BioNNE-L — соревнование по нормализации биомедицинских именованных сущностей на русском и английском языках

BioNNE-L — соревнование по нормализации биомедицинских именованных сущностей на русском и английском языках

Привет, Хабр!Я — Андрей Саховский, исследователь SberAI и аспирант Сколтеха. Занимаюсь биомедицинским NLP, интересуюсь графами знаний, задачами извлечения информации из текстов медицинской тематики, языковыми моделями в хемоинформатике. Если вам тоже интересны эти научные области, обратите внимание на соревнование BioNNE‑L, которое организует наша команда исследователей из AIRI, МГУ и SberAI и которому будет посвящён этот текст. Читать далее

19 марта 2025, среда 16:28 Оставить комментарий Источник

Похожие материалы

[Перевод] Тематическое исследование распознавания именованных сущностей в биомедицине

Не так давно у автора этой статьи возник вопрос: может ли простой метод сопоставления строк — в сочетании с некоторыми простыми оптимизациями — конкурировать с моделью, обученной с учителем, в биомедицинской задаче распознавания именованных сущностей (NER)? Автор сравнил эти два метода между собой и предположил, что при правильном подходе даже простые модели могут конкурировать со сложными системами, а мы к старту курса "Machine Learning и Deep Learning" перевели его статью. Читать далее

4 июня 2021, пятница 19:17 Источник
Определяем язык текста. Сложный случай

Источник изображения: AnnaElli Система «Антиплагиат» работает с текстами на разных языках. Большинство работ, поступающих на проверку, написаны на русском, английском или казахском языках. Сейчас индекс «Антиплагиата» содержит документы более чем на 50 языках. Читать дальше →

24 ноября 2020, вторник 14:39 Источник
Наташа — библиотека для извлечения структурированной информации из текстов на русском языке

Есть стандартная задача извлечения именованных сущностей из текста (NER). На входе текст, на выходе структурированные, нормализованные объекты, например, с именами, адресами, датами: Задача старая и хорошо изученная, для английского языка существует масса коммерческих и открытых

14 марта 2018, среда 18:12 Источник

BioNNE-L — соревнование по нормализации биомедицинских именованных сущностей на русском и английском языках

Комментарии

Похожие материалы

[Перевод] Тематическое исследование распознавания именованных сущностей в биомедицине

Определяем язык текста. Сложный случай

Наташа — библиотека для извлечения структурированной информации из текстов на русском языке