Сравнение RuModernBERT и multilingual-e5-base для NER на русском

Сравнение RuModernBERT и multilingual-e5-base для NER на русском

Однажды при мне два ИИ экcперта закусились на тему какая модель лучше извлекает именованные данные на русском языке: RuModernBERT или multilingual-e5-base. Я послушал их аргументы и решил поставить небольшой эксперимент на реальных данных (благо данных хоть отбавляй).Итак, условия NER задачи: Читать далее

5 марта 2026, четверг 13:19 Оставить комментарий Источник

Похожие материалы

Путь разметки данных для NER: от Open Source до Prodigy

Распознавание именованных сущностей (Named Entity Recognition, NER) — это одна из самых востребованных задач в обработке естественного языка (NLP). Чтобы создать качественную модель для NER, требуется тщательно размеченная обучающая выборка, а процесс её создания может занять много времени и ресурсов. В этой статье я расскажу о своём пути разметки данных, начиная с использования Open Source инструментов и переходя к Prodigy, профессиональному инструменту для создания обучающих наборов данных. Читать далее

10 ноября 2024, воскресенье 1:15 Источник
CVE-2017-6666

A vulnerability in the forwarding component of Cisco IOS XR Software for Cisco Network Convergence System (NCS) 5500 Series Routers could allow an authenticated, local attacker to cause the router to stop forwarding data traffic across Traffic Engineering (TE) tunnels, resulting in a denial of service (DoS) condition. More Information: CSCvd16665. Known Affected Releases: 6.2.11.BASE. Known Fixed Releases: 6.1.3 6.1.2 6.3.1.8i.BASE 6.2.11.8i.BASE 6.2.2.9i.BASE 6.1.32.11i.BASE 6.1.31.10i.BASE 6.1.4.3i.BASE.

13 июня 2017, вторник 16:00 Источник
NER: Как мы обучали собственную модель для определения брендов. Часть 2

Привет всем! Сегодня продолжим рассказ о том, как наша команда Data Science из CleverData начала выделять бренды в строках онлайн-чеков. Цель такого упражнения — построение отчета для бренд-анализа, о котором мы подробно рассказали в первой статье на эту тему. Из второй части вы узнаете, как на базе пайплайна (сводки с данными) для получения разметки по брендам мы обучили собственную NER-модель. Читать далее

11 апреля 2023, вторник 12:01 Источник

Сравнение RuModernBERT и multilingual-e5-base для NER на русском

Комментарии

Похожие материалы

Путь разметки данных для NER: от Open Source до Prodigy

CVE-2017-6666

NER: Как мы обучали собственную модель для определения брендов. Часть 2