Метрики для задач NLP. Часть 1. Классификация, NER, Кластеризация

Метрики для задач NLP. Часть 1. Классификация, NER, Кластеризация

В этой статье будет рассказано о популярных метриках для NLP-задач: классификации текста, NER и кластеризации. Рассказ будет сопровождаться визуализацией, примерами и кодом на Python. ???? Начинаем ????

23 декабря 2025, вторник 18:32 Оставить комментарий Источник

Похожие материалы

NLP. Основы. Техники. Саморазвитие. Часть 2: NER

Первую часть статьи об основах NLP можно прочитать здесь. А сегодня мы поговорим об одной из самых популярных задач NLP – извлечении именованных сущностей (Named-entity recognition, NER) – и разберем подробно архитектуры решений этой задачи. Читать дальше →

14 мая 2019, вторник 17:07 Источник
Путь разметки данных для NER: от Open Source до Prodigy

Распознавание именованных сущностей (Named Entity Recognition, NER) — это одна из самых востребованных задач в обработке естественного языка (NLP). Чтобы создать качественную модель для NER, требуется тщательно размеченная обучающая выборка, а процесс её создания может занять много времени и ресурсов. В этой статье я расскажу о своём пути разметки данных, начиная с использования Open Source инструментов и переходя к Prodigy, профессиональному инструменту для создания обучающих наборов данных. Читать далее

10 ноября 2024, воскресенье 1:15 Источник
Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER

Всем привет! Меня зовут Андрей Иванов, я NLP-исследователь в R&D red_mad_robot. Мы разрабатываем систему Guardrails для защиты персональных данных (PII) и фильтрации небезопасного контента.В этой статье расскажу, как мы решали задачу точечного маскирования PII на картинках без обучения специальных визуальных детекторов. Разберём связку оптического распознавания символов (OCR) с NER-моделью, покажем метрики на реальных данных, раскроем ограничения подхода и наши решения для их преодоления. Читать далее

17 марта 2026, вторник 15:55 Источник

Метрики для задач NLP. Часть 1. Классификация, NER, Кластеризация

Комментарии

Похожие материалы

NLP. Основы. Техники. Саморазвитие. Часть 2: NER

Путь разметки данных для NER: от Open Source до Prodigy

Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER