Технологический стек классификации текстов на естественных языках

Технологический стек классификации текстов на естественных языках

В данном посте мы рассмотрим современные подходы, применяемые для классификации текстов на естественном языке по их тематикам. Выбранные методы работы с документами определены общей сложной спецификой задачи – зашумлёнными обучающими выборками, выборками недостаточного размера или вообще отсутствующими выборками, сильным перекосом размеров классов и так далее. В общем – реальные практические задачи. Прошу под кат. Читать дальше →

23 марта 2017, четверг 16:35 Оставить комментарий Источник

Похожие материалы

Гайд по созданию Big Data-проектов в облаке: технологический стек, этапы и подводные камни

Любой специалист, который когда-либо работал с Big Data знает, что в подобных проектах большой не только объем данных. Также это внушительные вычислительные ресурсы, разветвленный технологический стек и мощная инфраструктура. Поэтому Big Data-проекты часто реализовывают в облаке. …

6 февраля 2023, понедельник 12:40 Источник
Анализируем тональность текстов с помощью Fast.ai

В статье пойдет речь о классификации тональности текстовых сообщений на русском языке (а по сути любой классификации текстов, используя те же технологии). За основу возьмем данную статью, в которой была рассмотрена классификация тональности на архитектуре CNN с использованием…

26 октября 2019, суббота 22:45 Источник
Ранжирование текстов по похожести на опорные тексты при помощи модели TF-IDF в реализации GENSM

Бывает так, что критерии поиска текстов слишком сложны, чтобы обойтись регулярными выражениями. В таких случаях на помощь приходит ML. Если из списка текстов выбрать самый подходящий для нас, можно выяснить похожесть всех остальных текстов на этот. Похожесть(similarity) это численная

12 февраля 2021, пятница 10:38 Источник

Технологический стек классификации текстов на естественных языках

Комментарии

Похожие материалы

Гайд по созданию Big Data-проектов в облаке: технологический стек, этапы и подводные камни

Анализируем тональность текстов с помощью Fast.ai

Ранжирование текстов по похожести на опорные тексты при помощи модели TF-IDF в реализации GENSM