Синтаксический анализ текстов с помощью SyntaxNet

Синтаксический анализ текстов с помощью SyntaxNet

Для одной из задач мне понадобился синтаксический анализатор русскоязычных текстов. Что это такое. Например, у нас есть предложение «Мама мыла раму». Нам нужно получить связи слов в этом предложении в виде дерева: Из этого дерева понятно, что связаны слова «мама» и «мыла», а…

14 декабря 2016, среда 16:50 Оставить комментарий Источник

Похожие материалы

Разбор предложений по шаблонам русского языка

Существует несколько парсеров, подходящих для русского языка. Некоторые из них могут даже выполнять синтаксический анализ, как SyntaxNet, MaltParser и AOT: … или выявлять факты, как Tomita. Глядя на эти парсеры, я вижу какую-то огромную сложность вычислений, требования к памяти, лицензионные ограничения и… ограниченность каждого решения, увы. Чтобы понять, что же там такого сложного, мне захотелось сделать собственный парсер. Благо выходные оказались длинными. Читать дальше →

10 марта 2018, суббота 4:28 Источник
Кластерный анализ корпуса текстов

Иногда возникает необходимость провести анализ большого количества текстовых данных, не имея представления о содержании текстов. В таком случае можно попытаться разбить тексты на кластеры, и cгенерировать описание для каждого кластера. Таким образом можно в первом приближении сделать выводы о содержании корпуса текстов. Читать далее

23 ноября 2021, вторник 16:16 Источник
Ранжирование текстов по похожести на опорные тексты при помощи модели TF-IDF в реализации GENSM

Бывает так, что критерии поиска текстов слишком сложны, чтобы обойтись регулярными выражениями. В таких случаях на помощь приходит ML. Если из списка текстов выбрать самый подходящий для нас, можно выяснить похожесть всех остальных текстов на этот. Похожесть(similarity) это численная

12 февраля 2021, пятница 10:38 Источник

Синтаксический анализ текстов с помощью SyntaxNet

Комментарии

Похожие материалы

Разбор предложений по шаблонам русского языка

Кластерный анализ корпуса текстов

Ранжирование текстов по похожести на опорные тексты при помощи модели TF-IDF в реализации GENSM