Исправляем опечатки с учётом контекста

Исправляем опечатки с учётом контекста

Недавно мне понадобилась библиотека для исправления опечаток. Большинство открытых спелл-чекеров (к примеру hunspell) не учитывают контекст, а без него сложно получить хорошую точность. Я взял за основу спеллчекер Питера Норвига, прикрутил к нему языковую модель (на базе N-грамм), ускорил его (используя подход SymSpell), поборол сильное потребление памяти (через bloom filter и perfect hash) а затем оформил всё это в виде библиотеки на C++ со swig биндингами для других языков. Читать дальше →

24 января 2018, среда 21:09 Оставить комментарий Источник

Похожие материалы

Решение проблемы понимания контекста искусственным интеллектом. Часть 1

Понимание естественного языка является AI полной задачей. Одним из аспектов такого понимания является понимание контекста. В данной статье я объясню, какие виды контекста выделяет наша психика, как она работает с одним из видов контекста, и как мы этот процесс воссоздаем в нашей

15 ноября 2016, вторник 18:07 Источник
Обзор открытых решений для исправления опечаток

У каждого пользователя когда-либо были опечатки при написании поисковых запросов. Отсутствие механизмов, которые исправляют опечатки, приводит к выдаче нерелевантных результатов, а то и вовсе к их отсутствию. Поэтому, чтобы поисковая система была более ориентированной на…

15 августа 2019, четверг 16:06 Источник
Исправляем опечатки в поисковых запросах

Наверное, любой сервис, на котором вообще есть поиск, рано или поздно приходит к потребности научиться исправлять ошибки в пользовательских запросах. Errare humanum est; пользователи постоянно опечатываются и ошибаются, и качество поиска от этого неизбежно страдает — а с ним и…

18 декабря 2018, вторник 19:26 Источник

Исправляем опечатки с учётом контекста

Комментарии

Похожие материалы

Решение проблемы понимания контекста искусственным интеллектом. Часть 1

Обзор открытых решений для исправления опечаток

Исправляем опечатки в поисковых запросах