SVTR — state-of-the-art нейросеть для задачи OCR

SVTR — state-of-the-art нейросеть для задачи OCR

SVTR - state-of-the-art модель-трансформер для решения задачи OCR. Авторами статьи была предложена архитектура с одним "зрительным" модулем для эффективного распознавания текста. Основная идея работы заключается в обработке признаков разного уровня, то есть локальных, которые…

16 сентября 2022, пятница 15:36 Оставить комментарий Источник

Похожие материалы

Обучаем SVTR-Tiny для распознавания текста сцены

Сегодня мы расскажем вам, как дообучить новую state-of-the-art модель SVTR-Tiny для распознавания текста сцены (текста в реальных уличных условиях) на собственноручно сгенерированных изображениях с помощью API библиотеки PaddleOCR. Читать далее

15 декабря 2022, четверг 17:50 Источник
Tesseract OCR tips — создание своего словаря для повышения эффективности OCR

Это мой первый пост об оптическом распознавании текста (OCR) с использованием Tesseract. Tesserast это очень популярная open source библиотека для OCR поддерживаемая Google, которая дает высокие результаты точности и поддерживает более 100 языков. В этом посте я расскажу как можно работать со стандартным словарем для языковой модели Tesseract и настроить его под свои нужды. Кому интересно, прошу под кат. Читать дальше →

31 декабря 2019, вторник 0:11 Источник
Распознавание текста с помощью OCR

Tesseract — это движок оптического распознавания символов (OCR) с открытым исходным кодом, является самой популярной и качественной OCR-библиотекой. OCR использует нейронные сети для поиска и распознавания текста на изображениях. Tesseract ищет шаблоны в пикселях, буквах, словах и…

15 октября 2019, вторник 14:34 Источник

SVTR — state-of-the-art нейросеть для задачи OCR

Комментарии

Похожие материалы

Обучаем SVTR-Tiny для распознавания текста сцены

Tesseract OCR tips — создание своего словаря для повышения эффективности OCR

Распознавание текста с помощью OCR