От OCR до ADE: как машины научились не просто читать, а понимать документы

От OCR до ADE: как машины научились не просто читать, а понимать документы

Ещё 10 лет назад машина видела в документе просто набор пикселей. Сегодня она понимает структуру страницы, читает таблицы, графики и рукописи — и автоматически извлекает нужные данные. Разбираем как это работает под капотом и почему это меняет целые индустрии. Читать далее

10 марта 2026, вторник 12:15 Оставить комментарий Источник

Похожие материалы

Tesseract OCR tips — создание своего словаря для повышения эффективности OCR

Это мой первый пост об оптическом распознавании текста (OCR) с использованием Tesseract. Tesserast это очень популярная open source библиотека для OCR поддерживаемая Google, которая дает высокие результаты точности и поддерживает более 100 языков. В этом посте я расскажу как можно работать со стандартным словарем для языковой модели Tesseract и настроить его под свои нужды. Кому интересно, прошу под кат. Читать дальше →

31 декабря 2019, вторник 0:11 Источник
Как выбрать OCR в 2026-м: тестируем девять моделей на трех движках инференса на рукописном русском

Вам нужен OCR. В техобзорах рекомендуют Tesseract, на Хабре все пишут про VLM, идете на Hugging Face — там PaddleOCR-VL, DeepSeek-OCR, Dots.OCR, Qwen2.5-VL, и каждая называет себя SOTA. Прибавим к этому vLLM, SGLang, TGI, Native HF Transformers, и вот вы зависли между десятками комбинаций. Мы протестировали девять моделей на трех движках инференса на рукописном русском и отразили в таблице, какая модель под какую задачу лучше подходит.Велком под кат за таблицей и историей ее создания Читать далее

31 июля 2026, пятница 11:00 Источник
Как выбрать OCR в 2026-м: тестируем девять моделей на трех движках инференса на рукописном русском

Вам нужен OCR. В техобзорах рекомендуют Tesseract, на Хабре все пишут про VLM, идете на Hugging Face — там PaddleOCR-VL, DeepSeek-OCR, Dots.OCR, Qwen2.5-VL, и каждая называет себя SOTA. Прибавим к этому vLLM, SGLang, TGI, Native HF Transformers, и вот вы зависли между десятками комбинаций. Мы протестировали девять моделей на трех движках инференса на рукописном русском и отразили в таблице, какая модель под какую задачу лучше подходит.Велком под кат за таблицей и историей ее создания Читать далее

31 июля 2026, пятница 11:00 Источник

От OCR до ADE: как машины научились не просто читать, а понимать документы

Комментарии

Похожие материалы

Tesseract OCR tips — создание своего словаря для повышения эффективности OCR

Как выбрать OCR в 2026-м: тестируем девять моделей на трех движках инференса на рукописном русском

Как выбрать OCR в 2026-м: тестируем девять моделей на трех движках инференса на рукописном русском