Распознавание текста на изображении и общение с распознанным текстом. Paddle OCR + LLM

Распознавание текста на изображении и общение с распознанным текстом. Paddle OCR + LLM

Данная статья описывает процесс создания проложения для распознавания текста на изображении и общения с распознанным текстом. В процессе разработки используются: Язык: PythonОптическое Распознавание Символов(OCR): Paddle OCRПлощадка для языковой модели: OllamaБольшая языковая модель(LLM): qwen2:7bСетевой фреймворк для API: FastAPI Читать далее

5 августа 2025, вторник 13:00 Оставить комментарий Источник

Похожие материалы

Распознавание текста с помощью OCR

Tesseract — это движок оптического распознавания символов (OCR) с открытым исходным кодом, является самой популярной и качественной OCR-библиотекой. OCR использует нейронные сети для поиска и распознавания текста на изображениях. Tesseract ищет шаблоны в пикселях, буквах, словах и…

15 октября 2019, вторник 14:34 Источник
Быстрый OCR на основе Paddle

Распознать текст на скане документа – задача не новая. А вот уложиться в пару секунд на CPU – уже вызов. Там, где готовые фреймворки долго "думают", я сделала своё OCR решение на основе PaddleOCR с конвертацией в ONNX. В этой статье я расскажу почему в качестве ядра был выбран Paddle, и как работает весь алгоритм на основе его моделей. Читать далее

22 мая 2026, пятница 9:01 Источник
Добавление OCR-слоя и другие преобразования PDF

При сканировании и сохранении в формате PDF зачастую документы сохраняются в виде графических изображений. Это неудобно, потому что делает невозможным полнотекстовый поиск по содержанию. Утилита OCRmyPDF решает эту проблему: она одной командой из консоли добавляет к PDF-документу слой OCR с распознанным текстом.Ниже упомянуты ещё несколько полезных инструментов для парсинга PDF, в том числе для преобразования сложных математических PDF-документов в текстовый формат Markdown. Читать далее

24 августа 2025, воскресенье 23:07 Источник

Распознавание текста на изображении и общение с распознанным текстом. Paddle OCR + LLM

Комментарии

Похожие материалы

Распознавание текста с помощью OCR

Быстрый OCR на основе Paddle

Добавление OCR-слоя и другие преобразования PDF