На сегодняшний день оптическое распознавание символов является частью решения таких прикладных задач, как распознавание и оцифровка текстов, распознавание документов, распознавание автомобильных номеров, определение номеров банковских карточек, чтение показаний счетчиков
Tesseract — это движок оптического распознавания символов (OCR) с открытым исходным кодом, является самой популярной и качественной OCR-библиотекой. OCR использует нейронные сети для поиска и распознавания текста на изображениях. Tesseract ищет шаблоны в пикселях, буквах, словах и…
Данная статья описывает процесс создания проложения для распознавания текста на изображении и общения с распознанным текстом. В процессе разработки используются: Язык: PythonОптическое Распознавание Символов(OCR): Paddle OCRПлощадка для языковой модели: OllamaБольшая языковая модель(LLM): qwen2:7bСетевой фреймворк для API: FastAPI Читать далее
Привет, Хабр!Сегодня хотим поделиться опытом, который мы накопили при попытке автоматизировать анализ коммунальных платежей для нашей сети магазинов, состоящей более чем из 1200 объектов. Читать далее