Manuscript OCR — открытая нейросеть для чтения рукописей XIX векаМы обучили свою OCR-модель распознавать дореформенную кириллицу, нестандартные почерки и сложные сканы. Всё — на собственных данных, с нуля. В статье — как мы это сделали и ссылки на репозиторий с кодом. Открыть рукопись
Давным-давно в далекой-далекой галактике продолжали изучать манускрипт Войнича. Что нового о нем удалось узнать на этот раз, расскажу я, Даша Фролова из команды спецпроектов в МТС Диджитал.Сначала напоминалка: манускрипт Войнича — загадочная рукопись, датируемая XV веком,…
В современных музеях и архивах древние тексты, рукописи и книги хранятся в определенных условиях, что позволяет сохранить их первозданный вид для будущих поколений. Самым ярким представителем нетленных рукописей считаются свитки Мертвого моря (Кумранские рукописи), впервые…
Манускрипт Войнича — весьма интересный артефакт средневекового прошлого. Это рукописная книга, которая была написана около 500 лет назад неизвестным автором, на неизвестном языке, с использованием неизвестного алфавита. С того момента, как информация о ней появилась в широком…