29 марта 2023, 08:14

Нейросети "Яндекса" расшифровали рукописные архивы Московской области на 300 тыс. страниц

Документы были обработаны алгоритмом на базе системы оптического распознавания символов

МОСКВА, 29 марта. /ТАСС/. Метрические книги на 300 тыс. страниц из Центрального государственного архива Московской области (документы XVIII - начала XX веков) были расшифрованы нейронными сетями "Яндекса", сообщили в пресс-службе IT-компании в среду.

Документы были обработаны алгоритмом на базе системы оптического распознавания символов. Благодаря применяемым методам рукописи преобразовываются в печатный текст, и в базе можно находить отдельные слова: такие, как упоминания фамилий и населенных пунктов.

За два месяца с запуска сервиса "Поиск по архивам" в январе 2023 года количество расшифрованных нейросетями страниц увеличилось вдвое, с 2,5 до 5 млн. Среди прочего в базу вошли материалы из Главархива Москвы (700 тыс. страниц) и впервые опубликованные в открытом доступе описи из архива Республики Мордовия. 

Теги:
Россия