9 июня 2023, 07:24

Московские нейросети проанализировали более 4,5 млн образов с архивными записями

В сервисе можно искать по материалам двух столетий, которые больше всего пользуются популярностью у горожан

МОСКВА, 9 июня. /ТАСС/. Искусственный интеллект расшифровал более 9 млн страниц метрических книг, исповедных ведомостей, ревизских сказок. Всего московские нейросети проанализировали в рамках эксперимента по внедрению технологий компьютерного зрения в сферу архивного дела более 4,5 млн образов с архивными записями, сообщили в пятницу в пресс-службе соцкомплекса правительства столицы.

"В распоряжении комплекса социального развития Москвы уже была современная цифровая техника и огромный архив оцифрованных документов по истории семьи - именно эти материалы послужили основой для обучения искусственного интеллекта. Сейчас в базе сервиса представлено 4,5 млн образов архивных документов, а это более 9 млн страниц метрических книг, исповедных ведомостей, ревизских сказок", - сказала заммэра Анастасия Ракова, чьи слова приводит пресс-служба.

Как уточнили в мэрии, в январе этого года в столице запустили совместную платформу Главархива Москвы и компании "Яндекс" - "Поиск по архивам", в которой с помощью нейросетей расшифровываются архивные записи со сложной орфографией XVIII - начала XX веков. "Искусственный интеллект в считанные секунды находит в исторических документах упоминание фамилии, имени, населенного пункта или любых других слов, что облегчает и ускоряет поиск информации о своих предках, а также помогает в составлении генеалогического древа", - отметили в пресс-службе соцкомплекса.

Там добавили, что за несколько месяцев с момента запуска сервиса пользователи нашли и изучили около 2,5 млн образов с текстовой расшифровкой, то есть более половины всех материалов, представленных на платформе. При этом сервис по чтению старинных рукописей доступен бесплатно и работает на открытой платформе.

"Видя такой неподдельный интерес со стороны жителей и города, и страны к изучению истории своей семьи к столичному эксперименту присоединились Московская, Оренбургская, Новгородская области, а также Республика Мордовия. Нейросети, разработанные в столице, уже проанализировали порядка 1,7 млн электронных копий документов из региональных архивов", - добавили в пресс-службе.

В пресс-службе уточнили, что в сервисе можно искать по материалам двух столетий, которые больше всего пользуются популярностью у горожан. "Документы можно найти по каталогу или через строку поиска. Есть фильтры по годам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями. Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии", - заключили в мэрии.