Новгородцы создали программу, распознающую древнерусские рукописи

Нейросеть с помощью новгородских умельцев научилась по снимку определять, когда, где и кем была написана сфотографированная рукопись

Специалисты передовой инженерной школы Новгородского университета им. Ярослава Мудрого (НовГУ) научили нейросети распознавать древнерусские рукописи и другие исторические документы. Созданная учеными на базе искусственного интеллекта программа способна по фрагментам определять датировку и авторство посланий.

Нейросеть с помощью новгородских умельцев научилась по снимку определять, когда, где и кем была написана сфотографированная рукопись
Нейросеть быстро определит, когда и кем были написаны рукописи. Фото: t.me/novmuseum

«Программу создали разработчики из лаборатории технического зрения при передовой инженерной школе НовГУ, — сообщает пресс-­служба НовГУ. — Нейросеть обучили распознавать рукопись по фрагментам текстов: уже сейчас она умеет делать это по церковнославянскому языку. Также создана база данных фотографий первоисточников».

Изобретение разработчиков позволит специалистам быстрее устанавливать датировку и авторство исторических рукописных материалов. Это, в свою очередь, ускорит атрибуцию и локализацию текстов, связанных с деятельностью Новгородской архиерейской семинарии.

Проект, созданный благодаря участию вуза в проекте «Приоритет‑2030», позволит понять масштаб новгородского скриптория и глубже оценить его значение в истории образования и интеллектуальной культуры нашей страны.

Кстати, прямых аналогов у данной программы нет. По словам разработчиков, ближайшим по смыслу изобретением является проект «Digital Петр», который умеет распознавать почерк Петра I, а также множество программ для перевода со старославянского языка на современный русский.

По словам одного из авторов новгородского изобретения, ведущего инженера лаборатории технического зрения НовГУ Михаила Гареева, ранее ученые проводили множество испытаний в области цифрового анализа данных. Работы идут и сейчас.

«Однако большинство из них сосредоточены на более общих задачах, таких как перевод текстов или распознавание почерка, — цитирует ТАСС Михаила Гареева. — Специальных исследований, посвященных деятельности именно новгородского скриптория, до этого проекта не проводилось».

Как рассказали в пресс-­службе НовГУ, в XVIII веке в Новгородской архиерейской семинарии существовала мастерская по переписке книг. Поэтому сегодня во многих библиотеках, музеях и архивах хранятся рукописи и исторические документы, которые написаны «новгородскими почерками», однако происхождение и авторство записей не всегда остается ясным.

«Программа новгородских разработчиков предоставит историкам новые возможности для исследования рукописей, так как использование нейросетей сегодня позволяет добиваться высокой точности в определении происхождения документов, а музеям и архивам — сократить время и ресурсы, необходимые для исследования и каталогизации рукописей», — отмечают в НовГУ.

В ближайших планах разработчиков — вывести свой продукт на рынок.

К слову, недавно стало известно, что российские ученые научили нейросеть читать древние свитки, не разворачивая их. Технологию создали инженеры Федерального исследовательского центра «Информатика и управление» РАН. Созданная ими программа умеет виртуально разворачивать свитки и берестяные грамоты и выводить написанный на них текст на монитор компьютера.

«Теперь получить восстановленный текст из манускрипта можно нажатием одной кнопки. Разработка позволит изучать тексты бумажных, берестяных и серебряных свитков и печатных книг, которые пострадали вследствие естественного старения, воздействия влажности или пожаров и хранятся в особых условиях», — отметили ученые.

Как пишут СМИ, уникальность технологии в том, что нейросеть с помощью томографа может отделять листы друг от друга. Но сложности все же есть.

«Проблема, которая по-прежнему требует решения, — разрыхление слоев», — сообщил журналистам завотделом «Зрительные системы» ФИЦ ИУ РАН Дмитрий Николаев.

Как отметила старший научный сотрудник отдела рукописей и старопечатных книг Исторического музея Елена Уханова, до нас дошли лишь пара сотен рукописей от трех первых столетий. И задача ученых — прочесть то, что угасло, смыто и зачеркнуто.

Опубликован в газете "Московский комсомолец" №34 от 14 августа 2024

Заголовок в газете: Как читать предков?

Что еще почитать

В регионах

Новости региона

Все новости

Новости

Самое читаемое

Автовзгляд

Womanhit

Охотники.ру