5 июня 2024 года, выступая перед участниками Общего собрания Российского исторического общества, Председатель РИО Сергей Нарышкин обратил внимание на важность оцифровки документов Архивного фонда России.
«Материально-техническое оснащение архивной отрасли — это не быстрый, но принципиально важный процесс — такой же значимый, как и системное улучшение условий труда архивистов», — подчеркнул Председатель Общества.
Сергей Евгеньевич добавил, что магистральным направлением развития архивной отрасли должна стать оцифровка архивного наследия:
«Сегодня нам необходимо выработать стратегию развития архивной отрасли, при этом, на мой взгляд, магистральным направлением её развития должна стать оцифровка документального наследия. Её следует понимать, конечно, не как простое сканирование, а как реальное повышение доступности исторической информации для исследователей. В том числе — через машинное распознавание текста для обеспечения возможности сквозного поиска в нём. К слову, и Президентская библиотека тоже вполне могла бы принять участие в этой большой работе».
Оцифровка архивных документов приносит пользу как посетителям архивов, так и их сотрудникам — с её помощью любой желающий получает возможность познакомиться с интересующим документом с помощью сквозного поиска и других инструментов, а специалисты могут дольше сохранять документы в целости и высвободить дополнительные архивные площади.
Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.
Текст: Михаил Дорофеев
Фото: Александр Шалгин