Современные принципы хранения и распространения архивной информации
Залаев Г.З.
Российский государственный архив научно-технической документации, Москва, Россия
Gennady Z. Zalaev
Russian State Archive for Sci-tech Documentation, Moscow, Russia
Г.З. Залаєв
Російський державний архів науково-технічної документації, Москва, Росія
Опыт работы Российского государственного архива научно-технической документации по созданию полнотекстовых страховых копий на оптическом диске, выбору формата архивной информации на оптическом диске, принципам построения системы поиска в массиве оцифрованных документов.
The experience of the Russian State Archive for Sci-tech Documentation in full text insurance copies on optical disks production, selection of archive information formats on the optical disk, creation of a search system within the massif of digitized documents is presented.
Досвід роботи Російського державного архіву науково-технічної документації по створенню повнотекстових страхових копій на оптичному диску, вибору формату архівної інформації на оптичному диску та принципів побудови системи пошуку в масиві оцифрованих документів.
Огромная часть возникающей в современном обществе информации сосредотачивается в архивах, образуя социальный информационной потенциал. Потребности общества в ретроспективной информации велики и имеют межгосударственное значение, так как в архивах России хранится информация интересная для целого ряда стран. Например, в фондах Российского государственного архива научно-технической документации представлены материалы международного сотрудничества в области освоения космического пространства и космической техники, в частности по программе “ЭПАС”.
При колоссальном информационном потенциале ретроспективной информации традиционные методы хранения и распространения архивной информации теряют свою эффективность.
Кардинальное решение проблемы заключается в применение современных информационных технологий, в частности, технологий оцифровки различного вида документов.
Определенный опыт получен в Российском государственном архиве научно-технической документации (до 1996 г. Российский научно-исследовательский центр космической документации).
Представляют интерес два проекта:
- электронный архив “Вирт Йозеф — канцлер Германии”
- электронный архив “Фотографии Ю.А. Гагарина”
В 1992 г. РГАНТД совместно с Российским центром хранения историко-документальных коллекций осуществил проект оцифровки документов из фонда “Вирт Йозеф — государственный канцлер Германии”.
Особенности этого проекта:
1. Разноформатность документов (от ресторанных счетов и бумажных квитанций до газетных полос и плакатов).
2. Тексты машинописные и рукописные.
3. Бумага разных оттенков от серого до желтого; папки с делами при сканировании не расшивались, кроме дел, в которых подшивка затронула текст.
Всего было отсканировано 14362 документа, в том числе 455 фотографий, рисунков и гравюр.
Для сканирования текстовых документов использовались планшетные сканеры DataCopy-830 и Relisys с разрешением 200-400 точек. Для сканирования полутоновых изображений фотодокументов и документов большого формата использовался проекционный сканер DataCopy-920, выполненный в виде камеры на штативе, имеющий большую разрешающую способность и позволяющий сканировать документы в формате серой шкалы, что обеспечивает последующее воспроизведение без потери качества. Фотографии сканировались с различным (в зависимости от размера и содержания) разрешением от 200 до 1000 точек.
В 1996 г. была разработана системы хранения и поиска факсимильных копий фотодокументов Ю.А. Гагарина на оптических дисках с включением фрагментов соответствующих текстовых документов.
Было отсканировано 850 фотографий (цветных и серно-белых). Сканирование проводилось с “контролек”, т.е. фотоотпечатков небольших размеров, применяемых в отделе использования в качестве элемента НСА. В качестве носителя был выбран оптический диск WORM фирмы “Plasman” (как и в первом проекте), в 1997 г. массив оцифрованных фотографий был записан на CD-R.
В качестве инструмента для разработки программного обеспечения баз данных была использована программная система ISIS версии 3.2 разработанная UNESCO и язык программирования Pascal ISIS,.
В результате реализации рассмотренных проектов были разработаны технологии создания полнотекстовых страховых копий на оптическом диске, решены вопросы выбора формата записи архивной информации на оптическом диске, разработаны принципы построения системы поиска в массиве оцифрованных документов.
Автоматизированная информационно-поисковая система в проектах содержит следующие блоки:
1. База данных описаний отсканированных документов, которая являлась поисковым аппаратом.
2. Массив цифровых копий документов, записанный на оптический диск.
Связь между базой данных и массивом отсканированных документов организовывалась специальными программно-технологическими средствами: