Современные принципы хранения и распространения архивной информации

Modern Principles of Archive Information Preservation and Dissemination

Сучасні принципи збереження і розповсюдження архівної інформації

Залаев Г.З.

Российский государственный архив научно-технической документации, Москва, Россия

Gennady Z. Zalaev

Russian State Archive for Sci-tech Documentation, Moscow, Russia

Г.З. Залаєв

Російський державний архів науково-технічної документації, Москва, Росія

Опыт работы Российского государственного архива научно-технической документации по созданию полнотекстовых страховых копий на оптическом диске, выбору формата архивной информации на оптическом диске, принципам построения системы поиска в массиве оцифрованных документов.

The experience of the Russian State Archive for Sci-tech Documentation in full text insurance copies on optical disks production, selection of archive information formats on the optical disk, creation of a search system within the massif of digitized documents is presented.

Досвід роботи Російського державного архіву науково-технічної документації по створенню повнотекстових страхових копій на оптичному диску, вибору формату архівної інформації на оптичному диску та принципів побудови системи пошуку в масиві оцифрованих документів.

Огромная часть возникающей в современном обществе информации сосредотачивается в архивах, образуя социальный информационной потенциал. Потребности общества в ретроспективной информации велики и имеют межгосударственное значение, так как в архивах России хранится информация интересная для целого ряда стран. Например, в фондах Российского государственного архива научно-технической документации представлены материалы международного сотрудничества в области освоения космического пространства и космической техники, в частности по программе “ЭПАС”.

При колоссальном информационном потенциале ретроспективной информации традиционные методы хранения и распространения архивной информации теряют свою эффективность.

Кардинальное решение проблемы заключается в применение современных информационных технологий, в частности, технологий оцифровки различного вида документов.

Определенный опыт получен в Российском государственном архиве научно-технической документации (до 1996 г. Российский научно-исследовательский центр космической документации).

Представляют интерес два проекта:

- электронный архив “Вирт Йозеф — канцлер Германии”

- электронный архив “Фотографии Ю.А. Гагарина”

В 1992 г. РГАНТД совместно с Российским центром хранения историко-документальных коллекций осуществил проект оцифровки документов из фонда “Вирт Йозеф — государственный канцлер Германии”.

Особенности этого проекта:

1. Разноформатность документов (от ресторанных счетов и бумажных квитанций до газетных полос и плакатов).

2. Тексты машинописные и рукописные.

3. Бумага разных оттенков от серого до желтого; папки с делами при сканировании не расшивались, кроме дел, в которых подшивка затронула текст.

Всего было отсканировано 14362 документа, в том числе 455 фотографий, рисунков и гравюр.

Для сканирования текстовых документов использовались планшетные сканеры DataCopy-830 и Relisys с разрешением 200-400 точек. Для сканирования полутоновых изображений фотодокументов и документов большого формата использовался проекционный сканер DataCopy-920, выполненный в виде камеры на штативе, имеющий большую разрешающую способность и позволяющий сканировать документы в формате серой шкалы, что обеспечивает последующее воспроизведение без потери качества. Фотографии сканировались с различным (в зависимости от размера и содержания) разрешением от 200 до 1000 точек.

В 1996 г. была разработана системы хранения и поиска факсимильных копий фотодокументов Ю.А. Гагарина на оптических дисках с включением фрагментов соответствующих текстовых документов.

Было отсканировано 850 фотографий (цветных и серно-белых). Сканирование проводилось с “контролек”, т.е. фотоотпечатков небольших размеров, применяемых в отделе использования в качестве элемента НСА. В качестве носителя был выбран оптический диск WORM фирмы “Plasman” (как и в первом проекте), в 1997 г. массив оцифрованных фотографий был записан на CD-R.

В качестве инструмента для разработки программного обеспечения баз данных была использована программная система ISIS версии 3.2 разработанная UNESCO и язык программирования Pascal ISIS,.

В результате реализации рассмотренных проектов были разработаны технологии создания полнотекстовых страховых копий на оптическом диске, решены вопросы выбора формата записи архивной информации на оптическом диске, разработаны принципы построения системы поиска в массиве оцифрованных документов.

Автоматизированная информационно-поисковая система в проектах содержит следующие блоки:

1. База данных описаний отсканированных документов, которая являлась поисковым аппаратом.

2. Массив цифровых копий документов, записанный на оптический диск.

Связь между базой данных и массивом отсканированных документов организовывалась специальными программно-технологическими средствами: