Стандартизация средств межбиблиотечного обмена документами на основе электронных технологий
Standardization of Interlibrary Electronic Document Exchange
Стандартизація засобів міжбібліотечного обміну документами на основі електронних технологій

Захаров В. П.

Библиотека Российской Академии наук, Санкт-Петербург, Россия

Victor P. Zakharov

Russian Academy of Sciences' Library, St. Petersburg, Russia

Захаров В.П.

Бібліотека Російської Академії наук, Санкт-Петербург, Росія

Рассматриваются проблемы, встающие перед библиотеками при обмене электронными документами. Описывается опыт внедрения системы электронной доставки документов (ЭДД) в единой централизованной сети БАН.

The paper deals with facilities identified as essential requirements for electronic document exchange in Russian libraries. The new function of libraries is to enable end users to request remote documents held in our libraries. The role of electronic technologies is to integrate traditional ILL and new digital libraries. The paper discusses standardization of formats and protocols used in document delivery.

Розглядаються проблеми, що постали перед бібліотеками в процесі обміну електронними документами. Описується досвід впровадження електронної доставки документів (ЕДД) в єдиній централізованій мережі БАН.

Во всем мире с каждым годом увеличивается разрыв между ростом объемов научно-технической и другой информации и приростом фондов библиотек, которые все в меньшей степени в состоянии удовлетворить нужды своих читателей. Хотя это характерно для всех стран, но особенно остро эта проблема ощущается в российских библиотеках. Резко сократившееся финансирование на приобретение новой литературы и столь же резко возросшая стоимость транспортировка изданий поставили наши библиотека на грань катастрофы. Так за последние 8 лет (1991-99гг.) количество приобретенных Библиотекой РАН иностранных периодических изданий по сравнению с предыдущим периодом уменьшилось в 10 раз, а иностранных монографий - в 12 раз. При этом следует заметить, что благодаря широкому внедрению информационных технологий растет информированность читателей об информационных источниках и меняется, качественно и количественно, их информационная потребность, с которой они приходят в библиотеку. В этой ситуации чрезвычайную актуальность приобретает задача интеграции библиотек и библиотечных фондов. Одним из перспективных путей решения этой задачи становится развитие систем электронной доставки документов (ЭДД).

Электронная доставка документов является своего рода "мостом" между традиционными библиотечными и новыми информационными технологиями. С одной стороны, ЭДД следует рассматривать как часть традиционной библиотечной технологии. С другой стороны, технологию электронной доставки можно отнести к такому новому понятию, каким являются электронные библиотеки. Сам термин "электронная доставка" ("electronic deliv e ry"), акцентирующий внимание лишь на одном процессе – доставке - кажется нам не совсем удачным. Правильнее говорить о новой функции библиотек и новых сущностях в их функционировании. Речь должна идти не только и не столько о способах и каналах доставки документа конечному пользователю, сколько о новой парадигме библиотечного обслуживания, когда библиотеки утрачивают свою пространственную замкнутость и превращаются в открытые компьютерно-библиотечные сети, обслуживающие потребителей в независимости от их местонахождения.

Российские службы ЭДД стали создаваться совсем недавно. В Библиотеке Российской академии наук в Санкт-Петербурге работы по электронной доставке документов ведутся, с перерывами, с 1995 года. Однако лишь в 1999 году обрисовались контуры того, что можно назвать структурной и функциональной подсистемой. Толчком этому послужило участие БАН в проекте Института Открытое Общество по созданию корпоративной системы пяти петербургских библиотек по электронному копированию. В настоящее время проект успешно завершен, причем полезным следует считать как положительный, так и отрицательный опыт.

Параллельно с участием в данном проекте БАН с 1999 года активно работает в режиме электронного обмена со многими другими библиотеками страны. Среди наших партнеров в первую очередь следует назвать ИНИОН, ВИНИТИ, ГПНТБ СО РАН, ГПИБ, РГБ, БЕН. Для реализации собственно электронной доставки используются программы и протоколы сети Интернет, а для сканирования - программы, поставляемые со сканерами. Наиболее часто электронные копии пересылаются по электронной почте в виде графических файлов в формате TIFF с последующей распечаткой на принтере и предоставлением читателю "твердой копии". Применяется также формат PDF. Как средство передачи практикуется размещение файла на FTP - сервере.

Система ЭДД используется и непосредственно в единой централизованной сети БАН, включающей более 30 библиотек научно-исследовательских институтов Санкт-Петербургского Научного центра, расположенных не только в Санкт-Петербурге, но и за его пределами. Библиотеки сети БАН имеют свои фонды, подчас уникальные. И система ЭДД предоставляет уникальные возможности использования их в любом месте, в любом научно-исследовательском учреждении. Теперь читатели центральной библиотеки смогут воспользоваться фондами библиотек-филиалов, оперативно получая графические образы интересующих их документов по электронной почте, и наоборот. Пока речь идет только об электронных копиях статей, но все определяется лишь техническими возможностями и экономической целесообразностью. Внедрение системы ЭДД в библиотеках централизованной сети БАН оказывает также воздействие и на другие библиотечные процессы, как в центральной библиотеке, так и в филиалах.

Средства и способы обмена электронными документами в наших библиотеках часто определяются двусторонними договоренностями между заказчиком и исполнителем. При этом возникающие проблемы решаются ad hoc, применительно к желаниям и возможностям двух сторон на данный момент времени. Причем эти сиюминутные решения часто случайны и отражают лишь меру понимания или непонимания существа проблемы участниками обмена. Возникают ситуации, когда одна и та же библиотека разным библиотекам-заказчикам посылает электронные копии в разных форматах и по разной технологии. Отчасти это можно объяснить разнообразием технических средств и технологических подходов. В ряде случаев технология заказа и доставки копий определяется требованиями и особенностями интегрированной библиотечной системы, применяемой в той или иной библиотеке. Но главное все-таки в том, что это новая технология, которая еще не успела сложиться. Естественно, такое положение не может длиться долго, и на повестке дня стоит задача унификации и стандартизации программных и информационных средств обмена электронными документами. И с каждым днем эта задача становится все более острой. Одним из путей решения является принятие согласованных решений в рамках корпораций и консорциумов. Необходимость решения проблем ЭДД в масштабе страны привела также к созданию Ассоциации служб электронной доставки библиотек России.

Участники корпоративного проекта в Санкт-Петербурге также договорились о единой технологии и едином комплексе программных средств, в качестве какового была выбрана широко распространенная система на Западе Ariel. Создаваемые в системе Ariel электронные копии представляют собой многостраничные TIFF-файлы в стандарте сжатия Group IV Fax, предваряемые заголовком в стандарте GEDI (Group of Electronic Document Interchange). Имеется возможность экспорта/импорта данных из/в Ariel и обработки их другими, в том числе и бесплатными программными средствами.

Однако Ariel обеспечивает лишь часть операций по электронному обмену. И даже для этих операций вряд ли Ariel можно рассматривать как типовое проектное решение для всех библиотек России. По целому ряду причин массовое использование западных программных продуктов в российских библиотеках проблематично. Среди препятствий и различия в библиотечной практике на Западе и в России, включая вопросы авторского права, и стоимость самих продуктов (цена Ariel - 400-890 USD), и многое другое. Необходим аналогичный отечественный продукт. Возможно, это будет программный комплекс D2, разработанный в фирме “Кодис”.

Но на нынешнем этапе главное - это не разработка программных средств, а информационная модель взаимодействия при обмене, форматы и протоколы, которые в максимальной степени должны ориентироваться на международные стандарты. Только договорившись о них, мы сможем разработать совместимое программное обеспечение.

При этом встает несколько принципиальных вопросов:

Одна из особенностей российских служб ЭДД сегодня - это их своего рода автономность. Часто эти службы создаются в отделах автоматизации, что объяснимо, но неправильно. Мы считаем, что системы ЭДД, являясь частью библиотечных систем, должны с ними тесным образом интегрироваться. Фактически, службы ЭДД представляют собой новый, с технической точки зрения, аналог межбиблиотечного абонемента. Нам кажется, что нужно говорить в целом о подсистеме обслуживания удаленных пользователей первичными документами. И в библиотеках должно произойти объединение традиционных МБА и сегодняшних служб ЭДД.

Одновременно эти службы являются своего рода продолжением систем поиска в электронном каталоге. Естественно, интеграция ЭДД в комплексную библиотечную систему в каждой библиотеке будет происходить по-своему, что неизбежно повлечет за собой разнообразие программных и технических средств. Поэтому представляется, что на первом этапе и в первую очередь должны быть разработаны, выбраны и адаптированы протоколы, описывающие взаимодействие программно-технических комплексов на разных уровнях, как-то:

К вопросу о стандартах. Прежде всего, мы должны ориентироваться на открытые стандарты. Международными организациями CCITT, ISO, IEC разработаны, обсуждены и ратифицированы целые комплексы стандартов: ISO/DIS 10160/1, предназначенные конкретно для обмена информацией между библиотечными системами МБА, протокол Z39.50, стандарты X.400 (CCITT X.400 - X.430. Data Communication Networks: Message Handling Systems: Recommendations) и X.500 и LDAP (CCITT X.500 - X.521. Data Communication Networks Directory: Recommendations), стандарты и рекомендации Интернет и множество других.

Совершенно очевидно, что в основе телекоммуникационного взаимодействия между библиотеками должны лежать стандарты и протоколы Интернет, обеспечивающие режимы электронной почты, ftp, www на основе сетевых и транспортных протоколов TCP/IP, позволяющих создавать гетерогенное информационно-сетевое пространство. В приложении дается перечень некоторых документов Интернет, описывающих представление электронных документов при передаче их по сети. Стандарты и технологии Интернет позволят выполнить и такие требования, как конфиденциальность, сохранность информации при передаче по каналам связи и т.п.

Кроме того, требуется разработка специальных прикладных стандартов, которые обеспечат функции собственно заказа и доставки копий (прием и ведение заказов, отправка квитанций о доставке документов, взаимодействие с программами поиска в электронном каталоге и т.п.). Эти стандарты также должны удовлетворять требованиям архитектуры OSI. Использование стандартов должно обеспечить совместимость между разными библиотеками и унификацию взаимодействия между различными модулями внутри одной системы. Так, например, заказ на копию может формироваться различными способами (через поиск в электронном каталоге, путем заполнения специальной формы, путем использования старых заказов, сохраненных в архиве), однако формат его должен быть единым и пониматься различными программами. Желательно иметь два варианта реализации этого модуля: через Web-интерфейс и через программу Z39.50-клиент. Комплекс информационных стандартов и программных средств электронной доставки должен поддерживать также обслуживание разовых заказов, подключение службы ЭДД к другим системам в качестве заказчика.

В настоящее время за рубежом широко известен прикладной протокол международного МБА - ILL (InterLibrary Loan), а точнее , два протокола : ISO 10160 " Определение службы МБА " (Information and Documentation -- Open Systems Interconnection -- Interlibrary Loan Application Service Definition) и ISO 10161 " Спецификация прикладного протокола МБА " (Information and documentation -- Open Systems Interconnection -- Interlibrary Loan Application Protocol Specification -- Part 1: Protocol specification; Part 2: Protocol implementation conformance statement (PICS) proforma). Представляется, что именно эти протоколы (на которые обычно ссылаются как на один, обозначая его как ISO 10160/1) должны лечь в основу информационного обеспечения систем обслуживания пользователей первичными документами или их копиями, куда электронная доставка документов входит как составная часть.

Об этом свидетельствует и современный зарубежный опыт. Так, консорциум RLG разработал базирующийся на этом протоколе программный комплекс управления МБА под названием RLG's ILL Manager, который для выполнения функции доставки документов предполагает (но не обязывает) использование программы Ariel. Аналогичные программные средства разрабатываются и в других странах (например, проекты CILLA и JEDDS в Австралии).

Кроме того, электронные документы создаются и передаются не только в библиотеках. В мире формируется (сформировалось?!) новая информационная среда, инфраструктура которой базируется на компьютерах и телекоммуникациях. Эта среда, построенная по технологии “клиент-сервер”, обеспечивает возможность интеграции разнородных технических и программных решений. Наряду с уже хорошо известным словом Интернет несколько лет назад появилось понятие intranet, под которым понимается применение в корпоративных сетях и системах средств и стандартов, разработанных для глобальных сетей. И для организации электронного документооборота в этих системах существуют свои стандарты и программные средства. Вероятно, разработчики систем передачи электронных документов в библиотеках должны обязательно учесть стандарт ISO 8613 (parts 1-6) “Архитектура и обменный формат для офисных документов” (Office Document Architecture (ODA) and Interchange Format (ODIF)). Этот стандарт задает метод описания электронных документов и само описание структурированной информации в виде, удобном для машинной обработки и автоматизированного обмена.

Далее следует сказать, что документы или их копии, предоставляемые пользователю, могут быть разной природы: электронные графические копии, электронные файлы в одном из текстовых форматов, ксерокопии или оригиналы, выдаваемые по МБА. Соответственно , мы должны учесть все необходимые стандарты , описывающие их форматы и кодировку (TIFF, GIF, JPEG, PDF, PostScript, CCITT Group 3/Group4 Facsimile Standard, ISO 2022 "Information Processing - 7-bit/8-bit character sets", ISO 4873 “8-bit code for Information Interchange - Structure and Rules for Implementation", ISO 6937 “Coded characters for Text Communication", ISO 8859 “8-bit single byte coded graphics character sets", CP Windows-1251, и др .). Мы должны также учесть и использовать возможности представления документов на языках HTML ("HyperText Mark-up Language") и SGML (ISO 8859 "Information Processing - Text and Office Systems - Standard Generalized Mark-up Language") с соответствующими кодовыми таблицами (UNICODE, UTF-8, ISO 10646). Технологическое обеспечение и функциональные программы электронного МБА должны предусматривать не только различные форматы, но различные способы транспортировки документов, как-то: передача данных по электронной почте, через FTP-сервер, возможно, использование каких-то других протоколов сетей передачи данных, пересылка документов по факсу или обычной почтой и т.п.

Также имеется значительное число разработок, развивающихся как проекты электронных библиотек, которые решают задачи, сходные с теми, которые обсуждаются в данном докладе. В качестве примеров приведем две британские программы eLib (Electronic Library) и EDDIS (Electronic Document Delivery: the Integrated Solution). Эти разработки также могут быть использованы при взаимодействии обычных библиотек.

В заключение подчеркнем, что мы затронули лишь часть проблем, встающих перед библиотеками при обмене электронными документами. “Пафос” доклада заключается в том, что правильное решение этих проблем требует системного подхода, включающего декомпозицию систем на отдельные блоки и построение модели информационного взаимодействия между этими блоками. И что при этом в максимальной степени должны быть учтены открытые международные стандарты и разработаны недостающие.

Работа выполнена при частичной финансовой поддержке РФФИ (проект 98-07-90394 "Сетевая интеграция электронных информационных ресурсов ведущих библиотек и информационных центров России") и РГНФ (проект 96-05-12025 "Сетевая интеграция информационных ресурсов ведущих библиотек России на основе распределенной библиотечной сети LibWeb").

Приложение

Документы Интернет (RFC), которые должны быть учтены
в системах электронного обмена между библиотеками