Опыт конвертирования базы данных электронного каталога из
АС ОБЛБИБЛИОТЕКА (ГИВЦ) в систему автоматизации библиотек ИРБИС (ГПНТБ)


Converting the E-Catalogue Database from AS OBLBIBLIOTEKA to IRBIS

Досвід конвертування бази даних електронного каталога з
АС ОБЛБІБЛІОТЕКА (ДІОЦ) у систему автоматизації бібліотек ІРБІС (ДПНТБ)

Надпорожская Е.В., Платонова А.С., Яковишина Л.А.

Центральная городская публичная библиотека имени В.В. Маяковского, Санкт-Петербург, Россия

E. V. Nadporozhskaya, A. S. Platonova, and L. A. Yakovishina

Mayakovsky Central Municipal Public Library, St. Petersburg, Russia

О.В. Надпорожська, А.С. Платонова, Л.А. Яковишина

Центральна міська публічна бібліотека імені В.В. Маяковського, Санкт-Петербург, Росія

Решена проблема перевода данных Электронного каталога (около 51 000 записей) из программы АС-Облбиблиотека ГИВЦ в систему автоматизации библиотек ИРБИС.

Создана база данных Комплектования из ЭК для последующего отслеживания дублетов при вводе библиографического описания.

The problem of converting the electronic catalogue data (over 51000 records) from AS OBLBIBLIOTEKA of the Main Information Computer Center to the system of library automation (IRBIS) was resolved, and a database was generated for the acquisition from the e-catalogue allowing the staff to trace duplicates when entering a bibliographic description.

Представлено вирішену проблему конвертації даних електронного каталога (біля 51 000 записів) з програми АС ОБЛБІБЛІОТЕКА ДІОЦ у систему автоматизації бібліотек ІРБІС та базу даних комплектування з ЕК для подальшого відстеження дублетів при введенні бібліографічного опису.

C 1993 по 1999 гг. в библиотеке им. В. В. Маяковского (Санкт-Петербург) велись работы по созданию ЭК. Использовалась программа АС-Облбиблиотека (ГИВЦ МК РФ).

К концу этого периода возможности программы ГИВЦ пришли в заметное противоречие с нуждами библиотеки. В частности:

— настало время общения между библиотеками, а в программе не был предусмотрен обмен записями электронного каталога;

— не было конвертера из внутреннего формата в UNIMARC (или RUSMARC) и не предполагалось его создавать силами ГИВЦ;

— работа по созданию справочников велась вслепую, что не давало возможности видеть и корректировать создаваемые справочники;

— вместо справочника предметных рубрик создавался словарь ключевых слов.

Одним из основных неудобств было отсутствие возможности в полной мере описывать разные виды документов. Это заставляло библиотекарей придумывать различные выходы из этого положения.

С 1997 г. отдел автоматизации начал тестировать другие библиотечные пакеты, в поисках альтернативного решения, в том числе и новые версии программы ГИВЦ.

После анализа полученных результатов мы остановили свой выбор на известной системе ИРБИС (ГПНТБ), и было принято решение перейти на эту систему.

К моменту перехода ЭК библиотеки содержал около 51 000 записей.

Перед библиотекой встала проблема конвертирования ЭК. Конвертер решили сделать своими силами.

Мы получили от разработчиков ГИВЦа список полей внутреннего формата. Этот формат оказался перечнем полей с порядковой нумерацией от 1 до 85. На самом деле предлагалось использовать только всего 31 поле. При этом номера полей, как и их названия экранной формы записи не соответствовали номерам и названиям полей в списке внутреннего формата ГИВЦ.

Первое, что мы сделали, мы создали таблицу соответствия полей программ АС-Облбиблиотека и ИРБИС, для задания правил обработки записей. Стало ясно, что поля программы ГИВЦ:

— не имеют структуры (подполей);

— имеют порядковую нумерацию;

— большая часть полей не является повторяющимися;

— не хватает полей для описания различных типов документов.

Сделав выгрузку файла ЭК в формат ГОСТ, мы обнаружили, что не все поля, перечисленные в списке полей внутреннего формата ГИВЦ выгружаются в соответствующие поля ГОСТа. Мы выяснили также, что данных, которые вносят библиотекари гораздо больше, чем предусмотрено программой ГИВЦ. В одно поле вводились разнородные данные в виде последовательного текста, разделенного знаками препинания, не всегда соответствовавшими ГОСТУ библиографического описания.

Началась кропотливая работа по написанию технологического задания для конвертера с просмотром записей различных видов документов и попыткой разнесения данных по полям ИРБИС.

В программе ГИВЦ обязательным полем, как для работы, так и для поиска дублетов, было поле ISBN, а в то время (1993 г.) многие книги выходили без ISBN, поэтому в нашей библиотеке по рекомендации ГИВЦ, мы были вынуждены создавать по определенным правилам свои ISBN на издания, его не имевшие. Более того, были случаи, когда у нескольких изданий совпадали ISBN. В таких ситуациях в библиотеке было принято указывать номер ISBN и через тире порядковый номер. Поэтому, мы рекомендуем убрать при конвертировании все ISBN типа, так как искать в дальнейшем по ним дублетные издания будет невозможно. В конвертированном в ИРБИС ЭК проверять издания на дублетность лучше по всем полям, идентифицирующим дублеты, кроме поля ISBN.

Приступая к конвертированию, мы остановили процесс комплектования и обработки и сделали выгрузку ЭК из программы ГИВЦ в формат ГОСТ. После этого ГОСТ-файл ЭК конвертировали и импортировали полученные записи в ИРБИС в текстовом DOS-формате несколько раз. Просматривать записи можно было и в DOS-формате, но мы убедились, что проверять записи легче в программе ИРБИС, так как сразу же строятся словари и быстро выявляются многие ошибки и, кроме того, сам документ виден в карточном формате.

После каждого конвертирования дорабатывалось технологическое задание, так как мы выявляли, какие решения принимали библиотекари, чтобы найти выход при описании сложных документов в результате чего многие поля использовались не по назначению, так как соответствующих полей не было в программе ГИВЦ.

Одна из основных проблем состояла в том, что из одного неструктурированного поля программы ГИВЦ приходилось разносить содержимое в несколько полей ИРБИСа. Самым сложным при этом было выявить признаки отличия одного поля от другого. Сотрудники библиотеки разделяли сведения друг от друга не всегда одними и теми же символами, и более того, данные в поле заносили в произвольной последовательности. Сами разделители часто не соответствовали ГОСТам библиографического описания и сокращений.

При выгрузке в формат ГОСТ у записей появляются идентификаторы типа документов (для монографий и многотомников), а в программе ИРБИС предлагаются отдельные рабочие листы для различного вида документов. Поэтому оказалось несложным по этим идентификаторам добавить поле рабочего листа. Необходимым оказалось добавить в поле “Сведения об экземплярах” статус документа.

Было принято также решение изменить дату формирования документов в ГИВЦе на дату конвертирования, так как дата в программе ГИВЦ строго не привязана к экземпляру.

В документе ГИВЦ поля: “Инв. Номер”, “Штрих-код” и “Место хранения” — повторяющиеся, а поля: “№ КСУ” и “Цена экземпляра” — неповторяющиеся, и для всех экземпляров документа они единственны, поэтому рекомендуем при конвертировании:

— цену ставить в поле “общая цена”;

— Номер записи КСУ для каждого экземпляра всех записей ЭК установить одинаковый, желательно экзотический.

В результате проведенной работы нам удалось “поймать” при конвертировании:

— инверсию инициалов в поле “автор” как для полей авторов, редакторов так и для поля “сведения об ответственности”;

— “роль” автора в создании документа;

— “…” в начале текста поля заглавия;

— точку в поле автора для анонимных произведений;

— развести по повторяющимся подполям сведения, вписанные в программе ГИВЦ в одно поле через знаки препинания;

— сведения, относящиеся к заглавиям сложных сборников.

Оказалось возможным разнести:

— редакторов по соответствующим полям;

коллективы по соответствующим полям;

— содержание по подполям;

— разночтения фамилий, псевдоним;

— область серии;

— количественные характеристики;

— различить “ “, ( ), [ ] в поле ответственности;

— особенности описания таких сложных документов, как сборник без общего заглавия.

При конвертировании ЭК мы столкнулись с тем, что база данных комплектования остается пустой, а в программе ГИВЦ нет возможности выгрузки базы данных комплектования в ГОСТ. Мы решили импортировать конвертированный ЭК в базу данных комплектования ИРБИСа. Таким образом, мы получили возможность отслеживания дублетных описаний комплектования.

После такого импортирования нам пришлось сделать несколько глобальных корректур в базе комплектования.

Необходимо было сделать глобальную замену содержания полей рабочих листов на имя рабочего листа базы комплектования ИРБИС. Для этого нам пришлось сделать две глобальные корректуры:

— первая позволила удалить все имеющиеся имена рабочих листов (т. к. это рабочие листы ЭК), а затем — глобальная вставка имени рабочего листа базы комплектования;

— вторая корректура была посвящена заполнению 66 поля в ИРБИСе — отметки о переносе описания документов из комплектования в ЭК, так как теоретически все документы в ЭК должны попадать из комплектования. Мы вставили в это поле дату конвертирования и имя нашего ЭК.

Это было необходимо сделать для того, чтобы в ИРБИСе была возможность приписывать дублеты к старому документу. Таким образом, мы сохранили базу данных комплектования и дали возможность комплектаторам увидеть ее и отслеживать по ней дублеты, начиная с первого введенного документа (1993 г.).

Конечно, не все получилось так, как хотелось. В ИРБИСе в БД комплектования введены не все поля для правильного описания некоторых видов документов. Полей для описания многотомников и сборников без общего заглавия практически нет. Из- за этого при импорте ЭК в БД комплектования библиографические описания отдельных документов иногда искажались, но сведения из полей, не представленные в рабочих листах комплектования, не терялись, а попадали в страницу “Добавочные”. Но, тем не менее, осталась проблема многотомников, которые представлялись заглавием типа “Сочинения”, а отдельные тома не имели своих заглавий. В этом случае мы получали урезанное описание, которое в комплектовании было представлено только полем “Обозначение, номер тома”. При вводе дублетов этих документов комплектаторы не обнаруживали их описания в своей базе. Правда был выход — первым вводить поле ISBN, но, к сожалению, эта информация иногда бывает неправильной или отсутствует.

Так как после передачи дополнительных экземпляров (дублетов) документа в программе из БД комплектования в их ЭК программы ГИВЦ происходит принудительное запоминание номера последней КСУ в этом экземпляре (поле номера КСУ — не повторяющееся в ЭК), то все остальные экземпляры документа остаются без записи номера КСУ.

При конвертировании нам пришлось этот единственный номер КСУ переносить в первое повторяющееся поле экземпляров, так как невозможно было вычислить, к какому экземпляру относится номер этого КСУ.

Поскольку записей самих КСУ в БД ЭК нет, то мы пришли к выводу, что номер старых КСУ только в первом повторении поля экземпляров не имеет смысла. Оставить же пустым это подполе невозможно, поскольку при обращении к дублету в ИРБИСе во все экземпляры с незаполненными подполями КСУ автоматически вписывается номер, обрабатываемой в данный момент записи КСУ.

Поэтому во все поля экземпляров с пустым подполем номера КСУ мы, с помощью глобальной корректуры, вставили экзотический номер КСУ типа “9999”, который сразу можно отличить от других и найти при поиске.

Работа по конвертированию ЭК из программы ГИВЦ в программу ИРБИС оказалась многоступенчатой, трудоемкой, но конечной. Мы не потеряли ни одного документа.