Годовые результаты проведения ретроконверсии книжных фондов ВГБИЛ

Yearly Results of the Retrospective Conversion of Book Card Catalogs
in the All-Russian State Library for Foreign Literature

Річні результати проведення ретроконверсії книжкових фондів ВДБІЛ

Балакерская С.Б., Русакова Л.В.

Всероссийская государственная библиотека иностранной литературы им. М.И. Рудомино, Москва, Россия

S. B. Balakerskaya and Liudmila V. Rusakova

M. I. Rudomino All Russian State Library for Foreign Literature, Moscow, Russia

С.Б. Балакерська, Л.В. Русакова

Всеросійська державна бібліотека іноземної літератури ім. М.І. Рудоміно, Москва, Росія

Ретроспективная конверсия книжных карточных каталогов в электронную форму подходит в нашей библиотеке к середине. Технологический процесс ее проведения, о котором мы докладывали в прошлом году, практически устоялся. Однако возникают моменты, требующие изменений в организации или технологии основных операций. В докладе приводятся изменения, происшедшие за истекший год, варианты решения возникших проблем и принятые меры.

Retrospective conversion of the Library’s book card catalogs into the electronic database is in midcourse. The technological process, which was reported last year, has been mastered. However, several issues still have to be altered either organizationally or technologically. In this report, the changes over the past year, problem solutions, and measures taken are described.

Ретроспективна конверсія книжкових карткових каталогів в електронну форму підходить у нашій бібліотеці до середини. Технологічний процес її проведення, про який ми доповідали у минулому році, практично устоявся. Однак виникають моменти, що вимагають змін в організації або технології основних операцій. У доповіді наводяться зміни, що сталися за минулий рік, варіанти вирішення виниклих проблем і вжиті заходи.

Проект РЕТРО, проводимый во ВГБИЛ с целью преобразования бумажных карточных каталогов основного хранения в электронные каталожные записи, успешно перевалил на вторую половину. События ретроконверсии начались для нас в 1998 году, когда мы неудачно попытавшись организовать создание своих электронных записей о книгах путем заимствования их из внешнего источника (OCLC), решились на традиционный, более трудоемкий, процесс: СКАНИРОВАНИЕ — РАСПОЗНАВАНИЕ. С целью выбора лучшего исполнителя мы сравнили методы, используемые двумя фирмами: ПРОСОФТ и ГИПЕР. По ряду причин был выбран ГИПЕР, и с ним летом 1998 года мы начали совместно создавать первый вариант технологического процесса ретроконверсии. Правда, прежде всего, мы разработали, согласовали с ГИПЕРом и утвердили первый наиважнейший документ “Концепция ретроконверсии …”, о котором говорилось в прошлогоднем докладе Л.[1]. К концу 1998 года мы, убедившись, что “процесс пошел” в соответствии с согласованными технологическими процедурами / операциями, заключили с ГИПЕРом договор на весь оставшийся массив карточек. За 1999 год нам совместно с фирмой ГИПЕР удалось путем ежедневной эксплуатации и еженедельного обсуждения доработать, проверить окончательно и сделать обязательным расширенный вариант технологического процесса. Этот процесс циклически выполнялся весь 2000 год и с незначительными изменениями работает сегодня в 2001 году. О нем достаточно подробно говорилось в прошлогоднем докладе. Л.[1]. Незначительные изменения коснулись в основном организационных форм нашего взаимодействия с фирмой ГИПЕР, а также коснулись уточнения отдельных операций в третьей процедуре технологического процесса.

Напомним кратко назначение каждой из трех процедур нашего технологического процесса. Первая процедура предназначена для создания архива файлов, содержащих графические образы КК генерального алфавитного каталога библиотеки. Архив создан фирмой ГИПЕР на CD-ROM в виде основного и резервного комплектов. Заполненные в результате сканирования диски передавались фирмой в отдел Автоматизации библиотеки в сопровождении двустороннего документа, имеющего название “Акт приема-сдачи информации”. Первый Акт был составлен в ноябре 1998 года и фиксировал передачу графических образов на 63486 отсканированных каталожных карточек. Записи эти разместились на двух дисках. Полностью процедура создания архива файлов закончилась в конце марта 2000 года. Всего отсканировано карточек и передано в архив отдела Автоматизации 1 567 735 графических образа.

Вторая процедура заключается в зрительном определении на экране дисплея каталогизатором нашей библиотеки видов каталожных карточек по их графическим образам и клавиатурном занесении признака вида в служебную зону технологической таблицы “Реестр”. Эта процедура была разработана по настойчивому требованию библиотеки потому, что программа автоматического разнесения графических образов КК по видам, предложенная фирмой ГИПЕР, не работала из-за множественных вариантов составления библиографических описаний библиотекарями за многолетнюю практику Л.[2]. Рабочим инструментом для оператора в этой процедуре является “Графический редактор”, созданный фирмой по нашему техническому заданию. Просмотру подвергался целиком каждый отдельный диск с библиографическими записями, так как он является одноязычным (один язык оригинала, конечно, не считая русского языка, который на всех дисках является фоновым языком, языком комментариев, языком заполнения большинства полей библиографической записи). Об одноязычии записей на диске мы договорились с фирмой, исходя из удобства дальнейшей обработки наших многоязычных запасов. Процедура присвоения видов графическим образам закончена полностью в середине марта 2001 года по всем дискам, то-есть по всем языкам. Подробнее процедура описана в Л.[1]. По ходу её выполнения нами проводился статистический учет, часть результатов которого в виде сводной таблицы расстановки видов по дискам и языкам приведена на рис.1. Нужно отметить, что фактически в процессе выполнения этой процедуры проводился “первый контроль полуфабриката”, то-есть полный просмотр каталогизаторами графического образа каждой сканированной каталожной карточки. При этом каталогизатор был обязан не только присвоить вид каждой карточке, но и отнести к группе бракованных плохо читаемые, смазанные или частично различимые графические образы. Забегая вперед отмечу, что опыт показал необходимость относить также к группе бракованных, некоторые образы прошедшие первый контроль с положительным результатом и попавшие на просмотр в среде “Универсального редактора” (процедура 3), после автоматического распознавания и превращения графического образа в запись.

Почему важно обнаружить брак как можно раньше? Да потому, что бракованные графические образы выпадают из общего цикла обработки, и требуют, как минимум:

Рис.1 Сводная таблица расстановки видов (ТРВ)

Перечисленные операции обработки брака (бесплатные по договору библиотеки с фирмой), увеличивают общее время ретроконверсии и, очевидно, что чем раньше будет обнаружен брак, тем меньше будет потеря времени.

По результатам завершения второй процедуры при сборе статистических данных можно сделать выводы об объеме фонда ВГБИЛ на момент сканирования. Можно также, сделав выборку, спланировать объем предстоящей работы на текущий год. Так, например, после завершения обработки “по видам” 1 073 307 графических образов карточек, содержащих записи на четырех основных языках (английский, немецкий, французский и русский) можно сделать следующие заключения:

Полностью вторая процедура завершилась у нас в марте 2001 года. Наши операторы-каталогизаторы расставили признаки вида у каждого из графических образов, записанных на CD-ROM.

Третья процедура пока продолжается. Каждый раз она начинается с проводимой ГИПЕРом операции распознавания графического образа и превращения его в электронную запись. Операция проводится с массивом графических образов, размещенных на одном CD-ROM. Затем следует выполнение операции “второго промежуточного контроля полуфабриката”, производимое библиотечным оператором-каталогизатором с использованием программы “Универсального редактора”. Эта программа позволяет:

По ходу работ с этим редактором и распознанными записями выявилась необходимость изменения статуса обрабатываемой карточки/записи. Эта необходимость была учтена в рабочем документе (план работ), составляемом в конце операции 4 для каждого CD. Таблица-план предусматривает работу в рамках одного диска CD, содержимое которого компануется в блоки приблизительно по 1000 распознанных библиографических записей (для удобства контроля). Работать могут одновременно несколько человек, обрабатывая блоки, выделенные по одному для каждого из них. Чем “чище” проверяемые записи, тем быстрее осуществляет каталогизатор-оператор контроль корректности каждой из них и устранение выявленных недостатков. Приведем примеры неточностей, которые обнаруживают и устраняют наши сотрудники:

После завершения контроля блок записей передается на обработку в рамках операций 21, 23, 24 (Л.[1]). Эта группа операций обеспечивает сверку фондов и каталога. Операции сверки, проводимые в нашем проекте РЕТРО, достаточно полно изложены в Л.[3]. По ходу выполнения перечисленных операций в ГАК и ЧАК обнаруживаются:

В 2000 году по этим причинам было списано из каталогов и БД 2 492 книги.

В результате сверки мы надеемся получить:

В операциях третьей процедуры за истекший год появилось значительное количество усовершенствований. Так для исполнителей отдельных операций, с целью унификации действий операторов, созданы инструкции, потому что мы обнаружили некоторую самодеятельность сотрудников, занимающихся сверкой фондов и загрузкой готовых записей в ТИНЛИБ-РЕТРО. Анализ их действий привел нас к необходимости создания инструкций, обязательных для исполнения. Одна инструкция, например, определяя порядок взаимодействия подразделений библиотеки в ходе выполнения операций технологического процесса, вводит персональную ответственность исполнителей такими словами:

“Руководитель работ передает исполнителю имя файла, в котором находится блок данных, подлежащий обработке. В каждом файле располагается порядка 1000 листов с записями на книги. В первой строке каждого листа распечатки автоматически располагается (слева направо) следующая информация: Имя блока, язык, дата, Ф.И.О. исполнителя данной работы, номер листа.”

Кроме того, в инструкции говорится о порядке выдачи исполнителю пароля руководителем работ и о других нюансах организации взаимодействия участников проекта. Опыт показал, что внедрение инструкций позволяет добиться единообразия действий, эффективнее осуществлять контроль, создавать нормативы работ исполнителя методом сравнений и усреднений.

К совершенствованию процедуры нужно также отнести то, что мы устранили выявленные недостатки в технологическом процессе, и, в частности, исключили пару сопряженных операций 14 и 15 из-за пришедшего понимания того, что нельзя доверять машине эти операции. Это должен делать человек после окончательной проверки.

В заключение отметим, что за истекший 2000 год ВГБИЛ в результате проводимой конверсии имел:

Очередной целью, стоящей перед коллективом ВГБИЛ, занятым ретроконверсией, является дальнейшее повышение производительности труда без ущерба для качества.

Литература