Опыт редактирования электронных каталогов

Editing of Electronic Catalogs

Досвід редагування електронних каталогів

Моторина А.Н., Шкиркова А.В., Зеленина Г.Н.

Научная библиотека Челябинского государственного технического университета, Челябинск, Россия

Motorina A.N., Shkirkova A.V., Zelenina G.N.

Scientific Library of Chelyabinsk State Technological University, Chelyabinsk, Russia

Моторіна А.Н., Шкіркова А.В., Зеленіна Г.Н.

Наукова бібліотека Челябинського державного технічного університету, Челябинськ, Росiя

Внедрение новейших информационных технологий в практику работы отечественных библиотек означает в настоящее время создание электронных каталогов и организацию на их основе обслуживания читателей.

В докладе освещены некоторые аспекты традиционного и автоматизированного редактирования электронных библиотечных каталогов. Это позволяет повысить их качество и организовать самостоятельную работу читателей с информационной системой библиотеки.

New information technologies in the practice of Russian libraries signify a creation of electronic catalogs and new user services.

This report deals with the editing of library catalogs, both traditional and automated, which allows librarians to improve their quality, and to make the work of the information system users unattended.

Впровадження сучасних інформаційних технологій в практику роботи вітчизняних бібліотек означає створення електронних каталогів та організацію на їх основі обслуговування читачів.

В доповіді висвітлюються деякі аспекти традиційного та автоматизованого редагування електронних бібліотечних каталогів. Це дозволить підвищити їх якість та організувати самостійну роботу читачів з інформаційною системою бібліотеки.

Прежде, чем приступить к теме, определим некоторые терминолгические понятия в этой области.

По определению /1/ "электронный каталог (ЭК) - это библиотечный каталог, реализованный в машиночитаемой форме. В существующей информационной и библиотечной практике под ЭК понимают как библиографические базы данных, отвечающие признакам каталога, так и библиотечные автоматизированные системы или их подсистемы."

База данных, по определению того же автора /2/, есть "организованная совокупность блоков информационных элементов, представленных на машиночитаемых носителях, предназначенная и пригодная для оперативного решения пользовательских, служебных и других задач с использованием средств вычислительной техники".

В Научной библиотеке Челябинского государственного технического университета (НБ ЧГТУ) система ЭК представляет себой совокупность служебных и читательских (пользовательских) библиографических баз данных на фонды, активно используемые в учебном процессе.

Система электронных каталогов как служебных, так и читательских баз данных (БД) включает основную базу по фонду научно-технической литературы с 1975 года издания, включая полный комплекс новых поступлений с 1994 года (более 126 тыс. записей); базы данных по полному фонду авторефератов диссертаций (более 3 тыс. описаний названий); периодики (около 1000 записей); базы данных официальных материалов органов власти центральных и местных уровней с 1995 года (около 9 тыс. описаний названий документов).

Кроме того, для информационного обслуживания читателям предоставлена база данных библиотеки МГУ по состоянию на 1995 год (94 тыс. названий) и реферативная база данных предварительного заказа, конвертированная из автоматизированных каталогов фирмы "Артос" (около 9 тыс.).

С мая 1992 года пользователям организован свободный доступ к системе читательских баз данных из зала каталогов. С сентября 1994 открыт доступ к информационной системе библиотеки из сети университета.

Ввод информации в служебный вариант ЭК библиотеки осуществляется сотрудниками библиотеки с использованием программного комплекса "Библиотека-4", разработанного в НБ МГУ. Пользовательский вариант баз данных преобразуется из служебного и обслуживается специальными программными средствами, разработанными по заданию отдела автоматизации библиотеки в Челябинском региональном центре Высшей школы. Целью создания электронных каталогов в НБ ЧГТУ является организация самостоятельной работы читателей с информационной системой библиотеки и обеспечение свободного доступа к ней всех желающих /3,4/.

За время использования ЭК для обслуживания читателей был накоплен опыт по его организации и ведению. В результате эксплуатации и проведенного анализа читательских запросов /5-7/ были выявлены недоработки и ошибки при создании электронного каталога, которые затрудняют самостоятельную работу с информационной системой. Итогом нашего опыта обслуживания читателей явился вывод, что электронный каталог, как и все библиотечные каталоги, нуждается в постоянном совершенствовании и редактировании.

Согласно определению /8/ редактирование библиотечного каталога - это "проверка соответствия структуры, содержания и оформления библиотечного каталога предъявляемым к нему требованиям и устранение обнаруженных недостатков. Условно различают текущее редактирование (в процессе расстановки карточек) и плановое, предполагающее редактирование каталога в целом."

Мы считаем, что текущее редактирование ЭК проводится в процессе ввода библиографической записи, а плановое - в процессе редактирования базы данных и справочно-поискового аппарата (СПА) к ЭК. По определению /8/ "библиографическая запись - это библиографическое сообщение, зафиксированное в документальной форме, состоящее из библиографического описания, которое по надобности дополняется заголовком, классификационными индексами, предметными рубриками, ключевыми словами, шифрами хранения."

Параллельно можно выделить так называемое "автоматическое" редактирование, осуществляемое планово или оперативно, с применением средств программной обработки данных, подготовленных по специальным заказам сотрудников, занимающихся традиционным редактированием каталогов.

Актуализация баз данных электронного каталога проводится ежемесячно. Зачастую под актуализацией понимают периодическое пополнение имеющихся баз новыми библиографическими описаниями. По определению /1/ актуализация - это "поддержание данных в актуальном состоянии, т.е. приведение их в соответствие с состоянием отображаемых объектов предметной области. Актуализация включает в себя операции добавления, исключения, а также редактирования (в том числе правки или исправления) записи".

Мы понимает под актуализацией внесение изменений в структуру и содержание библиографической записи, выявление неточностей и архаизмов (в связи с поступлением новой информации, в том числе с изменением таблиц классификаций и дополнениями к ним), приведение СПА ЭК к унифицированному виду с целью соответствия поискового образа документа поисковому образу запроса. То есть, актуализация базы данных включает в себя пополнение библиографическими записями и редактирование ЭК. Но заметим, что понятия редактирования и актуализации мы относим как к служебному варианту баз данных, так и к пользовательскому. Отметим также, что изложенные методы и приемы редактирования и актуализации относятся к служебному варианту баз данных. Читательский вариант редактируется и актуализируется автоматически.

Наш опыт работы по редактированию ЭК опишем на примере основной базы данных, хотя подходы к этой работе применимы, на наш взгляд, к любой системе электронных каталогов.

База данных основного электронного каталога пополняется следующей информацией: библиографическими записями всех новых поступлений литературы, записями ретро-изданий гуманитарного цикла наук и описаниями литературы, наиболее спрашиваемой читателями, но не введенными в основную базу данных, дополнениями к СПА ЭК, изменениями в отредактированных записях основной базы данных.

Достаточно заметить, что объем библиографических записей в основной базе данных в формате MARC составляет около 83 мегабайт. Объем справочно-поискового аппарата ЭК, создаваемого вручную, составляет более 11 мегабайт.

Основным моментом в редактировании ЭК является редактирование его справочно-поискового аппарата.

СПА к ЭК первоначально представлял собой систему поисковых таблиц - файлов, создаваемых в результате подготовки информации с помощью программы ввода данных в автоматизированном режиме.

В настоящее время СПА к ЭК представляет систему словарей, создаваемых различными способами в процессе ввода информации. Это автоматически создаваемые словари, выполняющие роль поисковых таблиц, а также предварительно созданные словари так называемой нормативной и унифицированной лексики.

Под словарями нормативной лексики мы понимаем машиночитаемые файлы списков понятий, приведенных к норме, общепринятому стандарту. Словари унифицированной лексики - это файлы списков, понятий и терминов, приведенных к единой системе, форме, единообразию.

Все словари в ЭК мы поделили условно на 3 типа.

К первому типу относятся словари нормативной и нормализованной лексики, специально создаваемые библиотекарями в процессе ввода библиографической записи. Это словари ключевых слов, каталожных индексов, индексов УДК и ББК, словарь серий, коллективных авторов и учреждений (организаций), ответственных за выпуск издания.

Ко второму типу словарей относятся унифицированные словари, созданные систематизаторами в помощь своей работе, независимо от ввода библиографических записей, но используемые в процессе ввода. Это словари тематических рубрик, автоматизированного АПУ.

Следует отметить, что файлы словарей 1 и 2 типов подключены ко всем базам данных книжных изданий - основного каталога, баз новинок и ретро-изданий, а также периодики.

К третьему типу относятся словари, создаваемые в автоматизированном режиме по поисковым элементам, например, авторов, заглавий и т.д.

Ввод библиографической записи в ЭК осуществляется непосредственно с документа или с карточки служебного алфавитного каталога библиотеки.

Главными специалистами отдела научной обработки проводится предварительная обработка документа: систематизация и координатное индексирование - составление классификационных индексов, тематических рубрик и ключевых слов. При вводе библиографической записи используются вспомогательные картотеки, созданные ранее: картотека тематических рубрик, картотека названий кафедр университета, специальностей, картотека методических решений, принятых в отделе, систематическая контрольная картотека, рабочая картотека по организации и ведению ЭК.

Текущее редактирование электронного каталога осуществляется ежедневно по мере ввода библиографических записей в служебные базы. Оно состоит в проверке правильности заполнения полей, орфографии, выверке опечаток и т.д. Перед ежемесячной актуализацией читательской базы данных проверяются словари всех типов в базах новинок и ретро-изданий. В течение месяца проводится внесение изменений и пополнение новыми понятиями словарей второго типа. Вносятся исправления, дополнения и изменения в основную базу данных, замеченные и выявленные пользователями, библиотекарями, консультантами ЭК, которые не требуют длительных трудовых затрат.

Плановое редактирование включает в себя редактирование самих библиографических записей и словарей всех типов. Эта работа включает также ведение картотеки методических решений, предусматривающих методику заполнения конкретных полей, унификации терминологии. При редактировании словарей нормативной лексики используются тезаурусы, АПУ к таблицам классификаций, тематические, толковые и орфографические словари; мы также стараемся учесть замечания, высказанные пользователями нашей информационной системы.

Например, словарь серий создавался нами по методике, предусмотренной в программном комплексе "Библиотека-4" с использованием сокращений согласно ГОСТу 7.12-77 (СТ СЭВ 2012-79) "Сокращение русских слов и словосочетаний в библиографическом описании". Практика использования ЭК читателями показала, что пользователи не знают правил сокращений; знания эти необязательны, поэтому ведение такого словаря затрудняет поиск информации. Было принято решение отредактировать словарь серий, не применяя сокращения, упуская кавычки и слово "серия". Часто библиографическое описание имеет две и более серий или серия делится на подсерии; в этом случае решено каждую серию и подсерию заносить в повторяемое поле "серия", что значительно улучшило поиск информации по данному полю.

В связи с изменениями таблиц классификации или появлением новой информации по предмету систематизации возникает необходимость ресистематизации (реклассификации), что ведет к необходимости редактирования поля каталожных индексов, т.е. замена старых каталожных индексов на новые (например, раздел А - "Марксизм-ленинзм" заменен разделом Ю - "Философские науки" и Т - "Исторические науки"). Отсюда вытекает проблема группового редактирования каталожных индексов, которая решается автоматически программированием подготовленных таблиц соответствия старых каталожных индексов новым.

Большое значение имеет создание перечня ключевых слов в виде словаря ключевых слов нормализованной и унифицированной лексики, по которому осуществляется предметный поиск документов. Процесс их координатного индексирования - малознакомый для систематизаторов, т.к. в библиотеках вузов практически отсутствуют предметные каталоги. Появляющиеся в настоящее время методики по координатному индексированию (составлению набора ключевых слов для документа) зачастую отличаются друг от друга, и выбрать наиболее верную - довольно сложно. Мы придерживаемся двух методик, приведенных в /9,10,11/, но вносим также много своих дополнений.

Редактированием полей ключевых слов приходится заниматься по нескольким причинам. Отсутствие опыта по координатному индексированию на момент создания основной базы, отсутствие сетевого варианта программы и режима сетевого ввода данных во время создания ЭК - все это привело к разночтению одних и тех же понятий, использованию нескольких синонимов одного и того же понятия, введение в словарь понятий в единственном и множественном числе и т.д.

Созданные автоматически словари поисковых элементов нуждаются в редактировании по нескольким причинам. В связи с вносимыми дополнениями и изменениями при вводе библиографической записи; из-за допущенных орфографических ошибок, возникающих из-за отсутствия в программах ввода средств автоматической проверки данных, использованию различных программных средств подготовки баз.

Для редактирования этих типов словарей используется визуальный просмотр, выявление единичных или групповых опечаток и ошибок. Полезным инструментом редактирования является построение частотных словарей из поисковых элементов. Так было организовано плановое редактирование полей, авторов, заглавий, года издания книги и т.п.

Словарь тематических рубрик редактируется в связи с изменением профиля вуза. Гуманитаризация образования, организация в университете новых факультетов и специальностей - все это ведет к перепрофилированию комплектования библиотеки, а значит и созданию новых тематических рубрик и введению новых понятий и новой научной терминологии в АПУ к ЭК.

АПУ к ЭК - это взаимосвязанные между собой алфавитный перечень предметных рубрик (понятий) и организованные в систематическом порядке классификационные индексы. Его машиночитаемый вариант был создан на основании карточного АПУ к систематическому каталогу (СК) с более широким использованием инверсии, формулировок разделов СК и разделением гнездовых рубрик на единичные.

Программное подключение автоматизированного АПУ к полям индексов УДК и ББК в служебном варианте баз данных позволяет ускорить ввод данных в электронный каталог, предупредить ошибки ввода.

Подключение этого же АПУ к читательскому варианту позволяет пользователям самостоятельно вести и систематический, и предметный поиск документов. Кроме этого, систематический ряд АПУ дает понятие о системе классификации знаний, что также немаловажно для учебного заведения. Читателям не просто раскрывается содержание каталожных индексов, они видят предметное "окружение" своего запроса, адаптируясь к лексической среде ЭК. Все это позволяет приблизить работу информационной системы к форме "естественного" общения.

Программное совмещение АПУ и поисковых таблиц каталожных индексов дает также наглядное представление о направленности фонда, его предметной наполняемости. Эта информация используется систематизатором и редактором каталогов, т.к. наглядно видно, какие рубрики СК необходимо углубить, какие расширить, а какие и вообще исключить из систематического каталога.

Кратко остановимся на автоматизированном редактировании и актуализации, не акцентируя внимания на узких вопросах программирования конверторов для группового редактирования базы или ее преобразования. Остановимся на методике актуализации читательского варианта ЭК, способствующей оперативному решению пользовательских задач.

Для повышения информативности читательских баз данных регулярно проводится статистическое сканирование служебных баз ЭК. В результате определяются средняя длина записи в базе, средние длины поисковых элементов, определено среднее количество предметных рубрик и ключевых слов в одной записи, определено процентное наполнение базы полями систематических индексов. Отдельно были просканированы основная часть базы, введенная до 1993 года, новинки, начиная с 1993 года и база МГУ.

При актуализации пользовательских баз данных учитываются результаты такого сканирования: поисковые таблицы имеют длину, равную средней длине, определенной заранее. Это дает возможность выводить на экран пользователя только значащую информацию. При этом поиск осуществляется значительно быстрее. К тому же существенно экономится дисковое пространство для файлов самих баз данных.

Проведенный анализ статистического исследования дает информацию о последующих этапах редактирования ЭК.

В принципе, редактированием ЭК можно было бы и не заниматься. Но не совершенствуя созданное, не создашь совершенное. Это еще одна новая форма работы библиотеки, занимающейся автоматизацией. Редактированием ЭК нас заставляет забота о наших читателях. ЭК ими активно используется и значительно повышает качество обслуживания. Но всегда ли на это найдутся время и человеческие силы ?

В заключение отметим, что изложенных выше проблемы могло бы и не быть при условии целенаправленного управления процессом автоматизации национальными библиотеками, если бы эти процессы развивались не спонтанно, как это происходит сейчас.

На наш взгляд такое руководство необходимо на методическом уровне - в стране должны быть приняты и утверждены на уровне государственных стандартов единые методики подготовки автоматизированных библиотечных каталогов.

Необходимо разработать, наконец, и распространить повсеместно машиночитаемые файлы так называемых национальных файлов авторитетных данных - предметных рубрик, классификационных таблиц, списков коллективных авторов и т.п. При этом необходимо сразу предусмотреть возможность интеграции этих информационных ресурсов в международную систему. Так работает библиотечный мир, и этого не избежать, если предполагать в дальнейшем создание автоматизированной библиотечной системы России.

Список литературы

1. Воройский Ф.С. Толковый словарь по информатике. //Б-ка.1995.- №10.- С.79-82.

2. Воройский Ф.С. Толковый словарь по информатике. //Б-ка.1995.- №6.- С.35-37.

3. Бургер И.П. Современная библиотека вуза: состояние и проблемы // Научные и технические библиотеки.-1996.-№ 8, с. 3-6.

4. Гальцева Т. Е. , Зеленина Г.Н. Электронный каталог в библиотеке // Научно-технич. б-ки.-1995.-№ 10-11, с. 68-71.

5. Гальцева Т.Е. Изучение запросов пользователей автоматизированной информационно-поисковой системы // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества.Материалы конференции. Том 2.-1996.- с. 293-295.

6. Гальцева Т. Е. и др. Множество "почему" электронному каталогу // Библиотека.-1996.-№ 7, с.39-41.

7. Зеленина Г. Н., Гальцева Т.Е. Из опыта обслуживания читателей с использованием электронного каталога библиотеки // Научно-техническая информация. Серия 1.-1996.-№ 1, с.20-21.

8. Терминологический словарь по библиотечному делу и смежным отраслям знания.- М.,1995.- 268с.

9.Воройский Ф.С. Индексирование документов в автоматизированных библиотечно-информационных системах // Библиотека. -1996. №9, с. 42-44.

10.Ханжин А.Г. Разработка методики координатного индексирования документов. Ч.1 // НТИ. Сер.2. Информ. процессы и системы.1995.- №8.- С.22-26.

11.Ханжин А.Г.Разработка методики координатного индексирования документов. Ч.2 // НТИ. Сер.2. Информ. процессы и системы.1995.- №9.- С.14-18.