“Предметный вход” в электронный каталог. Как повысить
эффективность поисковых процедур
“Subject entry” in OPAC. How to Raise Effect of Search
“Предметний вхід” в електронний каталог. Як підвищити
ефективність пошукових процедур
Сукиасян Э. Р.
Российская государственная библиотека, Москва, Россия
Eduard R. Sukiasyan
Russian State Library, Moscow, Russia
Сукіасян Е. Р.
Російська державна бібліотека, Москва, Росія
Сравнивается практика применения предметного индексирования в России и за рубежом. В большинстве стран этот вид индексирования, как известно, обеспечен списками предметных рубрик, многолетним опытом предметизации, традициями обучения профессиональных предметизаторов.
В России основным аппаратом тематического поиска традиционно являлся систематический каталог, все библиотекари изучали систематизацию. Универсальный список предметных рубрик никогда не издавался. Можно представить себе, с какими трудностями встретились отечественные библиотекари, когда им предложили компьютерные системы, основанные на зарубежных традициях.
Показано, что для отечественной практики гораздо более эффективной являлась бы система индексирования с использованием поиска по классификационным таблицам с предметным входом на основе предметных рубрик алфавитно-предметного указателя к каталогу. Рассказывается о проведенных в России исследованиях с использованием категориального анализа для редактирования алфавитно-предметного указателя к каталогу.
The practice of application of subject indexing in Russia and abroad is compared. In the majority of countries this kind of indexing is accompanied by the lists of subject headings, long-term practice experience, and traditions of training professional librarians.
In Russia the basic device of thematic search traditionally was the systematic catalogue and all librarians studied classifying. The universal list of subject headings was never published in Russia. It is possible to imagine, what difficulties domestic librarians faced, when they were offered computer systems based on foreign traditions.
Ii is shown that the system of indexing with use of search by the classification systems with a “subject entry” on the basis of subject headings of the alphabetic—subject index to the catalogue would be much more effective for Russian practice. The paper also informs on research projects carried out in Russia, which deal with the use Ranganathan’s categorical analysis for editing the alphabetic—subject index to the catalogue.
Порівнюється практика застосування предметного індексування в Росії і за кордоном. У більшості країн цей вид індексування, як відомо, забезпечений списками предметних рубрик, багаторічним досвідом предметизації, традиціями навчання професійних предметизаторів.
У Росії основним апаратом тематичного пошуку традиційно був систематичний каталог, усі бібліотекарі вивчали систематизацію. Універсальний список предметних рубрик ніколи не видавався. Можна уявити собі, з якими труднощами зустрілися вітчизняні бібліотекарі, коли їм запропонували комп’ютерні системи, які базуються на закордонних традиціях.
Показано, що для вітчизняної практики набагато ефективнішою була б система індексування з використанням пошуку за класифікаційними таблицями з предметним входом на основі предметних рубрик алфавітно-предметного покажчика до каталогу. Розповідається про проведені в Росії дослідження з використанням категоріального аналізу для редагування алфавітно-предметного покажчика до каталогу.
Проблема, которую мы будем рассматривать, останется непонятной большинству наших зарубежных коллег. Электронный каталог (российское понятие аналогично зарубежному OPAC) в большинстве стран располагает эффективным механизмом поиска, в основе которого лежит “предметный вход”, иначе говоря — один из видов вербального индексирования.
Наиболее распространено вербальное индексирование в виде предметизации, индексирования, осуществляемого на основе заранее составленного, но дополняемого в процессе индексирования списка предметных рубрик. Гораздо реже, как правило, лишь в крупнейших автоматизированных информационных центрах, используется координатное индексирование, обеспечить которое может только тезаурус. Индексирование ключевыми словами большинством специалистов признано менее эффективным, так как в этом случае “по ходу дела” формируется неуправляемый словарь ключевых слов. Нормализовать такой словарь можно. Соответствующие приемы известны: унифицируются формы наименований, вводятся стандартные подзаголовки, упорядочиваются синонимы и т. д. Специалист поймет, что мы получим в результате уже не словарь ключевых слов, а список предметных рубрик. Если же пойти дальше, выявить скрытую парадигматику, показать в том же списке ассоциативные, выше- и нижестоящие понятия, ввести исчерпывающие и обратные ссылки, то мы окажемся в двух шагах от тезауруса. Останется лишь проверить, всегда ли наши предметные рубрики имеют вид лексических единиц.
В зарубежной практике для предметизации используются, как правило, стандартные списки предметных рубрик. Некоторые из них, например Library of Congress Subject Headings (LCSH) — список предметных рубрик Библиотеки Конгресса, получили мировую известность и вошли в состав лингвистического обеспечения крупнейших в мире систем, таких, например, как OCLC с его Всемирным каталогом — WorldCat. Небольшие публичные и школьные библиотеки США и Канады используют гораздо меньший по объему Sears List of Subject Headings , полностью согласованный с LCSH. Этот список, впервые подготовленный Minnie Earl Sears в 1923 г. выдержал полтора десятка изданий. В Канаде с 1978 г. выпускается дополнительно к списку Sears с подзаголовком Canadian Companion список предметных рубрик, раскрывающий специфические проблемы своей страны. Этот, чрезвычайно интересный для нашей страны опыт, у нас даже не изучен.
Предметизаторы зарубежных стран получают полноценное библиотечное образование, так как изучают теорию и практику предметного индексирования, пользуясь готовыми списками предметных рубрик и располагая соответствующими главами в учебниках и пособиях. Они могут проходить производственную практику, имея возможность самостоятельно проводить предметный поиск в каталогах библиотек, накопивших информацию за многие десятилетия. Наконец, те же предметные рубрики представляют поисковые образы документов и запросов в OPAC — электронных каталогах.
Интересно, что в стандартных американских учебниках по каталогизации о координатном индексировании, равно так же, как об индексировании ключевыми словами говорится лишь несколько слов. Почему выигрывает предметизация? Эксперименты показали, что при любых формах совместного ведения OPAC “разброс” терминов индексирования, часто минимальный при использовании стандартного списка предметных рубрик, достигает запредельных значений при координатном индексировании. Поэтому координатное индексирование считается слишком сложным инструментом для библиотечной практики, не оправдывающим вложенных средств. Этот вид индексирования глубоко изучается лишь в некоторых библиотечных школах, не по учебникам, а по монографиям, их авторы, как правило, являются профессорами и преподавателями этих школ. Что же касается ключевых слов, то этот вид индексирования отвергается по причине явной примитивности и низкой результативности при поиске. В массиве до тысячи документов поиск по ключевым словам себя еще оправдывает, если определены категории, фасеты. Но такой поиск проще всего реализовать на картах с краевой перфорацией, а не в библиотечных каталогах.
Столь подробный экскурс в зарубежную практику необходимым нам для того, чтобы ясно представить, какова глубина пропасти, в которой оказались отечественные библиотеки с их электронными каталогами. Начнем с того, что в отечественной практике никогда не издавался универсальный список предметных рубрик. Большинство библиотек, ведущих традиционный предметный каталог, использовало предметные рубрики, проставляемые на печатных карточках Всесоюзной книжной палаты с 1932 г. Несмотря на неоднократно высказываемые библиотекарями страны просьбы, этот список предметных рубрик не был опубликован, представить его в более или менее полном виде можно лишь по предметным указателям к “Книжной летописи”, отражающим, естественно, лишь годовое накопление предметных рубрик и подзаголовков. Собственную практику предметизации поддерживала на протяжении десятилетий Российская национальная библиотека. Она была и остается лидером в теоретической и практической предметизации, здесь находится штаб Проблемной комиссии по предметизации и предметному каталогу, регулярно издаются сборники научных трудов, организуются конференции. Но, несмотря ни на что, список предметных рубрик РНБ остался неизвестным, никогда не публиковался. Когда остро встал вопрос о необходимости списка предметных рубрик, в РНБ решили перевести LCSH и реализовали этот проект, вместо того, чтобы издать, наконец, российский стандартный список предметных рубрик. Ясно, что объединить для реализации этой давно назревшей идеи усилия крупнейших библиотек страны должна была РНБ. В этом случае можно было бы использовать достижения практики отраслевой предметизации: ведь очень многое сделано в этой области в ИНИОНе, в ГЦНМБ, в бывшей Государственной центральной театральной библиотеке (теперь ГРБИ). Достаточно посмотреть на уникальный вспомогательный аппарат — перечни типовых подзаголовков в дважды опубликованном, но забытом теперь Списке предметных рубрик ГЦНМБ.
А как обстояло дело с обучением будущих предметизаторов? Традиционно хорошо лишь в ведущих вузах в Санкт-Петербурге, Москве, Харькове. Но у нас два с лишним десятка вузов и полторы сотни средних специальных учебных заведений. Никто не сможет убедить нас в том, что там преподают практическую предметизацию. В лучшем случае — лишь знакомят с тем, что это такое. Квалифицированные преподаватели, как показывает опыт, уходят, а смены им почти не остается. Что мы имеем в учебной литературе: лишь несколько добротных учебных пособий, изданных незначительным тиражом (библиотеки ими не располагают вовсе). Может быть, есть много практических пособий? Небольшая (173 с.) книжка классика — В. П. Кругликовой “Предметизация произведений печати. Общая методика” издана в 1967 г. Пособие для библиотекарей “Предметный каталог. Общая методика предметизации. Организация и ведение каталога” (еще меньшее по объему — 125 с.) — в 1973 г. В том, сколько издается, например, в США пособий по предметизации, может убедиться каждый, посетив электронный каталог Библиотеки Конгресса (WWW. loc. gov).
В таких условиях практически все наши каталогизаторы были поставлены перед фактом, получив автоматизированные библиотечные системы, в которых единственным поисковым инструментом, обеспечивающим тематический, содержательный поиск, был поиск вербальный. “Пишите слова”, призывали разработчики этих систем, иногда называя эти “слова” предметными рубриками, а чаще — ключевыми словами, но никогда не указывая на то, откуда их взять. Брали, как показывает анализ, кто откуда, по-русски говорят: “как бог на душу положит”. Чаще всего прямо из заглавия, с титульного листа. Надо было торопиться: норма на автоматизированную обработку делалась в нашей стране непонятно как, но не превышала обычных норм на систематизацию, при которой таблицы перед глазами, а в книге — индекс, пусть примитивный, но от него уже можно оттолкнуться. С началом “накопления массива” становилось ясно, что поиск в нем осуществлять будет трудно.
Систематизация была забыта. Впрочем, разработчики считали, что они всё сделали правильно: в составе каждой записи электронного каталога есть классификационный индекс: что вам еще надо? Далеко не во всех системах предлагалось воспользоваться этим индексом для того, чтобы получить на экране все снабженные им записи. Вообще опция “поиск по классификационному индексу” встречается реже 20 других категорий, по которым можно искать документ. И это понятно: откуда сидящий перед монитором может знать классификационный индекс? Ведь “ База знаний” у нас скрыта от пользователя. В лучшем случае он может посмотреть список тех самых “слов” (предметных или ключевых — в принципе всё равно), который формируется “автоматически” программой по принципу: “что сам написал, то и получил”. Кое-где предусмотрено редактирование накопленного массива. Процесс это сложный (исправив слово в списке, надо последовательно исправлять формулировки во всех записях, в которые оно попало), поэтому почти никто им не занимается. Отсюда качество предметизации и, естественно, качество поиска.
Давайте спросим себя: стал ли поиск в электронном каталоге глубже, многоаспектнее? Для этого надо провести сравнительный эксперимент: один и тот же запрос реализовать как в электронном, так и в системе традиционных карточных каталогов. Сейчас, когда многие библиотеки накопили значительный массив записей в электронном каталоге, продолжая всё это время пополнение карточных каталогов, такой эксперимент провести можно. Надо привлечь специалистов, так как определить релевантность, а затем и пертинентность документа запросу может только пользователь. Можно предполагать, что электронный каталог должен выдать информацию (1) в гораздо большем объеме и (2) гораздо быстрее, чем мы её получим в карточных каталогах. Стоит вооружиться часами и посмотреть, сколько реально времени пойдет у нас на “очистку” выдачи от шума, как быстро мы будем получать на экране монитора очередные порции записей и т. д. Соответственно, надо записывать время, затраченное при поиске в карточном каталоге. Пусть это будет систематический каталог. Надо сравнить оба способа поиска необходимого деления: по алфавитно-предметному указателю и по внешнему оформлению каталога, сверху вниз по иерархии его структуры. Найденную информацию внимательно сравните. Я убежден, что вы всегда обнаружите при просмотре карточного каталога значительный массив записей (от 40 до 60%), которые вообще не были выданы электронным каталогом. Посмотрев на эти записи, обычно говорят: но вы это у машины и не спрашивали! Да, не спрашивали, но они к теме относятся или нет? Они нужны пользователю? Оказывается, нужны. Так в чем же дело?
Надо понимать, что электронный каталог, как и всякая машина, даёт точный, взвешенный ответ на поставленный перед ним вопрос. Вы когда-нибудь видели, чтобы электронный каталог посоветовал читателю “см. также”? Так сказать, “умственные способности”, интеллект электронного каталога определяет программист. Его интересует не поиск по сути, а механизм поиска. Хорошо, если этот механизм можно превратить в столбик цифр и букв, в программу. Но все мы понимаем, что запрограммировать все движения человеческого ума невозможно.
Нет, мы не отрицаем необходимость автоматизированного библиографического поиска. Электронные каталоги нужны и в обозримом будущем, судя по всему, заменят карточные каталоги. В библиотеках останутся в карточной форме лишь генеральные алфавитные каталоги, которые недоступны читателям и выполняют функции, которые пока не может взять на себя машина. Придется, между прочим, подумать о новом, назовем это так, “сейфообразном”, несгораемом каталожном оборудовании для этих каталогов.
Но как же быть с поиском?
Мы выскажем предложение, рассчитанное на библиотеки нашей страны, основанное на отечественных традициях и имеющихся у нас возможностях. Так было: на протяжении многих десятилетий ведущим реальным каталогом, обязательным для всех наших библиотек, обеспечивающим реализацию содержательных, тематических запросов был систематический каталог. Если в большинстве стран за рубежом систематизация проводилась лишь в интересах организации фондов, практически всегда — открытых для читателей, у нас систематический каталог раскрывал содержание закрытых в большинстве библиотек от читателей фондов. Систематическая расстановка — вторая функция классификационной системы, более или менее существенная лишь для тех библиотек, в которой открыты подсобные фонды или же часть основного хранения.
Именно поэтому в нашей стране традиционно огромное внимание общественности уделялось классификационным проблемам. Имена Л. Н. Троповского и З. Н. Амбарцумяна были широко известны библиотекарям, так как их таблицы “работали” на протяжении трех десятков лет. Авторитет УДК был закреплен правительственным постановлением (аналога в мировой практике нет). Нигде в мире не брались за перевод “Классификации двоеточием” Ш. Р. Ранганатана. Мы сделали это и пошли дальше — перевели и издали ДК Дьюи. Лишь несколько стран в мире могут сказать, что они имеют свою национальную классификационную систему. У нас есть своя ББК — система очень мощная по содержанию, сильная по техническим параметрам, вполне сопоставимая с ДКД и УДК, самая молодая и потому логически более совершенная, а это значит — более удобная для компьютерного поиска информации. Наконец, только в нашей стране на уровне государственной стандартизации (ГОСТ 7. 59) четко обозначены классификационные системы, регламентированные для применения.
По определению систематический каталог функционирует как система, состоящая из двух частей — собственно систематического каталога и алфавитно-предметного указателя к нему. Первая, систематическая часть обеспечивает структурированное представление библиографической информации в логической последовательности, по отраслям знаний и их подразделениям. Вторая — алфавитная, предназначена для поиска соответствующего деления в систематическом каталоге по предмету и является, таким образом, не чем иным, как предметным входом в систематический каталог.
Эта особенность систематического каталога была известна еще в XIX веке, когда Мелвиль Дьюи сделал алфавитно-предметный указатель (под названием Relative index) обязательной частью своей Десятичной классификации. Выдающий русский библиограф Н. В. Русинов подчеркивал, что систематический каталог незаменим, так как его функция не свойственна никакому другому виду каталога. “Напротив, — писал он , — предметный каталог уже потому не является необходимым, что он может быть заменен предметным указателем к систематическому каталогу, который с помощью этого добавления выполняет одновременно две функции и, следовательно, становится еще более ценным рабочим инструментом… Пока не будет убедительно доказана ненужность логической группировки книжных собраний… целесообразнее базироваться на систематическом каталоге, нежели на предметном…” (Н. В. Русинов. Десятичная классификация и систематический каталог: Введение. М., 12931. С. 13-14).
Потенциальные возможности предметного указателя к систематическому каталогу в интересах компьютерного поиска информации не изучены в отечественной теории. Точно так же, как не изучены аналогичные возможности систематического каталога. Никто из разработчиков автоматизированных систем не взял на себя дополнительную работу и не стал пионером в этой области. Зачем? Можно было пойти по проторенной зарубежными “творцами” дорожке и получить быстрый, а главное — в финансовом отношении гарантированный результат. Хотя, как теперь выясняется, весьма сомнительный в результативности поиска. Убежден в том, что в процессе разработки систем библиотекари были устранены (или самоустранились, что тоже вероятно). В некоторых известных в области библиотечной компьютеризации в нашей стране научных коллективах нет ни одного профессионально образованного библиотекаря. И никого это не волнует. Зато есть специалисты, которые переводят с “западных” языков. Считается, что этого достаточно, чтобы быть “на уровне последних достижений”. Никто, как мне кажется, не читает профессиональной библиотечной печати. Казалось бы, с какими только оскорбительными замечаниями в адрес этих горе-разработчиков не приходилось мне лично выступать — впору подавать на меня в суд. Нет, спокойно всё. Одни пишут и читают, а при встрече обсуждают горячие проблемы в своей среде, другие продолжают разрабатывать новые версии и продавать их библиотекам…
Никто, наверное, не обращал внимание на то обстоятельство, что в нашей стране, как ни в одной другой в мире, многие годы разрабатывались теоретические, методические и практические проблемы алфавитно-предметного указателя к систематическому каталогу. В разные годы издавались пособия М. Н. Коноваловой (1955), Ц. М. Бердичевской (1961, переиздание 1974), Р. Д. Потаповой (1964, переиздание 1976), коллектива авторов ГБЛ (1981), С. Е. Демидовой (2002). Этой теме посвящали свои статьи З. Н. Амбарцумян, С. К. Виленская, В. В. Власов, А. В. Кленов, Р. А. Леонов, Л. В. Хортюнова, Б. Ю. Эйдельман и многие другие. Впервые в мире в нашей стране (под руководством Т. П. Мишиной в ГБЛ, в 1971-1980 гг.) проведена колоссальная по объему экспериментальная работа по использованию методов категориального анализа, предложенных Ш. Р. Ранганатаном, для формирования и редактирования алфавитно-предметного указателя. Её практическим результатом стал карточный массив, являющийся “предметным входом” в систематический каталог, насчитывающий примерно 12 млн. записей.
В процессе исследования оценке и анализу были подвергнуты самые разные характеристики указателя. Только по вопросам языка указателя и формулировкам предметных рубрик были сформулированы требования в отношении грамматического состава предметной рубрики, её первого (ведущего) слова, прямой и инверсированной формы, падежа и числа в формулировке, дат и числительных, полной и краткой формы, допустимости сокращений и условных обозначений, иностранных терминов, синонимии и омонимии, необходимости введения пояснений и уточнений и т. д.
Выявлены отдельные категории предметов: объекты неживой природы; объекты живой природы; материалы, вещества, сырье, изделия (элементы и вещества неорганической химии. Органические соединения. Полимеры. Лекарства, витамины); устройства. Оборудование (машины, механизмы, приборы, аппараты, инструменты, приспособления); здания и сооружения; явления, процессы, операции, действия, технологические процессы (в неживой природе, в живой природе, в социальной жизни, технологические процесс); условия, отношения, связи между предметами; свойства, качества, признаки предмета; пространственные и временные понятия; региональные понятия; национальные, этнические языковые понятия; персоналия (индивидуальная, собирательная), именные рубрики; коллективы (учреждения и организации); группы населения; источники, памятники истории и культуры; произведения художественной литературы; отрасли знания, науки; отрасли народного хозяйства; отдельные теории; методы исследования; комплексные темы и проблемы. По каждой из указанных категорий разработаны рекомендации по составлению предметной рубрике, типовым подзаголовкам (приведены их списки).
Пособие для библиотекарей “Алфавитно-предметный указатель к систематическому каталогу” (М.: Книга, 1981. 159 с.) аккумулировало все эти и многие другие положения. Большой тираж (23 тыс. экз.) был мгновенно распродан. Лишь спустя несколько лет был утвержден стандарт (ГОСТ 7. 44-84), который поднял роль алфавитно-предметного указателя, сделал его обязательной частью систематического каталога, регламентировал ведение указателя как один из процессов систематизации. Были увеличены нормы на систематизацию.
Далеко не все библиотеки провели редактирование указателя. Как всегда, нашлись другие, более важные задачи, которыми занимались каталогизаторы. Но книга ведь осталась! И изложенные в ней теоретические положения и практические рекомендации полностью сохраняют свое значение и в отношении указателя, который может быть реализован в машине. Не надо выдумывать предметные рубрики и ключевые слова! Не надо проводить какой-либо дополнительный анализ, кроме того, который ведется в процессе систематизации. Надо доверять таблицам классификации, по которым ведется работа. Если указатель формируется и постоянно дополняется в процессе индексирования, он адекватно отражает содержание введенной в электронный каталог информации. От рубрики указателя через классификационный индекс можно выйти непосредственно в библиографический массив, просмотреть и выбрать нужные записи. Если понятие многоаспектно, то указатель выведет на экран монитора все возможные аспекты, покажет направления поиска. Электронный каталог сохранит преимущества систематического каталога, так как в нем всегда возможен поиск “выше — ниже” по иерархии делений.
Сегодня за пределами поисковых процедур находится колоссальный массив типовых, повторяющихся понятий, образующих деления общего и специального применения. С помощью указателя эффективность поиска многократно возрастает, так как на соответствующем этапе поиска перед пользователем возникнет информация об имеющихся типовых делениях. Появляется возможность использования классификационных формул, с помощью которых пользователь сам комбинирует элементы классификационного индекса.
Может кому-нибудь покажется всё это сложным? Ведь набрать слово проще. Но это мнение глубоко ошибочное. Далеко не всегда пользователь подходит к электронному каталогу “с готовым словом на кончике пера”. Порой так хочется увидеть перечень, список, из которого можно было бы выбрать. Это так естественно для человека, который всю свою жизнь находится в состоянии выбора. Право , невозможно представить себе ресторан, в котором, вместо того, чтобы подать Вам меню, официант начал бы проводить с вами социологическое исследование на тему “Что бы Вам хотелось выпить и поесть?”.
Дайте посмотреть и выбрать! Это особенно удобно в тех случаях, когда запрос не сформулирован заранее (мы имеем в виду запросы по тематике, содержательные, а не формальные, когда читатель ищет определенный документ известного автора). А если говорить о массовом пользователе, то подчеркнем: отличительной особенностью систематического каталога, не присущей никакому другому, является возможность его использования для выбора литературы в случае неопределенного спроса. В систематическом каталоге можно “рыться” и делать при этом удивительные открытия. Попробуйте порыться в электронном каталоге, когда тебя всё время просят написать “слова”...
Мне хотелось бы заинтересовать проблемой библиотекарей. В конце концов вам работать с читателями и их запросами. Надеюсь, кто-нибудь покажет этот текст молодому компьютерщику, программисту, желающему пойти своим путем. Нельзя же все время смотреть “как у них”… У них этого не было потому, что они в этом не нуждались. А почему до сих пор этого нет у нас?