Анализ Z39.50 ресурсов с точки зрения пользователя

Analyzing Z39.50 Resources from the User’s Standpoint

Аналіз Z39.50 ресурсів з точки зору користувача

Степанов В.К.

Московский государственный университет культуры и искусств, Москва, Россия

V. K. Stepanov

Moscow State University of Culture and Arts, Moscow, Russia

В.К. Степанов

Московський державний університет культури і мистецтв, Москва, Росія

Изложены результаты анализа наиболее авторитетных зарубежных и российских шлюзов Z39.50. На основе проведенного тестирования, сделано заключение о состоянии и перспективах каталогов, использующих Z39.50, показаны их достоинства и недостатки. Сделан вывод о том, что данный протокол не может быть эффективно использован для создания распределенных сводных каталогов.

The report contains data on the state-of-the-art and perspective development of Russian and international Z39.50 resources. A conclusion is made that Z39.50 is no longer the most efficient technology for building local or international union library catalogs.

Викладено результати аналізу найбільш авторитетних зарубіжних і російських шлюзів Z39.50. На основі проведеного тестування зроблено висновок про стан і перспективи каталогів, що використовують Z39.50, показано їх переваги і недоліки. Зроблено висновок про те, що даний протокол не може бути ефективно використаний для створення розподілених зведених каталогів.

 

В последнее десятилетие сочетание Z39.50 прочно удерживается в лексиконе специалистов, сфера деятельности которых связана с обеспечением доступа с библиографическим базам данных. Изучению теоретических и прикладных аспектов этого протокола посвящена огромная литература, а Интернет наполнен проектами, реализованными на базе Z39.50. Задача данного исследования заключается в проведении анализа Z-систем с точки зрения пользователя и определении их места и роли в общем перечне доступных в Интернет библиографических источников. Основой доклада послужили результаты тестирования зарубежных и отечественных Z39.50 ресурсов, изучение специальной литературы на английском и русском языках и опрос российских и американских экспертов.

Для анализа были отобраны наиболее авторитетные зарубежные и российские ресурсы, поскольку именно в них наиболее ярко проявляются достоинства протокола. Среди зарубежных источников в тестируемую группу вошли Z39.50 Gate Библиотеки Конгресса к каталогам библиотек всего мира (http://lcweb.loc.gov/z3950), Британский сайт UK Z39.50 directory (http://www.ukoln.ac.uk/dlis/zdir), австралийский Directory of Z39.50 Targets in Australia (http://www.nla.gov.au/libraries/adm/vCucadm.html), канадский Directory of Z39.50 Targets in Canada (http://novanet.ns.ca/vCucadm.html). В число российских ресурсов были отобраны шлюзы Корпоративной библиотечной системы вузов Санкт-Петербурга на сервере RUSLANet (http://www.ruslan.ru:8001/rus/z3950/gateway.html), Региональной корпоративной библиотечной системы Новосибирска (http://z3950.uiggm.nsc.ru/zgwc/zcgi.exe), программы LibWeb на сервере БЕН РАН (http://195.178.196.201/Zgw) и Корпоративной сети публичных библиотек Москвы (http://corporate.gpntb.ru).

В число исследуемых параметров включались: техническая устойчивость сервера, возможности пользовательского интерфейса, корректность обработки запросов, способность сохранять результаты поиска, наличие сервисных функций. Тестирование проводилось в разное время суток в период с 1 по 30 марта 2001 года.

Результаты тестирования позволили прийти к следующим выводам:

Техническая устойчивость большинства серверов Z39.50 достаточно высока. Системы в состоянии выполнять все декларируемые действия, включая текущую смену форматов найденных записей, пролистывание многостраничного списка и возвращение к исходной странице без потери данных. Исключение составляют канадский и австралийский шлюзы, доступ к которым иногда бывает закрыт по непонятным причинам, а также новосибирский Z39.50 сервер, до сих пор находящийся в режиме отладки (не редки отказы в обслуживании, эффект “потеря данных” при возвращении на предыдущую страницу).

Возможности пользовательского интерфейса определяют степень сложности поисковых предписаний, которая в идеале должна быть максимальной. В зависимости от подходов к реализации этой задачи, все шлюзы можно условно разделить на три группы. Первая группа характеризуется созданием предельно примитивных форм приема запроса, состоящих из одного поля: поиск можно вести или только по автору, или только по заглавию или по предметной рубрике, с невозможностью сочетания в запросе двух и более признаков. При этом особенности удаленных баз данных, к которым происходит обращение, полностью игнорируются. К этой группе относятся британский, австралийский и канадский шлюзы. Понятно, что подобные источники представляют наименьший интерес для пользователя, поскольку не позволяют вести многоаспектный поиск.

Вторая группа шлюзов отличается использованием единых универсальных поисковых интерфейсов сложной структуры. Как правило предоставляется поиск по большинству значимых полей с возможностью их сочетания. Характерно, что при этом особенности удаленных систем также не учитываются. По сравнению со шлюзами первой группы, эти системы несравненно более удобны с точки зрения пользователя, однако платой за универсальность интерфейса является некоторое обеднение (огрубление) возможностей запроса по сравнению с оригинальными системами. Описанный метод реализован в шлюзе LibWeb, корпоративных проектах Новосибирска и Москвы.

Разработчики шлюзов третьей группы идут по пути максимального учета особенностей поисковых систем конкретных библиотек. Характерным примером является шлюз Библиотеки Конгресса в котором каждая форма ввода запроса создана с учетом особенностей поисковых механизмов удаленных каталогов. Так для каталогов, использующих программный пакет SIRSI применяется свой стандартный интерфейс, для каталогов, использующих INNOPAC, ALEPH — свои и т.д. Во многих случаях учитываются даже особенности каждого конкретного каталога (Датская Королевская библиотека). Из российских шлюзов по этому пути идут разработчики шлюза RUSLANet, в котором каждый вход имеет собственный интерфейс, практически повторяющий интерфейс оригинального каталога удаленной библиотеки. При крайней трудоемкости, именно этот метод позволяет максимально расширить возможности составления запроса, включая любое сочетание полей, поиск по фразе и пр. Для пользователя обращение к такому шлюзу практически равнозначно обращению к оригинальному каталогу на сайте библиотеки.

Корректность обработки запроса является ключевым показателем для любой поисковой системы, поскольку им определяется и гарантируется полнота получаемых результатов. И именно эта характеристика является наиболее узким местом систем Z39.50. Многочисленные тесты показали, что корректность обработки запроса напрямую связана с методом формирования поискового интерфейса. Приемлемое качество достигается только в случаях предельной примитивизации механизма приема запроса (первая группа шлюзов) или путем ее идеальной “подгонки” под каждую уникальную удаленную систему (третья группа). При обоих вариантах система выдают корректные результаты поиска. Надежность выявления документов в шлюзах второй группы весьма низкая. Причиной этого является техническая сложность реализации диалога между различными Z39.50 системами. В итоге достоверность результатов поиска заставляет желать много лучшего: разница в числе выдаваемых записей через вход Z39.50 и через оригинальный каталог одной и той же библиотеки составляет порой несколько десятков.

Сервисные функции каталогов подразумевают способность пользователя настраивать систему в зависимости от типа решаемых задач, наличие разнообразия режимов вывода и сохранения результатов поиска. Большинство существующих шлюзов обладают возможностью представлять запись в краткой и полной форме как в виде текста, так и в различных MARC форматах. Российские шлюзы оснащены функцией выгрузки отдельной библиографической записи на компьютер пользователя, что имеет кардинальное значение для корпоративной каталогизации. Пока ни одна из систем не в состоянии формировать список и отправлять его по электронной почте. Для каталогов, реализованных на Z39.50, весьма актуальным является устранение дублирования в списке результатов, поскольку они одновременно обращаются сразу к нескольким базам данных. В настоящее время единственным шлюзом, декларирующем эту возможность является RUSLANet, однако проверка показала, что эта функция не работает даже при наличии в документах ISBN.

Проведенное исследование дает основания сделать ряд выводов. Прежде всего следует признать, что крайне привлекательная идея создания на основе технологии Z39.50 распределенных сводных каталогов выглядит чрезвычайно трудновыполнимой, а, скорее, — принципиально нереализуемой. Причина кроется в том, что структура хранения данных и поисковые механизмы каталогов библиотек серьезно отличаются один от другого. При использовании универсального интерфейса поискового интерфейса протокол не в состоянии корректно обеспечить взаимодействие различных систем. Итогом этого является недостоверность получаемых результатов, что само по себе резко снижает ценность Z39.50 ресурсов.

Низкая степень надежности извлекаемых сведений является главной причиной осторожного отношения к Z39.50. Именно сложность технической реализации поиска одновременно в различных базах данных привела к тому, что многие громкие проекты, наподобие создания европейского сводного каталога Europagate, так и не были реализованы и ныне практически полностью забыты, (http://europagate.dtv.dk/wg_index.htm).

Применение Z39.50 в обозримой перспективе скорее всего ограничится созданием отправных точек к различным каталогам, наподобие шлюза Библиотеки Конгресса США. Такие сайты безусловно полезны при поиске сведений из разных источников. Однако при серьезных библиографических розысканиях, требующих исчерпывающего выявления всех имеющихся сведений, предпочтительно обращение к оригинальным каталогам библиотек, в которых максимально учтены особенности каждой поисковой системы и которые гарантируют необходимую полноту выявления материалов.

Следует иметь ввиду, что сама идеология протокола Z39.50 разрабатывалась в “довэбовскую эру”, когда многие из нынешних возможностей передачи данных еще просто не были изобретены. С большой долей уверенности можно утверждать, что магистральное развитие отрасли будет определяться технологиями нового поколения, которые обладают гораздо более широкими возможностями по сравнению с Z39.50.