Пути формирования информационно-поисковых систем по краеведению: на примере ИПС “Санкт-Петербург”
Development of Information Retrieval Systems on Regional Studies: IRS “St. Petersburg”.
Шляхи формування інформаційно-пошукових систем з краєзнавства : на прикладі ІПС "Санкт-Петербург"

Мангутова С. Д., Минц Н.Н.

Российская национальная библиотека, Санкт-Петербург, Россия

Svetlana D. Mangutova, Natalia N. Mints

National Library of Russia, St. Petersburg, Russia

Мангутова С.Д., Мінц Н.Н.

Російська національна бібліотека, Санкт-Петербург, Росія

В докладе представлены теоретические подходы и опыт формирования информационно-поисковых систем по краеведению. Особое внимание уделено проблеме семантического анализа документов с точки зрения раскрытия их краеведческого содержания.

The theoretical approaches and experience in development of regional studies information-retrieval systems are presented. Special attention is given to the problem of semantic analysis of documents in terms of their regional content.

У доповіді подані теоретичні підходи і досвід формування інформаційно-пошукових систем з краєзнавства. Особливу увагу приділено проблемі семантичного аналізу документів з точки зору розкриття їх краєзнавчого змісту.

Положение Петербурга как промышленного, научного, культурного, а в течение двух веков и административного центра — столицы России, определили чрезвычайный объем и разнообразие информации о городе. Примерно с конца 1970-х — начала 1980-х гг. в петербургском краеведении наметился новый подъем и, как следствие этого, возрастание социальной значимости краеведческой информации. Это обстоятельство обнаружило противоречие между объемом информационных ресурсов и качеством предоставляемых пользователю информационных услуг. Информационное обеспечение петербургского краеведения было явно неудовлетворительным, т. к. не существовало системы библиографических указателей (БУ) о городе даже в традиционном ее виде, не говоря уже о более современных информационных продуктах.

Изменить сложившуюся ситуацию в области библиографии петербурговедения был призван совместный проект РНБ и ЦГПБ им. В.В.Маяковского —БУ “Новая литература о Ленинграде”. Он был задуман в 1989 г. как текущий краеведческий указатель, выходящий 2 раза в год с целью оперативного и полного учета печатных работ о жизни города. Первые три выпуска БУ, подготовленные в традиционном режиме, были далеки от совершенства. 4-й выпуск, вышедший в 1991 г., впервые был подготовлен с помощью ПЭВМ. Таким образом, практически одновременно с подготовкой указателя начала создаваться краеведческая БД “Санкт-Петербург”, общий объем которой составляет на сегодняшний день более 100 тыс. записей.

БД содержит универсальную библиографическую и фактографическую информацию о городе, полученную в результате семантического анализа документов (в т.ч. некраеведческой тематики) и кумулирует информацию о Петербурге за определенный период времени (в настоящее время — 1 год). ИПС “Санкт-Петербург” состоит из информационного массива (библиографические описания + аннотации), технических средств (персональный компьютер и т.д.), программного обеспечения (пакет СDS/ISIS), информационно-поискового языка, правил его использования и машинного словаря терминов.

ИПС “Санкт-Петербург” предназначена для обработки, хранения и использования краеведческой информации в научно-исследовательской, учебной, преподавательской и культурно-просветительной деятельности. С этой целью она решает следующие задачи:

ИПС “Санкт-Петербург” отвечает требованиям, предъявляемым к информационным продуктам высокой степени аналитичности. Это означает, что она располагает средствами, позволяющими раскрыть тематику, структуру, состав и наполнение БД на формализованном и содержательном уровнях. Формализованным средством является в нашем случае классификационный ИПЯ в виде модернизированного варианта ББК для краеведческих каталогов библиотек. Средством, раскрывающим содержание документов на библиографическом, тематическом, фактографическом и предметном уровнях выступают библиографическое описание, аннотация, дескрипторный ИПЯ, язык ключевых слов (КС) и предметных рубрик (ПР).

Каждое из перечисленных средств обладает своими достоинствами и ограничениями. Поэтому только совокупное их использование позволяет предельно точно и полно отразить краеведческое содержание документа, а также обеспечить информационный поиск, адекватный любому типу запросов.

Выявление документов осуществляется путем сплошного просмотра печатных источников. Основными принципами первичного (предварительного) отбора документов являются: хронологический охват, виды включаемых документов и язык, на котором они написаны. Основными принципами вторичного (качественного) отбора документов являются: наличие краеведческой информации в документе; научная, практическая, историческая и художественная ценность документа; максимально возможная полнота отбора документов; четкость определения территориальных границ.

Особо важными при формировании краеведческой ИПС, на наш взгляд, являются 2 положения:

1) Наличие краеведческой информации в документе означает, что отбору подлежат материалы, касающиеся любого вопроса из истории и современной жизни Санкт-Петербурга. При отборе акцент делается только на тексты, в которых содержатся местные реалии. Именно наличие петербургского субстрата (фона, деталей) решает вопрос о включении либо невключении текста в БД. Сам по себе факт рождения или проживания определенного лица в городе, даже известный по другим источникам, не всегда может служить основанием для ввода публикации в БД. Что касается лиц, о которых появляются работы общего характера, то из текста вычленяется лишь та часть, которая непосредственно относится к Санкт-Петербургу;

2) Территориальные границы устанавливаются, в первую очередь, исходя из современного административно-территориального деления Санкт-Петербурга.

Проанализируем преимущества и недостатки предлагаемых путей формирования краеведческой ИПС.

Сравнительный анализ потребностей в краеведческой информации, проведенный нами, показал тенденцию их увеличения приблизительно с 50% в 1991 г. до 80% в 1998 г. Анализ показал также, что пользователи обращаются к ИПС чаще всего не для расширения кругозора. Наибольший процент обращений к ИПС и традиционным ресурсам носит исследовательский характер. Примечательно, что даже учащиеся средней школы и студенты обращаются с целью поиска краеведческой информации, не лежащей на поверхности, малоизвестной широкому кругу.

Исходя из особенностей информационных потребностей, менялся в течение последних лет подход к созданию информационного продукта. Каким образом это происходило?

Во-первых, расширялся круг источников: так, если на начальной стадии он насчитывал чуть более 100 наименований, то в настоящее время их количество достигает 700. Это продиктовано уникальностью информации о Санкт-Петербурге, разбросанной по разным, казалось бы далеким от краеведческой тематики источникам. Расширение круга источников происходило и происходит, главным образом, за счет научных изданий.

Во-вторых, менялся с течением времени сам подход к раскрытию содержания научных и популярных источников: материалам источниковедческого характера, публикациям архивных документов, воспоминаниям, дневникам, переписке стало уделяться особое внимание. Эти документы подвергаются более тщательному отбору и углубленной обработке.

Анализ документов, отобранных в ИПС на первом этапе, проводится таким образом, чтобы информация, полученная в результате, отвечала не столько на информационный запрос пользователя, но шире — удовлетворяла информационную потребность, т.е. перекрывая информационные ожидания читателей, позволяя ему творчески осуществлять поиск, находя не предусмотренные заранее источники, увеличивая, таким образом, возможность выбора.

В третьих, на протяжении всех лет работы корректировался словарь терминов. В настоящее время словарь включает более 6 тысяч КС, дескрипторов и ПР. В процессе индексирования семантическая информация вручную переводится на язык лексических единиц и этот процесс носит субъективный характер. В то же время каждый новый термин подвергается контролю редактора ИПС.

Так, на разных этапах словарь обогатился, например, такими особенно важными для краеведения и трудоемкими для поиска в традиционном режиме терминами, как “быт” (с подрубриками: — военный, — дворянский, — литературный, — придворный, — рабочих, — студентов и т.п.), “домовые церкви”, “доходные дома”, “россика”, “феномен города”, “этнические группы” и т.д. Например:

Аксель-Хансен Э. Письма из России / Публ. и предисл. Б.Вайля // Новое лит. обозрение. — 1993. — № 5. — С.334-361.

Петроград мая-декабря 1917 г. в личных письмах секретаря Датского посольства в России. Быт сотрудников посольства.

датчане. быт. россика. посольства.

Миллионная ул., 16.

Датское посольство.

переписка.

Как известно, эффективность любого элемента справочно-библиографического аппарата (как традиционного, так и нетрадиционного) повышается благодаря системе ссылок и отсылок. В ИПС “Санкт-Петербург” с ее помощью решается, например, проблема переименований учреждений и организаций, т.к. для краеведческой БД является одним из наиболее часто встречающихся элементов словаря. Постоянно совершенствуется работа над системой установления связей между элементами словаря.

Главная задача создателей ИПС “Санкт-Петербург” — семантический анализ документов с точки зрения раскрытия их краеведческого содержания. Вместе с тем, поисковые возможности ИПС несомненно шире, так как она одновременно является источником получения обширной информации по различным аспектам отечественной истории, экономики, культуры и науки. Примером может служить следующий источник:

Оцуп Н.А. Океан времени: Стихотворения; Дневник в стихах; Статьи и воспоминания о писателях / Сост. и вступ. ст. Л.Аллена; Коммент. Р.Тименчика. — СПб.: Logos; Дюссельдорф: Голубой всадник, 1993. — 616 с.: ил. — (Лит. рус. зарубежья). — Из содерж.: Аллен Л. "С душой и талантом...": Штрихи к портрету Н.Оцупа; Стихотворения: Град; Встреча: Поэма: 1. Царское Село; Статьи и воспоминания о писателях: Царское Село: (Пушкин и Иннокентий Анненский); Н.С.Гумилев; "Всемирная литература" и Роза; Встречи с Федором Сологубом; Евгений Замятин; П.П.Потемкин; "Серебряный век" русской поэзии.

В данном случае КС, как: “серебряный век”; быт литературный; “Цех поэтов”, лит. об-ние; “Всемирная литература”, изд-во; Дом искусств; “Привал комедиантов”, лит.-артист. кабаре; “Бродячая собака”, лит.-артист. кабаре; “Башня” Вяч. Иванова; Салон Мережковских и т. п. несут не только краеведческую смысловую нагрузку. Они могут быть эффективно использованы для изучения литературного процесса в России начала XX века.

Проанализировав основные преимущества ИПС “Санкт-Петербург”, с точки зрения содержания и соответствия информационным потребностям пользователей, перейдем к рассмотрению ее сервисных возможностей в справочно-библиографическом обслуживании.

Итогом нашей работы на сегодняшний день можно считать тот факт, что ИПС “Санкт-Петербург” позволяет реализовать широкий спектр информационных услуг, а именно:

Вместе с тем реализовать качественно указанные информационные услуги нам мешает ряд нерешенных проблем. Среди них наиболее острыми являются оперативность, проблемы лингвистического обеспечения, комфортность справочно-библиографического обслуживания пользователей.