Нормативный контроль в электронном каталоге РНБ:
состав и структура нормативных данных

Authority Control in Electronic Catalog of Russian National Library:
Authority Data Structure

Нормативний контроль в електронному каталозі РНБ:
склад та структура нормативних даних

Загорская Е.И., Кулиш О.Н.

Российская национальная библиотека, Санкт-Петербург, Россия

Zagorskaya E.I., Kulish O.N.

Russian National Library, St.-Petersburg, Russia

Загорська О.І., Куліш О.Н.

Російська національна бібліотека, Санкт-Петербург, Росія

В качестве информационной модели авторитетных данных представлен проект структуры интегрированного авторитетного файла для электронного каталога Российской национальной библиотеки. Модель описывает: объекты авторитетного контроля; базовые элементы и составляющие авторитетных данных. Также в статье приведены определение, группы, соотношение элементов авторитетных данных и их значение для осуществления авторитетного контроля.

A project of integrated authority file's structure for RNB's electronic catalogue is described as an information model of authority data. The model includes: objects of the authority control; basic atomy elements and compound elements of authority data. Definition, group, and correlation of authority data's elements and their membership in authority control's objects are described as well.

Подсистема нормативного (авторитетного) контроля является одним из важнейших инструментов электронного каталога (ЭК). Задачей нормативного контроля является поддержка структуры связей каталога, нормативных файлов и указателей, а также обеспечение согласованности элементов библиографических записей (БЗ) при вводе и эффективной обработки этих элементов при поиске. Выполняя эту задачу, подсистема предоставляет нормативные и другие формулировки различных элементов БЗ, подлежащих унификации, дополнительную справочную информацию, а также поддерживает связь между различными ИПЯ каталога, что было желательно для традиционных карточных каталогов, и обязательно для электронной формы библиотечного каталога.

Автоматизация процессов каталогизации и интегрированный нормативный контроль предполагает, что нормативная запись вводится в систему только один раз, а затем автоматически генерируются её связи со всеми релевантными БЗ. Это снижает риск потери документа при поиске из-за ошибок при вводе с клавиатуры или импортировании записей в библиографический файл ЭК. Любая модификация нормативной записи будет автоматически относиться и к другим нормативным записям, связанным с модифицируемой, а также и к соответствующим записям библиографического файла.

Автоматизированный режим нормативного контроля осуществляется через нормативные файлы, фиксирующие нормируемые точки доступа всех документов, отраженных в каталоге. Это означает, что нормативные данные ЭК включаются в нормативные файлы, представляющие различные комплексы нормативных, ссылочных и справочных записей для различных типов заголовков, предметных рубрик (ПР), классификационных индексов и других элементов БЗ в виде машиночитаемых нормативных записей.

В настоящее время ведущие зарубежные библиотеки накопили значительный опыт ведения автоматизированного нормативного контроля в библиографическом описании (БО) и предметизации, и начинают, на базе этого опыта, решать задачи нормативного контроля классификационных ИПЯ в ЭК. Кроме того, современные решения задач нормативного контроля предполагают интеграцию отдельных нормативных файлов в единую базу нормативных данных (БНД) в рамках одного ЭК, а также создание объединенных национальных и международных нормативных файлов.

Информация, которая должна быть нормируемой в каталожной записи ЭК, является таковой же и в традиционных каталогах. Спецификой ЭК является то, что он представляет собой единую базу данных, включающую поисковые образы документов (ПОД) на всех ИПЯ - БО, ПР, индексы классификационых ИПЯ. Это означает, что одинаковые по семантике понятия, которые в системе традиционных каталогов могли оставаться не согласованными по формулировке, в ЭК должны быть взаимосвязанными и согласованными, причем их связи должны быть выражены эксплицитно.

При проектировании системы нормативного контроля ЭК РНБ мы исходим из того, что это должна быть интегрированная БНД, отвечающая современным требованиям к автоматизированному нормативному контролю ЭК и потенциально способная стать основой национальной БНД. Под такой БНД мы понимаем совокупность нормативных данных ЭК, предназначенных для коллективного использования на всех этапах и для всех видов каталогизации, т.е. БНД должна иметь множество назначений, соответствующих представлениям хранимых данных в различных элементах БЗ, и предусматривать централизованное ведение и управление нормативными данными.

Концептуальная, или информационная, модель БНД ЭК РНБ представлена в форме таблицы (см. табл.1 “Структура нормативных данных ЭК РНБ”).

Основной задачей, которая ставилась при разработке концептуальной модели БНД, является определение элементов нормативных данных (установление объектов нормирования в ЭК) и их взаимосвязей, а также их описание в табличной форме. Решение этой задачи включало также разделение нормативных данных на базовые (атомарные) элементы и элементы выводимые, и их группировку. Разработанная нами модель позволяет представить, что означает каждый нормируемый элемент и какие для него возможны операции.

В предложенной модели БНД представлены:

объекты нормативного контроля (элементы БЗ, подлежащие нормативному контролю)

представляющие их элементы данных (базовые и выводимые элементы нормативных данных)

взаимосвязи элементов данных и их членства в объектах нормативного контроля

группировка элементов нормативных данных.

Часть нормируемых данных, с точки зрения их семантики, легко вычленяется по формальным признакам и является как бы “первокирпичиками”, базовыми атомарными элементами, которые, в то же время, представляют собой элементы БЗ. К ним относятся индивидуальные имена, наименования некоторых типов коллективов, унифицированные заглавия и ряд других.

Сложнее решается вопрос с представлением данных, которые могут выступать как в качестве самостоятельных единиц БЗ, так и входить в качестве составной части (звена) в другие единицы или другие ИПЯ. В этом отношении наиболее показательным является пример географических наименований. Все три каталожных ИПЯ используют географические наименования для формулировки ПОДов. Географические наименования представлены в ББК в виде классификационных делений (основных таблиц и таблиц ТТД); в языке предметных рубрик (ЯПР) эти наименования представлены как лексические единицы (ЛЕ), т.е. заголовки и подзаголовки ПР; эти же наименования включаются в качестве структурного элемента в заголовки формы и заголовки таких коллективных авторов, как органы власти и управления и некоторые другие. Следовательно, единый массив нормативных записей географических наименований используется и для заголовка коллективного автора БО, и для заголовка формы БО, и в ЯПР.

Для выводимых элементов нормативных данных нужны специальные средства организации в базе данных, чтобы контролировать их лексику и связи. Они по своей структуре являются элементами составными, набираемыми из базовых элементов. К ним относятся, прежде всего, сложные ПР, развернутые классификационные индексы ББК, заголовки формы, заголовки наименований органов власти и управления и др.

Естественно, что не может быть полного совпадения, например, списка ПР-персоналий и списка индивидуальных имен алфавитного каталога. В этой группе элементов нормативных данных будет совпадающая часть имен и часть, которая отсутствует в одном списке, но присутствует в другом. И тем не менее, базовым массивом как для формы индивидуального имени в качестве элемента БО, так и формы имени-персоналии в предметизации, будет единый массив нормативных записей имен.

Таким же образом форма наименования коллективного автора берется и для формулировки ПР, и для БО из единого массива нормативных записей наименований коллективов. И в данном случае не имеет значения, каким образом формируется это наименование - непосредственно из базового элемента (наименование коллективов с невыделяемым географическим элементом или при его отсутствии) или выводимого (наименование коллективов с выделяемым географическим наименованием).

Базовые (атомарные) элементы нормативных данных представлены структурными элементами классификационного ИПЯ (в данном случае - ББК, но на её месте может быть и УДК) и лексикой языка предметных рубрик (ЯПР) и элементов БО, подлежащих нормированию в каталоге РНБ.

Базовые элементы, которые или непосредственно представляют нормативные заголовки, или являются составными частями для выводимых элементов, разделены на следующие группы:

Элементы классификационного ИПЯ (ББК):

основные таблицы (ОТ), планы расположения (ПлР), таблицы специальных типовых делений (СТД); таблица общих типовых делений (ОТД);

таблица территориальных типовых делений (ТТД);

таблица этнических типовых делений (ЭТД).

Элементы, используемые в разных ИПЯ (БО, ПР):

наименования серий - заглавия серий, которые используются и как элемент БО, и для формирования ПР;

наименования коллективов - группа нормативных данных, которая делится на две катагории: наименования коллективов, включаемых в нормативный заголовок в сочетании с т.н. выделяемой (контролируемой) географией и наименования других коллективов. Первая группа данных напрямую в заголовках не используется, а является составной частью при формировании соответствующего заголовка коллективного автора - вместе с географическим наименованием, поступающим из файла географических наименований. Вторая группа данных используется трояко: а) напрямую в качестве заголовка коллективного автора; б) в качестве структурного элемента (ЛЕ) ПР; в) как часть выводимых (составных) нормативных данных;

индивидуальные имена - группа элементов нормативных данных, разделяемая на две категории: собственно индивидуальные имена и родовые имена;

географические наименования;

унифицированные заглавия, к которым относятся как собственно унифицированные заглавия классических анонимов, так и заглавия неанонимных произведений, являющиеся частью заголовка “имя/заглавие”;

типовые и обобщающие заглавия, включаемые в заголовок “имя/заглавие”, а также виды материалов, отражаемых под заголовком формы.

Лексика ЯПР (только):

этносы и этнические группы - ЛЕ ПР, представляющие собой наименования этносов и этнических групп;

языки и языковые группы - ЛЕ ПР, представляющие собой наименования языков и языковых групп;

хронологические характеристики - ЛЕ ПР представляющие собой наименования исторических периодов и хронологические подзаголовки;

жанр/форма изданий - ЛЕ ПР, представляющие наименования жанров произведений и формы изданий;

тематические заголовки и подзаголовки ПР. Мы предполагаем, что из большой группы ЛЕ, названной “Тематические заголовки”, могут быть выделены еще некоторые группы (категории) ЛЕ.

Группировка элементов классификационного ИПЯ (классификационных делений ББК) обусловлена структурой эталонных таблиц классификации с учетом изменений и дополнений, получивших отражение в соответствующих официальных изданиях, а также с учетом изменений и дополнений, принятых на уровне методических решений РНБ.

Словарь ЯПР интегрирован с нормируемыми элементами БО, что обусловлено, во-первых, их общностью, основанной на использовании элементов естественного языка, и, во-вторых, возможностью унификации их формулировок при использовании как в БО, так и в качестве ЛЕ ПР. Такие нормируемые данные, как унифицированные заглавия, индивидуальные имена, наименования коллективов, серий, используются как элементы БО и как элементы ПР. Формы их приведения в БО и в ПР либо совпадают полностью, либо очень близки, либо являются производной одна из другой. Следовательно, как для процесса составления БО, так и предметизации нормируемые данные берутся из одного источника (файла), но оформляются они в том и другом случае по своим правилам, т.е. их внешние модели - различны.

Группы базовых элементов необходимо организовать таким образом, чтобы обеспечить оптимальное управление и контроль словаря, включая контроль ссылочно-справочного аппарата, распознавание синонимов и омонимов, процедуры модификации данных и расширение словаря. Наиболее надежна с точки зрения управления и контроля иерархическая организация понятий, сгруппированных по четко определенным категориям. В качестве инструмента иерархической организации базовых элементов нормативных данных ЭК РНБ мы предлагаем использовать ББК. Иерархические классификации типа ББК или УДК организуют систему понятий, представляющих весь универсум знаний, в классы и категории, и, по сути дела, являются готовым инструментом для организации словаря нормативных данных. Элементы ПР и БО можно сгруппировать по классификационным делениям основных и вспомогательных таблиц ББК. Причем отнесение ЛЕ к той или иной категории, разделу, классу зависит как от семантики понятия, так и от функции (роли) ЛЕ в составе сложной ПР. В таблице эта связь представлена стрелками между базовыми элементами ББК и базовыми элементами БО и ПР, например:

наименования этносов и этнических групп, должны быть сгруппированы в соответствии с таблицей этнических типовых делений ББК

наименования языков и языковых групп, должны быть сгруппированы в соответствии с классификационными деленями раздела “Языкознание” ББК;

наименования исторических периодов, хронологические подзаголовки предполается структуризовать в соответствии с классификационными делениями планов расположения раздела “История. Исторические науки” ББК;

наименования жанров произведений и формы изданий могут быть структуризованы как в соответствии с делениями основных таблиц, так и ОТД;

тематические заголовки могут быть разделены еще на несколько групп (категорий) и структуризованы соответственно отдельным СТД, ПлР, или основным таблицам отдельных разделов ББК.

Необходимо заметить, что, в основном, использование ББК в качестве инструмента для структуризации базовых элементов НД не влияет на связь между ПОД на ЯПР, БО и каталожными классификационными индексами, кроме случаев, когда базовый элемент выступает в качестве простой ПР (без подзаголовков). Иными словами, несмотря на использование для этих целей ББК, в качестве классификационного ИПЯ ЭК может применяться иная классификация, например, УДК. Однако, в некоторых случаях такая связь может быть использована при систематизации или для представления некоторых видов данных в кодированной форме. Например, когда индивидуальные имена или наименования коллективов используются в качестве последнего уровня детализации классификационных делений, и, напротив, географические понятия во внутренних моделях нормативных данных БО и ПР могут быть представлены классификационными индексами ТТД в качестве кодов.

Выводимые элементы представлены в таблице двумя типами данных. Во-первых, это две группы нормативных данных, представляющих собой: а) выводимые наименования коллективов, и б) заголовки типа “автор/заглавие”. Обе названные группы выводимых элементов используются как элементы БО и как ЛЕ ПР, т.е. являются составными элементами разных ИПЯ.

Наименования коллективов этого типа состоят из выделяемого контролируемого географического наименования и собственно наименования коллектива. Как правило, это наименования органов власти и управления, но подобная структура заголовка используется и для некоторых переводных форм наименований зарубежных университетов и других организаций, когда возникают трудности с прилагательным географического характера на русском языке.

Группа выводимых элементов “автор/заглавие” включает три вида нормативных заголовков: “автор/унифицированное заглавие” (например: Шекспир В. Гамлет), “автор/типовое или обобщающее унифицированное заглавие” (например: Чехов А.П. Пьесы, или Чехов А.П. Отдельные произведения) и “заголовок формы” (например: Россия. Договоры). Подобные заголовки используются и как ЛЕ ПР и в качестве комплексирующих рубрик в авторских комплексах алфавитного каталога (в ЭК - алфавитной сортировки БЗ при выполнении запроса). В обоих случаях подобные заголовки выступают как элементы двух разных ИПЯ.

Второй тип выводимых элементов нормативных данных - сложные ПР и классификационные индексы. Между двумя этими ИПЯ должна быть эксплицитно установлена связь, что и показано в таблице. Реально это означает, что каждой ПР будет присвоен точно соответствующий ей по содержанию классификационный индекс ББК. Такая работа проводится на этапе подготовки нормативных данных и, кроме всего прочего, способствует качественному редактированию списка ПР на этапе его подготовки к переводу в автоматизированную форму и дальнейшему управлению и контролю файла предметных рубрик в процессе его эксплуатации. Кроме того, автоматизированный аналог систематического ключа к ПР окажет значительное влияние на процессы предметизации и систематизации, предоставляя каталогизатору дополнительные возможности контроля выбора ПР и содержательного наполнения классификационных делений. Это обусловливает использование для систематической организации файла ПР именно той классификации, которая используется в ЭК РНБ в качестве классификационного ИПЯ (в РНБ это - ББК).


Табл. 1

Структура нормативных данных ЭК РНБ

Б

а

з

о

в

ы

е

э

л

е

м

е

н

т

ы

I I II III II II I





В

ы

в

о

д

и

м

ы

е

НД











Н о р м и р у е м ы е э л е м е н т ы БЗ

Файл ПР представлен в структуре нормативных данных как интегрированный, выполняющий функции и предметного доступа ЭК, и алфавитно-предметных указателей (АПУ) к классификационным индексам каталога и к таблицам ББК. Мы предполагаем, что ПР каталога смогут адекватно заменить большую часть ПР АПУ. Выборочные сравнения рубрик АПУ с ПР каталога подтверждают выводы исследований, проведенных в 1970-80-х годах в Библиотеке Конгресса США, о том, что для ЭК наличие отдельного АПУ в качестве языка-посредника является избыточным. Однако, сделать окончательные выводы для наших условий мы сможем после создания сводного АПУ и сравнения его с нормативным списком ПР каталога. В любом случае, каждая предметная рубрика средствами формата представления данных должна иметь указание на её функциональный статус: выполняет ли она все три функции (ПР каталога, АПУ к каталогу, АПУ к таблицам) или только одну или только две из них и какие. Процедура выполнения запроса по файлу ПР должна предусматривать возможность работы в раздельных режимах (только ПР каталога, только АПУ). При этом принципиально важно, чтобы одинаковые по содержанию рубрики вводились только один раз, а использовались - по-разному.

Предметные рубрики как выводимые элементы могут состоять только из ЛЕ, представленных как базовые элементы нормативных данных, либо выводимых, в свою очередь, из базовых, как, например, заголовки типа “автор/заглавие”.

Классификационные индексы как выводимые элементы представляют собой развернутые рабочие таблицы в электронной форме, производные из эталонных таблиц, т.е. базовых элементов. Простые индексы должны быть представлены в нормативном файле один раз с указанием их функционального статуса - является ли индекс классификационным делением и таблиц, и каталога, или только каталога, или только таблиц. Предметный доступ к классификационным индексам может осуществляться как через ПР и ключевые слова ПР, так и через ключевые слова дефиниций классификационных делений, которые в контексте нормативного контроля ЭК должны восприниматься как неконтролируемая лексика, поскольку текстовая часть таблиц ББК, как и таблицы в целом, контролируется вне системы нормативного контроля конкретного каталога.

Разрабатывая предложенную структуру нормативных данных ЭК РНБ, мы исходили из необходимости решить следующие задачи первого этапа проектирования базы нормативных данных:

определить состав и структуру элементов НД; установить взаимосвязи между элементами данных;

присвоить имена группам НД, установить правила отнесения элементов нормативных данных к тем или иным группам;

определить технологию использования элементов НД в процессах каталогизации и эксплуатации БНД;

принять решения о порядке ведения разных групп НД;

определить требования к разработке согласованных с форматом каталожных БЗ и приемлемых для всех элементов нормативных записей форматов (формата) машиночитаемого представления нормативных данных.