2.2.4. Лингвистическое и информационное обеспечение автоматизированных систем

Лингвистическое обеспечение АИС, ЛО

[linguistic support]

В автоматизированных информационных системах выделение лингвистического обеспечения (ЛО) из состава информационного обеспечения и оформление его в качестве самостоятельной подсистемы службы или направления деятельности было фактически завершено к 1976 году и получило юридическое закрепление Постановлением от 30.09.81 “Об утверждении единого порядка разработки и развития автоматизированных систем НТИ”. В настоящее время этот документ считается утратившим силу. Лингвистическое обеспечение достаточно развитой автоматизированной информационной системы (АИС) должно включать в себя следующие компоненты:

Языковые средства :

Средства поддержки ЛО :

Каждый тип языковых средств, кроме алфавита, единого для всего лингвистического обеспечения системы, включает в себя:

Особенность лингвистического обеспечения сети по сравнению с автономно работающими системами заключается в том, что ЛО сети делится еще по одному основанию - по сфере применения.

По этому аспекту выделяются :

  1. Общесистемные языковые средства [general language resources] , применяемые всеми звеньями системы (типовые ЛО) либо используемые для взаимодействия между звеньями в качестве языка-посредника (обменные средства ЛО, см., например, - “Общесистемный формат ”);
  2. Локальные языковые средства [local language resources] , применяемые только в рамках отдельно взятого звена (см., например, - “Внутренний формат ”);
  3. Внешние языковые средства [external language resources] , не применяемые для решения задачи внутри системы и используемые только при взаимодействии с внешними по отношению к АИС системами. Графические средства представления данных - Средства естественного языка (план выражения письменного текста) включают в себя алфавиты и микросинтаксис:

В текстах на естественном языке используются следующие алфавиты :

Под текстовыми особенностями в текстах на естественном языке понимают:

Представление графической информации в АИС сопряжено с рядом трудностей, вызванных, с одной стороны, ограниченностью набора символов, а с другой — необходимостью строгой линейности записи без полиграфических особенностей. Поэтому графические средства АИС обычно беднее, чем соответствующие средства естественных языков. Однако АИС, в которых формируются информационные издания, вынуждены разрабатывать и использовать специальные средства для представления разнообразной текстовой информации [36].

НОРМАТИВНАЯ/АВТОРИТЕТНАЯ ЗАПИСЬ [Authority Record ] –

Стандартизированная (нормируемая) машиночитаемая запись, основным содержанием которой является имя собственное какого-либо лица, наименование организации, предмета, темы, заглавие произведения, устанавливаемые каталогизирующей организацией, ответственной за запись. В дополнение к указанной основной части (“заголовку”) запись может содержать: информационные примечания, все вариантные и связанные “заголовки”, от которых должны формироваться ссылки, примечания об источниках информации и т.д., сведения о каталогизирующей службе, ответственной за описание, Международный стандартный номер нормативных данных.

Основным назначением авторитетных записей является обеспечение полноты и точности поиска в автоматизированных, в том числе информационных и библиотечных системах. Существуют различные традиционные и машинные способы представления лексических единиц и отношений между ними в информационно-поисковых тезаурусах, делений предметных и иерархических библиотечных классификаций с отношениями между ними. Для того, чтобы стандартизировать способы представления указанных данных, в мировой практике ведется специальная работа, поддерживаемая ИФЛА, по созданию машиночитаемых записей, называемых Authority records и массивов (файлов) этих записей – “ Authority files” - файлов нормативных записей, или авторитетных файлов .

Дискуссия о переводе терминов "Authority records" (нормативные, или авторитетные, записи) используемых в английском языке, еще не закончена. Специалисты по автоматизации библиотек решают этот вопрос, тем временем используют двойной перевод терминов: "нормативные/авторитетные записи", "файлы нормативных/авторитетных записей " . Ниже используются словосочетания "нормативные записи", "файлы нормативных записей".

В 1984 г. опубликовано Руководство по составлению нормативных и ссылочных записей (GARE). На основе совещаний Рабочей группы IFLA в 1989, 1990 и 1991 гг. подготовлен и утвержден в 1992 г. Руководство по предметным нормативным и отсылочным записям. Почти все машиночитаемые нормативные записи для авторов представлены в форматах типа MARC (см.), но очень небольшое число стран уверено в своих намерениях использовать UNIMARC (см.) для обмена нормативными записями. Обмен файлами не является еще обычным делом. Большинство партнеров обмениваются микрофишами [472, 473].

 

 

Информационное обеспечение Автоматизированной

информационной Системы, ИО АИС [information support] –

Структурированная совокупность всех документов и данных (или иначе - “информационных элементов”), хранящихся и циркулирующих в автоматизированной информационной системе, включая её вход и выход, независимо от характера носителей, на которых они записаны. Тематический и видовой состав документов и данных ИО АИС определяется её функциональным назначением. В системном плане вся совокупность документов и данных в АИС, составляющих её ИО, рассматривается как единое целое. Взаимосвязь отдельных компонентов ИО (базы и банки данных различного назначения, электронные каталоги, фонды документов, справочно-информационные фонды , массивы данных и т.п.) определяется логической структурой средств ИО, а правила их формирования, поддержки в рабочем состоянии, актуализации и использования – соответствующей технологической и организационной документацией, в свою очередь составляющей часть ИО АИС. Состав и количественные характеристики ИО каждой системы в течение времени изменяются, поэтому принято четко фиксировать его состояние в привязке к календарю или определенным временным интервалам. В этом случае используется также понятие информационная база автоматизированной системы.

Примечание: некоторые специалисты относят к ИО АИС также используемые системы кодирования данных, которые скорее м.б. отнесены к средствам лингвистического обеспечения АИС.

ИНФОРМАЦИОННАЯ БАЗА ( автоматизированной системы, службы )

[information support] -

Состояние информационного обеспечения автоматизированной информационной системы в заданный или определенный промежуток времени.

Существуют и другие определения понятия “информационная база” (ИБ), например, такое: "ИБ в автоматизированных системах - совокупность данных, размещаемых на внешних носителях и предназначенных для использования программами и пользователями. Так, например, в банках данных информационная база - это часть информационного фонда, включающего базы данных (выделенное см. ниже) и их описания - метаданные " [265].

Видимые различия в приведенных определениях одного и того же понятия касаются двух моментов: отсутствия во втором определении явной привязки ИБ к конкретному моменту или промежутку времени, что делает данную дефиницию близкой по указанному признаку к ИО АИС, и ограничение ИБ только той частью информационного фонда, которая размещена на машиночитаемых (в тексте - внешних) носителях информации.

Мы не намерены полемизировать с уважаемыми нами авторами цитируемого определения, поскольку действительно значительная часть специалистов придерживается аналогичных взглядов на это понятие. Тем не менее нашим читателям полезно знать, что в относительно новой и быстро развивающейся отрасли знания - информатике существует значительное число не установившихся терминов, а также различия в их толковании.