1.5.6. ФОРМАТ, ПОЛЕ ДАННЫХ И СВЯЗАННЫЕ С НИМИ ТЕРМИНЫ

ФОРМАТ [format, form, data format] -

  1. Совокупность правил записи и представления данных в памяти ЭВМ, в базе данных, на экране монитора или на внешнем носителе (в т.ч. человекочитаемом). Основной структурной единицей формата является элемент данных, который записывается в поле данных (см. ниже). Формат определяет: перечень полей данных, их характеристики, содержание вносимых данных и размещение. Определенное отличие от представленного определения имеют некоторые специальные форматы, например, формат SGML, в котором вместо полей данных служат "абзацы", "главы" и "списки";
  2. Элемент языка, в символическом виде описывающий представление информационных объектов в записи (в т.ч. в файле, базе данных и т.п.):
  3. Способ кодирования записи двоичной информации (например, - текстовый формат [ASCII format] - представление текстовой информации в коде ASCII);
  4. Способ разбиения поверхности носителя (например, магнитного диска - формат диска [disk format]) на адресуемые элементы (дорожки и сектора);
  5. Характеристика линейных размеров (ширины и высоты) печатного издания, листа, полосы набора, текстовой полосы и т.п. (например, - формат издания [format (size) of publication]) и/или порядок размещения реквизитов (например, - формат документа [document format]).

Еще одна дефиниция, позволяющая полнее раскрыть сущность весьма широкого понятия - "формат": "Определенная структура информационного объекта, подвергаемого обработке, записываемого на магнитный или оптический носитель, отображаемого на дисплее или распечатываемого на бумаге"[26].

В зависимости от характера информационного объекта, его структуры или способа записи различают:

В зависимости от сферы действия или характера распространения:

Коммуникативный формат, обменный формат -

Формат, предназначенный для обеспечения возможности обмена данными между автоматизированными системами разных организаций. Коммуникативный формат является средством согласования структуры и характера записей в массивах и базах данных, являющихся объектами передачи и приема в процессах информационного взаимодействия систем. Требования коммуникативных форматов накладывают определенные ограничения по составу, структуре и правилам заполнения обязательных для каждого из них составов полей данных на коммуникативные форматы более низкого уровня иерархии (международного - на государственные, государственного - на общесистемные и т.п.) а также внутренние форматы систем, на которые распространяется его действие. Примерами международных библиотечных коммуникативных форматов являются формат " MARC" и его версии UNIMARC, US MARC и др.

Для информационного обмена библиографической информацией в СЭВ служил МЕКОФ (международный коммуникативный формат), который остается также государственным форматом России для организаций государственной автоматизированной системы научно-технической информации (ГРНТИ). Общесистемный формат или формат автоматизированной системы является средством, обеспечивающим обмен данными внутри группы организаций, выделенной по ведомственным, территориальным или другим признакам.

Форматы MARC (Machine - Readable Catalogue or Cataloguing) -

Общая часть наименования ряда библиотечных коммуникативных форматов. Впервые программа MARC 1 была разработана Библиотекой Конгресса США в 1965-1966 гг. с целью получения данных каталогизации в машиночитаемой форме. Аналогичная работа выполнялась в Великобритании Советом по Британской национальной каталогизации для обеспечения использования машиночитаемых данных при подготовке печатного издания Британской национальной библиографии - British National Bibliography (проект BNB MARC ). На основе указанных разработок в 1968 г. начал создаваться коммуникативный англо-американский формат MARC (проект MARC II). Целями его создания стало обеспечение:

- гибкости решения каталогизационных и других библиотечных задач,

- пригодности для национального библиографического описания любых видов документов и использования структуры записи в автоматизированных системах.

В процессе развития использования формата в 1970-х гг. появилось более 20 его различных версий, ориентированных на национальные правила каталогизации (в том числе UKMARC, INTERMARC, USMARC, AUSMARC, CANMARC, DanMARC, LCMARC, NorMARC, SwaMARC и др.). В своих последних редакциях формат USMARC превратился в комплекс специализированных форматов (USMARC Concise Formats) для записи библиографических, авторитетных, классификационных данных, данных о фондах и общественной информации (соответственно - USMARC for Bibliographic Data, USMARC Format for Authority Data, USMARC for Classification Data, USMARC Format for Holding Data, USMARC Format for Community information). Каждый из указанных форматов опубликован, содержит подробное описание полей, инструкции по применению и правила, обеспечивающие ввод и идентификацию данных.

Для преодоления несовместимости указанных форматов в 1977 г. Международной Федерацией Библиотечных Ассоциаций (ИФЛА) было выпущено издание “Универсального формата MARC” [Universal MARC Format - UNIMARC]. Его целью было провозглашено "...содействие международному обмену данными в машиночитаемой форме между национальными библиографическими службами". Предполагалось, что этот формат должен был стать посредником между любыми национальными версиями форматов MARC и, следовательно, обеспечивать конвертирование данных из национального формата в него, а из него - в другой национальный формат.

В 1980 г. вышло в свет второе издание UNIMARC , а в 1983 г. - UNIMARC Handbook , в которых основное внимание уделялось каталогизации монографий и сериальных изданий. При этом были использованы требования Международного стандарта библиографических описаний [International Standard Bibliographic Description - ISBD].

В 1987 г. была издана новая версия формата UNIMARC , отраженная в Руководстве по применению UNIMARC - "UNIMARC Manual ", которая расширила его действие с монографий и сериальных изданий на другие виды документов. Кроме того Руководство предусмотрело возможность использования данного формата "как модели для разработки новых машиночитаемых библиографических форматов". Дальнейшее развитие формата было связано в частности с созданием его разновидности для ведения т.н. "авторитетных записей", обеспечивающих технологию ведения массивов имен персоналий и наименований (организаций, изданий и т.п.) для однозначного и удобного их использования при автоматизированной библиографической обработке документов, Соответствующий формат UNIMARC/AUTHORITIES был опубликован в 1991 г.

В этом же году в рамках программы ИФЛА "Универсальный библиографический учет и международная программа MARC" (Universial Bibliographic Control and International MARC -UBCIM ) был создан Постоянный комитет по UNIMARC'y (PUC ), на который были возложены функции контроля за развитием формата, включая обеспечение совместимости вносимых изменений ранее разработанным его версиям. Необходимость указанных функций была вызвана продолжением развития национальных версий формата MARC . Тем не менее в в дальнейшем при ведущей роли Библиотеки Конгресса США предпринимались усилия по созданию на базе трех близких между собой национальных версий формата MARC (USMARC, UKMARC и CANMARC ) нового международного коммуникативного формата IMARC -International MARC , который должен был конкурировать с форматом UNIMARC . В 1999 г. в результате достигнутого согласования и последующего слияния библиографических форматов США и Канады ( USMARC и CANMARC ) было объявлено об образовании на их основе нового формата {((Формата ХХ1-го века”) – MARC-21 . С этого времени организации, ориентировавшиеся на формат USMARC , должны перейти на формат MARC-21 и отслеживать все его последующие изменения, включая новые дополнения к нему (ранее подобные требования отсутствовали). Формат MARC-21 включает в себя:

В настоящее время формат MARC21 используется в США, Канаде, Австралии, Новой Зеландии, в университетских библиотеках Великобритании и Франции, Венгрии, Дании, Испании, Швеции, Финляндии а также в Национальной библиотеке Италии [233-236, 613-618].

RUSMARC - Российский коммуникативный формат представления библиографических записей - это российская версия международного коммуникативного формата UNIMARC, в трактовке и категориях, действующих в России ГОСТов и правил каталогизации. Формат разработан в 1997 г. по заказу Министерства культуры в рамках программы LIBNET под эгидой Российской Библиотечной ассоциации . В разработке использовались международные стандарты ISO , отечественные стандарты СИБИД, а также рабочие материалы Постоянного комитета по UNIMARC. Формат распространяется на книги и сериальные издания, предназначен для обмена библиографическими записями в машиночитаемой форме. Особенностью формата является широкое применение полей связи с использованием технологии встроенных полей. Для элементов данных национального значения, не нашедших отражения в формате UNIMARC введены дополнительные поля и подполя в соответствующих блоках с цифрой 9, определяющей национальный статус. Формат RUSMARC для библиографических записей дополняет взаимосвязанный с ним Российский коммуникативный формат представления авторитетных/нормативных записей, разработанный в 1997 г. [622].

ВНУТРЕННИЙ ФОРМАТ -

Формат локальной (т.е. каждой отдельно взятой) автоматизированной системы (АС). Основные отличия внутренних форматов от коммуникативных характеризуются составом дополнительных полей данных, предназначенных для решения служебных и пользовательских задач конкретной АС. В соответствии с этапами обработки информации в АС внутренний формат складывается из нескольких форматов. В общем случае в их число входят [201: предмашинный, предсистемный, формат хранения, рабочий, формат поиска, издательский (см. ниже) и коммуникативный форматы. В конкретных реализациях автоматизированных систем некоторые из перечисленных форматов могут совмещаться.

Виды внутреннего формата:

Некоторые виды действующих форматов:

ФОРМАТИРОВАНИЕ, ИНИЦИАЛИЗАЦИЯ, РАЗМЕТКА (диска)

[formatting, format, initialization] -

Процедура записи на магнитный диск меток, определяющих последующее расположение записей данных (блоков, секторов, дорожек), участков не пригодных для записи, а также другой управляющей информации. Форматирование выполняется перед первым использованием диска.

Форматирование текста [text formatting] - Преобразование текста в вид, в котором он должен выводиться на экран монитора или печать: установка границ страницы, формирование абзацев, центрирование заголовков, выравнивание полей, разбиение на страницы, установка колонтитулов и т.п. Форматировать [ format] -

1. Размещать данные в соответствии с предписанным форматом;

  1. Производить разметку или форматирование диска.

Переформатирование [reformating] -

1. Изменение формата данных;

2. Повторное форматирование магнитного диска.

RTF (Ritch Text Format) - Пакет соглашений, разработанных фирмой Microsoft (США) для включения форматированных данных в текстовый документ независимо от используемой аппаратуры или типа системы обработки текстов.

ПОЛЕ ДАННЫХ (ПД), ПОЛЕ [data field, field] -

1. Область на носителе информации (машино- или человекочитаемом), выделенная для записи определенного вида данных (в т.ч. - информационных элементов, данных, элементов данных);

2. Часть записи или заполняемой формы, имеющая функционально самостоятельное значение и обрабатываемая как отдельный элемент данных.

Примечание: Поле данных идентифицируется "внешним" и "внутренним" именами и характеризуется "видом данных", "длиной" и "структурой" записи. Поля данных могут быть "элементарными", "множественными" и "групповыми" а также "повторяющимися" (в одной записи) и "неповторяющимися" (см. ниже).

Примечание: Форматированные поле данных служат средством сортировки и поиска данных по содержащимся в них сведениям. Для решения ряда задач некоторые форматированные ПД могут быть одновременно объявлены также нормированными (по словарю). Так для контроля технологической дисциплины обработки документальных потоков с установленными сроками прохождения разных видов документов по звеньям технологической цепи (например, "заказ книги", "поступление в отд. комплектования", "поступление в отд. обработки", "поступление в отд. абонемента" и т.п.) соответствующие технологические поля могут контролироваться обязательным вводом текущей (а ни какой иной) даты и времени обработки и/или передачи документов;