1.6.1. ОБРАБОТКА ДАННЫХ И СВЯЗАННЫЕ С НЕЮ ТЕРМИНЫ

Ключевыми или исходными понятиями и отражающими их терминами в данном разделе могут служить - "обработка" и "переработка" (документов, данных, информации и т.п.) а также созданные на их основе производные понятия, такие, например, как аналитико-синтетическая обработка и переработка (соответственно - АСП и АСО), библиографическая обработка и др. При всей кажущейся очевидной их ясности нет большей неразберихи или путаницы в терминологических построениях, связанных с использованием соответствующих терминов не только в практическом их применении, но и в нормативных документах. В основе отмеченного явления далеко не всегда лежит пренебрежение истинными значениями слов родного языка или их незнание.

Существенную роль играет откровенное или мало осознанное стремление (чаще!) повысить или снизить интеллектуальный, качественный, количественный или другой показатель, характеризующий содержание соответствующих видов деятельности, работ, операций; установить то, что мы называем "ведомственными барьерами" и т.п. Наиболее представительными примерами сказанного могут служить отечественные ГОСТы, в частности, -7.26-80. (Библиотечное дело, Основные термины и определения. Введ. 01.01.82), 7,27-80. (Научно информационная деятельность. Основные термины и определения. Введ.

01.01.82.), ГОСТ 7.9-77. (Реферат и аннотация. Введ. 01.07.78. - Изм. 1. Введ. 01.07.81: Изм.

2. Введ. 01.07.87.), ГОСТ 7.59-90. (Индексирование документов. Общие требования к систематизации и предметизации. Введ. 27.02.90.) и др. [7, 22, 24, 25].

Учитывая сказанное считаем для начала нелишним обратиться к толковым словарям Д.Н.Ушакова и С.И.Ожегова [31, 32].

ПЕРЕРАБОТКА [conversion] -

  1. Производственный процесс, которому подвергается сырье (в нашем случае – исходные документы, данные и т.п. - прим. авт.);
  2. Действие по глаголу "переработать": превратить во что-нибудь в процессе работы, обработки (переработка сырья в изделия);
  3. Переделать, сделать по новому, иначе.

ОБРАБОТКА [processing] –

Действие по глаголу "обработать", т.е.:

  1. Подвергнуть выделке, отделке, какой-нибудь производственной операции;
  2. Отделать, привести в законченный вид, сделать более совершенным;
  3. Подвергнуть выделке, отделке, сделать готовым для чего-нибудь.

Исходя из приведенных значений указанных терминов следует, что в применении к информационным процессам понятие переработка предполагает внесение существенных преобразований содержания и/или формы исходных информационных продуктов, выполняемых на основе анализа и синтеза (см. ниже), содержащихся в них данных.

Примерами "переработки" могут служить; подготовка нового вида документа (в том числе - реферата, обзора, поискового образа документа и т.п.), его перевод на другой язык, преобразование данных (например, из текстовой формы в табличную в т.ч. их формализация - см. ниже) и др. Процессы обработки: "выделка", "отделка", "совершенствование" и т.д.) составляют производственные операции, которые не изменяя содержания и формы информационного продукта, делают его пригодным или готовым "для чего ни будь", например, типографского издания, автоматизированной или машинной обработки (см. ниже), а может быть - и переработки. Существенным отличием обработки документов и данных от их переработки может служить отсутствие в ее процессах использования методов индукции, дедукции и синтеза.

Примерами видов обработки документов [document processing] и данных [data processing] могут служить их форматирование, переформатирование (см. выше), (техническое) редактирование, корректура, измерение, копирование (полное или частичное), запись, перезапись (переписывание), чтение, сортировка, кодирование и др. процессы или отдельные операции выполняемые как человеком, так и автоматизированными средствами (подробнее см. [33]). Таким образом, вопреки бытующей в профессиональных и около профессиональных кругах практике, нашедшей отражение даже в нормативных документах, в частности ГОСТах СИБИД, "обработка информации" может рассматриваться как составная часть ее "переработки" а не как некий синоним этого термина.

Анализ [analysis] -

1. Метод научного исследования, состоящий в расчленении целого на составные элементы;

2. Разбор, рассмотрение чего-либо [34].

Синтез [synthesis] -

1. Метод исследования какого-либо явления в его единстве и взаимной связи частей:

2. Обобщение, сведение в единое целое данных, добытых анализом.

Индукция [induction] -

1. Логический метод исследования, основанный на переходе от частных, едининых случаев (фактов) к общему выводу ("от частного к более общему");

2. Форма мышления, в соответствии с которой мысль наводится на какое-либо общее правило или общее положение, присущее единичным объектам,

Дедукция [deduction] -

1. Логический метод исследования, заключающийся в переходе от знания более общих положений к частным суждениям или другим общим выводам ("от общего к частному");

2. Форма мышления, в соответствии с которой новое знание выводится чисто логическим путем из предшествующих знаний или мыслей. Дедукция неразрывно связана с индукцией.

Формализация [formalization] -

1. Процесс представления информации об объектах (в том числе - процессах), явлениях реального мира и мыслительной деятельности человека в формализованном виде (форме). В автоматизированных информационных системах вид формализации задается технологическими инструкциями и другими средствами, например, т.н. "рабочими листами ".

2. Метод исследования, основанный на использовании формализованных математических, логических и т.п. систем, в которых вместо естественного языка используется язык специальных символов.

Формализация данных [data formalization] -

Выбор, разработка и/или реализация заполнения форм входных документов для ввода данных(см. ниже) в систему. Наиболее распространенными формами входных документов в информационных и библиотечных системах являются анкетная и табличная.

Цикл обработки [processing cycle] -

1. Постоянно повторяющаяся последовательность операций по обработке документов и/или данных;

2. Последовательность шагов, многократно выполняемых ЭВМ, в процессе работы программы. Центральный процессор ЭВМ непрерывно действует в циклическом режиме, включающем: выбор текущей команды программы из памяти, ее исполнение и внесение результатов в память перед обращением к последующей команде нового цикла.

Параллельная обработка [parallel processing] -

В автоматизированных системах - Одновременное выполнение нескольких программ или разных частей одной программы при работе сданными.

Сортировка [sorting] - Упорядочение данных ( записей, файлов и т.п.) по какому-либо признаку или группе признаков. Последние выбираются из состава полей данных, связанных с объектом сортировки. Например, сортировка сведений об организациях или фирмах может производиться по признакам: область деятельности (отрасль), страна, город, наименование фирмы и т.д., если существуют заполненные записями соответствующие поля данных, связанные между собой определенными отношениями . Поля данных, содержащие признаки сортировки, называются ключевыми полями .

Интерактивный режим, диалоговый режим [interacting mode] -

Способ взаимодействия пользователя или оператора с ЭВМ (в т.ч. в ходе обработки или переработки данных), при котором происходит непосредственный и двухсторонний обмен информацией, командами или инструкциями между человеком и ЭВМ. Основной режим диалога построен в форме вопросов и ответов.

АНАЛИТИКО-СИНТЕТИЧЕСКАЯ ПЕРЕРАБОТКА (АСП ) -

Совокупность процессов по преобразованию исходных документов и данных путем их анализа и синтеза. К видам АСП можно отнести: подготовку обзоров, аннотаций (аннотирование ), рефератов ( реферирование) а также каталогизацию.

В автоматизированных системах АСП выполняется, как правило, человеком с учетом правил формализации данных, установленных в соответствующих системах, с привлечением для выполнения рутинных процессов и отдельных операций технических средств. К процессам указанного класса могут быть отнесены авто индексирование, построение частотных словарей [34], и некоторые др., выполняемые т.н. "лингвистическими процессорами". По мере дальнейшего развития программно-технических комплексов степень их участия в процессах АСП будет возрастать. В качестве примеров таких процессов могут быть названы автоматизированный (“машинный”) перевод, автоматизированный анализ текста, автоматизированное аннотирование и реферирование. О технологии и технических средствах автоматизированного или машинного перевода см., в частности, [658].

АНАЛИТИКО-СИНТЕТИЧЕСКАЯ ОБРАБОТКА (АСО ) -

Отдельные процессы, включающие операции или группы операций, связанные с анализом документов или данных но не ведущие к существенному изменению их содержания, структуры и вида,

В автоматизированных системах АСО может выполняться как в виде ручных, "человеко-машинных", так и чисто "машинных" (т.е. с использованием только автоматизированных средств) операций. Примерами полностью или частично автоматизированной реализации АСО могут служить операции сортировки, записи/перезаписи, кодирования, декодирования, шифрования/дешифрования, конвертирования и др.

БИБЛИОТЕЧНЫЙ КАТАЛОГ [library catalogue] -

Перечень произведений печати и других документов, имеющихся в фонде библиотеки или группы библиотек, составленный по определенному принципу и раскрывающий состав или содержание библиотечных фондов.

ЭЛЕКТРОННЫЙ КАТАЛОГ, ЭК , каталог

[catalog, electronic catalog directory] -

1. Библиотечный каталог (см. выше), реализованный в машиночитаемой форме" - такое определение м.б. дано на основании ст. 8 ГОСТ 7.26-80 [22]. В существующей информационной и библиотечной практике под "электронным каталогом" понимают, как библиографические базы данных, отвечающие признакам каталога, так и библиотечные автоматизированные системы (например, АБИС) или их подсистемы;

2. Справочник файлов со ссылками на их расположение. Используется операционной системой ЭВМ для определения местоположения файла. Система каталогов может включать главный (корневой) каталог и подкаталоги (соответственно - "директорию" и "поддиректории").

ОБРАБОТКА ДАННЫХ [data processing] -

Обобщенное наименование разнородных процессов, связанных с данными. Термин нашел преимущественное применение в контексте с вычислительной техникой и разного рода автоматизированными системами (информационными, библиотечными, управленческими и др.) и, как правило, относится к рутинным операциям обработки и хранения больших массивов документов и данных.

Ряд зарубежных и отечественных авторов толковых словарей по вычислительной технике справедливо считают данный термин неудачным, поскольку "все вычислительные операции можно считать обработкой данных" (См., например, [35]. - С. 125).

Термины, связанные с видами обработки данных:

КОДИРОВАНИЕ [coding, encode] -

1. В информационных системах - процесс преобразования текстовых и других материалов из одной системы символов в другую;

2. Процесс отображения дискретных сообщений сигналами в виде определенных сочетаний символов;

3. Процесс преобразования детальной спецификации программы в программу .

ДЕКОДИРОВАНИЕ [decoding, code translation, interpretation] -

В информационных системах - процесс преобразования кодированных данных в исходную или другую пригодную для чтения форму,

Uu-кодирование/uu-декодирование [uuencode/uudecode] - Самый распространенный набор алгоритмов кодирования и декодирования, благодаря которому становится возможным обмен файлами между различными системами электронной почты , ЭВМ отправителя преобразует текст файла в ASCII код, который может быть декодирован получателем в процессе восстановления исходных данных [2131.

Кодер [coder] - Устройство, преобразующее исходный текст в какой-либо код, кодирующее устройство.

Декодер [decoder] -

1. Устройство, преобразующее закодированный текст в исходную форму (вид), декодирующее устройство;

2. Электронное устройство, предназначенное для выбора и реализации одного из способов передачи данных. Например, для направления данных в индивидуальные ячейки памяти внутри быстродействующего запоминающего устройства ЭВМ.

Шифрование [ciphering, coding, crypting] - Процесс перевода текстов, цифровых и др. данных в зашифрованную форму с целью ограничения доступа к их содержанию нежелательных лиц, организаций и т.п.

Дешифрирование [deciphering, decoding] - Процесс преобразования закодированных текстов, цифровых и др. данных в их первоначальную или другую удобную для чтения форму.

Конвертирование (данных, баз данных, программ и др.) [ translation (data, database, program)] - Преобразование исходного информационного продукта в другой, пригодный для новых условий или целей использования .

Систематизация [ordering, systematization] - Процесс упорядоченного распределения объектов, осуществляемый по сходству или различию присущих им признаков.

Предметизация [sabject cataloguing] -

1. Вид систематизации, связанный с распределением объектов по предметным рубрикам - некоторым классификационным признакам;

2. Определение предметной рубрики для произведения печати или другого документа в

соответствии с его содержанием.

РАБОЧИЙ ЛИСТ, РЛ -

Формализованная анкета, предназначенная для обработки и записи структурированных данных.

В общем случае рабочий лист содержит состав полей данных, соответствующих виду обрабатываемых документов или данных, и некоторый набор сведений о их содержании и правилах заполнения (например, внутреннее и внешнее имя, длину, структуру записи и т.п.). Рабочий лист может быть реализован на твердом носителе - в виде бумажных бланков, пригодных для заполнения сведениями при так называемой предмашинной обработке документови данных, а также в виде специально размеченной структуры экрана монитора для реализации клавиатурного ввода.