Программно-технологический комплекс “ТОР” (воплощение давней мечты)
Родионов А.Я., Панюта Ю.И., Пробст М.А., Эпштейн Г.Р.
Производственно-издательский комбинат ВИНИТИ РАН, Москва, Россия
A.Ya. Rodionov, Yu.I. Panyuta, M.A. Probst, and G.R. Epstein
All-Russian Institute of Scientific and Technical Information, PIC Center, Moscow, Russia
А.Я.
Родіонов, Ю.І. Панюта, М.А. Пробст, Г.Р. ЕпштейнВиробничо-видавничий комбінат ВІНІТІ РАН, Москва, Росія
С момента создания ВИНИТИ аналитико-синтетическая переработка многоаспектных первоисточников выполнялась параллельно в нескольких отраслевых редакциях, что приводило к дублированию работ. Основоположники советской информатики еще в 60-х годах прошлого века доказали возможность и целесообразность однократного реферирования многоаспектного первоисточника с последующим использованием реферата в других отраслевых редакциях. Вопрос о внедрении однократного реферирования поднимался в ВИНИТИ много раз, но практического воплощения это не находило. Одной из основных причин было отсутствие технической базы. В середине 90-х годов было проведено комплексное переоснащение Производственно-издательского комбината. Практически все виды техники (от наборной до брошюровочной) были заменены на современные. Тогда же была создана корпоративная компьютерная сеть, объединившая около 200 ПК, в т. ч. три мощных сервера. Была внедрена система автоматизированной диспетчеризации производства РЖ. Все это вместе взятое позволило специалистам Комбината приступить к реализации давней мечты – однократному реферированию. Для использования принципов однократного реферирования в 2000 г. Комбинатом был разработан программно-технологический комплекс “ТОР”. В 2000 г. началось синхронное внедрение новой технологии в редакциях ВИНИТИ и на Комбинате. К началу текущего года основные параметры процесса вышли на расчетные значения. Описывается технологическая схема и принципы, заложенные в программно-технологический комплекс “ТОР”.
Since VINITI establishment the analytical and synthetic processing of multi-subject primary sources was done in parallel by several branch editorial offices. The founders of Soviet information science proved in 1960s the opportunity and necessity of multi-subject primary sources single abstracting with further use of abstracts by several editorial offices. The complex renovation of VINITI PIC Center was made in 1990s. At the same time the corporate computer system, which unified 200 computers including 3 powerful servers was designed. In 2000 the PIC Center designed the software technological complex TOR with the purpose to implement the single abstracting technology. The technological scheme and principles of the software technological complex TOR operation are described.
З моменту створення ВІНІТІ аналітико-синтетична переробка багатоаспектних першоджерел виконувалася паралельно в декількох галузевих редакціях, що приводило до дублювання робіт. Основоположники радянської інформатики ще в 60-х роках минулого століття довели можливість і доцільність одноразового реферування багатоаспектного першоджерела з наступним використанням реферату в інших галузевих редакціях. Питання про впровадження одноразового реферування піднімалося в ВІНІТІ багато разів, але практичного втілення це не знаходило. Однієї з основних причин була відсутність технічної бази. В середині 90-х років було проведено комплексне переоснащення виробничо-видавничого комбінату. Практично всі види техніки (від набірної до брошурувальної) було замінено на сучасні. Тоді ж було створено корпоративну комп'ютерну мережу, що об'єднала біля 200 ПК, у т.ч. три могутніх сервери. Було впроваджено систему автоматизованої диспетчеризації виробництва РЖ. Все це разом взяте дозволило фахівцям комбінату приступити до реалізації давньої мрії – одноразового реферування. Для використання принципів одноразового реферування в 2000 р. комбінатом було розроблено програмно-технологічний комплекс “ТОР”. У 2000 р. розпочалося синхронне впровадження нової технології в редакціях ВІНІТІ і на комбінаті. На початок поточного року основні параметри процесу вийшли на розрахункові значення. Описуються технологічна схема і принципи, закладені в програмно-технологічний комплекс “ТОР”.
С момента создания Реферативного журнала (РЖ) ВИНИТИ аналитико-синтетическая переработка (АСП) многоаспектных
первоисточников выполнялась параллельно в нескольких отраслевых редакциях, что приводило к дублированию работы референтов и редакторов, увеличению объемов ксерокопирования, набора и т. д.; средний коэффициент дублирования, по разным оценкам, составлял 1,3–1,4. Основоположники советской информатики еще в 60-х годах прошлого века [1] доказали возможность и целесообразность однократного реферирования многоаспектного первоисточника с последующим использованием реферата и БО в других отраслевых редакциях. В конце 60-х годов в ВИНИТИ даже была предпринята попытка внедрения такой технологии путем размножения машинописных копий рефератов (доступные ЭВМ не могли тогда обеспечить нужные объемы хранения и оперативность), однако успехом это не увенчалось. Вопрос об однократном реферировании поднимался и позднее: все концепции развития ВИНИТИ “Ассистент”, “Ассистент-2”, “Ассистент-3”, “Пума”, “Гамма” и, последняя, “КАИС” предусматривали переход к такой технологии, но практического воплощения это не находило. Пытались обратить внимание на эту проблему и авторы [2], но тоже безуспешно. Было очевидно, что решение этой задачи требует мощной материально-технической базы.В середине 90-х годов было проведено комплексное переоснащение производства РЖ в Комбинате. Практически все виды техники (от наборной до брошюровочной) были заменены на современные. Тогда же была создана корпоративная компьютерная сеть, объединившая около 200 ПК, в т. ч. три мощных сервера. Был унифицирован процесс подготовки РЖ, разработан и внедрен пакет прикладных программ “Ввод-3” и создана технологическая база иллюстраций. Значительным фактом стал переход к набору полей библиографических описаний непосредственно с макетированной страницы
, освободивший редакции от переноса БО в специальные формуляры, но потребовавший обучения полутора сотен наборщиц и корректоров Комбината библиографической “грамоте”. Была внедрена система автоматизированной диспетчеризации производства РЖ. Все это вместе взятое и позволило специалистам Комбината приступить к реализации давней мечты – однократному реферированию.Предложенная авторами совместно с А. И. Чёрным технология однократного реферирования [4] позволяет: полностью ликвидировать дублирование при реферировании многоаспектных документов, многократно использовать результаты АСП, увеличить число и полноту отражения перерабатываемых первоисточников (ПИ) без увеличения численности референтов, увеличить наполнение РЖ за счет заимствования многоаспектных документов из выпусков других редакций.
Технология построена на основе Единой технологической базы документов
(ЕТБД), в которую загружаются документы, опубликованные во всех 242 выпусках РЖ в течение последних 12 месяцев. В состав ЕТБД входит ряд индексных файлов, обеспечивающих учет заимствования документов. Эти данные используются для статистического анализа работы системы, а также для предотвращения повторных публикаций и Извещений.Учитывая психологию редакторов, документы, предлагаемые к заимствованию, рассылаются им в виде отпечатанных на бумаге Извещений, содержащих все поля документа и графы для записи модифицированных дескрипторов.
Технологическая схема подготовки РЖ с использованием ПТК “ТОР”
Технология изначально была адаптирована к действующему процессу подготовки РЖ и БД , что позволило, не меняя по существу технологическую схему, ввести лишь несколько дополнительных операций
(на схеме выделены серым). Т. о. появились следующие дополнениями к существовавшим ранее этапам обработки:●
при разметке первоисточников для каждого многоаспектного документа определяется профильная редакция, которая будет выполнять АСП документа. Здесь и далее под “профильной” понимается редакция, тематике которой соответствует основной аспект данного документа; под “непрофильной” понимается редакция, тематике которой соответствует один из не основных аспектов документа, определенных при разметке. Штамп разметки профильной редакции выделяют среди штампов остальных редакций. Отметим, однако, что при затруднении в выборе профильной редакции (из общего числа размеченных в документе) допустим известный волюнтаризм.●
при технологическом копировании со статьи, имеющие два и более штампов разметки, изготавливается только одна копия и одна макетированная страница (для профильной редакции).●
при поступлении документа в профильную редакцию АСП производится традиционно, но при этом редактор имеет возможность внести дополнения в тематическую разметку любого документа, если, по его мнению, размечены не все заинтересованные редакции.●
при наборе профильного РЖ используется новое поле “Разметка”, в которое набираются обозначения размеченных редакций.●
при формировании профильной отраслевой БД документ, содержащий коды нескольких редакций в поле “Разметка”, помещается в базу на общих основаниях, а его электронные копии – в буферы Извещений указанных редакций. Общее число таких буферов в системе равно числу редакций. При помещении документа в ЕТБД, его издательский номер, дополненный контрольной суммой (Технологический номер), используется в качестве идентификатора документа.В установленное графиком время, каждый буфер распечатывается в виде комплекта Извещений. Извещения направляют в редакцию по принадлежности буфера. Понятно, что в профильную редакцию Извещения не направляют. Извещение также не направляется в редакцию, если документ уже публиковался данной редакцией или, если ей уже посылалась Извещение об этом документе.
●
при обработке документов в непрофильной редакции полученные Извещения анализируются редакторами, и документы, заслуживающие публикации, обрабатываются: в них вносятся новые рубрикационные шифры (РБШ) и номер, а по усмотрению редактора – новые или дополнительные ключевые слова (ПОД) и УДК. Другие изменения в документ не вносят. Обработанное Извещение включается в комплект оригиналов выпуска как самостоятельный документ.Если этот документ необходимо включить и в другой выпуск, редактируемый той же редакцией, достаточно заполнить бланк Дополнительного извещения, вписав в него Технологический номер и РБШ (УДК, ПОД). Можно также ксерокопировать Извещение (до обработки) и использовать копию вместо Дополнительного извещения.
Технология предусматривает и вторичное использование документов, отобранных редактором при просмотре других РЖ
(БД). Для этого редактору достаточно заполнить бланк “Списка заимствованных документов”, указав в нем полный издательский номер заимствованного документа и новый РБШ. “Список” следует включить в состав оригинала; после набора документ будет найден в ЕТБД и после модификации войдет в состав очередного выпуска РЖ и БД. Кроме того, возможно формирование целого выпуска (раздела выпуска) из ранее опубликованных документов. В этом случае редакция использует бланк “Ведомости заимствованных документов”, уже содержащий соответствующие РБШ, и вписывает в него издательские номера заимствуемых документов; изменение ПОД при этом не предусмотрено.●
при наборе выпуска непрофильного РЖ Извещение (Дополнительное извещение) набирают по полям: Технологический номер (заимствуемого документа), РБШ, УДК и ПОД. Остальные данные подлежат последующему заимствованию из ЕТБД.●
при формировании непрофильных выпусков РЖ и БД из ЕТБД извлекается документ, номер которого указан в Извещении. Извлеченный документ проходит фильтрацию (контроль на первую публикацию в данном выпуске), а затем модифицируется – заменяются РБШ и УДК, ПОД дополняется (при необходимости) новыми ключевыми словами. Модифицированный документ включается в выпуск на общих основаниях.Наряду с первичным в ЕТБД помещается и модифицированный документ, который может быть также использован для публикации в других выпусках РЖ. Вне зависимости от использования документ, помещенный в ЕТБД, удаляется из неё через 12 месяцев.
Для реализации технологии однократного реферирования по Техническому заданию авторов в 2000 г. Информационно-вычислительным центром и Техническим отделом Комбината был разработан
Программно-технологический комплекс “ТОР”, включающий в себя пакет прикладных программ [8] и комплект технологических инструкций для всех действующих лиц процесса подготовки РЖ и БД [7]. С середины 2000 г. началось синхронное внедрение новой технологии в редакциях ВИНИТИ и на Комбинате. К началу текущего года основные параметры процесса вышли на расчетные значения, хотя отдельные конфликтные ситуации еще возникают. Тем не менее, можно констатировать:Всероссийский институт научной и технической информации
Литература