Опыт создания полнотекстовых ресурсов
в Муниципальной информационной библиотечной системе города Томска
The Experience of Full-text Resource Creation
at Tomsk Municipal Information Library System
Досвід створення повнотекстових ресурсів
у Муніципальній інформаційній бібліотечній системі міста Томська
Карауш А. С., Левицкая Л. В.
Муниципальная информационная библиотечная система г. Томска, Томск, Россия
Alexander S. Karaush, Lidia V. Levitskaya
Tomsk Municipal Information Library System, Tomsk, Russia
Карауш О. С., Левицька Л. В.
Муніципальна інформаційна бібліотечна система м. Томська, Томськ, Росія
Представлены основные этапы и мероприятия по организации для муниципальных библиотек Томска оптимального технологического процесса создания полнотекстовых ресурсов. Рассмотрены вопросы представления полнотекстовых ресурсов в электронном каталоге, а также пути дальнейшего их использования библиотеками для подготовки собственных информационных ресурсов.
The main stages and actions taken to provide for optimum technological process of acquiring full-text resources at Tomsk municipal libraries are described. Some aspects of presenting full-text resources in electronic catalogs, as well as their further use by the libraries, are discussed.
Подано основні етапи і заходи щодо організації оптимального технологічного процесу створення повнотекстових ресурсів муніципальних бібліотек Томська. Розглянуто питання представлення повнотекстових ресурсів у електронному каталозі, а також шляхи подальшого їх використання бібліотеками для підготовки власних інформаційних ресурсів.
Развитие аппаратной и программной составляющих вычислительной техники за последние несколько лет позволило библиотекам перейти на новый уровень информационного обслуживания разных категорий пользователей. При этом наблюдается ужесточение требований к информационным и технологическим возможностям библиотек со стороны пользователей. Многие библиотеки создают или планируют создавать полнотекстовые информационные ресурсы. Однако, большая себестоимость создания (оцифровки) бумажных материалов при нестабильном спросе останавливает процесс развития и пополнения полнотекстовых баз данных в библиотеках.
Муниципальная информационная библиотечная система города согласно планам участия в проекте “Открытая электронная библиотека г. Томска” в 2002-2003 гг. создала более 5000 страниц полнотекстовых ресурсов с использованием “обычных” аппаратных и программных средств при минимальных затратах рабочего времени. Всего в рамках третьего этапа проекта “Библиотечные консорциумы для модернизации информационного обслуживания высшего образования в России” в Томском консорциуме библиотек будет создано более 50 000 страниц полнотекстовых документов.
Основными этапами подготовки для создания полнотекстовых ресурсов являются:
1. Отбор литературы (информационных источников) из фондов библиотеки, отвечающих требованиям теме цифровой коллекции и всем юридическим моментам использования для создания цифровой копии (законы об авторских и смежных правах).
2. Подготовка технологического процесса сканирования — получение готового файла, содержащего распознанный или графический образ документа.
3. Подготовка технологического процесса описания полученных и приобретенных полнотекстовых ресурсов в собственном электронном каталоге.
4. Подготовка составляющих для представления и доступа пользователей к электронному каталогу с полнотекстовыми ресурсами.
5. Изучение использования и дополнительного спроса на полнотекстовые ресурсы библиотеки.
На первом этапе необходимо определиться с типами источников, типами описаний в соответствии с правилами каталогизации, коммуникационными форматами, типами файлов для оптимального представления информации. Данный этап занимает от 30% до 50% всего времени создания полнотекстовых ресурсов .
На втором этапе производится сканирование, оцифровка и сохранение полученных образов в виде файла. В МИБС приняты следующие технологические параметры:
2. 1. Использование разрешения сканирования 300 dpi.
2. 2. Использование единого цикла распознавания и сохранения программы ABBYY FineReader 6 в пакетном режиме в формате Adobe Acrobat.
2. 3. Отсутствие технологической операции редактирования и коррекции при использовании режима замены неуверенно распознанных букв их графическими образами.
2. 4. Сохранение образа сканированного документа в графическом формате tiff на компакт-дисках для дальнейшего использования других форматов хранения полнотекстовых документов.
Второй этап занимает не более 10-15% от всего времени создания полнотекстовых ресурсов, но требует максимального количества аппаратных средств относительно других этапов.
Третий этап целиком зависит от технологических возможностей программного обеспечения автоматизации библиотечных процессов. Однако следует придерживаться правил создания библиографической информации для последующего преобразования в коммуникационные форматы. И не “изобретать велосипед” в плане придумывания точек доступа к ресурсам и форматов описаний [1-3]. МИБС г. Томска работает на Системе “ИРБИС”, которая удовлетворят требованиям к описанию электронных ресурсов. Библиографическое описание на электронный ресурс, как правило, обладает многоуровневыми ссылками. Третий этап занимает от 10% до 20% общего времени создания и представления ресурса.
На четвертом этапе предстоит решить множество проблем, связанных с системой доступа к полученным ресурсам и определить стоимость и открытость полнотекстовых документов. Система доступа пользователей к полнотекстовым должна содержать несколько уровней, например, библиотека: вуз: город: все остальные. Расширения (типы) отдельных файлов полнотекстовых ресурсов должны использовать только латинские буквы без пробелов, а в наименованиях файлов желательно ограничиться использованием только цифр, как знаков, нечувствительных к регистру. Четвертый этап занимает от 10% до 20% общего времени создания полнотекстовых документов.
Пятый этап не связан напрямую с затратами времени на создание ресурсов, но от качественной работы этого этапа и обеспечения технологической цепочки обратной связи зависят оптимальные показатели объема полнотекстовых документов в фондах библиотеки. При наличии технических возможностей необходимо проводить мониторинг выполненных запросов и отказов, опросы мнения читателей по использованию ресурсов, а также анализировать планы организаций и различных структур населенного пункта на предмет опережающего накопления полнотекстовых ресурсов с целью удовлетворения запросов пользователей.
Нормально работающая технологическая схема данного процесса позволяет создавать 3000 страниц полнотекстовых документов путем сканирования силами одного работника отдела создания баз данных (каталогизации) при использовании вычислительной техники “средней” мощности.
Технологический процесс создания полнотекстовых документов не должен содержать этапы редактирования распознанного документа. Современное программное обеспечение позволяет “прятать” неуверенно распознанные символы за графические изображение слова. Таким образом, пользователь видит текст книги “правильно” и без ошибок распознавания. Однако, при использовании созданных таким образом полнотекстовых ресурсов в качестве исходного материала для создания дайджестов, обзоров и пр. требуются дополнительные затраты времени на редактирование. Кроме этого, пользователь, получив такой документ, должен будет провести дополнительную редакцию.
Используемое в МИБС программно-аппаратное обеспечение этапов создания полнотекстовых документов и некоторые показатели работы:
1. Количество занятых сотрудников — 1 человек (с отрывом от основного процесса — отдел создания баз данных);
2. Аппаратное обеспечение процесса:
Компьютер — Celeron-533 МГц, ОЗУ 128 Мб, 17” монитор, CD-RW-привод;
Сканер Acer Prisa-640S (SCSI-2) — время сканирования страницы А4 (300 dpi) не более 10 секунд;
ПО распознавания — ABBYY FineReader 6.
3. Средняя производительность технологического процесса, пункты 2-4, всего — 25 стр. в час (формат Adobe Acrobat с описанием в Электронном каталоге).
Библиотека со “средними техническими возможностями”, подготовив необходимые документы на основные технологические этапы сканирования и, применив современное программное обеспечение, получает технологический процесс создания полнотекстовых ресурсов с минимальными материальными и производственными затратами.
Литература
Российский коммуникативный формат. Электронные ресурсы. Материалы к обсуждению [Электронный ресурс]/ Национальная Служба развития системы форматов RUSMARC, СПб: 2002, — . — Режим доступа: http: //www. rba. ru: 8101/rusmarc/discuss/er/er. htm, свободный. — Загл. с экрана.
IFLA Universal Bibli ographic Control and International MARC Core Programme (UBCIM). UNIMARC Guidelines no. 6. Electronic Resources [Электронный ресурс]/ International Federation of Library Associations and Institutions (www. ifla. org), 2000, -. — Режим доступа: http: //www. ifla. org/VI/3/p1996-1/guid6. htm, свободный. — Загл. с экрана. (перевод на русский язык: ftp: //library. tomsk. ru/pub/IRBIS/mils-docs/er-unimarc-rus. zip)
Guidelines for Distinguishing Cartographic Electronic Resources from other Electronic Resources. [ Электронный ресурс]/ Library of Congress: 2002, — . — Режим доступа: http: //www. loc. gov/marc/cfmap. html, свободный. — Загл. с экрана.