Система доступа к электронным каталогам вузовских
Мамбеталиев К.К.
Казахский государственный национальный университет им. Аль-Фараби, Алматы, Казахстан
Kamchybek K. Mambetaliev
Al-Farabi Kazakh State National University, Almaty, Kazakhstan
К.К. Мамбеталієв
Казахський державний національний університет ім. Аль-Фарабі, Алмати, Казахстан
Предоставлено сообщение о разработанной в Казахстане Web-системе удаленного доступа к библиографическому фонду литературы. Предлагается обзор используемых технологий при создании системы. Раскрывается состав функций системы. Дается информация об ее аппаратном и программном обеспечении.
The web-system providing remote access to bibliographic collection was designed in Kazakhstan. The review of the technologies used for system development is offered. The contents of system functions is analyzed. The information on the system hard- and software is provided.
Мова йде про розроблену в Казахстані Web-систему віддаленого доступу до бібліографічного фонду літератури. Пропонується огляд використовуваних технологій при створенні системи, склад її функцій та інформація про її апаратне та програмне забезпечення.
Состояние автоматизации
библиотечных работ в Казахстане характеризуется в основном разработкой и внедрением автоматизированных систем каталогизации новых поступлений. Сформированные базы электронных каталогов чаще всего используются библиотекарями для статистической обработки. Как обычно, из-за отсутствия или нехватки автоматизированных рабочих мест читателей в библиотеках электронные каталоги остаются недоступными для широкого круга читателей.Активное развитие современных Internet-технологий открывает реальные возможности для эффективных путей реализации библиотечных систем информационного обслуживания пользователей в режиме удаленного доступа. Создание Web-систем библиотечных ресурсов позволяет повысить культурный и образовательный уровень пользователей за счет максимально быстрого и своевременного получения необходимой информации, улучшает уровень обслуживания читателей, способствует формированию единого информационного и культурного пространства страны, интеграции казахстанских информационных ресурсов в международное информационное пространство.
Разработанная нами Web-система удаленного доступа к библиографическому фонду литературы имеет две модификации или вариации: Web-система удаленного доступа к локальному электронному каталогу отдельной библиотеки (Web-система ЛЭК) и Web-система удаленного доступа к центральному электронному каталогу сети вузов Республики Казахстан [1].
Эксплуатация Web-системы локального электронного каталога в отдельных вузах в некоторых случаях может оказаться невозможной или неэффективной. Причиной может быть: отсутствие локальной сети и современной компьютерной техники; отсутствие доступа к сети Internet или качество связи с Internet не отвечает требованиям Web-сервера. Альтернативным и более экономичным вариантом является размещение каталога вуза на центральном Web-сервере, так как для конечного пользователя не важно, где расположен сервер, а важно, как он работает. Для этого все, что требуется от библиотеки — это регулярное обновление базы электронного каталога, удаленного или непосредственно расположенного на сервере с помощью специальной программы конвертирования. Поиск литературы в центральном каталоге удобен и для пользователей — можно получить результаты поиска сразу по нескольким библиотекам.
Обзор используемых технологий. Сетевая архитектура для функционирования Web-системы электронного каталога разработана на базе глобальной сети Internet и корпоративных сетей Интранет. Серверная часть системы разработана с использованием технологий Component Object Model (COM) и Active Server Pages (ASP).
В качестве средства разработки серверной части Web-системы электронного каталога мы выбрали технологию ASP, исходя из следующих соображений. Active Server Pages — это инструмент для эффективной разработки серверных Web-приложений, представляющий собой интерпретируемую прикладную среду. Он позволяет объединять HTML-теги, сценарии, написанные на разных языках, и серверные компоненты ActiveX в приложения на базе Web. ASP поддерживает два языка написания сценариев — VBScript и Jscript. Так как базовой технологией ASP является ISAPI, приложение выполняется быстрее чем CGI сценарий. Наличие привычного синтаксиса языка высокого уровня существенно упрощает создание HTML-страниц [2].
ASP поддерживают многочисленные серверные компоненты ActiveX, которые упрощают создание и значительно повышают функциональность активных Web-страниц. К ним относятся различные элементы управления, компоненты, создающие содержание приложения, компоненты потокового ввода/вывода в файл, объекты доступа к данным и многое другие.
Последнее время технология ActiveX все больше охватывает обширные области Web-программирования. Использование технологии ActiveX позволяет легко строить приложения из компонентов, допуская их совместное и повторное использование, а также перемещение по сети. В основе архитектуры ActiveX лежат стандарты COM и DCOM (Distributed COM). COM позволяет приложениям взаимодействовать друг с другом локально, а DCOM обеспечивает такое взаимодействие по сети [3].
Распределенная структура Web-системы. Использование только стандартных средств ASP и ADO для выполнения сложных запросов к данным электронного каталога не обеспечивает быстрый поиск, так как программы на ASP хранятся в исходном коде и перед каждым выполнением проходят интерпретацию через специальную программу.
Использование четырехуровневой архитектуры распределения вычислений помогает решить эту проблему, где вычисления системы распределяются по схеме Web-броузер <=> Сценарий ASP <=> ActiveX-компонент <=> Сервер баз данных. Поскольку в предлагаемой архитектуре большинство логических вычислений инкапсулированы в отдельном компоненте ActiveX, в сценариях ASP пишутся минимальные коды. Задача ASP сценариев — это поддержка связи между броузером и серверным компонентом ActiveX. Эта задача в ASP реализуется очень легко по сравнению с программированием в ISAPI или CGI.
Специально разработанный серверный компонент ActiveX DLL представляет собой откомпилированную COM-программу, которая упрощает доступ к серверу базы данных электронного каталога для остальных программ. Такая программа обрабатывает входные параметры, полученные от вызываемой программы (ASP-сценария) и на этой основе формирует свой запрос к базе данных с параметрами, необходимыми для доступа к данным на сервере. Компонент также обрабатывает результаты запроса, формирует ответ нужным образом и передает его обратно вызываемой программе (ASP-сценарию). Производительность программы компонента достигается из-за того, что она является уже откомпилированным кодом; загружается в память только один раз; выполняется в адресном пространстве вызываемой программы; использует средства быстрого доступа к данным.
Связь с броузерами обеспечивает сервер HTTP. Запросы броузера к обычным гипертекстовым файлам (.html) обслуживаются только на уровне сервера HTTP. Запросы к файлам с расширением .ASP распознаются сервером HTTP как запуск скрипт - программ Active Server Pages. Скрипты выполняются с использованием средств ISAPI. Для доступа к данным сценарии ASP создают объекты специального компонента ActiveX или устанавливают связь с уже существующим объектом. Далее ASP передает параметры поиска к компоненту с помощью его же методов. Компонент ActiveX анализирует входные параметры и генерирует несколько SQL-запросов к БД. Результаты запросов компонуются и передаются в виде HTML - строки обратно к сценарию ASP. Возвращенные строки объединяются с остальными частями HTML - потока и отправляются к броузеру через средства Web-сервера.
Состав функций системы. Система состоит из двух частей: программа администрирования баз данных и Web-система поиска литературы по запросу с Web-страниц. Программа администрирования запускается администратором и выполняется только на сервере. Сеансы Web-системы удаленно запускаются пользователями и выполняются на сервере при каждом посещении сайта электронного каталога. Сеанс закрывается при закрытии броузера на машине пользователя.
Функции администрирования Web-системы и баз данных:
Функции Web-системы поиска литературы:
Поскольку можно использовать стандартные броузеры, реализованные в настоящее время для практически любой платформы, информационная система некритична к выбору типа компьютеров, используемых в качестве клиентских мест. Благодаря использованию Web-технологий нет необходимости писать специальную программу для клиентской части, и тем более, устанавливать её на каждой клиентской машине. Для этой цели используется имеющийся практически на каждом компьютере Web-броузер, на котором большинство пользователей умеют работать. Кроме того, отсутствуют требования к техническим характеристикам клиентских машин, достаточно наличия Web-броузера, поддерживающего стандарт HTML-языка.
Гипертекстовые файлы Web-страниц, кроме текстовой и графической информации, содержат коды программ - скриптов на языке JavaScript. Эти программы выполняются на машине клиента и предназначены для управления некоторыми элементами Web-страницы. Многие из них активизируются при взаимодействии пользователя с элементами формы. Благодаря использованию клиентских скриптов достигается общая производительность Web-системы, так как эти программы выполняются моментально на компьютере пользователя без передачи через сеть на сервер.
На форме приведены элементы для управления способом показа результатов поиска: вид библиографического описания (полный/краткий/простой), количество показываемых документов в одной странице, сортировка документов по значению некоторых полей описания (автор, заглавие, место издания, год издания). Если требуется, в первую очередь, просмотр новых изданий, то надо установить сортировку по убыванию года издания. Тогда в результатах поиска первыми появятся свежие книги.
Для поддержки информации на казахском языке в Internet разработана уникальная технология, основанная на международной кодировке символов Unicode. Unicode рассчитана именно для Internet и является единственным стандартом, поддерживающим казахские символы.
Результаты поиска отображаются на отдельной странице броузера. В начале страницы отображается информационно - навигационный блок. В этом блоке находятся: элементы для осуществления вторичного поиска; нормализованная строка ключевых слов; статистика поиска каждого слова; количество документов, удовлетворяющих всем условиям поиска; навигатор для просмотра части списка по порядковым номерам документов.
Далее отображаются библиографические карточки найденных документов, согласно ГОСТ [4] и указанному виду просмотра описаний. Если в качестве просмотра не выбран полный вид, то на углу каждой карточки появляется маленький рисунок, при нажатии на который полное описание документа формируется в отдельном окне. В качестве шифра показывается один из полей, в зависимости от типа расстановки: форматная, УДК, ББКн, ББКм. Реализованы средства показа списка найденных документов на разных форматах библиографического описания.
На каждой карточке есть элемент, предназначенный для отметки нужных документов и записи их в отдельный “листок”. Допустим, что в результате поиска найдены 20 документов. Но только восемь из них нужны пользователю. В этом случае пользователь отмечает нужные документы и нажимает кнопку “Отправить в листок”, и эти восемь документов отображаются на отдельной странице. Можно добавить в список документы из других поисков, можно очистить и заново сформировать, можно составить список литературы или листы заказа, а также распечатать.
Предусмотрена возможность “искать в найденном”, позволяющая искать литературу по новым ключевым словам в результатах предыдущего поиска. Для этого при повторном поиске надо установить элемент “Искать в найденном”. Есть возможность объединения результатов двух поисков. Повторяющиеся документы автоматически исключаются из результата.
Реализована возможность отображения списка документов по результатам поиска отдельных слов. Например, при поиске “перспектива Internet” в статистике поиска слов показано: перспектива-109, Internet -47, количество отображенных по запросу документов — 0. Это значит, что ни в одном документе не встречаются оба слова. Но если пользователь желает посмотреть список документов по отдельным словам, то достаточно нажать в информационном блоке на эти слова.
Предусмотрена возможность отображения результатов поиска по частям с переходом между ними. Если, например, результат поиска состоит из 2000 документов, то просмотр всех в одной странице практически невозможен. Поэтому список разбивается на куски и отображается по 30 документам. Предусмотрена строка навигации для перехода (назад, вперёд) на другие куски списка.
Предусмотрена программа для реализации составных запросов из нескольких ключевых слов. Ключевые слова вводятся на специальном языке запросов, совместимых с языками многих поисковых серверов Internet-ресурсов:
Запрос: Ищет документы, которые содержат:
Демократический — Слово демократический в любом месте описания, без учета регистра
Дипломат* — Любые слова, которые начинаются с дипломат, например дипломат, дипломатия, дипломатический.
Нефть и Казахстан — И слово нефть, и слово Казахстан. Вместо “и” можно использовать “+” или просто
пробел: “нефть + Казахстан”, “нефть Казахстан”
Алма-Ата или — Или слово Алма-Ата, или слово Алматы (или оба вместе). Вместо “или” можете
Алматы использовать запятую: “Алма-Ата, Алматы”, “Internet, Интернет”.
Для построения сложных выражений из составных запросов используются скобки. Примеры построения сложных составных запросов
:Аппаратное и программное обеспечение.
Серверная часть Web-системы устанавливается и эксплуатируется на Intel-совместимых персональных компьютерах с операционной системой Windows 95/98 или Windows NT. Пользовательская эксплуатация системы со стороны клиента возможна на компьютерах с любой платформой (Intel, Macintosh, Alpha), с любой операционной системой (MS Windows, IBM OS/2, PowerPC) и с любого броузера Internet, поддерживающего хотя бы стандарт HTTP 1.0.При разработке решений по техническому обеспечению Web-системы электронного каталога учитывались такие характеристики, как низкие первоначальные затраты на программно-технический комплекс; низкие затраты на сопровождение и администрирование комплекса; высокая производительность сервера при максимальном количестве одновременных посещений. Поэтому при разработке системы были учтены два варианта технических решений:
1. Экономичный вариант — рекомендуется для электронных каталогов, объемом не более 500 тыс. документов. Нацелен на использование сравнительно дешевых (или бесплатно распространяемых) программных средств и компьютеров. Учитывая то, что в данный момент объем электронного каталога вузовских библиотек, накопленный в течении 5 — 10 лет, варьируется от 3 тыс. до 80 тыс. документов, считаем этот вариант более выгодным. Характеристики компьютера для сервера не ниже PentiumII 300 МГц, оперативная память — 64 Мбайт, винчестер — 3 Гбайт. Требования к программному обеспечению: операционная система Windows 95/98, туда же входят: средства Jet для доступа к БД Access, Web-служба Personal Web Server, Active Server Pages для создания динамических Web–страниц и обслуживания сетевых запросов.
2. Корпоративный вариант — рекомендуется для электронных каталогов, объемом более 500 тыс. документов. Такой вариант предполагает наличие мощной компьютерной техники, дорогостоящих корпоративных программных средств, а также наличия высококвалифицированных специалистов для их сопровождения. Характеристики компьютера для сервера не ниже PentiumIII 400 МГц, оперативная память — 128 Мбайт, винчестер — 6 Гбайт. Требования к программному обеспечению: операционная система Windows NT Server 4, система управления базами данных MS SQL Server7, Web — служба Internet Information Server, Active Server Pages.
Неправильно делать вывод, что эксплуатация Web-системы по первому варианту ухудшает её производительность. Наоборот, при небольших объемах баз данных первый вариант работает в 3-4 раза быстрее, чем второй вариант. Это объясняется тем, что в первом варианте для доступа к данным используется быстродействующее ядро Jet базы Access, а во втором варианте используются средства ODBC SQL Server, рассчитанные для крупных баз данных и не так быстро работающие с небольшими данными.
На текущий момент на демонстрационном Web-сервере центрального электронного каталога размещены базы данных трех учебных заведений Казахстана: КазГУ, КазАТК и КазГАСА. Общий объем базы центрального электронного каталога составляет более 200 тыс. документов с полными библиографическими описаниями. Некоторые из них имеют тексты содержания в электронном виде. Электронные каталоги: литература на казахском, русском, иностранном языках, труды и публикации преподавателей, диссертации и авторефераты. В будущем, предполагается подключение к системе и других вузовских библиотек, имеющих базу электронного каталога.
Список литературы