Пути оптимизации научно-информационного и патентного поиска в Интернет
Артамонова Н.О
.Институт медицинской радиологии им. С.П. Григорьева АМН Украины, Харьков, Украина
N. O. Artamonova
Grigoriev Institute of Medical Radiology, Academy of Medical Sciences of Ukraine, Kharkov, Ukraine
Н.О. Артамонова
Інститут медичної радіології ім. С.П.Григор'єва АМН України, Харків, Україна
Рассматривается технология проведения научно-информационного и патентного поиска в Интернет и пути ее оптимизации на примере изучения медицинских ресурсов Интернет. Представлена идеология проведения поиска, которая включает формирование стратегии и методологии научного поиска. Проведенная систематизация информации на основе научно обоснованного подхода позволила разработать концепцию эффективного использования глобальных мировых медицинских и радиологических ресурсов Интернет.
Medical resources in the Internet are taken as an example for studying and optimizing patent and scientific information retrieval in the Internet. The proposed ideology for information retrieval consists of strategy formation and scientific retrieval methodology. The classification of the information obtained on the basis of scientifically substantiated method allowed the institute to develop a concept for effective use of global medical and radiological resources of the Internet.
Розглядається технологія проведення науково-інформаційного і патентного пошуку в Інтернет і шляхи її оптимізації на прикладі вивчення медичних ресурсів Інтернет. Представлено ідеологію проведення пошуку, яка включає формування стратегії і методології наукового пошуку. Проведена систематизація інформації на основі науково обґрунтованого підходу дозволила розробити концепцію ефективного використання глобальних світових медичних і радіологічних ресурсів Інтернет.
В настоящее время состояние информационных ресурсов Интернет таково, что практически любой запрос, который имеет ту или иную смысловую нагрузку, может быть удовлетворен. Однако, перед тем как начинать поиск необходимо решить как минимум две проблемы: как (что и где искать) проводить поиск информации и по каким критериям ее оценивать. Для этого необходимо продумать некоторую стратегию, т.е. возникает проблема навигации в Интернет, которая включает приобретение основных методических навыков, правил и подходов к проведению информационного поиска.
Для формирования стратегии поиска необходимо учитывать некоторые правила, среди которых можно выделить следующие
:Объектом информационного поиска могут быть как фактографические данные (факты, формулы, количественные показатели), так и библиографическое или реферативное описание объекта и в зависимости от этого различают информационный поиск фактографический и документальный. Документальный поиск может быть полнотекстовым (направленный на нахождение первичных документов) и библиографическим (направленным на нахождение библиографической информации, то есть сведений о документах, которые представлены в виде библиографических записей).
Библиографический поиск характеризуется тем, что поиску подлежит не любая информация, а сведения о документах (библиографические или реферативные). Иначе говоря, пользователь заинтересован в нахождении таких элементов библиографической информации, как автор и/или заголовок и/или коллективный автор и/или выходные данные документа (год, издательство, место издания). Поиск информации, который проводится в библиотеке, как правило, сводится к поиску библиографической информации — по каталогам и картотекам.
Стратегия поиска ориентирована на оптимальное достижение необходимых результатов и зависит от качества формирования поискового задания. К основным типам запросов можно отнести такие как: адресный (о наличии в “хранилище” БД определенного документа); тематический (запрос на подборку информации по определенной теме); именной, библиографический (требует установления точного библиографического описания) и др. Учитывая достаточно широкий диапазон поисковых библиографических заданий, необходимо уточнить особенности выработки стратегии поиска в Интернет. Так, библиографический поиск по тематике запроса (или тематический) может распространиться и перейти границы поиска лишь в библиографических ресурсах в случае, если необходимо достичь максимальной полноты результатов поиска. Такая ж ситуация может быть и в ходе поиска по ключевым словам. В таких случаях желательно выполнить поиск по всем информационным ресурсам Интернет, а не только по библиотечно-библиографическим ИПС.
Технология проведения поиска предполагает прохождения некоторых этапов.
Формулирование запроса (поискового образа). Формирование поискового запроса осуществляют путем четкого формулирования и выбора наиболее информативных ключевых слов (терминов). Выбор основан на двух подходах: от общего к частному через конкретизацию (сужение поиска); от частного к общему через расширение поиска. Формирование запроса проводится в зависимости от интерфейса ИПС того сервера, на котором проводится поиск. В каждом конкретном случае интерфейс имеет свою специфику, свои особенности. Специфику интерфейсов ведущих информационно-поисковых систем можно увидеть при выходе на такие БД как: Medline, USPTO, EPO и RUPAT (БД Федерального института промышленной собственности России).
Выбор предмета поиска. Поиск может осуществляться при помощи: ключевых слов, предметных рубрик, авторитетных (автор, журнал, компания и т.п.) и фактографических данных. Словосочетания и фразы необходимо брать в кавычки, в противном случае запрос будет восприниматься как отдельные слова с выдачей соответствующего “шума”. Не нужно использовать широко распространенные термины типа “компьютер”, “информация”, “данные” и др. Если на запрос пришло 200 или более документов, то запрос необходимо переделать.
Если среди первых 10-ти ссылок по запросу нет ни одной нужной, то надо радикально изменить запрос или использовать другую поисковую систему.Следует учитывать тот факт, что при получении списка документов в результате поиска, ранжирование проводят по степени важности, релевантности документа, то есть пересмотрев первые 20-30 документов, можно увидеть, что нужных становиться меньше или их нет совсем. Многие поисковые интерфейсы имеют два бланка поиска: упрощенный — появляется на экран первым, и расширенный
(Advanced Search), которым можно воспользоваться при необходимости.Выбор информационного ресурса: поисковый сервер; информационные органы — собственники информационных ресурсов (поисковые сервера, библиотеки, информационные центры, патентные ведомства, издательства и др.). В Интернет существует большое количество разных серверов, которые предназначены для сбора, сохранения и предоставления информации в максимально удобном для пользователя виде. Они делятся на две категории — поисковые сервера и директории ресурсов.
Выбор информационного ресурса зависит также от типа поиска.
Поиск по слову (Word Search). Для этого вида поиска используют формы (для заполнения). Поиск проводится по одному или нескольким словам в каталогах библиотеки
Medline с помощью WWW. Этот вид поиска обеспечивает поиск: по авторам или заголовком, а также усложненный поиск, который предусматривает использование логических операторов (AND, OR, NOT), что позволяет выполнять поиск по предметным рубрикам, именам, заголовкам, сериям и другим элементам записи. Некоторые из этих записей имеют непосредственные ссылки на электронные материалы. Меню формирования запроса, которое появляется после выбора раздела “Word Search” или “Advanced Word Search”, предлагает большой перечень поисковых признаков. Кроме простого поиска по автору, заголовку, система обеспечиваетє многоаспектное объединение этих параметров за счет операторов.Поиск при помощи просмотра (Browse Search) предусматривает заполнение форм для просмотра и дальнейшего выбора из алфавитно-предметных указателей поискового сервера. Просмотр можно производить по предметным рубрикам, конференциям, названием. При проведении поиска на поисковом сервере необходимо при формировании запроса использовать логические операторы “и” (and), “или” (or), “нет” (not). Например, на сервере AltaVista символ “+” и “-” используют для выделения в запросе обязательных и “запрещенных” слов (по умолчанию все слова запроса считаются объединенными оператором “или”).
Определение информативности информационных ресурсов (объем, оперативность, релевантность документа). Вначале необходимо изучить возможности получения структурированной информации на известных мировых серверах Yаhoo, Alta Vista, информационно-поисковых серверах России: Рамблере и российском медицинском сервере; Украины: УКРМЕДНЕТ — Каталоге медицинских сайтов Украины (содержит 381 ссылку на другие сайты), поисковых системах МЕТА; MEDIC (Донецкий сайт медицинской информации), ПАНТЕЛЕЙМОН (сервер с доступом к украинским и российским медицинским журналам) и т.п. Затем методом анализа различных тематических списков (link) можно выявить ядерную группу организаций (фирмы производители, различные организации), информация на которых даст возможность более полнее удовлетворить современные информационные потребности. Оценка информативности веб-сайтов путем их систематизации, определения основных направлений деятельности, представленных на них организаций позволит выбрать необходимые. Необходимо, однако, учитывать, что информация, доступная в режиме бесплатного доступа имеет преимущественно рекламный характер, с представлением разделов по истории развития, основным направлениям деятельности организации, финансовым отчетам, техническим параметрам выпускаемой продукции, проводимым мероприятиям и др.
Освоение мировых просторов Интернет является неотъемлемой частью современной научно-информационной деятельности, поэтому особенный интерес представляет структуризация и оценка
их информативности. Результаты проведенного анализа информативности таких информационно-поисковых систем как — Medline, USPTO, WIPO, EPO, RUPAT позволили заключить следующее:Проведенная систематизация информации на основе научно обоснованного подхода позволила разработать концепцию эффективного использования глобальных мировых радиологических и медицинских ресурсов Интернет, основные положения которой можно сформулировать следующим образом.
I. Формирование единого патентно-информационного пространства медицинской области в целом и медицинской радиологии в частности, позволит повысить не только качество научных исследований, но и конкурентоспособность медицинских разработок.
II. Проведение анализа инновационной политики зарубежных фирм, в том числе по разработке технологических нововведений и перспективных направлений деятельности, необходимо использовать патентно-статистическую информацию, доступ к которой возможен через
www-сайты патентных ведомств ведущих стран поиска и патентных провайдеров. Получение исчерпывающей и достоверной информации, характеризующей инновационную деятельность зарубежных фирм, требует разумного подхода к формированию стратегии поиска с учетом комбинации различных возможностей доступа.III. Интернет — один из видов информационных ресурсов и имеет не только преимущества, но и ряд недостатков: получение “шума”, технические сбои при получении больших объемов информации, трудности в осуществлении навигации и проведении поиска БД с различным поисковым интерфейсом и т.д.
IV. Создание больших информационных объединений — консорциумов, которые контролируют рынок создания и распространения электронных информационных ресурсов, ставит перед патентно-информационными службами стран СНГ задачу активного освоения существующих информационных ресурсов Интернет и их мониторинг, с выделением профильных сайтов “ядерной зоны”.
V. Неизбежность процесса расширения доступа к патентно-информационным ресурсам Интернет вызывает необходимость, с одной стороны, формирования информационного пространства Интернет отечественными информационными ресурсами, с другой — осуществления специальной подготовки и адаптации пользователей к ориентации в информационных ресурсах, специализированных поисковых серверах и БД.
VI. Формирование стратегии проведения информационного поиска в Интернет, включает в качестве обязательного элемента — знание возможностей современных информационных технологий, использование современных информационных концепций.
VII. Проблема выбора необходимого электронного ресурса в Интернет связана со знанием структуры, вида и назначения информационного ресурса, например, собственно информационный ресурс (электронный документ, электронное издание), генератор ресурсов (исследовательские институты, коммерческие компании, национальные и международные организации, издательские организации, патентные ведомства и др.) и информационный сервис (технологии доступа, поиска и использования).