Создание электронных украинско-английского и англо-украинского
Министерство образования и науки Украины, Киев, Украина
Национальный технический украинский университет “КПИ”, Киев, Украина
Bohdan R. Kyiak and Tatyana E. Sokolovska
Ministry of Education and Science of Ukraine, Kiev, Ukraine
KPI National Technological Ukrainian University, Kiev, Ukraine
Міністерство освіти і науки України, Київ, Україна
Національний технічний український університет “КПІ”, Київ, Україна
В статье рассмотрены проблемы создания терминологических словарей по фундаментальной науке; обработан большой массив ключевых слов и выражений, которые употреблялись в проектах Государственного фонда фундаментальных исследований. Созданы электронные украинско-английский и англо-украинский словари активной научной лексики, открытые
для пополнения. Словари будут размещены на Web-страничке ГФФИ.The problems of terminological dictionaries of fundamental science are discussed, and a large array of keywords and word-combinations used in the projects of the State Foundation of Fundamental Research is examined. The compiled Ukrainian-English and English-Ukrainian dictionaries of modern scientific terminology are described. These dictionaries are open for updating and will be placed on the web-site of the State Foundation of Fundamental Research.
У статті розглянуто проблеми створення термінологічних словників фундаментальної науки на основі великого масиву ключових слів та виразів, що використовувалися у проектах Державного фонду фундаментальних досліджень. Представлено електронні українсько-англійський та англо-український словники активної наукової лексики, відкриті для поповнення. Словники будуть розміщені на
WEB-сторінці ДФФД.Серед основних завдань, що реалізує у своїй діяльності Державний фонд фундаментальних досліджень (ДФФД, далі Фонд), поряд з основною метою — грантовою підтримкою конкурсних наукових проектів, не менш важливою функцією є інформаційне забезпечення у сфері науки та освіти. Воно полягає не тільки у створенні банку наукових ідей вітчизняних учених, публікацій за результатами виконання розробок, оцінці їхнього індексу цитувань, а також у сприянні термінотворчого процесу в середовищі фундаментальної науки. Досвід попередніх шести конкурсів
Фонду свідчить про нестандартність ситуації, коли автори наукових проектів не використовують можливості україномовних термінологічних словників, наприклад /1,2,3/, а з іншого боку — рівень володіння англомовними науковими термінами недостатній для поширення інформації про власні розробки, що повинно сприяти їх входженню у світовий науковий простір.Точність і повнота пошуку необхідної інформації в існуючому розмаїтті є однією з найактуальніших проблем сьогодення, а результативність пошуку безпосередньо залежить від якості пошукових систем. У процесі проведення конкурсів Фонду та створення пошукової бази даних за проектами-грантами і підсумковими звітами, виникла необхідність автоматичної обробки авторських текстів з метою реалізації автоматизованого пошуку проектів за ключовими словами (для призначення відповідних за спеціалізацією експертів) та для інших задач, що вирішуються при роботі з великими масивами інформації. Всі ці питання пов’язані їз створенням інформаційно-пошукової мови, яка повинна мати достатню семантичну потужність і бути спроможною описувати поняття з необхідною повнотою і точністю та забезпечувати однозначність кожного запису. Важливим аспектом її є відкритість для поповнення та коригування лексичних засобів.
Сукупність лексичних одиниць інформаційно-пошукової мови становить її словник /4/. У даному випадку лексичні одиниці представлені дескрипторами (ключовими словами) і словосполученнями, які визначають найважливіші топіки, відбиті в текстових документах. Створюваний нами словник інформаційно-пошукової мови є словником дескрипторів (ключових слів) усіх напрямків фундаментальної
науки.Безпосередньо основою для підготовки і роботи над словником стала вибірка наукових термінів українською та їх відповідників англійською мовою з конкретного фактичного матеріалу бази даних за 780 звітами наукових і науково-технічних проектів 4-го та 5-го конкурсів Фонду за такими 9-ма науковими напрямками: математика, механіка, інформатика; фізика і астрономія; хімія; наукові основи перспективних технологій; біологія; наука про Землю та Всесвіт і проблеми навколишнього середовища; фундаментальні аспекти гуманітарних наук; фундаментальні соціально-економічні проблеми; проблеми прогнозування розвитку науки та освіти. Відповідно до розроблених електронних форм звітів автор проекту подавав до 10 ключових слів українською та їх переклад англійською мовою. Певна частина словника
(одна з дев’яти) відповідає окремому конкретному з перерахованих науковому напрямку.Словник змістовно віддзеркалює сучасний стан фундаментальних знань щодо широкого спектру наук. У ньому найбільш широко представлена наукова лексика, якою активно користуються українські науковці останні роки (1997-2000рр.). Ця лексика пов’язана з фундаментальною наукою, а отже, ілюструє діапазон даних від основних понять до розвитку нових орієнтирів — пріоритетів фундаментальної науки. Робоча картотека налічує близько 5000 тис. термінів українською мовою та стільки ж їхніх відповідників англійською мовою (таблиця). Звичайно у словнику є загальнонаукова і термінологізована вживана лексика.
№ |
Назва напрямку |
Кількість проектів |
Кількість слів наданих авторами (укр.мова) |
1 |
математика, механіка, інформатика |
85 |
664 |
2 |
фізика та астрономія |
233 |
1615 |
3 |
Хімія |
91 |
598 |
4 |
наукові основи нових перспективних технологій |
127 |
827 |
5 |
Біологія |
90 |
513 |
6 |
наука про Землю та Всесвіт і проблеми навколишнього середовища |
60 |
357 |
7 |
фундаментальні аспекти гуманітарних наук |
22 |
179 |
8 |
фундаментальні соціально-економічні проблеми |
56 |
484 |
9 |
проблеми прогнозування розвитку науки та освіти |
16 |
111 |
Всього |
780 |
5348 |
Метою роботи було отримання і вивчення поданого інформаційного матеріалу, що зумовлює вирішення ряду окремих завдань:
У процесі роботи над словником всі ключові слова, які використані у звітах, перевірялися і уточнювалися відповідно до стандартних словників. Необхідною виявилась також перевірка дескрипторів, поданих авторами-науковцями; а саме: чи несуть вказані ключові слова в тексті значне змістовне навантаження з точки зору інформаційного пошуку, чи подані слова є термінами, тобто словосполученнями з єдністю звукового знаку та співвіднесеного з ним відповідного поняття в системі даної галузі науки та техніки /5/. У результаті такого аналізу кількість ключових слів, взятих з проектів, суттєво зменшилась
. Після перевірки потребували граматичного коригування й англійські варіанти ключових слів. До деяких українських термінів були подані більш точні англійські еквіваленти. Перевірка перекладу термінології виявилася особливим завданням. Адекватний переклад термінів ускладнювався розбіжностями в історії виникнення термінів, в їх вживанні, наявністю синонімів та полісемії.Отже, змістом запропонованого словника наукової термінології є терміни — як особлива група слів, кількість яких у розвинених мовах дуже велика /5/. Якщо ж вважати термінами й групу загальновживаних лексичних одиниць, які є термінами лише контекстуально в наукових текстах (вода — в хімії, дірка — в фізиці та інші), то можна навіть зробити припущення, що кількість термінів в мові багатократно перевищує чисельність загальновживаних слів. При чому чисельність термінів невпинно зростає незалежно від того, яке походження терміна. Через певні особливості двадцятого сторіччя — головним чином, завдяки блискавичному розвитку науки та техніки — кількість термінів в мові збільшується набагато швидше, ніж загальновживаних слів.
Останнім часом у більшості наукових праць вивчення словотвірних процесів здійснюється на базі термінологічної лексики, оскільки остання є найбільш збагачуваною словникового складу мови у порівнянні з його іншими частинами.
Науковці вживають термінологічні одиниці, які надходять до мови різними шляхами:
— запозичення з рідної мови, в тому числі з діалектизмів, регіоналізмів, професіоналізмів; у цьому випадку часто мають місце такі стилістичні засоби як переосмислення, метонімічне перенесення;
— запозичення з інших мов (на різних етапах становлення суспільства терміни запозичуються з різних мов, що зумовлено різними історичними умовами). Як правило, слово запозичувалося з мови, розвиток країни якої досяг певного прогресу у тій чи іншій області. Аналогічний процес відбувається і зараз.
Сучасні терміносистеми української мови постійно поповнюються елементами, джерелом яких є інші високорозвинені мови. У мовах європейсько — американського ареалу дуже поширеним джерелом творення нових лексичних одиниць виступають насамперед класичні мови — давньогрецька та латинська. Використання греко-латинських компонентів являють собою особливий тип виникнення термінів, тому що їх поєднання є дуже продуктивним (minicomputer, alphanumeric, mini-based, retroactively), зустрічаються навіть терміни, які включають в себе декілька греко-латинських елементів (multi-minicomputer, megamini). На основі поданих авторами проектів ключових слів, можна зробити висновок, що терміносистеми української мови дуже активно використовують ці компоненти.
На прикладі поданих у проектах наукових термінів спостерігаються дериваційні процеси в українській мові, а саме процес словотворення, виникнення одних одиниць мови на основі інших. Даний процес має два потенційні шляхи розвитку — це розгортання (створення багатокомпонентних термінів) та згортання (створення більш компактної одиниці). Дериваційні процеси набули поширення в англійській, розвиваються і в українській мовах (data — database — database system, аналогічно в українській: дані — база даних — система бази даних).
У кожній мові діє закон мовної економії. Що стосується терміносистем, то їм особливо притаманне стискання форми вираження (але ні в якому разі не змісту) лексичної одиниці (chain of blocks = block-chaining, cubic number = cube, setpoint adjustments = settings).
Не всі науковці для варіанту перекладу використовували одиниці, які виникни нещодавно. Попередня форма вираження може іноді вважатися архаїчною чи навіть змінити своє смислове значення. В такому разі його вживання може привести до помилкового розуміння.Розвиток терміносистем відбувається дуже швидко, певна кількість лексичних одиниць відмирає, тому що поняття, які вони відображували, є неактуальними. Деякі з таких термінів набувають нового значення.
В результаті деякі лексичні одиниці були вилучені, а деякі додані.
Лексичні одиниці даної інформаційно-пошукової мови створили два великі пласти:
Планується, що словник буде існувати в електронній формі, тобто у вигляді бази даних для забезпечення постійного користування та ефективного пошуку термінів. Можливим стане швидке внесення змін, поповнення та його модернізація. Словник в електронній формі буде наглядно представляти інформацію, мати дружній інтерфейс і буде доступним користувачам різної кваліфікації.
Словник буде виставлений на Web — сторінці
Державного фонду фундаментальних досліджень (www.mon.gov.ua/konkurs_dffd.zip) для загального користування та пошуку необхідної інформації українськими науковцями, а також науковцями закордоном. Це дасть можливість використовувати словник при формування запитів для наступних конкурсів Фонду, швидко знаходити вірний переклад термінів, а в подальшому на основі аналізу поповнення словника зробити деякі висновки щодо розвитку фундаментальної науки в Україні в порівнянні з тими ж напрямками фундаментальної науки закордоном.На базі даного словника можлива розробка та створення дескрипторного словника із зафіксованими у ньому парадигматичними відношеннями — інформаційно-пошукового тезауруса.
Література