Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
22
КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ ЛІНГВІСТИЧНИЙ УНІВЕРСИТЕТ
Сліпецька Віра Дмитрівна
УДК 811.111+81-114
Англомовна термінологія штучного інтелекту
в контексті інших терміносистем
(досвід лінгвостатистичного аналізу)
Спеціальність 10.02.04 германські мови
Автореферат
дисертації на здобуття наукового ступеня
кандидата філологічних наук
КИЇВ
Дисертацією є рукопис.
Робота виконана на кафедрі англійської філології Київського національного лінгвістичного університету, Міністерство освіти і науки України.
Науковий керівник доктор філологічних наук, професор
Скороходько Едуард Федорович,
Український інститут лінгвістики і менеджменту,
кафедра прикладної лінгвістики, професор
Офіційні опоненти: доктор філологічних наук, професор
Левицький Віктор Васильович,
Чернівецький національний університет
імені Юрія Федьковича,
кафедра германського, загального
та порівняльного мовознавства, завідувач кафедри
кандидат філологічних наук
Грицьків Андрій Васильович,
Тернопільський національний економічний університет,
кафедра іноземних мов, доцент
Захист відбудеться 15.05.2008 р. о 10-30 годині на засіданні спеціалізованої вченої ради Д 26.054.02 Київського національного лінгвістичного університету (03680, МСП, м. Київ-150, вул. Червоноармійська, 73).
З дисертацією можна ознайомитись у науковій бібліотеці Київського національного лінгвістичного університету (м. Київ, вул. Червоноармійська, 73).
Автореферат розісланий 12.04.2008 р.
Учений секретар
спеціалізованої вченої ради,
професор О.М. Кагановська
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Упродовж останніх десятиріч термін як лінгвістичний феномен привернув увагу вчених у галузі не тільки термінознавства, але й загального мовознавства (В.Ф.Новодранова, M.LHomme). З одного боку, це повязане з розвитком лінгвістичної науки про термін природним процесом переходу від переважно описових розвідок до теоретичного узагальнення одержаних результатів (C.В.Гриньов, Т.Castellvi), дедалі глибшим усвідомленням ролі терміна в науковому дискурсі (Е.Ф.Скороходько). З іншого боку, впливають зовнішні чинники, серед яких не останнє місце посідають проблеми лінгвістичного забезпечення систем штучного інтелекту: автоматичний переклад, інформаційний пошук, реферування, видобування знань із текстових баз даних (K.Spark Jones). Проблеми лінгвістичного забезпечення систем штучного інтелекту стали особливо відчутними, враховуючи величезний обсяг текстових документів у мережі Інтернет. Ці проблеми знову вже на новому рівні актуалізували питання про характерні ознаки терміна і його ідентифікацію в тексті (F.Ville-Ometz).
Зявився навіть новий напрям досліджень, на стику термінознавства,
інформатики та компютерних технологій, автоматичне розпізнавання термінів
у тексті (К.Каgeura).
Незважаючи на значну кількість праць, присвячених науковій термінології, окремі терміносистеми залишаються практично не дослідженими. До них належить, зокрема, термінологія однієї з новітніх галузей знання штучного інтелекту. Перебуваючи на стадії становлення, вона включає багато неологізмів (зокрема, авторських, уперше використаних у конкретному тексті), які не зафіксовані в термінографічних джерелах. Штучний інтелект належить до галузей знання, у яких домінує інтелектуальний складник. У таких галузях шлях творення термінів, як правило, починається не від ремісничої лексики, що характерне для більшості галузевих термінологій, а від авторських неологізмів: авторський неологізм → ,,стихійний” термін → загальноприйнятий (стандартизований) термін (Е.Ф.Скороходько). Внаслідок цього вивчення термінології штучного інтелекту сприятиме глибшому розумінню сучасних механізмів термінотворення. Крім того, слід зазначити, що поза увагою дослідників залишилися два важливі аспекти. Йдеться про термінологічний складник наукового тексту в усій його повноті
та про контрастивний аналіз термінологій у межах однієї мови. Науковий текст
з будь-якої тематики містить не тільки спеціальні (галузеві) терміни, але
й загальнонаукову лексику, а також терміни інших галузей (екстрагалузеві терміни). Мовні характеристики термінів різних категорій, так само, як їх функціонування в тексті, мають специфіку, яка до цього часу не стала обєктом дослідження. Адже в більшості термінознавчих праць досліджується або термінологія взагалі як специфічний шар лексики, або термінологія певної галузі (І.М.Гумовська, О.І.Гутиряк, Е.Т.Дерді, З.Б.Куделько, Г.Б.Фогель, О.В.Харченко та ін.). До того ж відчувається відсутність контрастивних студій термінологій в межах однієї мови, незважаючи на те, що зіставленню термінів різних мов (переважно під кутом зору перекладацької проблематики) приділено певну увагу (Ф.А.Циткіна). Це питання розглядається і в працях з перекладу (В.І.Карабан, Е.Ф.Скороходько). Проте комплексне зіставлення різних галузевих термінологій в межах однієї мови не виконувалося.
Актуальність теми дисертаційного дослідження визначається загальною тенденцією сучасного мовознавства, спрямованою на зіставні студії. Йдеться про зіставлення різних термінологічних систем в межах тієї самої мови. Крім того,
у звязку з накопиченням величезної кількості текстових документів у мережі Інтернету загострилася проблема автоматичного розпізнавання термінів (для наступного реферування та інформаційного пошуку). Це, у свою чергу, потребує кількісного опису формальних характеристик термінів.
Звязок роботи з науковими темами. Дисертацію виконано в межах комплексної теми кафедри англійської філології Київського національного лінгвістичного університету ,,Мовні системи. Динаміка функціонування фонетичних, граматичних та лексичних одиниць: когнітивний та
комунікативно-прагматичний аспекти (германські, романські та українська мови)” (тема затверджена вченою радою КНЛУ, протокол № 2 від 26 вересня 2005 року). Проблематика дисертації вписується в коло питань, досліджуваних згідно
з держбюджетною науковою темою № 0106U002115 ,,Функціональні моделі тексту та дискурсу в синхронії та діахронії: когнітивний, комунікативний та емотивний аспекти” (тема затверджена вченою радою КНЛУ, протокол № 6 від
січня 2006 року).
Мета дисертації полягає у встановленні спільних та відмінних рис спеціальних та неспеціальних термінів, які функціонують в обстежених текстах зі штучного інтелекту, матеріалознавста та обробки металу, аерокосмічних технологій та фінансово-економічної справи.
Поставлена мета вимагає розвязання таких основних завдань:
Обєктом дослідження є англомовні терміни, представлені в наукових текстах зі штучного інтелекту.
Предметом дослідження структурні та словотвірні характеристики термінів штучного інтелекту в зіставленні з термінами інших галузей через призму лінгвостатичного аналізу.
У дослідженні перевіряється така гіпотеза: існує взаємозвязок між галузевою і категоріальною належністю терміна та його структурними і термінотвірними характеристиками (довжина терміна, афіксальна модель, частиномовна модель, термінотвірний тип).
Матеріалом дисертаційної роботи слугують наукові статті (теоретичного характеру) технічного та гуманітарного напрямів, опубліковані в 1998-2005 рр. відомим нідерландським видавництвом Elsevier. Англомовні наукові статті репрезентують типологічно різні галузі. Обрано три галузі в межах
технічного напряму й одну гуманітарного напряму: а) штучний інтелект;
б) теоретичне матеріалознавство й обробка металу; в) аерокосмічні технології;
г) фінансово-економічна справа. Галузі штучного інтелекту та авіакосмічних технологій перебувають на стадії становлення й активного розвитку (хоча
дещо відрізняються за віком), а галузі матеріалознавства та обробки металу, фінансово-економічної справи мають довгу історію і є відносно стабільними. Обрані галузі відрізняються за ступенем їхнього опрацювання у лінгвістичній літературі. Фінансово-економічна термінологія отримала достатнє висвітлення й залучена у роботі виключно для порівняння, а термінологія теоретичного матеріалознавства (властивостей сучасних матеріалів, методів їхнього випробовування, функціональні характеристики тощо) та аерокосмічних технологій (у першу чергу, аеромеханіки, теплофізики, міцності літальних апаратів) залишилися поза увагою вітчизняних дослідників.
Джерельну базу дослідження становлять терміни, отримані шляхом суцільної вибірки з англомовних наукових статей. Загальний обсяг опрацьованого матеріалу 179117 слововживань (за галузями: штучний інтелект , матеріалознавство , аерокосмічні технології , фінансово-економічна справа ); 5851 термін (за галузями, відповідно: 1499, 1466, 1436, 1450); 21673 терміновживання (відповідно: 8204, 5040, 3010, 5419).
Методи дослідження. Для вирішення поставлених завдань та з огляду на характер фактичного матеріалу в роботі комплексно використовуються такі методи: морфемний аналіз для встановлення структурних характеристик термінів; словотвірний аналіз та термінотвірний аналіз для виявлення термінотвірних характеристик; зіставний аналіз для порівняння термінів різних категорій; елементи аналізу дискурсу для встановлення функціонування термінів різних категорій у тексті. Для перевірки гіпотез, висунутих у результаті опрацювання емпіричного матеріалу, використано такі статистичні методи: критерій Стьюдента для перевірки гіпотези прo рівність / нерівність середніх значень та для перевірки гіпотези про рівність / нерівність відсотків (часток); критерій ,,хі-квадрат” для перевірки гіпотези про звязок між категоріальними ознаками; кластерний аналіз для визначення ступеня подібності між досліджуваними термінологіями.
Наукова новизна дисертаційної праці забезпечується комплексним зіставленням різних галузевих термінологій у межах однієї мови. Вперше наведена характеристика англомовних термінів штучного інтелекту з погляду їхньої структури, утворення та функціонування в науковому дискурсі. Вперше описано продуктивні способи термінотворення у двох галузях сучасної науки: штучного інтелекту та матеріалознавства. Вперше виявлено, що є спільного та відмінного у термінах різних категорій і різних галузей знання щодо їхньої структури, утворення та функціонування в науковому дискурсі. Це уможливило встановлення статистично значущих звязків, по-перше, між довжиною термінів різних категорій, галузей та їх частотою; по-друге, між афіксальними моделями та категорією терміна; по-третє, між термінотвірним типом, частиномовною моделлю та категорією терміна, його галузевою належністю. Вперше визначено ступінь подібності між термінологіями штучного інтелекту, матеріалознавства, аерокосмічних технологій та фінансово-економічною.
Теоретичне значення роботи полягає в тому, що вона є внеском
у подальше опрацювання питань, повязаних із процесами термінотворення, зокрема в ракурсі зіставного термінознавства. Головні положення дисертаційного дослідження слугують підґрунтям для глибшого розуміння процесів термінотворення, залежності частотних, структурних і термінотвірних ознак терміна від галузі знання та категорії. Загальна характеристика англомовної термінології штучного інтелекту є внеском у теорію термінології взагалі та англомовних термінологій зокрема. Представлений у дисертації матеріал може слугувати основою зіставних досліджень термінологій штучного інтелекту в двох чи більше мовах.
Практичне значення дослідження полягає у можливості використання його основних положень та висновків у викладанні курсу лексикології англійської мови (розділи ,,Словниковий склад англійської мови як система,” ,,Словотвір”), у спецкурсах із термінознавства, а також при написанні курсових, дипломних та магістерських робіт, при укладанні методичних розробок, посібників та підручників. Фактичний матеріал може бути використаний у лексикографічній практиці при укладанні частотних словників. Запропоновані в нашій праці підходи та механізми можуть бути використані також у працях з питань українського, російського термінознавства.
Апробація роботи. Результати дослідження обговорювалися на пяти наукових конференціях, у тому числі на чотирьох міжнародних: ,,Актуальні проблеми германської філології в Україні та Болонський процес” (Чернівці, 2007), ,,Сучасні проблеми лінгвістичних досліджень та дидактичні особливості викладання іноземних мов професійного спілкування у вищій школі”
(Львів, 2007), ,,Етнокультурні цінності і сучасна філологія” (Рівне, 2006), ,,Наука та практика 2007” (Полтава 2007); на V Міжвузівській конференції молодих учених ,,Сучасні проблеми та перспективи дослідження романських і германських мов і літератур” (Донецьк, 2007).
Публікації. Основні положення та результати дослідження відображені у девяти публікаціях: чотирьох статтях, три з яких опубліковані у фахових виданнях ВАК України (2,15 др. арк.), та чотирьох тезах доповідей на наукових конференціях. У співавторстві з Е.Ф.Скороходьком написано перший розділ монографії. Робота у співавторстві полягала у вибірці термінів, у здійсненні їх статистичної обробки та інтерпретації отриманих результатів. Загальний обсяг публікацій ,46 др. арк.
Загальний обсяг роботи. Обсяг тексту дисертації складає 165 сторінок, загальний обсяг праці разом із бібліографією і додатками становить 347 сторінок (додатки 153 сторінки). Список використаних бібліографічних джерел включає 202 позиції. Список термінологічних джерел включає 43 позиції.
Структура та обсяг роботи. Дисертація складається зі вступу, трьох розділів, загальних висновків, списку використаних бібліографічних джерел, списку джерел ілюстративного матеріалу, списку термінологічних джерел, додатків.
У вступі обґрунтовано вибір теми дисертації, визначено її актуальність і новизна, вказано обєкт і предмет, сформульовано мету та завдання праці, розкрито теоретичне та практичне значення, описано матеріал дослідження та методи його аналізу, сформульовано основні положення, що виносяться на захист.
У першому розділі розглянуто проблеми визначення терміна, термінології та терміносистеми, описано вимоги до терміна, висвітлено процедури стратифікаційного аналізу термінологічної лексики; викладено основні теоретичні положення та методологічні засади дослідження, повязані з ідентифікацією термінів у науковому тексті; охарактеризовано використані в роботі статистичні методи дослідження і обґрунтовано їх використання.
У другому розділі описано термінологічну складову англомовних текстів зі штучного інтелекту; визначено частоту термінів; проаналізовано довжину термінів, частиномовні моделі, суфіксальні моделі (структурний і термінотвірний аспекти), термінотвірні типи; розглянуто три категорії термінів: спеціальних інтрагалузевих термінів штучного інтелекту, спеціальних термінів (екстрагалузевих) суміжних термінологій, а також загальнонаукових термінів, які зустрічаються в цих англомовних текстах.
Третій розділ присвячено зіставленню спеціальних та неспеціальних термінів в англомовних наукових текстах різних галузей; описано термінологічну складову англомовних текстів з матеріалознавства та обробки металу; визначено ступінь подібності чотирьох розглянутих термінологій; зіставлено термінологію штучного інтелекту з термінологією матеріалознавства та обробки металу.
У загальних висновках відображено основні результати дослідження; підведені підсумки роботи; окреслено перспективи подальших досліджень.
Додатки обсягом 153 сторінки складаються з 5 частин, у яких представлено таблиці, що ілюструють характеристики досліджуваних термінів.
ОСНОВНИЙ ЗМІСТ
Розділ 1. ,,Теоретичні та методологічні засади дослідження”.
У вітчизняному та зарубіжному термінознавстві дослідження можна поділити на два напрями: роботи загальнотеоретичного характеру (Б.М.Головін, С.В.Гриньов, І.С.Квітко, Т.Р.Кияк, Т.Chung, H.Felber) та описи окремих термінологічних обєднань (П.В.Войко, О.В.Константінова, З.Б.Куделько, Г.Б.Фогель та ін.). У той же час, поставлена в цій праці мета у доступних нам роботах не визначалася.
Слід зазначити, що в основі нашого дослідження лежить низка теоретичних положень, часто дискусійних (розуміння наукового терміна, стратифікація термінологічної лексики наукового тексту тощо), яким уже була присвячена не одна праця. Дослідники переважно по-різному розуміють поняття ,,термін”. Існує два підходи щодо визначення терміна: структурно-субстанційний та функціональний. Прихильники структурно-субстанційного підходу розглядають термін як особливе слово, яке протиставляється за своєю семантичною
і граматичною структурою загальновживаному (Д.С.Лотте, Т.Л.Канделакі). Прихильниками функціонального підходу було доведено, що термін це функція, тип вживання лексичної одиниці, а не особливий тип лексичної одиниці (Б.М.Головін, В.М.Лейчик, Т.Р.Кияк, Е.Ф.Скороходько). У дослідженні ми дотримувались концепції про функціональну природу терміна. Е.Ф.Скороходько розуміє термін як слово чи усталене словосполучення, яке виражає спеціальне поняття науки, техніки або іншої галузі людської діяльності та має дефініцію, яка розкриває ті ознаки цього поняття, що є релевантними саме для тієї галузі.
Це визначення терміна вважатимемо найбільш адекватним, тому що воно:
а) охоплює найважливіші ознаки терміна, такі, як наявність дефініції, його системність, обмежена сфера вживання; б) робить акцент на характері дефініції, адже саме дефініція включає термін у відповідну термінологічну систему;
в) поширюється також на загальнонаукову термінологію. Виходячи з цих характеристик, надалі спиратимемося на цю дефініцію.
У вітчизняному і зарубіжному термінознавстві існують протилежні погляди на поняття ,,термінологія” та ,,терміносистема”: а) ці терміни вважаються синонімічними (К.Я.Авербух; Е.Ф.Скороходько); б) терміни ,,термінологія”
і ,,терміносистема” не синонімічні (В.М.Лейчик). При першому із зазначених підходів терміносистема це термінологія, у якій експліцитно представлені її системні властивості (К.Я.Авербух). Терміни ,,термінологія” і ,,терміносистема” виступають у визначенні К.Я.Авербуха як гіперонім та гіпонім. В.М.Лейчик дещо по-іншому розуміє ці поняття. Відмінність між термінологіями та терміносистемами, на його думку, полягає у способі їх утворення. Відповідно до цього підходу, термінології утворюються стихійно, у міру накопичення знань. Терміносистеми свідомо конструюються після того, як сформувалася теорія. Говорячи про термінологію, дослідники розрізняють: а) науку про терміни (термінознавство); б) фахову лексику в складі всіх слів певної мови (наприклад, термінологія німецької мови); в) спеціальну лексику, що обслуговує певну галузь науки чи техніки (А.С.Дяков, Т.Р.Кияк, З.Б.Куделько). Проте крім цих значень
у термін ,,термінологія” вкладають додатково різні смислові відтінки: всю сукупність термінів, незалежно від того, чи упорядкована вона, чи ні. За ознакою упорядкованості термінологія мови поділяється на упорядковану (стандартизовану) та на стихійну (Е.Ф.Скороходько). Термінології, не тільки стандартизованій, але й стихійній, як і лексиці в цілому, притаманна системність. Між термінами існують різноманітні відношення семантичні, етимологічні, словотворчі тощо. Тому будь-яку термінологію можна назвати термінологічною системою. У працях термінологів часто неявно під терміносистемою розуміють систему упорядкованих термінів. Таким чином, по суті, термінологія
і термінологічна система (терміносистема) синоніми. Синонімічність термінів ,,термінологія” і ,,термінологічна система” (,,терміносистема”) підтверджується тим, що навіть у нормативних документах вищого рівня (стандартах на терміни
й визначення), які репрезентують упорядковані термінології, вживається виключно назва термінологія. Ми дотримуємося позиції, що терміни ,,термінологія” і ,,терміносистема” синонімічні.
Існують різні погляди і на стратифікацію лексичної складової наукового тексту. Розбіжності стосуються, головним чином, статусу загальнонаукової лексики. Одні дослідники виділяють її як окрему категорію, поряд із термінологічною та загальнолітературною лексикою (М.М.Глушко), інші зараховують її до специфічного шару термінології (С.В.Шепітько). Ми поділяємо погляд С.В.Шепітько і в цій роботі обмежуємося аналізом термінологічної лексики й розрізняємо три категорії термінів, які функціонують у науковому тексті: інтрагалузеві терміни, які належать галузі знання, представником якої
є відповідний текст, екстрагалузеві терміни, які належать суміжній галузі знання, і загальнонаукові терміни.
Упродовж останніх десятиріч активізувалися спроби розвязати проблему ідентифікації термінів у тексті. Ці спроби зумовлені необхідністю вироблення методів автоматичного розпізнавання термінів у тексті для систем штучного інтелекту. Ці методи вписуються в рамки двох основних підходів: статистичного (Т.Chung, U.Kiyotaka) та лінгвістичного (P.Drouin, M.Hong). Характерним для першого підходу є метод Т.Чанг, яка пропонує ідентифікувати терміни, порівнюючи частоту слова в текстах різного характеру й різного змісту. Недоліком чисто статистичних методів автоматичного розпізнавання термінів
у текстах є те, що сама по собі частота не може слугувати критерієм розмежування термінів і нетермінів. Автори лінгвістичних методів автоматичного розпізнавання термінів у текстах аналізують належність компонентів лексичної одиниці до тих чи інших частин мови (P.Drouin, M.Hong), використовують лексичні функції теорії ,,значення-текст” (B.Orliac), ідентифікують термін за його мовним оточенням
у тексті (H.Fulford). Усі спроби автоматизувати розпізнавання термінів у тексті можна вважати успішними лише частково. Ефективність подібних методів невелика. Ідентифікуються не більше 70% термінів тексту (H.Nakagawa). Це не дивує, адже автори методів автоматичного розпізнавання термінів у тексті вимушені шукати вихід у створенні чисто формальних, кількісних методик. Але мова, наукова у тому числі, не є формальною системою. Тому формальних ознак, які б дозволили чітко розрізняти термін від нетерміна, не існує. Ознаки, які фігурують у визначеннях терміна (до того ж, здебільшого неузгоджених, часто суперечливих), теж не можуть слугувати критеріями термінологічності. Можна погодитися з думкою С.В.Гриньова, Е.Ф.Скороходька, що взагалі не існує чіткої межі між терміном і нетерміном. Е.Ф.Скороходько вважає некоректним саму постановку питання типу ,,Це термін чи нетермін?” і наполягає на тому, що натомість слід говорити про ступінь термінологічності.
Відсутність чіткого критерію визначення термінологічності й неможливість його формулювання на сучасній стадії розвитку термінознавства залишають єдиний шлях відбору фахової лексики з текстів: комплексну методику ідентифікації термінів у науковому тексті. Ця методика спирається, передусім,
на аналіз контексту. Враховуються безпосередня чи опосередкована наявність дефініції, структура мовної одиниці, її сполучуваність з іншими одиницями
у межах досліджуваного тексту, можливість переосмислення компонентів.
Розділ 2. ,,Міжкатегоріальні зіставлення спеціальних та неспеціальних термінів у англомовних наукових текстах зі штучного інтелекту”. Кожний науковий текст, крім термінів, що позначають реалії відповідної галузі (інтрагалузевих термінів), містить екстрагалузеві терміни, а також загальнонаукові терміни. Не є винятком тексти зі штучного інтелекту. Інтрагалузеві терміни
в обстежених текстах становлять 74,6% (1118 одиниць). Характер інтрагалузевих термінів ілюструють такі приклади: digital image scene, edge detection (розпізнавання образів); data mining (видобування знань); concept-tree clustering (доведення теорем). Тексти зі штучного інтелекту містять терміни статистики, наприклад: correlation coefficient, integral square error; математики, наприклад: cluster analysis, Euclidean metric; обчислювальної техніки та інформатики, наприклад: on-line system, relational database; мовознавства, наприклад: antonymy relation, discourse structure; загальнонаукові терміни, наприклад: degree, dimension. Екстрагалузеві терміни у текстах зі штучного інтелекту складають, за нашими підрахунками, 8,4% (126 одиниць); загальнонаукові ,0% (255 одиниць) від загальної кількості термінологічних одиниць, а за кількістю терміновживань, відповідно, 11,9% та 31,6%. Таким чином, частка неспеціальних термінів
у наукових текстах зі штучного інтелекту значна. Проте бракує досліджень, присвячених зясуванню специфіки цих структурних і термінотвірних моделей термінів цих категорій.
Англомовна термінологія, як і більшість сучасних термінологічних систем, складається з лексичних одиниць двох типів: одно- та багатокомпонентних термінів (за компонент приймаємо кореневу морфему). До останніх належать
як складні слова і словосполучення, так і одиниці з невизначеним чи
перехідним статусом (Д.І.Квеселевич; Е.Ф.Скороходько). Кількість компонентів терміна називатимемо його довжиною. Серед досліджених термінів, які функціонують у текстах зі штучного інтелекту виявилося 395 однокомпонентних
і 1104 багатокомпонентних одиниць (які налічують дві й більше кореневі морфеми), що становить 26% і 74% відповідно. Це характеризує загальну тенденцію сучасного термінотворення, яка полягає у використанні складних синтаксичних одиниць. С.В.Гриньов стверджує, що 60% термінів в сучасних європейських мовах це багатокомпонентні одиниці. Проте частка багатокомпонентних одиниць серед термінів різних категорій суттєво відрізняється. Якщо серед інтрагалузевих термінів 88% багатокомпонентні одиниці, то серед екстрагалузевих їх 63%, а серед загальнонаукових лише 8%.
У середньому інтрагалузевий термін налічує 2,275, екстрагалузевий ,817, загальнонауковий ,075 компонентів. Різниця статистично значуща: в усіх випадках імовірність помилки практично дорівнює нулеві, довірчі інтервали не перетинаються. Найбільша довжина інтрагалузевого терміна компонентів, екстрагалузевого , загальнонаукового компоненти. Результати дослідження надають можливість зробити висновок про те, що існує звязок між довжиною та категорією терміна. У середньому структурно найскладнішими виявилися інтрагалузеві терміни, найпростішими загальнонаукові. Якщо прийняти середню довжину загальнонаукового терміна за одиницю, то співвідношення за цим параметром між інтрагалузевими, екстрагалузевими та загальнонауковими термінами, які функціонують у текстах зі штучного інтелекту, можна представити як 2,12 : 1,69 : 1,00.
Наша вибірка серед термінів, які функціонують у англомовних наукових текстах зі штучного інтелекту, налічує 395 однокомпонентних одиниць:
інтрагалузевих, 47 екстрагалузевих, 237 загальнонаукових. Практична неможливість передати всі поняття штучного інтелекту за допомогою однокомпонентних термінів веде до утворення структурно складніших одиниць термінів-композитів та словосполучень. До найважливіших характеристик багатокомпонентних термінів належать частиномовна модель та термінотвірний тип терміна. Багатокомпонентні терміни, які функціонують у текстах зі штучного інтелекту, описуються 54 частиномовними моделями. Із цієї кількості
припадають на інтрагалузеві терміни, 11 на екстрагалузеві й лише 5 на загальнонаукові. Спільними для всіх трьох категорій термінів є три моделі, де
N іменник, А прикметник: NN, AN, ANN. Серед інтрагалузевих термінів продуктивними є такі моделі: NN, AN, NNN, ANN, NAN, ANNN. Майже половина багатокомпонентних термінів належить до моделі NN. Домінування утворень цього типу пояснюється, з одного боку, тенденцією до лаконічності та спрощення мовних форм, з іншого широким діапазоном семантичних відношень, які здатна передавати конструкція NN. Перш за все, це обєктні, субєктні, інструментальні відношення. У текстах галузі штучного інтелекту часто йдеться про ситуацію дії та про її окремі складники обєкт, інструмент чи результат дії, наприклад: chaining algorithm, character classification, data analysis.
Афікс несе певну інформацію про семантику терміна, незалежно від того, чи брав він участь у процесі термінотворення, чи ні. Тому була підрахована також частота фінальних суфіксів одно- та багатокомпонентних одиниць у структурі термінів штучного інтелекту. В останніх враховувався фінальний суфікс ядерного компонента. Так, у терміні error-tolerant graph isomorphism detection брався до уваги лише суфікс -ion. За критерієм хі-квадрат фіксується звязок між фінальними суфіксами та категорією термінів. Сила звязку (V Кремера) дорівнює 0,325.
За способом творення серед інтрагалузевих термінів штучного інтелекту домінують складні слова, серед екстрагалузевих складні слова та словосполучення (різниця частот цих одиниць статистично не суттєва). Натомість загальнонаукові терміни, переважно однокомпонентні, це частіше афіксальні утворення. Стосовно цієї ознаки термінів так само простежується звязок між категорією терміна і його термінотвірним типом. Сила звязку середня: V Кремера дорівнює 0,546. Таким чином, можна констатувати, що як за структурними, так
і за термінотвірними ознаками одиниці трьох розглянутих категорій інтрагалузевих, екстрагалузевих та загальнонаукових термінів суттєво відрізняються. Перша відмінність стосується структурної складності термінів. Найскладніші (й найдовші) в середньому інтрагалузеві терміни, найпростіші
(й найкоротші) загальнонаукові. Цю відмінність можна інтерпретувати як таку, що віддзеркалює загальні лінгвістичні закони, зокрема закон економії мовленнєвих зусиль. Інтрагалузеві терміни охоплюють діапазон мовних засобів, що номінують увесь спектр наукових понять штучного інтелекту. Як у кожній науці, більшість останніх складні вузькоспеціальні поняття. Терміни, що виражають складні наукові поняття (за класифікацією Е.Ф.Скороходька, ,,інформативні маркери”), мають, відповідно, складну семантичну структуру. Враховуючи тенденцію термінів до повнозначності (максимального віддзеркалення суттєвих ознак поняття) це неминуче призводить до ускладнення морфологічної та/чи синтаксичної структури мовної одиниці. З іншого боку, ці терміни функціонують переважно в текстах однієї галузі і мають меншу частоту вживання. Тому відносно громіздкі інформативні маркери менше відкидаються мовою. Екстрагалузеві терміни це терміни наукових дисциплін, які використовуються в текстах різних галузей. Звідси випливає, що це такі спеціальні терміни, які виражають поняття більш-менш широкої сфери функціонування, тобто певні базові поняття (за класифікацією Е.Ф.Скороходька, ,,індикативні маркери”). Частота їхнього вживання більша, порівняно з інформативними маркерами та інтрагалузевими термінами в цілому. Отже, вони повинні більшою мірою підлягати дії закону економії, краще відповідати прагматичним вимогам лаконічності, структурної повноти, що й демонструє наше дослідження. Загальнонаукові терміни мають найширшу сферу функціонування. Тому вони найкоротші та найчастотніші.
Друга відмінність стосується різноманітності мовних форм. Кількість частиномовних моделей, реалізованих в інтрагалузевих, екстрагалузевих та загальнонаукових термінах, які функціонують у текстах зі штучного інтелекту, виражається співвідношенням 10,4 : 2,2 : 1. Імовірно, це корелює з довжиною термінів різних категорій. Терміни різних категорій істотно відрізняються й за продуктивністю частиномовних моделей. Із двох найпродуктивніших моделей NN та AN серед інтрагалузевих термінів домінує перша, а серед загальнонаукових друга. Серед екстрагалузевих термінів різниця продуктивності цих моделей статистично не значуща. Домінування утворень типу NN серед інтрагалузевих термінів пояснюється тенденцією до лаконічності та спрощення мовних форм і широким діапазоном семантичних відношень, що їх здатна передавати ця конструкція. Використання моделі NN, безумовно, відповідає потребам мовця, тут автора наукового твору. Але її переваги, зокрема її ,,поліреляційність”, мають також негативні наслідки. Якщо словосполучення типу AN найчастіше виражає певне відношення експліцитно, то модель NN імпліцитно (пор. паралельні форми decomposition of graphs / graph decomposition, beveled cut / bevel cut). Звідси реляційна розмитість цих форм. Термін decomposition algorithm може означати як алгоритм, що здійснює декомпозицію, так і алгоритм, який здійснює якусь іншу операцію шляхом декомпозиції (виступаючи у цьому значенні як скорочена форма decomposition based algorithm). Таким чином, читачу доводиться докладати додаткові розумові зусилля на дешифрування смислу таких виразів. Якщо стосовно інтрагалузевих термінів це певною мірою компенсується фаховими знаннями читача, то екстрагалузеві терміни типу NN несуть загрозу хибного розуміння. Істотно різниться й продуктивність різних способів термінотворення. За цим параметром співвідношення кількості інтрагалузевих, екстрагалузевих та загальнонаукових термінів таке: а) основоскладання ,91 : 3,18 : 1; б) синтаксичне термінотворення ,00 : 6,83 : 1; в) морфологічне (афіксальне) термінотворення ,26 : 0,13 : 1; г) семантичне термінотворення ,22 : 0,34 : 1. Деякі з відмінностей (повязаних, наприклад, зі структурною складністю терміна, поширеністю чисто іменникових утворень типу NN, NNN тощо) можна інтерпретувати як такі, що віддзеркалюють загальні лінгвістичні закони або особливості англійської мови.
Розділ 3. ,,Міжгалузеві зіставлення спеціальних та неспеціальних термінів у англомовних наукових текстах різних галузей”. Для зясування, що
є спільного й відмінного між термінами, які функціонують у наукових англомовних текстах зі штучного інтелекту й текстах інших наукових галузей, розглядатимемо окремо інтрагалузеві, екстрагалузеві та загальнонаукові терміни. Довжина інтрагалузевих термінів у чотирьох досліджених термінологіях становить у середньому 2,381 компонента, за галузями: штучний інтелект ,275, аерокосмічні технології ,728, матеріалознавство ,248, фінансово-економічна справа ,262. У трьох випадках (штучний інтелект, матеріалознавство, фінансово-економічна справа) різниця неістотна. Проте аерокосмічні терміни демонструють більшу, порівняно з трьома іншими галузями, довжину. В усіх чотирьох термінологіях розподіл термінів має багато спільного. Близько половини термінів припадає на двокомпонентні одиниці, чверть на трикомпонентні, приблизно 10% на однокомпонентні терміни. З поміж чотирьох термінологій дещо вирізняється за розподілом аерокосмічна. У ній відносно менше одно- та двокомпонентних одиниць, натомість більше довших термінів. Крім того, це єдина термінологія, в якій ми зареєстрували семи- та восьмикомпонентні одиниці, наприклад: augmented frequency-dependent pressurе coupled combustion response. Однак слід констатувати, що тенденції розподілу залишаються незмінними. Таким чином, враховуючи, що чотири досліджені терміносистеми належать до різних
за характером галузей знання, можна зробити висновок, що розподіл термінів
за довжиною це одна з термінологічних універсалій.
Ураховуючи, що в сучасних термінологіях багатокомпонентні одиниці становлять до 80-90% термінів, увага до їхньої структури видається правомірною. Обстежені інтрагалузеві терміни належать до 149 різних частиномовних моделей. Найбільш різноманітними у цьому відношенні є аерокосмічні терміни: вони побудовані за 104 моделями (70% від загальної кількості моделей).
Інші дисципліни використовують меншу кількість моделей: у штучному інтелекті 52 (35%), матеріалознавстві 50 (34%), фінансово-економічній галузі (38%). Частково це пояснюється тим, що в аерокосмічній термінології кількість трикомпонентних, шестикомпонентних одиниць суттєво перевищує кількість таких термінів у інших галузях. Імовірно, що кількість моделей корелює
з кількістю термінів. Крім того, серед аерокосмічних термінів є
семи-восьмикомпонентні одиниці, відсутні в інших термінологіях. Статистично значуща різниця кількості термінів однієї моделі в різних термінологіях, тобто її різна продуктивність, дозволяє висунути припущення, що саме в цьому й полягає відмінність між дослідженими термінологіями. Для додаткової перевірки цієї гіпотези використано критерій ,,хі-квадрат”. Попарне зіставлення продуктивних моделей за цим критерієм так само показало, що звязок між галуззю та частиномовною моделлю існує. В усіх випадках різниця продуктивності статистично значуща: у парах ,,штучний інтелект :: аерокосмічна технологія” та ,,штучний інтелект :: фінансово-економічна справа” імовірність помилки не перевищує 0,00000. В парі ,,штучний інтелект :: матеріалознавство” ,02446. Одна з головних вимог до зіставного аналізу термінології уніфікація опису порівнюваних обєктів, оскільки важливо максимально зменшити вплив субєктивних чинників. Семантичні характеристики не мають формального вираження. Проте семантичну категорію терміна певною мірою віддзеркалює фінальний суфікс. З цією метою виділено три групи суфіксів. До першої ввійшли суфікси, повязані із ситуацією дії, які формують назви дії, а також субєкта, обєкта, інструмента, результату дії, наприклад: -er, -ing, -ion, -ment, -or, -tor. Друга охоплює суфікси зі значенням властивості, якості: -ance, -ness, -ity, -ty, третя надає абстрактного значення, наприклад: -age, -cy, -ics, -ism, -ity, -ure, -tude. Це найтиповіші значення, наприклад: laser welding, acquisition, measurement, actuator, air compressor; base metal resistance, salience, robustness, velocity; strong semantic linkage, dominant frequency, structural dynamics, graph isomorphism, nominal geometric magnitude. Виявилося, що існує звязок між галуззю науки й кількістю термінів, оформлених суфіксами різних груп. Кількість інтрагалузевих термінів, що стосуються дії, у термінології штучного інтелекту істотно перевищує кількість термінів у інших галузях: 79% від загальної кількості термінів із фінальним суфіксом, у той час як у решті термінологій налічується 64% таких термінів. Натомість кількість термінів на позначення якостей, властивостей, ознак
у термінології штучного інтелекту істотно менша, ніж у термінологіях матеріалознавства й фінансово-економічній: 13% проти 21-22%. Кількість таких термінів в аерокосмічній термінології (15%) відрізняється не істотно. Так само термінологія штучного інтелекту містить істотно менше термінів з абстрактним значенням, ніж решта термінологій: 8% проти 13-21%. Перевірка за критерієм
,,хі квадрат” показує, що існує звязок між галузевою належністю терміна та його семантичною категорією (встановленою за структурним фінальним суфіксом). Сила звязку невелика: V Кремера дорівнює 0,120. Виявлену залежність можна пояснити характером референтного субстрату. Штучний інтелект спрямований на створення систем, які імітують людську діяльність.
Найчисленнішими в усіх чотирьох термінологіях, як і можна було чекати, враховуючи попередні результати, виявилися складні слова й словосполучення. На ці два типи одиниць припадає у кожній галузі від 77 до 86% інтрагалузевих термінів. У той же час питома вага термінів цих двох типів у різних термінологіях неоднакова. Частка складних слів у термінології штучного інтелекту перевищує аналогічний показник в усіх інших терміносистемах, за винятком матеріалознавства. Натомість частка словосполучень у термінології штучного інтелекту більша, ніж у термінології матеріалознавства. Загалом звязок між термінотвірним типом та галузевою належністю терміна існує. Сила звязку
(V Кремера) дорівнює 0,169. В усіх чотирьох термінологіях найбільша
кількість складних слів побудована поєднанням двох, трьох чи чотирьох іменникових основ. За частиномовною моделлю NN у термінології штучного інтелекту створено 440 термінів (75,60% від кількості складних слів у цій терміносистемі), в аерокосмічній (60,57%), у матеріалознавчій
(73,47%), у фінансово-економічній (274%). За моделлю NNN, відповідно,
(18,90%), 144 (29,57%), 131 (20,09%), 76 (20,21%), а за моделлю NNNN
12 (2,06%), 20 (4,11%), 22 (3,37%), 11 (2.93%) термінів. Загальна кількість частиномовних моделей термінів-словосполучень . З них термінології штучного інтелекту належить 40, аерокосмічній , матеріалознавчій термінології , фінансово-економічній . Спільними для чотирьох термінологій є тринадцять моделей, де Ad прислівник, P1 дієприкметник теперішнього часу, P2 дієприкметник минулого часу, Prep прийменник, наприклад: AN, ANN, AAN, ANNN, NAN, P1N, NPrepN, P2N, AdAN, AANN, NANN, NsN, ANANN.
Серед трансформів (Е.Ф.Скороходько), або семантичних дериватів, у всіх досліджених термінологіях наявні як кореневі слова, так і афіксальні утворення, тобто одиниці, які приєднали суфікс чи префікс на стадії утворення побутового чи загальнолітературного слова. До першої групи в термінології штучного інтелекту належать 48 термінів (78,69% від загальної кількості трансформів у цій термінології), в аерокосмічній (86,05%), у матеріалознавчій (90,63%),
у фінансово-економічній (75,00%). Різниця статистично незначуща, можливо, через малу кількість трансформів. Як і в термінології штучного інтелекту, найчастіше спостерігається звуження значення, наприклад: flap закрилок.
Джерелом екстрагалузевих термінів у текстах різних галузей є низка наукових дисциплін. Головними донорами виступають біологія,
інформатика, математика, машинобудування, механіка, статистика, фізика, хімія. У текстах зі штучного інтелекту, на відміну від інших галузей, домінують
терміни математики, статистики, інформатики. Три найчастотніших екстрагалузевих терміни тут є представниками математики: set множина
(180 входжень, або 18,44% від загальної кількості вживань суміжних термінів), vertex вершина графа(частота 111, або 11,37%), node вузол графа(85, або 8,71%). У текстах з аерокосмічних технологій домінують терміни фізики та математики, з матеріалознавства статистики, математики та машинобудування,
у текстах з фінансово-економічної справи статистичні терміни та терміни машинобудування. Екстрагалузеві терміни, виявлені в текстах чотирьох галузей, представляють усі термінотвірні типи, за винятком абревіатур, присутніх лише
в текстах зі штучного інтелекту. Відмінності між термінотвірними типами екстрагалузевих термінів у різних галузях полягають у кількісному співвідношенні. Таким чином, як за складом, так і за деякими структурними
і термінотвірними характеристиками екстрагалузеві терміни у текстах різних наукових галузей мають суттєві відмінності. Очевидно, що і тут ці відмінності також обумовлені специфікою концептуального і когнітивного наповнення текстів. Розподіл загальнонаукових термінів за частотою в текстах різних галузей виявляє істотні розбіжності. Наприклад, якщо в текстах зі штучного інтелекту термін model має найвищий перший ранг, тобто є найчастотнішим (131 вживання, 5% від уживань усіх термінів цієї категорії), у текстах
інших галузей його ранг значно менший і становить 10,5 в термінології авіакосмічних технологій, 54 у матеріалознавстві, 29,5 у фінансово-економічній справі. У текстах із штучного інтелекту акцент робиться на теоретичне моделювання ментальних процесів, в аерокосмічних технологіях домінують методи розрахунків складних конструкцій, у матеріалознавстві експериментальні дослідження фізичних матеріалів, у фінансово-економічній галузі значна увага приділяється часовим вимірам.
За результатами кластерного аналізу термінологій найближчою до термінології штучного інтелекту виявилася термінологія матеріалознавства. Близькість цих двох термінологій одна до одної випливає також із їхніх загальних описів. Спільні ознаки цих двох термінологій: а) кількість частиномовних моделей у кожній термінології (52 та 50), статистично значуща різниця між ними відсутня; б) існує звязок між галуззю та частиномовною моделлю. Розрізнювальні ознаки: а) номенклатура частиномовних моделей: є середньопродуктивні моделі, наявні лише в одній із двох термінологічних систем; б) різна продуктивність частиномовних моделей у цих двох термінологіях.
Чотири досліджувані термінології відрізняються одна від одної
не лише конкретними значеннями продуктивності частиномовних
моделей, а й співвідношеннями цих величин. Інакше кажучи, ,,паспортом” термінології, який віддзеркалює її специфічність, слугує розподіл термінів
за відповідною ознакою. Такий паспорт назвемо профілем термінології.
Профіль це розподіл термінів за значеннями певної ознаки, тобто опис, який подає кількість термінів, які відповідають кожному значенню ознаки. Відмінності між термінологіями різних наукових дисциплін зумовлюються, перш за все, позамовними чинниками, повязаними зі специфікою предметної галузі, яка обслуговується відповідною дисципліною, концептуальним апаратом цієї дисципліни. У звязку з цим пропонується поняття референтного субстрату наукового тексту. Референтний субстрат визначається кількома чинниками: характером обєктів, методів дослідження в науковій галузі, ступенем математизації науки.
ВИСНОВКИ
У результаті дослідження структурних і термінотвірних характеристик термінів установлено, що існують чіткі відмінності між цими характеристиками термінів усіх трьох категорій, які одночасно функціонують у науковому тексті: інтрагалузевих, екстрагалузевих та загальнонаукових. Найскладнішими за структурними і термінотвірними характеристиками є інтрагалузеві терміни, найпростішими загальнонаукові. Це виявляється і в кількості їхніх структурних компонентів, і в різноманітності мовних форм, зокрема в різноманітності частиномовних моделей.
Основна відмінність між структурними і термінотвірними характеристиками інтрагалузевих термінів різних наукових дисциплін полягає, передусім,
не в наявності якихось рис, притаманних одним термінологіям і відсутніх в інших, а в кількісних співвідношеннях частот мовних форм чи продуктивності термінотвірних моделей, присутніх в усіх термінологіях. Саме в сукупності таких співвідношень і полягає відмінність між термінологіями окремих галузей чи окремих категорій. У звязку з цим запропоновано поняття термінологічного профілю, який може слугувати своєрідним паспортом термінології.
У дослідженні встановлено, що відмінності між термінологіями різних наукових дисциплін зумовлюються, перш за все, позамовними чинниками, повязаними зі специфікою предметної галузі, яка обслуговується відповідною дисципліною, концептуальним апаратом цієї дисципліни. У звязку з цим запропоновано поняття референтного субстрату наукового тексту.
У роботі було визначено ступінь подібності між чотирма досліджуваними термінологіями. Англомовна термінологія матеріалознавста та обробки металу
є найближчою до термінології штучного інтелекту.
Проблеми вивчення структурних і термінотвірних характеристик терміна мають перспективи подальших досліджень. Перспективним вважається розширення рамок дослідження за рахунок порівняння вище згаданих характеристик термінів, які функціонують у текстах різних жанрів і належать до однієї галузі знання (наприклад, до галузі аерокосмічних технологій).
ОСНОВНІ ПОЛОЖЕННЯ ДИСЕРТАЦІЇ ВІДБИТО В ТАКИХ ПУБЛІКАЦІЯХ АВТОРА:
АНОТАЦІЯ
Сліпецька В.Д. Англомовна термінологія штучного інтелекту в контексті інших терміносистем (досвід лінгвостатистичного аналізу). Рукопис.
Дисертація на здобуття наукового ступеня кандидата філологічних наук за спеціальністю 10.02.04 германські мови. Київський національний лінгвістичний університет, Київ, 2008.
Дисертація є лінгвостатистичним дослідженням структурних та термінотвірних характеристик термінів в англомовних наукових текстах
зі штучного інтелекту, матеріалознавства та обробки металу, аерокосмічної технології, фінансово-економічної справи. Проаналізовано три категорії
термінів: інтрагалузеві, екстрагалузеві та загальнонаукові. Дослідження
дозволяє стверджувати, що існує взаємозвязок між структурними, термінотвірними характеристиками та категорією термінів, їх галузевою належністю. Встановлено звязок між довжиною термінів різних категорій, галузей та їх частотою; між афіксальними моделями та категорією терміна; між термінотвірними типами та категорією терміна; між частиномовними моделями та категорією терміна. Виявлено, що основна різниця між структурними
і термінотвірними характеристиками інтрагалузевих термінів різних наукових дисциплін полягає у кількісних співвідношеннях частот мовних форм
чи продуктивності термінотвірних моделей. Встановлено, що відмінності між термінологіями різних наукових дисциплін зумовлюються, перш за все, позамовними чинниками. За результатами кластерного аналізу найближчою
до термінології штучного інтелекту виявилася термінологія матеріалознавства
та обробки металу.
Ключові слова: інтрагалузеві терміни, екстрагалузеві терміни, загальнонаукові терміни, взаємозвязок, довжина терміна, частота терміна, афіксальна модель, частиномовна модель, термінотвірний тип.
АННОТАЦИЯ
Слипецкая В.Д. Англоязычная терминология искусственного интеллекта в контексте других терминосистем (опыт лингвостатистического анализа). Рукопись.
Диссертация на соискание ученой степени кандидата филологических наук
по специальности 10.02.04 германские языки. Киевский национальный лингвистический университет, Киев, 2008.
Диссертация посвящена лингвостатистическому исследованию структурных
и терминообразующих характеристик терминов, которые функционируют
в англоязычных научных текстах по искусственному интеллекту, материаловедению и обработке металла, аэрокосмической технологии,
финансово-экономическому делу. Анализируются три категории терминов.
Данные исследования позволяют утверждать, что существует взаимосвязь между структурными, терминообразующими характеристиками и категорией терминов, его отраслевой принадлежностью. Установлена связь между длиной терминов разных категорий и их частотой; между аффиксальными моделями
и категорией термина; между терминообразующим типом и категорией термина; мeжду частеречной моделью и категорией термина.
В ходе исследования установлено, что интраотраслевые термины наиболее сложны как в структурном, так и в терминообразующем аспекте, наиболее
просты общенаучные. Интраотраслевые термины в большинстве случаев это сложные образования, состоящие из двух и более корневых морфем. Интраотраслевые термины отражают весь концептуальный аппарат научной дисциплины, охватывают все слои специальной лексики. Тенденция
к полнозначности термина приводит к появлению как семантически, так
и структурно сложных единиц. Экстраотраслевые термины представляют не весь состав терминологии смежной отрасли, а только ее ядро, к которому принадлежат частотные термины с большим когнитивным и терминообразующим потенциалом. Наиболее просты по структуре общенаучные термины. Они выражают понятия, относящиеся к методике и практике научного исследования. Термины этой категории наиболее частотны. Преимущественно это однокомпонентные единицы. Термины трех категорий различаются и продуктивностью финальных суффиксов. В интраотраслевых и экстраотраслевых терминах наиболее частотными являются
-ing и -er, в общенаучных -ion.
В процессе исследования установлено, что главное различие между структурными и терминообразующими характеристиками интраотраслевых терминов разных научных дисциплин состоит в количественном соотношении частот языковых форм или продуктивности терминообразующих моделей, имеющихся во всех четырех терминологиях. Только совокупность таких соотношений, названная терминологическим профилем, и отличает одну терминологию от другой. Профиль терминологии представляет собой объединение частных профилей терминообразующего, аффиксального, частеречного и т.д. Терминообразующий профиль фиксирует продуктивность терминообразующих моделей, аффиксальный аффиксальных моделей и т.д. Профиль может иметь форму словесного описания, таблицы или графика.
Исследование свидетельствует о том, что различия между отраслевыми терминологиями обусловлены прежде всего внеязыковыми факторами, связанными со спецификой предметной области. В связи с этим предложено понятие референтного субстрата научного текста. Референтный субстрат определяется, в частности, характером объектов и методов их исследования, степенью математизации науки. В терминологиях искусственного интеллекта, аэрокосмических технологий, финансово-экономического дела объект
науки это артефакты, в терминологии материаловедения и обработки металла вещества или результаты их обработки. Характер артефактов в трех отраслях разный: в искусственном интеллекте сложные математические или информационные модели; в аэрокосмических технологиях сложные конструкции; в финансово-экономическом деле общественные отношения. Характер науки в исследованных отраслях имеет свою специфику.
В материаловедении доминируют эмпирические исследования (описание физических или химических свойств металла). В искусственном интеллекте построение математических моделей. В связи с этим наука имеет дедуктивный характер. Математическое моделирование свойственно и аэрокосмическим исследованиям, и финансово-экономическому делу. В исследовании
определена степень сходства между терминологиями искусственного
интеллекта, материаловедения и обработки металла, аэрокосмических технологий и финансово-экономического дела. Результаты кластерного анализа свидетельствуют, что среди рассмотренных терминологий наибольшее сходство
с терминологией искусственного интеллекта имеет терминология материаловедения и обработки металла (анализировались такие характеристики: структурный тип термина, терминообразующий тип, частеречная модель, финальный структурный суффикс, аффиксальные модели).
Ключевые слова: интраотраслевые термины, экстраотраслевые термины, общенаучные термины, взаимосвязь, длина термина, частота термина, аффиксальная модель, частеречная модель, терминообразующий тип.
RESUME
Slipetska V.D. English Terminology of Artificial Intelligence in Context of Other Terminological Systems (A Linguostatistic Analysis). Manuscript.
Thesis for a candidate degree in Philology, speciality 10.02.04 Germanic Languages. Kyiv National Linguistic University, Kyiv, 2008.
This dissertation focuses on the linguostatistic study of structural and term-formation characteristics of terms that function in modern English sсientific texts on artificial intelligence, metal processing, aerospace technologies, finance and economics. Three categories of terms: intradomain, extradomain and common terms were analyzed. The data obtained prove that there is the interrelation between structural, term-formation characteristics and the respective term category. There exists the correlation between
the term length and its frequency; between the affixation models and the term category; between the part of speech models and the term category; between the term-formation type and the term category. The main difference between the structural, term-formation characteristics of the intradomain terms that belong to the four terminologies
under research lies in the frequency distribution of structural and term-formation models. The difference between four terminologies is caused by extralinguistic factors. The cluster analysis has allowed to determine the degree of similarity between the four English terminologies.
Key words: intradomain terms, extradomain terms, common terms,
correlation, term length, term frequency, affixation model, part of speech model,
term-formation type.