Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
НАЦІОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ УКРАЇНИ
"КИЇВСЬКИЙ ПОЛІТЕХНІЧНИЙ ІНСТИТУТ"
Діалло Сорі Кокума
(Гвінея)
УДК 681.3.06
Інтелектуальні компоненти для аналізу та прогнозування
ситуацій в системах підтримки прийняття рішень
(на прикладі управління підприємством)
Спеціальність: 01.05.03 - Математичне та програмне
забезпечення обчислювальних машин і систем
Автореферат
дисертації на здобуття наукового ступеню
кандидата технічних наук
Київ
Дисертацією є рукопис.
Роботу виконано в Національному технічному університеті України "Київський політехнічний інститут" на кафедрі обчислювальної техніки.
Науковий керівник: Кандидат технічних наук, доцент Пустоваров Володимир Ілліч, Національний технічний університет України "Київський політехнічний інститут", доцент кафедри
Офіційні опоненти: Доктор технічних наук, професор Кузьмук Валерій Валентинович, Інститут інформаційних і моделюючих технологій ІМТ, директор
Кандидат технічних наук, доцент Коломієць Валерій Федорович, Національний університет ім. Т.Г.Шевченка, доцент кафедри
Провідна установа: Інститут проблем моделювання в енергетиці НАН України, м. Київ, відділ спеціалізованих засобів моделювання.
Захист відбудеться " 09 " квітня 2001 р. о 14:30 годин на засіданні спеціалізованої ради Д26.002.02 у Національному Технічному Університеті України “Київський Політехнічний Інститут”(м. Київ, пр. Перемоги, 37, корп. 18, ауд. 306).
Відгуки на автореферат у двох примірниках, завірені печаткою установи, просимо надсилати за адресою: 03056, м. Київ, пр. Перемоги, 37, Вченому секретарю НТУУ “КПІ”.
З дисертацією можна ознайомиться в бібліотеці Національного Технічного Університету України “КПІ”.
Автореферат розісланий " 07 " березня 2001 г.
Вчений секретар спеціалізованої ради,
кандидат технічних наук, доцент М.М. Орлова
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми дисертації обумовлена широким використанням комп'ютерів і програмного забезпечення, що аналізує моделі об'єктів управління та відсутністю гнучких програмних засобів для аналізу та прогнозування стану слабко детермінованих об'єктів за наявності на ринку широкого спектру спеціального програмного забезпечення (СПЗ) для облікових задач.
Існуючі прикладні програми достатньо складні в експлуатації та не відповідають вимогам щодо інтерфейсу користувача, співвідношення “продуктивність-витрати ресурсів“та високої швидкості обробки великих обсягів зовнішньої інформації. Крім цього, продукти, що поширюються комерційно, не мають чітко специфікованих або визначених засад побудови і тому не завжди ефективні у сполученні з іншими продуктами. Тому як і раніше необхідна розробка формалізованих технологій для комплексного розв'язання всіх задач, пов'язаних з аналізом, оцінкою та прогнозуванням поточного стану системи для підготовки інформації та підвищення рівня автоматизації в системах підтримки прийняття рішень.
Таким чином розробка і дослідження способів і засобів побудови гнучкого СПЗ управління та збору даних є актуальною в різних галузях господарства і має теоретичне і практичне значення.
Зв'язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалась у розвиток робіт за державною науково-технічною програмою “Сучасні інформаційні технології в створенні інтегрованих виробничих комплексів”тема “Розробка, дослідження та застосування засобів інтелектуалізації в процесі проектування баз даних та прикладних програм в автоматизованих системах на базі ПЕОМ”(№ держреєстрації 0195u008180, 1994-96 рр.) та в рамках робіт напрямку “Перспективні інформаційні технології, прилади, системи зв'язку”, що виконувались на кафедрі обчислювальної техніки НТУУ “КПІ”в 1997-1999 рр.
Мета і задачі дослідження. Метою дисертаційної роботи є покращення характеристик СПЗ збору та фільтрації корисної інформації для розширення можливостей адаптації та реконфігурації за призначенням і ситуацією систем прогнозування та прийняття рішень з керування слабко детермінованими системами на базі технічних методів інженерії знань.
Об'єктом дослідження є СПЗ систем обліку і прогнозування. Предметом дослідження є вивчення можливості побудови та використання інтелектуальних компонент для поліпшення характеристик СПЗ. Основні задачі дослідження у відповідності з поставленою метою полягають у наступному:
Провести аналіз існуючих моделей відтворення даних для задач обліку ресурсів типової автоматизованої системи прогнозування та оптимізації добору рішень для схожих структур даних та задач через використання в репозитаріях характеристик ресурсів та автоматизацію генерації варіантів рішень з метою визначення перспективних технологій.
На основі застосування апарату семантичних мереж та принципу адекватної відповідності структури задач СПЗ переліку даних, що накопичуються та обробляються в системі прогнозування стану слабо детермінованих об'єктів (на прикладі управління підприємством) розробити методику побудови засобів швидкої реорганізації програмної системи з реконфігурацією аналітичних зв'язків, алгоритмів та процедур прогнозування перспективного розвитку стану системи управління.
З метою динамічного накопичення інформації в базі знань системи прогнозування та прийняття рішень систематизувати, розробити та дослідити ефективні способи та алгоритми інженерії знань для фільтрації, класифікації та сортування даних на основі методів логічного доведення відповідності критеріям фільтрації, що забезпечують збільшення швидкості обробки великих обсягів даних.
На основі обраних структур даних та СПЗ розробити методику адекватного настроювання сценаріїв виконання узагальнених задач системи обліку та прогнозування через багаторежимні діалогові оболонки для підтримки прийняття рішень з використанням графічного інтерфейсу.
Основними практичними задачами дисертаційної роботи є розробка методики для узагальнення комплексу програм автоматизованої системи управління і прийняття рішень, зручної для експлуатації при мінімальних витратах ресурсів на базі багатовіконного та багаторежимного інтерфейсу користувача, а також забезпечення гнучкості розробленого СПЗ.
Методи дослідження дисертації використовують засади теорії реляційних баз даних, теорії множин та теорії графів, теорію та методи інженерії знань на основі використання семантичних мереж.
Наукова новизна одержаних результатів та теоретична спрямованість дослідження визначається розробкою використанням удосконалених моделей та методів для побудови СПЗ слабо детермінованих систем:
систематизовані та класифіковані проблеми моделювання і розробки методів програмування, що виникають при розробці СПЗ систем обліку, прогнозування та прийняття рішень;
спираючись на принцип відповідності задач наявним структурам даних, удосконалено комплексну модель структур даних та програмних модулів узагальненого СПЗ, що відрізняється використанням методу семантичних мереж для формалізованої і автоматизованої побудови і перебудови СПЗ;
запропоновано новий метод для прискореного пошуку, фільтрації та класифікації інформації, що відрізняється використанням багаторівневих словників та часткового кодування неструктурованих даних і дозволяють скоротити час попередньої обробки та фільтрації даних.
Практичне значення одержаних результатів визначається побудовою на основі теоретичних результатів конкретних практичних методик настроювання для широкого використання, а також розробкою проблемних програмних систем збору та обробки даних для розширення можливостей їх використання в системах, побудованих на базі засобів автоматизації розробки діалогових проблемних програм:
Розроблено методику побудови мінімізованих і систематизованих семантичних таблиць, довідників і словників, що склало основу формалізованої побудови сценаріїв функціонування програмної системи.
Розроблено методику побудови узагальненої багатовіконної і багаторежимної системи інтерфейсів користувача на базі візуальних засобів програмування, що враховує особливості управління та прийняття рішень в слабо детермінованих системах.
Практичні результати роботи та методики були використанні для побудови СПЗ в навчальному процесі на кафедрі обчислювальної техніки в лабораторних роботах циклів курсів, пов'язаних з вивченням систем штучного інтелекту.
Для настройки сучасних діалогових оболонок реалізовано розширення, основане на систематизації режимів роботи за координатним методом; розроблено підсистему перебудови багатовіконних та багаторежимних інтерфейсів користувача. Розроблений алгоритм управління автоматизованим нормалізованим збором та фільтрацією інформації від зовнішніх джерел, а також обробки початкових та розрахункових даних. З використанням мови програмування високого рівня C++ та мови текстових запитів розроблено комплекс процедур і функцій для прийняття рішень при фільтрації та реєстрації прийнятої інформації з відкиданням непотрібних даних.
Особистий внесок здобувача. Основні результати, одержано автором самостійно. Автору належить:
Спосіб аналізу альтернативних варіантів моделей в системі прийняття рішень з прогнозуванням стану слабо детермінованого об'єкту, що використовує апарат семантичних мереж для відтворення істотних статичних та динамічних компонентів моделі.
Удосконалена комплексна модель структур даних та програмних модулів для задач обліку і прогнозування з використанням методу семантичних мереж для підтримки адекватної відповідності структур даних та алгоритмів при перебудові спеціального програмного забезпечення.
Метод інтелектуалізації автоматичного збору і фільтрації інформації від зовнішніх джерел з самонастройкою, що використовується для досягнення концептуальної мети системи.
Методика побудови спеціальних діалогових оболонок, заснована на розширенні стандартних графічних системних інтерфейсів та інтерфейсів користувача з використанням методів штучного інтелекту.
Апробація результатів дисертації. Робота доповідалась на 4-й міжнародній конференції "Теория и техника передачи, приема и обработки информации" в м. Туапсе у 1998 р. та на міжнародній конференції “Проблеми фізичної та біомедичної електроніки”р. у м. Києві та на наукових семінарах кафедри обчислювальної техніки НТУУ “КПІ”.
Публікації. За темою дисертаційної роботи у виданнях, що відповідають переліку ВАК, опубліковано чотири статті, у яких висвітлені основні результати роботи.
Структура та обсяг дисертації. Дисертаційна робота складається з вступу, чотирьох розділів, заключної частини та додатків, що складає 157 сторінок друкованого тексту, включає 17 рисунків, 8 таблиць, список використаної літератури на 137 назв.
ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі визначено задачі та спрямованість досліджень.
В першому розділі визначено наявність проблем у таких областях технологій інформаційних систем, як швидка перебудова і адаптація програмного забезпечення для потреб конкретного споживача в у мовах динамічної зміни потоків даних та задач, що оброблюються в інформаційних системах, а також при збиранні зовнішньої інформації для розв'язання задач прогнозування та прийняття рішень.
Програмне забезпечення СУБД, що використовується для управління слабо детермінованими об'єктами, традиційно виконує множину схожих дій, що реалізують облікові операції або транзакції (transaction). Обсяг облікових операцій визначається структурою та обсягом інформації в базі даних (БД), розроблюваної за вимогами контролюючих фінансових і податкових інстанцій у відповідності з потребами підприємства у поточній ситуації. Сучасні засоби візуального програмування дозволяють будувати і модифікувати вхідні форми і формати відтворень та документів окремо для транзакцій ti О T (T={ti}, i=1,…, n) кожного типу, що підлягає обліку. В більшості випадків ці задачі достатньо схожі між собою. Це є основою для добору зручних методів генерації програм на базі шаблонів класів P і функцій.
Дані та задачі обліку можуть бути ізоморфно представлені на основі єдиного багаторівневого дерева, графа або мережі. Ізоморфність визначається тим, що всі зовнішні операції системи виконуються на чітко розмежованих рівнях і на яких обробляється чітко визначений підтип даних Pi. Тому один із шляхів автоматизації перебудови СПЗ для систем обліку з можливостями прогнозування та прийняття рішень полягає в систематизації даних і програм обліку ресурсів підприємства та створенні узагальнених програмних модулів для збору, контролю введеної інформації і розв'язання задач оперативного та перспективного управління.
У формалізованій формі задачу збору можна визначити наступним чином: для попередньо визначеного комплексу проблемних програм П визначити необхідний комплекс інтелектуальних компонент і засобів (ІКЗ), що забезпечують ефективне функціонування такої системи. Особливу увагу в роботі приділено компонентам, що змінюють конфігурацію задач та забезпечують накопичення істотної інформації для розв'язання задач системи.
В другому розділі запропоновано моделі предметної області на основі систематизації і структуризації основних дій підсистем аналізу стану підприємства на основі метода семантичних мереж. Основу моделі предметної області складає відображення характеристик динамічності змін матеріальної цінності M ресурсів, що підлягають обліку, та характеристик активності A даних в декартовому просторі координат (див. рис. 1)
Воно виконано за двома обраними базовими напрямками систематизації даних: характеристикам матеріальної цінності ресурсів, що під-лягають обліку, характеристикам активності даних, що аналізуються, у транзакціях системи обліку. Матеріальна цінність ресурсів зростає від малих значень для ресурсів, що використовуються оперативно (як-то боргові та дебіторські зобов'язання підприємств), через середні значення для звичайних ресурсів (наприклад, фінансових), до великих значень у обладнання системи (або основних фондів підприємства).
Ns13 M
r=3
Ns12 Ns22 … r=2 … Ns72
r=1
Ns61
r=1
Ns11
A
задачі обліку, що використовують тільки підпорядковані дані;
задачі, що використовують власні та підпорядковані дані;
M вісь матеріальної цінності; A вісь активності.
Рис.1. Схема задач обліку і прогнозування слабо детермінованого об'єкту разом з даними
Структурні вузли Nsir мережі включають в себе підлеглі вузли нижчого рангу Nsj,r-1. Таким чином, відображення є семантичною мережею (СМ), обраної основою комплексної моделі структур задач та даних. Вона організується через багатоярусні структурні вузли з використанням принципів самосхожості, тобто схожості ієрархії об'єктів та її окремих елементів на різних рівнях. Вузли, що відображають дані схожих типів і форматів, розміщуються в сусідніх позиціях по горизонталі або вертикалі. Одиниці виміру та кількісно-якісна оцінка будь-якої частини мережі визначаються за допомогою додаткових атрибутних вузлів Naj. Інша частина атрибутних вузлів визначає комплекси координат за напрямками аналізу і систематизації вхідних даних. Така СМ дозволяє через програми аналізу стану організувати семантичну відповідність стану поточним даним, одержаним в структурних вузлах мережі.
Ранг r визначає рівень ієрархічної підлеглості, на якому знаходяться задачі та відповідні дані, і може розглядатися як третій напрямок систематизації. Ранг зменшується при розгалуженні графу. Він визначає узагальнення задач, повноваження доступу до даних та можливі пункти меню при розв'язанні окремих задач. Таким чином, булівський вектор операцій Oj(r) кожної задачі визначається її координатами у мережі за шириною та за глибиною багаторівневого дерева з рангом r. При зростанні рангу операції підвищується кількість одиниць у булівському векторі Oj(r). Наведена систематизація узагальненої структури програм і даних системи керування слабо детермінованим об'єктом у формі вузлів Nsir семантичної мережі є основою для впорядкованого розміщення базових функцій системи обліку та аналізу стану в комірках таблиць БД і БЗ та дозволяє визначити такі складні та групові структури даних через додаткові напрямки класифікації.
Задача збору зовнішньої інформації для системи обліку та прогнозування стану слабо детермінованого об'єкту потребує додаткової моделі представлення та обробки даних, формалізованої в такий спосіб. Множина об'єктів W={wi}, i=1..n, що аналізуються, відтворюється у вигляді текстів на природних мовах та мовах скриптів wi=wxi (слів тексту wi=Wi, словосполучень wi=…Wi,k-1WikWi,k+1…, чисельних даних wi=Ri), текстів таблиць wi=wti, їх полів wi=Fi або їх комбінацій wi=…wtik wtik+1 ...
Для керування відбором інформації необхідно визначити ознаки або шаблони взірців, що розрізнюються P={pj}, j=1..m в формі фактів pj=pfj, правил pj=prj або критеріїв pj=pkj. Звичайно факти відтворюються в формі логічних виразів, що включають константні та узагальнюючі елементи, а правила включають зв'язані логічні відношення з узагальнюючими змінними об'єктами. Критерії pkj, крім перелічених даних, включають синтаксичні та семантичні характеристики елементів текстів та таблиць c(Wi) і c(Fi) та обмежуючі або цільові функціонали. Правила, факти і критерії розміщуються в БЗ B = (Иjpfj) И (Иjprj) И (Иjpkj), а їх ключові, розрізнюючі та квантифікуючі (що визначають значимість) елементи Wi - в словниках або довідниках DW, що зберігають синтаксичну і семантичну інформацію про ці елементи.
DW = {W1,W2,… Wl,…WL}, l = 1..L.
Елементи словників утворюють ієрархію, на нижньому рівні якої розміщуються слова або кодові відтворення даних. Задачу відбору фрагментів об'єктів, що аналізуються, за визначеним критерієм часто називають фільтрацією, яка визначається узагальненою формулою:
KW = f(DW, B, P),
де f узагальнена логічна функція або предикат. Підготовка фільтра до роботи виконується через визначення критеріїв шляхом конкретизації функції f з використанням БЗ B. Функція f може бути розширена визначеннями обмежень.
З дотриманням повної аналогії зі словниками DW і критеріями фільтрації KW за синтаксичними ознаками слів керуюча інформація для задач аналізу та прогнозування стану будується в формі таблиць актуальності інформації DT і критеріїв відбору істотної частини актуальної інформації KT. Схожим способом можна побудувати таблиці критеріїв відбору зовнішньої інформації KS з попереднім ранжуванням джерел DS за їх важливістю та істотністю для прогнозування стану комп'ютеризованої системи управління слабо детермінованими об'єктами.
При фільтрації та відборі інформації основу програм складає розв'язання задачі пошуку через послідовність операцій просування по множині інформаційних об'єктів W і порівняння об'єктів пошуку wi з еталонами за правилами pj, серед яких можна знайти потрібний варіант за критерієм схожості (найкращий, достатньо близький, тощо). Підбір критеріїв з використанням ключових слів як синтаксичних ознак при семантичній фільтрації дуже рідко призводить до одержання інформації прийнятного змісту і обсягу. Для усунення цього недоліку в роботі запропоновано і розроблено метод розрізнення, що використовує взірці ключових слів з комплексом вагових характеристик, що визначаються за семантикою слів. За базовими ключовими словами Wb інформація повинна аналізуватися безумовно, а за додатковими ключовими словами Ws кількість розрізнених слів NWs повинна перевищити деякий поріг частоти включень, звідки випливає необхідність перевірки нерівності NWs і Nmin, де Nmin мінімально необхідна кількість входжень додаткових ключових слів.
Інформаційний запит являє собою сформульовану аналітиком або адміністратором системи чи самою системою вимогу, що частково висловлює умови відбору того чи іншого документу з зовнішніх джерел. Для розв'язання задач пошуку за запитом у відповідності з традиціями будемо використовувати деяку спеціальну мову запитів Q={Qk}, k=1..K, яка дозволяє відтворити будь-яку сукупність критеріїв K={KT, KS, KW, Kr}, що відповідає цілям задачі та забезпечує достатню точність відбору інформації за ключовими словами, подіями та контрольними відношеннями. Основним завданням таких мов є розрізнення події визначення необхідних семантичних ознак на рівні слів, груп слів або чисельних даних у визначеному вікні аналізу (прогляду), яке у інформаційній мережі може бути поточною web-сторінкою. Схожі запити можуть задаватися і в термінах мови SQL через операції порівняння рядків з наперед визначеними шаблонами.
В подальшому основні та додаткові слова, що сприяють меті видобування інформації, будемо позначати Wbp і Wsp, а базові слова, що забороняють видобувати поточну інформацію будемо позначати Wbn і Wsn. При зчитуванні документів, що зберігаються в глобальних мережах або на web-сторінках система автоматично перевіряє наявність або відсутність взірців ключових слів у вікні перегляду у відповідності з відношенням, що визначається узагальненім критерієм відбору:
KW = Иi F($ Wbp , $Wsp, (Wbp О wi Ъ Wsp О wi) Щ Wbn П wi Щ Wbn П wi).
Якщо для якогось блоку даних визначається наявність взірців, що відповідають цій умові, то документ вважається таким, що відповідає наданому інформаційному запиту і надається для подальшої обробки. Якщо множина кодів Cw, що включають синтаксичні ознаки складається в свою чергу з трьох підмножин:
Cw = {c(Wb), c(Ws), c(Wf)},
де c функція кодування синтаксичних і семантичних ознак, а Wf інформація з чисельних полів, то необхідна і достатня умова видачі документа з системи визначається такою формулою:
Wo = Wb И Ws З Wf.
Такі семантичні характеристики слова як його тип, клас та місце в групі схожих понять зберігаються в словнику разом з еталонами базових слів. Це дозволяє аналізувати не тільки синтаксичні, але й семантичні критерії відбору, що задаються за допомогою семантичних характеристик у вигляді функціоналів.
В третьому розділі представлено розроблені методи проектування інтелектуальних компонент СПЗ. Як основа удосконалення методів проектування інтелектуальних компонент СПЗ запропоновано загальний двохетапний алгоритм збирання неструктурованої інформації від зовнішніх джерел. На першому етапі попередньої або первинної фільтрації використовується механізм пошуку, заснований на системі словників ключових слів і термінів предметної області, на природних мов і мовах протоколів маркування та передачі гіпертекстів HTML або HTTP. На цьому етапі відібрані фрагменти повторно скануються за допомогою спеціальних шаблонів для розрізнення та класифікації фактичної та корисної інформації подальшим розподілом даних по спеціальних полях БД та БЗ для обробки і використання в процесі аналізу та прогнозування стану об'єктів обліку.
Для розв'язання задач пошуку і добору найкращих варіантів, що відтворює собою узагальнений зміст інтелектуальних компонент розроблено узагальнену методику побудови, налагодження та експлуатації програмного забезпечення, побудованого за схемою інтелектуальних компонент. Методика проектування і налагодження включає:
1. Добір та аналіз множини можливих запитів до інтелектуальної компоненти.
. Вибір множини джерел зовнішньої та внутрішньої інформації для інтелектуальної компоненти.
. Класифікація та ранжування джерел інформації за характеристиками надійності та коректності.
4. Визначення методики декомпозиції даних для організації їх перегляду.
. Формування або реконфігурація еталонів і взірців для аналізу даних у вікнах перегляду, зафіксованих форматів.
. Маркування та кодування фрагментів картин у вікнах перегляду, де було знайдено фактичну інформацію у вигляді еталонів і взірців за попередньо визначеними критеріями.
. Підготовка позначених фрагментів до наступних етапів аналізу за ознаками більш високих рівнів.
. Декодування або реконструкція корисних фрагментів картини проблемної області та класифікація віднайденої інформації за додатковими шаблонами і критеріями.
. Визначення напрямків розподілу зібраної та і класифікованої інформації.
. Аналіз попередньої інформації для поновлення БД і БЗ для їх подальшого використання в процесі обліку, аналізу і прогнозування стану слабко детермінованого об'єкту і прийняття рішень.
Методика експлуатації інтелектуальних компонент передбачає ті ж самі дії, що мають місце на етапах побудови і перебудови компонент. В роботі у формі конкретизації загальної методики розглянуто часткові методики пошуку та розподілу чисельних даних та пошуку та фільтрації у неструктурованих текстах.
Запропоновано реалізувати засоби прискореного пошуку інформації за рахунок ефективної побудови простих і складних операцій віртуальної машини пошуку, що використовуються в інтелектуальних компонентах. Прості операції забезпечують швидке виконання елементарних порівнянь, а складні швидке просування в просторі пошуку. Інші напрямки побудови інтелектуальних компонент складають методики заповнення БД і БЗ та визначення якісних характеристик шаблонів та взірців.
Щоб скоротити витрати на пошук важливо аналізувати семантичні, а не синтаксичні ознаки слів і словосполучень. Тому виникає доцільність заміни ключових слів спеціальним внутрішнім відтворенням з частковим кодуванням тексту, що дозволяє використати для пошуку порівняння семантичних полів закодованих фрагментів. З одного боку це полегшує пошук серед синонімів та квантифікованих понять, а також словоформ у флективних мовах (наприклад, в українській або російській), а з іншого боку потребує попереднього кодування тексту і його декодування при реконструкції для відображення.
Тенденція спрощувати роботу технічних виконавців та осіб, що приймають рішення в системах керування та на підприємствах, які є головними користувачами інформаційних систем управлення, необхідність швидкого усвідомлення інформації, а також створення і складання різних варіантів рішень викликає необхідність проектування зручного інтерфейсу користувача.
СПЗ реалізує типові дії розрізнення і цілеспрямованого пошуку. В розробленому СПЗ головну роль грають його інтелектуальні компоненти, найважливішими з яких є наступні:
В четвертому розділі розглянуто питання практичної реалізації програмного забезпечення системи та експериментальних досліджень. Багаторівневі оболонки для таких систем звичайно будують з урахуванням всіх особливостей динамічних систем обробки складних даних. Для відображення моделей об'єктів слабо детермінованої системи на панелі і основній частині робочої області монітора необхідно організувати їх структуру таким чином, щоб вони були прямо або не прямо досяжні для користувача під час його інтерактивного спілкування з системою. Для досягнення цієї мети розроблюється загальне програмне забезпечення інтерфейсу користувача і спеціальне середовище обробки.
Сценарії (scripts), які створюються за послідовністю альтернативних директив обраного режиму роботи системи xi, що відповідають кожній альтернативній дії, генерують меню Mir різних рівнів і включає списки об'єктів, що представляють групу доступних користувачу дій, які, в свою чергу, впорядковуються зліва направо за ступенем важливості і частотою використання. У випадку, коли обраний об'єкт має декілька функцій меню або підменю, ці функції розміщуються у вікні, яке з'являється при встановленні курсору на обраний об'єкт меню. Функції підміню також впорядковані за їх важливістю і частотою звертання згори до низу. Кожний пункт меню разом з підменю відповідає структурному атрибуту семантичних мереж. При виборі тієї чи іншої функції з'являється спливаюче вікно, яке зникає після виконання користувачем необхідних дій. Потрібно зауважити, що функції меню по можливості не повинні пересікатися або дублюватися:
card() nmax & card() nmin
де f і f - функції меню Mir і Mjr; nmax і nmin- мінімальна та максимальна кількість елементів меню.
Загальна структура ПЗ дозволяє обрати потрібне завдання, ввести дані для його виконання і визначити потрібний режим роботи за введеним повідомленням. Підказки виводяться в вигляді форматів меню, що визначається наступну однозначну відповідність:
TRSMX.
В процесі розв'язання задач і прийняття рішень необхідно, щоб були наочно відтворені всі моделі взаємопов'язаних об'єктів керуючих даних X, що складають сценарій дій, висловлений у формі послідовності директив меню M, задач T, сигналів (подій) S і правил R.
Часова складність виконання пошуку в тексті довжиною N символів, що відтворюється кодами літер і подільників (частіше за все ASCII або unicod), оцінюється за середньою кількістю односимвольних порівнянь, необхідних для знаходження ключових слів з j-го шаблона пошуку або словника термінів, в якому зберігається Kj слів. Часові витрати на пошук наявності одного слова в тексті або фрагменті тексту розраховується наступним чином:
Tf = ts N Kj (1+(nj-1)k),
де nj середня кількість символів в слові; k коефіцієнт наявності символів слова в кирилиці k @1+1/32. Якщо поділити весь текст на kw вікон пошуку з розміром Nw символів та виконати ефективно через швидке сканування подільників, використати ефективний метод пошуку в словнику окремо для кожного слова. В такому випадку часова складність порівняння при кодуванні оцінюються як:
Tfcodw Ј(pj (1+(nj-1)k)Kj +(nj-1)log2Kj ),
де pj ймовірність визначення наявності відповідного ключового слова в тексті, що включає N символів.
Аналіз формул і проведені експерименти дозволили визначити область ефективного використання розроблених методів фільтрації.
Висновки та основні результати
1. З використанням апарату логічного доведення систематизовано методи комплексного аналізу семантичних мереж даних, правил і задач типової автоматизованої системи обліку, що включають в себе аналіз схожості вузлів та розгалужень дерев задач за методом семантичних мереж для даних системи обліку. Це забезпечує зниження трудомісткості програмування слабо детермінованих систем і раціональний добір методів аналізу і прогнозування з можливістю добору альтернативних варіантів рішень.
. Розроблено нові методи та алгоритми керованого збору та дворівневої фільтрації корисної інформації від зовнішніх інформаційних джерел і її розміщення в БД і БЗ інтелектуальних компонент на основі часткових словників термінів, що забезпечують високу швидкість фільтрації і підвищення ефективності розв'язання задач пошуку і фільтрації істотної інформації. Розроблені методи відрізняються використанням правил, що відтворюються за допомогою словників предметної області в формі метазнань, необхідних для роботи СПЗ.
. На базі ієрархічного підходу до структурування програм розроблено структуру ядра СПЗ керуючої системи, що полегшує автоматизовану перебудову зв'язків компонент і відрізняється розміщенням модулів зі схожим цільовим призначенням і з мінімальними взаємними зв'язками на одному рівні ієрархії. Розроблена структура придатна для використання створених алгоритмів і програм автоматичного збору інформації і заповнення БД та БЗ з внутрішніх і глобальних мережних джерел корисної інформації.
. Проведено експерименти з розробки інтелектуальних компонент СПЗ, що показали збереження швидкості обробки і покращання характеристик гнучкості і функціональності комплексу програм інтелектуальних компонент обліку та прогнозування.
. Для побудови діалогових оболонок СПЗ, що розроблюється, запропоновано структуру даних та модулів для узагальнених задач обліку. Обрані діалогові оболонки генеруються за стандартними методиками побудови узагальнених інтерфейсів користувача, здатних працювати в різних режимах за схожими сценаріями.
. Проведено порівняльний аналіз оцінок часу обробки інформації при використанні різних способів її відтворення, що показало доцільність використання попереднього перетворення інформації в умовах багаторазових запитів до одного комплексу документів.
Основні результати дисертації опубліковані в наступних роботах:
1. Диалло С.К. Построение обобщенного программного обеспечения для систем учета // Вісник Національного Технічного Університету України “КПІ”. Інформатика, управління та обчислювальна техніка. - К.: ТОВ “ВЕК+”. - 1998. - №31. - с. 258-266.
2. Диалло С.К. Оптимизация структур данных и программ накопления данных в информационных системах с внешними связями // Вісник Національного Технічного Університету України “КПІ”. Інформатика, управління та обчислювальна техніка. - К.: ТОВ “ВЕК+”. - 1999. - №32. - с. 99-109.
3. Диалло С.К. Моделирование процессов фильтрации неструктурированных данных в интеллектуальной компоненте систем учета и прогнозирования // Вісник Національного Технічного Університету України “КПІ”. Інформатика, управління та обчислювальна техніка. - К.: ТОВ “ВЕК+”. - 2000. - №33. - с. 39-46.
4. Диалло С.К. Пустоваров В.И. Обобщенные методы сбора информации из компьютерных информационных сетей для управления предприятием // Вісник Національного Технічного Університету України “КПІ”. Інформатика, управління та обчислювальна техніка. - К.: ТОВ “ВЕК+”. - 1999. - №32. - с. 117-126.
Діалло Сорі Кокума. Інтелектуальні компоненти для аналізу та прогнозування ситуацій в системах підтримки прийняття рішень (на прикладі управління підприємством). рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 01.05.03 - Математичне та програмне забезпечення обчислювальних машин і систем. Національний Технічний Університет України "Київський Політехнічний Інститут", Київ, 2001.
Дисертація присвячена розробці удосконалених методів побудови спеціального програмного забезпечення (СПЗ) для розширення можливостей перебудови систем прогнозування та прийняття рішень з керування слабко детермінованими системами на базі технічних методів інженерії знань.
Ключові слова: спеціальне програмне забезпечення, системи прогнозування та прийняття рішень, слабко детерміновані системи, інженерія знань.
Диалло Сори Кокума. Интеллектуальные компоненты для учета и прогнозирования в системах поддержки принятия решений (на примере управления предприятием). рукопись.
Диссертация на соискание ученой степени кандидата технических наук по специальности 01.05.03. Математическое и программное обеспечение вычислительных машин и систем. Национальный Технический Университет Украины “Киевский Политехнический Институт”, Киев 2001.
Диссертация посвящена разработке усовершенствованных методов построения специального программного обеспечения (СПО) для расширения возможностей перестройки систем прогнозирования и принятия решений по управлению слабо детерминированными системами на основе технических приемов инженерии знаний.
На основании теории и методологии логического вывода систематизированы методы комплексного анализа семантических сетей данных, правил и задач типовой автоматизированной системы учета, включающие в себя анализ сходства узлов и ветвей деревьев задач методом семантических сетей для данных системы учета. Разработана методика оценки и прогнозирования состояния предприятий на основе тщательного изучения динамики изменения групп показателей, целевых характеристик или коэффициентов, входящих в критерии отбора информации и принятия решений. Предложен способ анализа альтернативных вариантов моделей в системе принятия решений с прогнозированием состояния слабо детерминированного объекта, использующей аппарат семантических сетей для воспроизведения существенных статических и динамических компонентов модели. На основании предложенного способа анализа построена усовершенствованная комплексная модель структур данных и программных модулей для задач учета и прогнозирования с использованием метода семантических сетей для поддержки адекватного соответствия структур данных и алгоритмов при перенастройке СПО.
Усовершенствованы методы и алгоритмы управляемого сбора и фильтрации полезной информации от внешних информационных источников и ее размещения в БД и БЗ интеллектуальных компонент на основе частичных словарей терминов, обеспечивающих высокую скорость фильтрации существенной информации и повышение эффективности решения задач поиска. В основу усовершенствованных методов положена интеллектуализация автоматического сбора и фильтрация информации от внешних источников с самонастройкой, используемой для достижения концептуальной цели системы. Разработанные методы отличаются использованием правил, представленных с помощью словарей предметной области в форме метазнаний, необходимых для работы СПО.
С использованием иерархического подхода к структурированию программ выбрана структура СПО управляющей системы, облегчающая автоматизированную перенастройку связей компонент и отличающаяся размещением модулей со сходственным целевым назначением и с минимальными взаимными связями на одном уровне иерархии. Предложена методика автоматизированного построения специальных диалоговых оболочек, основанная на расширении стандартных графических системных интерфейсов и интерфейсов пользователя с использованием методов инженерии знаний. Разработана структура ядра СПО, ориентированная на работу в сочетании с современными глобальными сетевыми технологиями, как источником полезной информации для контроля ситуации и прогнозирования. Для разработанной структуры созданы алгоритмы и программы автоматического сбора информации и заполнения БД и БЗ из сетевых источников.
Проведены эксперименты по разработке интеллектуальных компонент СПО, показавшие сохранение скорости обработки и улучшение характеристик гибкости и функциональности комплекса программ интеллектуальных компонент учета и прогнозирования. Проведен сравнительный анализ оценок времени обработки информации при использовании разных способов ее воспроизведения, что показало целесообразность использования предварительного преобразования информации в условиях многократных запросов к одному комплексу документов.
Ключевые слова: специальное программное обеспечение, системы прогнозирования и принятия решений, слабо детерминированными системами, инженерия знаний.
Diallo Sory Kokouma. The intellectual components for the accounting and forecasting in decision support systems (on an example of enterprises managing). - Manuscript.
Thesis for a Ph.D degree by the specialty 01.05.03. - Mathematical both software of computers and systems. National Technical University of Ukraine " Kiev Polytechnic Institute ", Kiev 2001.
The aim of the thesis is devoted to an elaboration of improved methods to construct a special software (SS) for the extension of possibilities of modification of forecasting and decision systems serving of poorly determined systems based in handle of knowledge engineering.
Key words: elaboration, special software, forecasting and decision making, poorly determined systems, knowledge engineering.