Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

Подписываем
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Предоплата всего
Подписываем
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ
“КИЄВО-МОГИЛЯНСЬКА АКАДЕМІЯ”
Департамент компютерних технологій
Кафедра інформатики
Реферат з курсу:
“ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ ІНТЕЛЕКТУАЛЬНИХ СИСТЕМ”
за осінній триместр 1999/2000 навчального року
ДСМ-МЕТОД
студентки ДКТ-5
Федосової Н. Є
Київ 1999
[1] Зміст. [2] Вступ. [3] Загальний опис ДСМ-методу. [4] ДCМ-метод автоматичного породження гіпотез (ДСМ-АПГ). [4.1] Схожість. [4.1.1] Загальні визначення. [4.2] Правила. [4.2.1] Простий метод. [4.2.2] Правила І роду [4.2.3] Правила ІІ роду. [4.3] Розмірковування. [5] Висновок. [6] Література. |
ДСМ-метод виник із спроб формалізувати індуктивну логіку Дж. С. Мілля засобами багатозначної логіки предикатів. В подальшому, однак, ДСМ-метод розвинувся в компютерну систему, що використовує множину оригінальних ідея відносно природи правдоподібного виведення.
Введемо три множини: причин А = {a1, …, ap}, наслідків B = {b1, …, bp} та оцінок Q = {q1, …, qp}. Вираз вигляду aі => bj; qk будемо називати позитивною гіпотезою (h+i j k). Вираз повязано з твердженням типу “ai є причиною bj з оцінкою достовірності qk”. Вираз вигляду ai ?> bj; qk будемо називати негативною гіпотезою (hi j k). Його повязано з твердженням типу “ai не є причиною bj з оцінкою достовірності qk”. Серед значень qi виділимо два спеціальних, які можна позначити 0 та 1. Значення 0, приписане позитивній або негативній гіпотезі, означає, що відповідне твердження є хибним. Приписування гіпотезам значення 1 означає, що дана гіпотеза є тотожно істинною. Всі інші оцінки, відмінні від 0 та 1, будемо позначати раціональними числами вигляду s/n, де s пробігає значення від 1 до n 1. Величина n характеризує “дробність” оцінок достовірності, що використовуються. Чим більше n, тим з більшою точністю оцінюється достовірність гіпотез.
Причини можуть бути різними за своїм типом. Найбільш рідкими є необхідні та достатні причини. Якщо аі причина такого типу, то bj відбувається завжди, та якщо bj відбулося, то було аі. Частіше зустрічаються достатні причини, що завжди викликають появу bj. Але поява bj не є стовідсотковою основою того, що до цього було аі. Наслідок bj міг бути викликаним якимись іншими достатніми причинами.
Додаткові причини мають ту властивість, що їх наявність не викликає наслідок bj. Для того, щоб зявилося bj, необхідна наявність певного набору додаткових причин, яких виступає в ролі узагальненої достатньої причини появи bj. Серед додаткових причин можуть бути необхідні додаткові причини. Їх входження до набору, що утворює узагальнену достатню причину, обовязкове для того, щоб bj реалізувалося. Інші додаткові причини можна назвати факультативними. До кінцевого набору можуть входити ти чи інші комбінації факультативних причин. Нарешті, можливі причини аі мають ту властивість, що поява аі необовязково викликає bj, але збільшує можливість появи bj.
Крім причин аі важливу роль в процесах реалізації причинно-наслідкових залежностей відіграють так звані гальма. Наявність гальм, разом з причиною, що викликає bj за звичайних умов, приводить до того, що bj не зявляється.
Повернемося до ДСМ-методу. Розглянемо групу позитивних прикладів. Знаходимо деяку частину опису обєктів, загальну для певної сукупності прикладів з цієї групи. Зявляється кандидат в причини. Таких кандидатів може бути декілька. Утворимо матрицю М+, в якій рядки відповідають виділеним кандидатам аі, а стовпчики наслідки bj, що нас цікавлять (при одному наслідку, що нас цікавить в М+ буде один стовпчик). На перетині рядків і стовпчиків будемо записувати оцінки достовірності qk гіпотез h+i j k. Для множини негативних прикладів будується інша матриця М, в якій містяться оцінки достовірності негативних гіпотез hi j k. Кандидати в причини в матрицях М + та М можуть частково співпадати.
На кожному кроці роботи ДСМ-методу використовуються нові спостереження, що поповнюють множини позитивних та негативних прикладів. Ці нові спостереження можуть або підтверджувати сформовані гіпотези h+i j k та hi j k, або суперечити їм. В першому випадку треба збільшувати оцінки достовірності відповідних гіпотез, а в другому зменшувати їх. Механізм зміни оцінок qk в ДСМ-методі влаштовано наступним чином. Значення n співпадає з кількістю позитивних чи негативних прикладів, що є у нас в даний момент. Таким чином, для М+ та М значення n може бути різним. Зі збільшенням n росте “дробність” оцінок достовірності. Оцінка 1/n відіграє особливу роль. Вона відповідає повній невизначеності про достовірність гіпотези. Тому в початковий момент М+ та М заповнені лише нулями, одиницями та оцінками 1/n. Значення істини та хиби можуть мати гіпотези, у яких в якості причин дано повні описи обєктів, що утворюють множини прикладів.
Якщо деяка позитивна чи негативна гіпотеза hi j k мала оцінку k/n, то при появі нового прикладу (n замінюється на n + 1) перевіряється підтверджує чи не підтверджує новий приклад цю гіпотезу. При підтвердженні оцінка k замінюється на (k + 1)/(n + 1), а при непідтвердженні новим прикладом раніше висуненої гіпотези її оцінка змінюється з k/n на (k 1)/(n + ). Таким чином, в процесі накопичування нової інформації оцінки гіпотез або наближаються до 0 чи 1, або якось “коливаються ”. В першому випадку гіпотеза на деякому кроці може зникнути з М+ або М. В другому при досягненні верхньої межі достовірності гіпотеза може отримати оцінку, що відображає емпіричну істину, та запамятатися як деякий встановлений факт в системі або ця гіпотеза повідомляється людині, що працює з ДСМ-програмами. В третьому випадку, якщо коливання оцінок достатньо сильні, може також відбутися виключення сформованої раніше гіпотези з тих, які описані в М+ та М.
Нові гіпотези формуються не лише на основі виділення в прикладах певної схожості. Вони можуть використовувати і метод відмінностей, також сформульований Міллєм. Відмінність виявляється для прикладів, що відносяться до груп позитивних та негативних прикладів. Знайдена відмінність служить кандидатом для гіпотез, що включаються в М+ або М.
В ДСМ-методі крім прямої реалізації ідей Мілля використовуються ще деякі виведення за аналогією. Для цього на множині описів обєктів вводиться тим чи іншим чином поняття схожості. Якщо встановлене відношення схожості, то в ДСМ-методі відбувається виведення за аналогією. Він здійснюється наступним чином. Якщо гіпотеза hi j k має оцінку k/n та така, що причини, що використовується в ній, схожа з причиною в гіпотезі hi j 1, що знаходиться в тій самій матриці М та оцінюється з точки зору достовірності значенням 1/n, то на гіпотезу hi j 1 переноситься оцінка гіпотези hi j k та вона отримує оцінку достовірності k/n. Подібна процедура в ДСМ-методі називається правилом позитивної аналогії. Існує в цьому методі і правило негативної аналогії, а також градація тих та інших правил по силі схожості, що в них враховується. Таким чином, ДСМ-метод демонструє можливість проведення правдоподібних розмірковувань досить широкого спектру.
У спрощеному вигляді схема правдоподібного виведення в ДСМ-АПГ схожа на схему виведення в системі індуктивного навчання. Гіпотезу про закономірності отримують в результаті таких узагальнень позитивних прикладів, які заздалегідь не були б узагальненням негативних прикладів. Специфічним для ДСМ-АПГ рисами є спосіб вираження операції узагальнення, використання оригінальних “підсилень” гіпотез, що відповідають перевіркам на гіпотезах виконання деяких умов здорового глузду, використання так званого узагальненого методу, можливість отримання складних залежностей на даних за допомогою комбінації індуктивного та дедуктивного виведення. ДСМ-метод поділяється на три основні рівні, які умовно можна назвати рівнями схожості, правил та розмірковувань.
На першому рівні, або рівні схожості, задається структура даних про обєкти з предметної області, а також операція схожості, що співставляє двом обєктам із предметної області третій обєкт, що виражає схожість перших двох.
На другому рівні, рівні правил, обєкти з предметної області поділяються на позитивні приклади (обєкти, які викликають деякий ефект А, що нас цікавить) та негативні приклади (обєкти, що не викликають ефекту А). Правила “знаходять” схожості позитивних прикладів, які не є схожостями негативних прикладів та, можливо, перевіряють деякі інші умови, що дозволяють називати знайдені схожості гіпотезами про структурні причини ефекту А.
На третьому рівні, рівні розмірковувань, складаються стратегії, тобто послідовності застосування правил правдоподібного виведення та перевірок деяких умов на множині всіх вихідних даних та отриманих гіпотез, що дозволяють зробити висновок про обгрунтованість правдоподібного ДСМ-виведення. На рівні розмірковувань отримання деяких гіпотез можливо за рахунок дедуктивного виведення, що використовує результати правдоподібного виведення. Тим самим, на цьому рівні здійснюється синтез правдоподібного та чисто дедуктивного (достовірного) виведення, що споріднює ДСМ-метод із системами навчання, основаними на поясненні. Вказана ієрархія рівнів ДСМ-метода відповідає також ієрархії формальних мов ДСМ-теорій.
Поняття схожості, що використовується в ДСМ-методі, представляє собою один з можливих способів синтезу кількох напрямків: обєкти структуровані (тобто на них задано відношення “бути більш загальним”), а їх схожість задається через операцію з визначеними алгебраїчними властивостями, що індуцирують відношення толерантності (тобто рефлексивне та симетричне відношення) на обєктах. Та навпаки, відношення толерантності (схожості) вільного (але фіксованого) числа обєктів може бути взаємно-однозначно співставлено деякій операції, яка може бути операцією схожості на обєктах в ДСМ-методі. Більш формально, нехай S множина обєктів, яка представляє деяку предметну область. Операція ? на парах обєктів із S задає нижню напіврешітку, якщо для будь-яких обєктів si, sj, sk з S мають місце співвідношення (1)(4)
(1) si?si = si,
(2) si?sj = sj?si,
(3) (si?sj) ?sk = si?(sj?sk),
(4) si?s0 = s0, для деякого s0 з S, який називається порожнім обєктом.
Поняття “порожнього обєкта” може бути розширене до “множини порожніх обєктів”. Такою може бути множина обєктів із S, що включає s0 та замкнуте відносно операції ?. Множина порожніх обєктів може інтерпретуватися як “несуттєва”, “неінформативна” схожість. Такою, наприклад, можна рахувати схожість графів хімічних молекул, максимальний загальний підграф яких є одна ланка вуглеводневого ланцюжка: СC.
Напіврешіточна операція ? задає на множині S відношення поглинання L наступним чином: для si та sj з S, si + sj тоді і тільки тоді, коли sі ? sj = si.
Означення 1.
Операцію, що задовольняє властивостям (1)(4), назвемо операцією схожості.
Означення 2.
Нехай <S, ?, s0> нижня напіврешітка, X ? s0 називається локальною схожістю обєктів s1, …, sk (k = 2), якщо X = s1?…?sk.
Можна записати s1?…?sk замість s1?(¬s2?(…?sk)…), використовуючи властивості (1)(3) операції схожості ?. Загалом, при визначенні операції схожості можна обійтися без властивості асоціативності (3), що дозволяє однозначно задавати схожість n обєктів через попарні схожості. В такому випадку, однак, довелося б вводити нескінчене сімейство операцій схожості ?2, ?3, …, кожне з яких відноситься до певної кількості обєктів. При цьому результат операції міг би залежати від порядку операндів.
Означення 3.
Нехай <S, ?, s0> нижня напіврешітка. Пара <X, {s1,…, sk}>, де s1,…, skS, називається глобальною схожістю, якщо Х = s1?…?sk, тобто Х є локальна властивість обєктів s1,…, sk та для будь-якого sS\{s1,…, sk} має місце X ? s ? X. Так як k заздалегідь невідоме, то глобальна схожість не є відношенням, на відміну від локальної схожості. Помітимо, що відношення
def
R (x, y) (S \ {s0}) (S \ {s0}), (x, y) R = x ? y ? s0
Є відношенням толерантності, тобто воно рефлексивне ((х, х) R) та симетричне ((x, y) R ? (y, x) R). Тим самим операція ? задає бінарне відношення схожості, але не лише його. В силу асоціативності операції ? можна ввести наступне k-арне відношення Rk для довільного k. Rk (S \ {s0}) … (S \ {s0}); (x1,… xk) Rk, якщо x1? … ?xk ? s0. Тоді відношення буде мати наступні властивості:
xS \ {s0}, (x,…x)Rk (Re)
k
pqi 1 = i = p = i + q = k
(x1, …, xi, …, xp, …, xi+q, …, xk)Rk ? (x1, …, xi-1, xi, …, xp, xi+q+1, …, xk)Rk (PR) (x1,… xk) Rk ? (xj1,… xjk) Rk, (Si)
де (j1, …, jk) будь-яка перестановка (1, …, k).
Відношення, що мають властивості (Re), (PR), (Si) називаються k-арними відношеннями толерантності. Ці відношення природнім чином узагальнюють відношення бінарної толерантності.
Припустимо, що предметна область задана деякої нижньою напіврешіткою SL = <S, ?, 0>, а база даних системи включає в себе деяку множину обєктів ? S. Нехай нас цікавлять властивості цих обєктів з деякої множини U2 ={w1, …, wk} та про кожний обєкт siΩ ςа кожну властивість wiU2 або відомо, що si має властивість wj ( і тоді він називається позитивним або (+)-прикладом відносно wj), або відомо, що si не має властивість wj (si є ()-прикладом відносно wj), або не відомо ні те ні інше (тоді він називається невизначеним або (τ)-прикладом відносно wj). Таким чином, для фіксованої властивості wj всі обєкти з Ω поділяються на три класи Ω+, Ω, Ωτ позитивних, негативних та невизначених прикладів відповідно.
Означення 4.
Нехай Ω+, Ω множина вихідних (+)- та ()-прикладів. Позитивною (або (+)-) гіпотезою І роду, отриманою за правилом Іа+, називається глобальна схожість вигляду <h, {si1, …, sit}> на напіврешітці <Ω+, ?, s0>, де si1, …, sit обєкти з ?+ (позитивні приклади), для котрого h не є локальною схожістю яких-небудь обєктів з ?. Будемо називати h головою, а {si1, …, sit} хвостом гіпотези.
Негативна (або ()-) гіпотеза І роду, отримана за правилом Іа, визначається двояко.
Якщо схожість деяких позитивних прикладів si1, …, sit співпадає зі схожістю деяких негативних прикладів si1, …, sit, тобто
si1 ?…? sit = sj1 ?…? sjr = h,
то обидві пари
<h, {si1, …, sit}>, <h, {sj1, …, sjr}>
називаються суперечливими (або (0)-) гіпотезами, отриманими за правилом Іа0. Таке означення гіпотез близьке до типових означень гіпотез в системах машинного навчання, де будується таке узагальнення позитивних прикладів, яке не було б узагальненням негативних.
Означення 5.
Позитивна або (+)-гіпотеза ІІ роду, отримана за правилом П+, є той обєкт НΩτ, для якого існує (+)-гіпотеза І роду <h+, {si1, …, sit}> така, що h+H та для довільної ()-гіпотези І роду <h, {si1, …, sit}> має місце hH.
Негативні (або ()-) гіпотези визначаються двояко. НΩτ називається суперечливою (або (0)-) гіпотезою, отриманою за правилом П0, якщо Н включає голови як позитивних, так і негативних гіпотез І роду.
Вивід правдоподібних гіпотез в ДСМ-методі здійснюється в рамках квазіаксіоматичних теорій (КАТ). КАТ є трійка
<, , >,
де множина аксіом, що неповно описує предметну область (ПО), множина емпіричних елементарних речень про обєкти з ПО. Зазвичай вони відповідають твердженням вигляду “Обєкт має властивість А”. Множина відкрита та може поповнюватися за рахунок проведення нових експериментів, спостережень та ін., множина правил виведення. = 10, де 1 множина правил правдоподібного виведення (ППВ) та 0 множина правил достовірного виведення.
Розмірковування в КАТ є побудова ланцюжка формул 1, …, n, де кожна і або аксіома з , або фактичне висловлювання з (відповідає (+)- чи ()-прикладу тобто обєкту з ?+ чи ?), або отримана з попередніх формул ланцюжка 1, …, n шляхом застосування правил з як, наприклад, гіпотези І та ІІ роду. Визначення розмірковування в КАТ відрізняється від визначення логічного виведення тим, що:
Множина аксіом складається з множини процедурних аксіом pr та множини декларативних аксіом dc. Аксіоми з pr формально виражають собою застосування правил І та ІІ роду з врахуванням їх часткового впорядкування. Частина декларативних аксіом з dc (позначимо її dc0) описує структуру даних (алгебру схожості, сполучення та різниці) предметної області, що розглядається. Інша частина декларативних аксіом, dc1, описує деякі природні властивості причинних відношень та гіпотез про них: правила комбінації наслідків одних і тих самих причин, а також принципи казуальної несуперечливості та повноти.
Нехай правила І та ІІ роду, що застосовуються в ході ППВ, фіксовані. Тоді вимогою аксіоми (принципу) казуальної несуперечливості полягає в тому, щоб (+)-приклад не міг би стати ()-гіпотезою ІІ роду на якому-небудь кроці породження гіпотез. Аксіома казуальної повноти вимагає того, щоб усі (+)-приклади ставали (+)-гіпотезами ІІ роду на якому-небудь кроці породження гіпотез.
Декларативні аксіоми ДСМ-методу можуть бути засобом керування розмірковуванням: при невиконанні якої-небудь аксіоми ДСМ-“розмірковувач” може вимагати поповнення бази даних новими прикладами та вказувати вид прикладів, що дозволяють добитися виконання аксіоми після застосування ДДСМ-ППВ. Перевірка виконуваності аксіом може здійснюватися часто дедуктивним шляхом з використанням засобів логічного виведення, основаних на логічній теорії ДСМ-методу. Система логічного виведення інтегрована з засобами правдоподібного виведення ДСМ-методу в єдину логіко-інформаційну обчислювальну систему та дозволяє отримувати дедуктивний доказ або спростування виконання тих чи інших залежностей на обєктах та гіпотезах із ДСМ-бази даних. Обєднання в ДСМ-розвязувачі індуктивного та дедуктивного виведення дає можливість бачити схожість ДСМ-розмірковувань з навчанням в системах, основаних на поясненні: складні залежності на обєктах з бази даних є тут аналогами тверджень, що не задовольняють критерію операціональності. “Навчання” їм можливо лише після навчання елементарним гіпотезам (тобто отримання їх за допомогою правил І та ІІ роду) та проведення на їх основі логічного виведення.
В даній роботі було розглянуто ДСМ-метод, я саме загальний опис цього методу, а також основи ДСМ-методу автоматичного породження гіпотез, що обєднує в собі риси індуктивних методів (навчання на позитивних та негативних прикладах) та методів, основаних на поясненні (використання дедуктивного виведення).
Д. А. Поспелов. Моделирование рассуждений. Опыт анализа мыслительных актов. Москва, “Радио и связь”, 1989
О. М. Анашков, Д. П. Скворцов, В.К. Финн, В. Г. Ивашко. Логические средства ДСМ-метода автоматического порождения гипотез: основные понятия и система правил вывода. НТИ, 1987.