Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Системы используются в случае если признаки и-или отношения между ними вероятностные

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 27.11.2024

Вероятностные системы распознавания.

Системы   используются в случае, если признаки и/или отношения между ними вероятностные.  Построение алгоритмов распознавания обычно базируется на использовании теории статистических решений. При наличии полной априорной информации эти методы могут применяться непосредственно, при неполной исходной информации надо использовать процедуры обучения и самообучения.

Пусть объекты представлены классами Q1 и Q2, для характеристики объектов используется вероятностный признак х. Для классов известны плотности распределения вероятностей f(x1) и  f(x2), а так же априорные вероятности появления объектов P(Q1) и P(Q2). В результате эксперимента определено значение х0 распознаваемого объекта. Надо определить, к какому классу относится объект.

Обозначим за xi некоторое, еще неопределенное значение признака  х. Введем правило: если xi > x0 то объект относится к классу Q2, иначе к классу Q1.

Если объект относится к классу Q1, а его считают объектом класса Q2, то совершена ошибка – ошибка первого рода, условная вероятность которой

Q1=∫ f1(x)dx, от xi до .

По терминологии теории статистических решений, ошибочно выбрана гипотеза Н2, в то время как справедлива гипотеза Н1. Наоборот, если справедлива гипотеза Н2, а гипотезе Нх, то совершена ошибка второго рода, условная вероятность отдано предпочтение которой

Q2=∫ f2(x)dx, от -до xi.

Пусть дана выборка из неизвестного совместного распределения Px, и поставлена бинарная задача проверки статистических гипотез: H0, H1. Где H0нулевая гипотеза, а H1альтернативная гипотеза. Предположим, что задан статистический критерий,

,

сопоставляющий каждой реализации выборки  одну из имеющихся гипотез. Тогда возможны следующие четыре ситуации:

  1.  Распределение выборки соответствует гипотезе , и она точно определена статистическим критерием, то есть .
  2.  Распределение выборки соответствует гипотезе , но она неверно отвергнута статистическим критерием, то есть , ошибка первого рода.
  3.  Распределение выборки соответствует гипотезе , и она точно определена статистическим критерием, то есть .
  4.  Распределение выборки соответствует гипотезе , но она неверно отвергнута статистическим критерием, то есть ., ошибка второго рода.

Ошибку первого рода часто называют ложной тревогой, ложным срабатыванием или ложноположительным срабатыванием — например, анализ крови показал наличие заболевания, хотя на самом деле человек здоров, или металлодетектор выдал сигнал тревоги, сработав на металлическую пряжку ремня. Слово «положительный» в данном случае не имеет отношения к желательности или нежелательности самого события.

Функции потерь, характеризующие потери при совершении ошибок первого и второго рода, а также потери правильных решений, образуют в данном случае платежную матрицу вида

где с11 и с22, с12 и с21 — потери, связанные соответственно с правильными решениями и ошибками первого и второго рода.

Средний риск при многократном распознавании неизвестных объектов равен сумме потерь, связанных с неправильными и правильными решениями, с учетом вероятностей их появления и априорных вероятностей поступления на вход системы распознавания объектов классов Q1 и Q2.

Отношение условных плотностей распределения f2(x)/f1(x) = (х) называют коэффициентом правдоподобия или отношением правдоподобия.

Значение x0 позволяет оптимальным образом (в смысле минимума среднего риска) разделить признаковое пространство на области R1 и R2. Область R1 состоит из хx0, для которых (х) 0, а область R2 — из х > x0, для которых (х) > 0Ррешение о принадлежности объекта к классу Q1 следует принимать, если значение коэффициента правдоподобия меньше его критического значения, а решение об отнесении объекта к классу Q2 — при противоположной ситуации.

Критерий Байеса — правило, в соответствии с которым стратегия решений выбирается таким образом, чтобы обеспечить минимум среднего риска. Применение критерия Байеса целесообразно в случае, когда система распознавания многократно осуществляет распознавание неизвестных объектов или риска, усредненного по множеству решений задачи распознавания принадлежности объектов классу Q1 и Q2 принимаются в соответствии явлений в условиях неизменного признакового пространства, при неизвестных объектов, обеспечивается тогда, когда решения о стабильном описании классов и неизменной платежной матрице.

Стратегию, основанную на этом правиле, называют байесовской стратегией, а минимальный средний риск — байесовским риском.

Использование другой стратегии, отличной от байесовской, Минимум со следующим правилом: если измеренное значение признака у данного объекта расположено в области R1 то объект относится к классу Q11 если в области R2 — к классу Q2.

Байесовская стратегия может быть описана также следующим образом. Пусть в результате опыта установлено, что значение признака у распознаваемого объекта w составляет величину x = x0. Тогда условная вероятность принадлежности объекта классу Q1 (условная вероятность первой гипотезы в соответствии с теоремой гипотез или формулой Байеса)

P(Q1│x0)  = P(Q1)f1(x0)/ f (x0)

а условная вероятность принадлежности объекта классу Ω2 (условная вероятность второй гипотезы)

P(Q2x0)  = P(Q2)f2(x0)/ f (x0)

где f(x0)=P(Q1)f(x0)+P(Q2)f(x0) - совместная плотность распределения вероятностей значений признака х по классам, в свою очередь величины P(Q1)f(x0) и P(Q2)f(x0)— апостериорные вероятности, принадлежности распознаваемого объекта классам Q1 и Q22, соответственно.

Минимаксный критерий

При построении систем распознавания возможны такие ситуации, когда априорные вероятности появления объектов соответствующих классов неизвестны. Минимизировать значение среднего риска принятия решений на основе байесовской стратегии в этом случае не представляется возможным. Применительно к этой ситуации рационально использовать критерий, который минимизирует максимально возможное значение среднего риска. Этот критерий называют минимаксным критерием.

Минимаксная стратегия состоит в том, что решение о принадлежности неизвестного объекта соответствующему классу принимается на основе байесовской стратегии, соответствующей такому значению P(Q1), при котором средний риск максимален. Покажем преимущество минимаксной стратегии по сравнению с другими возможными стратегиями в условиях, когда неизвестны значения Р(Qi), i=1, ..., m.

Минимаксная стратегия обеспечивает то, что при P(Q1)< P(Q1) и P(Q1)> P(Q1). средние потери не будут превышать максимального значения минимальных средних (байесовских) потерь.

Минимаксная стратегия есть байесовская стратегия для наихудших значений априорных вероятностей, дающая, хотя и осторожное, но гарантированное значение среднего риска.

Критерий Неймана - Пирсона

При построении некоторых систем распознавания могут быть неизвестны не только априорные вероятности появления объектов соответствующих классов, но и платежная матрица. В подобных системах для построения алгоритма классификации целесообразно воспользоваться критерием Неймана—Пирсона, суть которого состоит в следующем. Исходя из того, какие решения принимаются на основании результатов распознавания неизвестных объектов, определяется допустимое (заданное) значение условной вероятности ошибки первого рода, затем определяется такая граница между классами, придерживаясь которой удается добиться минимума условной вероятности ошибки второго рода.

Процедура последовательных решений

Ранее предполагалось, что решение о принадлежности распознаваемого объекта w соответствующему классу Qi, i=l, ..., m, принимается после измерения всей совокупности признаков этого объекта х1 ..., xN. Однако возможен и другой подход к решению этой задачи: после измерения каждого очередного признака x1;x1, х2; х1, х2, х3 и т. д. включается алгоритм распознавания и решается задача распознавания на основе данных об измеренных к текущему моменту признаках неизвестного объекта. При этом в зависимости от результатов сравнения полученного решения с некоторыми установленными заранее границами либо измеряется очередной признак объекта со, либо прекращается дальнейшее накопление информации об этом объекте. Такая процедура решения задачи распознавания, называемая последовательной, обязана своим возникновением одному из разделов статистики — последовательному анализу.

Последовательное и многократное решение задачи распознавания с использованием на каждом шаге все возрастающего числа измеренных признаков целесообразно в случаях, когда определение признаков сопряжено с затратами на проведение экспериментов. Процесс накопления экспериментальных данных требует затрат значительного количества времени, проведение экспериментов сопряжено с определенным риском (например, при постановке медицинского диагноза), объекты ряда классов из их общей совокупности надежно распознаются по ограниченному количеству признаков.

Пусть множество объектов подразделено на классы Q1 и Q2, рабочий словарь содержит признаки х1 ..., xN и функции условной плотности распределения вероятностей будут fi(x1); fi(x1, х2); ...; fi(x1 ..., xN), i=l, 2.

Допустим, что проведена серия, состоящая из n экспериментов, в результате которых определены признаки х1 ..., хn (n<N). Сопоставим отношения n-мерных функций условных плотностей распределения вероятностей n=f1(x1, ..., хn)/f21 ..., хn) с величинами А и В. При этом будем полагать следующее: если nА, то проведение экспериментов прекращается и принимается решение о том, что wQ1 если nB, то проведение экспериментов также прекращается и принимается решение о том, что wQ2; если В<n <А, то принимается решение, что эксперименты необходимо продолжить и определяется очередной (n + 1)-й признак распознаваемого объекта. Постоянные А и В называются верхним и нижним порогами.




1. штурвала предприятия стоял руководитель который умеет видеть перспективы принимать обоснованные стра
2. О медицинском страховании и Законом О страховании в части возврата части страхового взноса оформления д
3. Машина Атвуда для изучения прямолинейного движения1
4. тема жизнеобеспечения фирмы
5. козак походить з тюркських мов і означає вільна озброєна людина
6. ВАРИАНТ 1 1 Укажите основные форменные элементы крови- а тромбоциты; в лимфоциты; д нейтрофилы; б плаз
7. Автоматизация деятельности института селекции растений
8. КУЗБАССКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ИМЕНИ Т Ф
9. Статья 84 Амнистия ~ вид освобождения от уголовной ответственностии наказания объявляемый Госдумой РФ в отн
10. Во что играют дети мира Задачи- образовательные- знакомство с видами игрушек мира; формирова
11. Вариант Посадки 15 20H7-g6 45H6-m5 60H6-p5 80D9
12. Реферат- Политический режим- понятие и сущность
13. Теория организации производства
14. Макродирективы С помощью макросредств ассемблера можно не только частично изменять входящие в макроопре
15. Арифметика на службе защиты
16. Конституционный суд Австрии
17. Те~гені~ т~ра~тылы~ыны~ ны~аюы
18. Работа с данными
19. тема національної оцінки інноваційного розвитку
20. і На півночі граничить з Австрією на північному сході з Угорщиною на північномусході і півдні з Хорватіє