Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

102012 Системы распознавания с самообучением В ситуациях когда число классов заранее неизвестно единств

Работа добавлена на сайт samzan.net: 2015-07-05

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 5.5.2024

26.10.2012

Системы распознавания с самообучением

В ситуациях, когда число классов заранее неизвестно единственным путем формирования системы распознавания остается применение методов самообучения, которые получили наименование  Кластерного Анализа.

Под кластером понимают группу объектов, образующих в пространстве признаков компактную, в некотором смысле, область.

Выявление кластеров.

Для того чтобы определить на множестве данных кластер необходимо ввести меру сходства (подобия), которая будет положена в основу правила отнесения образов к области характеризуемой некоторым центром кластера.

рис.1

Если расстояния одинаковые, то зачисления выполняются произвольно.

Каким образом померить близость?

В качестве мер сходства чаще всего рассматривается Евклидовое расстояние между образом wke и центром соответствующей кластерной области.

В качестве альтернативы приведем не метрическую меру сходства:  (рис.2)

рис.2

Мера Танимото:  

Простой алгоритм выявления кластера:

Пусть дано m образов {w1,w2,..,wn} , описываемых векторами признаков {x1, x2,…,xn}

Центр первого класса Z1 совпадает с любым из заданных образов. Определена произвольная, не отрицательная пороговая величина T

Вычисляется расстояние между центром Z1 и следующим образом:

Если это расстояние больше порога (T), то учреждается новый центр Z2.

Иначе этот образ зачисляется в кластерную область 1. И т.д. по всем  образам.

D-расстояние

T-образ

Результаты кластеризации *определяются выбором первого центра, *порядком осмотра образов, *значением пороговой величины T, *геометрическими характеристиками данных.

Алгоритм Максиминного расстояния:

  1.  На первом шаге алгоритма один из объектов произвольным образом назначается центром первого кластера
  2.  Затем отыскивается образ, отстоящий от Z1 на наибольшем расстоянии. Он назначается Z2.
  3.  Производится вычисление расстояния между всеми остальными образами выборки и центрами Z1 и Z2.
  4.  В каждой паре определяется минимальное.
  5.  После этого выделяется максимальное из минимальных, если оно составляет значительную часть расстояния между Z1 и Z2, то соответствующий образ назначается Z3.
  6.  И т.д.

Алгоритм К внутри групповых средних.

K=2

1) Выбирают К исходных центров кластера. Этот выбор произволен, обычно в качестве исходных центров используются первый К образ из обучающего множества.

2) на К-ом шаге задонное множество образов {X} распределяется по К кластерам, по next принципу:

 X  Sj(k) || X-Zj (k) || < || X-Zi(k) ||

3) Определяются новые центры кластеров на K+1 итерации

Zj(k+1) = 1\N *X , x Sj(k)

4) Условие сходимости. Если Zj(k+1) =Zj(k) то конец

    Иначе – переход к шагу 2

Оценка результатов кластерного анализа.

  1.  Целесообразно посмотреть количество образов внутри каждой кластерной области.
  2.  Разброс образов относительно центра (дисперсия)
  3.  Расстояния между центрами кластерных областей (в комбинации с пунктом 1 вопрос о слиянии)




1. Введение в философию компьютерных существ
2. С другой стороны адекватное применение приемов и способов финансового контроля гарантирует соблюдение пра
3. Литовский мирный договор Все строение возводимое ныне германскими империалистами в несчастном догово
4. тактическая характеристика очагов ядерного поражения Очагом ядерного поражения называется
5. тематично нищити українські національні права та вольності і поступово підготовляти населення до загальнор
6. Особенности создания туроператором туристского продукта
7. ТЕМАТИКИ Нестеренко Олексій Никифорович
8. реферат дисертації на здобуття наукового ступеня кандидата педагогічних наук Київ ~
9. Контрольная работа- Таможенный склад
10.  Коэффициент текущей ликвидности показывает достаточно ли у предприятия средств которые могут быть исполь
11. Осенью 1917 года еще больше ухудшилось экономическое и военное положение России
12. Родился Лурих в 1876 году в Эстонии
13. Методы борьбы со стрессом
14. роста численности населения роста доли городского населения загрязнения среды отходами усил
15. Бетасервис В.1
16. Контрольная работа по дисциплине История экономических учений студента 2го курса заочного отделения г
17. Задание 1 6 баллов Ответ- 1 ~ Бабочка 2 ~ Заяц 3 ~ Белка 4 ~ Лось 5 ~ Волк 6 ~ Ёж Задание 2 3 балла Отв
18. ТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ САПР Математическое и программное обеспечения САПр призваны решить две задачи
19.  это газы образующие самостоятельные месторождения
20. Сутність поняття громадянська активність студентів