Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
26.10.2012
Системы распознавания с самообучением
В ситуациях, когда число классов заранее неизвестно единственным путем формирования системы распознавания остается применение методов самообучения, которые получили наименование Кластерного Анализа.
Под кластером понимают группу объектов, образующих в пространстве признаков компактную, в некотором смысле, область.
Выявление кластеров.
Для того чтобы определить на множестве данных кластер необходимо ввести меру сходства (подобия), которая будет положена в основу правила отнесения образов к области характеризуемой некоторым центром кластера.
рис.1
Если расстояния одинаковые, то зачисления выполняются произвольно.
Каким образом померить близость?
В качестве мер сходства чаще всего рассматривается Евклидовое расстояние между образом wke и центром соответствующей кластерной области.
В качестве альтернативы приведем не метрическую меру сходства: (рис.2)
рис.2
Мера Танимото:
Простой алгоритм выявления кластера:
Пусть дано m образов {w1,w2,..,wn} , описываемых векторами признаков {x1, x2,…,xn}
Центр первого класса Z1 совпадает с любым из заданных образов. Определена произвольная, не отрицательная пороговая величина T
Вычисляется расстояние между центром Z1 и следующим образом:
Если это расстояние больше порога (T), то учреждается новый центр Z2.
Иначе этот образ зачисляется в кластерную область 1. И т.д. по всем образам.
D-расстояние
T-образ
Результаты кластеризации *определяются выбором первого центра, *порядком осмотра образов, *значением пороговой величины T, *геометрическими характеристиками данных.
Алгоритм Максиминного расстояния:
Алгоритм К внутри групповых средних.
K=2
1) Выбирают К исходных центров кластера. Этот выбор произволен, обычно в качестве исходных центров используются первый К образ из обучающего множества.
2) на К-ом шаге задонное множество образов {X} распределяется по К кластерам, по next принципу:
X € Sj(k) || X-Zj (k) || < || X-Zi(k) ||
3) Определяются новые центры кластеров на K+1 итерации
Zj(k+1) = 1\N *∑X , x €Sj(k)
4) Условие сходимости. Если Zj(k+1) =Zj(k) то конец
Иначе переход к шагу 2
Оценка результатов кластерного анализа.