У вас вопросы?
У нас ответы:) SamZan.net

темами технического зрения способны хорошо видеть чтобы работать с реальным миром

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 29.12.2024

Лекция 6

РАСПОЗНАВАНИЕ  ОБРАЗОВ И СИТУАЦИЙ

Современные роботы, снабженные системами технического зрения, способны хорошо видеть, чтобы работать с реальным миром. Они могут делать заключение о том, какого типа объекты присутствуют, в каких отношениях они находятся между собой, какие группы образуют.

Суть задачи распознавания – установить, обладают ли изучаемые объекты фиксированным конечным набором признаков, позволяющим отнести и ке определенному классу.

Цели науки распознавания образов:

- замена человеческого эксперта или сложной экспертной системы более простой системой (автоматизация деятельности человека или упрощение сложных систем);

- построение обучающихся систем, которые умеют принимать решения без указания четких правил, а именно, систем, которые умеют сами синтезировать правила принятия решений на основе некоторого конечного количества «продемонстрированных» системе примеров правильных решений.

Задачи распознавания можно охарактеризовать следующим образом.

1.Это информационные задачи, состоящие из двух основных этапов: приведение исходных данных к виду, удобному для распознавания и собственно распознавание.

2. В эти задачах можно вводить понятие аналогии Ии подобия объектов и формулировать понятие близости объектов в качестве основания для зачисления объекта в определенный класс.

3. В этих задачах можно оперировать набором примеров, классификация которых известна и которые в виде формализованных описаний могут быть предъявлены алгоритму распознавания для настройки на задачу в процессе обучения.

4. Для этих задач трудно строить формальные теории и применять классические математические методы.

5. В этих задачах возможна «плохая» информация.

Типы задач распознавания:

- отнесение предъявленного объекта к одному из классов (обучение с учителем);

- автоматическая классификация – разбиение множества объектов (ситуаций) по их описанияю на систему непересекающихся классов;

- выбор набора информатиыных признаков при распощнавании;

- приведение исходных данных к виду, удобному для распознавания;

- динамическое распознавание и динамическая классификация;

- задачи прогнозирования.

Основные определения

Образ – это cтруктурированное описание объекта или явления, представленное вектором признаков, каждый элемент которого представляет числовое значение одного из признаков, характеризующих данный объект. Другими словами : образ - любой объект, для которого можно измерить набор определенных числовых признаков. Пример образа: буква, изображение, кардиограмма, и т.п.

 Числовой признак (или просто признак).  – это формула или иное описание способа сопоставления объекту некоторой числовой характеристики, которое действует в рамках конкретной задачи распознавания образов. Для каждого объекта может быть определено несколько различных признаков, то есть несколько числовых характеристик.

 Пространство признаков. N-мерное пространство, определенное для данной задачи распознавания, где N – фиксированное число измеряемых признаков для любых объектов. Вектор из пространства признаков, соответствующий объекту задачи распознавания это  N-мерный вектор с компонентами (х1,х2, …, хN), которые являются значениями признаков данного объекта.

ОБЪЕКТ->N признаков->M-мерный вектор признаков

 Класс - неформализируемое (как правило) представление о возможности отнесения произвольного объекта из множества объектов задачи распознавания к определенной группе объектов. Для объектов одного класса предполагается наличие «схожести».  Для задачи распознавания образов может быть определено произвольное количество классов, большее 1. Количество классов обозначается числом S.

В целом проблема распознавания образов состоит из двух частей: распознавания и обучении.

Распознавание образов заключается в классификации некоторой группы объектов на основе определенных требований. Объекты, относимые к одному классу образов, обладают общими свойствами. Требования, определяющие классификацию, могут быть различными, так как в различных ситуациях возникает необходимость в различных типах классификаций.

Например, при распознавании английских букв образуется 26 классов образов. Однако, чтобы отличить при распознавании английские буквы от китайских иероглифов, нужны лишь два класса образов.

Простейший подход к распознаванию образов заключается в сопоставлении с эталонами. В этом случае некоторое множество образов, по одному из каждого класса образов, хранится в памяти машины. Входной (распознаваемый) образ (неизвестного класса) сравнивается с эталоном каждого класса. Классификация  основывается   на   заранее   выбранном   критерии  соответствия или критерии подобия. Другими словами, если входной образ лучше соответствует эталону i-го класса образов, чем любому другому эталону, то входной образ классифицируется как принадлежащий i-му классу образов.

Недостаток этого подхода, т. е. сопоставления с эталоном, заключается в том, что в ряде случаев трудно выбрать подходящий эталон из каждого класса образов и установить необходимый критерий соответствия.

Более совершенный подход заключается в том, что классификация основывается на некотором множестве отобранных замеров, производимых на входных образах. Эти отобранные замеры, называемые «признаками», предполагаются инвариантными или малочувствительными по отношению к обычно встречающимся изменениям и искажениям и обладающими небольшой избыточностью.

Частный случай второго подхода «измерения признаков», при котором эталоны хранятся в виде измеренных признаков и в классификаторе используется специальный критерий классификации (сопоставление).

Признаки определяются разработчиками и должны быть инвариантны к ориентации, размеру и вариациям формы объектов.

Основные этапы построения систем распознавания

Этап № 1

Определение полного перечня признаков (параметров), характеризующих объекты или явления, для которых данная система разрабатывается

При решении этой задачи главное - найти все признаки, характеризующий распознаваемый объект или явление. Необходимо найти все возможные признаки, описывающие объекты распознавания, чтобы при оценке эффективности решений, системе не приходилось повторно проводить поиск признаков в случае ограниченности выбранных признаков на последующих этапах разработки,

Для того чтобы назначить признаки распознавания нет способов их автоматической генерации, т.к. это под силу только человеку. Это эвристическая операция.

Выбор признаков можно осуществлять, имея представление об их общих свойствах.

Детерминированные признаки - это такие характеристики объектов или явлений, которые имеют конкретные и постоянные числовые значения.

Вероятностные признаки - это характеристики объекта (явления), носящие случайный характер.

Логические признаки распознавания - это характеристики объекта или явления, представленные в виде элементарных высказываний об истинности ("да", "нет"   или   "истина", "ложь").

Структурные признаки - непроизводные (то есть, элементарные, не производимые из других элементарных признаков) элементы (символы), примитивы изображения объекта распознавания.

Этап № 2

Первоначальная классификация объектов (явлений), подлежащих распознаванию, составление априорного   алфавита классов.

Решение ее осуществляется наиболее часто эвристически, как и выбор признаков распознавания, а логика ее решения следующая:

1-е - определяется, какие решения могут приниматься по результатам распознавания либо человеком, либо автоматической системой управления объектом (цель распознавания).

2-е - на основе определенной выше цели формулируются требования к системе распознавания, позволяющие выбрать принцип классификации.

3-е - составляется априорный алфавит классов объектов (явлений).

Этап № 3

Разработка априорного словаря признаков распознавания.

Главное содержание рассматриваемой задачи построения СР - создание словаря, обеспечиваемого реально возможными измерениями.

Этап № 4

Описание классов априорного алфавита на языке априорного словаря признаков.

Трудоемкая задача, требующая глубокого изучения свойств объектов распознавания, а также она является наиболее творческой задачей.

Необходимо сопоставить класс с соответствующим числовым параметром детерминированных и вероятностных признаков, значения логических признаков и предложений, составленных из структурных признаков-параметров.

Значения этих параметров описаний можно получить из совокупности действий:

-специально поставленные экспериментальные работы или экспериментальные наблюдения;

-результаты обработки экспериментальных данных; математические расчеты; результаты математического моделирования; извлечения из литературных источников.

Этап № 5

Выбор алгоритма классификации, обеспечивающего отнесение распознаваемого объекта или явления к соответствующему классу.

Этап № 6

Определение рабочего алфавита классов и рабочего словаря признаков системы распознавания.

Разработка алфавита классов, который обеспечивал бы максимальное значение показателя эффективности распознавания.

То есть, из априорного словаря должны выбрать признаки, позволяющие при всех имеющихся ограничениях на их получение (измерение) доставить максимум вероятности правильной классификации объектов (явлений) и (или) минимальные вероятности ошибочных классификаций создаваемой системой.

Принципы классификации и типы систем распознавания

СР делятся на: -простые; -сложные.

Простые СР характеризуются единой физической природой признаков.

Например:

1) только масса - для систем распознавания жетонов, монет в автоматах таких, как
междугородный телефон, турникет метро;

Ясно, что для простых систем распознавания не обязательно иметь компьютер. Достаточно их реализовать в виде механических или электромеханических устройств. Хотя компьютерные реализации в принципе не противопоказаны, если наряду с этой в системе решаются и другие более достойные задачи.

Сложные СР характеризуются физической неоднородностью признаков.

По принципу получения апостериорной информации сложные системы распознавания делятся на:

-одноуровневые;

-многоуровневые.

В одноуровневых СР информация о признаках распознаваемого объекта (апостериорная информация) формируется непосредственно на основе обработки прямых измерений.

К одноуровневым относят, например, читающие автоматические распознающие устройства, автоматы для размена монет, автоматические устройства, предназначенные для отбраковки деталей, в качестве признаков используются некоторые линейные размеры, либо масса и т.д.

В многоуровневых СР информация о признаках формируется на основе косвенных измерений как результат функционирования вспомогательных распознающих устройств (пример: измерение дальности радиолокатором по времени задержки излученного импульса).

Многоуровневые сложные системы распознавания отличаются от одноуровневых тем, что не все признаки от разнородных физических измерителей используются непосредственно для решения задачи распознавания.

По количеству первоначальной априорной информации СР делятся на:

-системы без обучения;

-обучающиеся (ОСР) и самообучающиеся системы (ССР).

Многоуровневые сложные СР однозначно нельзя разделить на указанные классы, так как каждая из локальных СР, входящих в их состав, сама может представлять как систему без обучения, так и систему обучающуюся или самообучающуюся.

Системы без обучения.

Для построения таких систем необходимо располагать полной первоначальной априорной информацией.

Обучающиеся системы.

Для обучающихся систем мы должны иметь дело с ситуацией, когда априорной информации не хватает для описания распознаваемых классов на языке признаков. (Возможны случаи, когда информации хватает, однако делать упомянутое описание нецелесообразно или трудно).

То есть, на стадии формирования ОСР работают с "учителем", осуществляющим указание о принадлежности предъявленного для обучения объекта. И прежде, чем система будет применяться, должен пройти этап обучения.

Самообучающиеся системы.

Определен словарь признаков распознавания. Однако для организации процесса обучения задается некоторый набор правил, в соответствии с которым система сама вырабатывает классификацию.

Для ССР так же, как для ОСР существует период обучения, характерно наличие периода самообучения, когда ей предъявляются объекты обучающей последовательности. Только при этом не указывается принадлежность их к каким-либо классам.

Примером самообучающейся системы может быть система разделения на классы промышленных предприятий для сравнительного анализа эффективности их функционирования. При этом в качестве правил классификации могут быть указания либо о равенстве объемов выпускаемой продукции, либо о равенстве численности рабочих и т.п.).

В другой широко применяемой терминологии ССР - это система автоматического кластерного анализа или таксономии (taxis - порядок, nomos - закон).

По характеру информации о признаках распознавания СР подразделяются на:

-детерминированные;

-вероятностные;

-логические;

-структурные (лингвистические);

-комбинированные.

Детерминированные системы.

а) Метод решения задачи распознавания: использование геометрических мер близости;

б) Метод априорного описания классов: координаты векторов-эталонов по каждому из классов или координаты всех объектов, принадлежащих классам (наборы эталонов по каждому классу).

Вероятностные системы.

а) Метод решения задачи распознавания: вероятностный, основанный на вероятностной мере близости (средний риск);

б) Метод априорного описания классов: вероятностные зависимости между признаками и классами.

Логические системы.

а) Метод решения задачи распознавания: логический, основанный на дискретном анализе и исчислении высказываний;

б) Метод априорного описания классов: логические связи, выражаемые через систему булевых уравнений, где признаки - переменные, классы - неизвестные величины.

Структурные (лингвистические) системы.

а) Метод решения задачи распознавания: грамматический разбор предложения,
описывающего объект на языке непроизводных структурных элементов с целью определения его правильности.

б) Метод априорного описания классов: подмножества предложений, описывающих объекты каждого класса.

Комбинированные системы.

а) Метод решения задачи распознавания: специальные методы вычисления оценок;

б) Метод априорного описания классов: табличный, предполагающий использование таблиц, содержащих классифицированные объекты и их признаки (детерминированные, вероятностные, логические).

Таким образом, отсюда следует, что информацией никогда пренебрегать не стоит. Поэтому при построении как ОСР, ССР и просто СР необходимо всегда использовать принцип обратной связи расширения объема информации. То есть, результаты решения задачи распознавания неизвестных объектов после апостериорного подтверждения правильности их классификации необходимо использовать для уточнения описания классов в простых СР без обучения и для дополнительного обучения в ОСР и ССР.

Также существуют экспертные системы распознавания образов, эти системы основываются на методах искусственного интеллекта.

Рассмотренные системы распознавания основываются на моделировании математико-алгоритмических функций (уравнения, системы уравнений) детерминированных или стохастических систем с точным определением области применения, значений параметров, диапазонов сигналов, интервалов времени, частотных диапазонов и т.п. Эти задачи опираются на надежные, точно научно обоснованные знания.

Экспертные системы, основываются на представлении неалгоритмического, логического, декларативного характера, нечеткого и слабо формализованного знания в виде множества фактов и правил, причинно-следственных связей.

Указанные знания при этом могут быть как заслуживающими доверия, так и сомнительными.

Экспертные системы распознавания - это специализированные автоматы обработки знаний для интерактивного и кооперативного решения проблем распознавания на естественном профессиональном языке со  способностями приобретения,  хранения и представления знаний в форме алгоритмических программ с одной стороны и неалгоритмических фактов и правил, с другой стороны.

Их отличительная особенность состоит в том, что их основу составляют вполне определенный алфавит классов и словарь признаков. При этом каждый класс объектов или явлений на основе априорных данных четко описывается на языке этих признаков. Кроме того, в состав математического обеспечения современных систем входят правила принятия решений, алгоритмы распознавания. Они предназначены для сопоставления апостериорной информации о каждом распознаваемом объекте, представляемой в виде совокупности конкретных значений присущих ему признаков, выявленных в результате проведения с помощью измерительных средств опытов, с априорной информацией о классах объектов. На основе этого сопоставления и принимается решение об отнесении неизвестного объекта к определенному классу, если система не отказывается от его распознавания.

В мехатронных системах и робототехнике для распознавания объектов все чаще используются системы технического зрения. Техническое зрение можно определить как процесс выделения, идентификации и преобразования информации, полученной из трехмерных изображений. Этот процесс включает 6 этапов: снятие информации; предварительная обработка информации; сегментация; описание; распознавание; интерпретация.

Снятие информации – получение визуального изображения. Предварительная обработка – понижение шума или улучшение изображения отдельных деталей. Сегментация - процесс выделения на изображении интересующих объектов. При описании определяются характерные параметры (например, форма, размеры), необходимые для выделения требуемого объекта на фоне других. Распознавание – процесс идентификации объектов. Интерпретация – выявляет принадлежность к группе распознаваемых объектов.

Различают три уровня технического зрения.

Низкий уровень – процессы, которые являются простыми с точки зрения осуществления автоматических действий, не требующих наличия искусственного интеллекта (снятие и предварительная обработка информации).

Средний – процессы выделения, идентификации и разметки элементов изображения, полученных на нижнем уровне (сегментация, описание и распознавание объектов). Под высоким уровнем понимаются процессы, относящиеся к искусственному интеллекту. Системы высокого уровня обладают следующими признаками:

- возможностью выделения существенной информации из множества независимых признаков;

- способностью к обучению на примерах и обобщению этих знаний с целью их применения в новых ситуациях;

- возможностью восстановления событий по неполной информации;

- способностью определять цели и формулировать планы для достижения этих целей.

Системы технического зрения высокого уровня решают, как правило, все задачи систем низкого и среднего уровня. Характеристики таких систем далеки от возможностей человеческого зрения.

Сегментация – процесс подразделения сцены на составляющие части или объекты. Алгоритмы сегментации, как правило, основываются на двух фундаментальных принципах: разрывности и подобия. В первом случае подход основывается на определении контуров, во втором – на определении порогового уровня и расширении области.

При определении контуров могут использоваться различные методы: локальный анализ – анализ характеристик пикселов в небольшой окрестности (3х3 или 5х5) каждой точки образа, который уже подвергался процедуре обнаружения контура.  Подобные точки соединяются между собой. Основным критерием является показатель освещенности. Кроме того используются другие методы: преобразования Хоуга с выявлением собираемости элементов, глобальный анализ с помощью методов теории графов, методы расширения области за счет объединения пикселов и другие.

Описание – выделение свойств (деталей) объекта с целью распознавания. В идеале дескрипторы не должны зависеть от размеров, расположения и   ориентации объекта, но должны содержать достаточное количество информации для надежной идентификации объекта. В качестве дескрипторов границ применяют цепные коды. Цепные коды применяются для представления границы в виде последовательности отрезков прямых линий определенной длины и направления. В основном применяется 4-х или 8 связные дескрипторы, прямоугольная решетка.

Длина каждого отрезка определяется разрешением решетки, а направление задается выбранным кодом. Для отражения цепного кода сначала выбирается решетка. Тогда, если площадь ячейки, расположенной внутри границы, больше определенного числа (обычно 50%), ей присваивается значение 1, ели меньше – 0. Цепной код данной границы зависит от начальной точки. Метод точек эффективен только в тех случаях, когда сами границы инвариантны к повороту и изменению масштаба.


Код из левого верхнего угла: 03300110333233322….

Существуют также другие методы (аппроксимация многоугольниками, математические методы, использующие преобразования Фурье  и др.).

В системах технического зрения также применяют дескрипторные области. Например, площадь области определяется как число пикселов, содержащихся в пределах ее границ. Большие и малые оси области полезны для определения ориентации объекта. Особые проблемы представляет описание объектов и создание текстурных дескрипторов.

Распознаванием называется процесс разметки, т.е. алгоритмы распознавания идентифицируют каждый объект сцены и присваивают ему метки (болт, гайка и т.п.).

Существуют две категории методов распознавания: теоретические и структурные. Теоретические основываются на количественном описании, в основе структурных методов лежит декомпозиция объекта на простейшие элементы. Зная длины и направления простейших элементов, а также порядок их расположения, можно описать структуру объекта. Для распознавания используют также синтаксические методы.

Особенности зрительного восприятия мехатронных и робототехнических систем:

- необходимость построения комплексного описания среды на основе учета значительной априорной информации (модель проблемной среды) в отличие от фиксированных признаков или измерения отдельных параметров;

- необходимость анализа трехмерных сцен не только в плане анализа трехмерных объектов по их плоским проекциям, но и в плане определения объемных пространственных отношений;

- необходимость анализа изображений, включающих одновременно несколько произвольно расположенных объектов в отличие от традиционной задачи, когда для распознавания предъявляется один объект;

- необходимость анализировать реальную динамическую среду, а не статическое изображение;

- отсутствие постоянной фиксированной задачи и необходимость оперативно решать возникающие по ходу дела задачи;

- необходимость организации системного процесса взаимодействия в реальном времени нескольких подсистем  мехатронной или робототехнической системы (глаз-мозг), (глаз-мозг-исполнительные механизмы).




1. Долголетие
2. Тема 1ПСИХОЛОГИЯ КАК НАУКА
3. Петербургский государственный инженерноэкономический университет Факультет экономики и управления в
4. Тематический план Тематический план специальности Педагогика и психология бакалавры направление Педа
5. I Expnd the ide looking through ll the texts concerning felony crimes
6. стратегический менеджмент
7. Вступ
8. 1373 VIPПОЗИЦИИ Gtefolder обложка с отворотом
9. методическое пособие для студентов исторического факультета
10. тема Історія становлення банківських валютних відносин в Україні
11. Цветы Жизни Уважаемые родители Цветы Жизни это проект организованный Благотворительным фондом
12. Понятие о темпераменте и его физиологические основы 2.html
13. Тема- Разработка инструментария исследования Опросник- общие вопросы определяющие проблематику сам
14. rtem Khritonov JBBER- rtemkhritonov@jbber
15. тема порівнюється з нормативною що ліс змогу виявити характер відхилення від норми.
16. Тема 19- Производство по уголовным делам подсудным мировому судье Вопросы лекции- Производство по уг
17. западе и юге Европейской части и в степных районах юга Сибири
18. Скрининг биологически активных веществ из почвенных микроорганизмов
19. Литература - Неврология (СОСУДИСТЫЕ ЗАБОЛЕВАНИЯ ГОЛОВНОГО И СПИННОГО МОЗГА)
20. О техническом регулировании а правила разработки постановлением Правительства Российской Федерации от