Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Московский государственный технический университет
имени Н. Э. Баумана
Лекция №10:
«Интеллектуальные системы
принятия решений и управления
в условиях конфликта»
Автор:
доктор технических наук, профессор,
Действительный член Международной и Российской инженерных академий
Яковлев Андрей Иванович
Москва
2007 г.
Введение
Новым направлением принятия решений и управления в условиях конфликта являются информационные системы на основе интеллекта, который позволяет принимать решения формировать управления на основе использования знаний. Рассмотрена классификация интеллектуальных систем принятия решений и управления, новые результаты в их исследовании и приводятся примеры решения прикладных задач.
В лекции анализируются новые концепции, принципы и технологии принятия интеллектуальных решений в системах управления, использующих Интернет и другие телекоммуникационные сети для сбора, хранения, обработки и распространения информации. Это позволяет в условиях конфликта для аналитической работы формировать большие объемы достоверной информации и оперативно готовить необходимые документы при совместной работе коллектива лиц.
В лекции рассматриваются следующие основные вопросы:
10.1. Анализ современного состояния исследования интеллектуальных систем
В настоящее время научные исследования направлены на изучение и построение сложных, больших и слабо формализуемых технических, экологических, экономических, политических и социальных проблем, порождаемых процессом развития цивилизации и порождаемых им. По мнению ряда ученых [1-3], только использование всего потенциала знаний, накопленных человеком и создаваемых его интеллектом, позволяет успешно решать возникающие проблемы и находить пути адаптации человека к новым условиям его жизни при развития цивилизации.
Интеллектуальные системы и носители интеллекта традиционно находили применение в различных системах управления, включая ручное и полуавтоматическое управление, но новым этапом развития интеллектуальных систем стало появление электронных вычислительных машин (ЭВМ) и телекоммуникационных сетей с элементами искусственного интеллекта [4]. С момента начала исследований по искусственному интеллекту понималось создание вычислительных систем, обладающих свойствами имитации творческих процессов, логических выводов, восприятие естественно-язычных запросов и команд, аккумуляции знаний в ЭВМ. В качестве начальных научных направлений исследований новой информационной технологии можно выделить работы по интеллектуальным информационно-поисковым системам, обеспечивающим в процессе диалога человека с ЭВМ пользователей непрограммистов с базами данных и знаний на профессиональных языках пользователей близких к естественному языку (например, как в работах [5-7]).
10.1.1. Экспертные системы. Важное практическое реальное применение получила технология искусственного интеллекта, сформировавшаяся в середине семидесятых годов прошлого века и получившая название экспертных систем (ЭС) [8-10]. Достоинством ЭС стало то положение, что они ориентированы на решение широкого круга неформализованных задач, которые ранее считались мало доступными для вычислительной техники. При решении практических задач ЭС в ряде случаев позволили получить результаты «сравнимые, а иногда и превосходящие» результаты деятельности человека- эксперта, обосновывающего или готовящего предложения для лица принимающего решение [11].
При создании ЭС требуется разработать программы (устройства), которые при решении задач, трудных для эксперта-человека, получают результаты , не уступающие по рискам или эффективности результатам, формируемыми специалистами экспертами. В настоящее время ЭС нашли применение в различных сферах деятельности человека:
Исследователи ЭС для описания своей деятельности используют термин «инженерии знаний», который включает научные, технологические и методологические вопросы и фактически предполагает разработку принципов и технологий искусственного интеллекта на основе использования «знаний экспертов», или экспертных знаний.
Структура ЭС (рис. 10.1) имеет следующие компоненты [11]:
Рис.10.1. Схема обобщенной структуры ЭС
ЭС работает в двух режимах: режиме приобретения знаний (через инженера по знаниям от экспертов) и в режиме решения задачи пользователем.
Экспертные системы находят применение как эффективное средство анализа плохо формализуемых и трудно алгоритмизируемых задач по распознаванию образов и классификации конфликтов, условий их реализации, поиску целесообразных и оптимальных действий в условиях различных конфликтов. Технологии экспертных систем позволяют находить решения при неполноте исходных данных об объекте управления, идентифицировать стратегии и действия противника в конфликтных ситуациях, обрабатывать смысловое содержание больших объемов информации и на основе этого формировать оптимальные решения и управления. Одним из основных направлений применения экспертных систем в управлении стала концепция ситуационного управления, которое реализует не только управление объектом, его параметрами и структурой, но и каждому классу ситуаций, возникающих при функционировании системы, определяется решение по управлению.
10.1.2. Системы ситуационного управления. Реальным направлением прикладного развития технологии искусственного интеллекта стало ситуационное управление [12, 13], основанное на управлении сложными техническими и организационными системами на основе логико-лингвистических моделей по текущим ситуациям.
В работе Д. А. Поспелова [12] ситуационное управление в отличие от традиционного управления характеризуется рядом свойств, отличающих его от изучаемого в традиционной теории управления:
Перечисленные свойство дистанционного управления делают понятным, что его применение нацелено на те ситуации, когда изменяется структура объекта управления, в которой участвуют люди, когда происходит адаптация технических систем и людей к конкретной ситуации. При этом при принятии решения ЛПР и реализации управления должен учитывать как текущую ситуацию (информацию о структуре управления и функционирование объекта в данный момент времени), так и полную совокупность ситуаций (информацию о состоянии систем управления и технологии управления на всем жизненном цикле функционирования системы). При этом процесс ситуационного управления реализуется на основе реализации следующих элементов (рис. 10.2 [12]):
Рис. 10.2. Схема реализации ситуационного управления в текущей ситуации.
Из рассмотренной схемы ситуационного управления можно выделить ряд особенностей, присущих ситуационному управлению как разделу теории искусственного интеллекта:
Для построения метода ситуационного управления в работе используются семиотические модели, которые основываются на формальной модели, задаваемой четверткой
М = < Т, Р, Ф, П>, (10.1)
где Т множество базовых элементов, Р синтаксические правила, А система аксиом, П семантические правила,
а также формальной модели L, называемой интерпретированной формальной моделью
L = <Z, D, H, V>,
в которой Z множество интерпретируемых значений,
D правила отображения, которые дают отображения Т Z и обратное Z Т, т.е. приписывает каждому отображению Т некоторое интерпретирующее отображение,
H правила отображения,
V правила интерпретации, позволяющие приписывать любой синтаксически правильной совокупности базовых элементов некоторое интерпретирующее значение.
Тогда семиотическая модель С описывается следующей четверткой
С = <М, χТ, χР, χА , χП>, (10.2)
где χТ, χР, χА , χП соответственно правила изменения Т, Р, А, П.
Использование семиотической модели С в отличие от формальных моделей позволяет в процессе ситуационного управления изменять все элементы формальной модели Т, Р, А, П и благодаря этой способности строить модели для текущих ситуаций соответствующие человеческой деятельности. Использование знаков делает ситуационное управление эффективным. Так как человек окружен знаковыми системами, то он получает возможность договариваться со своими партнерами о синтаксисе, семантике и прагматике знаков.
Завершая короткое рассмотрение метода ситуационного управления можно отметить, что ситуационное управление позволяет описывать ряд конфликтных ситуаций, в которых требуется принимать конкретные решения. Вместе с тем большой класс реальных задач по управлению в условиях конфликта, связанных с социально-экономическими, военными, глобальными изменениями в экосфере, политическими преобразованиями основываются на теории игр, которая является разделом математики и предполагает использование формальных моделей. Поэтому для успешного использования ситуационного управления для принятия решений в условиях конфликта требуются создание сценариев с использованием всего инструментария теории игр [13].
10.1.3. Системы управления структурной динамикой сложных технических объектов. Новым, интересным и перспективным направлением развития искусственного интеллекта стали работы по методологическим и методическим основам теории управления структурной динамикой сложных технических систем [3, 14-17]. Направление предлагает использовать модельные комплексы с различными моделями, комбинированные методы, алгоритмы и методики, а также разработка интеллектуальной технологии автоматизированного проектирования систем мониторинга и управления сложных технических объектов в различных условиях изменения обстановки.
При исследовании управления сложной технической системой (т.е. с учетом сложности ее структуры, функционирования, стратегии принятия решений, выбора поведения и развития) изучаются процессы мониторинга и управления структурной динамикой сложной системы. Процесс мониторинга и управления анализирует переход структуры системы из одного в другое макросостояние под действием различного рода причин (внутренних, внешних, объективных, субъективных, воздействий внешней среды, конфликтующих систем и т.п.). В качестве примеров исследуемых сложных технических систем в работах [3, 17] рассмотрены следующие системы:
Место теории управления структурной динамикой сложных технических систем авторами определяется как интеграция искусственного интеллекта с системным анализом, исследованием операций теорией управления и теорией систем, т.е. требует междисциплинарных исследований [3]. Концепция проблемы управления структурной динамикой сложных технических объектов, которые могут состоять из человеко-машинных подсистем, сводится к решению следующих основных задач:
Содержательное решение задачи управления структурной динамикой сложной технической системы определяется нахождением последовательности плановых и регулирующих воздействий на параметры, элементы, объекты, подсистемы, структуры и систему в целом, при котором для каждого сценария изменения воздействий внешней среды на систему обеспечивается оптимальный переход ее из текущего в требуемое состояние.
Центральную роль в управлении структурной динамикой сложной технической системы отводится интегрированным системам поддержки принятия решения и их ядру специальному программно- математическому обеспечению поддержки решений, которые в содержательном плане должны отвечать следующим требованиям [3]:
Проведенный анализ требований к информационным системам поддержки принятия решений сложных технических систем показал, что применение только одного класса моделей (или математических, или логико-лингвистических, или логико-алгебраических и др.) не позволяет получать достоверные результаты, что делает необходимым использовать системный подход к решению проблемы моделирования, когда используются различные модельные многоуровневые описания.
В качестве одного из видов модели обобщенных вычислительных моделей представления знаний используется семантическая сеть, вершинам которой сопоставляются денотаты предметной области, а дугам отношения между ними. В этом случае вычислительная модель полностью определяется предметной областью и определяет четверкой множеств: переменных или параметров технической системы, отношений на множестве параметров, предикатов (предметными элементами которых являются элементы), отображения, ставящие в соответствие каждому отношению элемент.
Практическое приложение методических разработок мониторинга состояния и управления структурной динамикой сложных технических объектов связано с созданием интеллектуальных информационных технологий с решением типовых задач:
Методология и методы интеллектуальной технологии мониторинга и управления сложными техническими объектами по сравнению с традиционным структурно-функциональным синтезе облика сложных технических систем позволяют более эффективно решать следующие задачи:
- осуществлять интегрированный синтез функциональной и технической структур сложных технических систем в рамках единого формального описания рассматриваемой предметной области;
- планирование целесообразного поведения с учетом реальных ситуаций и состояния системы;
- существенно сократить размерность систем управления структурной динамикой;
- обеспечить адекватность получаемой информации целям функционирования системы;
- повысить эффективность обсуждения результатов по управлению структурной динамикой на концептуальном, алгоритмическом, информационном, программном уровнях описания;
- успешно решать проблемы унификации специального программного обеспечения;
- непосредственно связать те общие цели, на достижение которых ориентировано функционирование системы, с целями, которые реализуются в ходе управления структурами;
- обоснованно определять и выбирать выполнение операций и действий, связанных с изменением структурной динамики сложной технической системы.
Несомненно, что разработанная методология и технологии, а также полученные результаты при исследовании интеллектуальных технологий мониторинга и управления структурной динамикой сложных технических систем, найдут практическое применение при создании ситуационно-аналитических центров государственного управления, многочисленных оперативно-ситуационных центров МЧС России и других министерств и ведомств, демонстрационных и управленческих центров корпораций, учебных центров университетов и академий.
10.1.4. Идентификация и классификация интеллектуальных систем. Интеллектуальные системы всегда обладают качествами высокоорганизованной материи, связанной с обработкой знаний, способностью понимания, рассуждения и познания, которые сегодня наиболее развиты у человека.
Вместе с тем с использованием вычислительной техники были начаты работы по искусственному интеллекту и фактически начались исследования по двум направлениям [4]. Первое направление исследований связано с моделированием деятельности мозга или созданием технического разума, а второе с использованием вычислительной техники и программирования для создания технологии обработки, хранения и создания знаний, т.е. создание новой информационной технологии. Понятно, что искусственный интеллект по своему носителю и средствам обработки знаний существенно отличается от человеческого и других видов интеллекта, но между различными классами интеллектов и соответственно интеллектуальных систем имеются общие свойства и элементы.
В работах профессора А. В. Чечкина [19-21] были исследованы следующие основные свойства интеллектуальных систем:
Концепция функционирования интеллектуальных систем основывается на основе моделей поведения живых систем, изложенной в теории функциональных систем П. К. Анохина [23] дальнейшим ее развитием Судаковым К. В. [19], который ввел понятие системоквант, определенного как целенаправленная физиологическая подсистема живого существа, активируемая для удовлетворения некоторой его потребности и определяющая его поведенческие акты.
В настоящее время принято выделять пять основных классов интеллектуальных систем [19]:
Отличием интеллектуальных систем от кибернетических систем, в которой реализуется постоянно действующий (всегда активный) алгоритм решения одного типа задач, состоит в том, что в ней есть оценивание, запоминание и учет собственного поведения. В зависимости от ситуации, используя память о своем поведении (рефлексию), интеллектуальная система активизирует сильно формализованную подсистему (системоквант) и тем самым осуществляет управление своим поведением в зависимости от сложившейся ситуации.
В работе [3] к искусственному интеллекту следует относить те информационные технологии, которые обеспечивают возможность обработки знаний и обеспечивают выполнение следующих операций:
Интеллектуальная система это целенаправленная система выбора доминирующей (очередной) задачи из допустимого для данной интеллектуальной системы класса, поиск решения такой задачи, закрепления опыта решения ее и, если необходимо, изменение допустимого класса задач.
В простейшем случае интеллектуальная система является двухуровневой. Первый уровень это рабочая область, в которой находятся средства решения задачи. Рабочая область представляет сеть базовых элементов и содержит средства решения задач только с объектами внешней и внутренней предметной области. Базовыми элементами являются интеллектуальные датчики (подсистема сбора семантической информацию части объектов предметной области), интеллектуальные исполнители (подсистема изменения части объектов предметной области), локальные базы данных и знаний (основными понятиями баз знаний являются продукция, ультраоператор, информационная производная оператора и др. [21]), модели объектов и отношений между ними. Базовые элементы образуют структурную организацию и поведенческие особенности интеллектуальной системы. Базовые элементы объединяются в ансамбли (операторные схемы), которые называют радикалами. Рабочая среда интеллектуальной системы образуется из радикалов. Активизация радикалов (их включение для работы и образование на их основе различных схем решения задач) в интеллектуальной системе осуществляется активизирующей подсистемой.
Рабочая область состоит из ультрасреды, где хранятся базы данных и преобразовываются в базы знаний семантической информации; терминальной среды, в которой реализуется сбор и использование семантической информации; опорной среды, в которой собраны модели, аналоги внешней предметной области, она предназначена для прогнозирования процессов вне системы и внутренней эмпирической деятельности.
Второй уровень- это административная область, реализующая постановку задачи, планирование ее решения, прогнозирование будущего результата, активизирование средства решения сформированной задачи, контролирование средств решения задачи, закрепления опыта решения задачи расширение рабочей области. Административная область является активной подсистемой, которая имеет главной функцией активизировать средства из рабочей области для решения задачи.
Интеллектуальная система является многоуровневой и иерархической системой, которая получается из простейших систем заменой некоторых ее базовых элементов интеллектуальными подсистемами. В настоящее время примером интеллектуальной системы может служить сеть Интернет, в которой реализуются профессиональные ориентированные локальные базы знаний и локальные базы данных. Экспертных систем, многочисленные модели разных прикладных областей. Сама сеть представляет собой рабочую подсистему, а пользователи системы выступают в роли в роли активизирующей подсистемы. В целом они могут рассматриваться как интеллектуальная система.
В процессе работы интеллектуальной системы наблюдаются, как правило, следующие взаимодействующие процессы [19]:
Завершая рассмотрение интеллектуальных систем можно отметить, что их применение обеспечивает успешное решение задач при априорной неполноте и нечеткости исходных данных, вариабельности и неточности характеристик исследуемого объекта, более эффективного принятия решений в различных ситуациях, связанных с конфликтами. В результате достигнутых успехов в исследованиях по искусственному интеллекту появляется возможность на основе использования новых интеллектуальных информационных технологий создавать более эффективные по сравнению с традиционными системами управления системы интеллектуального управления (ИСУ).
10.2. Структура систем интеллектуального управления
Построение структуры системы интеллектуального управления связано в первую очередь с построением модели системы, в которой должны быть определены как традиционные элементы системы управления, так и модели обработки знаний, реализуемые интеллектуальной системой. В интеллектуальной системе управления новыми элементами по сравнению с традиционной системой управления являются все интеллектуальные преобразования или элементы управления знаниями, которые связаны с реализацией искусственного интеллекта, т.е. с использованием технологий экспертных систем, базы знаний, принятия решений, ассоциативной памяти, нечеткой логики, семиотических сетей, управления структурной динамикой и т.п. Анализируя принятые структуры систем управления с решающими устройствами [22] можно и для обобщенной интеллектуальной системы использовать аналогичную структуру (рис. 10.3), которая взаимодействует с внешней средой и в процессе ее получения от нее необходимой информации формирует цель действия и анализирует воздействия на систему (физические и информационные). Определяющими элементами системы управления в этом случае являются: интеллектуальный преобразователь и базовая система управления [18].
.
Рис.10.3. Обобщенная схема системы интеллектуального управления.
Можно заметить, что использование интеллекта человека строиться на основе рассмотренной структуры, когда человек участвует в управлении в качестве интеллектуального преобразователя, согласованного с внешней средой через специализированные датчики и реализующий воздействие на систему управления через ручку управления или интерфейс взаимодействия с компьютером. В практике управления подвижными объектами такие системы получили специальное название. Системы управления подвижными объектами (в авиации, в космической технике, автомобиле и других транспортных средствах) получили название систем полуавтоматического управления, когда используется способность человека наблюдать и оценивать ситуации, возникающие при движении объектов, и формировать непрерывное управление ими. В системах ручного управления на человека оператора возлагаются дополнительные функции по управлению движением подвижным объектом, связанные с тем фактом, что он осуществляет полностью функции базового управления и воздействует на органы управления. В ручных системах управления человек оператор рассматривается как звено управления, формирующее закон и программу управления. В автоматизированных системах управления (автоматизированным управлении космическим кораблем, атомной электростанцией и других подобных системах управления) человек оператор оказывает воздействие на базовую автоматическую систему через вычислительные системы, что адекватно может быть описано предлагаемой структурой.
В случае использования в системе управления искусственного интеллекта в качестве интеллектуального преобразователя реализуются [18]:
- экспертные системы [11, 15];
- ситуационное управление [12,15];
- управление структурной динамикой сложных технологических [3] и другие интеллектуальные системы и их элементы.
Интересным примером использования интеллектуального преобразователя в системе управления является использование динамической экспертной системы, структура которой предложенного в работе [18] в виде двух блоков: синтеза и реализации цели (Рис. 10. 4).
Рис. 10.4. Структурная схема системы интеллектуального управления с динамической экспертной системой.
Математическая модель интеллектуальной системы управления состоит из трех частей:
Интеллектуальный преобразователь представляет из себя логико-преобразующее устройство, который преобразовывает информацию о внешней среде и объекте управления трансформирует в сигналы Y, в сигналы воздействия на управляющие устройства системы [18]. Математическая модель интеллектуального преобразователя описывается множествами (10.1, 10.2), ультраоператорами [19-21], или оператором вида
Y = F(x, u, w, p, z), (10.3)
где
F(.) некоторый оператор интеллектуального преобразования, характеризующий структуру или и работу интеллектуального преобразователя,
x вектор состояния системы управления,
u вектор управления,
w вектор воздействий внешней среды,
p- вектор сигналов цели,
z- вектор параметров объекта.
Объект управления в достаточно общем случае описывается уравнениями вида:
.
x = f(x, u, w, z, t), y= C(x), x(t0) = x0, t≥ t0, (10.4)
где
f(.) вектор функция, описывающая объект управления,
С(.) заданная функция выходных сигналов,
t координата времени,
y- вектор выхода или измерений.
Управляющее устройства системы (вычислительных и преобразующих и исполнительных устройств) формируют управляющие воздействия на объект управления u из множества его возможных значений в соответствие с решаемой задачей для достижения сформированной интеллектуальным преобразователем цели.
Для формирования воздействий на систему управления объектом в интеллектуальном преобразователе используется блок принятия решения, который может быть рассмотрен как самостоятельный элемент. Блок принятия решений формируется на основе теории принятия решений [25 - 27].
10.3. Модели принятия решения в условиях конфликта
Основные этапы процесса принятия решения согласно теории принятия решения декомпозируются на следующие этапы [27]:
Определение цели решения возникшей проблемы реализуется в блоке интеллектуального преобразователя, получающего и обрабатывающего информацию о внешней среде с системы датчиков. В условиях конфликта цель может зависеть от имеющихся ресурсов и факторов, которые образуют проблемную ситуацию, т.е. ситуацию принятия решения в условиях конфликта. Способ действия для управлении объектом в процессе принятия решения называют стратегиями, а результат к которому может привести выбранная стратегия называют исходом. Условия конфликта порождают факторы, воздействующие на стратегию и соответственно на управление, реализуемое интеллектуальной системой. С точки зрения наличия информации об условиях конфликта факторы разделяются на две группы:
В зависимости от происхождения неопределенные факторы делятся на случайные и неопределенные нестохастического характера, состоящие из природных и стратегических. Математическая модель принятия решений формируется с учетом всех факторов и имеющейся о них информации. Упрощенная модель принятия решения в этом случае может быть описана следующей системой
D0 = < Y, G, U, L, J, Ω>, (10.5)
где
Y- множество исходов (результатов);
G- модель предпочтений исходов (принимаемых решений);
U- множество стратегий принятия решений,
L- множество возможных значений неопределенных факторов;
J- функция, определяющая взаимосвязь неопределенного фактора и исход, получаемый в результате принятого решения;
Ω- вся остальная информация о принимаемом решении в формализованном виде( сведения о конфликте, предпочтения других лиц , участвующих в конфликте и др.).
Удобство использования модели (10.5) в условиях конфликта определяется тем положением, что она позволяет просто и наглядно связать значения неопределенных факторов и стратегий с управлением, реализуемым интеллектуальной системой. Множества Y, G, U, L и функция J формально задают компоненты принимаемого решения и определяют связь с системой управления через понятия критерия и показателей эффективности системы. В теории управления наиболее часто отношения предпочтения описываются с помощью специальных функций : показателей качества и критериев. Под показателем W качества или эффективности системы управления понимается мера степени соответствия реального результата управления Y требуемому Yтр для достижения цели и получения оценок или измерений интенсивности исходов. Под критерием К понимается правило, позволяющее сопоставлять принимаемые решения и стратегии с точки зрения выбранных показателей оценок исходов. Критерии вводятся на основе определенной концепции рационального поведения интеллектуальной системы [25]: пригодности, оптимизации и адаптивизации.
Более общей моделью принятия решения в условиях конфликта по сравнению с (10.5) является модель динамической системы интеллектуального управления на основе моделей теории игр [28, 29] и современного аппарата функционального анализа [30].
Теория игр как раздел математики в настоящее время стал теорией математических моделей [29] . При этом под конфликтом понимается явление, которое связано с ответом на вопросы:
Для описания конфликта вводится понятия:
Тогда формальное описание конфликта состоит в задании системы
Г = < RД , SRД, S, RИ, GRИ >, (10.6)
где
SRД- множество стратегий коалиции действия;
GRИ множество отношений коалиции интересов,
при этом множества и отношения, которые связаны между собой в соответствие со сделанными выше их описанием в зависимости от конкретного содержания конфликта.
В работе [30], как и в ряде других исследованиях по общей системной теории управления, предложено рассматривать динамические системы управления состоящие из объекта управления, характеризуемого некоторым множеством состояний, и регулятора, под которым понимается математическая модель, состоящую из элемента, обеспечивающего оценку состояния объекта, и элемента, формирующего управление.
Для описания динамической системы используется математическая модель совокупности элементов, удовлетворяющих следующим основным аксиомам:
А. Заданы множества моментов времени Т, множество состояний системы Х. Множество значений входных воздействий U, непустое множество их допустимых значений
= {: TU}, (10.7)
множество значений выходных величин Y и множество их допустимых значений
= {: TXY}. (10.8)
В. Множество Т есть некоторое упорядоченное подмножество множества вещественных чисел (направление времени).
С. Существует переходная функция
Ф={: ТТХХ}, (10.9)
где состояния системы х(t) =[t, t0, x(t0), ]X.
D. Задано входное отображение
= {: TXY}. (10.10)
Приведенная модель в наиболее общем виде динамического объекта или системы изображена на рис.10.5.
Рис.10.5. Множественная схема динамической системы.
Для описания динамической системы используются дополнительные термины. Так, состояние системы х в момент времени t, или пара элементов множества TX называется событием (или фазой) динамической системы. Множество TX называется пространством событий, или фазовым пространством. В том случае, когда множество выходных воздействий используется для управления, то оно называется управлением. Управление переводит систему из одного состояние в некоторое другое. При этом система находится в движении, описывая в пространстве состояния траекторию. В рассмотренной формализации динамическая система рассматривается как объект управления.
Для реализации систему управления в классической теории систем выделяют объект управления и регулятор управления, состоящий в простейшем случае из элемента оценки состояния системы и элемента, формирующего закон управления. Так как объект управления нами уже рассмотрен как динамическая система, то введем понятия закона управления и оценки состояния системы.
Законом управления принято называть отображение
k : TX U, (10.11)
где величины u(t) = k[t; x(t)] управления, принадлежащие множеству U.
Для реализации управления необходимо знание переменных состояния системы х(t), что требует операции определения обратного отображения
-1 : Y X (10.12)
и тогда координаты системы определяются из условия
x(t) = -1[y(t)]. (10.13)
Кроме того для оценки состояния системы необходимо оценивать точность определения x(t), т.е. получать оценку состояния x0(t).
Рис.10.6. Структурно- логическая схема блока основного управления системы.
Структурно логическая схема системы управления, состоящая из объекта управления и регулятора, показана на рис. 10.6. Для учета факторов воздействия внешней среды и конфликта необходимо провести учет воздействий этих объектов. При этом факторы внешней среды и условий конфликта необходимо рассматривать и описывать с позиций динамической системы.
При принятии решения в системе интеллектуального управления возникает необходимость объединения интеллектуального преобразователя, включающего блок принятия решения, и динамическую систему управления.
10.4. Определение оптимальной интеллектуальной системы принятия решения и управления в условиях конфликта
Понятие оптимальности получило широкое распространение в теории управления и теории принятия решений [13, 22-25]. Под оптимальной системой автоматического управления понимают «наилучшую» систему, которую выбирают из множества систем по принятому показателю качества системы или эффективности ее функционирования. При этом система является оптимальной, если она обеспечивает экстремум принятого показателя. В зависимости от конкретного вида показателя понятие оптимальности связывается с критерием, т.е. с минимумом или максимумом показателя. Если, например, в качестве показателя используется средняя квадратическая ошибка системы, то оптимальной системой считают ту, которая реализует критерий минимумом средней квадратической ошибки. Если же в качестве показателя используется вероятность невыхода ошибки системы из заданных допусков, то оптимальной считают ту систему, которая реализует критерий максимум невыхода ошибки системы из заданных допусков.
Принятие решений в условиях определенности (фиксированности) факторов и в случае, когда неопределенность является случайной и о факторе имеется полная априорная информация, то оптимальность решения определяется аналогично тому, как это делается в системах автоматического управления.
В условиях стратегической (поведенческой) неопределенности, которая появляется в условиях конфликта, понятие оптимальности принимаемого решения значительно труднее поддается формализации. Теория математических моделей принятия оптимальных решений составляет значительную часть науки, которая получила название исследования операций [1]. Особое место в исследовании операций занимает раздел, занимающейся теорией математических моделей принятия оптимальных решений в условиях конфликта, который получил название теории игр [29]. Теории игр, как теория математических моделей базируется на использовании формальных, знаковых моделей для описания конфликта, а также использует формальные средства их анализа. В теории игр успешно были реализованы определения понятия конфликта и принятия решения. В тоже время понятие оптимальности удалось в настоящее время реализовать только для части игр. Поэтому при анализе систем принятия решений и управления мы ограничимся рассмотрением только тех конфликтов, которые описываются моделями бескоалиционных (множества коалиций действия и интересов совпадают, определены функции выигрыша) и антагонистических (число игроков равно двум, а значения их функций выигрыша в любой ситуации равны и противоположны по знаку) игр. Для бескоалиционных и антагонистических игр условия оптимальности основываются на понятии равновесия.
Вопрос об оптимальности управления и принятия решений в интеллектуальных системах усложняется и тем фактом, что для реализации системы используются экспертные знания, которые не всегда удается реализовать. Эта трудность преодолевается за счет допущения, что в системе реализуется интеллектуальный датчик, который однозначно определяет информацию о действиях другой стороны за счет физических измерений действия противоположных игроков, воздействующих на систему управления и принятия решения в условиях конфликта. Фактически в интеллектуальной системе реализуется рациональное управление и принятие решения. Достоверность и степень приближения к точному оптимальному управлению и принятию решения определяется той информацией, которую получает, отрабатывает и выдает интеллектуальная система, или интеллектуальный датчик. При этом в результате ошибок интеллектуального датчика, связанных с использованием экспертных знаний, появляются риски, связанные с ошибочным формированием цели принятия решения и управления, определением показателей и критериев оценки эффективности работы системы, выбором лучшей системы. Для уменьшения рисков в интеллектуальной системы используются методы обучения и самообучения, которые в настоящее время начинают разрабатываться в интеллектуальных системах и которые всегда присутствовали в биологическом интеллекте [17-21].
Решение задач синтеза систем оптимального управления и принятия решения в условиях конфликта традиционно связаны с математическими методами отыскания экстремумов функций и функционалов, нахождения равновесных состояний, что позволяет решать задачи синтеза систем управления и принятия решений в практически важных случаях.
Рассмотрение структуры систем интеллектуального принятия решения и управления в условиях конфликта (рис. 10.7) показывает, что система состоит из трех основных элементов (подсистем), каждый из которых имеет свои модели и специфические методы исследования:
- интеллектуальная подсистема;
-подсистема принятия решения;
- подсистема управления объектом и объект управления.
Рис.10.7. Структура интеллектуальной системы принятия решения и управления в условиях конфликта, порождаемого конфликтующими системами.
Не смотря на свою сложность и методологические особенности элементов интеллектуальных систем принятия решения и управления в условиях конфликта при определении оптимальной системы, удается выделить следующие основные задачи:
Формирование модели условий конфликтного взаимодействия оптимизируемой системы с другими системами основывается в простейшем случае с позиции теории игр как конфликт двух игроков (А, В). При этом конфликт рассматривается как операция, в которой игроки имеют различные цели и реализуют свою деятельность и выбирают свои стратегии в соответствии со своими целями рис.10.8 [1, 24-26]. Исследование операции проводится всегда с точки зрения одного игрока, а в рассматриваемом случае это проводится с позиции интеллектуальной системы принятия решения и управления (для определенности примем, что в конфликте это игрок А). Будем считать, что эффект достижения цели определяется векторными показателем W = (WА, WВ) и критерием К = (КА, КВ), связанные с целями поведения сторон. При этом в зависимости от наличия датчиков получения информации о целях действия игроков предполагается, что идентификация целей позволяет интеллектуальной системе определять критерии и показатели, используемые игроками для идентификации показателей и критериев игроков.
W
Рис. 10.8. Общая схема конфликта как операции двух систем с разными целями.
Вопросы формирование интеллектуальной подсистемы, включающей датчики, базу знаний, блоки экспертизы, оценки состояния, формирования целей, выбор показателей и критериев оптимизации системы и других элементов интеллектуальной деятельности были рассмотрены в первом разделе лекции, когда анализировались интеллектуальные системы и их элементы.
Принятие решений, обеспечивающих оптимальное противодействие одной или нескольким конфликтующим системам конфликтующим системам, основывается в условиях конфликта на использовании моделей, методов и алгоритмов принятия оптимальных решений в теории игр. В рассматриваемом нами случае мы ограничиваемся матричными антагонистическими (игры двух лиц с нулевой суммой), которые имеют развитый инструментарий решения прикладных задач [24-28]1.
Определение и математическое описание классов допустимых систем управления объектом управления основывается на теории систем управления [1, 31]. В основе рассматриваемой задачи оптимизации системы управления объектом используется подход, основанный на использовании корреляционной теории статистической оптимизации систем, разработанной профессором Н. И. Андреевым [22, 32]. В его работах разработаны методы исследования сложных линейных и нелинейных динамических систем, подверженных случайным воздействиям. При постановке задач определения оптимальных динамических систем по статистическим критериям (по минимуму средней квадратической ошибки системы, максимуму вероятности невыхода ошибки системы из заданных допусков и др.) им разработана методология учета ограничений типа неравенств, накладываемые на функции управления и вектора. Большое внимание им уделено исследованию динамических систем с заданной структурой, так как для прикладных задач эти системы играют, с одной стороны, важную роль, а, с другой стороны, приводят к значительному усложнению математических задач оптимизации этого класса систем. В его работах исследовано ряд новых задач, относящихся к оценке параметров системы, фильтру Калмана, синтезу нелинейных динамических систем, построению адаптивных систем оценивания и управления, развитию методов принятия статистических решений, определению оптимальных систем управления с решающими устройствами.
Модели систем управления, которые являются подсистемой интеллектуальной системы принятия решений и управления в условиях конфликта, на базе теоретико-множественного подхода описаны в разделе 10.3, где они заданы основными соотношениями (10.7-10.13).
Отыскание экстремума критерия или точек равновесия в игровых задачах, а также соответствующих им характеристик, для построения интеллектуальной системы принятия решений и управления в условиях конфликта основывается на современной теории игр в тех случаях, когда удается формализовать все элементы и факторы конфликта. Для формализации задач интеллектуальной обработки информации могут быть использованы методы информационной математики, которые были проанализированы в разделе 10.1.4.
Проиллюстрируем проведенный анализ постановки задачи определения оптимальной интеллектуальной системы принятия решения и управления в условиях конфликта на простом примере, который был рассмотрен в работе [33] в иной постановке задачи оптимизации.
Пример. Рассмотрим задачу определения интеллектуальной системы принятия решения и управления, на вход которой поступает сигнал, представляющего сумму полезного сигнала G(t) и помехи Z(t). При этом будем предполагать, что слежение за полезным сигналом осуществляет интеллектуальная система управления (игрок А), а помеху формирует противоположная сторона (игрок В), которая выбирает характеристики такими, чтобы ошибки следящей системы были большими. В результате возникает конфликт, который часто рассматривается в теории игр. Для наглядности и простоты изложения будем полагать, что каждая из сторон имеет две стратегии управления и по этой причине можно ограничить решение задачи на основе матричной и биматричной игр.
Пусть помеха представляет собой нормально распределенный белый шум с интенсивностями (α1, α2), выбором величины которых управляет игрок А. Полезный сигнал G = G0 числовая случайная величина, принимающая значения β0 и -β0 с вероятностью 0,5, величина которых формируется игроком А и может принимать значения (β01, β02).
Желаемая выходная величина формируемой системы слежения - полезный сигнал. Система выбирается на классе стационарных систем, время регулирования которых не превосходит время Т.
В качестве показателя качества системы принимается суммарная ошибка системы ошибка системы D∑, которая определяется биноминального распределения полезного сигнала D1 и случайным характером помехи D2. Следуя работе [32], запишем ошибки системы в следующем виде:
Т Т
D1 = ∫ ∫ δ(τ1- τ2)ω(τ1 ) ω(τ2 )d τ1d τ2,
0 0
где
δ(τ1- τ2) дельта-функция, принимающая нулевое значение, если ( τ1- τ2)≠0, и равна ∞, если( τ1- τ2)=0 ;
ω(τ1 ) весовая функция при переменной τ1;
ω(τ2 ) весовая функция при переменной τ2 ;
Т
D2 = (β0 )2 { ∫ ω(τ) d τ1 - 1}2;
0
D∑ = D1 + D2.
Базовая подсистема управления будет описываться весовой функцией, параметры которой зависят от решения игровой задачи и выбора подсистемой интеллектуального управления цели системы и соответствующих показателей и критериев оптимизации.
Тогда для иллюстрационного примем Т =1 и выражение для весовой функции можно записать в виде
ωIJ(τ ) = β20J (αi + β20J )-1 ,
где управление реализуется в виде весовых функций в зависимости от стратегий игроков (В - максимизирует дисперсию ошибки, а А -минимизирует ошибку слежения).
В этом случае дисперсии для принятой весовой функции записываются в следующем виде, учитывающем стратегии игроков
D1IJ= αi (αi β-20J +1)-2,
D2IJ = αi 2 β20J (αi + β20J )-2.
Интеллектуальная подсистема В, наблюдая с помощью своих информационных и физических датчиков за игроком А, определяет его действия и формирует свою стратегию движения в каждой конкретной ситуации. Возникает задача ситуационного управления движением, когда решения и управления должны осуществляться в соответствие с той ситуацией, которая складывается в текущий момент конфликта.
Одной из сложных задач в этом случае является задача определения типа антагонизма между игроками и определения целей действия систем, выяснения их интересов. В практике конфликтных ситуаций о действиях другой стороны или игрока, как правило, используется информация, получаемая через информационные сообщения, телекоммуникационные сети и путем сбора различными способами конфиденциальной информации. При реализации интеллектуальной экспертной системы используются эксперты и их оценки, но и возможен аналитический подход к решению идентификации намерений и цели противоположной стороны на основе анализа конфликта. Если реализуется интеллектуальная подсистема на основе ситуационного управления, то возможна декомпозиция общей задачи на две части, когда интеллектуальная подсистема идентифицирует конкретную ситуацию, а управление в конкретной ситуации формируется на основе решения игровых задач для определения неопределенных стратегий, или неопределенных параметров противодействующей стороны. Вместе с тем интеллектуальная подсистема должна определять тип модели игры в конфликте. Возникает вопрос, как это может реализовать интеллектуальная подсистема. Существует ли такая возможность?
Покажем возможность оценки действий противника на основе обработки информации по решению задачи с помощью теории игр. Для этого проанализируем результаты принятия решения при реализации матричной антагонистической игры. Вначале рассмотрим влияние конфликта на управление на примере единичной ситуации, когда время управления Т фиксировано и единственное, а затем рассмотрим условную модель ситуационного управления на основе сценария, в котором достижение цели обеспечивается несколькими ситуациями управлениями в разные моменты времени Тν.
Примем, что игроки могут реализовать по две стратегии, т.е. конфликт описывается матрицей размерности 2х2, где (β201 = 1, β202= 2) значение стратегий игрока В и (α1 = 1, α2 = 2) значение стратегий игрока А. В этом случае при принятых исходных данных матрицы выигрышей можно записать в следующем виде:
Стратегии В \ А β201 = 1 β202= 2 Min по j Max min = α1 = 1 0,5 0, 667 О,5 0,5 α2= 2 0, 333 0,4 0,4 Max по i 0,5 0,667 |
|
Min max = |
0,5 |
Стратегии В \ А |
β201 = 1 |
β202= 2 |
Min по j |
Max min = |
α1 = 1 |
0, 25 |
0,011 |
0,011 |
|
α2 = 2 |
0,011 |
0,08 |
0,08 |
О,08 |
Max по i |
0,011 |
0,08 |
||
Min max = |
0,08 |
Стратегии В \ А |
β201 = 1 |
β202= 2 |
Min по j |
Max min = |
α1 = 1 |
0,75 |
0,678 |
0,678 |
|
α2 = 2 |
0,344 |
0,48 |
0,48 |
0,48 |
Max по i |
0,75 |
0,48 |
||
Min max = |
0,48 |
Все три антагонистические игры имеют седловые точки
max min Dµij = min max Dµ, µ=(1, 2, 3), i=J=(1, 2)
i j j i
в чистых стратегиях, но цены игр у них разные. Интересным результатом анализа дисперсий ошибок анализируемой системы является то, что гарантированная суммарная ошибка системы (равна 0,48) меньше гарантированной ошибки, получаемой только при учете нормальной составляющей ошибки (равной 0,5). Понятно, что полученное уменьшение дисперсии суммарной ошибки в результате отказа от стратегии α1, которая ведет к увеличению дисперсии нормальной составляющей ошибки. Это также связано с тем, что дисперсии ошибок от изменения сигнала помехи существенно меньше при α2 влияют на дисперсию D1. По этой причине , если игрок А будет выбирать свою стратегию из условия увеличения дисперсии помехи, то он может быть наказан игроком В, который в этом случае может реализовать свою стратегию β201 = 1 (провести адаптивное управление) благодаря этого получить дополнительный выигрыш, который будет равен 0,344, т.е. меньше гарантированного выигрыша на 0,135 (уменьшает дисперсию на 28.5%). Таким образом интеллектуальная подсистема на основе получения оценок интенсивности шума сожжет определить, какой стратегии придерживается игрок А при противодействии игроку В. Логика рассуждений интеллектуальной подсистемы может быть продолжена в том направлении, если игрок В откажется от использования гарантированных оценок, а будет применять критерии: минимаксного сожаления Сэвиджа, пессимизма-оптимизма Гурвица, «недостаточного основания» Бернулли [25, 27].
Рассмотрим теперь случай, когда для достижения цели управления необходимо выполнения нескольких операций по слежению, согласно определенному сценарию (рис. 10.9), в котором последовательно реализуются три ситуации со временем управления Т1=1, Т2=2, Т3 =3 а также показано начало работы системы и достижение цели в случае успешного выполнения все планируемых операций.
Рис 10.9. Сценарий на основе сетевой модели, вершины которой соответствуют фактом, а дуги связям.
В качестве критерия эффективности достижения цели примем условие получения оптимальных оценок в каждой ситуации, как это было сделано в первой ситуации при Т1.
Для произвольного Тν дисперсии и определяемые весовые функции будут равны
D1IJ= Тν αi (αi β-20J + Тν)-2,
D2IJ = αi 2 β20J (αi + Тν β20J )-2,
ωIJ(τ ) = β20J (αi + Тν β20J )-1,
где ν = (1, 2, 3), i =(1, 2), J=(1, 2), если использовать данные , принятые в начальных расчетах дисперсий и весовой функции при Т1.
Одним из интересных предложений по развитию интеллектуальной подсистемы для оценки степени антагонизма между игроками и соответственно между интеллектуальными системами в условиях конфликта стало использование теории биматричных игр.
Заключение
В лекции рассмотрена задача определения интеллектуальной системы принятия решения и управления в условиях конфликта. Определение интеллектуальной системы основывалось на возможности декомпозиции системы на три подсистемы: подсистему интеллектуального управления, подсистему принятия решения и подсистемы базового управления, которая организовывала воздействия на объект управления, функционирующий в условиях конфликта.
Вначале лекции рассмотрено современное состояние исследований интеллектуальных систем, которое базируется на анализе основных направлениях развития искусственного интеллекта и его приложениях в информационных системах, связанных с автоматизацией различных видов деятельности человека. Основное внимание в лекции было уделено анализу экспертных систем, ситуационному управлению и интеллектуальным технологиям мониторинга и управления структурной динамикой сложных технических систем. Очень коротко в лекции затронуты вопросы моделирования и исследования искусственного интеллекта на основе теории функциональных систем П. К. Анохина и современного математического описания интеллектуальных систем с помощью радикалов, ультрасистем, ультраоператоров, предложенных и развиваемых в работах А. В. Чечкина.
В основу построения интеллектуальных систем управления положены исследования, выполненные Н. И. Андреевым, который создал теорию статистически оптимальных систем управления и провел оптимизацию адаптивных систем и системам с решающими устройствами. Им первым было предложена декомпозиция сложных динамических систем на базовый или основной контур управления и подсистему решающего устройства, включая и решения на основе теории игр. По аналогии с работами Н. И. Андреева в лекции предложена декомпозиция интеллектуальных систем принятия решения и управления на три взаимосвязанные подсистемы: интеллектуальную, принятия решения и базового управления. Можно при этом заметить, что объединение интеллектуальных подсистем с системами управления в методическом плане является более сложной и приближенной задачей, так как приходится объединять систему слабо формализуемых экспертных и человеческих знаний и формализованные системы управления. Вместе с тем современное развитие интеллектуальных систем убеждает в том, что надежды слияния искусственного интеллекта и систем управления можно ожидать в ближайшее время, что подтверждается большим объемом публикаций крупных ученых в этой области.
Большое внимание в лекции уделено построению моделей конфликта и осуществлена попытка формализации конфликтной ситуации. В основу подхода к построению моделей конфликта положены абстрактные множественные модели, которые находят применение в теории управления и в интеллектуальных системах. В этом плане делаются только первые шаги, но нет сомнений, что на этом направление вполне реально появится возможность решить задачи объединения части разделов теории игр и искусственного интеллекта с теорией управления. Например, базой такого объединения может стать информационная математика.
В заключение лекции я выскажусь о том, что меня давно интересует и фактически определяет мой интерес к задаче оптимизации систем управления в условиях конфликта. Это необходимость объединения систем управления с системами адаптивно-игровыми системами , использование которых открывает широкие возможности эффективного управления различной деятельностью человека в условиях конфликта [33 - 40].
Литература:
International Academe of Engineering, 1994.
1 Матричной антагонистической игрой называют конечные игры двух лиц с нулевой суммой, если в каждой окончательной позиции функция выигрыша равна нулю (сумма показателей игроков противоположна по знаку и равна нулю), и игра описывается матрицей с числом строк, равному числу стратегий одного игрока, и с числом столбцов, равному числу значений другого игрока