У вас вопросы?
У нас ответы:) SamZan.net

Лабораторная работа 3 Энтропия объединения двух систем

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 26.12.2024

Лабораторная работа №3

Энтропия объединения двух систем. Оценка энтропии источника при использовании разных моделей

  1.  Предмет исследования, цели и задачи работы

Предметом исследования лабораторной работы являются методы статистического контекстного моделирования нестационарного дискретного источника.

Цель работы – оценка значения частной условной энтропии нестационарного источника относительно статистики его предшествующих состояний.

В ходе работы требуется произвести моделирование игры «Чёт-нечёт» на основе данных матча двух людей; построить графики эффективности предсказания человеком, предсказаний на основе статистики контекстов разных длин и апостериорной статистики игры; вычислить значения частной условной энтропии загаданного значения относительно нескольких предшествующих  ходов. Отчет по лабораторной работе оформить согласно требованиям ГОСТ 7.32-2001 «Отчет о научно-исследовательской работе. Структура и правила оформления» [].

Задачи лабораторной работы:

а) повторить теоретический материал []: энтропия объединения двух систем, частная и полная условная энтропия системы. При оформлении отчёта использовать материал разделов  и , а также диаграммы приложения А;

б) произвести моделирование игры «Чёт-нечёт» с реализацией предсказания на основе:

  •  генератора случайных чисел (равновероятные исходы);
  •  частот прежде загаданных значений (ожидать то, что чаще встречалось);
  •  одного предыдущего значения (ожидать то, что чаще встречалось после этого значения);
  •  двух последних загаданных значений;
  •  трёх последних загаданных значений.

в) произвести апробацию модели игры на данных игры двух людей; построить диаграммы результативности предсказания:

  •  человеком;
  •  по частотам прежде загаданных значений;
  •  по статистике контекстов разных длин;
  •  по апостериорной статистике контекстов разных длин.

Проинтерпретировать результаты; сравнить с результатами игры с генератором случайных чисел (диаграммы приложения А).

д) выбрать один из ходов (желательно ближе к концу игры, когда имеется достаточная статистика по всем контекстам), ошибочно предсказанный контекстом глубины три, но верно предсказанный более коротким контекстом. По статистике, имеющейся к этому ходу:

  •  вычислить и сравнить значения условной энтропии загаданного значения относительно используемых моделей H (Xk+1 | Yk (3)), H (Xk+1 | Yk (2)), H (Xk+1 | Yk (1)), H (Xk+1 | Yk (0)),  где Yk (n) – контекстная модель, имеющая 2n состояний, соответствующих всем возможным контекстам глубины n, опирающаяся на статистику по сделанным k ходам;
  •  вычислить и сравнить значения частной условной энтропии загаданного значения относительно имеющегося контекста abc: H (Xk+1 | y (abc)), H (Xk+1 | y (bc)), H (Xk+1 | y (c)), H (Xk+1 | y (-)),  где y (abc) – одно из состояний соответствующей контекстной модели Yk (n); y (-) – единственное состояние контекстной модели нулевой глубины Yk (0).
  1.  Энтропия объединения двух систем

Под объединением двух систем X и Y с возможными состояниями x1, x2, … xn и  y1, y2, … ym понимается сложная система (XY), n  m состояний которой (xiyj) представляют собой комбинацию всех возможных состояний систем X и Y. Энтропия системы (XY) вычисляется по формуле:

, ()

где pij – вероятность того, что система находится в состоянии (xiyj).

Если системы X и Y независимы, формулу () можно записать в виде:

H (X, Y) = H (X) + H (Y). ()

Если X и Y зависимы, Y находится в состоянии yj, а X может принять состояние xi с вероятностью p (xi | yj), то частная условная энтропия системы X относительно Y:

. ()

Среднее значение H (X | yj) по всем возможным yj является полной условной энтропией системы X относительно Y:

, ()

где p(yj)– безусловная вероятность наступления состояния yj системы Y.

В общем случае формула энтропии объединения двух систем () может быть записана как:

H (X, Y) = H (X) + H (X | Y) = H (Y) + H (Y | X). ()

Формула () является частным случаем () и максимальным значением H (X, Y) [].

  1.  Моделирование игры «Чёт-нечёт»

Игра «Чёт-нечёт» заключается в угадывании одним игроком двоичного значения, загаданного другим игроком. При продолжительной игре каждая сторона пытается предугадать логику противника по истории прошлых ходов. Победитель определяется в зависимости от количества удачно предсказанных ходов.

Представим загадывающего как двоичный нестационарный источник X, множеством возможных сообщений которого является {0; 1}. Пусть k ходов уже сделано; x1, x2, … xk – история предыдущих загаданных значений; xk+1 – ожидаемое сообщение от X (новое загаданное значение), которое требуется предсказать; xk+1(h) – значение xk+1, предсказываемое человеком.

По ходу игры ведётся следующая статистика: число загаданных за k ходов нулей и единиц fk(0) и fk(1); количество биграмм – загаданных подряд 00, 01, 10 и 11 – fk(00), fk(01), fk(10) и fk(11); а также частоты различных комбинаций загаданных подряд трёх и четырёх значений: fk(000), fk(001), … fk(111) и fk(0000), fk(0001), … fk(1111); всего 2+4+8+16=30 счётчиков. Пусть, например, последними загаданными значениями были xk-2xk-1xk = 010. На основе накопленной статистики могут быть вычислены условные статистические вероятности того, что xk+1=1:

p (1 | 010) = fk(0101)/( fk(0100) + fk(0101)); ()

p (1 | 10) = fk(101)/( fk(100) + fk(101)); ()

p (1 | 0) = fk(01)/( fk(00) + fk(01)); ()

p (1) = fk(1)/( fk(0) + fk(1)). ()

В случае, если контекст 010 уже встречался ранее, fk(0100) и fk(0101) покажут, какое из значений встречалось следом за этим контекстом чаще. Если fk(0100) и fk(0101) не равны, сделаем предсказание xk+1(3) на основе контекста глубины три: если p (1 | 010) > 0,5, полагаем xk+1(3) равным единице и нулю в противном случае. Если fk(0100) и fk(0101) равны, обратимся к предсказанию xk+1(2), сделанному на основе статистики по контексту глубины два и вероятности p (1 | 10). Если и эта статистика не может помочь сделать предпочтение, будем использовать p (1 | 0) и предсказание xk+1(1); и так далее. Если не поможет и p (1), сделаем случайное предсказание с использованием генератора случайных чисел.

Предложенный алгоритм использует пять статистических моделей, каждая из которых способна дать собственное предсказание xk+1(3), xk+1(2), xk+1(1), xk+1(0) и xk+1(-1), где число в верхнем индексе обозначает глубину контекста; глубина ноль означает, что используется безусловные частоты значений; минус один – значения предсказать невозможно, xk+1(-1) является случайным двоичным числом с равновероятными исходами. Для простоты расчётов предпочтение отдаётся контекстам с большей глубиной; младшие контексты используются, только когда старшие не предсказывают.

Приложение А содержит диаграммы с динамикой игры в «Чёт-нечёт» с генератором случайных чисел Microsoft Excel. На обоих рисунках изображены четыре графика, отражающих эффективность предсказания с помощью оценки xk+1(-1) (синяя линия), xk+1(0) (чёрный пунктир), xk+1(3) (красные точки) и xk+1(posterior 3) (тёмно-красные треугольники). Предсказание xk+1(posterior 3) аналогично xk+1(3), только использует апостериорную статистику – значение счётчиков, которое установится после окончания игры. На обоих рисунках по горизонтальной оси отложено количество ходов, а по вертикали на рисунке  – количество удачных предсказаний каждой модели, на рисунке  – отношение числа удачных предсказаний к числу ходов. Диаграммы демонстрируют, что все использованные модели дают в среднем одинаковый результат (со случайным отклонением) – предсказание в 50% случаев. Неэффективность предсказания с помощью использованных моделей объясняется отсутствием контекстной зависимости в последовательности случайных чисел, сгенерированной Microsoft Excel, чего и следовало ожидать.

  1.  Вопросы для самопроверки
    1.  В каких пределах может находиться значение энтропии объединения двух систем и при каких условиях достигаются граничные значения?
    2.  В каких случаях условные энтропии H (X | Y) и H (Y | X) равны? Воспользуйтесь формулой энтропии объединения двух систем, записанной в общем виде.
    3.  Почему предсказание генератора случайных чисел с помощью разных моделей имеет примерно одинаковый результат?
    4.  Почему разные модели одного источника дают разные значения энтропии? Какое из значений энтропии является истинным?
    5.  В лабораторной работе использовались модель случайного угадывания, модель, использующая частоты загаданных ранее значений, и модели, использующие статистику по контексту M последних значений. Какие другие типы моделей могут быть использованы в игре «Чёт-нечёт»? Предложите свою модель, концептуально отличающуюся от перечисленных.
    6.  В каких случаях контекстные модели (анализирующие историю поведения источника и использующие статистические условные вероятности) обеспечивают более точную оценку энтропии источника?
    7.  Может ли контекстная модель, использующая статистику, накопившуюся к концу игры (заглядывающая в будущее), в среднем сыграть хуже, чем точно такая же модель, пользующаяся текущей статистикой? Если нет, то почему; если да, то в каком случае?

Список использованных источников

 Методические указания по оформлению текстовых документов при выполнении учебных заданий студентами всех курсов специальности 220200 / А.В. Никонов. Режим доступа: Кафедральный сервер: [Оформление2.doc] / Омск. гос. техн. ун-т. Каф. АСОИУ. – Омск, 2002.

Куликовский Л.Ф., Мотов В.В. Теоретические основы информационных процессов: Учеб. пособие для вузов по спец. «Автоматизация и механизация процессов обработки и выдачи информации». – М.: Высш. шк., 1987. – 248 с.


Приложение А
(обязательное)

Диаграммы предсказаний генератора случайных чисел

Рисунок А. – Диаграмма удачных предсказаний генератора случайных чисел

Рисунок А. – Диаграмма коэффициента удачных предсказаний генератора случайных чисел

5




1. Семейное право 1
2. Тема монополий и их регулирования является одной из самых актуальных в странах с рыночной экономикой
3. Лабораторна робота 1 Історія розвитку сучасна класифікація та складові комп~ютерної техніки
4. У файла имеется имя что дает возможность программе работать одновременно с несколькими файлами
5. тема МІС це безперервно діюча система до якої належать персонал устаткування набір процедур і методів пр
6. Виникнення і розвиток вчення про владу.
7. а определенную работу предназначенную для удовлетворения бытовых или других личных потребностей заказчика
8. Контрольная работа- Аналіз стратегічного менеджменту на підприємстві.html
9. Основы закаливания 001
10. Основной причиной травматизма при разработке траншей и котлованов является обрушение грунтовых масс
11. Тема 14 Банківський маркетинг План Роль маркетингу в функціонуванні банків Функції маркетингу в ба
12. Введение Глава 2
13. ТЕМА- Учащегося группы 389 Поваринского О
14. Искусство Древней Греции
15. 2. Приоритет студентов обучающихся на старших курсах- 1 курс 2 курс 3 курс 4 курс 5 курс 6 курс 0 1 2
16. Контрольная работа- Применение оорных схем на уроках литературы в школах для детей с тяжелыми нарушениями речи
17. УТВЕРЖДАЮ СОГЛАСОВАНО Предс
18. Реферат на тему- Конституція УСРР 1929 року
19. Як співвідносяться між собою поняття людина індивід індивідуальність особистість
20. Реферат- Советские мегабренды