Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

Подписываем
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Предоплата всего
Подписываем
PAGE 13
EMBED Equation.3
Лекция 3
Аппроксимация экспериментальных распределений случайных чисел стандартными статистическими законами
На практике для аппроксимации наиболее часто применяются методы моментов максимального правдоподобия.
Суть метода моментов заключается в приравнивании оценок моментов, вычисленных по экспериментальным данным, соответствующим им моментам, вычисленным по функции плотности или моментной производящей функции (МПФ). Качество представления рекомендуется оценивать по критериям согласия. Для применения метода момента требуется выполнить следующие действия.
1. На основании физической сущности анализируемого случайного процесса высказывается гипотеза о его подчинении какому-то стандартному статистическому закону. Для выбранного закона, который называется гипотетическим, записывается функция плотности или МПФ и определяется количество параметров гипотетического закона - d.
2. По экспериментальным данным вычисляются оценки начальных моментов. Если все случайные значения равновероятны, то используются следующие формулы для вычисления оценок начальных моментов:
, (3.1)
где s порядок момента ();
n количество реализаций случайной величины.
Оценка математического ожидания (первого начального момента) вычисляется по формуле:
. (3.2)
Оценка второго начального момента вычисляется по формуле:
. (3.3)
Оценки центральных моментов вычисляются по формуле:
(3.4)
Оценка второго центрального момента (дисперсии) определяется по формуле:
. (3.5)
Оценка среднего квадратического отклонения (стандартного отклонения) определяется по формуле:
. (3.6)
На практике обычно оценку стандартного отклонения вычисляют по оценкам второго и первого начального моментов.
. (3.7)
При количестве случайных чисел n в выборке (частная выборка), стремящемуся к бесконечности (к генеральной совокупности) n→ ∞; оценки начальных моментов стремятся к соответствующим им моментам .
3. Записываем формулы для вычисления моментов по ФП и составляем систему уравнений, решение которой определит значения параметров гипотетического закона. Таким образом, система должна состоять из d уравнений, но в любом случае, если даже d=1 рекомендуется определять не менее 2-х первых моментов и их оценок.
4. Оцениваем качество аппроксимации по критериям согласия (КС), среди которых наибольшее применение получили 2 (Пирсона) и критерий Колмогорова-Смирнова.
4.1. Для использования 2 строится гистограмма распределения случайной величины на основе группировки случайных чисел так, как это показано на рис. 3.1.
Рис.3.1. Гистограмма распределения случайной величины х
в диапазоне от a до b
КС 2 вычисляется по формуле:
(3.8)
с количеством степеней свободы
R=L d 1, (3.9)
где L количество интервалов гистограммы;
экспериментальная i-я частота, то есть количество попаданий случайной величины в i-й интервал гистограммы;
гипотетическая частота, то есть количество случайных чисел, которое должно было попасть в i-й интервал гистограммы:
;
n количество реализаций случайной величины;
Pi вероятность попадания случайной величины в i-й интервал гистограммы;
, (3.10)
где аi-1, ai левая и правая границы i-го интервала гистограммы;
R количество степеней свободы (разница между количеством имеющихся интервалов гистограммы и определяемыми параметрами).
По вычисленным значениям 2 и R по статистическим таблицам определяется коэффициент доверия гипотезе - Рр, который должен укладываться в 10% доверительный интервал т.е. должно выполняться неравенства. Если это условие выполняется, то делается заключение, что имеющиеся статистические данные не противоречат гипотезе об их подчинении высказанному гипотетическому закону по КС Пирсона. Если данное неравенство не выполняется, то гипотезу рекомендуется отвергнуть и провести аппроксимацию другим законом, как правило, более сложным.
Для корректного применения КС 2 рекомендуется строить гистограммы с количеством интервалов не менее 7 и чтобы количество попаданий случайной величины в любой интервал гистограммы, было не меньше 7. Таким образом, для использования КС 2 требуется наличие не менее 49 случайных чисел.
4.2. При сравнительно небольшом количестве случайных чисел рекомендуется применять КС Колмогорова, который вычисляется по формуле:
(3.11)
где n - количество реализаций случайной величины;
эмпирическая и гипотетическая функции распределения.
Эмпирическая функция распределения строится по имеющейся последовательности случайных чисел. Каждая имеющаяся случайная величина увеличивает функцию распределения на величину 1/n. Таким образом, функция распределения представляется графиком, изменяющимся от 0 до 1. Значения гипотетической функции распределения вычисляются по формуле:
, (3.12) ,
где а левая граница диапазона существования закона.
КС Колмогорова-Смирнова не допускает какой-либо группировки случайных событий и требует, чтобы каждое из имеющихся случайных чисел было проверено на поиск максимума индивидуально. По вычисленному значению К по статистическим таблицам находится коэффициент доверия гипотезе РК, который должен удовлетворять условию:
РК 0,20.
Если данное условие выполняется, то делается заключение, что имеющиеся статистические данные не противоречат гипотезе об их подчинении высказанному гипотетическому закону по КС Колмогорова. В противном случае гипотезу рекомендуется отвергнуть.
Метод максимального правдоподобия аппроксимации эксперимен-
тальных распределений стандартными статистическими законами
Суть метода максимального правдоподобия заключается в нахождении таких значений параметров статистического закона, при которых функция подобия достигает своего максимального значения. Качество представления рекомендуется оценивать по критериям согласия. Для применения метода максимального правдоподобия требуется выполнить следующие действия.
1. На основании физической сущности анализируемого случайного процесса высказывается гипотеза о его подчинении какому-то стандартному статистическому закону. Для выбранного закона, который называется гипотетическим, записывается функция плотности, которая определяет количество параметров гипотетического закона - d.
2. По экспериментальным данным для каждого параметра статистического закона составляется функция правдоподобия:
L(x1,x2,…xn;p1,p2,···pd)=f(x1, p1,p2,···pd)·f(x2, p1,p2,···pd)···f(xn, p1,p2,···pd), (3.13)
где f(xi, p1,p2,···pd) значение функции плотности, определяемой параметрами p1,p2,···pd, в i-ой точке экспериментального распределения случайных чисел;
xi значение случайной величины в i-ой точке экспериментального распределения случайных чисел;
pj - j параметр гипотетического закона распределения случайных чисел;
n количество значений экспериментального распределения случайных чисел;
d количество параметров гипотетического закона распределения случайных чисел.
3. Рекомендуется, но не обязательно, прологарифмировать функцию правдоподобия:
Ln(L(x1,x2,…xn;p1,p2,···pd))=ln(f(x1, p1,p2,···pd))+ln(f(x2, p1,p2,···pd))+···+
+ln(f(xn, p1,p2,···pd)). (3.14)
4. Составляется система уравнений в частных производных по параметрам статистического закона от функции правдоподобия, которые приравниваются нулю:
∂ L(x1,x2,…xn;p1,p2,···pd)=0; (3.15)
∂pj
Вместо функции правдоподобия можно использовать логарифмическую функцию подобия:
∂ ln(L(x1,x2,…xn;p1,p2,···pd))=0; (3.16)
∂pj
5. Решением системы уравнений (3.15) или (3.16) находятся параметры статистического закона.
6. Качество аппроксимации оценивается по критериям согласия 2 и Колмогорова-Смирнова, по методике, описанной в предыдущем разделе.
Метод моментов для равномерного закона
ФП и ФР равномерного закона:
. (3.17)
Вычислим первый и второй начальные моменты:
(3.18)
(3.19)
Вычислим стандартное отклонение и параметры равномерного закона:
(3.20)
(3.21)
(3.22)
Вычислим вероятность попадания случайной величины в интервалы гистограммы и гипотетическую ФР:
(3.23)
(3.24)
Следует учитывать, что при построении гистограммы принимается:
; .
Пример3.1. Аппроксимация экспериментального распределения случайных чисел равномерным законом с оценкой качества аппроксимации по критерию согласия Колмогорова
Экспериментальное распределение представляет собой выборку, состоящую из 10 трёхразрядных чисел, поэтому проведём аппроксимацию с оценкой качества аппроксимации по КС Колмогорова. Представим распределение случайных чисел по возрастанию их значений: 137, 221, 353, 366, 367, 507,686, 905, 918, 985 и построим по нему эмпирическую ФР, представленную на рис.3.2.
Вычислим основные характеристики эмпирического распределения:
.
сек.
сек.
Рис.3.2. Эмпирическая и гипотетическая функции распределения
Вычислим параметры равномерного закона:
сек.
сек.
По двум найденным точкам построим прямую линию, которая является гипотетической ФР. Она изображена на рис.3.2. По рис.3.2 находим, что максимальная разница между эмпирической и гипотетической ФР при аргументе, равном 367. Уточним значение ФР для этого значения и вычислим КС Колмогорова:
По статистическим таблицам находим коэффициент доверия высказанной гипотезе: .
Вывод: имеющиеся статистические данные не противоречат гипотезе о их подчинении равномерному закону по КС Колмогорова.
Пример3.2. Аппроксимация экспериментального распределения 100 одноразрядных чисел равномерным законом с оценкой качества аппроксимации по КС Пирсона
Выборка из 100 случайных чисел представлена в виде совокупности, состоящей из 5 строк и 20 столбцов.
Подсчитаем количество символов каждого типа и построим гистограмму, представленную на рис.3.3.
Рис.3.3. Гистограмма распределения 100 одноразрядных случайных чисел
Вычислим основные статистические характеристики распределения, параметры закона, значение КС Пирсона и по статистическим таблицам определим коэффициент доверия, выдвинутой гипотезе:
Ввиду того, что найденный коэффициент доверия не укладывается в рекомендуемый 10% - й доверительный интервал то гипотезу ввергаем.
Отметим, что если бы чисел «2» было 9, а не 5; а чисел «4» было бы 13, а не 17, то было бы равно:
2 ={1+4+1+16+9+4+16+4+16+4+25}/10=8,4;
при R=7; тогда по статистическим таблицам находим р=0,31 и гипотеза не отвергается.
Метод моментов для экспоненциального закона
В теории массового обслуживания центральное место занимает экспоненциальный закон, благодаря своим следующим замечательным свойствам.
1. Ординарности, которая заключается в том, что если в ОМ действует несколько экспоненциальных законов, то в любой момент времени в такой системе не может произойти более одного события.
2. Стационарности (независимости от времени). Стационарный режим в простейшей системе наступает тогда, когда выполняется условие, что интенсивность поступления транзактов не превышает интенсивности их обслуживания . В таких системах через некоторое время, которое называют переходным режимом, процесс изменения состояния системы перестает зависеть от времени и зависит только от технических характеристик ОМ и параметров внешней среды, в которой он функционирует. Условие наличия стационарного режима для простейшей СМО .
3. Отсутствия последействия, которое заключается в том, что время, оставшееся до окончания экспоненциального процесса в любой момент его протекания распределено по экспоненциальному закону с той же интенсивностью, с которой распределено все распределение случайных чисел.
Эти три свойства позволяют строить Марковские цепи, являющиеся основой аналитического моделирования СМО.
Функция распределения (ФР) экспоненциального закона приведена на рис.2.4. Это вероятность того, что случайная величина Х не превысит своего текущего значения х.
F(x)
F(x1) F(x)P{Xx}
x1 х
Рис.3.4. Функция распределения экспоненциального закона
Функция плотности (ФП). Это плотность вероятности случайной величины,
или дифференциальная функция распределения. ФП экспоненциального закона приведена на рис.3.5.
f(x)
f(x)=F/(x)
x
Рис. 3.5. Функция плотности экспоненциального закона
Экспоненциальный закон имеет диапазон своего существования от 0 до . Функция плотности экспоненциального закона
. (3.25)
ФР экспоненциального закона можно вычислить по ФП:
(3.26)
ФП экспоненциального закона определяется всего одним параметром m. Для потоков событий это количество транзактов (заявок), поступающих за единицу времени. Для процессов обслуживания это количество транзактов, которое может быть обслужено при их непрерывном поступлении в обслуживающий аппарат (ОА). Вычислим первый начальный момент по функции плотности:
(3.27)
Для вычисления интеграла (3.27) проведём интегрирование по частям:
Пусть , тогда ;
Рассмотрим этот же интеграл с пределами и вычислим основные статистические характеристики экспоненциального закона:
(3.28)
В полученном математическом выражении отдельно рассмотрим первое слагаемое:
Для первого слагаемого получили неопределённость вида бесконечность на бесконечность. Раскроем его по правилу Лопиталя, взяв отдельно производные от числителя и знаменателя.
Таким образом, первое слагаемое в (2.28) можно отбросить и вычислить интеграл по второму слагаемому.
(3.29)
Получили формулу для вычисления интенсивности экспоненциального закона по экспериментальным данным.
(3.30)
Вычислим второй начальный момент:
(3.31)
Пусть , тогда ;
Рассмотрим этот же интеграл с пределами и вычислим основные статистические характеристики экспоненциального закона:
(3.32)
В полученном математическом выражении (3.32) отдельно рассмотрим первое слагаемое:
(3.33)
Для первого слагаемого выражения (3.33) получили неопределённость вида бесконечность на бесконечность. Раскроем его по правилу Лопиталя, взяв отдельно производные от числителя и знаменателя.
(3.34)
Снова получили неопределённость вида бесконечность на бесконечность. Снова раскроем его по правилу Лопиталя, взяв отдельно производные от числителя и знаменателя.
(3.35)
Таким образом, первое слагаемое можно отбросить и вычислить интеграл по второму слагаемому.
(3.36)
Вычислим среднее квадратическое отклонение.
(3.37)
Для вычисления значений КС по формулам (3.8) и (3.11) требуется предварительно вычислить вероятности попадания случайной величины в интервалы гистограммы и гипотетические функции распределения по следующим формулам.
(3.38)
Метод моментов для нормального закона
Нормальный закон является наиболее употребительным. Он применяется для представления самых различных случайных процессов, таких как продолжительность жизни людей, изменения экономических и технических показателей. Функция плотности нормального закона представляется следующей математической зависимостью:
(3.39)
Характерной особенностью нормального закона является то что в качестве его параметров в функцию плотности (3.39) входят математическое ожидание и среднее квадратическое отклонение, поэтому для использования метода моментов достаточно в (3.39) подставить их оценки, вычисленные по экспериментальному распределению. Для оценки качества аппроксимации по критериям согласия Пирсона и Колмогорова требуется вычислить вероятность попадания случайной величины в интервалы гистограммы и гипотетическую ФР. Так как интеграл от функции плотности нормального закона аналитически «не берётся», то он определяется по таблицам, составленным для нормального закона с математическим ожиданием, равным нулю, и средним квадратическим отклонением, равным единице с преобразованием реального распределения по следующим формулам:
(3.40)
(3.41)
Пример 2.3. Аппроксимация экспериментального распределения случайных чисел экспоненциальным и нормальным законом с проверкой качества аппроксимации по критерию согласия
Эспериментальное распределение случайных чисел задано в виде гистограммы, представленной на рис.3.6.
Рис.3.6. Гистограмма экспериментального распределения с эмпирическими частотами и гипотетическими частотами, вычисленными для экспоненциального и нормального закона
По гистограмме вычислим основные статистические характеристики экспериментального распределения и интенсивность для его аппроксимации экспоненциальным законом:
Расхождение в и составляет около одной четвертой, поэтому весьма целесообразно выдвинуть гипотезу о подчинении экспериментального (эмпирического) распределения экспоненциальному закону.
По вычисленным гипотетическим частотам вычислим КС Пирсона:
По статистическим таблицам находим коэффициент доверия гипотезе о подчинении данного распределения экспоненциальному закону:
.
Так как вычисленный коэффициент доверия укладывается в рекомендуемый 10% интервал, то гипотеза о подчинении данного экспериментального распределения экспоненциальному закону не отвергается.
Гипотетические частоты для экспоненциального закона приведены на рис.3.6.
Проведём аппроксимацию того же примера нормальным законом. Значения оценок математического ожидания и среднего квадратического отклонения нами уже вычислены, теперь требуется вычислить гипотетические частоты попадания случайной величины в интервалы гистограммы для нормального закона. Результаты вычислений приведены в таблице 3.1.
Таблица 3.1
X |
z |
||
0 |
-1,25 |
10,56 |
11 |
100 |
-0,86 |
19,49 |
9 |
200 |
-0,49 |
31,56 |
12 |
300 |
-0,09 |
46,41 |
15 |
400 |
0,29 |
61,41 |
15 |
600 |
1,07 |
85,77 |
24 |
800 |
1,84 |
96,71 |
11 |
1200 |
3,38 |
99,97 |
3 |
11 первых значений случайной величины «выходят» за пределы диапазона построения гистограммы, так как в ней нет интервала для отрицательных чисел. В сумме получается 100 значений.
Вычислим значение КС Пирсона:
Так как в статистических таблицах нет коэффициента доверия для такого большого значения КС , то будем считать, что коэффициент доверия гипотезы и таким образом гипотеза о подчинении данного экспериментального распределения нормальному закону отвергается.
Контрольные вопросы: