Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Моделирование выборок значений с

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 25.11.2024

§5. Моделирование выборок значений с.в. с заданным законом распределения.

Часто для исследования вероятностных характеристик с.в. приходится создавать соответствующий статистический материал. Основные идеи и приемы такого моделирования подробно изложены, например, в [1] и [2], приведем здесь краткие сведения по этому вопросу.

С.в. с любым распределением могут быть получены из равномерного распределения на отрезке [0.1] чисел  {}, вырабатываемых на ЭВМ датчиком случайных чисел.

Моделирование дискретной с.в. и метод маркировки (м.м.)

Для моделирования  n  значений дискретной с.в.  Х с заданным рядом распределения

Нужно отрезок [0,1] разбить на m частичных отрезков: [0;p1],  [p1;p1 + p2], …, [p1+ p2+…+ pm-1;1] и  промаркировать реализацию  n  случайных чисел {ri} по построенным интервалам. Тогда попадание случайного числа  r  в i–ый интервал будет означать, что i – е значение разыгрываемой с.в.  ;

Задача 1.  

Разыграть (смоделировать) 6 значений с.в.  Х , имеющий ряд распределения

Х

1

3

8

p

0,34

0,25

0,41

Решение.

С помощью датчика с.в. получим 6 случайных чисел {}:

0,43; 0,61; 0,21; 0,84; 0,70; 0,5.

Промаркируем эти случайные числа по отрезкам:

[0;0.34], [0,34;0,59],[0,59;1]; получим, что случайные числа {} соответственно попали в интервалы с номерами: 2, 3, 1, 3, 3, 1 что отвечает следующей смоделированной последовательности {}:3, 8, 1, 8, 8, 1.

Моделирование непрерывной с.в. (метод обратных функций (м.о.ф.))

В основе моделирования непрерывной с.в. лежит следующий, легко доказываемый факт: если F(x) – непрерывная строго монотонная функция распределения и  – обратная к ней функция, то с.в. где с.в. R  равномерно распределена на отрезке [0,1], имеет функцию распределения F(x).

Доказательство.

Действительно, , что и утверждалось.

Таким образом, если функцию можно явно вычислить, то моделирование  n  значений {} с.в. Х производится из  n  значений случайных чисел {} по формуле:

                                                                                             (1)  

Приведем примеры применения м.о.ф., используя обозначение L(x) – закон распределения с.в. Х.

Задача 2.     

Смоделировать получение значений с.в.  Х  в следующих случаях:  

а)             

Решение.           

, при ; по (1) имеем       

     

б)                                                 

Решение.

x≥0; по (1) имеем         

 а так как с.в. распределена также, как и с.в. , то возможное значение с.в. можно получить по более простой формуле .

Замечание 1. Если не строго монотонная функция, то обратную к ней функцию определяют при моделировании значений с.в. Х следующим выражением:

Ограниченность применения м.о.ф. связана с невозможностью явного вычисления обратной функции  В таких ситуациях используются различные частные приемы моделирования.

Метод Неймана.

Этот метод является достаточно общим для разыгрывания непрерывной с.в. Х, когда она определена на конечном отрезке [a,b] и плотность ее ограничена: , где М – постоянная.

Разыгрывание возможного значения с.в.  Х  производят по следующему алгоритму:

а) получают две равномерно распределенных на отрезке [0,1] с.в. R:   и

б) вычисляют координаты случайной точки  где  

в) если точка Z лежит под кривой (т.е. , то полагают, что возможное значение с.в.  Х  есть  в противном случае точку отбрасывают и переходят к следующей точке, повторяя алгоритм с пункта а) до получения возможного с.в. Х.

   В качестве примеров остановимся на практическом моделировании значений наиболее распространенных распределений.

Замечание 2. Если смоделированы возможные значения с.в.  то для моделирования реализаций с.в.  нужно применить это линейное преобразование к полученным возможным значениям с.в.

Задача 3. Смоделировать получение значений с.в. Х в следующих случаях:

а) L(X)=R[a,b]. Эта задача решена выше м.о.ф. Та же формула для моделирования получается на основании замечания 2:

б) L(X)=N(a, b). Если L(X)=N(1,0) и моделирование возможных значений с.в.    проведено, то на основании замечания 2 получение возможных значений с.в. Х  можно производить по формуле:Таким образом, задача сводится к моделированию с.в.

Приведем два способа моделирования возможных значений стандартной нормальной с.в. .

1) По теореме Леви (ЦПТ) возможные значения с.в. Х могут быть получены при достаточно большом   n  по формуле:

Часто на практике достаточно брать n=12. Тогда имеем следующую простую формулу моделирования таких с.в.:

2) Две возможные реализации  и   вычисляются из двух значений чисел  и    по формулам:

Первый из этих способов легче реализуется, но приводит к приближенно нормальным числам.

Задача 4.

Биномиальное распределение В(n,p). Возможное значение биномиально распределенной с.в. X~B(n,p) может быть получено по общей схеме с

где  или проще, методом браковки: берется  n  независимых равномерно распределенных случайных чисел  тогда количество чисел из них, меньших р, есть возможное значение с.в. X~B(n,p).

В частности при n=1  получаем возможное значение бернулевской с.в.

Задача 5.

Геометрическое распределение G(p),

где […] – означает целую часть числа.

С помощью описанного приема для моделирования возможного значения геометрического распределения могут быть получены возможные значения с.в., распределенной по:

а) сдвинутому геометрическому закону cgG(p),

б) по закону Паскаля πa(r,p), (по формуле:

в) отрицательному биномиальному закону ОВ(r, p),

 по формуле:

Задача 6.

Пуассоновское распределение  k=0,1,2,…)

Возможное значение с.в. Х может быть получено по одному из соотношений:

;

Задача 7.

Полиномиальное распределение , где n – число опытов, m – число возможных исходов в каждом опыте, а вероятность i–ого исхода  .

Для моделирования:

а) разбивают отрезок на  m  частей: ;

б) получают  n  чисел ;

в) для каждого  находят отрезок  которому  принадлежит;

г) для каждого отрезка  определяют число  попавших чисел из  тогда считают, что  приняла значение , а с.в.  – приняла значение (.

§6. Непараметрическая задача статистики.

Исходной информацией является случайная величина Х и выборка наблюдений над ней =( x1, x2, x3, ...., xn). Требуется найти вид распределения (семейство распределений), к которому относится распределение с.в. Х. Для решения этой (непараметрической) задачи существует целый ряд обработок или представлений данной выборки.

Статистический (или частотный) ряд – это таблица вида:

x

Где – возрастающая последовательность разных наблюденных значений с.в. Х; – число наблюденных значений с.в. ;–объем выборки;

2. Полигон частот (относительных частот) – это ломаная линия (строится для дискретной с.в.), соединяющая точки

Полигоны частот и относительных частот отличаются друг от друга только масштабом по оси ординат. Полигон относительных частот является графическим статическим аналогом соответствующего представления ряда распределения для точек

3. Гистограмма частот (относительных частот)

(строится для непрерывной с.в.) – это ступенчатая фигура, сглаживающая кривая для которой является статистическим аналогом кривой распределения с.в. Х.

Гистограмма строится следующим образом: на оси абсцисс отмечают отрезок  делят его на равные отрезки длиной h таким образом, чтобы ни один отрезок не был пуст, а далее над  отрезком строят прямоугольники высотой , где   

Площадь ступенчатой фигуры – гистограммы

Гистограммы частот и относительных частот отличались только масштабом по оси ординат. Кривую распределения с.в. Х приближает сглаживающая кривая гистограммы относительных частот, т.к. в этом случае

как и площадь под графиком плотности распределения.

4. Эмпирическая функция распределения Fn(x) (э.ф.р.)

 где n – объем выборки, k – число наблюдений < х.

Задача.

Пусть наблюденная выборка значений с.в. Х есть 3, 1, 4, 4, 3, 3, 3, 1, 3, 4. Построить э.ф.р.

Решение.

Построим статический ряд

Х

1

3

4

2

5

3

Свойства (совпадает со свойствами F(x)):

1.

2.
3. – неубывающая по х;

4. – непрерывна слева.

Распределение и моменты э.ф.р. .

Введем индикаторную функцию . Тогда

, где при фиксированном значении х с.в.

J(xX) ~B (1,p=F(x)), так как

J(x–X)

0

1

P

Известно, что тогда~, где p=F(x)    

Таким образом, при фиксированном значении  x  

а это значит, что – несмещенная оценка для EX;  а это значит, что – состоятельная оценка для F(x).

Сходимость  к F(x).

а) Обозначим  Воспользуемся неравенством Чебышева:

положим , тогда  и

 

Получим  при

б) Воспользуемся теоремой Колмогорова. Если – последовательность независимых с.в. и выполнено условие  то  при т.е.

Положим  и проверим условие теоремы Колмогорова

при

Докажем, что из сходимости п.н. сходимость п.в. 

Доказательство.

Пусть  т.е.  или

Хотя бы при одном , а сходимость п.в. означает, что

но  и требовалось доказать, т.е.

Замечание. Из доказанного утверждения следует, что т.к. при

по теореме Колмогорова, то  что было установлено раньше непосредственно по неравенству Чебышева.

Точность и надежность  для F(x) при фиксированном значении х.

а) Пусть  n  велико. Тогда по следствию из интегральной теоремы Муавра – Лапласа

Здесь Р – надежность оценки  для F с точностью ε, а  – нижняя граница надежности.

б) При любом  n  по неравенству Чебышева имеем  – нижняя граница надежности оценки  для F с точностью ε. 


Часть Ⅱ.

Введение.

II часть пособия по математической статистике предполагает знание 1–й части и посвящена решению одной из основных задач математической статистики – параметрической задачи. Исходными данными здесь являются – изучаемая случайная величина (с.в) Х, выборка   значений с.в. Х с точностью до параметраТребуется оценить заданную функцию от  

Рассматриваются два подхода к решению задачи: точечное и доверительное оценивание. Обсуждаются методы построения таких оценок.

Большое внимание отводится вопросу анализа качества полученных оценок с различных точек зрения и при различной природе неизвестного параметра распределения с.в. Х.

Изложение теоретического материала сопровождается многочисленными примерами c подробными комментариями, а также предложены задачи для самостоятельного решения.

Настоящее пособия имеет целью оказание помощи студентам подбором соответствующего материала и пояснениями при решении поставленных задач.


§1. Выборочные моменты. Их свойства.

1. Начальные сведения.

В  качестве оцениваемых функций в параметрической задаче статистики часто встречаются выборочные моменты. Пусть Х – наблюдаемая с.в.,

=( x1, x2,...., xn)– выборка объема n.

– ый начальный выборочный момент; при r = 1;

– выборочное соединение;

r – ый центральный выборочный момент; при r = 2;

– выборочная дисперсия;

– выборочное среднеквадратическое отклонение;

При ЕХ=m –  известном

r – ый центральный выборочный момент;

если выборки значений с.в. Х и У есть соответственно то

– выборочная корреляция;

– выборочный коэффициент корреляции;

 – выборочный коэффициент ассиметрии;

– выборочный коэффициент эксцесса

2. Свойства выборочных моментов

Сформулируем их в форме задач.

1) Исследовать  на несмещенность и состоятельность для    r – го начального момента

Решение.

E, т.е.  – несмещенная оценка для ; по теореме Хинчина при  имеем если  , то для с.в.  выполняется ЗБЧ, т.е.  – состоятельная оценка для . В частности, при r = 1  – несмещенная состоятельная оценка, для ЕХ.

2) Исследовать на несмещенность и состоятельность , для DX.

Решение.

– смещенная, но асимптотически несмещенная оценка для DX;

смещение  в среднем занижает значение DX. Т.к. смещение линейно, можно его подправить:

– несмещенная оценка для DX.

Состоятельность  для DX следует из теоремы Хинчина для и состоятельности  для DX, так как

3) Исследовать    для   следует из теоремы Хинчина, если в качестве :

Отсюда, в частности, следует, что при известном EX = m   – несмещенная и состоятельная оценка для DX.

4) Исследовать точность и надежность  для EX = m.

Решение.

Обозначим L(z) – закон распределения с.в. Z.

Если , то ε –  точность, а γ – надежность оценки  для m; найдем распределение статистики . Обозначим

;;;

тогда по теореме Леви  

Таким образом, надежность   для ЕХ с точностью ε есть  и может быть увеличена за счет выбора большего  n.

Приведем числовые примеры.

С какой вероятностью (надежностью) совершается ошибка < ε =0.3 при замене ЕХ на  при:

а) n = 20; = 4.52;

Решение.

По 4). При

.

б). ; ; .

Решение.

;  .

При сравнении результатов а). и б). наглядно видно повышение надежности γ с ростом n.

5) Исследовать на несмещенность  для .

Решение.

;  ;  ; .                                (*)

т.к.  и  независимы;   

Подставим все это, в выражение (*):

 Þ – смещенная, но асимптотически несмещенная оценка для . Смещение  оценки   есть  линейное. Подправим смещение оценки  :   –  несмещенная оценка для .

3. Законы распределения и моменты статистик  и  для Х~N(m, σ).

а).  ;         ;

Þ

Þ 

б).

Подвергнем {} линейному преобразованию с матрицей преобразования следующего вида: 

, т.е.                                   (1)         

при выполнении условий                     (2)    

Покажем, что (2) – ортогональные преобразования, т.е. (по определению) такие , для которых выполняются условия:     ,                                                                                  (3) т.е. нужно показать, что для данного преобразования (1) условия (2) следуют из условий (3). Действительно,  по (2), (и при

i=n:, а из условия  при i=n имеем

Таким образом, доказано, что для преобразований (1) выполнены условия (3), а значит (1) – ортогональное

преобразование, сохраняющее сумму квадратов:

– независимые с.в. как элементы выборки, каждая из которых ~N(m,σ), значит их совместное распределение нормально (с плотностью, равной произведению их одинаковых плотностей). Известно, что ортогональное преобразование переводит нормальный вектор () в другой нормальный вектор .

Найдем моменты с.в. {} (i=1,n) при условиях (2), обозначив

 

при ij 

А это значит для нормального вектора  независимость его компонент с учетом следующего замечания (без доказательств).

Замечание 1. Для гауссовского вектора некоррелированность его компонент эквивалентна их независимости.

Т.к. ортогональное преобразование сохраняет сумму квадратов и , то верно равенство:

где

~~

Где , а , что соответствует плотности гамма распределения

~N(0,1)~

~

Замечание 2. Не нарушая общности, можно считать, что исходные с.в. , т.к.  для  и  для  совпадают, покажем это:  ;  ; ,  т.к. . Т.е.  и  совпадают.

Замечание 3. Для матрицы ортогонального преобразования   (где  – транспонированная матрица, а  – обратная матрица).

Тогда из условий ортогональности (3) ÜÞ условия:

                                                                                       (4),

т.е. условия (3) и (4) эквивалентны.                                            

Покажем, что с учетом замечания 2 и эквивалентности условий (2) и (3) для рассматриваемых преобразований (1) сохраняются суммы квадратов, т.е. . Действительно:

Отдельно вычисляем следующие суммы:

, поэтому

 

что и утверждалось.

Замечание 4. Если , то  и  независимы.

Действительно по (1)  ,  а , т.е.  и  зависят от разных, независимых между собой с.в. соответственно  и (), а значит,  и  независимы между собой.

§2. Свойства точечных оценок.

1.Задача точечного оценивания

Исследуется случайная величина X, распределение которой относится к параметрическому множеству , где  – неизвестный      k – мерный параметр. В дальнейшем будем обозначать это короче: X~.

Имеется выборка наблюденных значений случайной величины X: oбъема  n. Требуется построить точечную оценку (статистику) для данной функции  и исследовать качество данной оценки.

Замечание. При такой постановке задачи нет проблемы построения оценки для , так как требования к ее качеству (близости к истинному значению) не высказаны. Математическая задача возникает тогда, когда эти требования математически формализованы. А в связи с тем, что они не все и не всегда выполнимы, будем называть их желательными свойствами оценок.

2. Простейшие свойства точечных оценок  

а). Несмещенность: ( EX– математическое ожидание с.в. X) или асимптотическая несмещенность  

б). Состоятельность: , т.е.      для любого ;

в). Эффективность несмещенной оценки характеризуется дисперсией  и используется для сравнения качества несмещенных оценок.

Эти свойства или пожелания к качеству точечной оценки объединены стремлением достичь определенной степени концентрации возможных значений оценки  вокруг истинного значения оцениваемой функции .

Одновременное выполнение этих желательных свойств не всегда возможно, поэтому представление о «хорошей» оценке зависит от цели и возможностей исследования, определяющих приоритетные свойства оценки. Так, для малых выборок часто важна несмещенность оценки, а для больших – асимптотическая несмещенность и состоятельность. А иногда, сознательно отказываясь от одних свойств оценок, добиваются выполнения других, более важных с точки зрения исследования свойств.

3. Оптимальные оценки.

Если же оценка является несмещенной с минимальной дисперсией, то она называется оптимальной.

Теорема.

Если оптимальная оценка существует, то она единственна.

Доказательство (от противного). 

Пусть не так, т.е. существуют две оптимальные оценки для :  и . Тогда ; - минимальная возможная дисперсия несмещенных оценок для .

Построим оценку  и изучим ее свойства.  – снова несмещенная оценка для  .

т.к. по неравенству Коши-Буняковского  . Но  не может быть < по условию. Отсюда следует, что  (поэтому  – оптимальная оценка для ), а это значит, что  или  и  и  линейно зависимы , где a и bconst.

Тогда  или , что и утверждалось.

4.Общий подход к сравнению оценок.

Функция потерь - – это любая неотрицательная функция, дающая потерю (ущерб) в результате того, что за  принята ее оценка ;

Однако, важным являются не единичные потери, а средние при многократном использовании оценки вместо истинного значения оцениваемой функции. Поэтому введем функцию риска ) - это средние потери относительно выбранной функции потерь.

Часто функция потерь выбирается в виде:  и называется квадратичной функцией потерь, а соответствующий риск  – квадратичным риском.

Для несмещенных оценок квадратичный риск

поэтому сравнение качества несмещенных оценок по квадратичному риску лежит в русле этого общего подхода и совпадает с их сравнением по эффективности.

5.Смещение оценки.

Пусть . Тогда b называется смещением оценки t для . Если b=0, оценка называется несмещенной, если b>0 (b<0), то оценка в среднем завышает (занижает) истинное значение оцениваемой функции. В случае линейного смещения его легко устранить, т.е. подправить оценку по смещению. Пусть , где a и bconst, тогда получаем, что  – несмещенная оценка для .

6. Связь смещения, квадратичного риска и дисперсии оценки.

Пусть

Тогда

– эта формула часто упрощает вычисление квадратичного риска.

7. Достаточное условие состоятельности несмещенных и асимптотически несмещенных оценок

Теорема 1. 

Для состоятельности несмещенной оценки  достаточно, чтобы

Доказательство.

Пусть  и  воспользуемся неравенством Чебышева, получив  или, с учетом несмещенности t для :, откуда и следует утверждение.

Теорема 2.

Для состоятельности асимптотически несмещенной оценки t для  достаточно, чтобы.

Доказательство. 

Пусть;;. Рассмотрим событие

тогда из того, что, тогда по неравенству Чебышева имеем, что и доказывает утверждение.

Замечание. Результаты этих теорем в указанных условиях часто упрощают установление состоятельности.

8. Выборочные моменты

Выборочные моменты – распространенный вид оцениваемых функций от неизвестного параметра  распределения с.в. Х. Приведем сначала наиболее общие формы выборочных моментов ( – выборка)

– начальный  r-ый выборочный момент; при r=1

– выборочное среднее с.в. Х;

центральный r-ый выборочный момент; при r=2  — выборочная дисперсия. При известном EX=m   – выборочный r-ый центральный момент.

– выборочная корреляция (здесь

– выборки значений соответственно с.в. X и Y);

– выборочное среднее квадратичное отклонение с.в. Х,

– выборочный коэффициент корреляции;

– выборочный коэффициент асимметрии;

– выборочный эксцесс.

9. Примеры

9.1 Примеры на определение свойств оценок.

1). Проверить на состоятельность и несмещенность выборочное среднее  для математического ожидания EX.

Решение.

, то есть статистика  – несмещенная оценка для ЕХ.

при  , откуда следует и состоятельность статистики  для ЕХ. Этот факт сразу следует и из теоремы Хинчина (ЗБЧ).

Замечание 1.Отсюда получаем, например, что статистика  есть несмещенная состоятельная оценка для параметра L распределения Пуассона П(L), параметра a нормального распределения N(а,б).

Замечание 2.Если при исследовании смещенности оценки Т(х) получается линейная функция L от параметра  , то  для построения несмещенной оценки для  нужно применить к оценке Т(х) преобразование  .

2). Проверить на состоятельность и несмещенность выборочную дисперсию  для дисперсии DX.

Решение. 

Преобразуем выражение для  :

                (1)

Тогда,

                            

то есть, – смещенная, но асимптотически несмещенная оценка для DX. Подправим  оценку  для DX. По замечанию 2 оценка  – несмещенная оценка для DX.

Состоятельность оценки  для DX следует (по определению) из теоремы Хинчина, примененной к каждому слагаемому выражения (1).

3). Самостоятельно показать, что статистика  при известном значении ЕХ = m является несмещенной для дисперсии.

В дальнейшем будем использовать обозначение L(X) – закон распределения с.в. Х.

4). L(X) = . Проверить свойства оценки  для .

Решение.

 от объема выборки  n  не зависит, поэтому при  не сходится к , то есть является несостоятельной оценкой для . Здесь мы имеем пример несмещенной и несостоятельной оценки для .  

5). L(X) = . Проверить свойства оценки  для . В случае смещенности подправить ее.

Решение.
, то есть данная оценка  является см
ещенной, но асимптотически несмещенной. Подправим ее. По замечанию 2 получаем, что оценка  – несмещенная оценка для параметра .

Для исследования состоятельности оценки  вычислим дисперсию оценки :

;, откуда следует, что оценки  и  являются состоятельными.

6) С.в. Х распределена по закону Коши. Состоятельна ли оценка  для ?

Решение. 

Функция распределения закона Коши есть

Характеристическая функция (х.ф.) с.в. Х

Х.ф. с.в. ;

Х.ф. с.в. то есть с.в. X и  имеют одинаковое распределение (данное распределение Коши).

  

При  , что означает несостоятельность приведенной оценки  для .

PAGE   \* MERGEFORMAT 64




1. История акционерного законодательства Советской России и Союза ССР На первоначальном переходном этапе.html
2. Свельто 21 Менеджмент
3. історичні передумови виникнення філософії.html
4. Джоансен А Стук ее сердца- Эксмо; Москва; 2012 ISBN 9785699586431 Аннотация Запуганная молодая девушка и
5. КАВКАЗСКИЙ ЭКОНОМИЧЕСКИЙ РАЙОН Состав- Ростовская область Краснодарский и Ставропольский края; Адыгейска
6. Предпосылки возникновения доказательной медицины
7. ЛЕКЦИЯ 15 Трансгенные животные Стратегия получения трансгенных животных состоит в следующем
8. Дружная. Транзит по территории РП
9. 3 Безопасность жизнедеятельности
10. гнойной мокроты где МТ обнаруживают сравнительно редко обычно при исследовании методом флотации посева ил
11. I Введение1
12. Существуют разные критерии классификации экспериментальных планов- критерий строгого истинного экс
13. Контрольная работа 1
14. Автоматизация колонн получения биоэтанола.html
15. Характеристика исходной информации и режим атмосферных осадков (на примере метеостанции Лиски)
16. Методические рекомендации для выполнения лабораторной работы по дисциплине Информатика для студентов 1
17. Оценка эффективности инновационной деятельности
18. Тема- Предоперационный период в деятельности медсестры
19. Конспект лекций по дискретной математике
20. На тему- Контрольное задание 1 вариант 2; контрольное задание 4 вариант 2