Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Оценка генерального среднего

Работа добавлена на сайт samzan.net:


PAGE  19

1. Оценка генерального среднего. 

В настоящем параграфе рассматриваются некоторые методы статистических оценок. При этом постоянно предполагается, что наблюдаемая случайная величина (или, как мы условились говорить, генеральная совокупность) имеет нормальное распределение. Через q все время обозначается принятый уровень значимости; доверительная вероятность соответственно будет равна 1 – q.

Основным оцениваемым параметром является генеральное среднее. Особенно важную роль играет среднее в обработке наблюдений — ведь здесь оно совпадает с истинным результатом наблюдений.

Легче всего дать оценку для генерального среднего в тех случаях, когда с достаточно высокой степенью точности известна генеральная дисперсия . Генеральную дисперсию можно найти только приближенно по выборочной дисперсии; погрешность такого приближения в зависимости от объема выборки п изучается в следующем пункте. На практике эту погрешность обычно не учитывают уже при  . Разумеется, такое большое количество наблюдений над одним объектом проводится редко. Однако здесь можно пользоваться сериями наблюдений и над другими объектами, если только у этих серий та же самая генеральная дисперсия (сравнение двух или нескольких дисперсий также возможно методами математической статистики). Дисперсия будет тогда вычисляться по «текущим измерениям». Используя наблюдения над большим количеством объектов, мы сможем сделать общее число наблюдений Достаточно большим и, значит, найти генеральную дисперсию с высокой степенью точности.

Знание генеральной дисперсии позволяет оценивать генеральное среднее даже по одному наблюдению. А именно, если при наблюдении над случайной величиной  получено значение , то для генерального среднего а имеет место следующая доверительная оценка (с доверительной вероятностью 1 – q:

,

где  -  квантиль стандартного нормального распределения, который можно найти из таблицы II Приложения (1). Например, при стандарте  и доверительной вероятности 1 значение  даст оценку:

,

откуда .

Если над случайной величиной  проведено несколько наблюдений, то для оценки генерального среднего можно использовать выборочное среднее . Это среднее также является случайной величиной с нормальным распределением. Математическое ожидание у величины  то же самое, что и у , а дисперсия уменьшается в п  раз (п — число наблюдений) и равна

.

Каждая выборка есть одно наблюдение над величиной . Поэтому для генерального среднего а получается оценка

.

Как и выше, генеральную дисперсию  считаем известной, откуда . Окончательно получаем оценку

     (1.1)

Из этой оценки видно, в частности, что уменьшение доверительного интервала обратно пропорционально корню квадратному из числа наблюдений, т. е. если мы хотим уменьшить возможную ошибку в два раза, мы должны число наблюдений увеличить в четыре раза.

В качестве примера оценим генеральное среднее а по генеральной дисперсии  и по трем наблюдениям . Здесь ,

.

В качестве доверительной вероятности возьмем , тогда .

Поэтому

.

После всех вычислений получим окончательную оценку .

В проведенных рассуждениях мы пользовались тем, что , как случайная величина, имеет нормальное распределение с параметрами а и . Благодаря этому величина

       (1.2)

имеет стандартное нормальное распределение и с вероятностью 1 - р удовлетворяет неравенству

     .   (1.3)

Подставляя в (1.3) значение и из формулы (1.2), мы вновь придем к оценке (1.1) генерального среднего а.

Как уже указывалось, генеральную дисперсию  нельзя найти из наблюдений, поэтому вместо нее обычно берут выборочную дисперсию . Это значит, что вместо величины и на самом деле рассматривается величина

.         (1.4)

При больших п дисперсия  мало отличается от  и значит, величина t мало отличается от величины и. При малых же объемах выборок различие между t и и оказывается весьма существенным; более того, распределение величины t уже не является нормальным.

Общие законы теории вероятностей позволяют вывести формулы, описывающие распределение величины t. Это распределение называется

t-распределением или распределением Стьюдента; оно зависит только от числа f степеней свободы, по которым подсчитана дисперсия . Если дисперсия  и среднее  подсчитывались по одним и тем же наблюдениям, то , где п—объем выборки.

Мы не будем приводить формулу плотности t -распределения, слишком громоздкую и содержащую специальные функции.

    Рис. 1

Свойства этой плотности хорошо видны на графике; на рис. 1 приведены графики плотности t - распределения при различных значениях f. Они напоминают по форме плотность нормального распределения, но при  значительно медленнее сближаются с осью абсцисс. При  дисперсия , поэтому распределение Стьюдента сближается с нормальным; случай  вообще соответствует нормальному распределению. При малых же f распределение Стьюдента сильно отличается от нормального, в силу чего его роль особенно велика в так называемой микростатистике или статистике малых выборок.

В дальнейшем, согласно общему правилу, через  обозначаются квантили t -распределения. Это распределение симметрично относительно нуля, поэтому . При доверительной вероятности 1 - р для величины t получается доверительная оценка

Подставляя сюда выражение для t из формулы (1.4), получим неравенство

,

откуда, после преобразований, найдем

Полученная оценка очень похожа на оценку (1.1), полученную ранее, только здесь  заменено на , в связи с чем вместо  приходится рассматривать . Значения  для различных чисел степеней свободы f и уровней значимости р приведены в таблице квантилей Стьюдента.

Распределение Стьюдента позволяет оценивать генеральное среднее, когда генеральная дисперсия неизвестна. При этом число наблюдений может быть очень малым, даже равным двум Конечно, скудость информации сказывается на результатах - доверительные границы получаются довольно широкими. Поэтому везде, где только можно, нужно стараться увеличивать число степеней свободы у выборочной дисперсии, привлекая, в частности, «текущие измерения».

Сравним, например, две оценки генерального среднего по выборочному среднему, найденному по трем наблюдениям; в качестве

доверительной вероятности возьмем . В обеих оценках будем использовать одну и ту же дисперсию 0,25, только вначале будем считать ее генеральной, а потом — выборочной, найденной по тем же трем наблюдениям. Если 0,25 — это генеральная дисперсия, то , и используя нормальное распределение, получим доверительную оценку

или, после всех вычислений, .

Если же 0,25 — это выборочная дисперсия, то s = 0,5 и нужно воспользоваться распределением Стьюдента, в силу которого справедлива доверительная оценка

После вычислений получаем доверительную оценку , которая значительно уступает оценке, полученной в предположении, что известная нам дисперсия является генеральной. Этот пример еще раз подчеркивает важность определения именно генеральной дисперсии для получения наиболее узких доверительных интервалов.

В некоторых задачах требуется найти одностороннюю доверительную оценку генерального среднего, т. е. оценку только сверху или только снизу. Такие оценки непосредственно вытекают из общего определения квантилей. А именно, при доверительной вероятности 1 - р оценка для t сверху имеет вид , оценка снизу имеет вид . Используя выражение для t из формулы (1.4), получим односторонние доверительные оценки генерального среднего:

(сверху)    (снизу).

Напомним, что в таблице указаны квантили  для соответствующих уровней значимости р. Поэтому число  нужно искать в столбце с вероятностью 2р.

2. Оценка генеральной дисперсии. 

Роль дисперсии неоднократно подчеркивалась в предыдущем изложении. Не говоря о том, что знание генеральной дисперсии позволяет получать более удобные оценки генерального среднего, дисперсия имеет и самостоятельную ценность, как информация о точности применяемой методики испытаний.

Для оценки генеральной дисперсии используется выборочная дисперсия  s2 Эта дисперсия в силу случайности выборки сама является случайной величиной, т.к. математическим ожиданием для s2 служит генеральная дисперсия . Отсюда следует, что  можно оценить по s2, если известно распределение величины  s2.

Распределение величины s2 можно получить с помощью так называемого распределения Пирсона (или  распределения), открытого и разработанного Пирсоном в 1900 г. Для выборки с элементами х1, х2, . . ., хn через  обозначается сумма

.

В этой сумме есть связь , поэтому число степеней свободы . Плотность - распределения зависит только от f, графики плотности при некоторых значениях f  приведены на рис 2.  Поскольку , то и плотность рассматривается лишь на промежутке [0, ) Кривые асимметричны, хотя степень асимметрии уменьшается при увеличении f. В связи с этим отдельные квантили величины  не выражаются друг через друга.

   Рис. 2

При доверительной вероятности 1 - р двусторонняя доверительная оценка величины  имеет вид

Квантили   при различных р и f приведены в таблице IV Приложения (1).

Нетрудно усмотреть связь между величинами  и s2:

,

откуда

.

Поэтому с вероятностью 1 - р справедливо неравенство

.

Простейшие преобразования приведут нас к соотношению

,

которое и является двусторонней доверительной оценкой для генеральной дисперсии . Аналогично получаются односторонние доверительные оценки

,    .

Оценим в качестве примера генеральную дисперсию  для серии из 16 наблюдений с выборочной дисперсией s2 = 2,4, доверительную вероятность 1-р положим равной 0,90. По таблице квантилей Пирсона при числе степеней свободы f = 15 находим  и . Это даст двустороннюю доверительную оценку

или, после вычислений, 0.

Полученные оценки дисперсии можно превратить в оценки стандарта , извлекая из всех частей неравенств квадратный корень. Например, двусторонняя доверительная оценка генерального стандарта при доверительной вероятности 1 - р имеет вид

.

Вводя в рассмотрение случайную величину

,

эту двустороннюю оценку можно записать в виде

,

а соответствующие односторонние — в виде ,  (доверительную вероятность по-прежнему считаем равной 1 - р) Для удобства пользования перечисленными оценками в таблице) приведены квантили

.

Этими же квантилями можно пользоваться и для оценок генеральной дисперсии, например, с вероятностью 1 - р справедливо неравенство

.

Можно показать, что при больших f распределение величины s близко к нормальному с математическим ожиданием  и дисперсией  . На практике распределение величины s считают нормальным уже при .

Отметим, что для определения s2 и дальнейшей оценки  можно использовать «текущие измерения». При этом нужно помнить, что число степеней свободы f равно общему числу наблюдений минус число групп Именно это f и определяет распределение величины .

3. Сравнение дисперсий. 

Одной из важнейших задач статистической обработки наблюдений является сравнение двух или нескольких выборочных дисперсий. Основной выясняемый вопрос при этом — можно ли считать сравниваемые выборочные дисперсии оценками одной и той же генеральной дисперсии. С такой задачей, в частности, приходится сталкиваться при вычислении дисперсии по «текущим измерениям».

Начнем со сравнения двух дисперсий  и , имеющих соответственно f1 и f2 степеней свободы. Будем считать, что первая выборка сделана из генеральной совокупности с дисперсией  , а вторая — из генеральной совокупности с дисперсией . Выдвигается нулевая гипотеза  — гипотеза о равенстве . Для того чтобы отвергнуть эту гипотезу, нужно доказать значимость расхождения между  и  при выбранном уровне значимости р. В качестве критерия значимости обычно используется так называемое распределение Фишера.

Распределением Фишера (или F-распределением) называется распределение случайной величины:

.

Это распределение зависит только от f1 и  f2 , при этом  ,

На рис 3 приведены графики плотности F - распределения при сочетаниях  .

Как и в случае - распределения, плотность рассматривается лишь на положительной полуоси, т. е. при . Кривые имеют асимметричную форму. Квантили Фишера F1-p для некоторых наиболее употребительных уровней значимости и

Рисунок 3

различных комбинаций f1 и  f2 даны в таблицах. При нахождении квантилей  Fp , для значений р, не вошедших в таблицу, используется очевидное соотношение

.

Например ;    .

С помощью F - распределения можно находить доверительные оценки для отношения  . Если доверительная вероятность равна 1— р, то имеем двустороннюю оценку

или односторонние оценки

,                    .

Вернемся к рассмотрению нулевой гипотезы, согласно  которой . В этом случае  и, следовательно,  F - распределение может быть использовано непосредственно для оценки отношения . С вероятностью 1-р должно выполняться двустороннее неравенство

      (1.8)

или одно из односторонних неравенств

;         .

Вероятность любого противоположного неравенства равна уровню значимости р. Значит, согласно принципу значимости  противоположные неравенства невозможны, если справедлива нулевая гипотеза. Иными словами, противоположные неравенства образуют критическую область проверяемой гипотезы, и если отношение  на самом деле попадает в эту область, то различие между дисперсиями следует признать значимым.

Сформулируем получившиеся критерии значимости. При этом для удобства изложения будем обозначать через  большую из сравниваемых дисперсий. Если большей выборочной дисперсии заведомо не может соответствовать меньшая генеральная, т. е. если неравенство  заведомо невозможно, то нужно применять односторонний критерий, сравнивая отношение  с полученными выше односторонними доверительными оценками. Нулевая гипотеза отвергается, если  , где значение   берется из таблицы .

При неизвестном соотношении между  и  нужно применять двусторонний критерий, т. е. проверять, не нарушается ли установленное выше двустороннее неравенство (1.8). При этом левая часть неравенства (1.8) всегда выполнена, так как для небольших р (а принятый уровень значимости не может быть большим) обязательно , в то время как    по условию.

Поэтому нарушиться может только правая часть неравенства (1.8). Следовательно, при двустороннем критерии значимости отношение  сравнивается только со значением  (также взятым из таблицы VII Приложения (1)), и нулевая гипотеза отвергается, если .

Пример. При изучении стабильности температуры в термостате получены данные 21,2, 21,8; 21,3; 21,0, 21,4;21,3. К стабилизатору температуры

применено некоторое усовершенствование, после чего (на другом режиме) получены данные: 37,7; 37,6, 37,6; 37,4. Можно ли при уровне значимости р = 0,05 считать усовершенствование эффективным ?

Эффективность стабилизаторов температуры, очевидно, зависит отдаваемой ими дисперсии температур. Таким образом, задача состоит в том, чтобы сравнить генеральные дисперсии данных выборок температур. Вычисляем выборочные дисперсии, уменьшив для удобства вычислений все данные на 21 в первом случае и на 37,5 — во втором:

Отсюда

.

Числа степеней свободы 5, f2= 3. Усовершенствование может лишь уменьшить дисперсию, поэтому применяем односторонний критерий значимости. По таблице квантилей Фишера находим . Мы видим, что .

Следовательно, данные наблюдений не позволяют отвергнуть нулевую гипотезу и считать усовершенствование эффективным.

Критерий Фишера можно использовать для сравнения дисперсий и в том случае, когда одна из дисперсий является генеральной. В этом случае ее число

степеней свободы считается равным  . Например, сравнивая выборочную дисперсию , имеющую f1 = 4 степеней свободы, с генеральной дисперсией , мы в качестве критического значения должны взять из таблицы величину . Мы видим, что

.

Следовательно, различие между выборочной и генеральной дисперсиями не является значимым.

Распределение F с бесконечным числом степеней свободы можно использовать для получения доверительных оценок генеральной дисперсии по выборке объема п Так, при доверительной вероятности 1—р справедлива двусторонняя оценка:

, .

К сожалению, полученная оценка не дает ничего нового по сравнению с оценками п. 1.2, ибо справедливо тождество

.

4. Сравнение дисперсий выборок более двух

Рассмотрим теперь вопрос о сравнении нескольких дисперсий , имеющих числа степеней свободы  . Требуется выяснить, являются ли числа  оценками одной и той же генеральной дисперсии. Сразу же напрашивается мысль использовать F - распределение — сравнить, например, сначала  и , затем   и  и т.д. Однако такой способ сравнения может привести к ошибочному выводу — сравнивая в один прием лишь две дисперсии, мы лишаем себя всей информации остальных дисперсий.

А ведь то, что невозможно на двух случайных объектах (выборках), может стать вполне возможным на большем их числе (чем больше проводится испытаний, тем более редкие события могут произойти).

Кроме того, незначимые различия, накапливаясь от пары к паре, могут стать вполне значимыми, хотя мы этого не заметим. Разумеется, такой ошибки можно избежать, сравнивая сразу самую большую и самую маленькую дисперсию — если уж они различаются незначимо, то и между промежуточными дисперсиями различий нет. Но и этот вывод справедлив, только если все дисперсии определены по выборкам одинаковых объемов.

Таким образом, с помощью F - критерия удается сравнивать несколько дисперсий только в случае одинаковых чисел степеней свободы у сравниваемых дисперсий. При этом выявить можно только незначимость различий; если же этот критерий показывает, что наибольшая и наименьшая дисперсия различаются значимо, то по отношению ко всем остальным дисперсиям в совокупности вывод о значимом различии может быть неверен. Мы снова сталкиваемся с необходимостью использовать при сравнении полную информацию о всех заданных дисперсиях. Такое квалифицированное сравнение проводится с помощью критерия Бартлета.

Определим вначале средневзвешенную дисперсию

,  .

Вычислим величины

,

.

Бартлет показал, что в случае, когда все  соответствуют одной генеральной дисперсии, отношение  распределено приближенно, как  с k—1 степенями свободы, независимо от fi , лишь бы все . Это значит, что гипотеза о равенстве генеральных дисперсий принимается, если  при заданном уровне значимости р; в противном случае различие между дисперсиями  нужно считать значимым.

Нетрудно видеть, что всегда С > 1. Поэтому вначале вычисляют только В и сравнивают его с . Если окажется, что , то нулевую гипотезу (гипотезу о равенстве дисперсий) нужно принять, ибо и подавно <.

Если же , то С придется вычислить, применяя затем критерий Бартлета полностью.

Формулы для вычисления В и С несколько упрощаются, если все fi равны между собой. Однако в этом случае существует более удобный (и более точный) критерий Кохрана. Кохран предложил рассматривать отношение максимальной дисперсии к сумме всех остальных,

,

и нашел распределение величины g. Оказалось, что это распределение зависит только от k и от числа f степеней свободы, по которым определена каждая дисперсия .

Квантили Кохрана  приводятся в таблицах для  р = 0,05 и 0,01. Если найденное по заданным дисперсиям значение g окажется больше, чем  (для выбранного уровня значимости), то нулевую гипотезу нужно отбросить и расхождение между дисперсиями считать значимым.

Рассмотрим следующий пример, связанный с обработкой «текущих измерений» (наиболее типичный случай использования критерия Бартлета). С помощью мостика измеряются электрические сопротивления нескольких проводников. У одних проводников сопротивление мало, у других велико; естественно опасаться, что на разных уровнях сопротивлений мостик обладает разной точностью. Поэтому дисперсии, полученные на разных проводниках, необходимо сравнить.

Данные измерений приведены в таблице 1.1. В этой же таблице приведена часть расчетов для величин В и С.

Таблица 1.1  

Номер проводника,

Кол-во степеней свободы,

Дисперсия,

1

8

0,17

13,36

1,2304

7,8432

0,1250

2

12

0,40

4,80

1,6021

5,2252

0,0833

3

16

0,38

6,08

1,5798

7,2768

0,0625

4

16

0,62

9,92

1,7924

4,6784

0,0625

5

10

0,54

5,40

1,7324

3,3240

0,1000

Суммы

62

27,56

24,3478

0,4333

Приведем остальные расчеты:

,  ,

,

.

По таблице квантилей Пирсона находим, что при четырех степенях свободы . Мы видим, что  и значит, на уровне значимости р = 0,05 гипотезу о равенстве дисперсий нужно принять. Величина С нам не понадобилась, ее вычисление приведено лишь для иллюстрации.

Критерий Бартлета позволяет в разобранном примере утверждать, что генеральная дисперсия измерений на мостике не зависит от измеряемого сопротивления. Следовательно, для оценки этой дисперсии могут быть использованы все 67 измерений. В качестве оценки  нужно взять средневзвешенную дисперсию s2, которая у нас уже вычислена и равна 0,444. Этой дисперсии соответствуют 62 степени свободы, в силу чего можно считать, что ; ошибка такой замены при 62 степенях свободы весьма невелика.




1. Тема- Диффузный токсический зоб Тюмень 2011 1
2. История возникновения и эволюция теории предпринимательства.html
3. ТЕМА- Двовимірні масиви
4. . Національний рух у Східній Україні друга пол
5. Костюм мещанства и купечества 18 веке
6. по теме - Критерий устойчивости линейных систем
7.  Теоретические аспекты обложения НДС в Российской Федерации
8. .Cущностьпредпосылки и концепции происх
9. твое но этот человек не оправдывает твои ожидания таким образом мы начинаем обобщать один неудачный опыт
10. Диспропорции в экономике и пути их преодоления
11. Уральский государственный университет физической культуры кафедра Теории государства и права и констит
12. Возникновение разумного человечества
13. тема- ldquo;Происхождение эукариотических клетокrdquo;
14. театральные представления игры и зрелища Музыка в Древнем Риме
15. тематическая статистика1
16. РЕФЕРАТ дисертації на здобуття наукового ступеня кандидата юридичних наук Харків ~
17.  Свободная энергия Гиббса как критерий возможного протекания химических процессов
18. Н
19. Оброченская сош Ичалковского района РМ Морозова Юлия.
20. Проблемных породахСобака любым другим именемНе анализируйте Глава 4Сила СтаиНатуральнаядикаяСтаяНет