Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Статистические гипотезы и критерии согласия При использовании экспериментальных методов для решении кон

Работа добавлена на сайт samzan.net: 2015-07-05

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 18.5.2024

3. ПРОВЕРКА СтатистическИХ ГИПОТЕЗ

3.1. Статистические гипотезы и критерии согласия

При использовании экспериментальных методов для решении конкретных практических задач часто приходится делать некоторые предположения относительно свойств одной или нескольких генеральных совокупностей основываясь на имеющихся выборках ограниченного объема. Такие предположения являются статистическими гипотезами.

По ГОСТ 15895-77. Статистической гипотезой называют любое предположение, касающееся неизвестного распределения случайной величины в совокупности.

Роль статистических гипотез при обработке экспериментальных данных весьма высока. Без них невозможно обойтись даже при попытке численно охарактеризовать случайную величину на основе выборки, при построении точечных и интервальных оценок.

При построении точечных и интервальных оценок высказывалось предположение, что случайная величина подчиняется нормальному закону распределения. Кроме того, всегда подразумевалось что все выборочные значения принадлежат одной и той же генеральной совокупности (нет резко выделяющихся значений).

Тем более невозможно обойтись без статистических гипотез если возникает задача сравнения двух или более случайных величин.

Идея формирования и проверки статистических гипотез состоит в следующем. Пусть для некоторого числового параметра случайной величины по выборке объема N вычислена некоторая оценка . Пусть имеется причина предположить, что истинное значение параметра , т.е. его значение в генеральной совокупности, равно 0 . Это предположение следует проверить на практике, то есть по имеющимся опытным данным выборки. Такое проверяемое предположение называют нулевой гипотезой Н0 и записывают в виде соотношения Н0: =0. Даже если нулевая гипотеза справедлива, то выборочное значение  обычно не совпадает точно с 0 , поскольку оно является лишь одним из конкретных значений случайной величины , порожденной случайными выборками объема N. Если известна функция распределения оценки , построенная теоретически в предположении справедливости нулевой гипотезы, то с ее помощью можно найти такую зону, вероятность попадания в которую мала (равна малому значению a). Эта зона может использоваться в качестве некоторой критической области, то есть области, попадание в которую оценки  дает основания отвергнуть выдвинутую нулевую гипотезу.

Нулевой гипотезой обычно называют гипотезу, имеющую наиболее важное значение в проводимом исследовании. Ее обозначают Н0.

По ГОСТ 15895-77. Нулевая гипотеза это гипотеза, подлежащая проверке.

Нулевую гипотезу выдвигают и затем проверяют с помощью статистических критериев с целью выявления оснований для ее отклонения и принятия альтернативной гипотезы.

По ГОСТ 15895-77. Альтернативная гипотеза - каждая допустимая гипотеза, отличная от нулевой. Ее обозначают НА или Н1.

Обычно при проверке статистических гипотез в качестве конкретной альтернативной гипотезы, из всех возможных, выбирают гипотезу, имеющую в проводимом исследовании второе по важности значение после нулевой.

Если имеющийся статистический материал не позволяет отвергнуть нулевую гипотезу, то ее принимают и используют в качестве рабочей до тех пор, пока новые результаты испытаний не позволяют ее отклонить.

По ГОСТ 15895-77. Статистический критерий - однозначно определенный способ проверки статистических гипотез.

В основе критерия лежит некоторое известное теоретическое распределение случайной величины. По опытным данным рассчитывают некоторую случайную величину, называемую статистикой, относящуюся к данному критерию и имеющую то же распределение .

Статистикой для проверки гипотез называют функцию g(x1,x2,...,xN) результатов наблюдений составляющих выборку x1,x2,...,xN, однозначно связанную с принятым статистическим критерием и определяемую им.

Все возможные значения статистики для проверки гипотезы делят на две части: область принятия нулевой гипотезы и критическую область.

По ГОСТ 15895-77. Критической областью называют область со следующими свойствами: если значения применяемой статистики принадлежит данной области, то отвергают нулевую гипотезу; в противном случае ее принимают.

Проверка гипотезы сводится к выяснению того, в какую область попало рассчитанное значение статистики: если оно попало в критическую область, то нулевая гипотеза отвергается, а если в область принятия нулевой гипотезы, то принимается.

Так как эти решения базируются на статистиках, найденных по выборкам ограниченного объема (то есть на случайных величинах), то при принятии решения всегда возможны ошибки. При статистической проверке гипотез возможны четыре исхода, из них два ошибочные - ошибки первого и второго рода:

Нулевая гипотеза

Объективно верна

Объективно не верна

Принимается

Правильное решение

Ошибка 2-го рода

Отвергается

Ошибка 1-го рода

Правильное решение

По ГОСТ 15895-77. Уровень значимости это вероятность ошибки первого рода. Обозначим уровень значимости через a. Обычно выбирают a=0.01, a=0.1, и наиболее часто a=0.05.

Вероятность совершить ошибку второго рода, т.е. принять объективно неверную гипотезу, обозначим b. Величину p=1-b называют мощностью критерия. Обычно величиной a задаются и стараются использовать такой критерий, чтобы значение мощности p было наибольшим.

По ГОСТ 15895-77. Мощность критерия это вероятность того, что нулевая гипотеза будет отвергнута, если альтернативная гипотеза верна.

Критические области бывают односторонние и двухсторонние. Смысл этих областей показан на рис. 3.1.

 Рис. 3.1. Критические области плотности распределения:

а. - правосторонняя; б. - левосторонняя; в. – двусторонняя

Точки, отделяющие области принятия нулевой гипотезы от критических областей называют границами критической области. Обычно их определяют как квантили используемого теоретического распределения, которому подчиняется статистика для проверки гипотез.

Если хотят убедиться в том, что одна случайная величина строго больше другой (или строго меньше другой), то используют одностороннюю критическую область.

В этом случае  Н0: =0,

Н1: >0  или Н1: <0.

Если проверяют как положительные, так и отрицательные расхождения между изучаемыми величинами, то используют двусторонние критические области .

В этом случае Н0: =0,

Н1: 0.

Алгоритм проверки статистических гипотез сводится к последовательному выполнению следующих операций:

Формулируют нулевую гипотезу Н0;

Формулируют альтернативную гипотезу Н1;

Выбирают критерий для проверки Н0;

Рассчитывают статистику относящуюся к выбранному критерию;

Находят границы критической области при выбранной альтернативной гипотезе Н1;

Проверяют попадание рассчитанной статистики в критическую область и делают вывод о справедливости выдвинутой нулевой гипотезы.

Все последующее рассмотрение будем проводить в соответствии с этим алгоритмом.

При использовании механизма проверки статистических гипотез следует помнить, что даже в случае принятия нулевой гипотезы, в 100% случаев вывод будет ошибочным в связи со всегда имеющейся вероятностью совершить ошибку первого рода.

3.2. Критерий для отбрасывания резко выделяющихся

результатов испытаний

Разброс экспериментальных данных вокруг некоторого центра рассеянья является нормальным явлением и объясняется одновременным воздействием множества неконтролируемых слабо влияющих факторов. Но порой в общем массиве опытных данных появляются величины резко отличающиеся от остальной массы значений, а следовательно не принадлежащие рассматриваемой генеральной совокупности данных. Они могут появиться вследствие изменения условий эксперимента, грубых ошибок проводимых измерений, неправильной записи результатов и т.д. Полученные ошибочные опытные данные могут существенно повлиять на окончательные результаты эксперимента и должны быть исключены из рассмотрения. Для исключения сомнительных данных применяют специальные критерии. Они позволяют сделать объективное, обоснованное заключение о принадлежности или не принадлежности сомнительных данных к рассматриваемой генеральной совокупности данных.

Нулевой гипотезой при использовании этих критерием является предположение о том, что все опытные данные хi принадлежат одной и той же генеральной совокупности Х. Альтернативная гипотеза состоит в том, что одно или более из значений xi являются грубыми ошибками и не принадлежат генеральной совокупности:

Н0: хiХ ;

Н1: хiХ .

В качестве такого подозрительного значения xi может выступать либо наибольшее, либо наименьшее значение из всех опытных данных. Причем, первым на принадлежность генеральной совокупности следует проверить то значение xi, которое отстоит наиболее далеко от эмпирического центра распределения  (2.26):

.                  (3.1)

Возможны две ситуации: когда для полученной выборки опытных данных известно значение генеральной дисперсии s2, и когда s2 не известно, но можно рассчитать ее оценку - выборочную дисперсию s2.

3.2.1. Критерий для отбрасывания резко выделяющихся

результатов испытаний при известной генеральной дисперсии

Ситуация, когда известна генеральная дисперсия 2 и неизвестно математическое ожидание встречается довольно часто. Как правило, она характерна для приемочных испытаний проводимых на предприятиях занятых выпуском однотипной продукции с различными номинальными параметрами в течение длительного периода времени.

Например: Плавочные и технологические колебания механических свойств при производстве проката, труб или прессованных изделий при значимом их влиянии на уровень механических свойств практически не влияют на дисперсию этих свойств. В связи с этим большой объем результатов приемочных контрольных испытаний позволяет достаточно точно и надежно оценить генеральную дисперсию характеристик механических свойств.

Рассмотрение проведем в соответствии с общим алгоритмом из п. 3.1.

1) Н0: хiХ .

2) Н1: хiХ .

В качестве статистического критерия при известной генеральной дисперсии 2 следует использовать t -критерий [6].

Статистика этого критерия имеет вид      ,                                   (3.2)

где s - генеральное стандартное отклонение (2.22).

Границы критической области можно установить при помощи критического значения критерия ta, N, взятым из табл. П6 приложения для уровня значимости a и объема выборки N.

Если выполняется неравенство , то статистика t попадает в область принятия нулевой гипотезы, результат испытаний xi не следует считать выбросом и он должен учитываться как и остальные N-1 результатов. При  статистика t попадает в критическую область, результат испытаний xi является ошибочными и должны быть исключены их рассмотрения, а найденная ранее оценка математического ожидания должна быть скорректирована.

3.2.2. Критерий Н.В.Смирнова

Этот критерий применяется для наиболее часто встречающихся случаев, когда генеральные характеристики неизвестны, а известны лишь их оценки s2 и , произведенные на основании анализируемой выборки. Следует проверить принадлежность результата испытаний xi генеральной совокупности опытных данных. Используем общий алгоритм из п. 3.1.

1) Нулевая и альтернативная гипотезы принимаются прежними.

    Н0: хiХ .

2) Н1: хiХ .

В качестве статистического критерия используется u -критерий [6].

Статистика этого критерия имеет вид      ,                                    (3.3)

где s- выборочное стандартное отклонение (2.35).

Границы критической области можно установить при помощи критического значения критерия ua, N, взятого из табл. П7 приложения для уровня значимости a и объема выборки N.

Если выполняется неравенство , то статистика u попадает в область принятия нулевой гипотезы, результат испытаний xi не следует считать выбросом и он должен учитываться как и остальные N-1 результатов. При  статистика u попадает в критическую область, результат испытаний xi является ошибочными и должны быть исключены их рассмотрения, а найденная ранее оценка математического ожидания и дисперсии должны быть рассчитаны вновь.

3.3. Проверка гипотез о числовых значениях параметров

нормального распределения

Значения выборочных числовых характеристик случайных величин зависят от размера и состава выборки и так же являются случайными величинами. Следовательно, они сами обладают определенным рассеиванием и собственными вероятностными характеристиками. Поэтому если при расчете оценок числовых характеристик по различным выборкам получено расхождение в числовых значениях, то это еще не означает, что оцениваемые генеральные характеристики этих величин не равны. Просто может оказаться, например, что выборки взяты из различных мест одной и той же генеральной совокупности. Но, так как генеральная совокупность одна, то и ее числовые характеристики едины.

Однако, расхождение может быть и не случайным, а носить вполне закономерный характер.

Часто при решении практических задач возникает необходимость определения значимости или случайности в расхождении выборочных характеристик между собой, а также выборочных и известных генеральных характеристик. Наибольшее практическое значение имеет сравнение средних значений и выборочных дисперсий экспериментально полученных выборок результатов наблюдений и выводы о свойствах соответствующих генеральных характеристик, полученные на основании этих сравнений.

3.3.1. Сравнение двух дисперсий

Гипотезы о равенстве (или неравенстве) дисперсий имеют особо большое значение прежде всего в технике и технологии, так как измеряемая дисперсией величина рассеяния характеризует такие исключительно важные показатели, как точность машин, приборов, стабильность технологических процессов, показатели качества готовой продукции и т.д. Поэтому часто о качестве выпускаемой продукции, преимуществах той или иной технологии можно судить по результатам сравнения дисперсий. При этом возможно несколько вариантов сравнения.

3.3.1.1. Сравнение выборочной дисперсии с известной генеральной

Пусть имеются основания считать известным значение генеральной дисперсии некоторой величины  (см. п. 3.2.1). С изменением каких то факторов (например, изменена часть технологии производства) была получена новая выборка исследуемой величины объемом N. По данным этой выборки вычислена оценка дисперсии этой совокупности s2. Требуется проверить предположение: повлияло ли изменение этих факторов на величину генеральной дисперсии.

При решении этой задачи нулевая гипотеза Н0 будет заключаться в том, что дисперсия для генеральной совокупности из которой взята выборка s2 будет равна известной дисперсии .

В соответствии с общим алгоритмом:

1) Н0: .

2) Решение этой задачи возможно при трех вариантах альтернативных гипотез:

а) НА: ;    б) НА: ;      в) НА: .

Проверка нулевой гипотезы производится с использованием 2 - критерия.

Статистика этого критерия

                                            (3.4);

Границы критической области можно установить по таблицам квантилей 2 - распределения (распределения Пирсона) (см. табл. П6) для выбранного уровня значимости и числа степеней свободы n=N-1.

Нулевая гипотеза Н0 справедлива (принимается), если выполняется неравенство:

а) при НА:         ;

б) при НА:         ;

в) при НА:         .

3.3.1.2. Критерий равенства дисперсий двух совокупностей

Пусть по результатам независимых испытаний двух выборок объемом N1 и N2 из нормально распределенных совокупностей подсчитаны оценки генеральных дисперсий  и , причем . Требуется проверить нулевую гипотезу о том, что указанные выборки принадлежат генеральным совокупностям с равными дисперсиями, то есть .

В соответствии с общим алгоритмом:

Н0: .

Возможно два варианта альтернативных гипотез:

а) НА:;      б) НА: 

Используют F-критерий (критерий Фишера).

F - статистика имеет вид

при                                     (3.5)

Границы критической области можно установить по таблицам квантилей F - распределения (распределения Фишера) (см. табл. П4 и П5) для выбранного уровня значимости /2 (для альтернативной гипотезы а) или  (для альтернативной гипотезы б) и числа степеней свободы n1=N1-1 и 2=N2-1.

Нулевую гипотезу принимают, т.е. полагают, что  при выполнении одного из неравенств (для различных альтернативных гипотез):

а) при НА:;             ;

б) при НА: ;             .

В случае подтверждения нулевой гипотезы и имея основания полагать, что обе исходные выборки принадлежат одной генеральной совокупности, по двум выборочным дисперсиям можно получить более точную оценку общей генеральной дисперсии

,                                        (3.6)

которая может быть использована для дальнейшего анализа опытных данных.

Пример:  В результате испытаний 30 образцов из утяжинного (заднего) конца прессованного профиля и 20 образцов из выходного (переднего) конца найдены выборочные значения и дисперсия предела прочности алюминиевого сплава, которые составляли соответственно =401 МПа, =82, =409 МПа, =71 для каждого из концов. Требуется проверить равны ли разбросы опытных данных на переднем и заднем концах профиля, т.е. равны ли генеральные дисперсии предела прочности концов.

В соответствии с общим алгоритмом:

1) Н0: ;

2) НА: ;

3) Выбираем для проверки в соответствии с принятой альтернативной гипотезой двусторонний F-критерий;

4) Значение F-статистики .

5) Для принятого уровня значимости a=0.1, n1=N1-1=29, n2=N2-1=19 по таблице пределов распределения Фишера определяем (табл. П4)

.

В рассматриваемом случае , значит, можно принять в качестве рабочей гипотезу о том, что исследуемые зоны профиля равноценны по однородности материала.

3.3.2. Критерий равенства дисперсий ряда совокупностей

При сопоставлении дисперсий ряда совокупностей нулевая гипотеза заключается в том, что все m генеральных совокупностей, из которых взяты выборки, имеют равные дисперсии, т.е.

1) Н0: .

Различаются случаи когда имеются выборки одинакового и различного объемов.

3.3.2.1. Критерий Кохрена

Критерий Кохрена используется при равных объемах отдельных выборок. В качестве альтернативной гипотезы выступает гипотеза о том, что генеральная совокупность с наибольшей дисперсией превышает по дисперсии остальные m-1 генеральных совокупностей, т.е.

1) Н0: .

2) НА: . 

При равном объеме выборок (N1=N2=…=Nm-1=Nm) проверка  Н0 проводится по критерию Кохрена.

Статистикой относящейся к этому критерию является величина

,                                                         (3.7)

где  - наибольшая из имеющихся  дисперсий.

Границы критической области можно установить по таблицам квантилей распределения Кохрена (G - распределения) (см. табл. П8 приложения) для выбранного уровня значимости , числа сравниваемых дисперсий n1=m и числа степеней свободы n2=N-1.

Нулевую гипотезу принимают при выполнении неравенства

Пример:  В результате испытаний на растяжение пяти серий из 20 образцов алюминиевого сплава различных плавок найдены выборочные дисперсии предела прочности: =154, =208, =186, =197 , =153. Требуется оценить значимость влияния плавочных и технологических колебаний на дисперсию предела прочности материала.

Н0: .

НА: . 

Используем G-критерий .

. По таблице пределов распределения Кохрена (табл .П8)  для уровня значимости  a = 0,05  , числа степеней свободы n1=5 и n2=20-1=19 определяем (в соответствии с принятой альтернативной гипотезой используем односторонний критерий)  .

Так как условие (3.14) выполняется (0,232<0,356), то можно принять в качестве рабочей гипотезу о отсутствии влияния плавочных и технологических колебаний на дисперсию предела прочности алюминиевого сплава.

3.3.2.2. Критерий Бартлета

Критерий Бартлета используется для сравнения дисперсий при различных объемах отдельных выборок ni, причем ni5. В качестве альтернативной выступает гипотеза о неравенстве дисперсией генеральных совокупностей имеющихся m серий испытаний, т.е.

1) Н0: .

НА: . 

При сравнении дисперсий в выборках различного объема используют критерий Бартлета.

Статистика этого критерия рассчитывается по выражениям

,..................................(3.8)

где                   ,                                          (3.9)

.                                                              (3.10)

Границы критической области можно найти по таблицам квантилей 2 - распределения (распределения Пирсона) (см. табл. П3) для уровня значимости a и числа степеней свободы n=m-1.

Если выполняется условие   , то нулевую гипотезу о равенстве генеральных дисперсий совокупностей, из которых взяты выборки принимают. При невыполнении этого условия нулевую гипотезу отвергают и принимают альтернативную.

В случае подтверждения нулевой гипотезы об однородности дисперсий () по m выборочным дисперсиям на основании выражения (3.10) можно произвести оценку генеральной дисперсии s2 , которая может быть использована в дальнейшем, например для построения доверительных интервалов.

3.3.3. Проверка гипотез о числовых

значениях математических ожиданий

Часто для решения вопроса о соответствии произведенной продукции определенным требованиям (например, требованиям ГОСТ или ТУ), при выявлении преимущества того или иного технологического процесса или нового материала и т.д. возникает необходимость по выборочным средним значениям исследуемых величин делать вывод о соответствующих генеральных значениях – математических ожиданиях. При этом может возникнуть задача сравнения математического ожидания с конкретным числовым значением (например с известным математическим ожиданием) и задача сравнения двух математических ожиданий по двум выборочным средним.

3.3.3.1. Сравнение математического ожидания случайной величины с известным значением

Эта задача может возникнуть в двух равноценных вариантах. 1) Когда необходимо сделать обоснованное заключение о равенстве или неравенстве математического ожидания случайной величины конкретному числовому значению (например, m=3). 2) Когда накоплен значительный объем экспериментальных данных, который позволил определить математическое ожидание m (например, m=3) и дисперсию s2 интересующей характеристики, но после внесения некоторых изменений в условия получения экспериментальных данных получена новая выборка, по которой определены значения выборочного среднего  и дисперсии s2 несколько отличающиеся от генеральных. Возникает необходимость установить значимо ли влияние условий получения экспериментальных данных на значения интересующей величины, т.е. имеется ли значимое различие между выборочным значением  и генеральным математическим ожиданием m. Оба эти варинта постановки задачи решаются одинаково.

Возможны два несколько отличающихся случая: А) генеральная дисперсия s2 известна; Б) генеральная дисперсия s2 неизвестна, но известна ее оценка s2.

А) Рассмотрим случай когда генеральная дисперсия s2 известна.

Примем в качестве нулевой гипотезы предположение о том, что математическое ожидание m1 интересующего нас свойства после изменения условий получения опытных данных равно математическому ожиданию m соответствующего свойства до внесения изменений (или равно конкретной величине m), т.е.

Н0:  m1= m.

Альтернативная гипотеза может быть в трех вариантах

а) НА: m1> m;         б) НА: m1< m ;        в) НА: m1 m .

Используется z-критерий

z - статистика имеет вид

,                                                 (3.11)

Границы критической области можно установить по таблицам квантилей нормированного нормального распределения (распределения Лапласа) (табл. П2) для выбранного уровня значимости .

Нулевую гипотезу принимают, т.е. полагают что m1= m при выполнении неравенств:

а) при альтернативной гипотезе НА: m1> m                  ;

б) при альтернативной гипотезе НА: m1< m                  ;

в) при альтернативной гипотезе НА: m1 m                  .

Б) Генеральная дисперсия s2 неизвестна, но известна ее оценка s2.

В этом случае вместо генеральной дисперсии s2 использую выборочную дисперсию s2. Ход рассуждений здесь аналогичен приведенному выше в п. А), но в качестве критерия следует использовать t-критерий. Кроме того, обобщим случаи альтернативных гипотез а) и б) из п. А), используя абсолютные значения отклонений и учитывая симметричный характер t-распределения.

Н0:  m1= m.

Два варианта альтернативной гипотезы

а) НА: m1> m или НА: m1< m ;        в) НА: m1 m .

Используют t-критерий.

t - статистика имеет вид              ,                                       (3.12)

Границы критической области можно установить по таблицам квантилей  t-распределения (распределения Стьюдента) (табл. П6) для выбранного уровня значимости и числа степеней свободы n=N-1.

Нулевую гипотезу принимают, т.е. полагают что m1=m при выполнении неравенств:

а) при альтернативной гипотезе НА: m1> m или m1< m           ;

в) при альтернативной гипотезе НА: m1 m                             .

3.3.3.2. Сравнение математических ожиданий двух совокупностей

Пусть для двух нормально распределенных генеральных совокупностей с неизвестными параметрами m1, s12, и m2, s22 испытали выборки объемом N1 и N2. По результатам испытаний подсчитали оценки параметров распределения , и , . Требуется установить равенство или неравенство математических ожиданий этих совокупностей m1 и m2.

Примем нулевую гипотезу о равенстве математических ожиданий при альтернативной гипотезе об их отличии.

Н0: m1=m2=m ;

НА: m1m2;

Для проверки гипотезы используют t-критерий Стьюдента.

Возможно два случая: А) дисперсии генеральных совокупностей равны, т.е. s12=s22=s2; Б) дисперсии генеральных совокупностей не равны, т.е. s12s22.

А) Дисперсии генеральных совокупностей равны. 

4) В этом случае вычисляют оценку общей дисперсии s2:

                              (3.13)

и статистику                 .                                                (3.14)

Границы критической области можно установить по таблицам квантилей t-распределения (распределения Стьюдента) для выбранного уровня значимости и числа степеней свободы n=N1+N2-2 (табл. П6).

Нулевую гипотезу принимают при выполнении неравенства  .

Б) Дисперсии генеральных совокупностей не равны (s12s22).

4) В этом случае оценку общей дисперсии s2 вычислять не имеет смысла и t-статистику вычисляют по выражению:

.                                           (3.15)

5) Границы критической области можно установить по таблицам квантилей t-распределения (распределения Стьюдента) (табл. П6) для выбранного уровня значимости и числа степеней свободы n, которое определяют из выражения

,                                                (3.16)

где                             .                                                      (3.17)

6) Нулевую гипотезу принимают при выполнении неравенства .

В случае принятия нулевой гипотезы Н0: m1=m2=m по двум выборочным средним производят оценку общего математического ожидания

,                                               (3.18)

которую можно использовать, при дальнейшем анализе опытных данных, например, для построения доверительных интервалов.

3.4. Критерий согласия. Проверка гипотез о виде функции

распределения

Рассмотренные ранее методы оценки случайной величины и проверки гипотез предполагали что известна функция ее распределения – распределения   Гаусса. Однако, в большинстве случаев сам вид закона распределения является гипотетическим и нуждается в статистической проверке.

Наиболее простым, но весьма приближенным методом оценки согласия результатов эксперимента с тем или иным законом распределения является графический метод, заключающийся в построении эмпирического закона распределения и сопоставлении его с теоретическим [5]. Если экспериментальные точки лежат вблизи теоретического графика, то опытные данные соответствуют теоретическому закону распределения. Графический метод является в значительной мере субъективным и используется на практике в качестве первого приближения при решении этой задачи.

Более объективным методом установления вида распределения случайной величины является применение критериев согласия. Критерии согласия служат для проверки статистической гипотезы о соответствии генеральной совокупности предполагаемому теоретическому закону распределения на основании анализа выборки опытных данных из этой совокупности. Существует достаточно большое количество критериев согласия [6], отличающихся своей мощностью и объемом опытных данных, необходимых для их использования. Рассмотрим некоторые из них.

3.4.1. Критерий согласия Пирсона (2-критерий)

Критерий согласия Пирсона применяется для проверки гипотезы о соответствии эмпирического закона распределения предполагаемому теоретическому распределению при больших объемах выборки (N>100).

Для использования критерия 2 весь размах варьирования опытных данных разбивают на m интервалов и для каждого из них определяют частоту попадания наблюдений nj в каждый интервал. Для удобства оценок параметров распределения интервалы выбирают одинаковой длины.

Число интервалов зависит от объема выборки. Обычно принимают: при N=100 m=1015, при N=200 m=1520, при N=400 m=2530, при N=1000 m=3540. Интервалы, содержащие менее пяти значений, объединяют с соседними.

Статистикой критерия Пирсона служит величина

,                                            (3.19)

где nj – эмпирическая частота попаданий наблюдений в j-й интервал; pj - теоретическая вероятность попадания случайной величины в j-й интервал. При вычислении вероятности pj следует иметь в виду, что левая граница первого интервала и правая граница последнего должны совпадать с границами области возможных значений случайной величины. Для нормального закона распределения, в частности,  это - и +.

При проверке гипотезы о соответствии опытных данных нормальному закону распределения для определения вероятностей pj следует использовать функцию Лапласа . Исходные наблюдения xj необходимо нормировать согласно выражению

,                                                 (3.20)

где  и s - соответственно выборочное среднее и среднеквадратическое отклонение рассматриваемой случайной величины. После разбивки нормированных наблюдений на n  интервалов, вероятность pj попадания случайной величины в j-й интервал с границами zjлев и zjпр рассчитывается по выражению    (используя таблицу П1).

Нулевую гипотезу о соответствии выборочного распределения теоретическому проверяют путем сравнения величины, вычисленной по выражению (3,19) с критическим значением , найденным из таблиц распределения Пирсона (табл. П3) для уровня значимости a и числа степеней свободы  n=m-c-1, где  m - число интервалов разбиения после их объединения, с - число параметров оцениваемых по рассматриваемой выборке (для нормального закон распределения таких параметров два:  и s2). Если выполняется неравенство , то нулевую гипотезу не отвергают. При несоблюдении этого условия принимают альтернативную гипотезу о принадлежности выборки неизвестному закону распределения.

3.4.2. Критерий согласия Шапиро-Уилка (W-критерий)

Этот критерий предназначен для проверки гипотезы о нормальном или логарифмически нормальном законе распределения при ограниченном объеме выборки и является более мощным чем другие критерии (N50).

Предварительно анализируемую выборку x1,x2,...,xn представляют в виде вариационного ряда x1<x2<...<xn .

Для вычисления статистики критерия

                                                  (3.21)

вычисляют выборочную дисперсию  и величину

,                                 (3.22)

где значения  для i=1,2,...,k определяют из таблицы. Причем если N - четное число, то , если N - нечетное число, то .

Нулевую гипотезу о нормальности распределения принимают если , где  - критическое значение критерия Шапиро-Уилка для выбранного уровня значимости a  [6].

3.4.3. Приближенные критерии нормальности распределения

Для приближенной проверки гипотезы о соответствии случайной величины нормальному закону распределения существует целый ряд приближенных критериев. Рассмотрим два наиболее широко используемых из них.

А. Проверка нормальности распределения с использование

показателей асимметрии и эксцесса

При такой проверке вычисляют выборочные оценки значений

асимметрии:                                                                                          (3.23)

и эксцесса                                           ,                                            (3.24)

где m3 и m4 - выборочные значения центральных моментов третьего и четвертого порядков, рассчитываемые соответственно по выражениям

                                            (3.25)

                                            (3.26)

Рассчитывают среднеквадратические отклонения для оценок асимметрии и эксцесса соответственно по выражениям

,                                                (3.27)

.                                                (3.28)

Сравнивают абсолютные значения асимметрии А и эксцесса Е с их дисперсиями sA и sE соответственно. В случае, если АsA и ЕsE, нулевую гипотезу не отвергают и полагают случайную величину распределенной нормально.

Кроме рассмотренного, возможен более объективный подход к проверке нормальности распределения, заключающийся в объединении рассмотренных выборочных характеристик в общую статистику

,                                                (3.29)

которая сопоставляется с табличным значением квантили -распределения для уровня значимости a и числа степеней свободы n=2.

Если выполняется равенство , то нулевую гипотезу о нормальности закона распределения  не отвергают.

Б. Проверка нормальности распределения по среднему абсолютному

отклонению (САО)

Проверку согласия распределения случайной величины нормальному закону распределения может быть проведена с применением среднего абсолютного отклонения (критерия САО), пригодного для выборок малого объема (N<120).

Статистикой этого критерия является величина

.                                                  (3.30)

Закон распределения с вероятностью p=0.95 (с уровнем значимости a=0.05) соответствует нормальному если выполняется неравенство

,                                               (3.31)

где s - среднеквадратическое отклонение.




1. Профессиональные компетенции педагога, обеспечивающие формирование у младших школьников умений работать с текстом на уроках окружающего мира
2.  Резюме 2 Описание организации 2
3. ИССЛЕДОВАНИЕ ВЛИЯНИЯ РОДИТЕЛЬСКОЙ УСТАНОВКИ МАТЕРИ НА РАЗВИТИЕ РЕБЁНКА
4. Проблемы и перспективы ценообразования на рынке ценных бумаг правовые основы, совершенствование
5. Вывод законов отражения и преломления из принципов Гюйгенса и принципа Ферма
6. Уральский государственный лесотехнический университет УГЛТУ Кафедра транспорта и дорожного строите
7.  Представьте- людный декабрьский вечер не совсем вечер конечно но уже стемнело
8. Коммуникативное мастерство врача и эффективность взаимодействия с пациентом
9. Применение препарата Дюфастон в период после переноса эмбрионов в программе экстракорпорального оплодотворения
10. факт настолько общеизвестный что само его обсуждение является педагогическим трюизмом
11. Тема 10- Визуальное проектирование в C Тема урока Элементы управления 2 Вопросы рассматриваемые на
12. Численность, состав, организационная структура партии Эсеров в начале 1900-х годо
13. За~ы 20072802 берілген ~згерістер мен толы~тыруларымен 1тарау
14. А агЕнт алфавИт аэропОрты им.html
15. прямого отождествления
16. тема единиц. Основные характеристики измерений
17. на тему Спрос предложение и цена в системе рыночных отношений Группа
18. Лабораторна робота 1 з дисципліни Комп~ютерна обробка гідрогеологічних та інженерногеологічних даних
19. вычислительных машин ЭВМ и сопоставить эти сведения с этапами в области обработки и передачи информации
20. реферату- Мистецтво писемності Стародавнього СходуРозділ- Образотворче мистецтво Мистецтво писемності Ст