Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Если план исследования большего числа групп совершенно недопустимо просто сравнивать их попарно.

Работа добавлена на сайт samzan.net:


Методы множественного сравнения

Критерий Стьюдента может быть использован для проверки гипотезы о различии средних только для двух групп. Если план исследования большего числа групп, совершенно недопустимо просто сравнивать их попарно. Для корректного решения этой задачи можно воспользоваться, например, дисперсионным анализом. Однако дисперсионный анализ позволяет проверить лишь гипотезу о равенстве всех сравниваемых средних. Но, если гипотеза не подтверждается, нельзя узнать, какая именно группа отличалась от других. Это позволяет сделать методы множественного сравнения, которые в свою очередь также бывают параметрические и непараметрические. Эти методы дают возможность провести множественные сравнения так, чтобы вероятность хотя бы одного неверного заключения оставалась на первоначальном выбранном уровне значимости, например, 5%.

Среди параметрических критериев Стьюдента для множественных сравнений, критерий Ньюмана-Кейлса, критерий Тьюки, критерий Шеффе, критерий Даннета, а среди непараметрических - критерий Краскела-Уоллиса, медианный критерий. Надо сказать, что основные параметрические критерии для множественного сравнения независимых групп могут после некоторых модификаций применяться для установления различий и в повторных измерениях, если дисперсионный анализ установил наличие таких различий.

Рассмотрим некоторые критерии. Еще раз обращаем внимание, что к применению этих критериев надо прибегать в случае, если дисперсионный анализ показал наличие значимых различий между средними значениями выборок.

Буквой m обозначим число сравниваемых групп.

Критерий Стьюдента для множественного сравнений основан на использовании неравенства Бонферрони: если к-раз применить критерий с уровнем значимости альфа, то вероятность хотя бы в одном случае найти различие там, где его нет, не превышает произведения к на альфа. Из неравенства Бонферонни следует, что если мы хотим обеспечить вероятность ошибки альфа', то в каждом из сравнений мы должны принять уровень значимости альфа'/k - это и есть поправка Бонферрони (к - число сравнений). Понятно, что такое уменьшение в несколько раз значимости делает тест достаточно "жестким" с ростом числа сравнений, установить различия становится достаточно трудно. Чтобы несколько смягчить данный тест, пользуются обобщенной оценкой внутригрупповой дисперсии, число степеней свободы при этом возрастает, что в свою очередь приводит к уменьшению критического значения для проверки теста. Число степеней свободы при таком подходе для критерия Стьюдента при таком подходе равно f = m*(n - 1), где n - объем групп, а для групп разного объема число степеней свободы будет равно суммарной численности всех групп N минус количество групп m (что в случае m>2 превышает обычное число степеней свободы для критерия Стьюдента, равное суммарной численности двух непосредственно сравниваемых групп минус 2).

Этот метод работает, если число сравнений невелико, обычно не больше 8. При большем числе сравнений критерий Ньюмана-Кеулса и Тьюки дают более точную оценку вероятности альфа'.

КРИТЕРИЙ СТЬЮДЕНТА ДЛЯ МНОЖЕСТВЕННЫХ СРАВНЕНИЙ

Только что мы познакомились со злостным вредителем научных исследований — эффектом множественных сравнений. Он состоит в том, что при многократном применении критерия вероятность ошибочно найти различия там, где их нет, возрастает.

Если исследуемых групп больше двух, то следует воспользоваться дисперсионным анализом. Однако дисперсионный ана25

лиз позволяет проверить лишь гипотезу о равенстве всех средних. Но, если гипотеза не подтверждается, нельзя узнать, какая именно группа отличается от других.

Это позволяют сделать методы множественного сравнения. Все они основаны на критерии Стьюдента, но учитывают, что сравнивается более одной пары средних. Сразу поясним, когда, на наш взгляд, следует использовать эти методы. Наш подход состоит в том, чтобы в первую очередь с помощью дисперсионного анализа проверить нулевую гипотезу о равенстве всех средних, а уже затем, если нулевая гипотеза отвергнута, выделить среди них отличные от остальных, используя для этого методы множественного сравнения*. Простейший из методов множественного сравнения — введение поправки Бонферрони.

Как было показано в предыдущем разделе, при трехкратном применении критерия Стьюдента с 5% уровнем значимости вероятность обнаружить различия там, где их нет, составляет не 5%, а почти 3x5 = 15%. Этот результат является частным случаем неравенства Бонферрони: если к раз применить критерий с уровнем значимости а, то вероятность хотя бы в одном случае найти различие там, где его нет, не превышает произведения ^ на а. Неравенство Бонферрони выглядит так:

а' < ка,

где а' — вероятность хотя бы один раз ошибочно выявить различия.

* Некоторые авторы считают этап дисперсионного анализа излишним и предлагают сразу применить методы множественных сравнений. Этот подход изложен в В. W. Broun, Jr., М. Hollander. Statistics: а biomedical introduction. Wiley, New York, 1977, chap. 10. Analysis of K-samples problems.

Можно сказать, что асобственно, и является истинным уровнем значимости многократно примененного критерия. Из неравенства Бонферрони следует, что если мы хотим обеспечить вероятность ошибки а', то в каждом из сравнений мы должны принять уровень значимости а '/к — это и есть поправка Бонферрони. Например, при трехкратном сравнении уровень значимости должен быть 0,05/3 = 1,7%.

Поправка Бонферрони хорошо работает, если число сравнений невелико. Если оно превышает 8, метод становится слишком «строгим» и даже весьма большие различия приходится признавать статистически незначимыми*. Существуют не столь жесткие методы множественного сравнения, например критерий Ньюмена—Кейлса (его мы рассмотрим в следующем разделе). Все методы множественного сравнения схожи с поправкой Бонферрони в том, что, будучи модификацией критерия Стьюдента, учитывают многократность сравнений.

Один из способов смягчить строгость поправки Бонферрони состоит в том, чтобы увеличить число степеней свободы, воспользовавшись знакомой из дисперсионного анализа внутри-групповой оценкой дисперсии. Вспомним, что

X, -X

2

2 2 S S

+

, Я, nz

где s2 — объединенная оценка дисперсии совокупности.

Используя в качестве такой оценки внутригрупповую дисперсию slHy (гл. 3), получим:

Xt -X

2 2

^вну ^вну

__L + —

Если объемы выборок одинаковы, то

t = x{-x2

2s2

< вну

п

* Способность критерия выявлять различия называется чувствительностью, она обсуждается в гл. 6.

Число степеней свободы \ = т(п-\). Если число групп т больше 2, то число степеней свободы при таком расчете будет больше 2{п -1), благодаря чему критическое значение / уменьшится.

Бег и менструации. Продолжение анализа

В предыдущей главе мы выяснили, что различия в ежегодном числе менструальных циклов в группах спортсменок, физкультурниц и в контрольной группе статистически значимы. Однако осталось неясным, отличаются ли от контрольной группы и спортсменки, и физкультурницы — или только спортсменки? Отличаются ли спортсменки от физкультурниц? Способа определить межгрупповые различия у нас не было. Теперь, используя критерий Стьюдента с поправкой Бонферрони, мы можем попарно сравнить все три группы.

Внутригрупповая оценка дисперсии s2BHy =3,95. Число групп т = 3, численность каждой группы п = 26. Следовательно, число степеней свободы v = т(п -1) = 3(26-1) = 75. (Если бы мы оценивали дисперсию по двум группам, число степеней свободы было бы 2(п -1) = 2(26 -1) = 50.) Произведем попарное сравнение трех групп.

При сравнении контрольной группы и группы физкультурниц имеем:

V V 26

при сравнении контрольной группы и группы спортсменок: { = Хф= 91-П.5 =_435j

Т~ V 26

и при сравнении группы физкультурниц и группы спортсменок:

,=^??-=щьЕ=1,81.

V 26

Мы провели 3 сравнения, поэтому уровень значимости в каждом должен быть 0,05/3, то есть примерно 0,017. По таблице 4.1 находим*, что при 75 степенях свободы критическое значение составляет примерно 2,45.

Таким образом, мы можем заключить, что и у спортсменок, и у физкультурниц частота менструаций ниже, чем в контрольной группе, при этом у спортсменок и физкультурниц она не отличается.




1. РЕФЕРАТ дисертації на здобуття наукового ступеня кандидата історичних наук
2. Загальна характеристика ЗАТ Харківський велосипедний завод
3. имущих классов потерявших все в результате экспроприации их собственности.
4. темах с цифровым управлением
5. задание 1 Занятие 3 1 Переведите на латинский язык- швы черепа оболочка трахеи ветвь нижней челю
6. Актуальные проблемы российско-американских отношений
7. Иллиада и Одиссея она встречается много раз Он крылатое слово промолвил между собой обменивались сл
8. Виды правовых норм
9.  Теоретические аспекты проблемы жизненного цикла товара 5 1
10. Затверджую
11. ВеК Носкова В
12. Варіант 1 1Матерія ~ мисленна абстракція в якій відображені найбільш загальні властивості речей і явищ в
13. суррогатного материнства Биоэтические проблемы искусственной инсеминации ИИ
14. ЛЕКЦІЯ 14 Спортивний рух української діаспори Викладач Гречанюк О
15. Тема 100 Основными функциями плазмолеммы являются барьерная транспортная; поступление и выведение ве
16. Тема- Введение Определение предмета анатомии и физиологии их связь с другими дисциплинами
17. Экономическая стратегия Российского правительства в области природопользования
18. Изучение источников выбросов метана на предприятии и оценка эффективности мероприятий по обеспечению экологической безопасности
19. Минута СлавыНастя- Конкурс наш проходит для того чтобы ученики нашей школы могли показать свои таланты
20. реферату- Україна та Європейський СоюзРозділ- Соціологія Україна та Європейський Союз ldquo;Європейський в