Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Тема 9 статистична Перевірка гіпотез План 9

Работа добавлена на сайт samzan.net:


Тема 9. статистична Перевірка гіпотез

План

9.1. Визначення гіпотези. Види гіпотез

9.2. Перевірка гіпотез

9.3. Типи помилок, які виникають при прийнятті гіпотези

Питання для самоконтролю

Література

9.1. Визначення гіпотези. Види гіпотез

Статистична гіпотеза – це певне припущення щодо властивостей генеральної сукупності, яке можна перевірити за даними вибіркового спостереження. Гіпотеза, яку необхідно перевірити, формулюється як відсутність відмінностей між параметром генеральної сукупності і заданою величиною.

Цю процедуру перевірки гіпотез часто застосовують для того, щоб відрізнити структуру (закономірність) від простої випадковості, і з цієї точки зору вона дає можливість отримати корисні початкові дані для ухвалення рішення. Гіпотеза є твердженням про генеральну сукупність, що може бути або вірним, або невірним. Дані допомагають вирішити, яку з двох гіпотез прийняти як істинну.

Нульова гіпотеза, яку позначають, є заперечуваною, часто дуже конкретне твердження, як, наприклад, твердження про чисту випадковість.

Дослідницька гіпотеза, або альтернативна гіпотеза,, є метою доказу, і для прийняття її як істинної потрібний переконливий доказ проти нульової гіпотези. Ухваленням нульової гіпотези є слабкий висновок, а відхилення нульової гіпотези й ухвалення альтернативної є строгий висновок і значущий результат.

Щоб з'ясувати, чи рівне середнє генеральній сукупності  заданому значенню, перевіряють нульову гіпотезу проти альтернативної гіпотези . Задане значення – це відоме фіксоване число, яке отримане не з вибіркових даних. Така перевірка є двосторонньою, оскільки альтернативна гіпотеза дозволяє, щоб значення середнього для генеральної сукупності () розташовувалося як справа, так і зліва від заданого значення (). Таку перевірку гіпотези про середнє генеральної сукупності називають також t-тестом, або t-тестом Стьюдента.

9.2. Перевірка гіпотез

Перевірка гіпотези полягає в з'ясуванні того, чи далі відстоїть середнє значення вибірки  від заданого значення, чим це могло б бути викликано випадковістю за умови, що  рівно заданому значенню . Таким чином, відстань між  і  порівнюють із стандартною помилкою , використовуючи при цьому t - таблицю Стьюдента. Процедуру перевірки можна виконати або на основі двостороннього довірчого інтервалу, або за допомогою t-статистики (або t-теста), яка, обчислюється за формулою:

         (9.1)

Нижче описано виконання двосторонньої перевірки з використанням довірчого інтервалу та з використанням t-теста (обидва підходи завжди дають один і той же результат).

Якщо задане значення  знаходиться в межах двостороннього довірчого інтервалу, або (еквівалентне твердження):, то нульову гіпотезу  приймають як прийнятну можливість. Вибіркове середнє  не значимо відрізняється від . Спостережувана різниця між вибірковим середнім  заданим значенням  може бути обумовлена просто випадковістю. Результат не є статистично значущим.

Якщо задане значення  не знаходиться в межах двостороннього довірчого інтервалу, або (еквівалентне твердження) –, то приймають альтернативну гіпотезу  і відкидають нульову гіпотезу . Вибіркове середнє  значно відрізняється від . Спостережувана різниця між вибірковим середнім  і заданим значенням  не може бути обумовлена тільки випадковістю. Результат є статистично значущим.

Виконуючи перевірку статистичної гіпотези, ви, таким чином, приймаєте нульову гіпотезу () всякий раз, коли  є прийнятно можливим значенням для . Якщо нульова гіпотеза вірна, вірогідність того, що буде прийняте правильне рішення, дорівнює довірчому рівню (95% або будь-якому іншому) того стовпця, який ви використовували в t-таблиці.

У наступній таблиці містяться основні величини, необхідні для перевірки гіпотез як про середній нормально розподіленій генеральній сукупності, так і про вірогідність виникнення події для біноміального розподілу (при великих n):

Нормальний

розподіл

Біноміальний

розподіл

Середнє генеральній сукупності

Задане значення

Нульова гіпотеза

Альтернативна гіпотеза

Дані

x подій з n випробувань (частка)

Оцінка

Стандартна помилка

Довірчий інтервал

t-статистика (або t-тест)

t-статистики (або t-теста) є прикладом більш загального поняття тест-статистики, найбільш корисною з погляду вибору однієї з двох гіпотез, величини, яку обчислюють на основі наявних даних. Значення тест-статистики порівнюють із відповідним критичним значенням, яке знаходять за допомогою стандартної статистичної таблиці. Наприклад, t-значення з t-таблиці є критичним t-значенням. Корисне емпіричне правило полягає в тому, що якщо абсолютне значення t-статистики (або t-теста) більше числа 2, то нульову гіпотезу відхиляють, інакше – приймають.

Односторонній t-тест відповідає нульовій гіпотезі, що затверджує, що значення  знаходиться по одну сторону від, і альтернативній гіпотезі, що затверджує, що значення  знаходиться по іншу сторону від . Щоб використовувати односторонній (направлений) тест, слід бути впевненим, що незалежно від поведінки даних, ви продовжуватимете використовувати односторонній тест на тій же стороні («більше, ніж» або «менше, ніж»). Якщо існують сумніви, слід використовувати двосторонній тест; якщо результат двостороннього тесту виявиться значущим, потім на його основі можна зробити односторонній висновок.

Перевірку гіпотези можна виконати шляхом побудови одностороннього довірчого інтервалу (відповідно до затвердження альтернативної гіпотези), або за допомогою t-статистика (або t-тест). Значущий результат (ухвалення альтернативної гіпотези) матиме місце, коли значення заданої величини  не потрапить в довірчий інтервал. Це відбувається в тому випадку, коли  знаходиться на передбачуваною альтернативною гіпотезою стороні від  і значення t-статистики з абсолютної величині більше табличного t-значения. Результат є значущим, якщо  (коли перевіряється) або  (коли перевіряється ).

Для одностороннього t-теста, який перевіряє чи більше ніж, гіпотезу формулюють так:  і . Довірчий інтервал включає всі значення, які, принаймні, не менше, ніж .

Якщо задане значення  знаходиться всередині довірчого інтервалу, або (еквівалентне твердження):, то нульову гіпотезу  приймають як прийнятну можливість. Вибіркове середнє  не значно більше . Якщо  більше, спостережувану різницю можна пояснити тільки випадковістю. Результат не є статистично значущим.

Якщо  не знаходиться усередині довірчого інтервалу, або (еквівалентне твердження):, то приймають альтернативну гіпотезу  і відкидають нульову гіпотезу . Вибіркове середнє  значно більше . Спостережувану різницю між вибірковим середнім  і заданим значенням  не може бути обумовлена тільки випадковістю. Результат є статистично значущим.

Для одностороннього t-теста, який перевіряє, чи менше ніж, гіпотезу формулюються так:  і . Довірчий інтервал включає всі значення, які не більше, ніж .

Якщо  знаходиться всередині довірчого інтервалу, або (еквівалентне твердження):, то нульову гіпотезу  приймають як прийнятну можливість. Вибіркове середнє  незначно менше . Якщо  менше, ніж, спостережувану різницю можна пояснити тільки випадковістю. Результат не є статистично значущим.

Якщо  не знаходиться усередині довірчого інтервалу, або (еквівалентне твердження):, то приймають альтернативну гіпотезу  і відкидають нульову гіпотезу . Середнє вибірки  значно менше . Спостережувану різницю не можна пояснити лише випадковістю. Результат є статистично значущим.

9.3. Типи помилок, які виникають при прийнятті гіпотези

Залежно від того, яка з гіпотез насправді є істинною, можна зробити два типи помилок. Помилки I роду припускаються, відкидаючи вірну нульову гіпотезу й оголошуючи результат перевірки статистично значущим. Вірогідність здійснення помилки I роду (при вірній нульовій гіпотезі) визначається вибором відповідного значення в t- таблиці, звичайно це рівень значущості 0,05 (5%). 

Помилку II роду здійснюють, приймаючи нульову гіпотезу, й оголошуючи результат статистично незначущим, тоді як істинною є альтернативна гіпотеза. Вірогідністю здійснення помилки II роду (при вірній альтернативній гіпотезі) управляти нелегко, але вона може знаходитися (залежно від дійсного значення ) у межах від 0 до рівня довіри, тесту (наприклад, 95%). Зверніть увагу, що кожен тип помилки заснований на припущенні про істинність одної з гіпотез. Оскільки кожна з гіпотез або вірна, або невірна, залежно від генеральної сукупності (але не від даних), ми не розглядаємо поняття вірогідності справедливості гіпотези.

Попередні умови, необхідні для перевірки гіпотези, наступні: (1) набір даних є випадковою вибіркою з даної генеральної сукупності, (2) або вимірювані величини є приблизно нормально розподіленими, або розмір вибірки достатньо великий для того, що б середнє значення вибірки було приблизне нормально розподілено.

Рівень перевірки, або рівень значущості, є вірогідність прийняти альтернативну гіпотезу, коли правильною є нульова гіпотеза (тобто зробити помилку I роду). Зазвичай цей рівень встановлюють рівним 5%, але його можна встановити рівним 1% або 0,1% (або навіть 10% для деяких завдань), вибравши відповідний стовпець t-таблиці.

p- значення показує, наскільки незвичайним є отримання наявних даних за умови справедливості нульової гіпотези. Малі p- значення свідчать про малу вірогідність такої події та приводять до відхилення . Зазвичай  відкидають, коли p- значення менше 0,05. Результат перевірки називають статистично значущим (р < 0,05), якщо він значущий на рівні 5%. Використовують також терміни високо значущий (р < 0,01), дуже високо значущий (р < 0,001) і незначущий (p > 0,05).

Питання для самоконтролю

  1.  Що таке гіпотеза?
  2.  Коли виникає необхідність у перевірці статистичних гіпотез?
  3.  Які гіпотези використовуються?
  4.  Яка із гіпотез є найбільш визначеною?
  5.  Яку гіпотезу необхідно доказувати?
  6.  У чому полягає перевірка гіпотез за допомогою довірчого інтервалу?
  7.  У чому полягає перевірка гіпотез за допомогою t-статистики?
  8.  Прийняття якої гіпотези являє собою слабкий висновок або слабке заключення?
  9.  Чи існує різниця в результатах перевірки гіпотез за допомогою довірчого інтервалу та  t-статистики?
  10.   Виконування яких вимог необхідно для застосування перевірки статистичних гіпотез?
  11.   Які типи помилок можливо допускати в залежності від того, яка із гіпотез дійсно є істиною?

12.  Прийняття якої гіпотези являє собою строге заключення та значимий результат?

13.  Яку гіпотезу необхідно прийняти якщо об’єм вибірок n більше 40 та значення t-статистики по абсолютній величині більше числа 2?

14. При прийнятті нульової гіпотези  як звучить висновок, якщо перевірка гіпотез здійснюється за допомогою довірчого інтервалу?

15.  Як звучить висновок, якщо перевірка гіпотез здійснюється за допомогою довірчого інтервалу, якщо була прийнята альтернативна гіпотеза ?

Література

  1.  Сигел Эндрю. Практическая бизнес-статистика.: Пер. с англ. М.: Изд. Дом "Видьямс", 2002. - 1056 с.
  2.  Статистика: Підручник / А.В. Головач, А.М. Єріна, О.В. Козирєв та ін.; За ред. А.В. Головача, А.М. Єріної, О.В. Козирєва. – К.: Вища шк.., 1993. – 623 с.
  3.   Теория статистики: Учебник/ Под. ред. проф. Р.А. Шмойловой. – 3-е изд., перераб. – М.: Финансы и статистика, 2002. – 560 с.




1. РОССИЙСКАЯ ПРАВОВАЯ АКАДЕМИЯ МИНИСТЕРСТВА ЮСТИЦИИ РОССИЙСКОЙ ФЕДЕРАЦИИ
2. Методика преподавания литературы специальная Преподаватель- Вятлева Ю
3. Тема ’ 19. Исполнение обязательств и способы их обеспечения Понятие исполнения и принципы исполнения.html
4. РЕФЕРАТ дисертації на здобуття наукового ступеня кандидата медичних наук К
5. 0313 Петрову казалось что традиционное развитие норма а Греция это аномалия
6. Последовательность подачи блюд и напитков
7. Данные для расчета Ставка земельного налога ~ 35 руб
8. Литература Акушерство (акушерские кровотечения)
9. Тема 5 вопросы 56 СУРСы В научной литературе в практической деятельности государственных органов к соци
10. Сухожилие плотная оформленная соед ткань Волокна параллельно расположены Волокон больше чем клет
11. Поворот к сплошной коллективизации в ССС
12. экономические отношения собственности
13. Использование PR-методов в работе субъектов современного рыночного пространства с телевизионными СМИ
14. контрольна робота складається з відповідей на два теоретичні питання які визначаються за першою літерою пр
15. РЕФЕРАТ дисертації на здобуття наукового ступеня кандидата хімічних наук Львів ~ 2003
16. Утверждаю Президент ККОО по развитию силовых видов спорта Светогор Е
17. Государственно-политические аспекты деятельности Русского Общевоинского союза.html
18. Основы организации вычислительных систем
19. реферат дисертації на здобуття наукового ступеня кандидата історичних наук Дніпро
20. почему же так получилось