Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Практичне заняття № 1
Первинна статистична оцінка результатів спостережень та перевірка гіпотез про нормальність закону розподілу виміряної величини
Мета заняття:статистична оцінка результатів спостережень та перевірка гіпотез про нормальність закону розподілу виміряної величини.
Завдання заняття: виконання розрахунків статистичних оцінок даних вимірювань та перевірка гіпотез про нормальність закону розподілу вимірюваної величини в середовищі ППП Excel та ППП MATLAB.
Тривалість 3 год.
Основні теоретичні положення
Спостереження - основа інженерної й наукової діяльності. Для опису їх доцільно розмежувати при спостереженнях два основних типи отримання інформації: 1) про поведінку визначеної сукупності великої кількості однорідних об'єктів; 2) про властивості цього визначеного об'єкта протягом тривалого проміжку часу. У статистиці для опису будь-якої множини об'єктів застосовується поняття сукупності. При цьому генеральною сукупністю називають множину об'єктів, з яких проводиться відбір у процесі конкретизації спостережень. Відібрані для спостережень об'єкти є вибірковою сукупністю, або вибіркою, а число цих об'єктів називають її об'ємом.
Якщо спостереження здійснюють в ідентичних умовах на багатьох об'єктах , то можливий визначений закономірний результат. Результат кожного окремого спостереження називають варіантом, а послідовність варіантів, записану установленим способом (у по-рядку зростання значень, у міру одержання інформації, у порядку визначених якісних оцінок й ін.), - варіаційним рядом. Число однакових результатів при спостереженнях називають частотою, а співвідношення цього числа до всього об'єму вибірки відносною частотою. Якщо при великій кількості спостережень відносна частота прагне до визначеного постійного значення, то цю властивість називають статистичною стійкістю, а число, до якого прагне відносна частота, є абстрактним вираженнм стійкості й зветься ймовірністю даного результату спостережуваної величини. Характеристики об'єктів спостереження, що приймають різні значення з певними ймовірностями, називають випадковими. Вивчення поводження випадкових величин є предметом статистичного аналізу .
Таблиці спостережень дозволяють легко графічно подати експериментальний матеріал (рис. 1.1 і рис.1.2) у вигляді полігонів і гістограм частот, а також полігонів і гістограм відносних частот. Полігон, або частотний багатокутник, будують за допомогою ламаних ліній, що з'єднують частоти й відносні частоти, приписані середнім для інтервалу значенням вихідної змінної.
Гістограма є східчастою фігурою, що складається із прямокутників з основами інтервалів зміни вихідної змінної й висотою, яка дорівнює відповідним частотам або відносним частотам.
На підставі таблиць спостережень будують полігони й гістограми накопичених частот або відносних частот, які також містять корисну інформацію про результати спостережень (рис.1.3, рис.1.4). На підставі графічного подання результатів спостережень отримується первинну інформацію у вигляді описових і чисельних характеристик, які відображають характер кривих розподілу частот.
По графічному виду криві розподілу можна розділити на нормальні (дзвоноподібні, або унімодальні), бімодальні (двовершинні), мультимодальні (багатовершинні), J-подібні, J-зво-ротні, U-подібні й ін. (рис. 1.5).
Таблиця 1. 1 Спостереження величин k i c
Інтервал зміни вихідної змінної |
Середнє значення вихідної змінної в інтервалі |
Частота |
Накопичена частота |
Ymin…(Ymin+с) (Ymin+с)…(Ymin+2c) (Ymin+2с)…(Ymin+3c) . . [Ymin + (k-1) c]…Ymax |
. . |
n1 n2 n3 . . nk |
n1 n1 + n2 n1 + n2+ n3 n1 + n2+ …+ + nk |
Разом |
Рисунок 1. 1 - Гістограма частот
Рисунок 1. 2 - Полігон частот
Рисунок 1.3 - Гістограма накопичених частот
Рисунок 1. 4 - Полігон накопичених частот
а - нормальне; б - бімодальне; в - мультимодальне;
г - J-подібне; д - J-зворотне; е U-подібне
Рисунок 1. 5 - Види кривих розподілу
Криві розподілу нормального типу можуть бути симетричними, з позитивною або негативною асиметрією (рис.1. 6).
а - симетричні; б, в - з позитивною й негативною симетрією
Рисунок 1.6 - Види кривих нормального розподілу
Крім того, залежно від форми вершини, криві нормального типу можуть бути нормально-, тупо- і гостровершинними (рис. 1.7).
а) б)
в)
Рисунок 1. 7 - Нормально- (а), тупо- (б) і гостро вершина - (в) криві розподілу
Кількісними характеристиками, що дають інформацію про природу розподілів, є так звані параметри розподілу. При унімодальних розподілах як характеристики центру використовуються три найбільше часто застосовуваних параметри:
мода - значення вихідної змінної Y, що відповідає вершині розподілу;
медіана - значення вихідної змінної Y, що ділить число об'єктів спостереження на дві рівні частини, тобто для значення Y маємо 50 % спостережень медіани й 50 % більше;
середнє арифметичне - значення вихідної змінної Y, розраховане за формулою:
(2.3)
Відзначимо, що для унімодального й симетричного розподілу , а при невеликій асиметрії :
.
Як інші параметри розподілу, які часто застосовують, доцільно виділити квартилі - три значення ви-хідної змінної, що ділять вибіркову сукупність на чотири час-тини, кожна з яких містить четверту частину об'єктів спостереження; YQ1, YQ3 - відповідно нижній й верхній квартилі (рис.1. 8).
За аналогією при розбивці сукупності на 10 й 100 рівних частин використають відповідно поняття декатилей і персен-тилей.
Важливою характеристикою унімодальних розподілів є розкид, або розсіювання, як міра цього - застосовують поняття розмаху R, стандартного (або середньо квадратичного) відхилення S, вибіркової дисперсії S2, коефіцієнта варіації δ ( %):
; (1.4)
; (1.5)
а) б)
Рисунок 1. 8 - Квартилі на кривій відносних частот (а) і на кривій накопичених відносних частот (б)
; (1.6)
(1.7)
Як параметри, що характеризують асиметрію (або скоше-ність) розподілу, використовують міру скошеності :
(1.8)
а для оцінки гостровершинності (або крутості) розподілу міру крутості, або ексцес,
(1.9)
Для симетричного розподілу , для позитивної асиме-трії > 0, для негативної < 0. При гостровершинному розподілі маємо e>0, для нормального розподілу e = 0, для плосковершинної кривої розподілу e < 0.
Асиметрію унімодального розподілу можна оцінити й по методу Пірсона, що запропонував два коефіцієнти асиметрії:
; (2.10)
(2.11)
Ці коефіцієнти дорівнюють нулю для симетричного розподілу, позитивні або негативні залежно від того, позитивна або негативна асиметрія.
ПЕРЕВІРКА СТАТИСТИЧНИХ ГІПОТЕЗ
При проведенні статистичного аналізу доводиться мати справу із проблемою оцінювання різного роду характеристик випадкових величин і різних їх сукупностей. На підставі результатів спостережень інженер або дослідник повинен ро-бити висновки про закони розподілу і їх параметри, порів-нювати середні й дисперсії різних вибірок. При цьому висува-ються різного роду статистичні гіпотези, які є по суті деякими припущеннями, або їх заперечення.
Висунуту гіпотезу H0 називають основною (нульовою), а її альтернативу H1 конкуруючою (альтернативною). При цьо-му розрізняють гіпотези прості, що містять тільки одну про-позицію (наприклад, H0 випадкова величина X=5), і складні, які складаються з конечного або нескінченного числа простих (наприклад, припущення H0:X<10 складається з незліченної множини простих гіпотез H0 : X = ai, де ai будь-яке число, менше 10).
Гіпотези бувають правильними й помилковими, тому в результаті статистичного аналізу можуть бути прийняті по-милкові рішення, які будуть полягати в запереченні правильної гіпотези (помил0ки першого роду) або прийнятті помилкової гіпотези (помилки другого роду). При цьому варто мати на увазі, що наслідки цих помилок можуть бути істотно різними. Так, якщо гіпотеза стверджує: прихват колони труб, то помил-ка першого роду може привести до складної аварії через недбалість, а помилка другого роду - до матеріальних втрат внас-лідок зайвої обережності.
Для перевірки різного роду статистичних гіпотез вико-ристовують статистичні критерії K, якими називають випад-кову величину, призначену для перевірки нульової гіпотези. При цьому значенням критерію що спостерігається називають його значення, обчислене по вибірках. Після вибору статис-тичного критерію всю множину його значень розбивають на дві підмножини що не перетинаються, одна із яких містить значення критерію, що підтверджують нульову гіпотезу (об-ласть прийняття гіпотези), а інша - що відкидають основну гіпотезу (критична область). Керуючись викладеним, можна сформулювати основний принцип перевірки статистичних гіпотез у такий спосіб: якщо значення що спостерігається критерію належить критичній області, то гіпотезу відкидають, а якщо області прийняття гіпотези - її приймають.
У більшості практичних задач гіпотези перевіряють на підставі однобічних критеріїв, що диктується змістом задач.
В інженерній практиці доводиться розглядати випадкові події, що характеризуються як кількісно, так і якісно. Для перших (випадкові величини) у багатьох випадках можна використовувати нормальний закон розподілу ймовірностей, що описується за допомогою двох параметрів a і σ.
Статистичні гіпотези при використанні припущення про нормальність закону розподілу або близькості до останнього перевіряють за допомогою критеріїв, що одержали назву параметричних. Для випадкових характеристик (кількісних і якісних, що не відповідають нормальному закону розподілу, використовують непараметричні критерії порівняння, які не вимагають припущень про характер розподілу результатів спостережень у генеральній сукупності.
Слід зазначити, що параметричні критерії при меншій області застосовності мають теоретичну обґрунтованість, а непараметричні критерії мають більшу універсальність і простоту обчислень.
Для розподілів, близьких до нормальних, статистичні гі-потези щодо середнього значення випадкової величини перевіряють на підставі критерію Стьюдента ( t-критерію):
(1.4)
де середнє значення випадкової величини у вибірці; σ середня квадратична помилка випадкової величини X.
Якщо задатися рівнем значимості α або ймовірністю відповідності отриманої вибіркової середньої значенню математичного очікування M(X) для генеральної сукупності, то нульову гіпотезу H0 : = M(X) перевіряють за правилом:
< tтаб , (1.5)
де tтаб табличне значення критерію Стьюдента, визнечене для значення рівня значимості α/2 і ймовірності P = 1 α/2 і числі ступенів волі f = N 1 при об'ємі вибірки N (додаток Г).
Це правило застосовують тому, що розподіл величини M(X) вважається симетричним щодо нуля й використовується двосторонній критерій. Введення поняття ступеня волі пов'язане з обмеженістю вибірки, а її значення f = N 1 вказує на той факт, що вибірка була використана для визначення величини .
Наведена умова дозволяє оцінити довірчі границі отри-маного значення вибіркової середньої з умови:
М(Х) tтаб = ≤ ≤ М(Х) + tтаб , (1.6)
яке дає інтервал значень вибіркової середньої. Якщо випадкова величина перебуває в зазначених границях, то вона є не відмінною від середньої. У протилежному випадку можна стверджувати відмінність випадкової величини від вибірко-вого середнього значення.
Умова (1.6) часто використовують для відбору аномальних точок у повторних дослідах відповідно до правила трьох сигм:
> 3 σх ,
для вибірок великого об'єму, а для вибірок малого об'єму
> tтаб σх ,
де tтаб табличне значення t, обумовлене при заданому рівні значимості α і числі ступенів f = N 1.
Як приклад використання наведених вище правил роз-глянемо результати спостережень за проходкою (м) на долото нового типу в 10 свердловинах з однаковими умовами бурін-ня: 10,0; 12,0; 16,0; 14,0; 13,0; 9,0; 12,0; 11,0; 10,0; 9,0:
Середнє значення для даної вибірки:
= (10+12+16+14+13+9+12+11+10+9) = 11,6 м,
а середнє квадратичне відхилення:
.
Необхідно перевірити гіпотезу H0 : = 13 м, що доз-волила б стверджувати тотожність проходки даної партії доліт з генеральним середнім значенням X*=13м для умов експерименту.
Відповідно до правила перевірки маємо:
Якщо задатися рівнем значимості α = 0,05, що відповідає ймовірності P = 0,975 при двосторонній області прийняття гіпотези, то для f = N 1 = 9 табличне значення:
tтаб = 2,26 > t = 1,95.
Отже, гіпотеза H0 підтверджується, і відмінності серед-ньої проходки від генеральної середньої практично немає.
Довірчий інтервал отриманої вибіркової середньої мож-на записати в такий спосіб:
або
Серед наведених вибіркових значень величина 16,0 виг-лядає трохи завищеною відносно середнього значення. Пере-вірка на аномальність дає наступний результат:
16 11,6 = 4,4 < 2,26 · 2,27 = 5,1,
тобто зазначене значення не є аномальним.
Порядок виконання роботи
Обробка результатів роботи та їх аналіз
Оформлення та захист звіту
Запитання до самоконтролю