Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
25
Суть та організаційні форми статистичного спостереження
Статистичне спостереження є першим етапом статистичного дослідження. Він є дуже важливим, бо від отриманих результатів буде залежати подальший хід дослідження. Інформація, отримана шляхом статистичного спостереження повинна:
Статистична інформація це сукупність статистичних даних, що відображають соціально-економічні процеси і використовуються в процесі управління економікою. Статистична інформація це первинний статистичний матеріал, який формується в процесі статистичного спостереження, групується, аналізується, узагальнюється і на основі якого робляться висновки.
Статистичне спостереження це науково організований збір масових даних про явища та процеси, які відбуваються в суспільстві.
Спостереження не завжди буває статистичним (наприклад, спостереження за якістю продукції на ринку не є статистичним). Спостереження буде статистичним тоді, коли:
Отже можна доповнити, що статистичне спостереження повинно бути: масовим, планомірним, мати певний характер повторюваності (одноразовим, періодичним або систематичним).
План статистичного спостереження
Будь-яке статистичне спостереження планується і проводиться за певним планом. План статистичного спостереження містить дві частини:
1. Програмно-методологічна частина
Першим завданням у програмно-методологічній частині є мета дослідження.
Далі необхідно визначити об'єкт дослідження(узагальнено можна сказати, що об'єктом статистичного спостереження є суспільні явища і процеси, які мають досліджуватися).
По-третє, визначається одиниця спостереження. Одиниця спостереження це той первинний елемент об'єкту дослідження, який є носієм інформації, за допомогою якої збираються необхідні статистичні дані. Одиниці спостереження слід відрізняти від одиниці сукупності. Якщо одиниця спостереження це носій інформації, то одиниця сукупності це носій ознаки. Інколи вони співпадають (наприклад, перепис населення).
Після визначення одиниці спостереження, переходимо до визначення програми переліку питань або ознак, на які повинні бути отримані відповіді в процесі дослідження. Оформлюється цей перелік питань у вигляді бланку, формуляру чи анкети.
2. Організаційна частина
Ця частина вказує:
Важливість цього показника в тому, що ми маємо досліджувати об'єкт в його звичайному стані; Час може бути об'єктивним і суб'єктивним. Об'єктивний час це момент чи період часу, до якого відносяться зібрані дані. Суб'єктивний час це дата або період, протягом якого збирають дані.
Наприклад, при складанні платіжного балансу країни за 1998 рік, об'єктивний час:1.01.1998 31.12.1998, суб'єктивний час: 10.01.1999-17.01.1999 (якщо інформація збиралась у цей проміжок часу).
Існує також критичний момент спостереження момент часу, на який припадає реєстрація відомостей.
Наприклад, при переписі населення у 1984 році реєстрація була проведена в ніч з 11 на 12 січня (критичний момент), в той час, як суб'єктивний час дорівнював 1 тижню (12 19 січня).
Існує дві форми статистичного спостереження:
Види і способи статистичного спостереження
Види статистичного спостереження
Поточне (безперервне) спостереження спостереження, яке здійснюється в часі безперервно коли факти, події і явища реєструються в момент їх виникнення. Прикладом може бути реєстрація шлюбів, розлучення інші операції органів запису громадських актів. Одноразові і періодичні спостереження відносяться до групи так званих переривчастих спостережень коли факти реєструються в певні проміжки часу. Прикладом одноразового спостереження може бути перепис населення, періодичного перепис обладнання, залишків сировини і матеріалів.
Суцільне спостереження це таке спостереження, при якому реєстрації підлягають всі одиниці сукупності.
Несуцільне спостереження лише певна частина одиниць сукупності підлягає реєстрації. Несуцільне спостереження може бути:
Способи одержання інформації
Опитування може бути:
23
Центральна гранична теорема теорема теорії ймовірностей про збіжність розподілу суми незалежних однаково розподілених випадкових величин до нормального розподілу. Ця теорема підкреслює особливість нормального розподілу в теорії ймовірностей.
Центральна гранична теорема для незалежних послідовностей
Формулювання Ліндеберга
Нехай послідовність взаємно незалежних випадкових величин з однаковими розподілами. Припустімо, що та існують. Нехай . Тоді для довільних фіксованих , ():
Де нормальна функція розподілу.[1][2]
Формулювання Ляпунова
Теорема названа на честь російського математика Олександра Ляпунова. У цьому варіанті центральної граничної теореми випадкові величини мають бути незалежними, але не обов'язково однаково розподіленими. Теорема також вимагає щоб випадкові виличини мали скінченні моменти деякого порядку (2 + δ) і швидкість зростання цих моментів має бути обмежена умовою Ляпунова.
ЦГТ Ляпунова[3]: Нехай {Xi} послідовність незалежних випадковех величин, таких, що кожна з них має скінченне математичне сподівання і дисперсію . Позначимо . Якщо для деякого виконується умова Ляпунова
Тоді сума прямує за розподілом до стандартного нормального розподілу, при
На практиці зазвичай найлегше перевірити умову Ляпунова для . Якщо послідовність випадкових величин задовольняє умову Ляпунова, то вона задовольняє також умову Лінденберга. Зворотне твердження не правильне.
Формулювання Лінденберга
Докладніше: Умова Лінденберга
Використовуючи ті позначення що й у попередньому параграфі, замінюючи умову Ляпунова на слабшу (запропоновану фінським математиком Ліндебергом у 1920 році) можна отримати нове формулювання центральної граничної теореми.
Якщо для кожного виконуэться
де характеристична функція. Тоді розподіл стандартизованої суми Zn прямує до стандартного нормального розподілу N(0,1).
28
Вибіркове (емпіричне) середнє значення характеристика положення для вибіркового розподілу. [1]
Означення
Нехай випадкова вибірка.
Вибірковим середнім називається середнє арифметичне елементів даної вибірки:[2]
.
Властивості вибіркового середнього
35
4.2. Емпірична функція розподілу
Емпіричною функцією розподілу називається функція Fn(x), яка визначає для кожного значення x відносну частоту події (ξ < x) і має наступні властивості:
Розрахунковий вираз для емпіричної функції розподілу можна записати таким способом:
;
x
ni*(x)
Рис. 4.4. Гістограма, загальний випадок
o
a1
a2
a3
a4
a5
a6
1
(ξ < x)
Fn(x)
Рис. 4.5. Емпірична функція розподілу, загальний випадок
x
o
х1
х3
хm
х2
x
Вигляд емпіричної функції розподілу поданий на рис. 4.5.
Приклад. Знайти і побудувати емпіричну функцію розподілу за даним розподілом вибірки:
i |
1 |
2 |
3 |
xi |
1 |
4 |
7 |
ni |
5 |
20 |
25 |
Розвязання.
i |
1 |
2 |
3 |
xi |
1 |
4 |
7 |
ni* |
0,1 |
0,4 |
0,5 |
Контроль обчислень виконуємо шляхом підсумовування відносних частот варіантів, тоді одержимо: Σ ni* = 1.
якщо x x1 = 1, то Fn(x) = 0;
якщо x1 < x x2, тобто 1 < x 4, то Fn(x) = n1* = 0,1;
якщо x2 < x x3, тобто 4 < x 7, то Fn(x) = n1*+ n2* = 0,1 + 0,4 = 0,5;
якщо x > x3, тобто x > 7, то Fn(x) = n1*+ n2*+ n3* = 0,1 + 0,4 + 0,5 = 1.
х
Fn(x)
0,1
1
0,5
1,0
4
7
Рис. 4.6. Емпірична
функція розподілу
Отже, одержимо:
Використовуючи отримані значення функції розподілу Fn(x), будуємо графік (див. рис. 4.6).
37
ЕФЕКТИВНІ ТОЧКОВІ ОЦІНКИ.
В попередніх двох лекціях було введено два типи кількісних мір відхилення точкової оцінки параметру , які базувались на залежності від обсягу вибірки (конзистенційні оцінки) та розташування значень оцінки відносно параметру (незсунені оцінки). При чому у другому випадку вимагалось, щоб значення оцінок параметрів розташовувались однаково як ліворуч, так і праворуч від параметру. Але ця вимога не обов'язково може привести до того, що випадкова помилка буде у якомусь сенсі () мала. Тому є необхідність ввести ще одну кількісну міру відхилення, що враховує розташування оцінки відносно параметру так, щоб ці знічення було "розкидано" недалеко від параметру. Таким чином, ця нова міра відхилення повинна ставити вимоги до ДИСПЕРСІЇ точкової оцінки .
ОЗНАЧЕННЯ 35.1
Назвемо точкову оцінку параметру ЕФЕКТИВНОЮ, якщо її дисперсія найменша серед усіх дисперсій інших оцінок.
Означення ефективності не дуже сприяє дослідженню оцінки. По-перше, не завжди легко обчислити дисперсію оцінки , по-друге, навіть коли її можна обчислити, то нема гарантії , що вона буде найменшою серед дисперсій усіх інших оцінок, бо не завжди можна розглянути усі оцінки, а тим більше - обчислити їх дисперсію. Але завдання можна полегшити, якщо познайомитись з нижченаведеною нерівністю.
НЕРІВНІСТЬ КРАМЕРА - РАО.
Нехай - функція правдоподібності генеральної сукупності , - вибірка із генеральної сукупності , - деякий параметр, - його незсунена оцінка. Тоді має місце нерівність :
(35.1)
ДОВЕДЕННЯ
Внаслідок незсуненості оцінки = ,
.
Візьмемо похідну по від лівої та правої частин отриманої рівності.
Отриману рівність можна переписати у вигляді :
Застосуємо до лівої частини нерівність Коші-Буняковського
(35.2)
Поділивши обидві частини нерівності на
,
Отримаємо нерівність Крамера Рао (35.1).
Як скористатись цією нерівністю для дослідження оцінки на ефективність? По-перше, якщо дисперсія оцінки дорівнює правій частині нерівності, то оцінка ефективна, бо менш ніж права частина, дисперсія бути не може. Але дуже часто обчислення дисперсії оцінки та правої частини нерівності є неможливим, або дуже складним. І тут треба скористатися властивостями з лінійної алгебри. Насправді нас цікавлять умови , при яких нерівність Коші-Буняковського перетворюється у рівність. Такою умовою є лінійна залежність множників та у нерівності (35.2), тобто або
(35.3)
де
ВИСНОВОК. Для незсуненої оцінки параметру критерієм ефективності є виконання рівності (35.3).
ЗАУВАЖЕННЯ. Інколи пропонується ввести величину, що має назву ефективності і дорівнює :
,
яка дорівнює у випадку ефективної оцінки . Крім того, очевидно, що чим ближче ефективність до 1, тим менше дисперсія оцінки. Тому часто кажуть навіть відносно неефективних оцінок, що одна оцінка більш ефективна за іншу, порівнюючи їх ефективності. Вважається ефективнішою та оцінка, у якої ефективність більша.
ПРИКЛАД 35.1.
Перевірити, чи буде ефективна оцінка :
Параметру генеральної сукупності , якщо - її вибірка,-пуассонівська.
РОЗВЯЗОК
Внаслідок того, що , а , оцінка - незсунена. Отже можна скористатись критерієм ефективності .
Обчислимо похідну :
;
Отже і оцінка ефективна.
40
або
Можна строго показати, що оцінка математичного сподівання:
(4.11)
є незсуненою, обгрунтованою, має дисперсію оцінки:
(4.12)
а якщо випадкова величина ξ розподілена за нормальним законом, то дисперсія (4.12) буде мінімально можливою, тобто оцінка (4.11) ефективна.
Дійсно, у виразі (4.11) складаються незалежні значення однієї і тієї ж випадкової величини x, що мають однакову дисперсію:
Dx1 = Dx2 = … = Dxi = Dx.
Застосовуючи операцію дисперсії до лівої і правої частин рівняння (4.11) і з огляду на властивості дисперсії, одержимо:
.
Оцінка вибіркової дисперсії Dв випадкової величини ξ:
є ефективною, обгрунтованою, але зсуненою убік менших значень у разів.
Для усунення цього зсуву праву частину рівності (4.12) достатньо розділити на зазначений множник, у підсумку одержимо так називану “виправлену” дисперсію:
. (4.13)
У випадку нормального розподілу випадкової величини ξ дисперсію самої оцінки виправленої дисперсії (4.13) і середнє квадратичне відхилення знайдемо за формулами:
Одержувані статистичні (точкові) оцінки сходяться до істинних оцінок лише при нескінченному збільшенні числа n спроб. Отже, заміна істинних значень шуканих параметрів їх статистичними оцінками завжди супроводжується помилками. Якщо такі помилки занадто великі, то наслідки заміни можуть бути істотними. Тому потрібно вміти оцінювати точність і надійність одержуваних оцінок, особливо при малій кількості спостережень n (при малій кількості спроб).
Для визначення точності і надійності статистичних оцінок використовують поняття “довірчий інтервал” і “довірча ймовірність”.
58
Статистичний критерій - це вирішальне правило, що забезпечує математично обґрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні критерії будуються на основі статистики ^(х1, х2, хп) - деякої функції від результатів спостережень х1, х2, хп. Статистика ¥ є випадковою величиною з певним законом розподілу. Серед значень статистики ¥ виділяють критичну область ¥кр з властивістю: якщо емпіричне значення статистики ¥емп належать області ¥ кр, то нульову гіпотезу відхиляють (відкидають), інакше - приймають. Статистичні критерії визначають у практичній діяльності метод розрахунку певного числа, яке позначається як емпіричне значення критерію, наприклад, ґем" для ґ-критерію Стьюдента.
Співвідношення емпіричного і критичного значень критерію є підставою для підтвердження чи спростовування гіпотези. Наприклад, у разі застосування ґ-критерію Стьюдента, якщо ґем" > ґкр , то значення статистики належать критичній області і нульова гіпотеза Н0 відхиляється (приймається альтернативна гіпотеза Ні). Правила прийняття статистичного рішення обумовлюються для кожного критерію.
Відповідно до статистичних гіпотез статистичні критерії діляться на параметричні й непараметричні.
Параметричні критерії використовуються в завданнях перевірки параметричних гіпотез і включають у свій розрахунок показники розподілу, наприклад, середні, дисперсії тощо. Це такі відомі класичні критерії, як г-критерій, ґ-критерій Стьюдента, ^-критерій Фішера та ін. Непараметричні критерії перевірки гіпотез засновані на операціях з іншими даними, зокрема, частотами, рангами тощо. Це А-критерій Колмогорова-Смірнова, [/-критерій Вілкок-сона-Манна-Вітні та багато інших.
Параметричні критерії дозволяють прямо оцінити рівень основних параметрів генеральних сукупностей, різниці середніх і відмінності в дисперсіях. Критерії спроможні виявити тенденції зміни ознаки при переході від умови до умови, оцінити взаємодію двох і більш факторів у впливі на зміни ознаки. Параметричні критерії вважаються дещо більш потужними, ніж не-параметричні, за умов, якщо ознака виміряна за інтервальною шкалою і нормально розподілена. Проте з інтервальною шкалою можуть виникнути певні проблеми, якщо дані, представлено не в стандартизованих оцінках. До того ж перевірка розподілу "на нормальність" вимагає досить складних розрахунків, результат яких заздалегідь невідомий. Найчастіше розподіли ознак відрізняються від нормального, тоді доводиться звертатися до непараметричних критеріїв.
Непараметричні критерії позбавлені перерахованих вище обмежень. Проте вони не дозволяють здійснити пряму оцінку рівня таких важливих параметрів, як середнє або дисперсія, з їхньою допомогою неможливо оцінити взаємодію двох і більше умов або факторів, що впливають на зміну ознаки. Непараметричні критерії дозволяють вирішити деякі важливі завдання, які супроводжують дослідження в психології і педагогіці: виявлення відмінностей у рівні досліджуваної ознаки, оцінка зсуву значень досліджуваної ознаки, виявлення відмінностей у розподілах ознак.
Застосування критеріїв для прийняття (відхилення) статистичних гіпотез завжди здійснюються з довірчою ймовірністю, інакше кажучи, на певному рівні значущості.