Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
6. Вибірковий метод.
Статистична перевірка гіпотез
6.1. Суть вибіркового спостереження
Вибіркове спостереження такий вид несуцільного спостереження, при якому обстежуються не всі елементи сукупності, що вивчається, а лише певним чином дібрана їх частина. Сукупність, з якої вибирають елементи для обстеження, називається генеральною, а сукупність, яку безпосередньо обстежують, вибірковою. Статистичні характеристики вибіркової сукупності розглядаються як оцінки відповідних характеристик генеральної сукупності.
Практика вибіркових спостережень досить різноманітна. Це обстеження домогосподарств, маркетингові дослідження, аудиторські перевірки великих фірм, вивчення громадської думки тощо. При обстеженні невеликої частини генеральної сукупності зменшуються помилки реєстрації, можна розширити й деталізувати програму обстеження. З іншого боку, вибіркове спостереження забезпечує економію матеріальних, трудових, фінансових ресурсів і часу.
При вивченні певного кола соціально-економічних явищ вибіркове спостереження єдино можливе. Це стосується передусім перевірки якості продукції (жирності молока, чистоти та вологості зерна, міцності пряжі тощо). Часом вибіркове спостереження поєднується із суцільним. Наприклад, при перепису населення кожна четверта одиниця спостереження дає докладнішу інформацію. Крім того, вибірковий метод використовують для прискореної обробки матеріалів суцільного спостереження та перевірки правильності даних переписів і одноразових обстежень.
Обєктивною гарантією того, що вибірка репрезентує (представляє) всю сукупність, є додержання наукових принципів організації та проведення спостереження, насамперед неупередженого, обєктивного підходу до вибору елементів для обстеження. Принцип випадковості вибору забезпечує всім елементам генеральної сукупності рівні можливості потрапити у вибірку.
Якщо генеральна сукупність містить N елементів, а для обстеження потрібно вибрати частину n, то число можливих вибірок
.
Усі вони мають однакову ймовірність , а кожна з них несе в собі певну похибку, що відбиває факт випадковості вибору. Оскільки вибіркова сукупність не точно відтворює склад генеральної сукупності, то й вибіркові оцінки не збігаються з відповідними характеристиками генеральної сукупності. Розбіжності між ними називають похибками репрезентативності: для середньої це різниця між генеральною та вибірковою середніми, для частки різниця між генеральною і вибірковою р частками, для дисперсії відношення генеральної та вибіркової дисперсій тощо.
За причинами виникнення похибки репрезентативності поділяються на тенденційні (систематичні) та випадкові. Тенденційні похибки виникають, коли при формуванні вибіркової сукупності порушений принцип випадковості (упереджений вибір елементів, недосконала основа вибірки тощо). Ці похибки для всіх елементів сукупності однонаправлені і призводять до зсунення результатів обстеження.
Випадкові похибки це наслідок випадковості вибору елементів для дослідження і повязаних з цим розбіжностей між структурами вибіркової та генеральної сукупностей щодо ознак, які вивчаються.
При організації вибіркового обстеження важливо уникнути тенденційних похибок. Незсуненість одна з вимог до будь-якої вибіркової оцінки. Притаманних вибірковому спостереженню випадкових похибок уникнути неможливо, проте теорія вибіркового методу дає математичну основу для обчислення таких похибок та регулювання їх розміру.
Згідно з генеральною граничною теоремою за умови достатньо великого обсягу вибірки розподіл вибіркових середніх (і часток), незалежно від розподілу генеральної сукупності, асимптотично наближається до нормального. Більшість значень вибіркових середніх зосереджується навколо генеральної середньої, а отже, найбільшу ймовірність мають відхилення, близькі до нуля. Чим більше відхилення, тим менша його ймовірність. Для будь-якої ймовірності існує межа відхилень вибіркової середньої від генеральної. Використовуючи властивості нормального розподілу, для однієї конкретної вибірки можна визначити:
похибки репрезентативності середню та граничну для взятої ймовірності;
ймовірність того, що похибка вибірки не перевищить допустимого рівня;
обсяг вибірки, який забезпечить потрібну точність результатів для взятої ймовірності.
Кінцева мета будь-якого вибіркового спостереження поширення його характеристик на генеральну сукупність. Для середньої та частки визначаються межі можливих їх значень у генеральній сукупності з певною ймовірністю довірчі межі. Якщо метою вибіркового обстеження є визначення обсягових показників генеральної сукупності обсягів ознаки , то вибіркова середня поширюється на генеральну сукупність прямим перерахунком: .
Очевидно, використовуючи граничні значення довірчого інтервалу середньої, можна визначити довірчі межі обсягового показника. Наприклад, загальна посівна площа під крупяними культурами в районі становить 2000 га. За даними 10%-го вибіркового обстеження середня врожайність крупяних культур 22,5 ц/га, гранична похибка середньої 0,5 ц/га. Отже, можливий обсяг валового збору зерна з цієї площі буде не менший за 44 тис. ц [(2000 (22,5 0,5)]. Максимальний валовий збір 46 тис. ц [(2000 (22,5 + 0,5)].
коли вибіркове спостереження проводиться з метою уточнення результатів суцільного спостереження, застосовується метод коефіцієнтів. Наприклад, після щорічного перепису худоби, що належить населенню, проводиться 10 %-й вибірковий контроль, мета якого визначити частку недообліку худоби. За даними перепису в районі налічується 10000 корів. У домогосподарствах, які потрапили до контрольної вибірки, за переписом 200 корів, а за даними перевірки 205. Отже, частка недообліку корів становить . Це і є той коефіцієнт, на який слід скоригувати результати перепису: 10000 1,025 = 10250 корів.
6.2. Вибіркові оцінки середньої та частки
У статистиці використовують два типи оцінок параметрів генеральної сукупності точкові та інтервальні. Точкова оцінка це значення параметра за даними вибірки: вибіркова середня та вибіркова частка р. Інтервальною оцінкою називають інтервал значень параметра, розрахований за даними вибірки для певної ймовірності, тобто довірчий інтервал. Чим менший довірчий інтервал, тим точніша вибіркова оцінка.
Межі довірчого інтервалу визначаються на основі точкової оцінки та граничної похибки вибірки :
для середньої
;
для частки
,
де середня або стандартна похибка вибірки; t квантиль розподілу ймовірностей (довірче число).
Стандартна похибка вибірки є середнім квадратичним відхиленням вибіркових оцінок від значення параметра в генеральній сукупності. Як доведено в теорії вибіркового методу, дисперсія вибіркових середніх у n разів менша від дисперсії ознаки у генеральній сукупності, тобто . Оскільки на практиці генеральна дисперсія ознаки невідома, в розрахунках можна використати вибіркову незсунену оцінку дисперсії: для повторної вибірки , для безповторної . Отже, формули стандартної похибки такі:
для повторної вибірки
,
для безповторної вибірки
.
Щодо практичного використання наведених формул, то слід урахувати таке:
а) дисперсія частки , де р і q частки вибіркової сукупності, яким відповідно властива і невластива ознака;
б) у великих за обсягом сукупностях (30 і більше одиниць) поправка не вносить істотних змін у розрахунки, а тому береться до уваги лише у вибірках з невеликою кількістю елементів;
в) коригуючий множник для безповторної вибірки , тобто при малих величинах (наприклад, для 2- чи 5 %-ї вибірки) наближається до 1, а тому розрахунок можна виконувати за формулою для повторної вибірки; при 10 %-й вибірці коригуючий множник становить 0,949, при 20 %-й 0,894.
Гранична похибка вибірки це максимально можлива для взятої ймовірності F(x). Довірче число t вказує, як співвідносяться гранична та стандартна похибки. Як бачимо з рис. 6.1, з імовірністю 0,683 гранична похибка не вийде за межі стандартної , з імовірністю 0,954 вона не перевищить 2, з імовірністю 0,997 3. На практиці найчастіше використовують імовірність 0,954 (на рис. 6.1 незаштрихована частина площини).
Рис. 6.1. Співвідношення ймовірностей та ширини довірчих меж
З урахуванням сказаного формули граничних похибок середньої та частки записують так:
Повторна вибірка |
Безповторна вибірка |
|
для середньої |
|
|
для частки |
|
Як видно з формул, розмір граничної похибки залежить від варіації ознаки , обсягу вибірки n та її частки в генеральній сукупності , узятого рівня ймовірності, якому відповідає квантиль t. Чим більша варіація ознаки в генеральній сукупності, тим більша в середньому похибка вибірки. Залежність похибки від обсягу вибіркової сукупності обернено пропорційна. Щоб зменшити похибку вибірки вдвічі, обсяг останньої має зрости в 4 рази. При безповторному виборі похибка буде тим менша, чим більша частка обстеженої сукупності . Очевидно, при суцільному спостереженні похибка репрезентативності відсутня (= 0).
При малих вибірках (n < 30) розподіл відхилень між параметрами вибіркової та генеральної сукупностей залежить від обсягу вибірки, а тому в розрахунках стандартних похибок вибірки використовують вибіркові оцінки дисперсій . Квантилі t визначають за розподілом імовірностей Стьюдента. У табл. 6.4 наведено деякі значення квантилів t розподілу Стьюдента для ймовірності 0,95 і числа ступенів свободи k = n 1. При n > 30 квантилі розподілу Стьюдента і нормального розподілу збігаються.
Розглянемо методику вибіркового оцінювання середньої та частки на прикладі обстеження професійної мобільності робітників машинобудівного підприємства. Результати 19%-ї безповторної вибірки наведено в табл. 6.1.
Таблиця 6.1
Вік і потенційна професійна мобільність робітників
Показник |
Верстатники |
Налагоджувачі |
Опитано робітників |
64 |
25 |
Середній вік опитаних, років |
37 |
33 |
Дисперсія віку |
144 |
100 |
Частка професійно |
30 |
20 |
Визначимо межі середнього віку робітників і частки професійно мобільних, тобто тих, що мають намір змінити професію, з імовірністю 0,954 (t = 2).
Гранична похибка середнього віку робітників-верстатників
року.
Це дає підставу стверджувати, що в генеральній сукупності в 95,4 випадках із 100 середній вік верстатників щонайменше 34,3 року й не перевищує 39,7 року:
.
Перш ніж визначити граничну похибку частки потенційно мобільних верстатників, необхідно обчислити її дисперсію:
= 0,3(1 0,3) = 0,21.
Гранична похибка
, або 10,3 %.
Щодо інтервалу можливих значень частки професійно мобільних верстатників у генеральній сукупності, то межі його становлять
19,7 і 40,3 %:
.
Аналогічно обчислені граничні похибки середнього віку та професійної мобільності налагоджувачів дещо більші:= 3,6 року, = 14,4 %. З імовірністю 0,954 можна стверджувати, що в генеральній сукупності середній вік налагоджувачів не перевищує 36,3 року, а верхня межа частки професійно мобільних робітників становить 24,4 %.
У статистичному аналізі часто постає потреба порівняти похибки вибірки різних ознак або однієї і тієї самої ознаки в різних сукупностях.
Такі порівняння виконують за допомогою відносної похибки, яка показує, на скільки процентів вибіркова оцінка може відхилятися від параметра генеральної сукупності. Відносна стандартна похибка середньої це коефіцієнт варіації вибіркових середніх:
.
Її розмір можна визначити також на основі коефіцієнта варіації ознаки :
для повторної вибірки
;
для безповторної вибірки
.
На практиці поширеніша гранична відносна похибка середньої, яка враховує ймовірність статистичного висновку. Так, для ймовірності 0,954 відносна гранична похибка середнього віку верстатників
.
Такий самий результат дає розрахунок відносної похибки на основі коефіцієнта варіації віку верстатників:
Відносна гранична похибка середнього віку налагоджувачів становить 10,9 %, що свідчить про меншу точність вибіркової оцінки для цієї професійної групи робітників.
Вибіркову похибку частки також слід порівнювати з величиною частки р. Адже одна і та сама похибка = 2 % для р = 80 % є малою, для р = 40 % допустимою, для р = 10 % завеликою. Відносну похибку частки обчислюють за формулою
.
Отже, відносну похибку можна використати для порівняння вибіркових оцінок різних ознак. На практиці достатнім рівнем точності вважається
6.3. Різновиди вибірок
Формування вибірки не безладний процес. Ця дія виконується за певними правилами. Передусім визначається основа вибірки. У сукупностях, які складаються з «фізичних» елементів, одиниця основи може репрезентувати або окремий елемент сукупності, або певне їх угруповання. Наприклад, вивчається використання комбайнів. Загальна їх кількість n розподілена за m бригадами, кожна з них має комбайнів. Одиницею основи вибірки може бути комбайн або бригада. Відповідно формується вибіркова сукупність: у першому випадку вибирається n комбайнів із загального їх числа N, у другому m бригад із загального їх числа M.
Найпростішою основою вибірки є перелік елементів генеральної сукупності, пронумерований від 1 до N. Простими вважаються також набори звітів, анкет, карток тощо.
На практиці досліджувані сукупності мають, як правило, не одну, а низку альтернативних основ для вибірки. Наукове обгрунтування та правильний вибір основи перша передумова забезпечення репрезентативності результатів вибіркового спостереження.
Від основи вибірки залежить спосіб добору елементів сукупності для обстеження. Найчастіше використовують способи добору: простий випадковий, механічний, розшарований (районований), серійний.
Простий випадковий добір провадиться жеребкуванням або за допомогою таблиць випадкових чисел. Це класичний спосіб формування вибіркової сукупності, який передбачає попередню досить складну підготовку до формування вибірки. Для жеребкування на кожну одиницю генеральної сукупності необхідно заготувати відповідну фішку; при використанні таблиць випадкових чисел усі елементи цієї сукупності мають бути пронумеровані. У великих за обсягом сукупностях така робота здебільшого недоцільна, а часом і неможлива. Тому на практиці застосовуються інші різновиди випадкових вибірок.
Механічний добір. Основа вибірки впорядкована чисельність елементів сукупності. Добір елементів здійснюється через рівні інтервали. Крок інтервалу обчислюється діленням обсягу сукупності N на передбачений обсяг вибірки n. Початковий елемент вибірки визначається як випадкове число всередині першого інтервалу, другий елемент залежить від початкового числа й кроку інтервалу. Так, для частки вибірки кроком інтервалу є число =, тобто у вибірку має потрапити кожний двадцятий елемент. Якщо початковий елемент випадкове число 7, то другим елементом буде 7 + 20 = 27, третім 27 + 20 = 47 і т.д.
Механічна вибірка порівняно з простою випадковою ефективніша, її простіше здійснити. Проте за наявності циклічних коливань значень ознаки, цикл коливань яких збігається з інтервалом, можливий зсув вибіркових оцінок. Похибку механічної вибірки обчислюють за формулою безповторної вибірки .
Вивчаючи безперервні в часі процеси, зокрема технологічні (структури затрат робочого часу, використання виробничого устаткування), проводять моментні спостереження. Суть їх у періодичній фіксації стану процесу на певні моменти часу, які вибирають за схемою випадкової або механічної вибірки (через певні інтервали часу).
На етапі підготовки моментних спостережень визначають перелік можливих варіантів стану процесу, наприклад перелік причин простоїв устаткування.
Під час обстеження певної сукупності одиниць устаткування, скажімо, верстатів, у певні моменти часу фіксується, працює r-й верстат чи ні (якщо ні, зазначаються причини простою). Припустимо, що в цеху працюють 10 верстатів і за 8-годинну зміну через кожні півгодини проводилась реєстрація використання цих верстатів. Було зроблено 160 записів (16 10), у 144 випадках зазначено, що верстат працював, у 16 не працював. Частка працюючих верстатів становить 0,9, дисперсія частки 0,9 0,1 = 0,09. Із ймовірністю 0,954 гранична похибка вибірки , або 4,6 %. Отже, частка працюючих верстатів за зміну становила не менш як 90 4,6 = 85,4 %.
Щодо повноти охоплення елементів сукупності, то моментне спостереження суцільне, воно вибіркове впродовж часу, бо охоплює не весь час роботи устаткування, а лише певні моменти. У разі правильної організації моментні обстеження забезпечують досить точні результати, швидко і з меншими витратами, ніж при суцільному спостереженні.
Розшарований (районований, типовий) добір це спосіб формування вибірки з урахуванням структури генеральної сукупності. На відміну від простого випадкового та механічного добору, які проводяться в цілому по генеральній сукупності, розшарований передбачає її попередню структуризацію й незалежний добір елементів у кожній складовій. Обсягом розшарованої вибірки є сума частинних вибірок , тобто , де m число складових (груп, типових районів тощо).
Похибку розшарованої вибірки обчислюють, використовуючи середню з групових дисперсій . Якщо сформовані групи обєднують «схожі» елементи, а групові середні величини помітно різні, варіація ознаки в групах буде значно меншою, ніж по сукупності. У такому разі <, а отже, похибка розшарованої вибірки порівняно з простою випадковою чи механічною буде менша:
.
Для того щоб забезпечити більшу точність розшарованої вибірки, слід обгрунтувати ознаку розшарування сукупності, число складових частин m, обсяг частинних вибірок і спосіб добору. Зменшення варіації ознаки при розшаруванні сукупності можливе за умови, що ознака розшарування сукупності корелює з ознакою, характеристики якої оцінюються. ці ознаки співвідносяться як причина й наслідок.
Відповідно до правила розкладання дисперсій = або де кореляційне відношення, яке вимірює щільність звязку між ознаками, що відображують причину й наслідок. Отже, розшарування сукупності зменшує похибку вибірки на частку (). Чим щільніший звязок між ознаками, тим помітніше зменшення похибки. При = 0,50 похибка вибірки зменшується вдвічі, при = 0,66 втричі.
У практиці вибіркових спостережень застосовують різні способи визначення обсягу вибіркової сукупності n та її складових . Найпростіший з них, коли всі m груп подані однаковою кількістю елементів:
.
Проте застосування цього способу обмежене. Якщо чисельності груп дуже різні, може виникнути ситуація, коли >.
Найчастіше застосовують пропорційний добір, який передбачає однакове для всіх складових представництво, тобто частки однакові й обсяг частинної вибірки залежить від обсягу відповідної складової сукупності:
.
Оптимальним щодо мінімізації похибки добірки є добір, пропорційний до середнього квадратичного відхилення:
.
Очевидно, що обсяг вибірки залежить від рівня варіації ознаки в окремих складових генеральної сукупності. Однорідні групи подаються меншим числом елементів, неоднорідні більшим. Відсутність даних про варіацію ускладнює практичну реалізацію такого способу вибірки.
Різновидом розшарованої вибірки є метод квот, коли обсяг частинних вибірок визначається завчасно. Цей спосіб поширений при вивченні громадської думки, ринку тощо. Так, при вивченні громадської думки тому, хто має брати інтервю, встановлюються квоти, наприклад обстежити двох фермерів-чоловіків віком 30 40 років, трьох мешканців міста віком 20 30 років і т.ін. У який спосіб «заповнити квоти», він вирішує сам. Метод квот не гарантує незсуненості вибіркових оцінок.
Серійна вибірка. Одиниця основи вибірки серія елементів. Серії складаються з одиниць, які повязані або територіально (райони, селища), або організаційно (фірми, акціонерні товариства). Вибіркова сукупність серій формується за схемами механічної або простої випадкової вибірки. Дібрана серія розглядається як одне ціле, обстеженню підлягають усі без винятку елементи серії. При обчисленні похибки вибірки враховується міжсерійна варіація:
,
де міжсерійна дисперсія; m число серій.
Похибка серійної вибірки буде меншою порівняно з похибкою простої випадкової чи механічної вибірки у тому разі, якщо серії більш-менш однорідні й варіація серійних середніх незначна. Зростання міжсерійної варіації призводить до збільшення похибки вибірки.
Використання того чи іншого способу формування вибіркової сукупності залежить від мети вибіркового обстеження, можливостей його організації та проведення. Іноді поєднуються різні способи добору: механічний і серійний, розшарований і механічний, випадковий і серійний.
Таке поєднання можливе в рамках багатоступеневої вибірки. Ступенів може бути два, три й більше. Кожний з них має свою, відмінну від інших основу вибірки. Відповідно поділяються й одиниці вибірки: першого ступеня, другого і т.ін. Повнота охоплення основи й схема добору одиниць на різних ступенях різняться.
Наприклад, сукупність містить k одиниць першого ступеня, які складаються з M одиниць другого ступеня, ті, в свою чергу, обєднують одиниць третього ступеня. Саме така триступенева вибірка застосовується при організації обстеження домогосподарств. Наприклад, формування вибіркової сукупності домогосподарств сільськогосподарських виробничих кооперативів грунтується на таких ступенях одиниць вибірки:
одиниці першого ступеня це райони області, 40% яких охоплює вибірка ();
одиниці другого ступеня селища; відбирається до 20% їх числа в тих районах, що відібрані на першому ступені (= 0,2);
одиниці третього ступеня домогосподарства; обстежується 5% їх числа в тих селищах, які потрапили у вибірку на другому ступені (= 0,05).
Отже, вибір елементів для безпосереднього обстеження здійснюється на останньому, третьому ступені формування вибіркової сукупності. Частка вибіркової сукупності в генеральній залежить від часток вибірки на всіх ступенях:
,
тобто обстеженню підлягає 0,4 % домогосподарств.
Багатоступенева вибірка значно зменшує витрати на обстеження й порівняно з іншими вибірками більш ефективна.
Якщо обстежують сукупність за двома й більше ознаками, які різняться варіацією, ефективною є багатофазна вибірка. Суть її в тому, що для різних ознак формуються вибіркові сукупності різного обсягу. На відміну від багатоступеневої вибірки багатофазна використовує для всіх ознак одну й ту саму основу вибірки, проте програма обстеження різна.
Формування вибіркових сукупностей здійснюється поетапно фазами. З генеральної сукупності формується первинна вибірка, а з первинної підвибірка і т.д. На кожній наступній фазі обсяг підвибірки зменшується, а програма обстеження розширюється. Вибіркові оцінки кожної фази використовуються як додаткова інформація на наступних фазах, що підвищує точність результатів вибіркового спостереження.
При організації багатофазної вибірки можливі комбінації різних способів і видів вибіркового спостереження. Багатофазна вибірка поєднується з багатоступеневою, а також із суцільним спостереженням.
6.4. Визначення обсягу вибірки
У процесі проектування вибіркових спостережень визначають мінімально достатній обсяг вибірки, при якому вибіркові оцінки репрезентували б основні властивості генеральної сукупності. Занадто великий обсяг вибірки потребує зайвих витрат, а занадто малий призведе до збільшення похибки репрезентативності. Теорія вибіркового методу дає змогу науково обгрунтувати достатній обсяг вибірки.
Згідно з формулою граничної похибки вибірки обсяг вибірки
,
тобто достатній обсяг вибірки залежить від ступеня однорідності генеральної сукупності, ймовірності, з якою гарантується результат, і необхідної точності вибіркової оцінки. Практичне використання цієї формули ускладнюється через відсутність оцінки варіації.
Як правило, використовують оцінки за аналогією, тобто оцінки, отримані в попередніх або аналогічних обстеженнях. Наприклад, на лісовому масиві в 400 га визначається загальний запас деревини. Пробні ділянки по 0,1 га. За даними попередніх обстежень середнє квадратичне відхилення виходу деревини з 0,1 га становить 3 м3. Скільки пробних ділянок необхідно обстежити, щоби похибка вибірки з імовірністю 0,954 не перевищила 1 м3?
При t = 2 достатній обсяг вибірки
ділянок.
Якщо аналогічні обстеження не проводились або в генеральній сукупності відбулися істотні зміни, точнішу характеристику варіації дають пробні обстеження. Коли відомі межі варіації ознаки, розраховують за правилом «трьох сигм», тобто ().
Для альтернативної ознаки, коли відсутня будь-яка інформація про структуру сукупності, вважають, що частка р = 0,5, отже, 2 = = 0,5 0,5 = 0,25.
Коли розрахований обсяг вибіркової сукупності n перевищує 5% обсягу генеральної сукупності N, його коригують на «безповторність вибірки». Скоригований обсяг вибірки .
Щодо точності вибіркового обстеження, то доцільно контролювати відносну граничну похибку . У такому разі мірою варіації ознаки є коефіцієнт варіації :
.
Наприклад, проектується вибіркове опитування робітників компанії (N = 3200) щодо середнього розміру вільного часу. За аналогічними обстеженнями в інших компаніях = 20%. Мінімально необхідний обсяг вибірки, при якому з імовірністю 0,954 гарантується похибка вибірки в обсязі не більш як 2,5%,
,
скоригований на кінцевість сукупності обсяг вибірки
.
Необхідний обсяг вибірки можна розрахувати також на основі відносної похибки вибірки для частки:
.
Очевидно, чим більша частка р, тим менший обсяг вибірки забезпечить необхідну точність результатів обстеження, і навпаки: для малих значень р обсяг вибірки збільшується.
У табл. 6.2 наведено обсяги вибірки, які забезпечують точність результатів обстеження малопоширених явищ з відносною стандартною похибкою, меншою за 10 %.
Таблиця 6.2
Достатній обсяг вибірки для вивчення малопоширених явищ
р |
q / р |
n при 10% |
0,20 |
4,0 |
400 |
0,15 |
5,7 |
570 |
0,12 |
7,3 |
730 |
0,10 |
9,0 |
900 |
0,09 |
10,1 |
1010 |
0,08 |
11,5 |
1150 |
У практиці вибіркових обстежень одночасно вивчаються кілька ознак. Якщо бажаний ступінь точності визначати для кожної ознаки окремо, то результатом розрахунків стане низка значень обсягу вибірки. З метою їх узгодження використовуть або максимальний обсяг n (і тоді решта ознак оцінюється «надто точно»), або обсяг головної ознаки.
6.5. Статистична перевірка гіпотез
Статистична гіпотеза це певне припущення щодо властивостей генеральної сукупності, яке можна перевірити, спираючись на результати вибіркового спостереження. Суть перевірки гіпотез полягає у тому, щоб визначити, узгоджуються чи ні результати вибірки з гіпотезою, випадковими чи не випадковими є розбіжності між гіпотезою і даними вибірки.
Найчастіше гіпотеза, яку належить перевірити, формулюється як відсутність розбіжності (нульова розбіжність) між невідомим параметром генеральної сукупності G і заданою величиною А, а тому її позначають Н0. Зміст гіпотези записують після двокрапки, наприклад Н0 : G = A.
Кожній нульовій гіпотезі протиставляють альтернативну Нa. При формулюванні Нa враховується вагомість відхилень (G A): для додатних відхилень Нa G > a, для відємних Нa : G < A, для тих і інших Нa : G A.
Якщо вибіркові дані cуперечать гіпотезі Н0, вона відхиляється. У противному разі, тобто коли ці дані узгоджуються з гіпотезею Н0, вона не відхиляється. Спираючись на результати вибірки, статистична перевірка гіпотез неминуче повязана з ризиком прийняття помилкового рішення: ризик І відхилення правильної нульової гіпотези, ризик ІІ невідхилення нульової гіпотези, коли насправді правильною є альтернативна. Ці ризики конкуруючі, і зменшення ймовірності одного () зумовлює збільшення ймовірності іншого (). Оскільки уникнути ризиків неможливо, а наслідки їх, як правило, різновагомі, то в кожному конкретному дослідженні прагнуть мінімізувати той ризик, який повязаний з більшими втратами. Ймовірності ризиків наведено в табл. 6.3.
Таблиця 6.3
Ймовірність ризиків помилкових рішень при перевірці гіпотез
Правильна |
Прийнята гіпотеза |
|
гіпотеза |
Н0 |
Нa |
Н0 |
1 |
|
Нa |
|
1 |
Правило, за яким гіпотеза Н0 відхиляється або не відхиляється (приймається), називається статистичним критерієм. Математичною основою будь-якого критерія є статистична характеристика Z, значення якої визначається за даними вибірки, а закон розподілу відомий. Кожне значення характеристики Z має певну ймовірність f (Z). Якщо вибіркове значення Z малоймовірне, гіпотеза Н0 відхиляється.
Межу малоймовірності Z називають рівнем істотності . Очевидно, що це ймовірність ризику І, а тому залежно від змісту гіпотези Н0 і наслідків її відхилення рівень істотності визначають у кожному конкретному дослідженні. Звичайно вибирають один з рівнів , для яких табульовані значення статистичних характеристик критеріїв Z1 . Це = 0,10; 0,05; 0,025; 0,01.
Значення статистичної характеристики критерія Z1 поділяє множину вибіркових значень Z на дві частини: а) область допустимих значень і б) критичну область. Якщо вибіркове значення z потрапляє в критичну область, гіпотеза Н0 відхиляється, якщо в область допустимих значень не відхиляється. Саме тому значення Z1 називають критичним.
Залежно від того, як сформульована альтернативна гіпотеза, критична область може бути односторонньою (лівосторонньою чи правосторонньою) або двосторонньою (рис. 6.2).
Рис. 6.2. Лівостороння та двостороння критичні області
Порядок перевірки статистичних гіпотез розглянемо на прикладі співвідношення середніх двох сукупностей. Припустимо, ведеться вибірковий контроль тривалості служби деталей одного виду, виготовлених за різними технологіями. Контролю піддано 5 деталей, виготовлених за старою технологією, і 4 за новою, тобто n1 = 5,
n2 = 4. Вибіркові оцінки середніх і дисперсій відповідно становили: = 580 год при = 308; = 612 год при = 329.
Різниця між середніми становить ( ) = (612 580) = 32 год.
Потрібно визначити, чи істотні відхилення середніх, тобто чи зумовлені вони відмінностями технологій, чи випадкові. Нульова гіпотеза формулюється на припущенні, що відхилення середніх випадкові Н0: . Альтернативна гіпотеза передбачає, що нова технологія збільшує тривалість служби деталі: Н0: . При такому формулюванні Нa провaдиться одностороння (правостороння) перевірка.
Статистичною характеристикою гіпотези Н0 : є нормоване відхилення середніх
,
яке підпорядковане розподілу Стьюдента з числом ступенів свободи k = n1 + n2 2.
У нашому прикладі k = 5 + 4 2 = 7; оцінка дисперсії s2 = 408,
a t = 2,37:
Перевіримо гіпотезу Н0 проти Нa з рівнем істотності = 0,05. За даними табл. 6.4 критичне значення t, що менше від фактичного (t = 2,37). Отже, нульова гіпотеза Н0: відхиляється, і з імовірністю 0,95 можна стверджувати, що нова технологія збільшує термін служби деталей.
При двосторонній перевірці гіпотези, коли Нa:, використовують критичне значення для , наприклад при = 0,05 це буде .
Таблиця 6.4
Значення квантилів t розподілу
Стьюдента для = 0,05
Число |
Для інтервалу |
|
ступенів |
двостороннього |
одностороннього |
4 |
2,78 |
2,13 |
5 |
2,57 |
2,01 |
6 |
2,45 |
1,94 |
7 |
2,38 |
1,89 |
8 |
2,31 |
1,86 |
10 |
2,23 |
1,81 |
15 |
2,13 |
1,75 |
20 |
2,09 |
1,73 |
30 |
2,04 |
1,70 |
1,96 |
1,64 |
Отже, статистична гіпотеза перевіряється в такій послідовності:
а) формулюють нульову Н0 та альтернативну Нa гіпотези;
б) вибирають статистичну характеристику Z, за значеннями якої перевіряють правильність гіпотези Н0;
в) визначають рівень істотності і відповідне йому критичне значення Z; залежно від формулювання гіпотез Н0 i Нa критична область може бути одно- або двосторонньою;
г) за результатами вибірки розраховують фактичне (вибіркове) значення статистичної характеристики z, яке порівнюють з критичним Z; якщо Z > Z, гіпотеза Н0 відхиляється, при Z < Z не відхиляється.
Процедура перевірки гіпотез використовується при порівнянні вибіркових характеристик (середньої, частки, дисперсії) з відповідними нормативами, порівнянні характеристик двох вибіркових сукупностей, оцінюванні істотності розбіжностей двох розподілів, у дисперсійному та кореляційному аналізі.
Основні категорії та поняття
Вибіркове спостереження
похибка репрезентативності
систематична
випадкова
стандартна, середня
гранична
відносна
Вибіркова оцінка
точкова
інтервальна
Довірчі межі
середньої
частки
Квантиль розподілу ймовірностей
Добір випадковий
механічний
розшарований, районований
серійний
Вибірка моментна
багатоступенева
багатофазна
Статистична гіпотеза
нульова
альтернативна
Статистичний критерій
Критична область
Рівень істотності
завдання для самоконтролю
1. У чому суть вибіркового спостереження? Які його переваги перед іншими видами спостереження?
2. Що означає «репрезентативність вибірки»? За яких умов вибірка буде репрезентативною?
3. Чому принцип випадковості добору є визначальним при формуванні вибіркової сукупності? Які способи добору забезпечують додержання цього принципу?
4. Чим відрізняється випадкова похибка репрезентативності від систематичної? Чи можна її уникнути?
5. Як визначити розмір похибки вибірки? Чим відрізняється гранична похибка вибірки від стандартної (середньої)?
6. Як визначається довірчий інтервал для генеральної середньої та частки?
7. Хімічний аналіз 10 партій молока дав такі показники кислотності (в градусах Тернера): 18, 21, 17, 19, 20, 23, 16, 22, 23, 21.
а) Визначте середню кислотність молока і довірчі межі для середньої з імовірністю 0,95;
б) Визначте частку партій молока, що відповідає стандарту (не більше 21) та з імовірністю 0,95 похибку вибірки для частки.
в) Скільки партій молока необхідно перевірити, щоб похибку вибірки для частки нестандартного молока з тією самою ймовірністю зменшити вдвічі?
8. З метою визначення затрат часу на виготовлення деталі проведено хронометраж роботи випадково дібраних 25 робітників (10%-й механічний вибір). За даними вибірки середні витрати часу становили 15 хв при = 2 хв. Обчисліть похибку вибірки для середніх затрат часу і визначте:
а) Як зміниться похибка вибірки, якщо обсяг вибіркової сукупності збільшиться в 2,25 раза?
б) Як позначиться на похибці вибірки збільшення дисперсії в 1,6 раза?
в) Як зміниться похибка вибірки, якщо зі збільшенням дисперсії в 1,21 раза обсяг вибіркової сукупності збільшиться в 2,25 раза?
г) Як зміниться похибка вибірки, якщо частку вибіркової сукупності щодо генеральної довести до 19%?
д) Як зміниться похибка вибірки, якщо виконати розшарований добір (виокремити групи за стажем роботи) і міжгрупова дисперсія витрат часу становитиме 36% загальної?
9. За даними 1%-го вибіркового обстеження 100 домогосподарств маємо:
Характеристика домогосподарства |
Середній рівень |
Коефіцієнт варіації, % |
Середній розмір, осіб |
3,1 |
45 |
Місячний середньодушовий |
180 |
52 |
Розмір житла на члена |
9,0 |
29 |
Із імовірністю 0,954 визначте відносні похибки вибірки для зазначених показників, порівняйте похибки та зробіть висновки щодо їх розміру.
10. Урожайність нового сорту озимої пшениці, розміщеного на 10 дослідних ділянках, становила, ц/га: 45,4; 48,0; 47,4; 45,6; 43,9; 44,8; 46,4; 49,2; 47,8; 51,5.
а) Визначте середню врожайність озимої пшениці та довірчий інтервал для середньої з імовірністю 0,95.
б) Чи узгоджуються вибіркові дані з припущенням, що врожайність нового сорту озимої пшениці не менша за 46 ц/га?
11. За даними пробного вибіркового обстеження роботи ковальсько-пресового обладнання (обсяг вибірки 16) у першу зміну без простоїв працювало 80% машин. Яка має бути вибіркова сукупність, щоб похибка вибірки для частки працюючого без простоїв обладнання з імовірністю 0,954 не перевищила 5%?
12. За даними 1%-го вибіркового обстеження рівня харчування населення області коефіцієнти варіації споживання по окремих продуктах становили, %:
Хліб 16
молоко та молочні продукти 25
мясо 40
Скільки необхідно обстежити сімей, щоб з імовірністю 0,954 гарантувати відносну граничну похибку вибірки не більш як 5%.
13. При організації вибіркового обстеження думки населення щодо якості медичного обслуговування (задовольняє / не задовольняє) потрібно визначити кількість респондентів, яка б з імовірністю 0,954 гарантувала граничну похибку вибірки для часток розподілу не більш як 2%.
14. За даними 20%-го вибіркового обстеження тижневий обсяг хатньої праці жінок становить:
Наявність дітей |
Число обстежених сімей |
Обсяг хатньої праці, год |
Середнє квадратичне |
Без дітей |
200 |
26 |
10 |
Одна дитина |
120 |
30 |
20 |
Дві і більше |
80 |
35 |
15 |
а) Визначте середній обсяг хатньої праці за тиждень для всієї сукупності обстежених сімей та довірчий інтервал для середньої з імовірністю 0,954.
б) З якою ймовірністю можна стверджувати, що тижневий обсяг хатньої праці жінок не перевищує 30 год?
15. На яких принципах грунтується перевірка статистичних гіпотез? Сформулюйте нульову та альтернативну гіпотези.
16. Як перевірити справджуваність нульової гіпотези? Який рівень істотності доцільно використати?
17. Що таке критична область? Який висновок ви зробите, якщо статистична характеристика критерію потрапить у критичну область?
18. Як визначаються ризики прийняття хибного рішення?
7. Методи аналізу взаємозвязків
7.1. Види взаємозвязків
Усі явища навколишнього світу, соціально-економічні зокрема, взаємозвязані й взаємозумовлені. У складному переплетенні всеохоплюючого взаємозвязку будь-яке явище є наслідком дії певної множини причин і водночас причиною інших явищ. Причини та наслідки повязані неперервними ланцюгами прямо або опосередковано, що схематично ілюструє рис. 7.1. Так, незалежне в межах зображеного графа звязку явище є причиною явищ , , . Із них явище , у свою чергу, впливає на , а на .
Поряд з причинними існують звязки паралельних явищ, на які впливає спільна причина. На рис. 7.1 це звязок між і , які мають спільну причину :
Рис. 7.1. Граф взаємозвязків
Визначальна мета вимірювання взаємозвязків виявити і дати кількісну характеристику причинних звязків. Суть причинного звязку полягає в тому, що за певних умов одне явище спричинює інше. Причина сама по собі не визначає наслідку, останній залежить також від умов, у яких діє причина. Вивчаючи закономірності звязку, причина та умови обєднують в одне поняття «фактор». Відповідно ознаки, які характеризують фактори, називаються факторними, а ті, що характеризують наслідки, результативними.
Аналіз характеру зваємозвязків та оцінювання сили впливу факторів на результат є передумовою розробки науково обгрунтованих управлінських рішень, прогнозування й регулювання складних соціально-економічних явищ і процесів.
Розрізняють два типи звязків функціональні та стохастичні. При функціональному звязку кожному значенню фактора відповідає одне або кілька чітко визначених значень у. Такою, наприклад, є залежність довжини ртутного стовпчика від температури навколишнього середовища. Знаючи х, можна в кожному окремому випадку точно визначити результат у. У соціально-економічних науках до функціонального типу належать звязки між показниками адитивні () або мультиплікативні ( ), а також залежність середніх величин від структури сукупності.
Наприклад, при моніторингу залежності фінансових результатів бізнесу в ланцюгу «витрати обсяг прибуток» визначається сила впливу операційного (господарського, виробничого) важеля , який вказує на ступінь підприємницького ризику. Чим більша сила операційного важеля, тим більший ризик. функціонально повязаний з обсягом виробництва (збуту) , змінними і постійними витратами, прибутком :
.
Припустимо, виручка від реалізації продукції фірми = 12240 млн гр.од., витрати становили 11745 млн гр.од., з них змінні 9520, постійні 2225. За цими даними валова маржа дорівнює 12240 9520 = 2720 млн гр.од., прибуток 2720 2225 = 495 млн гр. од., а сила операційного важеля = 2720 : 495 = 5,5. Такий потужний операційний важіль негативно впливає на нетто-результат експлуатації інвестицій.
На відміну від функціональних, стохастичні звязки неоднозначні. Наприклад, залежність захворюваності населення від екологічного стану довкілля. На забруднених радіонуклідами територіях стан здоровя мешканців коливається від «тяжко хворого» до «практично здорового». Проте в середньому в таких регіонах порівняно з екологічно чистими інтенсивність захворювання значно вища.
Стохастичні звязки виявляються як узгодженість варіації двох чи більше ознак. У ланці звязку «» кожному значенню ознаки відповідає певна множина значень ознаки , які утворюють так званий умовний розподіл. Стохастичний звязок, відбиваючи множинність причин і наслідків, виявляється в зміні умовних розподілів, що схематично ілюструє рис. 7.2.
Якщо умовні розподіли замінюються одним параметром середньою , то такий звязок називають кореляційним. Отже, кореляційний звязок є різновидом стохастичного і виявляється в зміні середніх умовних розподілів.
Факторна |
Результативна ознака у за наявності звязку |
||
ознака хі |
функціонального |
стохастичного |
кореляційного |
х1 |
у1 |
у1 у2 |
|
х2 |
у2 |
у1 у2 у3 |
|
х3 |
у3 |
у2 у3 у4 |
|
... |
... |
... |
... |
хm |
уm |
уm 1 уm |
Рис. 7.2. Види взаємозвязків
Наявність стохастичного звязку можна виявити на основі комбінаційного розподілу елементів сукупності. Такий розподіл наведено в табл. 7.1. Сукупність шахт регіону поділено на групи за двома ознаками: глибиною розробки вугільних пластів і фондомісткістю видобутку вугілля. Кожна група за глибиною розробки пласта характеризується своїм особливим розподілом шахт за фондомісткістю видобутку вугілля. Це умовні розподіли. Порівняння умовних розподілів вказує на тенденцію підвищення фондомісткості зі зростанням глибини розробки пластів. Звичайно, для кожної окремої шахти така залежність може не виявитись через вплив інших факторів. Певні межі варіації фондомісткості характерні для кожної групи. Так, на шахтах, де глибина розробки пластів 500 700 м, фондомісткість коливається в межах від 18 до 26 гр. од. за тонну. Проте середній рівень фондомісткості в цій групі вищий порівняно з попередньою групою (300 500 м) і нижчий порівняно з наступною (700 і більше):
Середні рівні фондомісткості видобутку вугілля наведено в останній графі таблиці. Зростання групових середніх від групи до групи свідчить про наявність кореляційного звязку між глибиною розробки пласта і фондомісткістю вугілля. Отже, кореляційний звязок, як і стохастичний, це властивість сукупності в цілому, а не окремих її елементів.
Таблиця 7.1
Залежність фондомісткості видобутку вугілля
від глибини розробки вугільних пластів
Глибина |
Кількість шахт з рівнем фондомісткості, гр.од./т |
Середній рівень |
|||||
розробки пласта, м |
18 20 |
20 22 |
22 24 |
24 26 |
26 28 |
Разом |
фондомісткості, гр.од/т |
До 300 |
9 |
7 |
1 |
17 |
20,0 |
||
300 500 |
8 |
27 |
5 |
40 |
22,9 |
||
500 700 |
6 |
15 |
4 |
25 |
24,8 |
||
700 і більше |
8 |
10 |
18 |
26,1 |
|||
По сукупності |
9 |
15 |
34 |
28 |
14 |
100 |
23,5 |
Отож, можна не лише стверджувати, що існує кореляційний звязок між факторною і результативною ознаками, а й визначати, як у середньому змінюється зі зміною на одиницю. Ефекти впливу на визначаються відношенням приростів середніх групових Так, глибина розробки вугільного пласта зростає від групи до групи на 200 м. Фондомісткість видобутку вугілля в другій групі більша порівняно з першою на 22,9 20,0 = 2,9 гр.од/т. Отже, зі зростанням глибини розробки пласта на 100 м фондомісткість зростає в середньому на 1,45 гр.од/т:
Аналогічно розраховані ефекти впливу глибини розробки пласта на фондомісткість вугілля в третій групі становлять 0,95, у четвертій 0,65 гр.од. на тонну вугілля.
7.2. Регресійний аналіз
Важливою характеристикою кореляційного звязку є лінія регресії емпірична в моделі аналітичного групування і теоретична в моделі регресійного аналізу. Емпірична лінія регресії представлена груповими середніми результативної ознаки кожна з яких належить до відповідного інтервалу значень групувального фактора . Теоретична лінія регресії описується певною функцією яку називають рівнянням регресії. На відміну від емпіричної, теоретична лінія регресії неперервна. Так, вважають, що маса дорослої людини у кілограмах має бути на 100 одиниць менша за її зріст у сантиметрах. Якщо чоловік 175 см зросту важить 68 кг, то йому за цим співвідношенням до нормальної маси не вистачає 7 кг. Співвідношення між масою і зростом можна записати у вигляді рівняння: де маса, зріст. Звичайно, така форма звязку між масою та зростом людини надто спрощена. Насправді збільшення маси не строго пропорційне до збільшення зросту. Люди з певним зростом мають різну масу, проте в середньому зі збільшенням зросту маса зростає. Для точнішого відображення звязку між цими ознаками в рівняння слід увести другий параметр, який був би коефіцієнтом пропорційності при , тобто
Рівняння регресії в такому вигляді описує числове співвідношення варіації ознак і в середньому. Коефіцієнт пропорційності при цьому відіграє визначальну роль. Він показує, на скільки одиниць у середньому змінюється зі зміною на одиницю. При прямому звязку величина додатна, при оберненому відємна.
Подаючи як функцію , тим самим абстрагуються від множинності причин, штучно спрощуючи механізм формування варіації .
Різні явища по-різному реагують на зміну факторів. Для того щоб відобразити характерні особливості звязку конкретних явищ, статистика використовує різні за функціональним видом регресійні рівняння. Якщо зі зміною фактора результат змінюється більш-менш рівномірно, такий звязок описується лінійною функцією При нерівномірному співвідношенні варіацій взаємозвязаних ознак (наприклад, коли прирости значень зі зміною прискорені чи сповільнені або напрям звязку змінюється), використовують нелінійні регресії, зокрема:
степеневу
гіперболу
параболу тощо.
Вибір та обгрунтування функціонального виду регресії грунтується на теоретичному аналізі суті звязку. Припустимо, вивчається звязок між урожайністю та кількістю опадів. Надто мала і надто велика кількість опадів спричинюють зниження врожайності, максимальний її рівень можливий за умови оптимальної кількості опадів, тобто зі збільшенням факторної ознаки (опади) урожайність спершу зростає, а потім зменшується. Залежність такого роду описується параболою
Вивчаючи звязок між собівартістю та обсягом продукції , використовують рівняння гіперболи , де пропорційні витрати на одиницю продукції, постійні витрати на весь випуск.
Зауважимо, що теоретичний аналіз суті звязку, хоча й дуже важливий, лише окреслює особливості форми регресії і не може точно визначити її функціональний вид. До того ж у конкретних умовах простору і часу межі варіації взаємозвязаних ознак і значно вужчі за теоретично можливі. І якщо кривина регресії невелика, то в межах фактичної варіації ознак звязок між ними досить точно описується лінійною функцією. Цим значною мірою пояснюється широке використання лінійних рівнянь регресії:
Параметр (коефіцієнт регресії) величина іменована, має розмірність результативної ознаки і розглядається як ефект впливу на . Параметр вільний член рівняння регресії, це значення при = 0. Якщо межі варіації не містять нуля, то цей параметр має лише розрахункове значення.
Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого мінімізація суми квадратів відхилень емпіричних значень від теоретичних Y:
Математично доведено, що значення параметрів та , при яких мінімізується сума квадратів відхилень, визначаються із системи нормальних рівнянь
Розвязавши цю систему, знаходимо такі значення параметрів:
Розглянемо порядок обчислення параметрів лінійної регресії на прикладі звязку між урожайністю зернових і кількістю внесених добрив (у центнерах діючої поживної речовини). Значення взаємозвязаних ознак наведено в табл. 7.2. Необхідні для розрахунку параметрів величини такі:
= 12; = 224; = 342,8; = 18,68;
= 12 : 8 = 1,5; = 224 : 8 = 28.
Користуючись цими величинами, визначаємо:
ц/га;
Таблиця 7.2
Розрахунок параметрів лінійної регресії,
теоретичних рівнів і залишкових величин
Номер господарства |
Кількість внесених |
Урожайність зернових у, ц/га |
ху |
х2 |
Y |
y Y |
(y Y)2 |
1 |
1,1 |
23 |
25,3 |
1,21 |
24 |
1 |
1 |
2 |
1,4 |
25 |
35,0 |
1,96 |
27 |
2 |
4 |
3 |
1,2 |
26 |
31,2 |
1,44 |
25 |
1 |
1 |
4 |
2,0 |
33 |
66,0 |
4,00 |
33 |
0 |
0 |
5 |
1,5 |
27 |
40,5 |
2,25 |
28 |
1 |
1 |
6 |
1,3 |
28 |
36,4 |
1,69 |
26 |
2 |
4 |
7 |
1,8 |
30 |
54,0 |
3,24 |
31 |
1 |
1 |
8 |
1,7 |
32 |
54,4 |
2,89 |
30 |
2 |
4 |
Разом |
12,0 |
224 |
342,8 |
18,68 |
224 |
16 |
Отже, рівняння регресії має вигляд
тобто кожний центнер внесених добрив (у перерахунку на діючу речовину) дає приріст урожайності в середньому 10 ц/га. Якщо добрива зовсім не вносити в грунт, урожайність зернових не перевищить 13,0 ц/га.
Рівняння регресії відбиває закон звязку між і не для окремих елементів сукупності, а для сукупності в цілому; закон, який абстрагує вплив інших факторів, виходить з принципу «за інших однакових умов». За цих умов очікувана врожайність зернових
при внесенні добрив у обсязі 1,1 ц д.р. на 1 га становить
Y = ц/га. Для інших значень факторної ознаки теоретичні рівні врожайності наведено в табл. 7.2. Вплив інших факторів, окрім х, зумовлює відхилення емпіричних значень від теоретичних в той чи інший бік. Відхилення (y Y) називають залишками і позначають символом . Залишки, як правило, менші за відхилення від середньої, тобто
У нашому прикладі
Відповідно загальна дисперсія врожайності
залишкова дисперсія
У невеликих за обсягом сукупностях коефіцієнт регресії схильний до випадкових коливань. Тому слід перевірити його істотність. При лінійному звязку істотність коефіцієнта регресії перевіряють за допомогою t-критерію (Стьюдента), статистична характеристика якого для гіпотези визначається відношенням коефіцієнта регресії до власної стандартної похибки тобто
Стандартна похибка коефіцієнта регресії залежить від варіації факторної ознаки залишкової дисперсії і числа ступенів свободи :
За даними табл. 7.2,
Отже, ц/га, а , що перевищує критичне значення Гіпотеза про випадковий характер коефіцієнта регресії відхиляється, з імовірністю 0,95 вплив кількості внесених добрив на врожайність зернових визнається істотним.
У разі потреби можна визначити межі випадкових коливань
коефіцієнта регресії, тобто довірчі межі Для ймовірності 0,95
(t = 2,45) довірчі межі коефіцієнта регресії становлять
Важливою характеристикою регресійної моделі є відносний ефект впливу фактора на результат коефіцієнт еластичності:
Він показує, на скільки процентів у середньому змінюється результат зі зміною фактора на 1%. У нашому прикладі тобто збільшення кількості внесених добрив на 1% спричинює приріст урожайності зернових у середньому на 0,8 %.
Коли звязок між ознаками і має характер відносної мінливості, лінія регресії описується степеневою функцією яка зводиться до лінійного виду логарифмуванням Параметр b степеневої функції це коефіцієнт еластичності, який характеризує відносний ефект впливу фактора на результат. До класу степеневих належать функції споживання, виробничі функції тощо.
7.3. Оцінка щільності та перевірка істотності
кореляційного звязку
Поряд з визначенням характеру звязку та ефектів впливу факторів х на результат важливе значення має оцінка щільності звязку, тобто оцінка узгодженості варіації взаємозвязаних ознак. Якщо вплив факторної ознаки на результативну значний, це виявиться в закономірній зміні значень зі зміною значень , тобто фактор своїм впливом формує варіацію. За відсутності звязку варіація не залежить від варіації .
Для оцінки щільності звязку статистика використовує низку коефіцієнтів з такими спільними властивостями:
1) за відсутності будь-якого звязку значення коефіцієнта наближається до нуля; при функціональному звязку до одиниці;
2) за наявності кореляційного звязку коефіцієнт виражається дробом, який за абсолютною величиною тим більший, чим щільніший звязок.
Серед мір щільності звязку найпоширенішим є коефіцієнт кореляції Пірсона. Позначається цей коефіцієнт символом r. Оскільки сфера його використання обмежується лінійною залежністю, то і в назві фігурує слово «лінійний». Обчислення лінійного коефіцієнта кореляції r грунтується на відхиленнях значень взаємозвязаних ознак і від середніх величин.
За наявності прямого кореляційного звязку будь-якому значенню відповідає значення , а відповідає Узгодженість варіації і схематично показано на рис. 7.3 у вигляді кореляційного поля зі зміщеною системою координат. Точка, координатами якої є середні і , поділяє кореляційне поле на чотири квадранти, в яких по-різному поєднуються знаки відхилень від середніх:
Квадрант |
||
І |
+ |
+ |
ІІ |
|
+ |
ІІІ |
|
|
ІV |
+ |
|
Отже, для точок, розміщених у I та Ш квадрантах, добуток додатний, а для точок з квадрантів II і IV відємний. Чим щільніший звязок між ознаками і , тим більша алгебраїчна сума добутків відхилень Гранична сума добутків цих відхилень дорівнює
Рис. 7.3. Узгодженість варіації
взаємозвязаних ознак
Коефіцієнт кореляції визначається відношенням зазначених сум:
Очевидно, що при функціональному звязку фактична сума відхилень дорівнює граничній, а коефіцієнт кореляції , при кореляційному звязку абсолютне його значення буде тим більшим, чим щільніший звязок.
На практиці використовують різні модифікації наведеної формули коефіцієнта кореляції. Для оцінки щільності звязку між кількістю внесених добрив та врожайністю зернових скористаємося однією з модифікацій зазначеної формули:
За даними табл. 7.2 Згідно з цими значеннями коефіцієнт кореляції становить 0,900, що свідчить про вагомий вплив кількості внесених добрив на врожайність зернових:
Коефіцієнт кореляції, оцінюючи щільність звязку, вказує також на його напрям: при прямому звязку величина додатна, при зворотному відємна. Знаки коефіцієнтів кореляції і регресії однакові, величини їх взаємозвязані функціонально:
У нашому прикладі
Вимірювання щільності нелінійного звязку грунтується на співвідношенні варіацій теоретичних та емпіричних (фактичних) значень результативної ознаки . Як зазначалося в підрозд. 5.6, відхилення індивідуального значення ознаки від середньої можна розкласти на дві складові. У регресійному аналізі це відхилення від лінії регресії і відхилення лінії регресії від середньої .
Відхилення є наслідком дії фактора , відхилення наслідком дії інших факторів. Взаємозвязок факторної та залишкової варіацій описується правилом розкладання варіації:
де загальна дисперсія ознаки y; факторна дисперсія; залишкова дисперсія.
Очевидно, значення факторної дисперсії буде тим більшим, чим сильніший вплив фактора на . Відношення факторної дисперсії до загальної розглядається як міра щільності кореляційного звязку і називається коефіцієнтом детермінації:
.
За даними табл. 7.2 , звідки
Аналогічний результат дають такі обчислення:
Отже, коефіцієнт детермінації тобто 81% варіації врожайності зернових залежить від варіації кількості внесених добрив, а 19 % припадає на інші фактори.
Корінь квадратний з коефіцієнта детермінації називають індексом кореляції При лінійному звязку що підтверджують обчислення: Тому за відомим лінійним коефіцієнтом кореляції можна визначати внесок ознаки у варіацію ознаки Так, при можна сказати, що 36 % варіації залежить від варіації .
На таких самих засадах грунтується оцінка щільності звязку за даними аналітичного групування. Мірою щільності звязку є кореляційне відношення де міжгрупова дисперсія, яка вимірює варіацію ознаки під впливом фактора , а загальна дисперсія.
Оцінимо щільність звязку між глибиною розробки вугільних пластів і фондомісткістю видобутку вугілля (див. табл. 7.1). Розрахунки загальної та факторної дисперсій подано в табл. 7.3 та 7.4. Згідно з розрахунками загальна дисперсія становить 5,19, факторна 3,86:
Кореляційне відношення , тобто 74,5 % варіації фондомісткості видобутку вугілля на шахтах регіону пояснюється варіацією глибини розробки пластів.
Таблиця 7.3
Розрахунок загальної дисперсії фондомісткості видобутку вугілля (
Фондомісткість, гр.од./т |
18 20 |
20 22 |
22 24 |
24 26 |
26 28 |
Разом |
Кількість шахт |
9 |
15 |
34 |
28 |
14 |
100 |
19 |
21 |
23 |
25 |
27 |
|
|
4,5 |
2,5 |
0,5 |
1,5 |
3,5 |
|
|
182,25 |
93,75 |
8,5 |
63,0 |
171,5 |
519 |
Таблиця 7.4
Розрахунок факторної дисперсії фондомісткості продукції ()
Глибина розробки пластів, м |
||||
До 300 |
17 |
20,0 |
3,5 |
208,25 |
300 500 |
40 |
22,9 |
0,6 |
14,40 |
500 700 |
25 |
24,8 |
1,3 |
42,25 |
700 і більше |
18 |
26,1 |
2,6 |
121,68 |
У цілому |
100 |
23,5 |
|
386,58 |
Обчислення та інтерпретація коефіцієнта детермінації і кореляційного відношення показують: ці характеристики щільності звязку за змістом ідентичні, вони характеризують внесок фактора у загальну варіацію результату .
Перевірка істотності кореляційного звязку грунтується на порівнянні фактичних значень і з критичними, які могли б виникнути за відсутності звязку. Якщо фактичне значення чи перевищує критичне, то звязок між ознаками не випадковий. Гіпотеза, що перевіряється, формулюється як нульова:
або .
Критичні значення характеристик щільності звязку для рівня істотності і відповідного числа ступенів свободи для факторної і залишкової дисперсій наведено в табл. 7.5. Ступені свободи залежать від обсягу сукупності n та числа груп або параметрів функції , тобто = 1, =
Таблиця 7.5
Критичні значення коефіцієнта детермінації і кореляційного
відношення для рівня істотності = 0,05
1 |
2 |
3 |
4 |
5 |
|
5 |
0,569 |
699 |
764 |
806 |
835 |
6 |
500 |
632 |
704 |
751 |
785 |
7 |
444 |
575 |
651 |
702 |
739 |
8 |
399 |
527 |
604 |
657 |
697 |
9 |
362 |
488 |
563 |
618 |
659 |
10 |
332 |
451 |
527 |
582 |
624 |
12 |
283 |
394 |
466 |
521 |
564 |
14 |
247 |
348 |
417 |
471 |
514 |
16 |
219 |
312 |
378 |
429 |
477 |
18 |
197 |
283 |
345 |
394 |
435 |
20 |
179 |
259 |
318 |
364 |
404 |
24 |
151 |
221 |
273 |
316 |
353 |
28 |
130 |
193 |
240 |
279 |
314 |
32 |
115 |
171 |
214 |
250 |
282 |
36 |
102 |
153 |
192 |
226 |
256 |
40 |
093 |
139 |
176 |
207 |
234 |
50 |
075 |
113 |
143 |
170 |
194 |
60 |
063 |
095 |
121 |
144 |
165 |
80 |
047 |
072 |
093 |
110 |
127 |
100 |
038 |
058 |
075 |
090 |
103 |
120 |
032 |
049 |
063 |
075 |
087 |
200 |
019 |
030 |
038 |
046 |
053 |
Так, критичне значення коефіцієнта детермінації для і становить
Обчислений за даними табл. 7.2 коефіцієнт детермінації перевищує критичне значення, що з імовірністю 0,95 під-
тверджує істотність звязку між кількістю внесених добрив і врожайністю зернових.
Аналогічно визначимо критичне значення кореляційного відношення для = 4 1 = 3 та = 100 4 = 96.
Оскільки значення = 96 у табл. 7.5 відсутнє, можна використати найближче до нього число = 100. Критичне значення .
Розраховане за даними табл. 7.1 кореляційне відношення значно перевищує критичне, а отже, гіпотеза про випадковий характер відхилень групових середніх відхиляється. Звязок між глибиною розробки вугільних пластів і фондомісткістю видобутку вугілля з імовірністю 0,95 визнається істотним.
Розглянута процедура перевірки істотності звязку є складовою дисперсійного аналізу, розробленого Р. Фішером. Характеристика критерію Фішера дисперсійне відношення функціонально повязана з кореляційним відношенням , а тому результати перевірки ідентичні.
7.4. Рангова кореляція
Взаємозвязок між ознаками, які можна зранжувати, передусім на основі бальних оцінок, вимірюється методами рангової кореляції. Рангами називають числа натурального ряду, які згідно зі значеннями ознаки надаються елементам сукупності і певним чином упорядковують її. Наприклад, експерти оцінили технічний та фінансовий стан семи підприємств галузі в балах за певними критеріями. Сумарні бали оцінок експертів наведено в табл. 7.6. Ранжування проводиться за кожною ознакою окремо: перший ранг надається найменшому значенню ознаки, останній найбільшому.
Кількість рангів дорівнює обсягу сукупності. Очевидно, зі збільшенням обсягу сукупності ступінь «розпізнаваності» елементів зменшується. З огляду на те, що рангова кореляція не потребує додержання будь-яких математичних передумов щодо розподілу ознак, зокрема вимоги нормальності розподілу, рангові оцінки щільності звязку доцільно використовувати для сукупностей невеликого обсягу.
Ранги, надані елементам сукупності за ознаками і , позначають відповідно та . Залежно від ступеня звязку між ознаками певним чином співвідносяться й ранги. При прямому функціональному звязку =, тобто відхилення між рангами отже, й сума квадратів відхилень При зворотному функціональному звязку де число рангів. Якщо звязок між ознаками відсутній, являє собою середню арифметичну цих крайніх значень: . Це є максимальна сума квадратів відхилень рангів. Отже, за відсутності звязку
Спираючись на зазначену математичну тотожність, К. Спірмен запропонував формулу для коефіцієнта рангової кореляції:
.
Коефіцієнт рангової кореляції має такі самі властивості, як і лінійний коефіцієнт кореляції: змінюється в межах від 1 до +1, водночас оцінює щільність звязку та вказує на його напрям.
Визначимо коефіцієнт рангової кореляції за даними табл. 7.6.
Таблиця 7.6
Розрахунок коефіцієнта рангової кореляції Спірмена
№ |
Експертні оцінки, балів |
Р а н г и |
||||
п/п |
Технічний стан |
Фінансовий стан |
||||
1 |
27 |
26 |
1 |
2 |
1 |
1 |
2 |
30 |
25 |
2 |
1 |
1 |
1 |
3 |
38 |
30 |
6 |
4 |
2 |
4 |
4 |
36 |
32 |
5 |
5 |
0 |
0 |
5 |
33 |
28 |
3 |
3 |
0 |
0 |
6 |
42 |
37 |
7 |
7 |
0 |
0 |
7 |
35 |
33 |
4 |
6 |
2 |
4 |
Разом |
|
|
|
|
|
10 |
Сума квадратів відхилень рангів а коефіцієнт рангової кореляції
Значення коефіцієнта рангової кореляції свідчить про наявність прямого звязку між технічним і фінансовим станом підприємств галузі. Критичне значення коефіцієнта рангової кореляції (табл. 7.7) для рівня істотності = 0,05 і = 7 Отже, з імовірністю 0,95 істотність звязку доведено.
Таблиця 7.7
Критичні значення коефіцієнта рангової кореляції
Спірмена при = 0,05
Обсяг вибірки |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
0,900 |
0,828 |
0,714 |
0,642 |
0,600 |
0,563 |
0,527 |
0,497 |
Якщо два і більше елементів сукупності мають однакові значення ознаки, їм надається середній ранг. Нехай, наприклад, друге за величиною значення ознаки мають три елементи сукупності (№ 2, 3, 4), тоді всім їм надається ранг а щільність звязку оцінюється за формулою лінійного коефіцієнта кореляції.
7.5. Оцінка узгодженості варіації
атрибутивних ознак
Взаємозвязки між атрибутивними ознаками аналізуються на підставі таблиць взаємної спряженості (співзалежності). Як приклад розглянемо табл. 7.8, у якій наведено результати соціологічного опитування населення щодо намірів узяти участь на ринку цінних паперів. Тих, хто не боїться ризикувати, класифікували як ризикових інвесторів, тих, хто не уявляє ризику без гарантій, обережними, а хто ризику уникає взагалі, неризиковими.
Частоти комбінаційного розподілу респондентів за віком і схильністю до ризику концентруються навколо діагоналі з верхнього лівого кута в нижній правий. Серед молодих більшість готова ризикувати на ринку цінних паперів, у середній віковій групі готовий ризикувати один з пяти, а половина не уявляє ризику без гарантій, у третій віковій групі на одного обережного припадають два неризикових.
Таблиця 7.8
Розподіл респондентів за віком і схильністю до ризику
Вік х, |
Тип інвестора у |
Разом |
||
років |
ризиковий |
обережний |
неризиковий |
|
16 30 |
24 |
12 |
4 |
40 |
31 50 |
20 |
50 |
30 |
100 |
51 і більше |
6 |
18 |
36 |
60 |
Разом |
50 |
80 |
70 |
200 |
Характер розподілу частот свідчить про наявність стохастичного звязку між віком і схильністю до ризику.
Оцінка щільності стохастичного звязку грунтується на відхиленнях частот (часток) умовного та безумовного розподілів, тобто на відхиленнях фактичних частот від теоретичних , пропорційних до підсумкових:
,
де підсумкові частоти за ознакою ; підсумкові частоти за ознакою ; обсяг сукупності
Якби схильність до ризику не залежала від віку, то кількість ризикових серед молоді становила б
обережних у другій віковій групі
неризикових у третій віковій групі
Абсолютну величину відхилень фактичних частот від пропорційних характеризує квадратична спряженість Пірсона:
.
За відсутності стохастичного звязку = 0. На основі розподілу ймовірностей перевіряється істотність звязку. Критичні значення для = 0,05 і числа ступенів свободи наведено в табл. 7.9. Так, для критичне значення Фактичне значення
що значно перевищує критичне, а отже, з імовірністю 0,95 істотність звязку між віком і схильністю до ризику доведено.
Відносною мірою щільності стохастичного звязку слугують коефіцієнти взаємної спряженості (співзалежності). Найчастіше використовується формула Чупрова:
,
де число груп за ознакою , число груп за ознакою . Оскільки при незалежності ознак то і С = 0. При функціональному звязку за умови, що Тому в разі, коли , зручніше користуватися формулою Крамера:
де мінімальне число груп (або ).
У нашому прикладі а тому наведені формули коефіцієнта взаємної спряженості тотожні:
,
що свідчить про помітний звязок.
Таблиця 7.9
Критичні значення
k |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
3,84 |
5,99 |
7,81 |
9,49 |
11,07 |
12,59 |
14,07 |
15,51 |
Якщо обидві взаємозвязані ознаки альтернативні, тобто кількість груп , то за відсутності звязку добутки діагональних частот однакові: Саме на відхиленнях добутків частот грунтуються характеристики звязку:
,
.
У літературі зі статистики коефіцієнт для 4-клітинкової таблиці називається коефіцієнтом контингенції або асоціації. Очевидно, що за змістом він ідентичний коефіцієнту взаємної спряженості, а з повязаний функціонально: .
За допомогою коефіцієнта контингенції оцінимо щільність звязку між шкідливою звичкою палити і хворобами легенів (табл. 7.10):
Таблиця 7.10
Розподіл пацієнтів клініки за результатами легеневих проб
Наявність |
Результати легеневих проб |
Разом |
|
звички палити |
аномальні |
нормальні |
|
Палить |
20 |
5 |
25 |
Не палить |
10 |
15 |
25 |
Разом |
30 |
20 |
50 |
Значення перевищує критичне Отже, істотність звязку доведено з імовірністю 0,95.
Корисною мірою при аналізі 4-клітинкових таблиць взаємної спряженості є відношення перехресних добутків або відношення шансів
Відношення шансів характеризує міру відносного ризику. У нашому прикладі
Отже, імовірність легеневих хвороб у тих, хто палить, у 6 разів вища порівняно з тими, хто не палить.
Зауважимо, що методи аналізу таблиць взаємної спряженості можна використати і для кількісних ознак. Будь-які технічні перешкоди відсутні. Проте слід памятати, що коефіцієнт спряженості оцінює лише узгодженість фактичного розподілу з пропорційним. При перестановці рядків чи стовпців значення коефіцієнта не зміниться. Міри щільності кореляційного звязку коефіцієнт детермінації і кореляційне відношення оцінюють не лише узгодженість частот, а й порядок, послідовність, в якій поєднуються різні значення ознак. Отже, ці характеристики звязку більш потужні. А загалом вибір методу вимірювання звязку і характеристик його щільності має грунтуватись на попередньому теоретичному аналізі суті явищ, характеру взаємозвязків, наявній інформації.
Основні категорії та поняття
Звязок
функціональний
стохастичний
кореляційний
Фактор
Ефект впливу
Лінія регресії
емпірична
теоретична
Коефіцієнт
регресії
еластичності
кореляції
детермінації
рангової кореляції
контингенції
взаємної спряженості
Кореляційне відношення
Відношення шансів
Ступені свободи
завдання для самоконтролю
1. Як виявляється причинний звязок?
2. У чому особливості функціонального і стохастичного звязку?
3. Як виявляється кореляційний звязок? Поясніть його співвідношення зі стохастичним звязком.
4. Як визначити ефекти впливу фактора на результат за даними аналітичного групування?
5. За даними річних звітів сільськогосподарських підприємств, які спеціалізуються на виробництві яловичини, рівень рентабельності залежить від ступеня забезпеченості господарства ресурсами:
Коефіцієнт забезпеченості ресурсами |
Кількість господарств |
Рівень рентабельності, % |
До 0,9 |
31 |
10 |
0,9 1,1 |
45 |
16 |
1,1 і більше |
24 |
35 |
По сукупності в цілому |
100 |
18,7 |
Загальна дисперсія рентабельності виробництва становить 116.
Визначте: а) міжгрупову дисперсію; б) кореляційне відношення. Поясніть економічний зміст кореляційного відношення, перевірте істотність звязку з імовірністю 0,95, зробіть висновки.
6. Які функції в аналізі взаємозвязків виконує рівняння регресії?
7. Чому лінійна регресія найбільш поширена? Як визначити її параметри?
8. Що характеризує коефіцієнт регресії? Чим відрізняється коефіцієнт еластичності від коефіцієнта регресії?
9. Рівняння регресії описує залежність собівартості 1 т литва (гр.од.) від продуктивності праці на одного робітника, т: . Поясніть зміст параметрів.
10. Лінійний коефіцієнт кореляції між ступенем механізації виробничих процесів і продуктивністю праці становить 0,7. Яка частка варіації продуктивності праці залежить від варіації ступеня механізації виробничих процесів?
11. Вихід цукру з 1 т переробленої сировини залежить від цукристості буряка. За даними 10 цукрових заводів зазначені показники співвідносяться так:
Заводи |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Цукристість,% |
16,2 |
15,8 |
17,3 |
15,6 |
16,5 |
14,7 |
16,1 |
15,3 |
17,2 |
16,7 |
Вихід цукру кг/1 т буряків |
132 |
133 |
142 |
130 |
137 |
125 |
129 |
128 |
135 |
134 |
а) оцініть щільність звязку між виходом цукру з 1 т переробленого цукрового буряка і його цукристістю за допомогою лінійного коефіцієнта кореляції;
б) опишіть звязок між показниками лінійною функцією, визначте параметри функції, поясніть їх економічний зміст;
в) перевірте істотність звязку, висновки зробіть з імовірністю 0,95.
12. Як оцінити щільність нелінійного звязку? Чи можна вважати коефіцієнт детермінації універсальною мірою щільності кореляційного звязку? Будь-яку відповідь обгрунтуйте.
13. За наведеними даними оцініть щільність звязку між рейтингом інвестиційної привабливості компаній (фірм) і курсом акцій на торгах сертифікатного аукціону:
Емітент |
Рейтинг інвестиційної |
Курс акцій, |
А |
5 |
300 |
В |
3 |
800 |
С |
2 |
2000 |
D |
1 |
2500 |
F |
4 |
16000 |
K |
6 |
200 |
N |
7 |
700 |
Перевірте істотність звязку з імовірністю 0,95.
14. Результати вибіркового опитування споживачів щодо сприйняття ними реклами товарів такі:
Враження |
Кількість споживачів |
||
від реклами |
Придбали товар |
Не придбали товару |
Разом |
Запамятали |
10 |
30 |
40 |
Не запамятали |
2 |
28 |
30 |
Разом |
12 |
58 |
70 |
1) оцініть результативність реклами за допомогою відношення шансів, поясніть його економічний зміст;
2) оцініть щільність звязку за допомогою коефіцієнта контингенції;
3) перевірте істотність звязку з імовірністю 0,95.
15. Розподіл молодих робітників за ступенем задоволеності умовами праці та професійною мобільністю характеризується такими даними:
Ступінь задоволеності |
Чи маєте намір змінити професію? |
|||
умовами праці |
Так, найближчим часом |
Так, у перспективі |
Ні |
Разом |
Задоволений |
|
20 |
26 |
46 |
Ставлюся байдуже |
7 |
18 |
9 |
34 |
Незадоволений |
15 |
5 |
|
20 |
Разом |
22 |
43 |
35 |
100 |
Проаналізуйте комбінаційний розподіл робітників, оцініть щільність звязку між задоволеністю умовами праці та професійною мобільністю за допомогою коефіцієнта спряженості. Перевірте істотність звязку з імовірністю 0,95.