Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

Подписываем
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Предоплата всего
Подписываем
Зміст
Таблиця 1. Вибіркова сукупність даних про залежність величини валового регіонального продукту від величини роздрібного товарообороту
Регіон |
Роздрібний товарооборот підприємств, млн. грн. |
Валовий регіональний продукт у факт. цінах , млн. грн. |
|
Х |
У |
АР Крим |
18937,9 |
20874 |
Вінницька |
12485,9 |
15381 |
Волинська |
8840 |
10072 |
Дніпропетровська |
35464,9 |
71173 |
Донецька |
44289,8 |
92093 |
Житомирська |
9557,5 |
11127 |
Закарпатська |
9081,1 |
10508 |
Запорізька |
20570,9 |
33158 |
Івано-Франківська |
11190,7 |
13916 |
Київська |
16163 |
26221 |
Кіровоградська |
7511,6 |
9989 |
Луганська |
18013,7 |
32280 |
Львівська |
20171,9 |
27987 |
Миколаївська |
11158,7 |
14767 |
Одеська |
24292,3 |
33116 |
Полтавська |
12848,4 |
28355 |
Рівненська |
8326,7 |
11180 |
Сумська |
8757,7 |
12341 |
Тернопільська |
7283,9 |
8276 |
Харківська |
32862,3 |
43868 |
Херсонська |
9464,9 |
9034 |
Хмельницька |
10710,7 |
12339 |
Черкаська |
10149,4 |
13656 |
Чернівецька |
6787,5 |
6672 |
Чернігівська |
8247 |
11532 |
Факторна ознака (Х) - Роздрібний товарооборот підприємств, млн. грн. Результуюча ознака (У) - Валовий регіональний продукт у факт. цінах, грн.
1. Побудова аналітичного групування
Одним із найпростіших способів дослідження взаємозвязку між результуючою змінною та факторними ознаками є аналітичне групування. Аналітичне групування це статистична таблиця в якій вказані інтервали значень факторної ознаки, згідно з якими згруповані одиниці сукупності, а також наведені групові середні значення результуючої змінної.
Кількість груп можна визначити за допомогою формули Стерджеса:
k= 1+3,322 lg n,
Де k кількість груп аналітичного групування, n кількість одиниць сукупності.
Розмір інтервалу h при цьому розраховують за формулою:
h = ,
де R = - розмах сукупності (вибірки), - максимальне значення факторної ознаки, мінімальне значення факторної ознаки.
Результати аналітичного групування доцільно подавати графічно. Для цього по осі абсцис проставляють середні значення факторної ознаки для кожного інтервалу групування, а по осі ординат групові середні значення результуючої змінною. Усі ці точки сполучають і отримують емпіричну лінію регресії.
Для нашого випадку = 44289,8, а = 6787,5. Відповідно до формули Стерджеса, дана вибірка буде мати 6 інтервалів. Обчислимо ширину інтервалу:
h = = 6250,38
Аналітичне групування дуже зручно зобразити у вигляді таблиці (Таблиця 1.1).
Таблиця 1.1. Аналітичне групування величини валового регіонального продукту за величиною роздрібного товарообороту
№ |
Роздрібний товарооборот підприємств у факт. цінах, млн. грн.. |
Кількість регіонів |
Середнє значення роздрібного товарообороту підприємств у фактичних цінах, млн. грн. (x) |
Середнє значення валового регіонального продукту у факт. цінах, млн. грн. (y) |
1 |
6787,5-13037,88 |
16 |
9912,69 |
12446,56 |
2 |
13037,88-19288,26 |
3 |
16163,07 |
17704,87 |
3 |
19288,26-25538,64 |
3 |
22413,45 |
21678,37 |
4 |
25538,64-31789,02 |
0 |
||
5 |
31789,02-38039,4 |
2 |
34914,21 |
34163,60 |
6 |
38039,4-44289,8 |
1 |
41164,60 |
92093,00 |
Разом |
25 |
|||
У середньому |
24913,60 |
35617,28 |
Графічно дане аналітичне групування представлено на Рис. 1.1.
Рис. 1.1.Емпірична лінія регресії залежності валового регіонального продукту у фактичних цінах, млн. грн., від роздрібного товарообороту підприємств, млн. грн..
Аналітичне групування має ряд переваг і недоліків. Основною перевагою аналітичного групування є відносна простота виконання, а недоліком є те, що аналітичне групування дає надто загальний і розмитий результат, його не слід використовувати у випадках, коли потрібно отримати конкретні дані.
2. Побудова парної лінійної кореляційно-регресійної моделі
Будемо вважати, що кореляційна залежність результуючої змінної від факторної ознаки є лінійною і описується рівнянням регресії (узагальнена ПЛКРМ):
Де - коефіцієнт регресії,
- вільний член регресії.
- випадкова величина, яка містить різноманітні помилки спостереження та вимірювання тощо.
Оскільки ці параметри нам невідомі, то ми повинні здійснити їх оцінку. Щоб одержати оцінки параметрів на основі заданих статистичних даних необхідно побудувати рівняння регресії (вибіркову ПЛКРМ) :
- теоретичне, нормативне або прогнозне значення результуючої змінної.
Щоб одержати оцінки застосуємо метод найменших квадратів, знайшовши мінімум функції:
Після здійснення ряду перетворень і використання методу Крамера отримаємо формули для обчислення даних оцінок:
Для того, щоб обчислити дані оцінки необхідно здійснити ряд додаткових обчислень, які наведені в Таблиці 2.1.
Таблиця 2.1. Вхідні дані і допоміжні розрахунки для визначення параметрів залежності валового регіонального продукту у фактичних цінах від роздрібного товарообороту підприємств у фактичних цінах.
Регіон |
Роздрібний товарооборот підприємств, млн. грн. |
Валовий регіональний продукт у факт. цінах , млн. грн. |
Розрахункові величини |
|
|
xi |
yi |
xi2 |
xi yi |
АР Крим |
18937,9 |
20874 |
358644056,4 |
395309724,6 |
Вінницька |
12485,9 |
15381 |
155897698,8 |
192045627,9 |
Волинська |
8840 |
10072 |
78145600 |
89036480 |
Дніпропетровська |
35464,9 |
71173 |
1257759132 |
2524143328 |
Донецька |
44289,8 |
92093 |
1961586384 |
4078780551 |
Житомирська |
9557,5 |
11127 |
91345806,25 |
106346302,5 |
Закарпатська |
9081,1 |
10508 |
82466377,21 |
95424198,8 |
Запорізька |
20570,9 |
33158 |
423161926,8 |
682089902,2 |
Івано-Франківська |
11190,7 |
13916 |
125231766,5 |
155729781,2 |
Київська |
16163 |
26221 |
261242569 |
423810023 |
Кіровоградська |
7511,6 |
9989 |
56424134,56 |
75033372,4 |
Луганська |
18013,7 |
32280 |
324493387,7 |
581482236 |
Львівська |
20171,9 |
27987 |
406905549,6 |
564550965,3 |
Миколаївська |
11158,7 |
14767 |
124516585,7 |
164780522,9 |
Одеська |
24292,3 |
33116 |
590115839,3 |
804463806,8 |
Полтавська |
12848,4 |
28355 |
165081382,6 |
364316382 |
Рівненська |
8326,7 |
11180 |
69333932,89 |
93092506 |
Сумська |
8757,7 |
12341 |
76697309,29 |
108078775,7 |
Тернопільська |
7283,9 |
8276 |
53055199,21 |
60281556,4 |
Харківська |
32862,3 |
43868 |
1079930761 |
1441603376 |
Херсонська |
9464,9 |
9034 |
89584332,01 |
85505906,6 |
Хмельницька |
10710,7 |
12339 |
114719094,5 |
132159327,3 |
Продовження Таблиці 2.1. Вхідні дані і допоміжні розрахунки для визначення параметрів залежності валового регіонального продукту у фактичних цінах від роздрібного товарообороту підприємств у фактичних цінах.
Черкаська |
10149,4 |
13656 |
103010320,4 |
138600206,4 |
Чернівецька |
6787,5 |
6672 |
46070156,25 |
45286200 |
Чернігівська |
8247 |
11532 |
68013009 |
95104404 |
За методом найменших квадратів маємо:
= -7640,39;
= 2,01
Рівняння регресії має вигляд:
-7640,39 + 2,01х
Графік даного рівняння зображено на Рисунку 2.1.
Рис. 2.1. Пряма регресії, яка описує залежність валового регіонального продукту у фактичних цінах від роздрібного товарообороту підприємства у фактичних цінах.
3. Економетрична інтерпретація параметрів моделі
На основі аналізу коефіцієнта регресії = 2,01, можна зробити висновки:
Вільний член рівняння регресії =3454,71 показує , що при нульовому обсягу роздрібного товарообороту у фактичних цінах валовий регіональний продукт у фактичних цінах буде становити 3454,71 грн. Слід зауважити, що таке інтерпретування вільного члена є достатньо умовним.
4. Обчислення випадкових відхилень та їх інтерпретація
Отримавши парну лінійну кореляційно-регресійну модель (ПЛКРМ) можна обчислити відхилення , і= , емпіричних чи теоретичних значень результуючої змінної від відповідних нормативних .
………
.…
Ці відхилення називають випадковими відхиленнями моделі.
Враховуючи , парну лінійну кореляційно-регресійну модель можна зобразити як:
+ е
Випадкові відхилення еi дають змогу оцінити ефективність використання факторної ознаки та резерви зміни результуючої змінної.
Для того, щоб обчислити усі випадкові відхилення потрібно виконита обчисленн, наведені у Таблиці 4.1.
Таблиця 4.1. Вхідні і допоміжні розрахунки для визначення випадкових відхилення
Регіон |
Роздрібний товарооборот підприємств, млн. грн. |
Валовий регіональний продукт у факт. цінах (фактичні значення) грн. |
Валовий регіональний продукт у факт. цінах (нормативні значення) грн. |
Випадкові відхилення (грн.) |
|
xi |
yi |
ỹ |
еi |
АР Крим |
18937,9 |
20874 |
30462,17 |
-9588,17 |
Вінницька |
12485,9 |
15381 |
17480,91 |
-2099,91 |
Волинська |
8840 |
10072 |
10145,46 |
-73,46 |
Дніпропетровська |
35464,9 |
71173 |
63714,06 |
7458,94 |
Донецька |
44289,8 |
92093 |
81469,53 |
10623,47 |
Житомирська |
9557,5 |
11127 |
11589,05 |
-462,05 |
Закарпатська |
9081,1 |
10508 |
10630,54 |
-122,54 |
Запорізька |
20570,9 |
33158 |
33747,72 |
-589,72 |
Продовження таблиця 4.1. Вхідні і допоміжні розрахунки для визначення випадкових відхилення
Івано-Франківська |
11190,7 |
13916 |
14875,00 |
-959,00 |
Київська |
16163 |
26221 |
24879,14 |
1341,86 |
Кіровоградська |
7511,6 |
9989 |
7472,75 |
2516,25 |
Луганська |
18013,7 |
32280 |
28602,70 |
3677,30 |
Львівська |
20171,9 |
27987 |
32944,94 |
-4957,94 |
Миколаївська |
11158,7 |
14767 |
14810,62 |
-43,62 |
Одеська |
24292,3 |
33116 |
41235,08 |
-8119,08 |
Полтавська |
12848,4 |
28355 |
18210,25 |
10144,75 |
Рівненська |
8326,7 |
11180 |
9112,71 |
2067,29 |
Сумська |
8757,7 |
12341 |
9979,87 |
2361,13 |
Тернопільська |
7283,9 |
8276 |
7014,62 |
1261,38 |
Харківська |
32862,3 |
43868 |
58477,70 |
-14609,70 |
Херсонська |
9464,9 |
9034 |
11402,74 |
-2368,74 |
Хмельницька |
10710,7 |
12339 |
13909,26 |
-1570,26 |
Черкаська |
10149,4 |
13656 |
12779,94 |
876,06 |
Чернівецька |
6787,5 |
6672 |
6015,88 |
656,12 |
Чернігівська |
8247 |
11532 |
8952,36 |
2579,64 |
У даному випадку випадкові відхилення набувають як додатних так і відємних значень. Якщо випадкове відхилення набуває додатних значень, то це означає, що фактичне значення валового регіонального продукту на одну особу у фактичних цінах перевищує відповідне нормативне значення, а отже, можна стверджувати, що у цьому регіоні інвестиції в основні засоби використовуються ефективніше, ніж у середньому по Україні. В протилежному випадку навпаки.
5. Перевірка моделі на наявність автокореляції
Одним з припущень класичного кореляційно-регресійного аналізу є припущення про незалежність випадкових величин .
Для перевірки моделі на наявність автокореляції використаємо коефіцієнт Дарбіна-Уотсона, який обчислимо за формулою:
Його ще називають d-статистика.
Автокореляція визначає зв'язок між значеннями результуючої змінної, які спостерігаються.
Якщо є близький до 0, то автокореляція існує і вона додатна; якщо є близьким до 4, то автокореляція існує і від'ємна; якщо ж =2, то автокореляція відсутня.
Для використання критерію потрібно здійснити обчислення (Таблиця 5.1.).
Таблиця 5.1. Додаткові обчислення для знаходження критерію Дарбіна-Уотсона
Регіон |
еi |
ei2 |
(ei - ei-1)2 |
1 |
2 |
3 |
4 |
АР Крим |
-9588,17 |
91932954,27 |
|
Вінницька |
-2099,91 |
4409631,90 |
56073963,75 |
Волинська |
-73,46 |
5395,93 |
4106521,21 |
Дніпропетровська |
7458,94 |
55635806,09 |
56737025,29 |
Донецька |
10623,47 |
112858192,02 |
10014264,56 |
Житомирська |
-462,05 |
213488,57 |
122888795,10 |
Закарпатська |
-122,54 |
15017,01 |
115263,19 |
Запорізька |
-589,72 |
347770,44 |
218254,10 |
Івано-Франківська |
-959,00 |
919688,42 |
136370,10 |
Київська |
1341,86 |
1800584,85 |
5293968,70 |
Кіровоградська |
2516,25 |
6331508,99 |
1379192,49 |
Луганська |
3677,30 |
13522526,39 |
1348036,63 |
Львівська |
-4957,94 |
24581199,75 |
74567402,45 |
Миколаївська |
-43,62 |
1902,77 |
24150564,54 |
Одеська |
-8119,08 |
65919460,11 |
65213042,83 |
Полтавська |
10144,75 |
102915894,46 |
333567381,81 |
Рівненська |
2067,29 |
4273684,37 |
65245327,76 |
Продовження таблиці 5.1. Додаткові обчислення для знаходження критерію Дарбіна-Уотсона
Сумська |
2361,13 |
5574927,42 |
86341,53 |
Тернопільська |
1261,38 |
1591067,97 |
1209456,64 |
Харківська |
-14609,70 |
213443205,45 |
251890895,55 |
Херсонська |
-2368,74 |
5610926,63 |
149841007,14 |
Хмельницька |
-1570,26 |
2465705,29 |
637575,14 |
Черкаська |
876,06 |
767488,94 |
5984485,96 |
Чернівецька |
656,12 |
430492,45 |
48375,90 |
Чернігівська |
2579,64 |
6654560,32 |
3699945,41 |
Отже,
Після обчислення d-статистики задамо рівень значущості =0,05 і за таблицями d-статистики Дарбіна-Уотсона при заданому рівні значущості, кількості факторів k (в нашому випадку k=1) та кількості спостережень n (n=25) знаходять критичні значення статистики.
В даному випадку коефіцієнт знаходитьсь в проміжку ( ; 4 ), а саме (1,454<1,71<2,546). Тоді з довірчою імовірністю можна стверджувати, що у вибірковій сукупності автокореляція відсутня.
6. Визначення тісноти звязку між змінними
Для лінійної форми зв'язку між результуючою й факторною змінними найчастіше використовують коефіцієнт кореляції, який обчислюють за такою формулою:
.
Для обчислення коефіцієнта кореляції доцільною буде побудова Таблиці 6.1.
Таблиця 6.1. Додаткові обчислення для обчислення коефіцієнта кореляції
Регіон |
xi |
yi |
xi2 |
xi yi |
yi2 |
АР Крим |
18937,9 |
20874 |
358644056,4 |
395309724,6 |
435723876 |
Вінницька |
12485,9 |
15381 |
155897698,8 |
192045627,9 |
236575161 |
Волинська |
8840 |
10072 |
78145600 |
89036480 |
101445184 |
Дніпропетровська |
35464,9 |
71173 |
1257759132 |
2524143328 |
5065595929 |
Донецька |
44289,8 |
92093 |
1961586384 |
4078780551 |
8481120649 |
Житомирська |
9557,5 |
11127 |
91345806,25 |
106346302,5 |
123810129 |
Закарпатська |
9081,1 |
10508 |
82466377,21 |
95424198,8 |
110418064 |
Запорізька |
20570,9 |
33158 |
423161926,8 |
682089902,2 |
1099452964 |
Івано-Франківська |
11190,7 |
13916 |
125231766,5 |
155729781,2 |
193655056 |
Київська |
16163 |
26221 |
261242569 |
423810023 |
687540841 |
Кіровоградська |
7511,6 |
9989 |
56424134,56 |
75033372,4 |
99780121 |
Луганська |
18013,7 |
32280 |
324493387,7 |
581482236 |
1041998400 |
Львівська |
20171,9 |
27987 |
406905549,6 |
564550965,3 |
783272169 |
Миколаївська |
11158,7 |
14767 |
124516585,7 |
164780522,9 |
218064289 |
Одеська |
24292,3 |
33116 |
590115839,3 |
804463806,8 |
1096669456 |
Полтавська |
12848,4 |
28355 |
165081382,6 |
364316382 |
804006025 |
Рівненська |
8326,7 |
11180 |
69333932,89 |
93092506 |
124992400 |
Сумська |
8757,7 |
12341 |
76697309,29 |
108078775,7 |
152300281 |
Тернопільська |
7283,9 |
8276 |
53055199,21 |
60281556,4 |
68492176 |
Харківська |
32862,3 |
43868 |
1079930761 |
1441603376 |
1924401424 |
Херсонська |
9464,9 |
9034 |
89584332,01 |
85505906,6 |
81613156 |
Хмельницька |
10710,7 |
12339 |
114719094,5 |
132159327,3 |
152250921 |
Черкаська |
10149,4 |
13656 |
103010320,4 |
138600206,4 |
186486336 |
Чернівецька |
6787,5 |
6672 |
46070156,25 |
45286200 |
44515584 |
Чернігівська |
8247 |
11532 |
68013009 |
95104404 |
132987024 |
- Звязок між змінними дуже слабкий
- Звязок між змінними слабкий
- Звязок між змінними помірний
- Звязок між змінними тісний
- Звязок між змінними функціональний.
В даному випадку = 0,96, це означає, що коефіцієнт кореляції попадає в проміжок , отже, звязок між змінними Х та У функціональний. Можна вважати, що 96% зміни валового регіонального продукту у фактичних цінах пояснюється зміною роздрібного товарообороту підприємствау фактичних цінах.
7. Побудова спряженої кореляційно-регресійної моделі
Якщо за факторну ознаку взяти валовий регіональний продукт у розрахунку на одну особу у фактичних цінах, а за результуючу інвестиції в основний капітал на одну особу у фактичних ціних, то можна побудувати рівняння прямої регресії x на y:
,
яке називають спряженим до рівняння регресії y на x.
Параметри і можна знайти декількома способами
З цієї формули випливає, що:
Модуль розкриваємо зі знаком коефіцієнта регресії.
визначаємо з формули:
За обома способами отримуємо:
=1,261
=-13924,17
Спряжену кореляційно-регресійну модель можна зобразити так:
=-13924,17+1,261y
Коефіцієнт кореляції між кількістю сільського населення та загальною кількістю населення становить:
8. Геометрична інтерпретація спряжених моделей
1. Якщо кореляційний взаємозвязок відсутній між змінними х та у спряжені рівняння регресії зображуються двома перпендикулярними прямими, де ;
2. Якщо між змінними х та у існує функціональний зв'язок то спряжені лінії регресії зливаються в одну пряму;
3. Якщо взаємозвязок між змінними х та у кореляційний то спряжені лінії регресії перетинаються утворюючи між собою гострий кут .
Побудуємо спряжені лінії регресії на одній координатній площині:
Пару взаємно спряжених моделей можна подати як
Або:
Маємо рівняння прямих, що проходять через 2 точки. Точкою їх перетину є точка (). (Рис. 8.1)
Рис. 8.1. Спряжені лінії регресії при кореляційному звязку
9. Обчислення тангенса кута між спряженими лініями регресії
Розрахуємо тангенс кута між спряженими прямими:
де , , а отже дану формулу можна записати у вигляді:
,
при чому :
; а
Звідси, φ= 16°38
Оскільки спряжені лінії регресії при перетині утворюють гострий кут, то між змінними x та y наявний кореляційний взаємозвязок.
10. Перевірка формули декомпозиції загальної дисперсії результуючої змінної
Рівність називають формулою декомпозиції загального відхилення;
Різницю називають загальним відхиленням результуючої змінної;
Різницю називають відхиленням, яке можна пояснити з огляду на кореляційно-регресійну модель (пояснене відхилення);
Різницю (випадкове відхилення) називають ще непоясненим відхиленням.
Аналогічне співвідношення спостерігається для сум квадратів відхилень:
Якщо дану тотожність поділити на кількість елементів у вибірці, то отримаємо наступне відношення (формула декомпозиції дисперсії):
Для обчислення декомпозиції дисперсії необхідно провести додаткові обчислення, які наведені в Таблиці 10.1.
Таблиця 10.1. Вхідні дані та допоміжні розрахунку для перевірки формули декомпозиції загальної дисперсії результуючої змінної
Регіон |
xi |
yi |
|
|
|
|||
1 |
2 |
3 |
4 |
5 |
6 |
|||
АР Крим |
18937,9 |
20874 |
5394470,76 |
52788469,78 |
91932954,27 |
|||
Вінницька |
12485,9 |
15381 |
61083603,36 |
32669085,25 |
227441610,4 |
|||
Волинська |
8840 |
10072 |
172255125,2 |
170332333 |
415758927 |
|||
Дніпропетровська |
35464,9 |
71173 |
2301734957 |
1641664455 |
1657371890 |
|||
Донецька |
44289,8 |
92093 |
4746713933 |
3395733947 |
3798359526 |
|||
Житомирська |
9557,5 |
11127 |
145675244,2 |
134735258 |
373848698,7 |
|||
Закарпатська |
9081,1 |
10508 |
161000570 |
157905765,6 |
398168797 |
|||
Запорізька |
20570,9 |
33158 |
99229489,96 |
111326147 |
7267513,357 |
|||
Івано-Франківська |
11190,7 |
13916 |
86129536,36 |
69248962,14 |
273775655,9 |
|||
Київська |
16163 |
26221 |
9146995,36 |
2830945,126 |
17987500,99 |
|||
Кіровоградська |
7511,6 |
9989 |
174440697,8 |
247239427,1 |
419150583,8 |
|||
Луганська |
18013,7 |
32280 |
82508155,56 |
29225930,29 |
3304515,328 |
|||
Львівська |
20171,9 |
27987 |
22947932,16 |
95030193,13 |
6126453,704 |
|||
Миколаївська |
11158,7 |
14767 |
71058156,16 |
70324648,68 |
246338280 |
|||
Одеська |
24292,3 |
33116 |
98394496,36 |
325386760,8 |
7042827,419 |
|||
Полтавська |
12848,4 |
28355 |
26609090,56 |
24863657,77 |
4440154,491 |
|||
Рівненська |
8326,7 |
11180 |
144398675,6 |
198355933,2 |
371801980 |
|||
Сумська |
8757,7 |
12341 |
117844051,4 |
174681910,2 |
328376708,3 |
|||
Тернопільська |
7283,9 |
8276 |
222624304,4 |
261856328,8 |
492226024,3 |
|||
Харківська |
32862,3 |
43868 |
427306778 |
1244755707 |
179716347,4 |
|||
Херсонська |
9464,9 |
9034 |
200579238,8 |
139095146,4 |
459166358,5 |
|||
Хмельницька |
10710,7 |
12339 |
117887477,8 |
86254750,41 |
328449196,9 |
|||
Черкаська |
10149,4 |
13656 |
91023048,36 |
108506898,5 |
282447263 |
|||
Чернівецька |
6787,5 |
6672 |
273062405,2 |
295177113,3 |
565972065,4 |
|||
Чернігівська |
8247 |
11532 |
136062893,2 |
202898471,4 |
358351238,1 |
Як бачимо формула декомпозиції загальної дисперсії результуючої змінної справджується доволі точно.
Чим більша пояснена дисперсія і, відповідно, менша непояснена, тим точніше кореляційно-регресійна модель пояснює звязок між змінними, і навпаки. В нашому випадку можна зробити висновок, що дана модель не дуже точно пояснює звязок між обсягом валового регіонального продукту та роздрібним товарооборотом підприємства.
11. Обчислення стандартної похибки моделі
Стандартна похибка оцінки за рівнянням характеризує варіацію фактичних уі навколо теоретичних , знайдених за допомогою рівняння регресії.
На практиці для обчислення стандартної похибки використовують формулу:
,
Або
.
Стандартна похибка моделі за рівнянням регресії має ті ж одиниці вимірювання, що і результуюча змінна .
Стандартна похибка моделі лежить в межах:
= 106371,2
Дане значення лежить в інтервалі 0≤ Syx≤ Sy, а отже, обчислення правильні.
12. Побудова довірчого інтервалу для оцінки фактичного значення результуючої змінної, його геометрична інтерпретація
Довірчий інтервал оцінки за рівнянням регресії можна побудувати маючи значення граничної похибки оцінки. Гранична похибка оцінки обчислюють так:
гранична похибка оцінки,
tр - імовірнісний коефіцієнт, який при заданих значеннях ймовірностей знаходять за таблицями нормального закону розподілу, якщо обсяг вибірки великий, а якщо кількість спостережень невелика за таблицями розподілу Стьюдента,
- стандартна похибка оцінки.
tp =1,714 (користуємося таблицями розподілу Стьюдента), тоді:
Отже інтервал довір'я має вигляд:
Таблиця 12.1. Значення довірчих інтервалів для оцінки фактичного значення результуючої змінної
Регіон |
ỹ-182320,24 |
ỹ |
ỹ+182320,24 |
1 |
2 |
3 |
4 |
АР Крим |
-151858,07 |
30462,17 |
212782,41 |
Вінницька |
-164839,33 |
17480,91 |
199801,15 |
Продовження Таблиці 12.1. Значення довірчих інтервалів для оцінки фактичного значення результуючої змінної
Волинська |
-172174,78 |
10145,46 |
192465,70 |
Дніпропетровська |
-118606,18 |
63714,06 |
246034,30 |
Донецька |
-100850,71 |
81469,53 |
263789,77 |
Житомирська |
-170731,19 |
11589,05 |
193909,29 |
Закарпатська |
-171689,70 |
10630,54 |
192950,78 |
Запорізька |
-148572,52 |
33747,72 |
216067,96 |
Івано-Франківська |
-167445,24 |
14875,00 |
197195,24 |
Київська |
-157441,10 |
24879,14 |
207199,38 |
Кіровоградська |
-174847,49 |
7472,75 |
189792,99 |
Луганська |
-153717,54 |
28602,70 |
210922,94 |
Львівська |
-149375,30 |
32944,94 |
215265,18 |
Миколаївська |
-167509,62 |
14810,62 |
197130,86 |
Одеська |
-141085,16 |
41235,08 |
223555,32 |
Полтавська |
-164109,99 |
18210,25 |
200530,49 |
Рівненська |
-173207,53 |
9112,71 |
191432,95 |
Сумська |
-172340,37 |
9979,87 |
192300,11 |
Тернопільська |
-175305,62 |
7014,62 |
189334,86 |
Харківська |
-123842,54 |
58474,70 |
240797,94 |
Херсонська |
-170917,50 |
11402,74 |
193722,98 |
Хмельницька |
-168410,98 |
13909,26 |
196229,50 |
Черкаська |
-169540,30 |
12779,94 |
195100,18 |
Чернівецька |
-176304,36 |
6015,88 |
188336,12 |
Чернігівська |
-173367,88 |
8952,36 |
191272,60 |
Геометрично довірчий інтервал це смуга між 2-ма паралельними прямими на відстані граничної похибки по ординаті від лінії регресії. В цю смугу потрапляють майже всі фактичні значення y. Дуже велика ширина довірчого інтервалу пояснюється наявністю фактичних значень результуючої ознаки, які дуже відхиляються від своїх нормативних значень.
Рис. 12.1. Геометрична інтерпретація довірчого інтервалу оцінки за рівнянням регресії
Тобто, з ймовірністю 0,95 можна стверджувати, що фактичні значення результуючої змінної, зумовлене значенням факторної ознаки, має знаходитися між цими прямими.
13. Розрахунок теоретичного та емпіричного значень відношення детермінації, їх економетрична інтерпретація. Обчислення кореляційного відношення
Стандартна похибка моделі виражається в одиницях вимірювання результуючої змінної. Це робить неможливим порівняння 2-ох чи кількох КРМ на точність, якщо в них результуюча змінна вимірюється різними одиницями.
Для такого порівняння використовується безвимірна характеристика точності моделі і тісноти звязку відношення детермінації.
Відношенням детермінації називають відношення поясненої дисперсії до всієї дисперсії результуючої змінної:
Із формули випливає, що відношення детермінації може приймати значення з інтервалу: .
Відношення детермінації є показником адекватності усіх кореляційно-регресійних моделей. А в нашому випадку (для парної ЛКРМ) його називають коефіцієнтом детермінації
Для обчислення похибки моделі використовують пояснену дисперсію , то для обчислення відношення детермінації зручніше використовувати формулу:
R2 =0,4504
Отже, в середньому по Україні 45,04% зміни валового регіонального продукту у фактичних цінах пояснюється зміною роздрібного товарообороту підприємства.
Кореляційним відношенням називають арифметичне значення кореня квадратного з відношення детермінації:
Є показником сили звязку та адекватності моделі для всіх КРМ. Якщо КРМ є парною лінійною, то кореляційне відношення рівне абсолютному значенню коефіцієнта кореляції.
Оскільки R= 0,96, то зв'язок між факторною ознакою та результуючою змінною можна вважати достатньо тісним.
Загальну дисперсію результуючої змінної можна розкласти на суму поясненої та непоясненої дисперсії, як на основі ПЛКРМ так і на основі аналітичного групування. Формула декомпозиції загальної дисперсії змінної у має вигляд:
- кількість груп аналітичного групування;
- число одиниць сукупності в j-й групі;
- фактичне значення результуючої змінної для і-тої одиниці сукупності j-тої групи;
- середнє значення результуючої змінної в j-й групі.
Емпіричним відношенням детермінації називають величину:
Порівняння теоретичного відношення детермінації з емпіричним відношенням детермінації, дає змогу робити висновки про адекватність моделі.
= 2413995023
=0,883
У нашому випадку емпірична регресія пояснює 88,3% усієї дисперсії результуючої змінної, що на 43,3% більше ніж теоретична пряма регресії, побудована методом найменших квадратів. Це означає, що звязок між валовим регіональним продуктом у фактичних цінах та роздрібним товарооборотом підприємства для заданої вибіркової сукупності краще описувати нелінійною залежністю.
14. Обчислення вибіркових похибок параметрів регресії. Побудова довірчих інтервалів для істинних значень параметрів регресії, їх геометрична інтерпретація
Якщо при побудові ПЛКРМ методом найменших квадратів виконуються усі припущення класичного кореляційно-регресійного аналізу, то параметри є величинами, які розподілені за нормальним законом.
Параметри нормального закону розподілу випадкових величин невідомі. Якщо замість дисперсії випадкових величин взяти її оцінку , то формули для оцінки дисперсій b0 i b1:
Стандартною вибірковою похибкою b0 ПЛКРМ називають величину:
На підставі стандартної похибки при заданому значенні довірчої ймовірності р можна знайти граничну похибку b0 та побудувати довірчий інтервал для істинного значення параметра узагальненої ПЛКРМ:
Геометрично довірчий інтервал інтерпретується парою паралельних прямих, між початковими координатами яких з довірчою ймовірністю р знаходиться істинне значення параметра ПЛКРМ:
Стандартною вибірковою похибкою коефіцієнта регресії b0 ПЛКРМ:
= 39995,6
tp =1,714 (користуємося таблицями розподілу Стьюдента), тоді:
= 1,714 * 39995,6= 68552,46
:
Таблиця 14.1. Значення вибіркових похибок параметра регресії β0
Регіон |
ỹ-68552,46 |
ỹ |
ỹ+68552,46 |
1 |
2 |
3 |
4 |
АР Крим |
-38090,29 |
30462,17 |
99014,63 |
Вінницька |
-51071,55 |
17480,91 |
86033,37 |
Волинська |
-58407,00 |
10145,46 |
78697,92 |
Дніпропетровська |
-4838,40 |
63714,06 |
132266,52 |
Продовження таблиці 14.1. Значення вибіркових похибок параметра регресії β0
Донецька |
12917,07 |
81469,53 |
150021,99 |
Житомирська |
-56963,41 |
11589,05 |
80141,51 |
Закарпатська |
-57921,92 |
10630,54 |
79183,00 |
Запорізька |
-34804,74 |
33747,72 |
102300,18 |
Івано-Франківська |
-53677,46 |
14875,00 |
83427,46 |
Київська |
-43673,32 |
24879,14 |
93431,60 |
Кіровоградська |
-61079,71 |
7472,75 |
76025,21 |
Луганська |
-39949,76 |
28602,70 |
97155,16 |
Львівська |
-35607,52 |
32944,94 |
101497,40 |
Миколаївська |
-53741,84 |
14810,62 |
83363,08 |
Одеська |
-27317,38 |
41235,08 |
109787,54 |
Полтавська |
-50342,21 |
18210,25 |
86762,71 |
Рівненська |
-59439,75 |
9112,71 |
77665,17 |
Сумська |
-58572,59 |
9979,87 |
78532,33 |
Тернопільська |
-61537,84 |
7014,62 |
75567,08 |
Харківська |
-10077,76 |
58474,70 |
127027,16 |
Херсонська |
-57149,72 |
11402,74 |
79955,20 |
Хмельницька |
-54643,20 |
13909,26 |
82461,72 |
Черкаська |
-55772,52 |
12779,94 |
81332,40 |
Чернівецька |
-62536,58 |
6015,88 |
74568,34 |
Чернігівська |
-59600,10 |
8952,36 |
77504,82 |
Рис. 14.1. Геометрична інтерпретація довірчого інтервалу для істинного значення β0
З ймовірністю 95% фактичне значення параметра є між початковим ординатами цих прямих.
Стандартна похибка оцінки коефіцієнта регресії B1 обчислюється за формулою:
Гранична похибка оцінки коефіцієнта регресії B0 обчислюється за формулою:
Геометрично довірчий інтервал інтерпретується парою прямих, що перетинаються у точці :
tp =1,714 (користуємося таблицями розподілу Стьюдента), тоді:
= 1,714 * 2,22= 3,81
З ймовірністю 95% фактичне значення параметра b1 належить цьому проміжку:
:
Таблиця 14.2. Значення вибіркових похибок параметра регресії β1
Регіон |
ỹ-x |
ỹ |
ỹ+x |
1 |
2 |
3 |
4 |
АР Крим |
11949,20 |
30462,17 |
11582,67 |
Вінницька |
12720,72 |
17480,91 |
7406,82 |
Волинська |
12365,20 |
10145,46 |
9331,07 |
Дніпропетровська |
10055,12 |
63714,06 |
21834,38 |
Донецька |
10663,28 |
81469,53 |
18542,71 |
Житомирська |
13294,00 |
11589,05 |
4303,94 |
Закарпатська |
13180,08 |
10630,54 |
4920,53 |
Запорізька |
11974,96 |
33747,72 |
11443,24 |
Івано-Франківська |
11786,00 |
14875,00 |
12465,99 |
Київська |
7702,16 |
24879,14 |
34569,77 |
Кіровоградська |
12659,92 |
7472,75 |
7735,90 |
Луганська |
11537,68 |
28602,70 |
13810,02 |
Львівська |
11573,36 |
32944,94 |
13616,90 |
Миколаївська |
12411,76 |
14810,62 |
9079,06 |
Одеська |
11296,24 |
41235,08 |
15116,82 |
Полтавська |
9782,32 |
18210,25 |
23310,91 |
Рівненська |
12681,36 |
9112,71 |
7619,85 |
Сумська |
13503,12 |
9979,87 |
3172,08 |
Тернопільська |
13101,36 |
7014,62 |
5346,60 |
Харківська |
11367,12 |
58474,70 |
14733,18 |
Херсонська |
12505,36 |
11402,74 |
8572,45 |
Хмельницька |
12025,20 |
13909,26 |
11171,32 |
Черкаська |
11701,52 |
12779,94 |
12923,24 |
Чернівецька |
12558,48 |
6015,88 |
8284,94 |
Чернігівська |
12905,52 |
8952,36 |
6406,59 |
Рис. 14.2. Геометрична інтерпретація довірчого інтервалу для істинного значення β1
15. Розрахунок вибіркової похибки моделі. Побудова довірчого інтервалу для середнього прогнозного значення результуючої змінної, його геометрична інтерпретація
Знаючи вибіркові похибки параметрів моделі, можна знайти похибку вибіркову похибку всієї моделі. Очевидно, що задача знаходження вибіркової похибки усієї регресії рівносильна задачі знаходження вибіркової похибки теоретичного значення результуючої змінної.
Для того, щоб представити це значення, запишемо ПЛКРМ у такому вигляді:
Згідно теореми про дисперсію двох незалежних випадкових величин маємо:
Дисперсія збігається з дисперсією при нульовому значення факторної ознаки, отже, шляхом математичних перетворень отримаємо таку формулу для обчислення стандартної вибіркової похибки моделі:
Стандартна вибіркова похибка моделі відображає похибку вибірки.
Стандартна вибіркова похибка моделі залежить від конкретного значення факторної ознаки і дає оцінку середнього значення результуючої змінної для цього значення факторної ознаки.
Гранична вибіркова похибка моделі
Геометрично, довірчий інтервал інтерпретується смугою між двома гіперболами:
Нехай x= 1500 грн.
За даними обчислень:
За таблицями розподілу Стьюдента з рівнем значущості α=0,05 значення імовірнісного коефіцієнта tp=1,714.
Гранична вибіркова похибка моделі дорівнює:
22509,61
Довірчий інтервал за заданого рівня імовірності:
15464,76≤ y ≤ 29554,46
Це означає, що з ймовірністю 95% фактичне значення валового регіонального продукту у фактичних цінах, при величині роздрібного товарообороту підприємства 15000грн. повинне лежати в межах від 15464,76 до29554,46 грн.
Рис. 15.1. Геометрична інтерпретація довірчого інтервалу для фактичних значень результуючої змінної
16. Обчислення похибки індивідуального прогнозу. Побудова довірчого інтервалу для індивідуального прогнозного значення результуючої змінної, його геометрична інтерпретація
Похибка оцінки індивідуального прогнозу обчислюється за формулою:
Похибка оцінки індивідуального прогнозу обчислюється за формулою:
На основі стандартної похибки оцінки індивідуального прогнозу при заданому значенні ймовірності р можна визначити граничну похибку індивідуального прогнозу та побудувати довірчий інтервал для індивідуального прогнозу.
Гранична похибка знаходиться як добуток стандартної похибки на заданий імовірнісний коефіцієнт .
Для х = 15000 грн.:
За таблицями розподілу Стьюдента з рівнем значущості α=0,05 значення імовірнісного коефіцієнта tp=1,714.
Це означає, що з ймовірністю 95% фактичне значення величини валового регіонального продукту у фактичних цінах за величини роздрібного товарообороту підприємства грн. повинне лежати в межах від -12561,3 до 35699,22 грн.
Рис. 16.1. Геометрична інтерпретація довірчого інтервалу індивідуального прогнозу
17. Оцінення коефіцієнта кореляції
Всі випадкові величини ми оцінювали до цього часу (випадкові відхилення, параметри b0 , b1) мали нормальний закон розподілу (або близький до нього), тому для їхньої оцінки можна було будувати симетричний довірчий інтервал, використовуючи таблиці нормального закону розподілу або розподілу Стьюдента.
Коефіцієнт кореляції r не є нормально розподілена випадкова величина. Областю його допустимих значень є інтервал [-1;1], а нормального закону розподілу(-∞;+∞).
Вибіркове значення коефіцієнта кореляції r = 0,71. Отож, для оцінювання коефіцієнта кореляції насамперед перейдемо від випадкової змінної r до випадкової змінної z:
Для випадкової величини z знайдемо стандартну вибіркову похибку за формулою:
Гранична вибіркова похибка z при заданому значенні довірчої ймовірності р = 0,95 становить
.
Тоді довірчий інтервал невідомого значення ζ випадкової величини z, яке відповідає істинному значенню коефіцієнта кореляції , має вигляд:
.
Здійснивши обернене перетворення від змінної z до змінної r за формулою (57), отримаємо довірчий інтервал для істинного значення коефіцієнта кореляції генеральної сукупності
,
де ,
Отже, з довірчою ймовірністю 0,95 можна стверджувати, що істинне значення коефіцієнта кореляції генеральної сукупності має лежати в межах від до .
18. Перевірка статистичної значущості параметрів звязку між змінними
Перевірка статистичної значущості коефіцієнта кореляції.
Для коефіцієнта кореляції формулюється нульова гіпотеза, що реальний коефіцієнт кореляції в генеральній сукупності рівний нулю (ρ =0).
Необхідно дослідити сумісність вибіркового коефіцієнта кореляції з цією гіпотезою.
Для перевірки нульової гіпотези використаємо статистику:
За таблицями Стьюдента при заданому рівні значущості α = 0,01 та кількості ступенів вільності ν=n-2 = 25-2 = 23 знаходимо критичне значення статистики .
Оскільки tем > ( > ), то нульову гіпотезу відхиляємо і з довірчою ймовірністю р = 0,99 вважаємо, що коефіцієнт кореляції ρ генеральної сукупності відмінний від нуля, тобто кореляційна залежність валового регіонального продукту у розрахунку на одну особу від обсягу капітальних інвестицій в основний капітал на одну особу є статистично значущою.
Перевірка статистичної значущості коефіцієнта регресії.
Для коефіцієнта регресії формулюється така нульова гіпотеза: коефіцієнт регресії генеральної сукупності β1=0.
Статистика для перевірки цієї гіпотези має вигляд:
.
За таблицями Стьюдента при заданому рівні значущості α = 0,01 та кількості ступенів вільності ν = 23 знаходимо критичне значення статистики . Оскільки tем > ( > ), то нульову гіпотезу відхиляємо і з довірчою ймовірністю р = 0,99 вважаємо, що коефіцієнт регресії β1 генеральної сукупності відмінний від нуля, тобто кореляційна залежність величини капітальних інвестицій від обсягу реалізованої продукції (робіт, послуг) по регіонах України є статистично значущою.
19. Експрес-діагностика моделі
В деяких випадках використання аналізу соціально-економічних обєктів можна обмежитись лише простою перевіркою моделі на адекватність без обчислення стандартної похибки, побудови довірчих інтервалів для істинних значень параметрів моделі та прогнозних значень результуючої змінної. Таку просту і швидку перевірку моделі на адекватність називають експрес-діагностикою моделі.
Експрес-діагностику ПЛКРМ можна здійснити за допомогою критерію Фішера за такою схемою:
20. Економічна інтерпретація результатів економетричного дослідження та їх використання
З аналітичного групування можна зробити висновок про те, що між величиною валового регіонального продукту у фактичних цінах та роздрібних товарооборотів підприємств по регіонах України наявна кореляційна залежність, оскільки під час збільшення обсягу роздрібного товарообороту підприємства, відповідно зростає і валовий регіональний продукт.
У побудованій парній лінійній кореляційно-регресійній моделі коефіцієнт регресії b1 = 2,01. Оскільки значення коефіцієнта регресії відмінне від нуля, то це вказує на наявність кореляційного зв'язку між величиною валового регіонального продукту у розрахунку на одну особу і інвестиціями в основний капітал на одну особу. Додатне значення b1 вказує на те, що при збільшенні обсягу роздрібного товарообороту підприємства валовий регіональний продукт по регіонах України повинен зростати.
На основі дослідження випадкових відхилень можна стверджувати, що необхідно підвищувати ефективність в таких областях як: АР Крим (е= -9588,17), Вінниці (е=-2099,91), Волинській (е= -73,46), Житомирській (е= -462,05), Закарпатській (е= -122,54),Запорізька(е= -589,72 Івано-Іранківській (е= -959,00), Львівській (е= -4957,94),Миколаївська (е=-43,62),Одеська(е=-8119,08), Харківська (е=-14609,70),Херсонській (е= -2368,74) та Хмельницька (е=-1570,26) областях.
Величина коефіцієнта кореляції (r =0,96) свідчить про те, що між величиною валового регіонального продукту і роздрібним товарооборотом є тісний кореляційний зв'язок.
Оскільки прямі спряжених парних лінійних кореляційно-регресійних моделей перетинаються не під прямим кутом, а під гострим, то можна зробити висновок, що зв'язок між змінними є і він кореляційний. Гострий кут між прямими свідчить про те, що взаємозвязок між х та у тісний.
Порівнюючи у формулі декомпозиції загальної дисперсії пояснену та непояснену складові, можна зробити висновок: оскільки значення поясненої дисперсії більші, ніж непоясненої, то це означає, що кореляційно-регресійна модель точно пояснює звязок між величиною валового регіонального продукту у розрахунку на одну особу і інвестиціями в основний капітал на одну особу.
На основі коефіцієнта детермінації можна зробити висновок, що в середньому по Україні 45,04% зміни валового регіонального продукту у фактичних цінах пояснюється зміною роздрібного товарообороту підприємства. Емпірична регресія пояснює 88,3%% усієї дисперсії результуючої змінної, що на 43,3% більше ніж теоретична пряма регресії, побудована методом найменших квадратів. Це означає, що звязок між валовим регіональним продуктом у фактичних цінах та роздрібним товарооборотом підприємства у фактичних цінах для заданої вибіркової сукупності краще описувати нелінійною залежністю.
Оскільки tем > ( > ), то із довірчою ймовірністю р=0,99вважаємо, що коефіцієнт кореляції ρ генеральної сукупності відмінний від нуля, тобто кореляційна залежність валового регіонального продукту у розрахунку на одну особу від обсягу капітальних інвестицій в основний капітал на одну особу є статистично значущою.
Оскільки tем > ( > ), то і з довірчою ймовірністю р = 0,99 вважаємо, що коефіцієнт регресії β1 генеральної сукупності відмінний від нуля, тобто кореляційна залежність величини капітальних інвестицій від обсягу реалізованої продукції (робіт, послуг) по регіонах України є статистично значущою.
На основі експрес-діагностики моделі можна стверджувати, що побудована парна лінійна кореляційно-регресійна модель відповідає дійсності, тобто адекватно описує кореляційну залежність величини капітальних інвестицій від обсягу реалізованої продукції (робіт, послуг) по регіонах України.