Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Лекция 4
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
4.1. Основные понятия
Корреляция термин, применяемый в различных областях науки и техники для обозначения взаимозависимости, взаимного соответствия, соотношения понятий, предприятий, предметов, функций.
Корреляция в математической статистике вероятностная или статистическая зависимость, не имеющая вообще говоря строго функционального характера. В отличие от функциональной зависимости, корреляционная зависимость возникает тогда, когда один из признаков зависит не только от данного второго признака, но и от ряда других случайных факторов, или же тогда, когда среди условий, от которых зависят и тот и другой признаки, имеются общие для них условия. Пример такого рода зависимости - корреляционная таблица, в которой, например, отражена зависимость производительности ПК от его стоимости.
Корреляционный анализ. В основе корреляционного анализа лежит допущение о том, что исследуемые явления подчинены определённым вероятностным закономерностям. Зависимость между двумя случайными событиями проявляется в том, что условная вероятность одного из них при наступлении другого отличается от безусловной вероятности.
Корреляционный анализ совокупность математических методов обнаружения корреляционной зависимости между двумя случайными признаками.
Технология корреляционного анализа включает в себя следующие этапы.
Построение корреляционного поля.
Составление корреляционной таблицы.
Определение нормальности.
Выбор метода корреляционного анализа.
Вычисление количественных характеристик.
Оценка значимости (существенности) связи.
Вид зависимости можно определить по результатам регрессионного анализа.
(Весь этот абзац 32 строки с очень небольшими изменениями заимствован из БСЭ т.13 стр. 210 211.)
Рассмотрим предложенную технологию подробно.
4.2. Корреляционное поле. Корреляционная таблица
Корреляционное поле и корреляционная таблица являются вспомогательными средствами наглядного анализа собранных статистических данных. Их достоинство простота построения и наглядность. По ним можно сделать предварительные выводы о форме зависимости случайных величин.
При нанесении выборочных точек на координатную плоскость получают корреляционное поле. По корреляционному полю можно, например, установить, что один признак в среднем возрастает, или убывает при возрастании другого признака.
По корреляционному полю с помощью группировки можно построить корреляционную таблицу. В каждой клетке корреляционной таблицы записывается количество пар признаков, которые попадают в соответствующие интервалы группировки по каждому признаку. Рассмотрим зависимость ВВП РФ (таблица 4.2.1) от численности персонала, занятого исследованиями и разработками (таблица 4.2.2) по регионам РФ. Таблицы 4.2.1 и 4.2.2 заимствованы из Статистического ежегодника РФ за 2012 год.
Таблица 4.2.1. Объёмы ВВП по регионам РФ
Всего, млн. руб. |
На душу населения1), руб. |
|||||||||||||
2000 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2000 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
|
Валовой внутренний продукт Российской Федерации в рыночных ценах |
7305646 |
21609766 |
26917201 |
33247513 |
41276849 |
38807219 |
45172748 |
49835 |
150571 |
188167 |
232817 |
289170 |
271787 |
316226 |
в том числе валовая добавленная стоимость в основных ценах |
6472199 |
18517666 |
22977344 |
28484471 |
35182698 |
33831324 |
38871057 |
44150 |
129026 |
160625 |
199464 |
246477 |
236938 |
272112 |
из нее валовой региональный продукт по субъектам Российской Федерации (валовая добавленная стоимость в основных ценах) - всего |
5753672 |
18034385 |
22492120 |
27963956 |
33908757 |
32007228 |
37398520 |
39532 |
125659 |
157233 |
195819 |
237552 |
224163 |
261804 |
Центральный |
1841499 |
6278360 |
7965170 |
10208918 |
12674395 |
11405183 |
13363655 |
48205 |
164888 |
208807 |
267272 |
331472 |
297793 |
348100 |
Белгородская |
42074 |
144988 |
178846 |
237013 |
317656 |
304345 |
397070 |
27970 |
95911 |
118211 |
156225 |
208548 |
199046 |
259173 |
Брянская область |
24650 |
66692 |
82100 |
102706 |
125834 |
126477 |
144264 |
17414 |
49923 |
62188 |
78519 |
96885 |
98015 |
112623 |
Владимирская |
33018 |
86927 |
112842 |
146663 |
175396 |
185825 |
218712 |
21073 |
58261 |
76185 |
99683 |
119942 |
127815 |
151311 |
Воронежская |
49524 |
133587 |
166177 |
222812 |
287072 |
301729 |
328771 |
20365 |
56535 |
70493 |
94850 |
122591 |
129113 |
140810 |
Ивановская область |
16900 |
44415 |
55090 |
74752 |
86980 |
87062 |
98209 |
14240 |
40039 |
50272 |
68866 |
80709 |
81287 |
92306 |
Калужская область |
23903 |
70954 |
86150 |
111869 |
150395 |
154946 |
184581 |
22438 |
69192 |
84317 |
109790 |
147930 |
152612 |
182375 |
Костромская |
16662 |
44685 |
54351 |
65700 |
81041 |
78921 |
92291 |
21985 |
63304 |
78227 |
95687 |
119072 |
116856 |
137817 |
Курская область |
30168 |
86625 |
104036 |
128799 |
167866 |
161571 |
192442 |
23678 |
72995 |
88949 |
111348 |
146276 |
141834 |
170255 |
Липецкая область |
48068 |
145194 |
179057 |
209822 |
259532 |
226662 |
254738 |
39051 |
121376 |
150197 |
176535 |
219136 |
192165 |
216884 |
Московская область |
176694 |
708062 |
934329 |
1295650 |
1645753 |
1519446 |
1796536 |
26688 |
104738 |
137092 |
188565 |
237596 |
217340 |
254279 |
Орловская область |
22161 |
53182 |
64802 |
77101 |
96670 |
90624 |
102450 |
25168 |
64180 |
79342 |
95387 |
120531 |
113849 |
129788 |
Рязанская область |
27957 |
84383 |
105492 |
121305 |
150151 |
153634 |
173526 |
22070 |
70666 |
89011 |
102983 |
128212 |
131891 |
150002 |
Смоленская область |
28141 |
65526 |
79043 |
95703 |
121601 |
125349 |
149091 |
25798 |
63687 |
77367 |
94432 |
121013 |
125743 |
150910 |
Тамбовская область |
23387 |
63615 |
79766 |
106040 |
120836 |
136324 |
139017 |
19134 |
55574 |
70416 |
94533 |
108653 |
123512 |
126994 |
Тверская область |
35341 |
96897 |
127364 |
156035 |
192283 |
197687 |
218644 |
23073 |
68049 |
90518 |
112022 |
139216 |
144258 |
161039 |
Тульская область |
42061 |
116221 |
142240 |
174111 |
231731 |
214925 |
237208 |
24292 |
71587 |
88476 |
109226 |
146466 |
136852 |
152301 |
Ярославская |
41756 |
131252 |
153252 |
186578 |
214946 |
212684 |
234246 |
29828 |
99335 |
117309 |
143936 |
166712 |
165758 |
183644 |
г. Москва |
1159034 |
4135155 |
5260233 |
6696259 |
8248652 |
7126972 |
8401859 |
115631 |
381997 |
477873 |
601147 |
734242 |
628930 |
733042 |
Продолжение табл.4.2.1
Всего, млн. руб. |
На душу населения1), руб. |
|||||||||||||
2000 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2000 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
|
Северо-Западный федеральный округ |
578505 |
1799780 |
2198608 |
2770191 |
3388222 |
3415871 |
3905154 |
40565 |
130846 |
160591 |
202974 |
248743 |
251018 |
286828 |
Республика Карелия |
28215 |
77125 |
84228 |
104603 |
115208 |
105924 |
127734 |
38539 |
112950 |
125613 |
157959 |
175466 |
162649 |
197838 |
Республика Коми |
59473 |
171307 |
218491 |
241151 |
291812 |
302629 |
352335 |
56620 |
176075 |
229054 |
256586 |
314252 |
329967 |
389064 |
Архангельская |
61807 |
166433 |
215933 |
268672 |
289756 |
323607 |
355884 |
44797 |
128965 |
169458 |
212908 |
231493 |
260585 |
289058 |
в том числе |
11924 |
44718 |
67248 |
97838 |
91476 |
130178 |
145750 |
… |
… |
… |
… |
… |
… |
… |
Вологодская |
69195 |
193966 |
201939 |
243336 |
294926 |
213397 |
252063 |
53433 |
156380 |
164130 |
199003 |
242348 |
176179 |
209220 |
Калининградская |
23290 |
81838 |
103139 |
143928 |
179267 |
169520 |
195063 |
24309 |
87123 |
110255 |
153964 |
191533 |
180797 |
207464 |
Ленинградская |
56002 |
205417 |
265260 |
309029 |
383255 |
430396 |
502126 |
33265 |
122024 |
157122 |
182658 |
226011 |
252891 |
293342 |
Мурманская область |
55135 |
132870 |
158127 |
191585 |
213734 |
202235 |
234649 |
59158 |
156653 |
190124 |
233766 |
263756 |
251957 |
294445 |
Новгородская |
20966 |
63848 |
74924 |
86665 |
115141 |
117710 |
127271 |
29347 |
95286 |
113246 |
132335 |
177472 |
183197 |
200033 |
Псковская область |
16179 |
40583 |
51465 |
61562 |
73283 |
74648 |
84345 |
20545 |
55773 |
72029 |
87457 |
105449 |
108798 |
124663 |
г. Санкт-Петербург |
188243 |
666393 |
825102 |
1119660 |
1431840 |
1475805 |
1673684 |
39811 |
141796 |
174433 |
235410 |
299436 |
306455 |
343951 |
Южный |
329696 |
936057 |
1195195 |
1577083 |
2001112 |
1994912 |
2293686 |
23418 |
67566 |
86428 |
114086 |
144634 |
144046 |
165579 |
Республика Адыгея |
5520 |
17029 |
21132 |
29085 |
36134 |
41512 |
46149 |
12315 |
38515 |
48050 |
66366 |
82378 |
94437 |
104921 |
Республика |
6213 |
9686 |
12844 |
17226 |
20790 |
23948 |
24344 |
20184 |
33018 |
43797 |
58925 |
71451 |
82587 |
84150 |
Краснодарский край |
137125 |
372930 |
483951 |
648211 |
803834 |
861603 |
1008152 |
26714 |
72794 |
94244 |
125700 |
155104 |
165555 |
193055 |
Астраханская |
28116 |
70128 |
85112 |
100359 |
147549 |
134418 |
145430 |
27815 |
69814 |
84950 |
99999 |
146391 |
133019 |
143924 |
Волгоградская |
63767 |
203232 |
252143 |
331767 |
416679 |
377514 |
437414 |
23341 |
76741 |
95683 |
126313 |
159002 |
144303 |
167538 |
Ростовская область |
88955 |
263052 |
340013 |
450435 |
576126 |
555917 |
632197 |
20004 |
60575 |
78642 |
104603 |
134137 |
129626 |
147710 |
Северо-Кавказский |
105178 |
352069 |
457118 |
573221 |
728231 |
786670 |
887606 |
13803 |
39051 |
50434 |
62724 |
78922 |
84494 |
94465 |
Республика |
20921 |
90443 |
124154 |
156929 |
216277 |
257833 |
285279 |
8490 |
33840 |
45742 |
56813 |
77034 |
90543 |
98662 |
Республика |
2619 |
7419 |
9034 |
16812 |
19173 |
18953 |
21537 |
6668 |
17435 |
21922 |
41341 |
47002 |
46174 |
52131 |
Кабардино-Балкарская |
14081 |
36833 |
43310 |
48909 |
58093 |
65660 |
76056 |
15949 |
42253 |
50225 |
57012 |
67731 |
76451 |
88470 |
Карачаево-Черкесская |
5462 |
16724 |
23260 |
27470 |
35714 |
38584 |
43324 |
12404 |
36972 |
50779 |
59201 |
76277 |
81759 |
91094 |
Республика Северная Осетия - Алания |
8363 |
31182 |
43341 |
52805 |
57708 |
64081 |
74845 |
11965 |
44127 |
61230 |
74357 |
81097 |
90041 |
105104 |
Чеченская |
… |
22899 |
32344 |
48056 |
66274 |
64308 |
69676 |
… |
20038 |
27831 |
40573 |
54742 |
51981 |
55188 |
Ставропольский край |
53732 |
146569 |
181675 |
222240 |
274992 |
277251 |
316889 |
19604 |
53415 |
66136 |
80715 |
99503 |
99995 |
113923 |
Приволжский |
1036787 |
2799036 |
3513341 |
4330426 |
5324051 |
4922532 |
5660130 |
32792 |
91574 |
115728 |
143366 |
176879 |
163958 |
189071 |
Республика |
145125 |
381647 |
505206 |
590054 |
743133 |
647912 |
757570 |
35246 |
93683 |
124440 |
145544 |
183169 |
159429 |
186121 |
Республика |
11208 |
33351 |
43664 |
55069 |
65765 |
69272 |
82426 |
15115 |
46590 |
61413 |
77919 |
93512 |
98889 |
118184 |
Республика |
17553 |
44267 |
57974 |
77049 |
94058 |
90862 |
104327 |
19220 |
50983 |
67310 |
90139 |
110877 |
107903 |
124760 |
Республика |
186154 |
482759 |
605912 |
757401 |
926057 |
885064 |
1004690 |
49139 |
128227 |
161046 |
201172 |
245629 |
234206 |
265372 |
Удмуртская |
53307 |
139995 |
164849 |
205647 |
243136 |
230938 |
264464 |
33489 |
90316 |
106891 |
133905 |
158851 |
151269 |
173675 |
Чувашская |
22995 |
69392 |
93172 |
123453 |
155032 |
139910 |
152490 |
17277 |
54002 |
73147 |
97529 |
122980 |
111300 |
121682 |
Пермский край |
124142 |
327273 |
383770 |
477794 |
607363 |
539832 |
630755 |
43273 |
119654 |
141865 |
178097 |
227719 |
203364 |
238823 |
Кировская область |
35795 |
79801 |
97047 |
118155 |
151117 |
146321 |
166219 |
23166 |
55727 |
68958 |
85144 |
110128 |
107680 |
123516 |
Нижегородская |
105056 |
299724 |
376180 |
473307 |
588791 |
547223 |
646676 |
29090 |
87355 |
110663 |
140298 |
175587 |
164072 |
194945 |
Оренбургская |
76343 |
213138 |
302808 |
370881 |
430023 |
413396 |
454993 |
34585 |
101110 |
145533 |
179882 |
209770 |
202332 |
223390 |
Пензенская область |
25219 |
74363 |
88805 |
119104 |
147853 |
147185 |
158214 |
16900 |
52164 |
62720 |
84558 |
105477 |
105487 |
113970 |
Самарская область |
140407 |
401812 |
487713 |
584969 |
699296 |
584000 |
692928 |
42759 |
124575 |
151239 |
181530 |
217090 |
181298 |
215321 |
Саратовская |
63068 |
170930 |
204291 |
252867 |
321747 |
326370 |
369630 |
23315 |
65657 |
79127 |
98570 |
126086 |
128474 |
146252 |
Ульяновская |
30415 |
80584 |
101950 |
124676 |
150680 |
154247 |
174748 |
21412 |
59805 |
76475 |
94376 |
114808 |
118180 |
134828 |
Продолжение табл.4.2.1
Всего, млн. руб. |
На душу населения1), руб. |
|||||||||||||
2000 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2000 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
|
Уральский |
866133 |
3091363 |
3720616 |
4236326 |
4815668 |
4360451 |
5087786 |
69327 |
254078 |
307374 |
350767 |
398807 |
360909 |
420920 |
Курганская область |
18705 |
50246 |
68435 |
81076 |
106223 |
107915 |
115223 |
17759 |
51724 |
71739 |
86224 |
114237 |
117059 |
126106 |
Свердловская |
156077 |
475576 |
653908 |
820793 |
923551 |
825267 |
1033748 |
34215 |
108697 |
150549 |
189763 |
213922 |
191415 |
240247 |
Тюменская область |
570790 |
2215584 |
2551355 |
2758813 |
3121401 |
2870284 |
3292883 |
176918 |
673208 |
773076 |
831305 |
934230 |
852920 |
970771 |
в том числе: |
||||||||||||||
Ханты-Мансийский автономный округ - Югра |
403822 |
1399336 |
1594097 |
1728340 |
1937159 |
1778637 |
1976224 |
… |
… |
… |
… |
… |
… |
… |
Ямало-Ненецкий автономный округ |
117101 |
441722 |
546366 |
594679 |
719397 |
649640 |
771769 |
… |
… |
… |
… |
… |
… |
… |
Челябинская |
120561 |
349957 |
446918 |
575644 |
664493 |
556985 |
645932 |
33012 |
99160 |
127443 |
164798 |
190566 |
159901 |
185681 |
Сибирский |
687072 |
1951300 |
2442999 |
2990665 |
3442210 |
3391089 |
4093589 |
33682 |
99628 |
125749 |
154702 |
178421 |
175846 |
212440 |
Республика Алтай |
2738 |
8806 |
11609 |
15109 |
18701 |
19912 |
21636 |
13505 |
43592 |
57555 |
74634 |
91713 |
97112 |
105050 |
Республика Бурятия |
21575 |
74913 |
91712 |
107442 |
124738 |
121188 |
136374 |
21555 |
77313 |
94965 |
111354 |
129145 |
125173 |
140500 |
Республика Тыва |
3594 |
11663 |
15147 |
19384 |
23871 |
26922 |
30601 |
11749 |
38430 |
50052 |
63959 |
78381 |
87890 |
99442 |
Республика Хакасия |
17418 |
41727 |
53689 |
63722 |
72309 |
81020 |
93709 |
31333 |
77865 |
100828 |
119953 |
136024 |
152205 |
175975 |
Алтайский край |
46737 |
135686 |
173811 |
223563 |
259343 |
265613 |
299715 |
17661 |
53812 |
69852 |
90760 |
106020 |
109089 |
123642 |
Забайкальский край |
30025 |
69647 |
90732 |
110822 |
140302 |
148588 |
162100 |
25320 |
61741 |
81066 |
99545 |
126362 |
133974 |
146357 |
Красноярский край |
214663 |
439737 |
585882 |
734155 |
737951 |
749195 |
1050158 |
71281 |
152389 |
205042 |
258394 |
260318 |
264479 |
370952 |
Иркутская область |
103014 |
258096 |
330834 |
402655 |
438852 |
458775 |
539246 |
39115 |
102904 |
133414 |
163588 |
178988 |
187689 |
221531 |
Кемеровская |
88728 |
295378 |
342211 |
437790 |
575902 |
512408 |
622513 |
30048 |
104765 |
122394 |
157302 |
207286 |
184674 |
224969 |
Новосибирская |
72013 |
235382 |
296064 |
365531 |
453575 |
425400 |
482027 |
26472 |
88476 |
111679 |
138199 |
171430 |
160210 |
180939 |
Омская область |
46028 |
220686 |
262507 |
296005 |
347760 |
336260 |
371218 |
21643 |
108971 |
130614 |
148129 |
174710 |
169328 |
187458 |
Томская область |
40539 |
159579 |
188801 |
214487 |
248906 |
245808 |
284292 |
38386 |
155365 |
184434 |
209320 |
241911 |
237293 |
272208 |
Дальневосточный |
308802 |
826420 |
999073 |
1277126 |
1534868 |
1730520 |
2106914 |
44932 |
127161 |
155389 |
200069 |
241574 |
273411 |
334306 |
Республика Саха |
81960 |
183027 |
206845 |
242657 |
309518 |
328202 |
384726 |
85376 |
191896 |
216536 |
253424 |
322922 |
342520 |
401468 |
Камчатский край |
18141 |
43974 |
56120 |
66077 |
77854 |
94643 |
101677 |
49109 |
129241 |
168173 |
200610 |
238405 |
291954 |
315364 |
Приморский край |
62089 |
186623 |
215934 |
259041 |
316582 |
368997 |
464325 |
29140 |
92504 |
108099 |
130632 |
160417 |
187556 |
236978 |
Хабаровский край |
64795 |
161194 |
194260 |
231293 |
269178 |
276895 |
351261 |
44171 |
116258 |
141995 |
170398 |
198952 |
205081 |
260956 |
Амурская область |
26315 |
76861 |
95091 |
111761 |
131564 |
151119 |
179509 |
28317 |
88597 |
111116 |
131888 |
156330 |
180572 |
215812 |
Магаданская |
13010 |
27168 |
31203 |
35314 |
42054 |
47896 |
58174 |
65705 |
157799 |
185018 |
213450 |
258848 |
299404 |
368734 |
Сахалинская |
34777 |
121014 |
166105 |
286273 |
333582 |
392380 |
492730 |
61596 |
230298 |
321109 |
559774 |
657783 |
779943 |
987418 |
Еврейская |
3784 |
14204 |
17977 |
23726 |
23977 |
25320 |
32538 |
19485 |
77319 |
99578 |
132505 |
134378 |
142388 |
183930 |
Чукотский |
3931 |
12355 |
15538 |
20984 |
30559 |
45068 |
41974 |
65963 |
237135 |
295107 |
396907 |
582270 |
872422 |
826865 |
Таблица 4.2.2. Численность персонала, занятого исследованиями и разработками, по регионам РФ (человек)
2000 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Российская Федерация |
887729 |
813207 |
807066 |
801135 |
761252 |
742433 |
736540 |
735273 |
Центральный федеральный округ |
455985 |
408330 |
411958 |
415522 |
396272 |
385392 |
381795 |
380363 |
Белгородская область |
1953 |
1289 |
1297 |
1314 |
1189 |
1185 |
1189 |
1198 |
Брянская область |
2611 |
1927 |
1770 |
1950 |
2010 |
1352 |
790 |
1172 |
Владимирская область |
9499 |
7913 |
7640 |
7453 |
7075 |
6638 |
4871 |
5131 |
Воронежская область |
13140 |
13806 |
14144 |
14984 |
14651 |
14677 |
13184 |
14106 |
Ивановская область |
1557 |
1105 |
918 |
892 |
732 |
774 |
749 |
644 |
Калужская область |
11881 |
10413 |
10708 |
10920 |
10386 |
10374 |
10091 |
10422 |
Костромская область |
305 |
147 |
139 |
137 |
146 |
134 |
116 |
109 |
Курская область |
2016 |
1571 |
3469 |
3377 |
3185 |
2955 |
2944 |
3128 |
Липецкая область |
547 |
362 |
417 |
352 |
353 |
369 |
323 |
326 |
Московская область |
100601 |
88681 |
91062 |
88114 |
84375 |
83653 |
84574 |
86130 |
Орловская область |
1900 |
920 |
1082 |
1006 |
936 |
844 |
797 |
844 |
Рязанская область |
3637 |
3311 |
3461 |
3584 |
3555 |
3064 |
2373 |
2265 |
Смоленская область |
1102 |
944 |
1170 |
1094 |
1031 |
964 |
873 |
760 |
Тамбовская область |
2933 |
2800 |
2285 |
2282 |
2038 |
1964 |
1665 |
1807 |
Тверская область |
5978 |
5499 |
5430 |
5340 |
5505 |
5089 |
4851 |
4625 |
Тульская область |
10241 |
9959 |
10359 |
7544 |
5754 |
5521 |
4992 |
3759 |
Ярославская область |
9259 |
6608 |
6660 |
7190 |
6739 |
6358 |
6187 |
6311 |
г. Москва |
276825 |
251075 |
249947 |
257989 |
246612 |
239477 |
241226 |
237626 |
Северо-Западный |
116812 |
104752 |
103635 |
103864 |
99556 |
97633 |
95826 |
97221 |
Республика Карелия |
1307 |
935 |
867 |
945 |
951 |
907 |
934 |
978 |
Республика Коми |
2170 |
2047 |
2049 |
2089 |
2105 |
1889 |
1806 |
1748 |
Архангельская область |
1316 |
1496 |
3065 |
3011 |
2971 |
1473 |
1148 |
1064 |
в том числе Ненецкий |
22 |
24 |
24 |
31 |
43 |
81 |
75 |
58 |
Вологодская область |
424 |
464 |
561 |
469 |
483 |
466 |
482 |
410 |
Калининградская область |
2533 |
2075 |
2023 |
1961 |
1897 |
1799 |
1859 |
1990 |
Ленинградская область |
6246 |
6388 |
6422 |
6467 |
6374 |
6463 |
6477 |
6431 |
Мурманская область |
2765 |
2345 |
2195 |
2102 |
2071 |
2057 |
2097 |
2102 |
Новгородская область |
1253 |
861 |
876 |
849 |
820 |
873 |
892 |
982 |
Псковская область |
427 |
280 |
287 |
262 |
230 |
276 |
318 |
516 |
г. Санкт-Петербург |
98371 |
87861 |
85290 |
85709 |
81654 |
81430 |
79813 |
81000 |
Продолжение табл.4.2.2
2000 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Южный федеральный округ |
31752 |
28875 |
29290 |
30458 |
27492 |
27695 |
28109 |
27738 |
Республика Адыгея |
168 |
163 |
361 |
361 |
320 |
327 |
330 |
357 |
Республика Калмыкия |
205 |
221 |
227 |
217 |
214 |
199 |
203 |
190 |
Краснодарский край |
7332 |
7000 |
7324 |
6997 |
6452 |
6379 |
6256 |
6059 |
Астраханская область |
1669 |
1621 |
1444 |
1859 |
1047 |
942 |
917 |
966 |
Волгоградская область |
4797 |
4157 |
4017 |
4553 |
3657 |
3965 |
4001 |
3988 |
Ростовская область |
17581 |
15713 |
15917 |
16471 |
15802 |
15883 |
16402 |
16178 |
Северо-Кавказский |
5670 |
5655 |
5920 |
6256 |
6141 |
6051 |
6053 |
8585 |
Республика Дагестан |
1776 |
1827 |
1882 |
1910 |
1778 |
1658 |
1642 |
1628 |
Республика Ингушетия |
- |
23 |
26 |
87 |
83 |
95 |
95 |
112 |
Кабардино-Балкарская Республика |
732 |
682 |
730 |
725 |
678 |
727 |
677 |
704 |
Карачаево-Черкесская Республика |
592 |
569 |
546 |
522 |
507 |
497 |
491 |
506 |
Республика Северная Осетия - Алания |
642 |
549 |
572 |
684 |
686 |
608 |
643 |
685 |
Чеченская Республика |
… |
271 |
276 |
351 |
333 |
361 |
412 |
639 |
Ставропольский край |
1928 |
1734 |
1888 |
1977 |
2076 |
2105 |
2093 |
4311 |
Приволжский федеральный округ |
150046 |
140592 |
134188 |
126903 |
120644 |
117000 |
116285 |
111579 |
Республика Башкортостан |
10290 |
8415 |
8047 |
8281 |
8005 |
7543 |
7655 |
8052 |
Республика Марий Эл |
1835 |
1011 |
520 |
475 |
201 |
206 |
170 |
190 |
Республика Мордовия |
1393 |
1100 |
1089 |
1068 |
1316 |
1204 |
901 |
926 |
Республика Татарстан |
16243 |
14352 |
14227 |
13289 |
12940 |
12783 |
13175 |
13258 |
Удмуртская Республика |
2506 |
2102 |
1972 |
1594 |
1692 |
1438 |
1525 |
2000 |
Чувашская Республика |
1809 |
1406 |
1069 |
745 |
1158 |
1008 |
942 |
943 |
Пермский край |
12729 |
13229 |
11506 |
10510 |
9740 |
9877 |
9739 |
9899 |
Кировская область |
2009 |
2038 |
1937 |
2044 |
1973 |
1815 |
1615 |
1707 |
Нижегородская область |
48251 |
49797 |
46989 |
44400 |
42832 |
40909 |
40636 |
39902 |
Оренбургская область |
1337 |
919 |
949 |
1039 |
1065 |
1048 |
947 |
914 |
Пензенская область |
7858 |
7103 |
7119 |
7194 |
6611 |
6082 |
6220 |
6413 |
Самарская область |
25857 |
24506 |
24856 |
23390 |
20462 |
20627 |
20189 |
15666 |
Саратовская область |
9610 |
6677 |
6317 |
5811 |
5414 |
5099 |
4982 |
4828 |
Ульяновская область |
8319 |
7937 |
7591 |
7063 |
7235 |
7361 |
7589 |
6881 |
Уральский федеральный округ |
50803 |
49670 |
49377 |
47562 |
43695 |
42276 |
42672 |
43586 |
Курганская область |
1927 |
1267 |
945 |
924 |
828 |
717 |
644 |
706 |
Свердловская область |
27565 |
25076 |
24755 |
23859 |
21357 |
20390 |
20379 |
20906 |
Тюменская область |
4935 |
5488 |
6147 |
7605 |
6883 |
6923 |
7160 |
6750 |
в том числе: |
||||||||
Ханты-Мансийский автономный |
1085 |
2269 |
2192 |
3266 |
2634 |
2641 |
1958 |
1876 |
Ямало-Ненецкий автономный округ |
209 |
98 |
111 |
100 |
85 |
4 |
16 |
46 |
Челябинская область |
16376 |
17839 |
17530 |
15174 |
14627 |
14246 |
14489 |
15224 |
Сибирский федеральный округ |
62477 |
60986 |
58647 |
56427 |
53956 |
53463 |
53024 |
52794 |
Республика Алтай |
90 |
111 |
132 |
168 |
173 |
156 |
158 |
172 |
Республика Бурятия |
1209 |
1231 |
1003 |
985 |
954 |
969 |
952 |
1144 |
Республика Тыва |
285 |
327 |
332 |
416 |
414 |
425 |
416 |
415 |
Республика Хакасия |
128 |
282 |
205 |
198 |
193 |
166 |
149 |
148 |
Алтайский край |
3427 |
2732 |
2775 |
2731 |
2267 |
2054 |
1955 |
2182 |
Забайкальский край |
680 |
509 |
608 |
520 |
512 |
335 |
322 |
313 |
Красноярский край |
7196 |
7102 |
6846 |
6685 |
6287 |
6299 |
6475 |
6748 |
Иркутская область |
5295 |
4829 |
4557 |
4910 |
4897 |
4919 |
4912 |
5075 |
Кемеровская область |
2090 |
1476 |
1511 |
1496 |
1327 |
1336 |
1258 |
1231 |
Новосибирская область |
25168 |
24791 |
23438 |
22561 |
21597 |
21622 |
21615 |
21569 |
Омская область |
8872 |
9367 |
8983 |
7246 |
6961 |
6622 |
6125 |
5002 |
Томская область |
8037 |
8229 |
8257 |
8511 |
8374 |
8560 |
8687 |
8795 |
Дальневосточный |
14184 |
14347 |
14051 |
14143 |
13496 |
12923 |
12776 |
13407 |
Республика Саха (Якутия) |
2662 |
2573 |
2450 |
2537 |
2359 |
2258 |
2249 |
2379 |
Камчатский край |
993 |
1293 |
1333 |
1232 |
1193 |
1207 |
1154 |
1152 |
Приморский край |
6225 |
6471 |
6458 |
6296 |
5965 |
5548 |
5493 |
5590 |
Хабаровский край |
1683 |
1536 |
1390 |
1737 |
1700 |
1635 |
1500 |
1627 |
Амурская область |
1013 |
890 |
807 |
778 |
774 |
819 |
830 |
824 |
Магаданская область |
567 |
599 |
617 |
603 |
575 |
566 |
572 |
638 |
Сахалинская область |
912 |
865 |
883 |
858 |
834 |
794 |
901 |
869 |
Еврейская автономная область |
71 |
72 |
74 |
65 |
60 |
60 |
60 |
309 |
Чукотский автономный округ |
58 |
48 |
39 |
37 |
36 |
36 |
17 |
19 |
По данным таблиц 4.2.1 и 4.2.2 для регионов Центрального, Северо-западного и Приволжского округов составим корреляционную таблицу 4.2.3 и корреляционное поле, приведённое на рис.4.2.1. Средние значения ВВП, вычисленные по градациям аргумента таблицы 4.2.3, прорисованы на рис. 4.2.1 красным цветом.
Таблица 4.2.3. - Корреляционная таблица
ВВП Кол. |
До 100 |
До 150 |
До 200 |
До 250 |
До 300 |
До 350 |
До 400 |
До 800 |
Кол. |
Ср. кол. |
Ср. ВВП |
До 500 |
- |
3 |
- |
2 |
- |
- |
- |
- |
5 |
281.8 |
161.4 |
До 1000 |
1 |
4 |
3 |
1 |
- |
- |
- |
- |
9 |
874.3 |
150.3 |
До 2000 |
- |
2 |
1 |
1 |
2 |
- |
1 |
- |
7 |
1523 |
224.1 |
До 4000 |
- |
1 |
1 |
- |
1 |
- |
- |
- |
3 |
2471 |
204.7 |
До 8000 |
- |
3 |
5 |
- |
1 |
- |
- |
- |
9 |
5977 |
169.1 |
До 16000 |
- |
1 |
1 |
1 |
1 |
- |
- |
- |
4 |
11547 |
206.8 |
До 32000 |
- |
- |
- |
1 |
- |
- |
- |
- |
1 |
20189 |
215.0 |
До 64000 |
- |
- |
1 |
- |
- |
- |
- |
- |
1 |
40636 |
195.0 |
До 128000 |
- |
- |
- |
- |
1 |
1 |
- |
- |
2 |
82194 |
299.0 |
До 256000 |
- |
- |
- |
- |
- |
- |
- |
1 |
1 |
241226 |
733.0 |
Итого: 42 региона
Центрального, Северо-западного и Приволжского регионов
350 •
ВВП на душу населения в тыс. руб. •
300
•
• •
250 • • •
•
•
200 • • •
• • •
• • •
150 • • • • •
• •
• • •• •• • • •
100• • •
0.5 • 1.0 2.0 4.0 8.0 16.0 32.0 64.0 128
Количество исследователей и разработчиков в тысячах человек
Рис.4.2.1. Корреляционное поле зависимости объёма ВВП на душу
населения от количества разработчиков и исследователей
Республика Коми при количестве разработчиков и исследователей 1748 имеет ВВП 389064 рубля на душу населения, что вводит некоторую флуктуациюв рис.4.2.1.
По рис.4.2.1 и таблице 4.2.3 можно сделать вывод о наличии общей тенденции повышения ВВП при увеличении количества исследователей и разработчиков. Корреляционная зависимость между этими признаками имеет нелинейный колебательный характер. Можно надеяться, что при увеличении количества анализируемых регионов корреляционная зависимость будет приближаться к линейной и пропадёт выявленный колебательный процесс.
4.3. Выбор метода корреляционного анализа
Из 14 используемых на практике методов установления наличия связи между случайными величинами [10] сформулируем рекомендации по их вы-бору в зависимости от вида переменных, которые могут быть количествен-ными, или качественными, ранжируемыми, или неранжируемыми, ограни-ченными по количеству градаций, или неограниченными, подчиняющимися нормальному закону, или произвольному закону. В соответствии с выше-сказанными условиями составим таблицу методов 4.3.1.
Таблица 4.3.1. Основные методы корреляционного анализа.
Коэф. оценки |
Фактор |
Отклик |
Ранжиру- емость |
Нормаль- ность |
Линей- ность |
Наличие кол. показ.сущест. |
Средства реализации |
1.Биссериаль- ный |
Колич. |
Качест. |
2 град. по отклику |
Не треб. |
Не треб. |
Не имеется |
|
2.Фехнера |
Колич. |
Колич. |
Не треб. |
Не треб. |
Не треб. |
Не имеется |
|
3.Ранг. Спир- мена |
Колич. и качест. |
Колич. и качест. |
Треб.Кол. не огран. |
Требуется |
Не треб. |
Имеется |
|
4.Ранг. Кен- дала |
Колич. и качест. |
Колич. и качест. |
Треб.Кол. не огран. |
Не треб. |
Не треб. |
Не имеется |
|
5.Ассоциации |
Качест. |
Качест. |
Треб. 2 градации |
Не треб. |
Не треб. |
Не имеется |
|
6.Континген- тности |
Качест. |
Качест. |
Треб. 2 градации |
Не треб. |
Не треб. |
Не имеется |
|
7.Коэф. лине-йной коррел. |
Колич. |
Колич. |
Не треб. |
Требуется |
Требу- ется |
Имеется |
|
8.Корреляци- онное отнош. |
Колич. |
Колич. |
Не треб. |
Не треб. |
Не треб. |
Не имеется |
|
9.Пирсона- Чупрова |
Качест. |
Качест. |
Треб. 2 градации |
Не треб. |
Не треб. |
Имеется |
|
10.Пирсона- Чупрова 1 |
Качест. |
Качест. |
Треб. 2 градации |
Не треб. |
Не треб. |
Имеется |
|
11.Пирсона- Чупрова 2 |
Качест. |
Качест. |
Треб. 2 градации |
Не треб. |
Не треб. |
Имеется |
|
12.Конкорда-ции |
Качест. |
Качест. |
Треб. |
Не треб. |
Не треб. |
Имеется |
|
13.Множеств.детерминаци |
Колич. |
Колич. |
Не треб. |
Треб. |
Треб. |
Имеется |
|
14.Множеств. корреляции |
Колич. |
Колич. |
Не треб. |
Треб. |
Треб. |
Имеется |
Существенность вычисленных показателей корреляционной связи можно оценить по шкале Чеддока, приведённой в таблице 4.3.2.
Таблица 4.3.2. Шкала Чеддока
4.4. Биссериальный коэффициент корреляции
Биссериальный коэффициент корреляции позволяет изучить связь меж-ду качественным результативным (откликом) и количественным факторным признаком. Для его вычисления исследуемые объекты разбиваются на две группы. Биссериальный коэффициент корреляции вычисляется по формуле:
(4.4.1)
где среднее значение отклика в первой группе;
среднее значение отклика во второй группе;
p1 - удельный вес (вероятность) первой группы в совокупности;
p2 - удельный вес (вероятность) второй группы в совокупности;
σy среднее квадратическое отклонение отклика;
Z1 - табличное значение Z-распределения в зависимости от p1.
Значение Zi для рi можно взять из соответсвующей таблицы, либо вычислить по формуле:
(4.4.2)
Если вычисленное значение r ≥0,3 то корреляционная связь считается существенной.
Пример 4.4.1
Требуется оценить связь между семейным положением женщины качественным признаком (откликом) и уровнем оплаты её труда количественным признаком (фактором). Исходные статистические данные обследования представлены в виде таблицы 4.4.1.
Таблица 4.4.1. Исходные данные для примера 4.4.1
Семейное |
Уровень |
оплаты |
труда |
в тыс. руб. |
Всего |
положение |
До 8 |
8 - 16 |
16 -24 |
Более 24 |
человек |
Среднее значение |
7 |
12 |
20 |
25 |
|
Замужем |
98 |
86 |
42 |
24 |
250 |
Не замужем |
37 |
46 |
78 |
89 |
250 |
Итого |
135 |
132 |
120 |
113 |
500 |
Проведём вычисления.
Средняя зарплата замужних женщин:
Средняя зарплата незамужних женщин:
Средняя зарплата замужних и незамужних женщин:
Стандартное отклонение заработной платы:
Вероятность учёта замужних женщин:
Вероятность учёта незамужних женщин:
Значение Z-распределения:
Биссериальный коэффициент корреляции:
Так как r=0,38>0,3 делаем заключение, что связь между семейным положением женщин и их заработанной платой имеется, но превышение r над 0,3 сравнительно невелико, то её следует отнести к умеренной.
4.5. Непараметрический показатель связи коэффициент Фехнера
Простейшим непараметрическим показателем связи является коэффициент Фехнера. Коэффициент Фехнера не требует нормальности распределений случайных величин. В основе его вычисления лежит принцип сопоставления отклонений признаков от своих средних значений. Его применение основано на допущении, что отклонения отклика от своей средней величины должно соответствовать отклонению фактора от своей средней величины. Коэффициент Фехнера вычисляется по формуле:
(4.5.1)
где С число совпадений знаков отклонений;
Н число несовпадений знаков отклонений.
Коэффициент Фехнера может принимать значения от -1 до +1. При Kf=±1
связь между признаками х и у функциональная (не случайная). При Kf=0 связь между признаками х и у отсутствует. Промежуточные значения Kf характеризуют степень связи между между признаками х и у.
Пример 4.5.1. Оценить связь объёмов продаж с затратами на рекламу по данным, приведённым в таблице 4.5.1. Средние значения признаков вычислены по следующим формулам:
(4.5.2)
Результаты вычислений сведены в таблицу 4.5.1.
Таблица 4.5.1. Исходные данные и вычисление коэффициента Фехнера
Календарный интервал - i |
Затраты на рекламу - xi |
Объём продаж - yi |
Совпадение отклонений + |
||
1 |
194 |
60.7 |
2560 |
233.9 |
+ |
2 |
186 |
52.7 |
1945 |
-381.1 |
- |
3 |
52 |
-81.3 |
1450 |
-876.1 |
+ |
4 |
78 |
-55.3 |
1120 |
-1206.1 |
+ |
5 |
145 |
11.7 |
2389 |
62.9 |
+ |
6 |
178 |
44.7 |
4590 |
2263.9 |
+ |
7 |
130 |
-3.3 |
3460 |
1133.9 |
- |
8 |
189 |
55,7 |
2378 |
51.9 |
+ |
9 |
89 |
-44.3 |
1580 |
-746.1 |
+ |
10 |
92 |
-41.3 |
1789 |
-537.1 |
+ |
Итого: |
133.3 |
2326.1 |
8 совпадений; 2 несовпадения |
По формуле (4.5.1) вычислим коэффициент Фехнера:
Связь между объёмом продаж и затратами на рекламу можно считать прямой и умеренной.
Недостатком коэффициента Фехнера является равенство различных по абсолютной величине отклонений физических значений признаков от средних значений без учёта величины разницы.
4.6. Коэффициенты корреляции рангов
Коэффициенты корреляции рангов можно вычислять как между количественными, так и между качественными признаками при условии, что их можно ранжировать. К ним относятся коэффициенты корреляции рангов Спирмена и Кендалла.
Коэффициент корреляции рангов Спирмена
Для определения тесноты связи как между количественными, так и между качественными признаками, при условии, что они представляют однородные объекты и могут быть ранжированы по одному и тому же принципу можно использовать коэффициент корреляции рангов Спирмена, вычисляемый по формуле:
(4.6.1)
где di разность между величинами рангов аргумента (фактора) и функции (отклика) i го варианта;
n - количество вариантов.
Если количество вариантов сравнительно велико и их распределение подчиняется нормальному закону, то значимость коэффициента рангов Спирмена можно оценить по критерию Стьюдента по формуле:
(4.6.2)
По статистическим таблицам находится критическое значение критерия Стьюдента tкрит для рекомендуемого уровня значимости α=0,05 при количестве степеней свободы k=n-2. Если tвыч ≥ tкрит то связь между переменными считается существенной. При сравнительно небольших выборках для установления существенности связи между переменными используют специальную таблицу критических значений коэффициента корреляции рангов Спирмена [10].
Пример 4.6.1
Для примера применения коэффициента корреляции рангов Спирмена используем значения затрат на рекламу и объёма продаж, представленные в таблице 4.5.1, введём по ним ранги по возрастанию их значений. Результаты ранжирования представим в таблице 4.6.1.
Таблица 4.6.1. Значения объёмов продаж и затрат на рекламу
Календарный нтервал - i |
Затраты на рекламу - xi |
Ранг - Rxi |
Объём продаж - yi |
Ранг - Ryi |
di= Rxi - Ryi |
di2 |
||||||
1 |
194 |
10 |
2560 |
8 |
2 |
4 |
||||||
2 |
186 |
8 |
1945 |
5 |
3 |
9 |
||||||
3 |
52 |
1 |
1450 |
2 |
-1 |
1 |
||||||
4 |
78 |
2 |
1120 |
1 |
1 |
1 |
||||||
5 |
145 |
6 |
2389 |
7 |
-1 |
1 |
||||||
6 |
178 |
7 |
4590 |
10 |
-3 |
9 |
||||||
7 |
130 |
5 |
3460 |
9 |
-4 |
16 |
||||||
8 |
189 |
9 |
2378 |
6 |
3 |
9 |
||||||
9 |
89 |
3 |
1580 |
3 |
0 |
0 |
||||||
10 |
92 |
4 |
1789 |
4 |
0 |
0 |
Так как количество вариантов п=10 сравнительно не велико, то для оценки существенности связи воспользуемся специальной статистической таблицей [10], по которой найдём, что при п=10 и рекомендуемом уровне значимости α=0,05 критическое значение ρкрит=0,634. Так как вычисленное значение ρвыч превышает критическое значение ρкрит , то связь между переменными при принятых условиях признаем существенной. Если, например, уменьшить уровень значимости до α=0,02 то критическое значение ρкрит=0,733. Так как вычисленное значение ρвыч при принятых условиях не превышает критическое значение ρкрит, то связь между переменными при принятых условиях признаем несущественной.
При допущении о нормальности распределения переменных вычислим критерий Стьюдента:
По статистическим таблицам найдём критическое значение критерия Стьюдента для рекомендуемого значения уровня значимости α=0,05 и количестве степеней свободы п-2: tкрит=2,31. Так как вычисленное значение критерия Стьюдента превышает критическое, то будем считать связь между переменными существенной.
Коэффициент корреляции рангов Кендалла
Для определения тесноты связи как между количественными, так и между качественными признаками, характеризующие однородные объекты и ранжированные по одному и тому же принципу можно использовать коэффициент корреляции рангов Кендалла, вычисляемый по формуле:
(4.6.3)
где Рi количество случаев для i-го варианта (календарного интервала),
ранг которых превышает i-е значение;
Qi - количество случаев для i-го варианта (календарного интервала),
ранг которых не превышает i-е значение;
n - количество вариантов.
Существенность коэффициента корреляции рангов Кендалла, при условии нормальности распределений случайных величин, проверяют по формуле:
(4.6.4)
Критическое значение критерия Стьюдента находится по статистическим таблицам [10] для рекомендуемого значения уровня значимости α=0,05 и количества степеней свободы п-2.
Пример 4.6.2
Подсчитаем коэффициент корреляции рангов Кендалла для примера 4.5.1. Проведём ранжирование вариантов по рангу Rxi по данным таблицы 4.5.1 и вместе с проведёнными расчётами составим таблицу 4.6.2.
Таблица 4.6.2. Значения объёмов продаж и затрат на рекламу
Календарный нтервал - i |
Затраты на рекламу - xi |
Ранг - Rxi |
Объём продаж - yi |
Ранг - Ryi |
Pi |
Qi |
Pi -Qi |
3 |
52 |
1 |
1450 |
2 |
8 |
1 |
8 |
4 |
78 |
2 |
1120 |
1 |
8 |
0 |
8 |
9 |
89 |
3 |
1580 |
3 |
7 |
0 |
7 |
10 |
92 |
4 |
1789 |
4 |
6 |
0 |
6 |
7 |
130 |
5 |
3460 |
9 |
1 |
4 |
-3 |
5 |
145 |
6 |
2389 |
7 |
2 |
2 |
0 |
6 |
178 |
7 |
4590 |
10 |
0 |
3 |
-3 |
2 |
186 |
8 |
1945 |
5 |
2 |
0 |
2 |
8 |
189 |
9 |
2378 |
6 |
1 |
0 |
1 |
1 |
194 |
10 |
2560 |
8 |
0 |
0 |
0 |
Вычислим коэффициент корреляции рангов:
Вычисленное значение положительно и превышает рекомендуемое значение 0,50, что указывает на наличие существенной зависимости между переменными.
При допущении о нормальности распределений исходных данных существенность коэффициента корреляции рангов Кендалла проверим по формуле (4.6.4):
Критическое значение критерия Стьюдента находится по статистическим таблицам для рекомендуемого значения уровня значимости α=0,05 и количества степеней свободы п-2 [10]: tкрит=2,31.
Так как τвыч = τкрит то делаем заключение о наличии существенной связи между переменными.
4.7. Коэффициенты ассоциации и контингенции
Коэффициенты ассоциации и контингенции можно использовать для оценки тесноты связи двух качественных признаков, каждый из которых состоит только из двух градаций. Для проведения расчётов строится таблица сопряжённости 4.7.1.
Таблица 4.7.1. Таблица сопряжённости двух признаков
1-е значение |
2-е значение |
Сумма |
|
1-й признак |
a |
b |
a+b |
2-й признак |
c |
d |
c+d |
Сумма |
a+c |
b+d |
a+b+c+d |
По таблице сопряжённости вычисляются коэффициент ассоциации:
(4.7.1)
и коэффициент контингенции:
(4.7.2)
Связь считается существенной, если Ka ≥0.5 и Kk ≥0.3. (4.7.3)
Пример 4.7.2. Установить тесноту связи между наличием вклада и семейным положением клиентов сбербанка по результатам таблицы 4.7.2.
Таблица 4.7.2. Таблица сопряжённости наличия вклада и семейного
положения клиентов сбербанка
Семейное положение |
Число клиентов со сбережениями |
Число клиентов со сбережениями |
Сумма |
Одинокие |
250 |
150 |
400 |
Семейные |
800 |
450 |
1250 |
Сумма |
1050 |
600 |
1650 |
По формулам (4.7.1), (4.7.2) вычислим коэффициенты ассоциации и контингенции:
Ввиду того, что вычисленные значения коэффициентов ассоциации и контингенции не удовлетворяют условию (4.7.3) делаем заключение, что наличие вкладов в сбербанке не зависит от семейного положения клиентов.
4.8. Коэффициенты оценки связи качественных
признаков, представленных несколькими градациями
Если каждый из двух качественных признаков состоит из более чем двух градаций, то для определения тесноты связи возможно применение коэффициента сопряжённости Пирсона-Чупрова и двух его модификаций. Коэффициент сопряжённости Пирсона-Чупрова вычисляется по формулам:
(4.8.1)
(4.8.2)
где φ2 показатель взаимной сопряжённости;
К1 число градаций первого признака:
К2 - число градаций второго признака.
Коэффициент взаимной сопряжённости вычисляется по формуле:
(4.8.3)
где nij число сотрудников по i-ой градации первого признака и j-ой
градации второго признака;
ni - общее количество сотрудников по i-ой градации первого признака;
nj - общее количество сотрудников по j-ой градации второго признака.
Пример 4.8.1. Требуется проанализировать зависимость распределения сотрудников строительной фирмы по должностям (второй признак) от их уровня образования (первый признак). Исходные данные представлены в таблице 4.8.1.
Должность Образование |
Руководители |
Служащие |
Рабочие |
Итого |
Высшее |
10 |
30 |
5 |
45 |
Неполн. высшее |
7 |
25 |
10 |
42 |
Среднее специальное |
2 |
15 |
50 |
67 |
Среднее общее |
1 |
10 |
25 |
36 |
Итого |
20 |
80 |
90 |
190 |
По (4.8.3) по данным таблицы 4.8.1 вычислим показатель взаимной сопряжённости:
φ2= (102/20+302/80+52/90)/45+(72/20+252/80+102/90)/42+
+(22/20+152/80+502/90)/67+(12/20+102/80+252/90)/36-1=0.326.
Вычислим коэффициенты взаимной сопряжённости:
По значения вычисленных коэффициентов сопряжённости определяем наличие связи, которую следует считать умеренной.
На практике используются две модификации коэффициента взаимной сопряжённости Чупрова. Первая из них требует вычисления по формуле:
(4.8.4)
где χ2 критерий Пирсона;
n - общее количество градаций по первому и второму признакам.
Критерий Пирсона вычисляется по формуле:
(4.8.5)
По второй модификации коэффициент сопряжённости вычисляется по формуле:
(4.8.6)
Продемонстрируем применение модифицированных коэффициентов сопряжённости на рассмотренном ранее примере по данным таблицы 4.8.1.
Вычислим значение критерия Пирсона:
Вычислим коэффициенты сопряжённости Чупрова по первой и второй модификации:
По значения вычисленных коэффициентов сопряжённости по первой и второй модификации определяем наличие связи, которую следует считать средней.
4.9. Коэффициенты корреляции количественных признаков
В качестве количественной меры оценки взаимосвязи между случайными величинами используются коэффициент линейной корреляции и эмпирическое корреляционное отношение. Оба показателя введены Пирсоном.
Коэффициент линейной корреляции используется в случае нормальности распределений случайных величин х и у и наличия линейной зависимости между ними. Он вычисляется по n экспериментальным данным по следующей формуле:
(4.9.1)
В формуле (4.9.1) оценки математических ожиданий переменных х, у и их произведения вычисляются по формулам:
(4.9.2)
Оценки вторых начальных моментов требуются для вычисления средних квадратических отклонений. Для этого используются следующие формулы:
(4.9.3)
(4.9.4)
Если коэффициент линейной корреляции близок к 1, то корреляционная связь между переменными положительная, близкая к линейной (рис.4.9.1). Если коэффициент линейной корреляции близок к -1, то корреляционная связь между переменными отрицательная, близкая к линейной (рис.4.9.2). Если коэффициент линейной корреляции близок к 0, то между переменными имеется слабая корреляционная связь (рис.4.9.3). Для независимых переменных коэффициент линейной корреляции равен нулю.
Рис.4.9.1. Графики зависимости между случайными переменными при
различных значениях коэффициента линейной корреляции
Оценить существенность коэффициента линейной корреляции между случайными переменными по критерию Стьюдента можно при условии, что распределения этих случайных величин подчиняется нормальному закону и что они имеют совместное двумерное нормальное распределение.
Коэффициент линейной корреляции является случайной величиной, и поэтому для него может быть вычислена стандартная ошибка
. (4.9.5)
По статистическим таблицам находим критическое значение коэффициента линейной корреляции.
. (4.9.6)
В случае, если значение коэффициента линейной корреляции, вычисленное по (4.9.1), по абсолютной величине не меньше 0,8, то можно ожидать наличие между переменными линейной зависимости и в уравнения регрессии вводить сами факторы в первой степени. Если значение коэффициента линейной корреляции по абсолютной величине лежит в диапазоне от критического значения до 0,8, то в уравнения регрессии рекомендуется вводить сравнительно несложные функции от факторов. Рекомендуется использовать следующие функции от факторов xi; : для увеличения масштаба фактора х относительно результативного показателя эффективности у; - для уменьшения масштаба фактора х относительно результативного показателя эффективности у; - для отображения обратной связи между фактором х и результативным показателем эффективности у. Если значение коэффициента линейной корреляции по абсолютному значению меньше критического, то такие факторы рекомендуется не включать в уравнения регрессии.
Эмпирическое корреляционное отношение вычисляется по формуле
(4.9.7)
где δ* оценка межгруппового среднего квадратического отклонения;
σу* оценка среднего квадратического отклонения результативного
признака.
. (4.9.8)
Эмпирический коэффициент детерминации в долях от 1 показывает на сколько изменение результативного признака объясняется изменением факторного признака, Он вычисляется по формуле:
(4.9.9)
Пример 4.9.1
Вычислим коэффициент линейной корреляции и эмпирическое корреля-ционное отношение для оценки тесноты связи между оборотным капиталом предприятий и их прибылью, Статистические данные по указанным признакам для 25 предприятий приведены в таблице 4.9.1.
Таблица 4.9.1. Исходные данные для примера 4.9.1
№ предприятия - i |
Оборотный капитал - хi в тыс. руб. |
Прибыль - yi в тыс. руб. |
1 |
634 |
127 |
2 |
536 |
86 |
3 |
726 |
184 |
4 |
510 |
82 |
5 |
656 |
137 |
6 |
547 |
110 |
7 |
809 |
193 |
8 |
732 |
190 |
9 |
807 |
184 |
10 |
766 |
189 |
11 |
664 |
135 |
12 |
751 |
175 |
13 |
556 |
115 |
14 |
836 |
210 |
15 |
739 |
169 |
16 |
846 |
215 |
17 |
934 |
264 |
18 |
927 |
241 |
19 |
851 |
235 |
20 |
678 |
167 |
21 |
832 |
275 |
22 |
748 |
157 |
23 |
717 |
164 |
24 |
944 |
314 |
25 |
959 |
286 |
Для наглядности вычислений добавим в таблицу 4.9.1 ещё три вспомогательных столбца со значениями: хi2, yi2, xi yi и поместим полученные результаты в таблицу 4.9.2.
Таблица 4.9.2. Предварительные расчёты для примера 4.9.1
Номер предпри- ятия - i |
Оборотный капитал- хi |
Прибыль - yi |
xi2 |
yi2 |
xi yi |
1 |
634 |
127 |
401956 |
16129 |
80518 |
2 |
536 |
86 |
287296 |
7396 |
46096 |
3 |
726 |
184 |
527076 |
33856 |
133584 |
4 |
510 |
82 |
260100 |
6724 |
41820 |
5 |
656 |
137 |
430336 |
18769 |
89872 |
6 |
547 |
110 |
299209 |
12100 |
60170 |
7 |
809 |
193 |
654481 |
37249 |
156137 |
8 |
732 |
190 |
535824 |
36100 |
139080 |
9 |
807 |
184 |
651249 |
33856 |
148488 |
10 |
766 |
189 |
586756 |
35721 |
144774 |
11 |
664 |
135 |
440896 |
18225 |
89640 |
12 |
751 |
175 |
564001 |
30625 |
131425 |
13 |
556 |
115 |
309136 |
13225 |
63940 |
14 |
836 |
210 |
698896 |
44100 |
175560 |
15 |
739 |
169 |
546121 |
28561 |
124891 |
16 |
846 |
215 |
715716 |
46225 |
181890 |
17 |
934 |
264 |
872356 |
69696 |
246576 |
18 |
927 |
241 |
859329 |
58081 |
223407 |
19 |
851 |
235 |
724201 |
55225 |
190985 |
20 |
678 |
167 |
459684 |
27889 |
11326 |
21 |
832 |
275 |
692224 |
73625 |
228800 |
22 |
748 |
157 |
559504 |
24649 |
117436 |
23 |
717 |
164 |
514089 |
26896 |
117588 |
24 |
944 |
314 |
891`136 |
98596 |
296416 |
25 |
959 |
286 |
919681 |
81796 |
274274 |
Итого |
18705 |
4604 |
14401233 |
937314 |
3625593 |
Оценки моментов |
18705/25= =748,2 |
4604/25= =184,16 |
14401233/25= =576049,32 |
937314/25= =37492,56 |
3625593/25= =145023,72 |
Вычислим средние квадратические отклонения:
Вычислим коэффициент линейной корреляции.
Вычислим критическое значение коэффициента линейной корреляции:
Значение tкрит=2,0687 находим по статистическим таблицам для
рекомендуемого уровня значимости α=0.05 и количества степеней свободы:
п-2=25-2=23.
Ввиду того, что вычисленное значение коэффициента линейной корреля-
ции превышает критическое значение, то анализируемую связь будем счи-тать существенной, а ввиду того что оно превышает 0,8, то делаем заключе-ние, что эта связь положительная и близкая к линейной.
Для вычисления эмпирического корреляционного отношения сгруппи-
руем предприятия и результаты группировки представим в таблице 4.9.3.
Таблица 4.9.3. Исходные данные для вычисления корреляционного
отношения
Номер интервала - i |
Границы интервала |
Кол. предпри- ятий - ni |
Середина ин- тервала - xi |
Средняя прибыль - уi |
1 |
510-600 |
4 |
555 |
98,25 |
2 |
600-690 |
4 |
645 |
141,50 |
3 |
690-780 |
7 |
735 |
175,43 |
4 |
780-870 |
6 |
825 |
218,67 |
5 |
879-960 |
4 |
915 |
276,25 |
Вычислим оценку межгрупповой дисперсии:
=((98,25-184,16)2×4+(141,5-184,16)2×4+
+ (175,43-184,160)2×7+(218,67-184,16)2×6+(276,25-184,16)2×4)/25=3136,12.
Вычислим общую дисперсию результативного признака:
Вычислим эмпирическое корреляционное отношение:
Вычислим эмпирический коэффициент детерминации:
Эмпирический коэффициент детерминации показывает, что более 87% изменения результативного признака объясняется изменением факторного признака, что позволяет сделать заключение о наличии существенной связи между ними.
Возможность применения линейной функции для представления
зависимости y=f(x) можно оценить по величине ω, вычисляемой по формуле:
Ввиду того, что вычисленное значение ω2 по абсолютному значению
меньше критического значения критерия Фишера Fкрит=3,1, найденного по статистическим таблицам для рекомендуемого значения уровня значимости α=0,05 и двух степенях свободы: k1=k-2=5-2=3 и k2=n-k=25-5=20, то делаем заключение о сильной близкой к линейной связи результативного признака у с факторным признаком х.
Вычислим коэффициенты линейного уравнения регрессии y=b0+b1;
Таким образом, получили линейное уравнение:
Вычислим коэффициент эластичности, который показывает на сколько процентов изменится результативный признак при изменении факторного признака на один процент:
Вычислим β-коэффициент, который показывает на сколько процентов изменится среднее квадратическое отклонение результативного признака при изменении среднего квадратического отклонения факториного признакана один процент:
Пример 4.9.2
Провести корреляционный анализ показателей нефтегазодобывающей отрасли России, представленных в таблице 4.9.4.
Таблица 4.9.4. Исходные данные для примера 4.9.2
Показатель |
Код |
1996 г. |
1977 г. |
1998 г. |
1999 г. |
2000 г. |
2001 г. |
2002 г. |
Добыча нефти в млн. тонн |
y |
269,91 |
270,94 |
264,70 |
268,53 |
281,29 |
301,73 |
341,60 |
Разведочное бурение в тыс. метрах |
x1 |
1026,4 |
1006,7 |
789.0 |
824,9 |
1013,7 |
1145,1 |
1410,4 |
Эксплуатацион- ное бурение в тыс. метрах |
x2 |
6762,2 |
6997,7 |
4697,7 |
4872,5 |
8286,7 |
9011,0 |
10024,5 |
Всего бурение в тыс. метрах |
x3 |
7788,6 |
8004,4 |
5486,7 |
5697,4 |
9300,4 |
10156,1 |
11434,9 |
Кол. добываю- щих скважин |
x4 |
106645 |
101224 |
97557 |
101937 |
109939 |
114883 |
113672 |
Кол. простаива- ющих скважин |
x5 |
37396 |
35958 |
34131 |
32932 |
31940 |
31479 |
34228 |
Всего скважин |
x6 |
144041 |
137182 |
131688 |
134869 |
141879 |
146362 |
147900 |
Ввод новых скважин |
x7 |
3419 |
3001 |
2376 |
2552 |
3405 |
4023 |
3901 |
Закуплено бе- тонита в тыс. т. |
x8 |
78,94 |
86,66 |
60,25 |
56,41 |
70,97 |
67,32 |
73,00 |
По данным таблицы 4.9.4 аналогично предыдущему примеру вычислены коэффициенты линейной корреляции между всеми переменными и результаты вычислений помещены в таблицу 4.9.5.
Таблица 4.9.5. Коэффициенты линейной корреляции для переменных
примера 4.9.2
Коды |
y |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
y |
1 |
0,932 |
0,850 |
0,862 |
0,865 |
-0,242 |
0,765 |
0,758 |
0,099 |
x1 |
0,932 |
1 |
0,937 |
0,948 |
0,831 |
-0,015 |
0,894 |
0,880 |
0,426 |
x2 |
0,830 |
0,937 |
1 |
0,999 |
0,916 |
-0,229 |
0,911 |
0,944 |
0,423 |
x3 |
0,862 |
0,948 |
0,999 |
1 |
0,913 |
-0,210 |
0,915 |
0,944 |
0,425 |
x4 |
0,865 |
0,831 |
0,916 |
0,913 |
1 |
-0,399 |
0,947 |
0,961 |
0,157 |
x5 |
-0,242 |
-0,015 |
-0,299 |
-0,210 |
-0,388 |
1 |
-0,071 |
-0,174 |
0,613 |
x6 |
0,765 |
0,894 |
0,911 |
0,915 |
0,947 |
-0,071 |
1 |
0,979 |
0,383 |
x7 |
0,758 |
0,882 |
0,944 |
0,944 |
0,961 |
-0,174 |
0,979 |
1 |
0,391 |
x8 |
0,099 |
0,426 |
0,423 |
0,425 |
0,157 |
0,613 |
0,383 |
0,391 |
1 |
Вычислим критическое значение коэффициента линейной корреляции:
Значение tкрит=2,5706 находим по статистическим таблицам для
рекомендуемого уровня значимости α=0.05 и количества степеней свободы:
п-2=7-2=5.
Проведём анализ результатов, приведённых в таблице 4.9.5. Так как коэффициенты линейной корреляции /ryx5/=0,242<rкрит и /ryx8/=0,099<rкрит, то связь результативного показателя у с факторами х5 и х8 является несущественной и поэтому эти факторы не будем включать в уравнение регрессии. Для решения вопроса о включении в уравнение регрессии других факторов будем последовательно рассматривать имеющиеся факторы попарно.
Сначала проверим выполнение неравенств для результативного показателя у и факторов х1 и х2.
ryx1>rx1x2; 0,932<0,937; не выполняется.
ryx2>rx1x2; 0,850<0,937; не выполняется.
Оба неравенства не выполняются, Это указывает на то, что связь между факторами х1 и х2 является более существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии фактор, у которого коэффициент линейной корреляции больше. Так как rx1=0,932>rx2=0,850, то для включения в уравнение регрессии оставляем фактор х1.
Проверим выполнение неравенств для результативного показателя у и факторов х1 и х3.
ryx1>rx1x3; 0,932<0,948; не выполняется.
ryx3>rx1x3; 0,862<0,948; не выполняется.
Оба неравенства не выполняются. Это указывает на то, что связь между факторами х1 и х3 является более существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии фактор, у которого коэффициент линейной корреляции больше. Так как ryx1=0,932>rуx3=0,862, то для включения в уравнение регрессии оставляем фактор х1.
Проверим выполнение неравенств для результативного показателя у и факторов х1 и х4.
ryx1>rx1x3; 0,932>0,785; выполняется.
ryx3>rx1x3; 0,865>0,785; выполняется.
Оба неравенства выполняются. Это указывает на то, что связь между факторами х1 и х3 является менее существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии оба фактора: х1 и х4.
Проверим выполнение неравенств для результативного показателя у и факторов х1 и х6.
ryx1>rx1x6; 0,932>0,894; выполняется.
ryx6>rx1x6; 0,765<0,894; не выполняется.
Первое неравенство выполняется, а второе не выполняется. Это ещё раз подтверждает что связь между фактором х1 и результативным показателем у является существенной. Не выполнение второго неравенства позволяет не включать фактор х6 в уравнение регрессии, но для большей убедительности при принятии такого решения проверим выполнение неравенств для результативного показателя у и факторов х4 и х6.
ryx4>rx4x6; 0,865<0,947; не выполняется.
ryx6>rx4x6; 0,765<0,947; не выполняется.
Оба неравенства не выполняются. Это указывает на то, что связь между факторами х4 и х6 является более существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии фактор, у которого коэффициент линейной корреляции больше. Так как ryx4=0,865>rуx6=0,765, то для включения в уравнение регрессии оставляем фактор х4.
Проверим выполнение неравенств для результативного показателя у и факторов х1 и х7.
ryx1>rx1x7; 0,932>0,882; выполняется.
ryx7>rx1x7; 0,758<0,882; не выполняется.
Первое неравенство выполняется, а второе не выполняется. Это ещё раз подтверждает что связь между фактором х1 и результативным показателем у является существенной. Не выполнение второго неравенства позволяет не включать фактор х7 в уравнение регрессии, но для большей убедительности при принятии такого решения проверим выполнение неравенств для результативного показателя у и факторов х4 и х7.
ryx4>rx4x7; 0,865<0,961; не выполняется.
ryx7>rx4x7; 0,758<0,961; не выполняется.
Оба неравенства не выполняются. Это указывает на то, что связь между факторами х4 и х7 является более существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии фактор, у которого коэффициент линейной корреляции больше. Так как ryx4=0,865>rуx7=0,758, то для включения в уравнение регрессии оставляем фактор х4.
Таким образом, проведённый статистический анализ позволил обосновать целесообразность включения в уравнение регрессии двух факторов: х1 и х4. Решение о не включении в уравнение регрессии факторов: х5 и х8 принято ввиду несущественности их связи с результативным показателем у. а других факторов: х2, х3, х6, и х7 принято ввиду наличия существенной корреляционной связи между ними с факторами х1 и х4.
Пример 4.9.3
Вычислить коэффициенты линейной корреляции между результативными показателями социально-экономическеого состояния населения города Елабуга уj; и расходными статьями бюджета - хi; и по вычисленным значениям построить столбчатые диаграммы. Перечень переменных, отобранных для исследования представлен в таблице 4.9.6.
Таблица 4.9.6. Перечень переменных для примера 4.9.3
Код |
Наименование переменной |
x1 |
Статья бюджета “Общегосударственные вопросы” (тыс. руб.) |
x2 |
Статья бюджета “Национальная безопасность и правоохранительная деятельность” (тыс. руб.) |
x3 |
Статья бюджета “Национальная экономика” (тыс. руб.) |
x4 |
Статья бюджета “Жилищно-коммунальное хозяйство” (тыс. руб.) |
x5 |
Статья бюджета “Культура, кинематография и средства массовой информации” (тыс. руб.) |
x6 |
Статья бюджета “Образование” (тыс. руб.) |
x7 |
Статья бюджета “Здравоохранение. Спорт и физическая культура” (тыс. руб.) |
x 8 |
Статья бюджета “Социальная политика” (тыс. руб.) |
x 9 |
Статья бюджета “Межбюджетные трансферты” (тыс. руб.) |
z1 |
Численность населения (тыс. чел.) |
z2 |
Численность населения трудоспособного возраста (тыс. чел.) |
z3 |
Численность работающих на крупных предприятиях (тыс. чел.) |
z4 |
Уровень безработицы (%) |
z5 |
Объем промышленной продукции (млн. руб., до 1997г. млрд. руб.) |
z6 |
Среднемесячная заработная плата (руб., до 1997г. тыс. руб.) |
z7 |
Прожиточный минимум на члена семьи (руб., до 1997г. тыс. руб.) |
z8 |
Стоимость набора из 25 основных продуктов питания (руб., до 1997г. тыс. руб.) |
z9 |
Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.) |
z10 |
Ввод жилых домов (кв. м. общ. пл.) |
z11 |
Объем реализации платных услуг в расчете на 1 жителя (руб., до 1997г. тыс. руб.) |
z12 |
Объем реализации бытовых услуг в расчете на 1 жителя (руб., до 1997г. тыс. руб.) |
z13 |
Оборот розничной торговли на душу населения (руб., до 1997г. тыс. руб.) |
z14 |
Оборот общественного питания на душу населения (руб., до 1997г. тыс. руб.) |
z15 |
Обеспеченность населения больничными койками (на 1000 чел.) |
z16 |
Обеспеченность населения врачами (на 1000 чел.) |
z17 |
Обеспеченность населения средним медицинским персоналом (на 1000 чел.) |
z18 |
Общая раскрываемость преступлений (%) |
z19 |
Потребление чистой воды (млн. куб. л.) |
z20 |
Выброс вредных веществ в атмосферу (кг) |
z21 |
Количество автомобилей (шт.) |
z22 |
Отходы животноводческие (тыс. т.) |
z23 |
Отходы бытовые (тыс. т.) |
z24 |
Отходы промышленные (тыс. т.) |
y1 |
Средняя продолжительность жизни (лет) |
y2 |
Рождаемость (тыс. чел.) |
y3 |
Смертность (тыс. чел.) |
y4 |
Естественный прирост (чел.) |
y5 |
Количество зарегистрированных браков (шт.) |
y6 |
Количество расторгнутых браков (шт.) |
y7 |
Разница между заключенными и расторгнутыми браками (тыс. шт.) |
y8 |
Число умерших детей в возрасте до 1 года (на 1000 чел.) |
y9 |
Заболеваемость туберкулезом (на 100 тыс. чел) |
y10 |
Заболеваемость онкологическими заболеваниями (на 100 тыс. чел) |
y11 |
Заболевания органов дыхания (на 1000 чел.) |
y12 |
Заболеваемость системы кровообращения (на 1000 чел.) |
y13 |
Общее количество преступлений (тыс. шт.) |
y14 |
Количество особо тяжких преступлений (тыс. шт.) |
y15 |
Количество тяжких преступлений (тыс. шт.) |
y16 |
Количество преступлений средней тяжести (тыс. шт.) |
y17 |
Количество преступлений небольшой тяжести (тыс. шт.) |
y18 |
Количество умышленных убийств (тыс. шт.) |
y 19 |
Количество причинений вреда здоровью (тыс. шт.) |
y20 |
Количество умышленных причинений тяжкого вреда здоровью (тыс. шт.) |
y21 |
Количество краж (тыс. шт.) |
y22 |
Количество мошенничеств (тыс. шт.) |
y23 |
Количество грабежей (тыс. шт.) |
y24 |
Количество разбоев (тыс. шт.) |
y25 |
Количество вымогательств (тыс. шт.) |
y26 |
Количество неправомерных завладений автомототранспортом (тыс. шт.) |
y27 |
Количество хулиганств (тыс. шт.) |
Коэффициент линейной корреляции вычисляется по формуле:
Критическое значение коэффициента линейной корреляции вычисляется по формуле:
,
где tкрит =2.0181 критическое значение критерия Стьюдента, найдено по статистическим таблицам [11] при n-2 = 44-2=42 степенях свободы и рекомендуемого уровня значимости α=0.05.
Коэффициенты линейной корреляции между результативными показателями и бюджетными факторами представлены в таблице 4.8.7. Таблица 4.9.7. Коэффициенты линейной корреляции между переменными
примера 4.9.3
х1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
x9 |
|
y1 |
-0,35 |
-0,12 |
0,44 |
-0,15 |
-0.25 |
-0,49 |
0,20 |
-0,27 |
-0,60 |
y2 |
0,46 |
0,44 |
-0,31 |
0,05 |
0,48 |
0,62 |
-0,21 |
0,57 |
0,26 |
y3 |
0,09 |
-0,00 |
-0,34 |
0,10 |
0,04 |
0,25 |
-0,19 |
0,09 |
0,21 |
y4 |
-0,43 |
-0,49 |
0,05 |
0,03 |
-0,50 |
-0,47 |
0,06 |
-0,55 |
-0,10 |
y5 |
0,41 |
0,20 |
-0,18 |
0,01 |
0,29 |
0,46 |
0,08 |
0,33 |
0,40 |
y6 |
0,11 |
0,02 |
-0,02 |
0,17 |
0,07 |
0,08 |
0,15 |
0,05 |
0,39 |
y7 |
0,36 |
0,21 |
-0,18 |
-0,16 |
0,27 |
0,45 |
-0,05 |
0,34 |
0,08 |
y8 |
-0,63 |
-0,51 |
0,17 |
0,08 |
-0,59 |
-0,69 |
-0,05 |
-0,61 |
-0,37 |
y9 |
-0,60 |
-0,54 |
-0,01 |
0,37 |
-0,56 |
-0,60 |
-0,16 |
-0,61 |
-0,09 |
y10 |
0,12 |
-0,19 |
-0,55 |
0,20 |
-0,05 |
0,30 |
-0,29 |
-0,02 |
0,59 |
y11 |
-0,16 |
-0,01 |
0,21 |
-0,25 |
-0,06 |
-0,17 |
0,08 |
-0,09 |
-0,34 |
y12 |
0,37 |
0,54 |
0,34 |
0,06 |
0,52 |
0,22 |
0,28 |
0,46 |
-0,08 |
y13 |
0,48 |
0,33 |
-0,13 |
0,18 |
0,42 |
0,45 |
0,07 |
0,43 |
0,31 |
y14 |
0,24 |
0,05 |
-0,07 |
0,36 |
0,12 |
0,15 |
0,17 |
0,08 |
0,35 |
y15 |
-0,10 |
-0,17 |
-0,04 |
0,36 |
-0,14 |
-0,14 |
0,04 |
-0,17 |
0,13 |
y16 |
0,71 |
0,56 |
-0,19 |
-0,06 |
0,65 |
0,76 |
0,03 |
0,71 |
0,41 |
y17 |
0,56 |
0,41 |
-0,26 |
0,09 |
0,50 |
0,62 |
-0,05 |
0,54 |
0,44 |
y18 |
0,42 |
0,48 |
0,18 |
-0,01 |
0,43 |
0,27 |
0,35 |
0,51 |
-0,05 |
y19 |
0,38 |
0,33 |
-0,05 |
0,29 |
0,38 |
0,40 |
0,08 |
0,40 |
0,36 |
y20 |
0,51 |
0,36 |
-0,01 |
-0,05 |
0,41 |
0,44 |
0,28 |
0,45 |
0,23 |
y21 |
0,53 |
0,36 |
-0,13 |
-0,01 |
0,45 |
0,51 |
0,08 |
0,49 |
0,24 |
y22 |
0,43 |
0,29 |
-0,13 |
-0,04 |
0,36 |
0,41 |
0,06 |
0,40 |
0,16 |
y23 |
0,42 |
0,49 |
0,08 |
0,02 |
0,50 |
0,39 |
0,10 |
0,54 |
0,06 |
y24 |
0,86 |
0,64 |
-0,16 |
0,04 |
0,75 |
0,86 |
0,21 |
0,79 |
0,52 |
y25 |
0,32 |
0,14 |
-0,24 |
0,03 |
0,21 |
0,32 |
-0,03 |
0,20 |
0,34 |
y26 |
0,27 |
-0,03 |
-0,22 |
0,03 |
0,07 |
0,26 |
0,10 |
0,12 |
0,25 |
y27 |
0,04 |
0,11 |
-0,04 |
-0,11 |
0,09 |
0,09 |
-0,07 |
0,09 |
0,02 |
Приведем диаграммы коэффициентов корреляции для наиболее важных результативных показателей условий жизни на рис. 4.9.2 рис.4.9.4.
Рис. 4.9.2. Диаграмма коэффициентов корреляции для переменной y2
Рис. 4.9.3. Диаграмма коэффициентов корреляции для переменной y10
Рис. 4.9.4. Диаграмма коэффициентов корреляции для переменной у13
4.10. Множественная корреляция
Для определения тесноты связи между откликом и несколькими факторами на практике используются следующие коэффициенты: конкордации, множественной корреляции и множественной детерминации.
Коэффициент конкордации определяет тесноту связи между произвольным количеством признаков, которые могут быть качественными или количественными. Требуется, чтобы они были проранжированными.
Коэффициент конкордации вычисляется по следующей формуле:
(4.10.1)
где m количество признаков;
n общее количество наблюдений;
S - отклонение суммы квадратов рангов от средней квадратов рангов которое вычисляется по формуле:
(4.10.2)
где n общее количество наблюдений;
si сумма рангов всех признаков по i-ой строке.
Сила связи определяется по критерию Пирсона, вычисляемого по формуле:
(4.10.3)
Пример 4.10.1
Вычисление коэффициента конкордации продемонстрируем на примере определения тесноты связи между уставным капиталом, числом акций, выставленных на продажу, и уставным капиталом. Исходные данные и результаты предварительных расчётов представлены в таблице 4.10.1.
Таблица 4.10.1. Исходные данные примера 4.10.1
№ |
Устав. кап. -х |
Число акций у |
Число рабо-тников - z |
Ранг х |
Ранг у |
Ранг z |
Сумма строк |
Квадр. сумм |
1 |
29540 |
856 |
119 |
9 |
7 |
1 |
17 |
289 |
2 |
16050 |
930 |
125 |
1 |
9 |
2 |
12 |
144 |
3 |
41020 |
1563 |
132 |
10 |
10 |
3 |
23 |
529 |
4 |
23500 |
682 |
141 |
6 |
5 |
4 |
15 |
225 |
5 |
26250 |
616 |
150 |
7 |
3 |
5 |
15 |
225 |
6 |
17950 |
495 |
165 |
4 |
2 |
6 |
12 |
144 |
7 |
28130 |
815 |
178 |
8 |
6 |
7 |
21 |
441 |
8 |
17510 |
858 |
181 |
3 |
8 |
8 |
19 |
361 |
9 |
17000 |
467 |
201 |
2 |
1 |
9 |
12 |
144 |
10 |
22640 |
661 |
204 |
5 |
4 |
10 |
19 |
361 |
Итого |
165 |
2863 |
Вычислим отклонение суммы квадратов рангов от среднего значения квадратов рангов:
S= 2863-1652/10=140.5.
По (4.10.1) вычислим коэффициент конкордации:
W=12·140.5/(32(103-10))=0.19.
По (4.10.2) вычислим значение критерия Пирсона:
χ2=12·140.5/(3·10·(10-1))=6.24.
По статистической таблице [2] находим критическое значение критерия Пирсона для рекомендуемого уровня значимости α=0.05 и количества степеней свободы n-1=10-1=9: χ2крит=16.919. Ввиду того, что вычисленное значение критерия Пирсона не превышает критическое значение делаем заключение об отсутствии связи между откликом уставным капиталом и двумя факторами: количеством акций, выставленных на продажу, и количеством работников на предприятиях.
Коэффициенты множественной детерминации и корреляции требуют наличия линейной зависимости между откликом и всеми факторами и нормальности всех переменных, используемых в вычислениях. К достоинствам этих коэффициентов относится наличие возможности оценки их существенности.
Эти показатели как правило используются для оценки качества уравне-ний регрессии в стандартных процедурах регрессионного анализа. Они так-же могут использоваться и для самостоятельных расчётов по определению силы связи между случайными переменными. Вычисления являются матрич-ными и поэтому при проведении вычислений без применения компьютеров сложными.
Для вычисления коэффициента множественной детерминации требуется первоначально вычислить парные коэффициенты линейной корреляции между всеми переменными, т.е. откликом и всеми факторами и составить соответствующую матрицу. Коэффициент множественной детерминации
R2y,x1,x2,…xm делением определителя матрицы Δ* на определитель матрицы Δ.
ryx1 ryx2 … ryxm 0
1 rx1x2 … rx1xm rx1y
Δ*=
rx2x1 1 … rx2xm rx2y (4.10.4)
rxmx1 rxmx2 … 1 rxmy
1 rx1x2 … rx1xm
Δ =
rx2x1 1 … rx2xm (4.10.5)
rxmx1 rxmx2 … 1
R2yx1x2…xm = Δ*/ Δ. (4.10.6)
Rкор,yx1x2…xm = √Δ*/ Δ. (4.10.7)
По статистическим таблицам [11] находим критические значения коэффициентов множественной детерминации и корреляции для рекомендуемого уровня значимости α=0.05 и количества степеней свободы равного количеству наблюдений минус 1, и если вычисленные по (4.10.6) и (4.10.7) значения превышают критические, то корреляционная связь между откликом и факторами считается существенной.
Для простоты приведём пример вычисления коэффициентов детермина-ции и корреляции для результативного показателя у добычи нефти и двух наиболее существенно влияющих на неё факторов: х1 разведочного бурения и х2 количества добывающих скважин.
Пример 4.10.2
Провести корреляционный анализ показателей нефтегазодобывающей отрасли России, приведённых в таблице 4.10.2, полученные по таблице 4.9.4. Для упрощения формул фактор х4 таблицы 4.9.4 переименован в фактор х2.
Таблица 4.10.2. Исходные данные для примера 4.10.2
Показатель |
Код |
1996 г. |
1977 г. |
1998 г. |
1999 г. |
2000 г. |
2001 г. |
2002 г. |
Добыча нефти в млн. тонн |
y |
269,91 |
270,94 |
264,70 |
268,53 |
281,29 |
301,73 |
341,60 |
Разведочное бурение в тыс. метрах |
x1 |
1026,4 |
1006,7 |
789.0 |
824,9 |
1013,7 |
1145,1 |
1410,4 |
Кол. добываю- щих скважин |
х2 |
106645 |
101224 |
97557 |
101937 |
109939 |
114883 |
113672 |
По данным таблицы 4.10.2 вычислены коэффициенты линейной корре-ляции между всеми переменными и результаты вычислений помещены в таблицу 4.10.3.
Таблица 4.10.3. Коэффициенты линейной корреляции для переменных
примера 4.10.2
Коды |
y |
x1 |
x2 |
y |
1 |
0,932 |
0,865 |
x1 |
0,932 |
1 |
0,831 |
x2 |
0,865 |
0,831 |
1 |
Коэффициент множественной детерминации вычисляется по формуле:
(4.10.8)
Коэффициент множественной корреляции вычисляется по формуле:
(4.10.9)
Проведём вычисления по формулам (4.10.8) и (4.10.9):
По шкале Чеддока коэффициент множественной корреляции попадает в диапазон значений от 0.5 до 0.7 и следовательно корреляционная связь меж-ду результативным показателем у добычи нефти и двух влияющих на неё факторов: х1 разведочного бурения и х4 количества добывающих скважин должна быть отнесена к заметным.
Полезно бывает вычислить и частные коэффициенты корреляции, кото-рые исключают влияние всех факторов кроме одного, по следующим формулам:
(4.10.10)
(4.10.11)
Естественно, что влияние фактора х1 на х2 без учёта влияния результатив-ного показателя у такое же как влияние фактора х2 на х1 без учёта влияния результативного показателя у:
(4.10.12)
По формулам (4.10.10) (4.10.12) вычислим частные коэффициенты корреляции.
Частные коэффициенты линейной корреляции уменьшают значения коэффициентов линейной корреляции за счёт исключения совместного влияния переменных, что не противоречит здравому смыслу.