Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Всероссийский заочный финансово экономический институт
По дисциплине «Эконометрика»
Выполнил:
Студент III курса Арасланова А.Н.
Проверил:
Преподаватель Хусаинова З.Ф.
2007
ПАРНАЯ РЕГРЕССИЯ
Вариант 4
X |
36 |
28 |
43 |
52 |
51 |
54 |
25 |
37 |
51 |
29 |
Y |
104 |
77 |
117 |
137 |
143 |
144 |
82 |
101 |
132 |
77 |
Требуется:
РЕШЕНИЕ:
Пуск-Программы-Olimp-СтатЭксперт
Появляется окно «Установка блока данных», ставим метки напротив «ввода данных по колонкам», остальные метки снимаем. Далее нажимаем кнопку «Установить»
Показатель А фактор Х
Показатель В фактор Y
Таблица 1
Протокол регрессионного анализа линейной модели
Парная регрессия. Y = Показатель-B X = Показатель-A |
|
|
|
|
|
|
|
|
|
|
|
Таблица функций парной регрессии |
|
|
|
|
|
Функция |
Критерий |
Эластич |
|
|
|
Y(X)=+13.892+2.402*X |
25,968 |
0,875 |
|
|
|
Выбрана функция Y(X)=+13.892+2.402*X |
|
|
|
|
|
|
|
|
|
|
|
Таблица остатков |
|
|
|
|
|
номер |
Факт |
Расчет |
Ошибка |
Ошибка |
Фактор |
1 |
104,000 |
100,352 |
3,648 |
3,507 |
36,000 |
2 |
77,000 |
81,139 |
-4,139 |
-5,375 |
28,000 |
3 |
117,000 |
117,164 |
-0,164 |
-0,140 |
43,000 |
4 |
137,000 |
138,779 |
-1,779 |
-1,299 |
52,000 |
5 |
143,000 |
136,377 |
6,623 |
4,631 |
51,000 |
6 |
144,000 |
143,582 |
0,418 |
0,290 |
54,000 |
7 |
82,000 |
73,934 |
8,066 |
9,837 |
25,000 |
8 |
101,000 |
102,754 |
-1,754 |
-1,737 |
37,000 |
9 |
132,000 |
136,377 |
-4,377 |
-3,316 |
51,000 |
10 |
77,000 |
83,541 |
-6,541 |
-8,494 |
29,000 |
|
|
|
|
|
|
|
|
|
|
|
|
Характеристики остатков |
|
|
|
|
|
Характеристика |
Значение |
|
|
|
|
Среднее значение |
0,000 |
|
|
|
|
Дисперсия |
20,774 |
|
|
|
|
Приведенная дисперсия |
25,968 |
|
|
|
|
Средний модуль остатков |
3,751 |
|
|
|
|
Относительная ошибка |
3,863 |
|
|
|
|
Критерий Дарбина-Уотсона |
1,707 |
|
|
|
|
Коэффициент детерминации |
0,998 |
|
|
|
|
F - значение ( n1 = 1, n2 = 8) |
5023,883 |
|
|
|
|
Критерий адекватности |
77,905 |
|
|
|
|
Критерий точности |
69,392 |
|
|
|
|
Критерий качества |
71,520 |
|
|
|
|
Уравнение значимо с вероятностью 0.95 |
|
|
|
|
|
10)На основе протокола регрессионного анализа линейной модели
выводим графики Показателя В (Y-X) (рис.1) и график относительной ошибки % (рис.2)
Рис.1 Показатель В (Y-X) линейной модели
рис.2 Относительная ошибка линейной модели, %
C пункта 1-7 выполнить шаги как описано выше
Таблица 2
Протокол регрессионного анализа гиперболической модели
Парная регрессия. Y = Показатель-B X = Показатель-A |
|
|
|
|
|
|
|
|
|
|
|
Таблица функций парной регрессии |
|
|
|
|
|
Функция |
Критерий |
Эластич |
|
|
|
Y(X)=+198.762-3293.898/X |
68,292 |
-0,690 |
|
|
|
Выбрана функция Y(X)=+198.762-3293.898/X |
|
|
|
|
|
|
|
|
|
|
|
Таблица остатков |
|
|
|
|
|
номер |
Факт |
Расчет |
Ошибка |
Ошибка |
Фактор |
1 |
104,000 |
107,264 |
-3,264 |
-3,139 |
36,000 |
2 |
77,000 |
81,122 |
-4,122 |
-5,354 |
28,000 |
3 |
117,000 |
122,159 |
-5,159 |
-4,410 |
43,000 |
4 |
137,000 |
135,417 |
1,583 |
1,155 |
52,000 |
5 |
143,000 |
134,175 |
8,825 |
6,171 |
51,000 |
6 |
144,000 |
137,764 |
6,236 |
4,331 |
54,000 |
7 |
82,000 |
67,006 |
14,994 |
18,286 |
25,000 |
8 |
101,000 |
109,737 |
-8,737 |
-8,651 |
37,000 |
9 |
132,000 |
134,175 |
-2,175 |
-1,648 |
51,000 |
10 |
77,000 |
85,179 |
-8,179 |
-10,622 |
29,000 |
|
|
|
|
|
|
|
|
|
|
|
|
Характеристики остатков |
|
|
|
|
|
Характеристика |
Значение |
|
|
|
|
Среднее значение |
0,000 |
|
|
|
|
Дисперсия |
54,634 |
|
|
|
|
Приведенная дисперсия |
68,292 |
|
|
|
|
Средний модуль остатков |
6,328 |
|
|
|
|
Относительная ошибка |
6,377 |
|
|
|
|
Критерий Дарбина-Уотсона |
1,511 |
|
|
|
|
Коэффициент детерминации |
0,996 |
|
|
|
|
F - значение ( n1 = 1, n2 = 8) |
1905,331 |
|
|
|
|
Критерий адекватности |
69,960 |
|
|
|
|
Критерий точности |
52,277 |
|
|
|
|
Критерий качества |
56,697 |
|
|
|
|
Уравнение значимо с вероятностью 0.95 |
|
|
|
|
|
10)На основе протокола регрессионного анализа гиперболической модели
выводим графики Показателя В (Y-X) (рис.3) и график относительной ошибки % (рис.4)
Рис.3 Показатель В (Y-X) гиперболической модели
рис.4 Относительная ошибка гиперболической модели, %
C пункта 1-7 выполнить шаги как описано выше
Таблица 3
Протокол регрессионного анализа показательной модели
Парная регрессия. Y = Показатель-B X = Показатель-A
|
|
|
|
|
|
Таблица функций парной регрессии |
|
|
|
|
|
Функция |
Критерий |
Эластич |
|
|
|
Y(X)= (+43.677)*(+1.023)**X |
27.333 |
0.908 |
|
|
|
Выбрана функция Y(X)= (+43.677)*(+1.023)**X |
|
|
|
|
|
|
|
|
|
|
|
Таблица остатков |
|
|
|
|
|
номер |
Факт |
Расчет |
Ошибка |
Ошибка |
Фактор |
1 |
104.000 |
97.732 |
6.268 |
6.027 |
36.000 |
2 |
77.000 |
81.716 |
-4.716 |
-6.125 |
28.000 |
3 |
117.000 |
114.302 |
2.698 |
2.306 |
43.000 |
4 |
137.000 |
139.798 |
-2.798 |
-2.042 |
52.000 |
5 |
143.000 |
136.705 |
6.295 |
4.402 |
51.000 |
6 |
144.000 |
146.195 |
-2.195 |
-1.524 |
54.000 |
7 |
82.000 |
76.412 |
5.588 |
6.815 |
25.000 |
8 |
101.000 |
99.944 |
1.056 |
1.046 |
37.000 |
9 |
132.000 |
136.705 |
-4.705 |
-3.564 |
51.000 |
10 |
77.000 |
83.565 |
-6.565 |
-8.526 |
29.000 |
|
|
|
|
|
|
|
|
|
|
|
|
Характеристики остатков |
|
|
|
|
|
Характеристика |
Значение |
|
|
|
|
Среднее значение |
0.093 |
|
|
|
|
Дисперсия |
21.857 |
|
|
|
|
Приведенная дисперсия |
27.333 |
|
|
|
|
Средний модуль остатков |
4.288 |
|
|
|
|
Относительная ошибка |
4.238 |
|
|
|
|
Критерий Дарбина-Уотсона |
2.188 |
|
|
|
|
Коэффициент детерминации |
0.998 |
|
|
|
|
F - значение ( n1 = 1, n2 = 8) |
4772.591 |
|
|
|
|
Критерий адекватности |
71.669 |
|
|
|
|
Критерий точности |
66.698 |
|
|
|
|
Критерий качества |
67.941 |
|
|
|
|
Уравнение значимо с вероятностью 0.95 |
|
|
|
|
|
10)На основе протокола регрессионного анализа показательной модели
выводим графики Показателя В (Y-X) (рис.5) и график относительной ошибки % (рис.6)
Рис.5 Показатель В (Y-X) показательной модели
рис.6 Относительная ошибка показательной модели, %
4. Построение степенной модели парной регрессии
C пункта 1-7 выполнить шаги как описано выше
Таблица 4
Протокол регрессионного анализа степенной модели
Парная регрессия. Y = Показатель-B X = Показатель-A |
|
|
|
|
|
|
|
|
|
|
|
Таблица функций парной регрессии |
|
|
|
|
|
Функция |
Критерий |
Эластич |
|
|
|
Y(X)= (+4.661)*X**(+0.858) |
26.991 |
0.858 |
|
|
|
Выбрана функция Y(X)= (+4.661)*X**(+0.858)
|
|||||
Таблица остатков |
|
|
|
|
|
номер |
Факт |
Расчет |
Ошибка |
Ошибка |
Фактор |
1 |
104.000 |
100.771 |
3.229 |
3.105 |
36.000 |
2 |
77.000 |
81.231 |
-4.231 |
-5.495 |
28.000 |
3 |
117.000 |
117.361 |
-0.361 |
-0.308 |
43.000 |
4 |
137.000 |
138.138 |
-1.138 |
-0.831 |
52.000 |
5 |
143.000 |
135.856 |
7.144 |
4.995 |
51.000 |
6 |
144.000 |
142.683 |
1.317 |
0.915 |
54.000 |
7 |
82.000 |
73.707 |
8.293 |
10.114 |
25.000 |
8 |
101.000 |
103.167 |
-2.167 |
-2.146 |
37.000 |
9 |
132.000 |
135.856 |
-3.856 |
-2.922 |
51.000 |
10 |
77.000 |
83.713 |
-6.713 |
-8.718 |
29.000 |
|
|
|
|
|
|
|
|
|
|
|
|
Характеристики остатков |
|
|
|
|
|
Характеристика |
Значение |
|
|
|
|
Среднее значение |
0.152 |
|
|
|
|
Дисперсия |
21.570 |
|
|
|
|
Приведенная дисперсия |
26.991 |
|
|
|
|
Средний модуль остатков |
3.845 |
|
|
|
|
Относительная ошибка |
3.955 |
|
|
|
|
Критерий Дарбина-Уотсона |
1.588 |
|
|
|
|
Коэффициент детерминации |
0.998 |
|
|
|
|
F - значение ( n1 = 1, n2 = 8) |
4833.032 |
|
|
|
|
Критерий адекватности |
72.340 |
|
|
|
|
Критерий точности |
68.726 |
|
|
|
|
Критерий качества |
69.629 |
|
|
|
|
Уравнение значимо с вероятностью 0.95 |
|
|
|
|
|
10)На основе протокола регрессионного анализа степенной модели
выводим графики Показателя В (Y-X) (рис.7) и график относительной ошибки % (рис.8)
Рис.7 Показатель В (Y-X) степенной модели
Рис.8 Относительная оценка степенной модели, %
Для выбора лучшей модели построим сводную таблицу результатов (таблица 5)
Таблица 5
Параметры |
Коэффициент детерминации R** |
F-критерий Фишера |
Индекс корреляции p yx (ryx) |
Средняя относительная ошибка Eотн |
Модель |
||||
1.Линейная |
0,998 |
5023,883 |
0,9990 |
3,863 |
2.Степенная |
0,998 |
4833,032 |
0,9990 |
3,955 |
3.Показательная |
0,998 |
4772,591 |
0,9990 |
4,238 |
4.Гиперболическая |
0,996 |
1905,331 |
0,9980 |
6,377 |
Из сводной таблицы видно, что лучшей моделью является линейная Y(X)=13,892+2,402X
Осуществим прогнозирование среднего значения показателя Y при уровне значимости =0,1, если прогнозное значение фактора X составит 80% от его максимального значения.
Подставим Хпрогн. в нашу модель и расчитаем Y(Xпрогн)
Y(X)=13,892+2,402 х 43,2 = 117,66 млн руб.
Отметим графически фактические и модельные значения Y, точки прогноза (рис.9)
Рис.9Прогноз по лучшей модели
МНОЖЕСТВЕННАЯ РЕГРЕССИЯ
Вариант 1.3 точки с 6 по 46
По данным о рынке жилья в Московской области, представленным в табл. 1, исследуется зависимость между ценой квартиры Y (тыс. долл.) и следующими основными факторами: |
|||||||
X1 город области (1- Подольск, 2-Люберцы); |
|||||||
X2 число комнат в квартире; |
|||||||
X3 общая площадь квартиры (м2); |
|||||||
X4 жилая площадь квартиры (м2); |
|||||||
X5 этаж квартиры; |
|||||||
X6 площадь кухни (м2). |
|||||||
Y-цена квартиры, тыс. долл. |
|||||||
Исходные данные взяты из журнала «Недвижимость и цены» 1-7 мая 2006 г. |
|||||||
Таблица 1 Исходные данные |
|||||||
№ |
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
1 |
115 |
2 |
4 |
70,4 |
51,4 |
9 |
7 |
2 |
85 |
1 |
3 |
82,8 |
46 |
5 |
10 |
3 |
69 |
1 |
2 |
64,5 |
34 |
6 |
10 |
4 |
57 |
1 |
2 |
55,1 |
31 |
1 |
9 |
5 |
184,6 |
2 |
3 |
83,9 |
65 |
1 |
9 |
6 |
56 |
1 |
1 |
32,2 |
17,9 |
2 |
7 |
7 |
85 |
2 |
3 |
65 |
39 |
12 |
8,3 |
8 |
265 |
2 |
4 |
169,5 |
80 |
10 |
16,5 |
9 |
60,65 |
1 |
2 |
74 |
37,8 |
11 |
12,1 |
10 |
130 |
2 |
4 |
87 |
57 |
6 |
6 |
11 |
46 |
1 |
1 |
44 |
20 |
2 |
10 |
12 |
115 |
2 |
3 |
60 |
40 |
2 |
7 |
13 |
70,96 |
2 |
2 |
65,7 |
36,9 |
5 |
12,5 |
14 |
39,5 |
1 |
1 |
42 |
20 |
7 |
11 |
15 |
78,9 |
2 |
1 |
49,3 |
16,9 |
14 |
13,6 |
16 |
60 |
1 |
2 |
64,5 |
32 |
11 |
12 |
17 |
100 |
1 |
4 |
93,8 |
58 |
1 |
9 |
18 |
51 |
1 |
2 |
64 |
36 |
6 |
12 |
19 |
157 |
2 |
4 |
98 |
68 |
2 |
11 |
20 |
123,5 |
1 |
4 |
107,5 |
67,5 |
12 |
12,3 |
21 |
55,2 |
2 |
1 |
48 |
15,3 |
9 |
12 |
22 |
95,5 |
1 |
3 |
80 |
50 |
6 |
12,5 |
23 |
57,6 |
2 |
2 |
63,9 |
31,5 |
5 |
11,4 |
24 |
64,5 |
1 |
2 |
58,1 |
34,8 |
10 |
10,6 |
25 |
92 |
1 |
4 |
83 |
46 |
9 |
6,5 |
26 |
100 |
1 |
3 |
73,4 |
52,3 |
2 |
7 |
27 |
81 |
2 |
2 |
45,5 |
27,8 |
3 |
6,3 |
Таблица 1 Исходные данные |
|||||||
№ |
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
28 |
65 |
1 |
1 |
32 |
17,3 |
5 |
6,6 |
29 |
110 |
2 |
3 |
65,2 |
44,5 |
10 |
9,6 |
30 |
42,1 |
1 |
1 |
40,3 |
19,1 |
13 |
10,8 |
31 |
135 |
2 |
2 |
72 |
35 |
12 |
10 |
32 |
39,6 |
1 |
1 |
36 |
18 |
5 |
8,6 |
33 |
57 |
1 |
2 |
61,6 |
34 |
8 |
10 |
34 |
80 |
2 |
1 |
35,5 |
17,4 |
4 |
8,5 |
35 |
61 |
1 |
2 |
58,1 |
34,8 |
10 |
10,6 |
36 |
69,6 |
1 |
3 |
83 |
53 |
4 |
12 |
37 |
250 |
1 |
4 |
152 |
84 |
15 |
13,3 |
38 |
64,5 |
1 |
2 |
64,5 |
30,5 |
12 |
8,6 |
39 |
125 |
2 |
2 |
54 |
30 |
8 |
9 |
40 |
152,3 |
2 |
3 |
89 |
55 |
7 |
13 |
41 |
38 |
1 |
1 |
41,9 |
19 |
12 |
9,5 |
42 |
62,2 |
1 |
2 |
69 |
36 |
9 |
10 |
43 |
125 |
2 |
3 |
67 |
41 |
11 |
8 |
44 |
61,1 |
1 |
2 |
58,1 |
34,8 |
10 |
10,6 |
45 |
67 |
2 |
1 |
32 |
18,7 |
2 |
6 |
46 |
93 |
2 |
2 |
57,2 |
27,7 |
1 |
11,3 |
47 |
118 |
1 |
3 |
107 |
59 |
2 |
13 |
48 |
132 |
2 |
3 |
81 |
44 |
8 |
11 |
49 |
92,5 |
2 |
3 |
89,9 |
56 |
9 |
12 |
50 |
105 |
1 |
4 |
75 |
47 |
8 |
12 |
51 |
42 |
1 |
1 |
36 |
18 |
8 |
8 |
52 |
125 |
1 |
3 |
72,9 |
44 |
16 |
9 |
53 |
170 |
2 |
4 |
90 |
56 |
3 |
8,5 |
54 |
38 |
2 |
1 |
29 |
16 |
3 |
7 |
55 |
130,5 |
2 |
4 |
108 |
66 |
1 |
9,8 |
56 |
85 |
2 |
2 |
60 |
34 |
3 |
12 |
57 |
98 |
2 |
4 |
80 |
43 |
3 |
7 |
58 |
128 |
2 |
4 |
104 |
59,2 |
4 |
13 |
59 |
85 |
2 |
3 |
85 |
50 |
8 |
13 |
60 |
160 |
1 |
3 |
70 |
42 |
2 |
10 |
61 |
60 |
2 |
1 |
60 |
20 |
4 |
13 |
62 |
41 |
1 |
1 |
35 |
14 |
10 |
10 |
63 |
90 |
1 |
4 |
75 |
47 |
5 |
12 |
64 |
83 |
2 |
4 |
69,5 |
49,5 |
1 |
7 |
65 |
45 |
2 |
1 |
32,8 |
18,9 |
3 |
5,8 |
66 |
39 |
2 |
1 |
32 |
18 |
3 |
6,5 |
67 |
86,9 |
2 |
3 |
97 |
58,7 |
10 |
14 |
68 |
40 |
2 |
1 |
32,8 |
22 |
2 |
12 |
Таблица 1 Исходные данные |
|||||||
№ |
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
69 |
80 |
2 |
2 |
71,3 |
40 |
2 |
10 |
70 |
227 |
2 |
4 |
147 |
91 |
2 |
20,5 |
71 |
235 |
2 |
4 |
150 |
90 |
9 |
18 |
72 |
40 |
1 |
1 |
34 |
15 |
8 |
11 |
73 |
67 |
1 |
1 |
47 |
18,5 |
1 |
12 |
74 |
123 |
1 |
4 |
81 |
55 |
9 |
7,5 |
75 |
100 |
2 |
3 |
57 |
37 |
6 |
7,5 |
76 |
105 |
1 |
3 |
80 |
48 |
3 |
12 |
77 |
70,3 |
1 |
2 |
58,1 |
34,8 |
10 |
10,6 |
78 |
82 |
1 |
3 |
81,1 |
48 |
5 |
10 |
79 |
280 |
1 |
4 |
155 |
85 |
5 |
21 |
80 |
200 |
1 |
4 |
108,4 |
60 |
4 |
10 |
Рассчитать матрицу парных коэффициентов корреляции. Построить линейную регрессионную модель на основе значимых факторов.
Вводим исходные данные (таблица 1) в Microsoft Excel. Сохраняем на компьютере. Расчет матрицы парных коэффициентов корреляции выполняем следующим образом:
Файл Открыть Исходные данные
Соответствие переменных:
Показатель А Y
Показатель B X1
Показатель C X2
Показатель D X3
Показатель E X4
Показатель F X5
Показатель G X6
После выполнения этих действий программа осуществит расчет. Протокол корреляционного анализа сохраняем на компьютере (Таблица 2)
По матрице парных корреляций Таблицы 2 устанавливаем наличие мультиколлиниарности и ослабляем ее при наличии, используя два метода:
I метод:
С помощью определителя парных коэффициентов корреляции между факторами:
det A |
= |
1 |
0,103 |
0,039 |
0,023 |
-0,135 |
-0,024 |
= |
0,007610069 |
0,103 |
1 |
0,832 |
0,933 |
0,042 |
0,122 |
||||
0,039 |
0,832 |
1 |
0,942 |
0,251 |
0,108 |
||||
0,023 |
0,933 |
0,942 |
1 |
0,108 |
0,346 |
||||
-0,135 |
0,042 |
0,251 |
0,108 |
1 |
0,386 |
||||
-0,024 |
0,122 |
0,518 |
0,346 |
0,386 |
1 |
При расчете det A = 0,007610069 0, следовательно, существует мульти-коллинеарность между факторами х1, х2, х3, х4, х5, х6.
II метод:
По значению парного коэффициента корреляции между факторами:
Коэффициент корреляции R между двумя переменными указывает на силу связи между факторами и принимает значения между -1 и +1. При этом если значение находится ближе к 1, то это означает наличие сильной связи, а если к 0 слабой.
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. цена квартиры, имеет тесную связь с индексом числа комнат в квартире (ryx2 = 0,715), с общей площадью квартиры (ryx3 = 0,854), с жилой площадью квартиры (ryx4 = 0,811). Однако факторы х2 и х3 (показатель С и D), х2 и х4 (показатель С и Е), х3 и х4 (показатель D и Е) тесно связаны между собой, т.к. значение парного коэффициента корреляции между факторами:
rx2x3 0,832 ≥ 0,8
rx2x4 0,933 ≥ 0,8
rx3x4 0,942 ≥ 0,8, что свидетельствует о наличии мультиколлиниарности. Т.е. х2, х3, х4 несут одну и ту же экономическую информацию, характеризующую одну и ту же сторону исследования цены квартиры (Y) на рынке жилья в Московской области. Поэтому один из этих факторов необходимо исключить из перечня факторов. Либо оставляем все факторы, при условии, что оба фактора важны для исследования цены квартиры. Исключим тот фактор, который менее тесно связан с результативными признаками.
Для исключения х2 или х3 рассматриваем степень тесноты связи каждого фактора с результативным признаком Y (цена квартиры)
rx2y = 0,715 исключаем
rx3y = 0,854
rx2x4 0,933 ≥ 0,8 коэффициент корреляции между общей площадью квартиры и жилой площадью
rx2y = 0,715 - исключаем
rx4y = 0,811
rx3x4 0,942 ≥ 0,8 коэффициент корреляции между общей площадью квартиры и жилой площадью:
rx3y = 0,854
rx4y = 0,811 исключаем
Остались: Х1, Х3, Х5, Х6
Таблица 2
Протокол корреляционного анализа
Матрица парных корреляций |
|
|
|
|
|
|
|
Переменная |
Показатель-A |
Показатель-B |
Показатель-C |
Показатель-D |
Показатель-E |
Показатель-F |
Показатель-G |
Показатель-A |
1.000 |
0.367 |
0.715 |
0.854 |
0.811 |
0.163 |
0.314 |
Показатель-B |
0.367 |
1.000 |
0.103 |
0.039 |
0.023 |
-0.135 |
-0.024 |
Показатель-C |
0.715 |
0.103 |
1.000 |
0.832 |
0.933 |
0.042 |
0.122 |
Показатель-D |
0.854 |
0.039 |
0.832 |
1.000 |
0.942 |
0.251 |
0.518 |
Показатель-E |
0.811 |
0.023 |
0.933 |
0.942 |
1.000 |
0.108 |
0.346 |
Показатель-F |
0.163 |
-0.135 |
0.042 |
0.251 |
0.108 |
1.000 |
0.386 |
Показатель-G |
0.314 |
-0.024 |
0.122 |
0.518 |
0.346 |
0.386 |
1.000 |
Критическое значение на уровне 90% при 2 степенях свободы = +0.2048 |
|
|
|
|
|
|
|
Матрица максимальных корреляций |
|
|
|
|
|
|
|
Переменная |
Показатель-A |
Показатель-B |
Показатель-C |
Показатель-D |
Показатель-E |
Показатель-F |
Показатель-G |
Показатель-A |
1.000 |
0.367 |
0.715 |
0.854 |
0.811 |
0.163 |
0.314 |
Показатель-B |
0.367 |
1.000 |
0.303 |
-0.272 |
0.323 |
0.163 |
0.242 |
Показатель-C |
0.715 |
0.303 |
1.000 |
0.832 |
0.933 |
-0.220 |
0.312 |
Показатель-D |
0.854 |
-0.272 |
0.832 |
1.000 |
0.942 |
0.251 |
0.518 |
Показатель-E |
0.811 |
0.323 |
0.933 |
0.942 |
1.000 |
-0.213 |
0.346 |
Показатель-F |
0.163 |
0.163 |
-0.220 |
0.251 |
-0.213 |
1.000 |
0.438 |
Показатель-G |
0.314 |
0.242 |
0.312 |
0.518 |
0.346 |
0.438 |
1.000 |
|
|
|
|
|
|
|
|
Матрица оптимальных лагов |
|
|
|
|
|
|
|
Переменная |
Показатель-A |
Показатель-B |
Показатель-C |
Показатель-D |
Показатель-E |
Показатель-F |
Показатель-G |
Показатель-A |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
Показатель-B |
0 |
0 |
3 |
1 |
3 |
5 |
10 |
Показатель-C |
0 |
3 |
0 |
0 |
0 |
8 |
4 |
Показатель-D |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
Показатель-E |
0 |
3 |
0 |
0 |
0 |
8 |
0 |
Показатель-F |
0 |
5 |
8 |
0 |
8 |
0 |
7 |
Показатель-G |
0 |
10 |
4 |
0 |
0 |
7 |
0 |
Матрица частных корреляций |
|
|
|
|
|
|
|
Переменная |
Показатель-A |
Показатель-B |
Показатель-C |
Показатель-D |
Показатель-E |
Показатель-F |
Показатель-G |
Показатель-A |
1.000 |
0.000 |
-0.545 |
0.591 |
0.393 |
0.000 |
0.000 |
Показатель-B |
0.000 |
1.000 |
0.000 |
0.000 |
-0.475 |
0.000 |
0.000 |
Показатель-C |
-0.545 |
0.000 |
1.000 |
0.239 |
0.792 |
0.000 |
0.000 |
Показатель-D |
0.591 |
0.000 |
0.239 |
1.000 |
0.302 |
0.000 |
0.606 |
Показатель-E |
0.393 |
-0.475 |
0.792 |
0.302 |
1.000 |
0.000 |
0.320 |
Показатель-F |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
1.000 |
0.000 |
Показатель-G |
0.000 |
0.000 |
0.000 |
0.606 |
0.320 |
0.000 |
1.000 |
Критическое значение на уровне 90% при 7 степенях свободы = +0.2053 |
|
|
|
|
|
|
|
Множественные корреляции |
|
|
|
|
|
|
|
Переменная |
Коэффи |
F-зна |
%точка |
|
|
|
|
Показатель-A |
0.950 |
43.428 |
100.000 |
|
|
|
|
Показатель-B |
0.794 |
8.025 |
100.000 |
|
|
|
|
Показатель-C |
0.973 |
84.585 |
100.000 |
|
|
|
|
Показатель-D |
0.980 |
113.437 |
100.000 |
|
|
|
|
Показатель-E |
0.986 |
163.772 |
100.000 |
|
|
|
|
Показатель-F |
0.541 |
1.950 |
95.909 |
|
|
|
|
Показатель-G |
0.855 |
12.794 |
100.000 |
|
|
|
|
Чем меньше межфакторная связь, тем лучше для исследователя. И чем больше связь между каждым фактором с результативным признаком Y, тем лучше для нас.
rx2y = 0,715 - слабая
rx3y = 0,854 достаточно сильная
rx4y = 0,811 слабая
В результате корреляционного анализа мы уточнили перечень фаторов, на основании которых построим регерессионную модель
ŷ = а0 + а1х1 + а3х3 + а5х5 + а6х6
Регрессионный анализ предназначен для исследовния зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели, т.е. метод отсева незначимых факторных признаков.
а0,а1,а3,а5,а6 параметры модели
а0 свободный член;
а1 - коэффициент регрессии при х1
а3 - коэффициент регрессии при х3
а5 - коэффициент регрессии при х5
а6- коэффициент регрессии при х6
Коэффициент регрессии показывает влияние или изменение результативного показателя на величину ai, если «+», то y увеличивается, если «-» -- y уменьшается
Вводим в Microsoft Excel исходные данные (таблица 3). Оставляя только значимые факторы.
Таблица 3 Исходные данные |
|||||
№ |
Y |
X1 |
X3 |
X5 |
X6 |
6 |
56 |
1 |
32,2 |
2 |
7 |
7 |
85 |
2 |
65 |
12 |
8,3 |
8 |
265 |
2 |
169,5 |
10 |
16,5 |
9 |
60,65 |
1 |
74 |
11 |
12,1 |
10 |
130 |
2 |
87 |
6 |
6 |
11 |
46 |
1 |
44 |
2 |
10 |
12 |
115 |
2 |
60 |
2 |
7 |
13 |
70,96 |
2 |
65,7 |
5 |
12,5 |
14 |
39,5 |
1 |
42 |
7 |
11 |
15 |
78,9 |
2 |
49,3 |
14 |
13,6 |
16 |
60 |
1 |
64,5 |
11 |
12 |
17 |
100 |
1 |
93,8 |
1 |
9 |
18 |
51 |
1 |
64 |
6 |
12 |
19 |
157 |
2 |
98 |
2 |
11 |
20 |
123,5 |
1 |
107,5 |
12 |
12,3 |
21 |
55,2 |
2 |
48 |
9 |
12 |
22 |
95,5 |
1 |
80 |
6 |
12,5 |
23 |
57,6 |
2 |
63,9 |
5 |
11,4 |
24 |
64,5 |
1 |
58,1 |
10 |
10,6 |
25 |
92 |
1 |
83 |
9 |
6,5 |
26 |
100 |
1 |
73,4 |
2 |
7 |
27 |
81 |
2 |
45,5 |
3 |
6,3 |
28 |
65 |
1 |
32 |
5 |
6,6 |
29 |
110 |
2 |
65,2 |
10 |
9,6 |
30 |
42,1 |
1 |
40,3 |
13 |
10,8 |
31 |
135 |
2 |
72 |
12 |
10 |
32 |
39,6 |
1 |
36 |
5 |
8,6 |
33 |
57 |
1 |
61,6 |
8 |
10 |
34 |
80 |
2 |
35,5 |
4 |
8,5 |
35 |
61 |
1 |
58,1 |
10 |
10,6 |
36 |
69,6 |
1 |
83 |
4 |
12 |
37 |
250 |
1 |
152 |
15 |
13,3 |
38 |
64,5 |
1 |
64,5 |
12 |
8,6 |
39 |
125 |
2 |
54 |
8 |
9 |
40 |
152,3 |
2 |
89 |
7 |
13 |
41 |
38 |
1 |
41,9 |
12 |
9,5 |
42 |
62,2 |
1 |
69 |
9 |
10 |
43 |
125 |
2 |
67 |
11 |
8 |
44 |
61,1 |
1 |
58,1 |
10 |
10,6 |
45 |
67 |
2 |
32 |
2 |
6 |
46 |
93 |
2 |
57,2 |
1 |
11,3 |
С помощью пакета СтатЭксперт делаем регрессионный анализ для нашей модели ŷ = а0 + а1х1 + а3х3 + а5х5 + а6х6 (таблица 4)
Таблица 4
Протокол регрессионного анализа линейной модели со значимыми факторами
Линейная регрессия. Зависимая переменная - Показатель-A |
||||||||
Оценки коэффициентов линейной регрессии |
||||||||
Переменная |
Коэффи |
Среднекв |
t- |
Нижняя |
Верхняя |
Эластич |
Бета- |
Дельта- |
Св. член |
-32,932 |
16,298 |
-2,021 |
-50,093 |
-15,772 |
0,000 |
0,000 |
0,000 |
Показатель-B |
32,962 |
6,246 |
5,277 |
26,386 |
39,539 |
0,528 |
0,122 |
0,114 |
Показатель-C |
1,600 |
0,128 |
12,541 |
1,466 |
1,734 |
1,189 |
0,919 |
0,857 |
Показатель-D |
0,543 |
0,845 |
0,642 |
-0,347 |
1,432 |
0,045 |
0,038 |
0,035 |
Показатель-E |
-3,531 |
1,581 |
-2,233 |
-5,196 |
-1,866 |
-0,396 |
-0,007 |
-0,006 |
Кpитическое значения t-pаспpеделения пpи 36 степенях свободы (p=85%) = +1.053 |
||||||||
|
|
|
|
|
||||
Таблица остатков |
|
|
|
|
||||
номер |
Факт |
Расчет |
Ошибка |
Ошибка |
||||
1 |
56,000 |
27,914 |
28,086 |
50,154 |
||||
2 |
85,000 |
114,189 |
-29,189 |
-34,340 |
||||
3 |
265,000 |
251,340 |
13,660 |
5,155 |
||||
4 |
60,650 |
81,664 |
-21,014 |
-34,649 |
||||
5 |
130,000 |
154,254 |
-24,254 |
-18,657 |
||||
6 |
46,000 |
36,199 |
9,801 |
21,306 |
||||
7 |
115,000 |
105,354 |
9,646 |
8,387 |
||||
8 |
70,960 |
96,680 |
-25,720 |
-36,245 |
||||
9 |
39,500 |
32,181 |
7,319 |
18,529 |
||||
10 |
78,900 |
71,439 |
7,461 |
9,456 |
||||
11 |
60,000 |
66,818 |
-6,818 |
-11,364 |
||||
12 |
100,000 |
118,864 |
-18,864 |
-18,864 |
||||
13 |
51,000 |
63,306 |
-12,306 |
-24,129 |
||||
14 |
157,000 |
152,027 |
4,973 |
3,168 |
||||
15 |
123,500 |
135,098 |
-11,598 |
-9,391 |
||||
16 |
55,200 |
72,297 |
-17,097 |
-30,972 |
||||
17 |
95,500 |
87,139 |
8,361 |
8,755 |
||||
18 |
57,600 |
97,684 |
-40,084 |
-69,591 |
||||
19 |
64,500 |
60,980 |
3,520 |
5,458 |
||||
20 |
92,000 |
114,754 |
-22,754 |
-24,732 |
||||
21 |
100,000 |
93,831 |
6,169 |
6,169 |
||||
22 |
81,000 |
85,170 |
-4,170 |
-5,148 |
||||
23 |
65,000 |
30,634 |
34,366 |
52,871 |
||||
24 |
110,000 |
108,833 |
1,167 |
1,061 |
||||
25 |
42,100 |
33,423 |
8,677 |
20,612 |
||||
26 |
135,000 |
119,385 |
15,615 |
11,567 |
||||
27 |
39,600 |
29,971 |
9,629 |
24,315 |
||||
28 |
57,000 |
67,613 |
-10,613 |
-18,620 |
||||
29 |
80,000 |
61,944 |
18,056 |
22,569 |
||||
30 |
61,000 |
60,980 |
0,020 |
0,033 |
||||
31 |
69,600 |
92,619 |
-23,019 |
-33,073 |
||||
32 |
250,000 |
204,391 |
45,609 |
18,243 |
||||
33 |
64,500 |
79,367 |
-14,867 |
-23,050 |
||||
34 |
125,000 |
91,948 |
33,052 |
26,442 |
||||
35 |
152,300 |
133,277 |
19,023 |
12,490 |
||||
36 |
38,000 |
40,031 |
-2,031 |
-5,343 |
||||
37 |
62,200 |
79,995 |
-17,795 |
-28,610 |
||||
38 |
125,000 |
117,905 |
7,095 |
5,676 |
||||
39 |
61,100 |
60,980 |
0,120 |
0,197 |
||||
40 |
67,000 |
64,088 |
2,912 |
4,347 |
||||
41 |
93,000 |
85,148 |
7,852 |
8,443 |
||||
Характеристики остатков |
|
|
|
|
||||
Характеристика |
Значение |
|
|
|
||||
Среднее значение |
0,000 |
|
|
|
||||
Дисперсия |
337,662 |
|
|
|
||||
Приведенная дисперсия |
384,560 |
|
|
|
||||
Средний модуль остатков |
14,741 |
|
|
|
||||
Относительная ошибка |
18,834 |
|
|
|
||||
Критерий Дарбина-Уотсона |
2,487 |
|
|
|
||||
Коэффициент детерминации |
0,968 |
|
|
|
||||
F - значение ( n1 = 4, n2 = 36) |
270,211 |
|
|
|
||||
Критерий адекватности |
80,937 |
|
|
|
||||
Критерий точности |
0,104 |
|
|
|
||||
Критерий качества |
20,312 |
|
|
|
||||
Уравнение значимо с вероятностью 0.95 |
Уравнение линейной регрессии принимает вид:
ŷ = -32,932 + 32,962х1 + 1,600х3 + 0,543х5 3,531х6
υ 1 = k = 4
υ 2 = n k 1 = 41 4 1 = 36, где
υ - число степеней свободы
k число независимых переменных
Если расчетное значение t критерия Стьюдента превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели, при этом оставшиеся в модели параметры должны быть пересчитаны.
t1(x1) = 5,277
t3(x3) = 12,541
t5(x5) = 0,642
t6(x6) = -2,233
Значение t критерия Стьюдента при уровне значимости =0,15
tтабл. = 1,49665
Из модели следует исключить факторы Х5 и Х6, т.к. не выполняется условие: tрасч > tтабл. , следовательно, Х5 и Х6 не значимые факторы.
Составим уравнение множественной регрессии со значимыми факторами для пересчета данных: ŷ = а0 + а1х1 + а3х3
С помощью пакета СтатЭксперт делаем регрессионный анализ для нашей модели, исходные данные приведены в таблице 5
Таблица 5 Исходные данные |
|||
№ |
Y |
X1 |
X3 |
6 |
56 |
1 |
32,2 |
7 |
85 |
2 |
65 |
8 |
265 |
2 |
169,5 |
9 |
60,65 |
1 |
74 |
10 |
130 |
2 |
87 |
11 |
46 |
1 |
44 |
12 |
115 |
2 |
60 |
Таблица 5 Исходные данные |
|||
13 |
70,96 |
2 |
65,7 |
14 |
39,5 |
1 |
42 |
15 |
78,9 |
2 |
49,3 |
16 |
60 |
1 |
64,5 |
17 |
100 |
1 |
93,8 |
18 |
51 |
1 |
64 |
19 |
157 |
2 |
98 |
20 |
123,5 |
1 |
107,5 |
21 |
55,2 |
2 |
48 |
22 |
95,5 |
1 |
80 |
23 |
57,6 |
2 |
63,9 |
24 |
64,5 |
1 |
58,1 |
25 |
92 |
1 |
83 |
26 |
100 |
1 |
73,4 |
27 |
81 |
2 |
45,5 |
28 |
65 |
1 |
32 |
29 |
110 |
2 |
65,2 |
30 |
42,1 |
1 |
40,3 |
31 |
135 |
2 |
72 |
32 |
39,6 |
1 |
36 |
33 |
57 |
1 |
61,6 |
34 |
80 |
2 |
35,5 |
35 |
61 |
1 |
58,1 |
36 |
69,6 |
1 |
83 |
37 |
250 |
1 |
152 |
38 |
64,5 |
1 |
64,5 |
39 |
125 |
2 |
54 |
40 |
152,3 |
2 |
89 |
41 |
38 |
1 |
41,9 |
42 |
62,2 |
1 |
69 |
43 |
125 |
2 |
67 |
44 |
61,1 |
1 |
58,1 |
45 |
67 |
2 |
32 |
46 |
93 |
2 |
57,2 |
Модель принимает вид: = -55,552 + 33,075х1 + 1,464х3
Таблица 6
Протокол регрессионного анализа линейной модели
по двум значимым факторам
Линейная регрессия. Зависимая переменная - Показатель-A |
||||||||
Оценки коэффициентов линейной регрессии |
||||||||
Переменная |
Коэффи |
Среднекв |
t- |
Нижняя |
Верхняя |
Эластич |
Бета- |
Дельта-коэф-т |
Св. член |
-55,552 |
12,112 |
-4,587 |
-68,294 |
-42,809 |
0,000 |
0,000 |
0,000 |
Показатель-B |
33,075 |
6,414 |
5,156 |
26,326 |
39,823 |
0,530 |
0,123 |
0,127 |
Показатель-C |
1,464 |
0,113 |
12,973 |
1,346 |
1,583 |
1,089 |
0,841 |
0,873 |
Кpитическое значения t-pаспpеделения пpи 38 степенях свободы (p=85%) = +1.052 |
||||||||
|
|
|
|
|
|
|
|
|
Таблица остатков |
|
|
|
|
|
|
|
|
номер |
Факт |
Расчет |
Ошибка |
Ошибка |
|
|
|
|
1 |
56,000 |
24,678 |
31,322 |
55,931 |
|
|
|
|
2 |
85,000 |
105,787 |
-20,787 |
-24,456 |
|
|
|
|
3 |
265,00 |
258,823 |
6,177 |
2,331 |
|
|
|
|
4 |
60,650 |
85,893 |
-25,243 |
-41,620 |
|
|
|
|
5 |
130,00 |
138,005 |
-8,005 |
-6,158 |
|
|
|
|
6 |
46,000 |
41,959 |
4,041 |
8,785 |
|
|
|
|
7 |
115,00 |
98,465 |
16,535 |
14,378 |
|
|
|
|
8 |
70,960 |
106,812 |
-35,852 |
-50,525 |
|
|
|
|
9 |
39,500 |
39,030 |
0,470 |
1,190 |
|
|
|
|
10 |
78,900 |
82,795 |
-3,895 |
-4,937 |
|
|
|
|
11 |
60,000 |
71,980 |
-11,980 |
-19,967 |
|
|
|
|
12 |
100,00 |
114,889 |
-14,889 |
-14,889 |
|
|
|
|
13 |
51,000 |
71,248 |
-20,248 |
-39,702 |
|
|
|
|
14 |
157,00 |
154,114 |
2,886 |
1,838 |
|
|
|
|
15 |
123,50 |
134,952 |
-11,452 |
-9,273 |
|
|
|
|
16 |
55,200 |
80,892 |
-25,692 |
-46,543 |
|
|
|
|
17 |
95,500 |
94,679 |
0,821 |
0,859 |
|
|
|
|
18 |
57,600 |
104,176 |
-46,576 |
-80,862 |
|
|
|
|
19 |
64,500 |
62,608 |
1,892 |
2,934 |
|
|
|
|
20 |
92,000 |
99,073 |
-7,073 |
-7,688 |
|
|
|
|
21 |
100,00 |
85,014 |
14,986 |
14,986 |
|
|
|
|
22 |
81,000 |
77,230 |
3,770 |
4,654 |
|
|
|
|
23 |
65,000 |
24,385 |
40,615 |
62,484 |
|
|
|
|
24 |
110,00 |
106,080 |
3,920 |
3,563 |
|
|
|
|
25 |
42,100 |
36,540 |
5,560 |
13,206 |
|
|
|
|
26 |
135,00 |
116,038 |
18,962 |
14,046 |
|
|
|
|
27 |
39,600 |
30,243 |
9,357 |
23,628 |
|
|
|
|
28 |
57,000 |
67,733 |
-10,733 |
-18,830 |
|
|
|
|
29 |
80,000 |
62,586 |
17,414 |
21,768 |
|
|
|
|
30 |
61,000 |
62,608 |
-1,608 |
-2,636 |
|
|
|
|
31 |
69,600 |
99,073 |
-29,473 |
-42,346 |
|
|
|
|
32 |
250,00 |
200,120 |
49,880 |
19,952 |
|
|
|
|
33 |
64,500 |
71,980 |
-7,480 |
-11,597 |
|
|
|
|
34 |
125,00 |
89,678 |
35,322 |
28,257 |
|
|
|
|
35 |
152,30 |
140,934 |
11,366 |
7,463 |
|
|
|
|
36 |
38,000 |
38,884 |
-0,884 |
-2,325 |
|
|
|
|
37 |
62,200 |
78,570 |
-16,370 |
-26,319 |
|
|
|
|
38 |
125,00 |
108,716 |
16,284 |
13,027 |
|
|
|
|
39 |
61,100 |
62,608 |
-1,508 |
-2,468 |
|
|
|
|
40 |
67,000 |
57,460 |
9,540 |
14,238 |
|
|
|
|
41 |
93,000 |
94,365 |
-1,365 |
-1,467 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Характеристики остатков |
|
|
|
|
|
|
|
|
Характеристика |
Значение |
|
|
|
|
|
|
|
Среднее значение |
0,000 |
|
|
|
|
|
|
|
Дисперсия |
384,455 |
|
|
|
|
|
|
|
Приведенная дисперсия |
414,807 |
|
|
|
|
|
|
|
Средний модуль остатков |
14,689 |
|
|
|
|
|
|
|
Относительная ошибка |
19,125 |
|
|
|
|
|
|
|
Критерий Дарбина-Уотсона |
2,250 |
|
|
|
|
|
|
|
Коэффициент детерминации |
0,963 |
|
|
|
|
|
|
|
F - значение ( n1 = 2, n2 = 38) |
498,702 |
|
|
|
|
|
|
|
Критерий адекватности |
94,136 |
|
|
|
|
|
|
|
Критерий точности |
0,466 |
|
|
|
|
|
|
|
Критерий качества |
23,883 |
|
|
|
|
|
|
|
Уравнение значимо с вероятностью 0.95 |
|
|
|
|
|
|
|
|
Для оценки качества модели регрессии вычисляем коэффициент множественной корреляции (индекс корреляции) R и коэффициент детерминации R2. Чем ближе к 1 значение этих характеристик, тем выше качество модели.
, где
n = 41 - число число наблюдений
k = 2 число независимых переменных
R2 = 0,963 (Таблица 6)
, следовательно, 96% вариаций зависимой переменной учтено в модели и обусловлено влиянием включенных факторов коэффициентов множественной корреляции.
Для проверки значимости модели регрессии используем Fитерий Фишера
Fтабл. = 3,25 с υ 1 и υ 2 степенями свободы
υ 1 = k = 2
υ 2 = n k 1 = 41 2 1 = 38
Fрасч. > Fтабл.
456 > 3,25, следовательно, модель значима.
4.3 Анализ статистической значимости параметров модели
Проверяем по t критерию Стьюдента при уровне значимости =0,15
t1(x1) = 5,156
t3(x3) = 12,973
tтабл. = 1,49665
tрасч > tтабл., следовательно, коэффициенты регрессии (х1 и х2) значимы.
Свойство случайности выполняется, следовательно, модель адекватна.
Sŷ1 =
Sŷ3 =
Полученное отношение имеет F распределение:
Fнабл. = 25,71 это значение больше критического значения (Fтабл. = 19,50 с υ 1 и υ 2 степенями свободы, υ 1 = k = 2, υ 2 = n k 1 = 41 2 1 = 38)
Fнабл. > Fтабл. Поэтому мы можем принять гипотезу о гетероскедастичости на 95% доверительной вероятности.