Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Министерство образования и науки РФ
Федеральное агентство по образованию ГОУ ВПО
Всероссийский заочный финансово экономический институт
Кафедра экономической теории
Факультет учетно-статистический
Контрольная работа
по эконометрике
Выполнила ст. 3 курса
Проверил проф. Региональной
каф. математики и информатики:
Сахабетдинов М.А.
Уфа - 2008
№ п.п. |
Цена квартиры, тыс.долл. (Y) |
Город области, 1 Подольск, 0 Люберцы (Х1) |
Число комнат в квартире (Х2) |
Жилая площадь квартиры, кв. м (Х4) |
1 |
38 |
1 |
1 |
19 |
2 |
62,2 |
1 |
2 |
36 |
3 |
125 |
0 |
3 |
41 |
4 |
61,1 |
1 |
2 |
34,8 |
5 |
67 |
0 |
1 |
18,7 |
6 |
93 |
0 |
2 |
27,7 |
7 |
118 |
1 |
3 |
59 |
8 |
132 |
0 |
3 |
44 |
9 |
92,5 |
0 |
3 |
56 |
10 |
105 |
1 |
4 |
47 |
11 |
42 |
1 |
1 |
18 |
12 |
125 |
1 |
3 |
44 |
13 |
170 |
0 |
4 |
56 |
14 |
38 |
0 |
1 |
16 |
15 |
130,5 |
0 |
4 |
66 |
16 |
85 |
0 |
2 |
34 |
17 |
98 |
0 |
4 |
43 |
18 |
128 |
0 |
4 |
59,2 |
19 |
85 |
0 |
3 |
50 |
20 |
160 |
1 |
3 |
42 |
21 |
60 |
0 |
1 |
20 |
22 |
41 |
1 |
1 |
14 |
23 |
90 |
1 |
4 |
47 |
24 |
83 |
0 |
4 |
49,5 |
25 |
45 |
0 |
1 |
18,9 |
26 |
39 |
0 |
1 |
18 |
27 |
86,9 |
0 |
3 |
58,7 |
28 |
40 |
0 |
1 |
22 |
29 |
80 |
0 |
2 |
40 |
30 |
227 |
0 |
4 |
91 |
31 |
235 |
0 |
4 |
90 |
32 |
40 |
1 |
1 |
15 |
33 |
67 |
1 |
1 |
18,5 |
34 |
123 |
1 |
4 |
55 |
35 |
100 |
0 |
3 |
37 |
36 |
105 |
1 |
3 |
48 |
37 |
70,3 |
1 |
2 |
34,8 |
38 |
82 |
1 |
3 |
48 |
39 |
280 |
1 |
4 |
85 |
40 |
200 |
1 |
4 |
60 |
Требуется:
Решение:
1. Рассчитаем матрицу парных коэффициентов корреляции и оценим статистическую значимость коэффициентов корреляции.
Используем Excel: для этого в меню сервис выберем анализ данных / корреляция. Получим матрицу коэффициентов парной корреляции между всеми имеющимися переменными:
|
Y |
Х1 |
Х2 |
Х4 |
Y |
1 |
|||
Х1 |
-0,01126 |
1 |
||
Х2 |
0,751061 |
-0,0341 |
1 |
|
Х4 |
0,874012 |
-0,0798 |
0,868524 |
1 |
Проанализируем коэффициенты корреляции между результирующим признаком Y и каждым из факторов Хj: зависимая переменная, стоимость квартиры имеет тесную связь с фактором, характеризующим жилую площадь r(Y, X4)=0,874 >0,7 и с числом комнат r(Y, X2)=0,751. С фактором, характеризующим город области зависимая переменная стоимость квартиры имеет обратную корреляционную зависимость (цена на квартиры выше в Люберцах) |r(Y, X1)| = - 0,01 .
Для проверки значимости найденных коэффициентов корреляции используем критерий Стьюдента.
Для каждого коэффициента r(Y, Xj) вычислим t-статистику по формуле t = и занесем результаты расчетов в корреляционную таблицу:
|
Y |
Х1 |
Х2 |
Х4 |
t-статистики |
Y |
1 |
||||
Х1 |
-0,0112 |
1 |
0,069411185 |
||
Х2 |
0,75106 |
-0,0341 |
1 |
7,012446419 |
|
Х4 |
0,87401 |
-0,0798 |
0,86852 |
1 |
11,08813705 |
По таблице критических точек распределения Стьюдента при уровне значимости α = 5% и числе степеней свободы k = n 2= 38 определим критическое значение с помощью функции СТЬЮДРАСПОБР tкр = 2,02.
Сопоставим фактическое значение t с критическим tкр.
t(r(Y, X1)) = 0,07 < tкр = 2,02, следовательно коэффициент r(Y, X1) не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой квартиры Y и городом области Х1 существует.
t(r(Y, X2)) = 7,01 > tкр = 2,02, следовательно коэффициент r(Y, X2) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной зависимости между признаками Y и Х2.
t(r(Y, X4)) = 11,09 > tкр = 2,02, следовательно коэффициент r(Y, X4) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной зависимости между признаками Y и Х4.
Таким образом, наиболее тесная и значимая зависимость наблюдается между ценой квартиры Y и жилой площадью квартиры Х4.
2. Построим поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Для построения поля корреляции используем Мастер диаграмм (точечная) покажем исходные данные Y и значение наиболее информативного фактора Х4. В результате получим диаграмму «поле корреляции»:
3. Рассчитать параметры линейных парных регрессий для всех факторов Х.
Для построения парной линейной модели Yt = a+b*X1. используем функцию РЕГРЕССИЯ пакета Анализа данных. В качестве входного интервала Х покажем значение фактора Х1.
Результаты вычислений представлены в таблицах:
ВЫВОД ИТОГОВ |
||||||
Регрессионная статистика |
||||||
Множественный R |
0,011259 |
|||||
R-квадрат |
0,000127 |
|||||
Нормированный R-квадрат |
-0,02619 |
|||||
Стандартная ошибка |
58,03646 |
|||||
Наблюдения |
40 |
|||||
Дисперсионный анализ |
||||||
|
df |
SS |
MS |
F |
Значимость F |
|
Регрессия |
1 |
16,22784 |
16,22784 |
0,004818 |
0,945026 |
|
Остаток |
38 |
127992,8 |
3368,231 |
|||
Итого |
39 |
128009 |
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
101,8136 |
12,37341 |
8,228419 |
5,73E-10 |
76,76497 |
126,8623 |
Х1 |
-1,2803 |
18,4452 |
-0,06941 |
0,945026 |
-38,6207 |
36,06005 |
Коэффициенты модели содержатся в третьей таблице итогов Регрессии.
Таким образом, уравнение модели с фактором X1 имеете вид:
YТ = 101,81 1,28*X1 (1)
Коэффициент регрессии b = 1,28, следовательно, цена реализации квартиры в Подольске в среднем на 1,28 тыс. долл. ниже цены реализации в Люберцах. Свободный член a = 101,81 не имеет реального смысла.
Аналогичные расчеты проведем для построения модели зависимости цены реализации Y от числа комнат в квартире Х2:
Регрессионная статистика |
|||||
Множественный R |
0,751061 |
||||
R-квадрат |
0,564092 |
||||
Нормированный R-квадрат |
0,552621 |
||||
Стандартная ошибка |
38,32002 |
||||
Наблюдения |
40 |
||||
Дисперсионный анализ |
|||||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
72208,88 |
72208,88 |
49,1744 |
2,37E-08 |
Остаток |
38 |
55800,11 |
1468,424 |
||
Итого |
39 |
128009 |
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
7,539299 |
14,67125 |
0,513882 |
0,61031 |
-22,1611 |
37,23969 |
Х2 |
36,03777 |
5,139115 |
7,012446 |
2,37E-08 |
25,63418 |
46,44136 |
Модель с фактором X2 построена, ее уравнение имеет вид:
YТ = 7,54 + 36,04*X2 (2)
Коэффициент регрессии b = 36,04, следовательно, при увеличении на 1 комнату в квартире в среднем на 36,04 тыс. долл. увеличивается цена квартиры. Свободный член a = 7,54 не имеет реального смысла.
Также построим модель зависимости цены квартиры Y от жилой площади квартиры Х4.
Регрессионная статистика |
||||||
Множественный R |
0,874012 |
|||||
R-квадрат |
0,763897 |
|||||
Нормированный R-квадрат |
0,757684 |
|||||
Стандартная ошибка |
28,20195 |
|||||
Наблюдения |
40 |
|||||
Дисперсионный анализ |
||||||
|
df |
SS |
MS |
F |
Значимость F |
|
Регрессия |
1 |
97785,7 |
97785,7 |
122,9468 |
1,79E-13 |
|
Остаток |
38 |
30223,29 |
795,3498 |
|||
Итого |
39 |
128009 |
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
-2,86485 |
10,39375 |
-0,27563 |
0,784324 |
-23,9059 |
18,17619 |
Х4 |
2,475975 |
0,223299 |
11,08814 |
1,79E-13 |
2,023929 |
2,928021 |
Модель с фактором X4 построена, ее уравнение имеет вид:
YТ = 2,86 + 2,48*X4 (3)
Коэффициент регрессии b = 2,48, следовательно при увеличении жилой площади квартиры на 1 кв. м в среднем на 2,48 тыс. долл. увеличивается цена квартиры. Свободный член a = 2,86 не имеет реального смысла.
4. Оценим качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F критерия Фишера.
Для удобства все результаты будем заносить в сводную таблицу.
Коэффициенты детерминации R-квадрат определены для каждой модели функцией РЕГРЕССИЯ и составляют:
Модель |
R-квадрат |
YТ = 101,81 1,28*X1 (1) |
0,000127 |
YТ = 7,54 + 36,04*X2 (2) |
0,564092 |
YТ = 2,86 + 2,48*X4 (3) |
0,763897 |
Таким образом, вариация цены квартиры Y на 0,01% объясняется по уравнению (1) изменением города области Х1; на 56,41% по уравнению (2) вариацией числа комнат в квартире Х2; на 76,39% по уравнению (3) изменением жилой площади квартиры Х4.
Для вычисления средней относительной ошибки аппроксимации рассмотрим остатки модели Еi = Yi YТi, содержащиеся в столбце Остатки итогов функции РЕГРЕССИЯ. Дополним таблицу столбцом относительных погрешностей, которые вычислим по формуле Еотн.i = 100 с помощью функции ABS.
Выполнение расчетов для модели (1):
ВЫВОД ОСТАТКА |
|||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погр-ти |
1 |
100,5333 |
-62,5333 |
164,5614 |
2 |
100,5333 |
-38,3333 |
61,62915 |
3 |
101,8136 |
23,18636 |
18,54909 |
4 |
100,5333 |
-39,4333 |
64,53901 |
5 |
101,8136 |
-34,8136 |
51,96065 |
6 |
101,8136 |
-8,81364 |
9,477028 |
7 |
100,5333 |
17,46667 |
14,80226 |
8 |
101,8136 |
30,18636 |
22,86846 |
9 |
101,8136 |
-9,31364 |
10,0688 |
10 |
100,5333 |
4,466667 |
4,253968 |
11 |
100,5333 |
-58,5333 |
139,3651 |
12 |
100,5333 |
24,46667 |
19,57333 |
13 |
101,8136 |
68,18636 |
40,10963 |
14 |
101,8136 |
-63,8136 |
167,9306 |
15 |
101,8136 |
28,68636 |
21,98189 |
16 |
101,8136 |
-16,8136 |
19,78075 |
17 |
101,8136 |
-3,81364 |
3,891466 |
18 |
101,8136 |
26,18636 |
20,4581 |
19 |
101,8136 |
-16,8136 |
19,78075 |
20 |
100,5333 |
59,46667 |
37,16667 |
21 |
101,8136 |
-41,8136 |
69,68939 |
22 |
100,5333 |
-59,5333 |
145,2033 |
23 |
100,5333 |
-10,5333 |
11,7037 |
24 |
101,8136 |
-18,8136 |
22,66703 |
25 |
101,8136 |
-56,8136 |
126,2525 |
26 |
101,8136 |
-62,8136 |
161,0606 |
27 |
101,8136 |
-14,9136 |
17,16184 |
28 |
101,8136 |
-61,8136 |
154,5341 |
29 |
101,8136 |
-21,8136 |
27,26705 |
30 |
101,8136 |
125,1864 |
55,14818 |
31 |
101,8136 |
133,1864 |
56,67505 |
32 |
100,5333 |
-60,5333 |
151,3333 |
33 |
100,5333 |
-33,5333 |
50,04975 |
34 |
100,5333 |
22,46667 |
18,26558 |
35 |
101,8136 |
-1,81364 |
1,813636 |
36 |
100,5333 |
4,466667 |
4,253968 |
37 |
100,5333 |
-30,2333 |
43,00616 |
38 |
100,5333 |
-18,5333 |
22,60163 |
39 |
100,5333 |
179,4667 |
64,09524 |
40 |
100,5333 |
99,46667 |
49,73333 |
По столбцу относительных погрешностей с помощью функции СРЗНАЧ найдем среднее значение отн = 54,13%.
Выполнение расчетов для модели (2):
ВЫВОД ОСТАТКА |
|||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погр-ти |
1 |
43,57707 |
-5,57707 |
14,6765 |
2 |
79,61484 |
-17,4148 |
27,99813 |
3 |
115,6526 |
9,347392 |
7,477914 |
4 |
79,61484 |
-18,5148 |
30,30252 |
5 |
43,57707 |
23,42293 |
34,9596 |
6 |
79,61484 |
13,38516 |
14,39265 |
7 |
115,6526 |
2,347392 |
1,989315 |
8 |
115,6526 |
16,34739 |
12,38439 |
9 |
115,6526 |
-23,1526 |
25,02985 |
10 |
151,6904 |
-46,6904 |
44,46703 |
11 |
43,57707 |
-1,57707 |
3,754925 |
12 |
115,6526 |
9,347392 |
7,477914 |
13 |
151,6904 |
18,30962 |
10,77037 |
14 |
43,57707 |
-5,57707 |
14,6765 |
15 |
151,6904 |
-21,1904 |
16,23784 |
16 |
79,61484 |
5,385162 |
6,335485 |
17 |
151,6904 |
-53,6904 |
54,7861 |
18 |
151,6904 |
-23,6904 |
18,50811 |
19 |
115,6526 |
-30,6526 |
36,06189 |
20 |
115,6526 |
44,34739 |
27,71712 |
21 |
43,57707 |
16,42293 |
27,37155 |
22 |
43,57707 |
-2,57707 |
6,285533 |
23 |
151,6904 |
-61,6904 |
68,54486 |
24 |
151,6904 |
-68,6904 |
82,75949 |
25 |
43,57707 |
1,422932 |
3,16207 |
26 |
43,57707 |
-4,57707 |
11,73607 |
27 |
115,6526 |
-28,7526 |
33,08701 |
28 |
43,57707 |
-3,57707 |
8,942671 |
29 |
79,61484 |
0,385162 |
0,481452 |
30 |
151,6904 |
75,30962 |
33,17605 |
31 |
151,6904 |
83,30962 |
35,4509 |
32 |
43,57707 |
-3,57707 |
8,942671 |
33 |
43,57707 |
23,42293 |
34,9596 |
34 |
151,6904 |
-28,6904 |
23,32551 |
35 |
115,6526 |
-15,6526 |
15,65261 |
36 |
115,6526 |
-10,6526 |
10,14534 |
37 |
79,61484 |
-9,31484 |
13,25013 |
38 |
115,6526 |
-33,6526 |
41,03977 |
39 |
151,6904 |
128,3096 |
45,82487 |
40 |
151,6904 |
48,30962 |
24,15481 |
По столбцу относительных погрешностей найдем среднее значение отн = 23,46%.
Выполнение расчетов для модели (3):
ВЫВОД ОСТАТКА |
|||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погр-ти |
1 |
44,17867 |
-6,17867 |
16,25965 |
2 |
86,27023 |
-24,0702 |
38,69812 |
3 |
98,65011 |
26,34989 |
21,07991 |
4 |
83,29906 |
-22,1991 |
36,33235 |
5 |
43,43587 |
23,56413 |
35,17034 |
6 |
65,71964 |
27,28036 |
29,33372 |
7 |
143,2176 |
-25,2176 |
21,37089 |
8 |
106,078 |
25,92197 |
19,63786 |
9 |
135,7897 |
-43,2897 |
46,7997 |
10 |
113,506 |
-8,50595 |
8,100909 |
11 |
41,70269 |
0,297309 |
0,707878 |
12 |
106,078 |
18,92197 |
15,13758 |
13 |
135,7897 |
34,21027 |
20,12369 |
14 |
36,75074 |
1,249258 |
3,287521 |
15 |
160,5495 |
-30,0495 |
23,02641 |
16 |
81,31828 |
3,681716 |
4,33143 |
17 |
103,6021 |
-5,60206 |
5,716383 |
18 |
143,7128 |
-15,7128 |
12,27566 |
19 |
120,9339 |
-35,9339 |
42,27515 |
20 |
101,1261 |
58,87392 |
36,7962 |
21 |
46,65464 |
13,34536 |
22,24227 |
22 |
31,79879 |
9,201207 |
22,44197 |
23 |
113,506 |
-23,506 |
26,11773 |
24 |
119,6959 |
-36,6959 |
44,21192 |
25 |
43,93107 |
1,068932 |
2,375404 |
26 |
41,70269 |
-2,70269 |
6,929977 |
27 |
142,4749 |
-55,5749 |
63,95265 |
28 |
51,60659 |
-11,6066 |
29,01647 |
29 |
96,17413 |
-16,1741 |
20,21766 |
30 |
222,4488 |
4,551164 |
2,004918 |
31 |
219,9729 |
15,02714 |
6,394527 |
32 |
34,27477 |
5,725233 |
14,31308 |
33 |
42,94068 |
24,05932 |
35,90944 |
34 |
133,3138 |
-10,3138 |
8,385163 |
35 |
88,74621 |
11,25379 |
11,25379 |
36 |
115,9819 |
-10,9819 |
10,45898 |
37 |
83,29906 |
-12,9991 |
18,49085 |
38 |
115,9819 |
-33,9819 |
41,44138 |
39 |
207,593 |
72,40701 |
25,85965 |
40 |
145,6936 |
54,30638 |
27,15319 |
По столбцу относительных погрешностей найдем среднее значение отн = 21,89%.
Разнесем результаты в сводную таблицу:
Модель |
R-квадрат |
отн |
YТ = 101,81 1,28*X1 (1) |
0,000127 |
54,13% |
YТ = 7,54 + 36,04*X2 (2) |
0,564092 |
23,46% |
YТ = 2,86 + 2,48*X4 (3) |
0,763897 |
21,89% |
Оценим точность построенных моделей:
отн1 = 54,13% > 15%, отн2 = 23,46% > 15%, отн3 = 21,89% > 15%.
Точность всех трех моделей неудовлетворительная. Ближе к 15% отн модели (3).
Проверим значимость полученных уравнений с помощью F критерия Фишера.
F статистики определены функцией РЕГРЕССИЯ и составляют:
Модель |
R-квадрат |
отн |
F |
YТ = 101,81 1,28*X1 (1) |
0,000127 |
54,13% |
0,004818 |
YТ = 7,54 + 36,04*X2 (2) |
0,564092 |
23,46% |
49,1744 |
YТ = 2,86 + 2,48*X4 (3) |
0,763897 |
21,89% |
122,9468 |
С помощью функции FРАСПОБР найдем значение Fкр = 4,1 для уровня значимости α = 5%, и чисел степеней свободы k1 = 1, k2 = 38.
F = 0,0048 < Fкр = 4,1, следовательно уравнение модели (1) не является значимой и ее использование нецелесообразно. F = 49,17 > Fкр = 4,1, F = 122,95 > Fкр = 4,1, следовательно, уравнения моделей (2) и (3) являются значимыми, их использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель (2) факторной переменной Х2 и включенной в модель (3) факторной переменной Х4.
На основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (3) зависимости цены квартиры от ее жилой площади. Однако эту модель нецелесообразно использовать для прогнозирования в реальных условиях, поскольку ее точность неудовлетворительная, и дальнейшие расчеты проведем в учебных целях.
5. Согласно условию задачи прогнозное значение фактора Х4 составляет 80% от его максимального значения. Максимальное значение Х4 = 91 найдем с помощью функции МАКС. Тогда прогнозное значение Х4* = 72,8. Рассчитаем по уравнению модели (3) прогнозное значение Y:
Y*Т = 2,86 + 2,48* Х4* = 2,86 + 2,48 * 72,8 = 177,39.
Таким образом, если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая цена квартиры будет составлять около 177,39 тыс. долл.
Зададим доверительную вероятность p = 1 α = 1 0,1 = 0,9 и построим доверительный прогнозный интервал для среднего значения Y.
Для этого нужно рассчитать стандартную ошибку прогнозирования для среднего значения результирующего признака:
S(Y*Т) = SE * .
Предварительно подготовим:
- стандартная ошибка SE = 28,2 из таблицы «регрессионная статистика»
- по столбцу данных Х4 найдем среднее значение = 42,04 с помощью функции СРЗНАЧ и определим = 15950,82 с помощью функции КВАДРОТКЛ;
- tкр коэффициент Стьюдента для уровня значимости α=10% и числа степеней свободы k = 38. tкр = 1,686 с помощью функции СТЬЮДРАСПОБР.
Следовательно, стандартная ошибка прогнозирования для среднего значения составляет:
S(Y*Т) = 28,2 * = 8,188 .
Размах доверительного интервала для среднего значения:
U(Y*Т) = tкр * S(Y*Т) = 1,686 * 8,188 = 13,805.
Границами прогнозного интервала будут:
Uнижн = Y*Т U(Y*Т) = 177,39 13,805 = 163,58;
Uверх = Y*Т + U(Y*Т) = 177,39 + 13,805 = 191,19.
Таким образом, с надежностью 90% можно утверждать, что если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая средняя цена квартиры будет от 163,58 тыс. долл. до 191,19 тыс. долл.
Для построения чертежа воспользуемся Мастером диаграмм (точечная) покажем исходные данные (поле корреляции). Затем с помощью опции добавить линию тренда, построим линию модели и покажем на графике результаты прогнозирования.
6. Методом включения построим двух факторные модели, сохраняя в них наиболее информативный фактор жилую площадь квартиры (Х4).
В качестве «входного интервала Х» укажем значения факторов Х1 и Х4, с помощью функции РЕГРЕССИЯ получим:
ВЫВОД ИТОГОВ |
|
Регрессионная статистика |
|
Множественный R |
0,875979 |
R-квадрат |
0,767339 |
Нормированный R-квадрат |
0,754763 |
Стандартная ошибка |
28,3714 |
Наблюдения |
40 |
|
Коэффициенты |
Y-пересечение |
-6,4361 |
Х1 |
6,692936 |
Х4 |
2,48928 |
Таким образом, модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4 построена, ее уравнение имеет вид: YТ = 6,44 + 6,69*X1 + 2,49*Х4.
Используем в качестве «входного интервала Х» значения факторов Х2 и Х4, с помощью функции РЕГРЕССИИ найдем:
ВЫВОД ИТОГОВ |
|
Регрессионная статистика |
|
Множественный R |
0,874163 |
R-квадрат |
0,76416 |
Нормированный R-квадрат |
0,751412 |
Стандартная ошибка |
28,56458 |
Наблюдения |
40 |
|
Коэффициенты |
Y-пересечение |
-2,16757 |
Х2 |
-1,57033 |
Х4 |
2,556497 |
Таким образом, модель (5) зависимости цены квартиры Y от числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:
YТ = 2,17 1,57*X2 + 2,56*Х4.
Построим множественную модель регрессии, учитывая все факторы (Х1, Х2, и Х4):
ВЫВОД ИТОГОВ |
|
Регрессионная статистика |
|
Множественный R |
0,876218 |
R-квадрат |
0,767758 |
Нормированный R-квадрат |
0,748404 |
Стандартная ошибка |
28,73688 |
Наблюдения |
40 |
|
Коэффициенты |
Y-пересечение |
-5,64357 |
Х1 |
6,859631 |
Х2 |
-1,98516 |
Х4 |
2,591406 |
Таким образом, трехфакторная модель (6) зависимости цены квартиры Y от города области Х1, числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:
YТ = 5,67 + 6,86*Х1 1,99*X2 + 2,59*Х4.
Выберем лучшую из построенных. Для сравнения моделей с различным количеством учтенных в них факторов используем нормированные коэффициенты детерминации, которые содержатся в строке «нормированный R-квадрат» функции РЕГРЕССИЯ. Чем больше величина нормированного коэффициента детерминации, тем лучше модель.
Модель |
Нормированный R-квадрат |
YТ = 6,44 + 6,69*X1 + 2,49*Х4 (4) |
0,754763 |
YТ = 2,17 1,57*X2 + 2,56*Х4 (5) |
0,751412 |
YТ = 5,67 + 6,86*Х1 1,99*X2 + 2,59*Х4 (6) |
0,748404 |
Таким образом, лучшей является модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4:
YТ = 6,44 + 6,69*X1 + 2,49*Х4.
Коэффициент регрессии b1 = 6,69, следовательно, при покупке квартиры в Люберцах (Х1) той же жилой площади (Х4), что и в Подольске цена квартиры (Y) увеличится в среднем на 6,69 тыс. долл.
Коэффициент регрессии b2 = 2,49, следовательно, при увеличении жилой площади (Х4) на 1 кв. м в одном городе (Х1), цена квартиры (Y) увеличится в среднем на 2,48 тыс. долл. Свободный коэффициент не имеет экономического смысла.
7. Оценим качество модели. Для оценки качества выбранной множественной модели (4) YТ = 6,44 + 6,69*X1 + 2,49*Х4 используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F критерий Фишера.
Коэффициент детерминации R-квадрат выпишем из таблица «Регрессионная статистика» для модели (4).
R2 = 0,767, следовательно, вариация цены квартиры Y на 76,7% объясняется по данному уравнению вариацией города области Х1 и жилой площади Х4.
Используем исходные данные Yi и найденные остатки Еi из таблицы «Вывод остатка» для модели (4). Рассчитаем относительные погрешности и найдем среднее значение отн.
ВЫВОД ОСТАТКА |
|||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погр-ти |
1 |
47,55316 |
-9,55316 |
25,13988493 |
2 |
89,87092 |
-27,6709 |
44,48700502 |
3 |
95,62438 |
29,37562 |
23,50049523 |
4 |
86,88378 |
-25,7838 |
42,19931434 |
5 |
40,11344 |
26,88656 |
40,12920021 |
6 |
62,51696 |
30,48304 |
32,77746634 |
7 |
147,1244 |
-29,1244 |
24,68165955 |
8 |
103,0922 |
28,90778 |
21,89983249 |
9 |
132,9636 |
-40,4636 |
43,74441266 |
10 |
117,253 |
-12,253 |
11,66952159 |
11 |
45,06388 |
-3,06388 |
7,294943394 |
12 |
109,7852 |
15,21484 |
12,17187399 |
13 |
132,9636 |
37,03642 |
21,7861284 |
14 |
33,39238 |
4,60762 |
12,12531651 |
15 |
157,8564 |
-27,3564 |
20,96274499 |
16 |
78,19942 |
6,800579 |
8,000681624 |
17 |
100,6029 |
-2,60294 |
2,656062313 |
18 |
140,9293 |
-12,9293 |
10,10099834 |
19 |
118,0279 |
-33,0279 |
38,85635461 |
20 |
104,8066 |
55,1934 |
34,49587661 |
21 |
43,3495 |
16,6505 |
27,75083346 |
22 |
35,10676 |
5,893244 |
14,37376579 |
23 |
117,253 |
-27,253 |
30,28110852 |
24 |
116,7833 |
-33,7833 |
40,70272457 |
25 |
40,61129 |
4,388708 |
9,752684736 |
26 |
38,37094 |
0,62906 |
1,612974811 |
27 |
139,6846 |
-52,7846 |
60,7418157 |
28 |
48,32806 |
-8,32806 |
20,82015006 |
29 |
93,1351 |
-13,1351 |
16,41887615 |
30 |
220,0884 |
6,911617 |
3,044764999 |
31 |
217,5991 |
17,4009 |
7,40463685 |
32 |
37,59604 |
2,403964 |
6,009909809 |
33 |
46,30852 |
20,69148 |
30,88281157 |
34 |
137,1672 |
-14,1672 |
11,51807973 |
35 |
85,66726 |
14,33274 |
14,33273923 |
36 |
119,7423 |
-14,7423 |
14,04026449 |
37 |
86,88378 |
-16,5838 |
23,59001573 |
38 |
119,7423 |
-37,7423 |
46,02716795 |
39 |
211,8456 |
68,15436 |
24,34084302 |
40 |
149,6136 |
50,38636 |
25,19318084 |
По столбцу относительных погрешностей с помощью функции СРЗНАЧ найдем среднее значение отн = 22,69%.
Сравнение показывает, что 22,69% > 15%. Следовательно, точность модели неудовлетворительная.
С помощью F критерия Фишера проверим значимость модели в целом. Для этого возьмем данные из таблицы «дисперсионный анализ» для модели (4)) F = 61,01.
Дисперсионный анализ |
|||||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
2 |
98226,35 |
49113,17573 |
61,01499 |
1,92E-12 |
Остаток |
37 |
29782,64 |
804,9362779 |
||
Итого |
39 |
128009 |
|
|
|
С помощью функции FРАСПОБР найдем значение Fкр = 3,25 для уровня значимости α = 5%, и чисел степеней свободы k1 = 2, k2 = 37.
F = 61,01 > Fкр = 3,25, следовательно, уравнения модели (4) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (4) факторными переменными Х1 и Х4.
Дополнительно с помощью t критерия Стьюдента проверим значимость отдельных коэффициентов модели.
Для выбранной модели (4) получены следующие значения:
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Y-пересечение |
-6,4361 |
11,51649 |
-0,558859663 |
0,579624 |
Х1 |
6,692936 |
9,045869 |
0,739888746 |
0,464037 |
Х4 |
2,48928 |
0,22536 |
11,04580516 |
2,85E-13 |
Критическое значение tкр найдено для уровня значимости α = 5% и числа степеней свободы k = 40 2 1 = 37. tкр = 2,03.
Для свободного коэффициента a= 6,44 определена статистика
t(a) = 0,56. |t(a)| = 0,56 < tкр = 2,03, следовательно, свободный коэффициент a = 6,44 не является значимым, его можно исключить из модели.
Для коэффициента регрессии b1 = 6,69 определена статистика t(b1)= 0,74.
|t(b1)| = 0,74 < tкр = 2,03, следовательно, коэффициента регрессии b1 не является значимым, его и фактор города области можно исключить из модели.
Для коэффициента регрессии b2=2,49 определена статистика t(b2)= 11,05.
|t(b2)| = 11,05 > tкр = 2,03, следовательно, коэффициента регрессии b2 является значимым, его и фактор жилой площади квартиры нужно сохранить в модели.
Выводы о значимости коэффициентов модели сделаны на уровне значимости α = 5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент a можно считать значимым на уровне 0,58 = 58%; коэффициент регрессии b1 на уровне 0,46 = 46%;, а коэффициент регрессии b2 на уровне 2,85E-13 = 0,000000000000285 = 0,000000000001%.
При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (4) используем нормированные коэффициенты детерминации.
Модель |
Нормированный R-квадрат |
YТ = 2,86 + 2,48*X4 (3) |
0,757684 |
YТ = 6,44 + 6,69*X1 + 2,49*Х4 (4) |
0,754763 |
Таким образом, при добавлении в уравнение регрессии фактора «город области» Х1 качество модели ухудшилось, что говорит не в пользу сохранения фактора Х1 в модели.
Средние коэффициенты эластичности в случае линейной модели определяются формулами Эj = bj * .
С помощью функции СРЗНАЧ найдем: = 0,45, = 42,045, = 101,24. Тогда Э1 = 6,69 * = 0,03, Э2 = 2,49 * = 1,03 .
Следовательно, при покупке квартиры в Люберцах (Х1) и неизменной жилой площади цена квартиры увеличится в среднем на 0,03%.
Увеличение жилой площади Х4 в том же городе на 1% приводит к увеличению цены квартиры в среднем на 1,03%.
Бета - коэффициенты определяются формулами βj = bj * .
С помощью функции СТАНДОТКЛОН найдем SX1 = 0,5; SX4 = 20,22; SY = 57,29. Тогда
β1 = 6,69 * = 0,06; β2 = 2,49 * = 0,88.
Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0,06 своего стандартного отклонения SY, а при увеличении только фактора Х4 на одно его стандартное отклонение увеличивается на 0,88 SY.
Дельта - коэффициенты определяются формулами Δj = βj * .
Коэффициенты парной корреляции r(Y, X1) = 0,01, и r(Y, X4) = 0,87 найдены с помощью функции КОРРЕЛЯЦИЯ. Коэффициент детерминации R2 = 0,77 определен для рассматриваемой двухфакторной модели функцией РЕГРЕССИЯ.
Вычислим дельта - коэффициенты:
Δ1 = 0,06 * = 0,0009; Δ2 = 0,88 * = 1,0009.
Поскольку Δ1 < 0, то факторная переменная Х1 выбрана неудачно и ее нужно исключить из модели.
Значит, по уравнению полученной линейной двухфакторной модели изменение результирующего фактора Y (цены квартиры) на 100% объясняется воздействием фактора Х4 (жилой площадью квартиры).
Задача № 2. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.
В течение девяти последовательных недель фиксировался спрос Y(t) (млн. руб.) на кредитные ресурсы финансовой компании. Временной ряд Y(t) этого показателя приведен в таблице.
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Y(t) |
30 |
28 |
33 |
37 |
40 |
42 |
44 |
49 |
47 |
Задание:
Подготовим Sy = 7,42 с помощью функции СТАНДОТКЛОН и рассчитаем λt-статистики. Результат расчетов приведем в таблице:
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Y(t) |
30 |
28 |
33 |
37 |
40 |
42 |
44 |
49 |
47 |
λt |
0,27 |
0,67 |
0,54 |
0,40 |
0,27 |
0,27 |
0,67 |
0,27 |
При n = 9 и уровне значимости α = 5% можно использовать λкр= 1,5.
Все λt-статистики меньше λкр, то есть аномальных наблюдений нет. Исходный ряд будем использовать для выполнения следующих пунктов задачи.
2. Построим линейную модель временного ряда Yt = a + b * t
С помощью функции РЕГРЕССИЯ найдем:
ВЫВОД ИТОГОВ |
|||||
Регрессионная статистика |
|||||
Множественный R |
0,971442 |
||||
R-квадрат |
0,9437 |
||||
Нормированный R-квадрат |
0,935657 |
||||
Стандартная ошибка |
1,883091 |
||||
Наблюдения |
9 |
||||
Дисперсионный анализ |
|||||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
416,0667 |
416,0667 |
117,333 |
1,26E-05 |
Остаток |
7 |
24,82222 |
3,546032 |
||
Итого |
8 |
440,8889 |
|
|
|
|
Коэффициенты |
||||
Y-пересечение |
25,72222 |
||||
t |
2,633333 |
Таким образом, a = 25,72, b = 2,63. Модель построена, ее уравнение имеет вид:
Yt = 25,72 + 2,63 * t.
Коэффициент регрессии b = 2,63 показывает, что с каждой неделей спрос на кредитные ресурсы финансовой компании (Y) увеличивается в среднем на 2,63 млн. руб.
3. Оценим адекватность построенной модели, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения.
Проверка перечисленных свойств состоит в исследовании Ряда остатков et, который содержится в таблице «Вывод остатка».
ВЫВОД ОСТАТКА |
||
Наблюдение |
Предсказанное Y(t) |
Остатки |
1 |
28,35556 |
1,644444 |
2 |
30,98889 |
-2,98889 |
3 |
33,62222 |
-0,62222 |
4 |
36,25556 |
0,744444 |
5 |
38,88889 |
1,111111 |
6 |
41,52222 |
0,477778 |
7 |
44,15556 |
-0,15556 |
8 |
46,78889 |
2,211111 |
9 |
49,42222 |
-2,42222 |
Для проверки свойства независимости остаточной компоненты используем критерий Дарбина - Уотсона. Согласно этому критерию вычислим по формуле статистику d = .
Подготовим для вычислений:
С помощью функции СУММКВ = 24,82; с помощью функции СУММКВРАЗН = 56,94.
Таким образом, d = = 2,29. Поскольку d > 2, то перейдем к d = 4 d = 4 2.29 = 1,71.
По таблице d-статистик Дарбина - Уотсона определим критические уровни: нижний d1 = 0,82 и верхний d2 = 1,32.
Сравним полученную фактическую величину d с критическими уровнями d1 и d2 и сделаем выводы:
d = 1,71 (d2 = 1,32; 2), следовательно, свойство независимости остатков для построенной модели выполняется.
Для проверки свойства случайности остаточной компоненты используем критерий поворотных точек (пиков), основой которого является определение количества поворотных точек для ряда остатков. С помощью Мастера диаграмм построим график остатков et.
Поворотные точки вторая, пятая, седьмая, восьмая. Их количество p=4. По формуле pкр = при n = 9 вычислим критическое значение pкр= = 2.
Сравним значения p и pкр : p = 4 > pкр= 2, следовательно, свойство случайности для ряда остатков выполняется.
Для проверки соответствия ряда остатков нормальному закону распределения используем R/S критерий.
В соответствии с этим критерием вычислим по формуле статистику R/S = .
Подготовим для вычислений:
С помощью функции МАКС emax = 2,21 максимальный уровень ряда остатков;
С помощью функции МИН emin = 2,99 минимальный уровень ряда остатков;
S(e) = 1,88 стандартная ошибка модели из таблицы «регрессионная статистика».
Получим: R/S = = 2,76.
По таблице критических границ отношения R/S определим критический интервал. При n = 9 можно использовать (2,67; 3,69). Сопоставим фактическую величину R/S с критическим интервалом: 2,76(2,67; 3,69), значит, для построенной модели свойство нормального распределения остаточной компоненты выполняется.
Проведенная проверка показывает, что для построенной модели выполняются все свойства. Таким образом, данная модель является адекватной, и ее можно использовать для построения прогнозных оценок.
4. Оценим точность модели на основе использования средней относительной ошибки аппроксимации.
Используем исходные данные Yt и найденные функцией РЕГРЕССИЯ остатки et по формуле eотн.t = 100 рассчитаем столбец относительных погрешностей и найдем среднее значение отн = 3,78%.
ВЫВОД ОСТАТКА |
|||
Наблюдение |
Предсказанное Y(t) |
Остатки |
Отн. погр-ти |
1 |
28,35556 |
1,644444 |
5,481481 |
2 |
30,98889 |
-2,98889 |
10,6746 |
3 |
33,62222 |
-0,62222 |
1,885522 |
4 |
36,25556 |
0,744444 |
2,012012 |
5 |
38,88889 |
1,111111 |
2,777778 |
6 |
41,52222 |
0,477778 |
1,137566 |
7 |
44,15556 |
-0,15556 |
0,353535 |
8 |
46,78889 |
2,211111 |
4,512472 |
9 |
49,42222 |
-2,42222 |
5,153664 |
Сравнение показывает, что 3,78% < 5%, следовательно, модель имеет высокую точность.
5. Осуществим прогноз спроса на следующие 2 недели.
«Следующие 2 недели» соответствуют периодам k1 = 1 и k2 = 2, при этом = n + k1 = 10 и = n + k2 = 11.
Согласно уравнению модели получим точечные прогнозные оценки:
Y*10 = 25,72 + 2,63 * 10 = 52,05 и Y*11 = 25,72 + 2,63 * 11 = 54,69.
Таким образом, ожидаемый спрос на кредитные ресурсы финансовой компании в следующие 2 недели будут составлять около 52,05 млн. руб. и 54,69 млн. руб. соответственно.
Для оценки точности прогнозирования рассчитаем границы прогнозного интервала для индивидуальных значений результирующего признака (доверительная вероятность p = 70%).
Подготовим:
С помощью функции СТЬЮДРАСПОБР при α = 100 % - 70 % = 30 %, k = 9 2 = 7. tкр = 1,12;
S(e) = 1,88;
С помощью функции СРЗНАЧ = 5;
С помощью функции КВАДРОТКЛ = 60.
Вычислим размах прогнозного интервала для индивидуальных значений, используя формулу: Un = .
При = 10 получим U10 = 2,6 и определим границы доверительного интервала: Uниж10= Y*10 U10 = 49,45; Uверх10= Y*10 + U10 = 54,66.
При = 11 получим U11 = 2,76 и определим границы доверительного интервала: Uниж11= Y*11 U11 = 51,93; Uверх11= Y*11 + U11 = 57,45.
Таким образом, с надежностью 70% можно утверждать, что спрос на кредитные ресурсы финансовой компании на следующую (10-ю) неделю будет составлять от 49,45 до 54,66 млн. руб., а через неделю (11-ю) от 51,93 до 57,45 млн. руб.
6. Представим графически фактические значения показателя, результаты моделирования и прогнозирования.
Для построения чертежа воспользуемся Мастером диаграмм (точечная) покажем исходные данные. С помощью опции Добавить линию тренда… построим линию модели и покажем на графике результаты прогнозирования.