У вас вопросы?
У нас ответы:) SamZan.net

тематики и информатики- Сахабетдинов М

Работа добавлена на сайт samzan.net: 2016-03-13

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Имя

Выберите тип работы:

Принимаю Политику конфиденциальности

Скидка 25% при заказе до 1.7.2025

Министерство образования и науки РФ

Федеральное агентство по образованию ГОУ ВПО

Всероссийский заочный финансово – экономический институт

Кафедра экономической теории

Факультет учетно-статистический

Контрольная работа

по эконометрике

Выполнила ст. 3 курса

Проверил проф. Региональной

каф. математики и информатики:

Сахабетдинов М.А.

Уфа - 2008

Задание № 1. Эконометрическое моделирование стоимости квартир в Московской области.

Наименование показателей и исходных данных для эконометрического моделирования представлены в таблице:

№ п.п.	Цена квартиры, тыс.долл. (Y)	Город области, 1 – Подольск, 0 – Люберцы (Х1)	Число комнат в квартире (Х2)	Жилая площадь квартиры, кв. м (Х4)
1	38	1	1	19
2	62,2	1	2	36
3	125	0	3	41
4	61,1	1	2	34,8
5	67	0	1	18,7
6	93	0	2	27,7
7	118	1	3	59
8	132	0	3	44
9	92,5	0	3	56
10	105	1	4	47
11	42	1	1	18
12	125	1	3	44
13	170	0	4	56
14	38	0	1	16
15	130,5	0	4	66
16	85	0	2	34
17	98	0	4	43
18	128	0	4	59,2
19	85	0	3	50
20	160	1	3	42
21	60	0	1	20
22	41	1	1	14
23	90	1	4	47
24	83	0	4	49,5
25	45	0	1	18,9
26	39	0	1	18
27	86,9	0	3	58,7
28	40	0	1	22
29	80	0	2	40
30	227	0	4	91
31	235	0	4	90
32	40	1	1	15
33	67	1	1	18,5
34	123	1	4	55
35	100	0	3	37
36	105	1	3	48
37	70,3	1	2	34,8
38	82	1	3	48
39	280	1	4	85
40	200	1	4	60

Требуется:

Рассчитать матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов корреляции.
Построить поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитать параметры линейных парных регрессий для всех факторов Х.
Оценить качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F – критерия Фишера. Выбрать лучшую модель.
С использованием лучшей модели осуществить прогнозирование среднего значения показателя Y при уровне значимости α = 0,1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представить графически и модельные значения Y, результаты прогнозирования.
Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель формирования цены квартиры за счет значимых факторов. Дать экономическую интерпретацию коэффициентов модели регрессии.
Оценить качество модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дать оценку влияния значимых факторов на результат с помощью коэффициента эластичности, β- и Δ-коэффициентов.

Решение:

1. Рассчитаем матрицу парных коэффициентов корреляции и оценим статистическую значимость коэффициентов корреляции.

Используем Excel: для этого в меню сервис выберем анализ данных / корреляция. Получим матрицу коэффициентов парной корреляции между всеми имеющимися переменными:

	Y	Х1	Х2	Х4
Y	1
Х1	-0,01126	1
Х2	0,751061	-0,0341	1
Х4	0,874012	-0,0798	0,868524	1

Проанализируем коэффициенты корреляции между результирующим признаком Y и каждым из факторов Хj: зависимая переменная, стоимость квартиры имеет тесную связь с фактором, характеризующим жилую площадь r(Y, X4)=0,874 >0,7 и с числом комнат r(Y, X2)=0,751. С фактором, характеризующим город области зависимая переменная – стоимость квартиры имеет обратную корреляционную зависимость (цена на квартиры выше в Люберцах) |r(Y, X1)| = - 0,01 .

Для проверки значимости найденных коэффициентов корреляции используем критерий Стьюдента.

Для каждого коэффициента r(Y, Xj) вычислим t-статистику по формуле t = и занесем результаты расчетов в корреляционную таблицу:

	Y	Х1	Х2	Х4	t-статистики
Y	1
Х1	-0,0112	1			0,069411185
Х2	0,75106	-0,0341	1		7,012446419
Х4	0,87401	-0,0798	0,86852	1	11,08813705

По таблице критических точек распределения Стьюдента при уровне значимости α = 5% и числе степеней свободы k = n – 2= 38 определим критическое значение с помощью функции СТЬЮДРАСПОБР tкр = 2,02.

Сопоставим фактическое значение t с критическим tкр.

t(r(Y, X1)) = 0,07 < tкр = 2,02, следовательно коэффициент r(Y, X1) не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой квартиры Y и городом области Х1 существует.

t(r(Y, X2)) = 7,01 > tкр = 2,02, следовательно коэффициент r(Y, X2) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной зависимости между признаками Y и Х2.

t(r(Y, X4)) = 11,09 > tкр = 2,02, следовательно коэффициент r(Y, X4) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной зависимости между признаками Y и Х4.

Таким образом, наиболее тесная и значимая зависимость наблюдается между ценой квартиры Y и жилой площадью квартиры Х4.

2. Построим поле корреляции результативного признака и наиболее тесно связанного с ним фактора.

Для построения поля корреляции используем Мастер диаграмм (точечная) – покажем исходные данные Y и значение наиболее информативного фактора Х4. В результате получим диаграмму «поле корреляции»:

3. Рассчитать параметры линейных парных регрессий для всех факторов Х.

Для построения парной линейной модели Yt = a+b*X1. используем функцию РЕГРЕССИЯ пакета Анализа данных. В качестве входного интервала Х покажем значение фактора Х1.

Результаты вычислений представлены в таблицах:

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,011259
R-квадрат	0,000127
Нормированный R-квадрат	-0,02619
Стандартная ошибка	58,03646
Наблюдения	40

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	16,22784	16,22784	0,004818	0,945026
Остаток	38	127992,8	3368,231
Итого	39	128009
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	101,8136	12,37341	8,228419	5,73E-10	76,76497	126,8623
Х1	-1,2803	18,4452	-0,06941	0,945026	-38,6207	36,06005

Коэффициенты модели содержатся в третьей таблице итогов Регрессии.

Таким образом, уравнение модели с фактором X1 имеете вид:

YТ = 101,81 – 1,28*X1 (1)

Коэффициент регрессии b = –1,28, следовательно, цена реализации квартиры в Подольске в среднем на 1,28 тыс. долл. ниже цены реализации в Люберцах. Свободный член a = 101,81 не имеет реального смысла.

Аналогичные расчеты проведем для построения модели зависимости цены реализации Y от числа комнат в квартире Х2:

Регрессионная статистика
Множественный R	0,751061
R-квадрат	0,564092
Нормированный R-квадрат	0,552621
Стандартная ошибка	38,32002
Наблюдения	40

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	72208,88	72208,88	49,1744	2,37E-08
Остаток	38	55800,11	1468,424
Итого	39	128009

	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	7,539299	14,67125	0,513882	0,61031	-22,1611	37,23969
Х2	36,03777	5,139115	7,012446	2,37E-08	25,63418	46,44136

Модель с фактором X2 построена, ее уравнение имеет вид:

YТ = 7,54 + 36,04*X2 (2)

Коэффициент регрессии b = 36,04, следовательно, при увеличении на 1 комнату в квартире в среднем на 36,04 тыс. долл. увеличивается цена квартиры. Свободный член a = 7,54 не имеет реального смысла.

Также построим модель зависимости цены квартиры Y от жилой площади квартиры Х4.

Регрессионная статистика
Множественный R	0,874012
R-квадрат	0,763897
Нормированный R-квадрат	0,757684
Стандартная ошибка	28,20195
Наблюдения	40

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	97785,7	97785,7	122,9468	1,79E-13
Остаток	38	30223,29	795,3498
Итого	39	128009
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-2,86485	10,39375	-0,27563	0,784324	-23,9059	18,17619
Х4	2,475975	0,223299	11,08814	1,79E-13	2,023929	2,928021

Модель с фактором X4 построена, ее уравнение имеет вид:

YТ = – 2,86 + 2,48*X4 (3)

Коэффициент регрессии b = 2,48, следовательно при увеличении жилой площади квартиры на 1 кв. м в среднем на 2,48 тыс. долл. увеличивается цена квартиры. Свободный член a = –2,86 не имеет реального смысла.

4. Оценим качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F – критерия Фишера.

Для удобства все результаты будем заносить в сводную таблицу.

Коэффициенты детерминации R-квадрат определены для каждой модели функцией РЕГРЕССИЯ и составляют:

Модель	R-квадрат
YТ = 101,81 – 1,28*X1 (1)	0,000127
YТ = 7,54 + 36,04*X2 (2)	0,564092
YТ = – 2,86 + 2,48*X4 (3)	0,763897

Таким образом, вариация цены квартиры Y на 0,01% объясняется по уравнению (1) изменением города области Х1; на 56,41% по уравнению (2) вариацией числа комнат в квартире Х2; на 76,39% по уравнению (3) изменением жилой площади квартиры Х4.

Для вычисления средней относительной ошибки аппроксимации рассмотрим остатки модели Еi = Yi – YТi, содержащиеся в столбце Остатки итогов функции РЕГРЕССИЯ. Дополним таблицу столбцом относительных погрешностей, которые вычислим по формуле Еотн.i = 100 с помощью функции ABS.

Выполнение расчетов для модели (1):

ВЫВОД ОСТАТКА
Наблюдение	Предсказанное Y	Остатки	Отн. погр-ти
1	100,5333	-62,5333	164,5614
2	100,5333	-38,3333	61,62915
3	101,8136	23,18636	18,54909
4	100,5333	-39,4333	64,53901
5	101,8136	-34,8136	51,96065
6	101,8136	-8,81364	9,477028
7	100,5333	17,46667	14,80226
8	101,8136	30,18636	22,86846
9	101,8136	-9,31364	10,0688
10	100,5333	4,466667	4,253968
11	100,5333	-58,5333	139,3651
12	100,5333	24,46667	19,57333
13	101,8136	68,18636	40,10963
14	101,8136	-63,8136	167,9306
15	101,8136	28,68636	21,98189
16	101,8136	-16,8136	19,78075
17	101,8136	-3,81364	3,891466
18	101,8136	26,18636	20,4581
19	101,8136	-16,8136	19,78075
20	100,5333	59,46667	37,16667
21	101,8136	-41,8136	69,68939
22	100,5333	-59,5333	145,2033
23	100,5333	-10,5333	11,7037
24	101,8136	-18,8136	22,66703
25	101,8136	-56,8136	126,2525
26	101,8136	-62,8136	161,0606
27	101,8136	-14,9136	17,16184
28	101,8136	-61,8136	154,5341
29	101,8136	-21,8136	27,26705
30	101,8136	125,1864	55,14818
31	101,8136	133,1864	56,67505
32	100,5333	-60,5333	151,3333
33	100,5333	-33,5333	50,04975
34	100,5333	22,46667	18,26558
35	101,8136	-1,81364	1,813636
36	100,5333	4,466667	4,253968
37	100,5333	-30,2333	43,00616
38	100,5333	-18,5333	22,60163
39	100,5333	179,4667	64,09524
40	100,5333	99,46667	49,73333

По столбцу относительных погрешностей с помощью функции СРЗНАЧ найдем среднее значение отн = 54,13%.

Выполнение расчетов для модели (2):

ВЫВОД ОСТАТКА
Наблюдение	Предсказанное Y	Остатки	Отн. погр-ти
1	43,57707	-5,57707	14,6765
2	79,61484	-17,4148	27,99813
3	115,6526	9,347392	7,477914
4	79,61484	-18,5148	30,30252
5	43,57707	23,42293	34,9596
6	79,61484	13,38516	14,39265
7	115,6526	2,347392	1,989315
8	115,6526	16,34739	12,38439
9	115,6526	-23,1526	25,02985
10	151,6904	-46,6904	44,46703
11	43,57707	-1,57707	3,754925
12	115,6526	9,347392	7,477914
13	151,6904	18,30962	10,77037
14	43,57707	-5,57707	14,6765
15	151,6904	-21,1904	16,23784
16	79,61484	5,385162	6,335485
17	151,6904	-53,6904	54,7861
18	151,6904	-23,6904	18,50811
19	115,6526	-30,6526	36,06189
20	115,6526	44,34739	27,71712
21	43,57707	16,42293	27,37155
22	43,57707	-2,57707	6,285533
23	151,6904	-61,6904	68,54486
24	151,6904	-68,6904	82,75949
25	43,57707	1,422932	3,16207
26	43,57707	-4,57707	11,73607
27	115,6526	-28,7526	33,08701
28	43,57707	-3,57707	8,942671
29	79,61484	0,385162	0,481452
30	151,6904	75,30962	33,17605
31	151,6904	83,30962	35,4509
32	43,57707	-3,57707	8,942671
33	43,57707	23,42293	34,9596
34	151,6904	-28,6904	23,32551
35	115,6526	-15,6526	15,65261
36	115,6526	-10,6526	10,14534
37	79,61484	-9,31484	13,25013
38	115,6526	-33,6526	41,03977
39	151,6904	128,3096	45,82487
40	151,6904	48,30962	24,15481

По столбцу относительных погрешностей найдем среднее значение отн = 23,46%.

Выполнение расчетов для модели (3):

ВЫВОД ОСТАТКА
Наблюдение	Предсказанное Y	Остатки	Отн. погр-ти
1	44,17867	-6,17867	16,25965
2	86,27023	-24,0702	38,69812
3	98,65011	26,34989	21,07991
4	83,29906	-22,1991	36,33235
5	43,43587	23,56413	35,17034
6	65,71964	27,28036	29,33372
7	143,2176	-25,2176	21,37089
8	106,078	25,92197	19,63786
9	135,7897	-43,2897	46,7997
10	113,506	-8,50595	8,100909
11	41,70269	0,297309	0,707878
12	106,078	18,92197	15,13758
13	135,7897	34,21027	20,12369
14	36,75074	1,249258	3,287521
15	160,5495	-30,0495	23,02641
16	81,31828	3,681716	4,33143
17	103,6021	-5,60206	5,716383
18	143,7128	-15,7128	12,27566
19	120,9339	-35,9339	42,27515
20	101,1261	58,87392	36,7962
21	46,65464	13,34536	22,24227
22	31,79879	9,201207	22,44197
23	113,506	-23,506	26,11773
24	119,6959	-36,6959	44,21192
25	43,93107	1,068932	2,375404
26	41,70269	-2,70269	6,929977
27	142,4749	-55,5749	63,95265
28	51,60659	-11,6066	29,01647
29	96,17413	-16,1741	20,21766
30	222,4488	4,551164	2,004918
31	219,9729	15,02714	6,394527
32	34,27477	5,725233	14,31308
33	42,94068	24,05932	35,90944
34	133,3138	-10,3138	8,385163
35	88,74621	11,25379	11,25379
36	115,9819	-10,9819	10,45898
37	83,29906	-12,9991	18,49085
38	115,9819	-33,9819	41,44138
39	207,593	72,40701	25,85965
40	145,6936	54,30638	27,15319

По столбцу относительных погрешностей найдем среднее значение отн = 21,89%.

Разнесем результаты в сводную таблицу:

Модель	R-квадрат	отн
YТ = 101,81 – 1,28*X1 (1)	0,000127	54,13%
YТ = 7,54 + 36,04*X2 (2)	0,564092	23,46%
YТ = – 2,86 + 2,48*X4 (3)	0,763897	21,89%

Оценим точность построенных моделей:

отн1 = 54,13% > 15%, отн2 = 23,46% > 15%, отн3 = 21,89% > 15%.

Точность всех трех моделей неудовлетворительная. Ближе к 15% отн модели (3).

Проверим значимость полученных уравнений с помощью F – критерия Фишера.

F – статистики определены функцией РЕГРЕССИЯ и составляют:

Модель	R-квадрат	отн	F
YТ = 101,81 – 1,28*X1 (1)	0,000127	54,13%	0,004818
YТ = 7,54 + 36,04*X2 (2)	0,564092	23,46%	49,1744
YТ = – 2,86 + 2,48*X4 (3)	0,763897	21,89%	122,9468

С помощью функции FРАСПОБР найдем значение Fкр = 4,1 для уровня значимости α = 5%, и чисел степеней свободы k1 = 1, k2 = 38.

F = 0,0048 < Fкр = 4,1, следовательно уравнение модели (1) не является значимой и ее использование нецелесообразно. F = 49,17 > Fкр = 4,1, F = 122,95 > Fкр = 4,1, следовательно, уравнения моделей (2) и (3) являются значимыми, их использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель (2) факторной переменной Х2 и включенной в модель (3) факторной переменной Х4.

На основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (3) зависимости цены квартиры от ее жилой площади. Однако эту модель нецелесообразно использовать для прогнозирования в реальных условиях, поскольку ее точность неудовлетворительная, и дальнейшие расчеты проведем в учебных целях.

5. Согласно условию задачи прогнозное значение фактора Х4 составляет 80% от его максимального значения. Максимальное значение Х4 = 91 найдем с помощью функции МАКС. Тогда прогнозное значение Х4* = 72,8. Рассчитаем по уравнению модели (3) прогнозное значение Y:

Y*Т = – 2,86 + 2,48* Х4* = – 2,86 + 2,48 * 72,8 = 177,39.

Таким образом, если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая цена квартиры будет составлять около 177,39 тыс. долл.

Зададим доверительную вероятность p = 1 – α = 1– 0,1 = 0,9 и построим доверительный прогнозный интервал для среднего значения Y.

Для этого нужно рассчитать стандартную ошибку прогнозирования для среднего значения результирующего признака:

S(Y*Т) = SE * .

Предварительно подготовим:

- стандартная ошибка SE = 28,2 из таблицы «регрессионная статистика»

- по столбцу данных Х4 найдем среднее значение = 42,04 с помощью функции СРЗНАЧ и определим = 15950,82 с помощью функции КВАДРОТКЛ;

- tкр – коэффициент Стьюдента для уровня значимости α=10% и числа степеней свободы k = 38. tкр = 1,686 с помощью функции СТЬЮДРАСПОБР.

Следовательно, стандартная ошибка прогнозирования для среднего значения составляет:

S(Y*Т) = 28,2 * = 8,188 .

Размах доверительного интервала для среднего значения:

U(Y*Т) = tкр * S(Y*Т) = 1,686 * 8,188 = 13,805.

Границами прогнозного интервала будут:

Uнижн = Y*Т – U(Y*Т) = 177,39 – 13,805 = 163,58;

Uверх = Y*Т + U(Y*Т) = 177,39 + 13,805 = 191,19.

Таким образом, с надежностью 90% можно утверждать, что если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая средняя цена квартиры будет от 163,58 тыс. долл. до 191,19 тыс. долл.

Для построения чертежа воспользуемся Мастером диаграмм (точечная) – покажем исходные данные (поле корреляции). Затем с помощью опции добавить линию тренда, построим линию модели и покажем на графике результаты прогнозирования.

6. Методом включения построим двух факторные модели, сохраняя в них наиболее информативный фактор – жилую площадь квартиры (Х4).

В качестве «входного интервала Х» укажем значения факторов Х1 и Х4, с помощью функции РЕГРЕССИЯ получим:

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,875979
R-квадрат	0,767339
Нормированный R-квадрат	0,754763
Стандартная ошибка	28,3714
Наблюдения	40

	Коэффициенты
Y-пересечение	-6,4361
Х1	6,692936
Х4	2,48928

Таким образом, модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4 построена, ее уравнение имеет вид: YТ = –6,44 + 6,69*X1 + 2,49*Х4.

Используем в качестве «входного интервала Х» значения факторов Х2 и Х4, с помощью функции РЕГРЕССИИ найдем:

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,874163
R-квадрат	0,76416
Нормированный R-квадрат	0,751412
Стандартная ошибка	28,56458
Наблюдения	40

	Коэффициенты
Y-пересечение	-2,16757
Х2	-1,57033
Х4	2,556497

Таким образом, модель (5) зависимости цены квартиры Y от числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:

YТ = –2,17 – 1,57*X2 + 2,56*Х4.

Построим множественную модель регрессии, учитывая все факторы (Х1, Х2, и Х4):

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,876218
R-квадрат	0,767758
Нормированный R-квадрат	0,748404
Стандартная ошибка	28,73688
Наблюдения	40
	Коэффициенты
Y-пересечение	-5,64357
Х1	6,859631
Х2	-1,98516
Х4	2,591406

Таким образом, трехфакторная модель (6) зависимости цены квартиры Y от города области Х1, числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:

YТ = –5,67 + 6,86*Х1 – 1,99*X2 + 2,59*Х4.

Выберем лучшую из построенных. Для сравнения моделей с различным количеством учтенных в них факторов используем нормированные коэффициенты детерминации, которые содержатся в строке «нормированный R-квадрат» функции РЕГРЕССИЯ. Чем больше величина нормированного коэффициента детерминации, тем лучше модель.

Модель	Нормированный R-квадрат
YТ = –6,44 + 6,69X1 + 2,49Х4 (4)	0,754763
YТ = –2,17 – 1,57X2 + 2,56Х4 (5)	0,751412
YТ = –5,67 + 6,86Х1 – 1,99X2 + 2,59*Х4 (6)	0,748404

Таким образом, лучшей является модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4:

YТ = –6,44 + 6,69*X1 + 2,49*Х4.

Коэффициент регрессии b1 = 6,69, следовательно, при покупке квартиры в Люберцах (Х1) той же жилой площади (Х4), что и в Подольске цена квартиры (Y) увеличится в среднем на 6,69 тыс. долл.

Коэффициент регрессии b2 = 2,49, следовательно, при увеличении жилой площади (Х4) на 1 кв. м в одном городе (Х1), цена квартиры (Y) увеличится в среднем на 2,48 тыс. долл. Свободный коэффициент не имеет экономического смысла.

7. Оценим качество модели. Для оценки качества выбранной множественной модели (4) YТ = –6,44 + 6,69*X1 + 2,49*Х4 используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F – критерий Фишера.

Коэффициент детерминации R-квадрат выпишем из таблица «Регрессионная статистика» для модели (4).

R2 = 0,767, следовательно, вариация цены квартиры Y на 76,7% объясняется по данному уравнению вариацией города области Х1 и жилой площади Х4.

Используем исходные данные Yi и найденные остатки Еi из таблицы «Вывод остатка» для модели (4). Рассчитаем относительные погрешности и найдем среднее значение отн.

ВЫВОД ОСТАТКА
Наблюдение	Предсказанное Y	Остатки	Отн. погр-ти
1	47,55316	-9,55316	25,13988493
2	89,87092	-27,6709	44,48700502
3	95,62438	29,37562	23,50049523
4	86,88378	-25,7838	42,19931434
5	40,11344	26,88656	40,12920021
6	62,51696	30,48304	32,77746634
7	147,1244	-29,1244	24,68165955
8	103,0922	28,90778	21,89983249
9	132,9636	-40,4636	43,74441266
10	117,253	-12,253	11,66952159
11	45,06388	-3,06388	7,294943394
12	109,7852	15,21484	12,17187399
13	132,9636	37,03642	21,7861284
14	33,39238	4,60762	12,12531651
15	157,8564	-27,3564	20,96274499
16	78,19942	6,800579	8,000681624
17	100,6029	-2,60294	2,656062313
18	140,9293	-12,9293	10,10099834
19	118,0279	-33,0279	38,85635461
20	104,8066	55,1934	34,49587661
21	43,3495	16,6505	27,75083346
22	35,10676	5,893244	14,37376579
23	117,253	-27,253	30,28110852
24	116,7833	-33,7833	40,70272457
25	40,61129	4,388708	9,752684736
26	38,37094	0,62906	1,612974811
27	139,6846	-52,7846	60,7418157
28	48,32806	-8,32806	20,82015006
29	93,1351	-13,1351	16,41887615
30	220,0884	6,911617	3,044764999
31	217,5991	17,4009	7,40463685
32	37,59604	2,403964	6,009909809
33	46,30852	20,69148	30,88281157
34	137,1672	-14,1672	11,51807973
35	85,66726	14,33274	14,33273923
36	119,7423	-14,7423	14,04026449
37	86,88378	-16,5838	23,59001573
38	119,7423	-37,7423	46,02716795
39	211,8456	68,15436	24,34084302
40	149,6136	50,38636	25,19318084

По столбцу относительных погрешностей с помощью функции СРЗНАЧ найдем среднее значение отн = 22,69%.

Сравнение показывает, что 22,69% > 15%. Следовательно, точность модели неудовлетворительная.

С помощью F – критерия Фишера проверим значимость модели в целом. Для этого возьмем данные из таблицы «дисперсионный анализ» для модели (4)) F = 61,01.

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	2	98226,35	49113,17573	61,01499	1,92E-12
Остаток	37	29782,64	804,9362779
Итого	39	128009

С помощью функции FРАСПОБР найдем значение Fкр = 3,25 для уровня значимости α = 5%, и чисел степеней свободы k1 = 2, k2 = 37.

F = 61,01 > Fкр = 3,25, следовательно, уравнения модели (4) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (4) факторными переменными Х1 и Х4.

Дополнительно с помощью t – критерия Стьюдента проверим значимость отдельных коэффициентов модели.

Для выбранной модели (4) получены следующие значения:

	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение
Y-пересечение	-6,4361	11,51649	-0,558859663	0,579624
Х1	6,692936	9,045869	0,739888746	0,464037
Х4	2,48928	0,22536	11,04580516	2,85E-13

Критическое значение tкр найдено для уровня значимости α = 5% и числа степеней свободы k = 40 – 2 – 1 = 37. tкр = 2,03.

Для свободного коэффициента a= –6,44 определена статистика

t(a) = – 0,56. |t(a)| = 0,56 < tкр = 2,03, следовательно, свободный коэффициент a = –6,44 не является значимым, его можно исключить из модели.

Для коэффициента регрессии b1 = 6,69 определена статистика t(b1)= 0,74.

|t(b1)| = 0,74 < tкр = 2,03, следовательно, коэффициента регрессии b1 не является значимым, его и фактор города области можно исключить из модели.

Для коэффициента регрессии b2=2,49 определена статистика t(b2)= 11,05.

|t(b2)| = 11,05 > tкр = 2,03, следовательно, коэффициента регрессии b2 является значимым, его и фактор жилой площади квартиры нужно сохранить в модели.

Выводы о значимости коэффициентов модели сделаны на уровне значимости α = 5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент a можно считать значимым на уровне 0,58 = 58%; коэффициент регрессии b1 – на уровне 0,46 = 46%;, а коэффициент регрессии b2 – на уровне 2,85E-13 = 0,000000000000285 = 0,000000000001%.

При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (4) используем нормированные коэффициенты детерминации.

Модель	Нормированный R-квадрат
YТ = – 2,86 + 2,48*X4 (3)	0,757684
YТ = –6,44 + 6,69X1 + 2,49Х4 (4)	0,754763

Таким образом, при добавлении в уравнение регрессии фактора «город области» Х1 качество модели ухудшилось, что говорит не в пользу сохранения фактора Х1 в модели.

Средние коэффициенты эластичности в случае линейной модели определяются формулами Эj = bj * .

С помощью функции СРЗНАЧ найдем: = 0,45, = 42,045, = 101,24. Тогда Э1 = 6,69 * = 0,03, Э2 = 2,49 * = 1,03 .

Следовательно, при покупке квартиры в Люберцах (Х1) и неизменной жилой площади цена квартиры увеличится в среднем на 0,03%.

Увеличение жилой площади Х4 в том же городе на 1% приводит к увеличению цены квартиры в среднем на 1,03%.

Бета - коэффициенты определяются формулами βj = bj * .

С помощью функции СТАНДОТКЛОН найдем SX1 = 0,5; SX4 = 20,22; SY = 57,29. Тогда

β1 = 6,69 * = 0,06; β2 = 2,49 * = 0,88.

Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0,06 своего стандартного отклонения SY, а при увеличении только фактора Х4 на одно его стандартное отклонение – увеличивается на 0,88 SY.

Дельта - коэффициенты определяются формулами Δj = βj * .

Коэффициенты парной корреляции r(Y, X1) = – 0,01, и r(Y, X4) = 0,87 найдены с помощью функции КОРРЕЛЯЦИЯ. Коэффициент детерминации R2 = 0,77 определен для рассматриваемой двухфакторной модели функцией РЕГРЕССИЯ.

Вычислим дельта - коэффициенты:

Δ1 = 0,06 * = – 0,0009; Δ2 = 0,88 * = 1,0009.

Поскольку Δ1 < 0, то факторная переменная Х1 выбрана неудачно и ее нужно исключить из модели.

Значит, по уравнению полученной линейной двухфакторной модели изменение результирующего фактора Y (цены квартиры) на 100% объясняется воздействием фактора Х4 (жилой площадью квартиры).

Задача № 2. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.

В течение девяти последовательных недель фиксировался спрос Y(t) (млн. руб.) на кредитные ресурсы финансовой компании. Временной ряд Y(t) этого показателя приведен в таблице.

t	1	2	3	4	5	6	7	8	9
Y(t)	30	28	33	37	40	42	44	49	47

Задание:

Проверить наличие аномальных наблюдений.
Построить линейную модель временного ряда Yt = a + b * t, параметры которой оценить МНК.
Оценить адекватность построенной модели, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения.
Оценить точность модели на основе использования средней относительной ошибки аппроксимации.
Осуществить прогноз спроса на следующие 2 недели (прогнозный интервал рассчитать при доверительной вероятности 70%).
Представить графически фактические значения показателя, результаты моделирования и прогнозирования.

Проверим наличие аномальных наблюдений. Используем метод Ирвина, основанный на определении λt-статистик по формуле: λt = , где Sy – выборочное среднее квадратичное (стандартное) отклонение признака Y.

Подготовим Sy = 7,42 с помощью функции СТАНДОТКЛОН и рассчитаем λt-статистики. Результат расчетов приведем в таблице:

t	1	2	3	4	5	6	7	8	9
Y(t)	30	28	33	37	40	42	44	49	47
λt		0,27	0,67	0,54	0,40	0,27	0,27	0,67	0,27

При n = 9 и уровне значимости α = 5% можно использовать λкр= 1,5.

Все λt-статистики меньше λкр, то есть аномальных наблюдений нет. Исходный ряд будем использовать для выполнения следующих пунктов задачи.

2. Построим линейную модель временного ряда Yt = a + b * t

С помощью функции РЕГРЕССИЯ найдем:

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,971442
R-квадрат	0,9437
Нормированный R-квадрат	0,935657
Стандартная ошибка	1,883091
Наблюдения	9

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	416,0667	416,0667	117,333	1,26E-05
Остаток	7	24,82222	3,546032
Итого	8	440,8889

	Коэффициенты
Y-пересечение	25,72222
t	2,633333

Таким образом, a = 25,72, b = 2,63. Модель построена, ее уравнение имеет вид:

Yt = 25,72 + 2,63 * t.

Коэффициент регрессии b = 2,63 показывает, что с каждой неделей спрос на кредитные ресурсы финансовой компании (Y) увеличивается в среднем на 2,63 млн. руб.

3. Оценим адекватность построенной модели, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения.

Проверка перечисленных свойств состоит в исследовании Ряда остатков et, который содержится в таблице «Вывод остатка».

ВЫВОД ОСТАТКА
Наблюдение	Предсказанное Y(t)	Остатки
1	28,35556	1,644444
2	30,98889	-2,98889
3	33,62222	-0,62222
4	36,25556	0,744444
5	38,88889	1,111111
6	41,52222	0,477778
7	44,15556	-0,15556
8	46,78889	2,211111
9	49,42222	-2,42222

Для проверки свойства независимости остаточной компоненты используем критерий Дарбина - Уотсона. Согласно этому критерию вычислим по формуле статистику d = .

Подготовим для вычислений:

С помощью функции СУММКВ = 24,82; с помощью функции СУММКВРАЗН = 56,94.

Таким образом, d = = 2,29. Поскольку d > 2, то перейдем к d’ = 4 – d = 4 – 2.29 = 1,71.

По таблице d-статистик Дарбина - Уотсона определим критические уровни: нижний d1 = 0,82 и верхний d2 = 1,32.

Сравним полученную фактическую величину d’ с критическими уровнями d1 и d2 и сделаем выводы:

d’ = 1,71 (d2 = 1,32; 2), следовательно, свойство независимости остатков для построенной модели выполняется.

Для проверки свойства случайности остаточной компоненты используем критерий поворотных точек (пиков), основой которого является определение количества поворотных точек для ряда остатков. С помощью Мастера диаграмм построим график остатков et.

Поворотные точки – вторая, пятая, седьмая, восьмая. Их количество p=4. По формуле pкр = при n = 9 вычислим критическое значение pкр= = 2.

Сравним значения p и pкр : p = 4 > pкр= 2, следовательно, свойство случайности для ряда остатков выполняется.

Для проверки соответствия ряда остатков нормальному закону распределения используем R/S критерий.

В соответствии с этим критерием вычислим по формуле статистику R/S = .

Подготовим для вычислений:

С помощью функции МАКС emax = 2,21 – максимальный уровень ряда остатков;

С помощью функции МИН emin = –2,99 – минимальный уровень ряда остатков;

S(e) = 1,88 – стандартная ошибка модели из таблицы «регрессионная статистика».

Получим: R/S = = 2,76.

По таблице критических границ отношения R/S определим критический интервал. При n = 9 можно использовать (2,67; 3,69). Сопоставим фактическую величину R/S с критическим интервалом: 2,76(2,67; 3,69), значит, для построенной модели свойство нормального распределения остаточной компоненты выполняется.

Проведенная проверка показывает, что для построенной модели выполняются все свойства. Таким образом, данная модель является адекватной, и ее можно использовать для построения прогнозных оценок.

4. Оценим точность модели на основе использования средней относительной ошибки аппроксимации.

Используем исходные данные Yt и найденные функцией РЕГРЕССИЯ остатки et по формуле eотн.t = 100 рассчитаем столбец относительных погрешностей и найдем среднее значение отн = 3,78%.

ВЫВОД ОСТАТКА
Наблюдение	Предсказанное Y(t)	Остатки	Отн. погр-ти
1	28,35556	1,644444	5,481481
2	30,98889	-2,98889	10,6746
3	33,62222	-0,62222	1,885522
4	36,25556	0,744444	2,012012
5	38,88889	1,111111	2,777778
6	41,52222	0,477778	1,137566
7	44,15556	-0,15556	0,353535
8	46,78889	2,211111	4,512472
9	49,42222	-2,42222	5,153664

Сравнение показывает, что 3,78% < 5%, следовательно, модель имеет высокую точность.

5. Осуществим прогноз спроса на следующие 2 недели.

«Следующие 2 недели» соответствуют периодам k1 = 1 и k2 = 2, при этом = n + k1 = 10 и = n + k2 = 11.

Согласно уравнению модели получим точечные прогнозные оценки:

Y*10 = 25,72 + 2,63 * 10 = 52,05 и Y*11 = 25,72 + 2,63 * 11 = 54,69.

Таким образом, ожидаемый спрос на кредитные ресурсы финансовой компании в следующие 2 недели будут составлять около 52,05 млн. руб. и 54,69 млн. руб. соответственно.

Для оценки точности прогнозирования рассчитаем границы прогнозного интервала для индивидуальных значений результирующего признака (доверительная вероятность p = 70%).

Подготовим:

С помощью функции СТЬЮДРАСПОБР при α = 100 % - 70 % = 30 %, k = 9 – 2 = 7. tкр = 1,12;

S(e) = 1,88;

С помощью функции СРЗНАЧ = 5;

С помощью функции КВАДРОТКЛ = 60.

Вычислим размах прогнозного интервала для индивидуальных значений, используя формулу: Un = .

При = 10 получим U10 = 2,6 и определим границы доверительного интервала: Uниж10= Y*10 – U10 = 49,45; Uверх10= Y*10 + U10 = 54,66.

При = 11 получим U11 = 2,76 и определим границы доверительного интервала: Uниж11= Y*11 – U11 = 51,93; Uверх11= Y*11 + U11 = 57,45.

Таким образом, с надежностью 70% можно утверждать, что спрос на кредитные ресурсы финансовой компании на следующую (10-ю) неделю будет составлять от 49,45 до 54,66 млн. руб., а через неделю (11-ю) – от 51,93 до 57,45 млн. руб.

6. Представим графически фактические значения показателя, результаты моделирования и прогнозирования.

Для построения чертежа воспользуемся Мастером диаграмм (точечная) – покажем исходные данные. С помощью опции Добавить линию тренда… построим линию модели и покажем на графике результаты прогнозирования.

1. тематической постановке краевых задач определения НДС в каком виде представляют условие задачи Почему в
2. продукты молочные группе продуктов с частично обезвоженным сгустком в которую помимо творога зернёного
3. реферат дисертації на здобуття наукового ступеня кандидата технічних наук Дніпропетровськ 200
4. і Своїм корінням сучасна біологія сягає давнини і бере початок у Давньому Єгипті та Давній Греції
5. на тему Використання типології МайєрсБріггс в практиці організаційної поведінки Виконали студ
6. Удача и Неудача
7. Гимн и герб школы Гимн торжественная песня восхваляющая и прославляющая коголибо или чтолибо
8. Анализ хозяйственной деятельности ОАО Крестьянский рынок д Пирогово
9. Сравнительный анализ систем калькуляции себестоимости
10. Тема- Роман Уласа Самчука ldquo;Маріяrdquo; ~ один з найдовершеніших творів про трагічну долю України про голодом

Материалы собраны группой SamZan и находятся в свободном доступе