Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Министерство образования и науки Российской Федерации
Алтайский государственный технический университет
им. И.И. Ползунова
Контрольная работа
по дисциплине: «Эконометрика»
Вариант №1.
Выполнила Ст. гр. ПИЭ-81
Вавилова В.А.
Проверила Кайгородова М.А.
Барнаул 2009
Задача №1
1. Рассчитать матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов корреляции.
2. Построить поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
3. Рассчитать параметры линейных парных регрессий для всех факторов Х.
4. Оценить качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F критерия Фишера. Выбрать лучшую модель.
5. С использованием лучшей модели осуществить прогнозирование среднего значения показателя У при уровне значимости α = 0,1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представить графически фактические и модельные значения У, результаты прогнозирования.
6. Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель формирования объема годовой прибыли за счет значимых факторов. Дать экономическую интерпретацию коэффициентов модели регрессии.
7. Оценить качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дать оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β- и Δ- коэффициентов.
Y |
X1 |
X2 |
X3 |
36 |
40 |
32 |
60 |
28 |
44 |
40 |
68 |
66 |
28 |
44 |
80 |
74 |
52 |
28 |
76 |
80 |
50 |
50 |
44 |
84 |
64 |
56 |
96 |
82 |
70 |
50 |
100 |
98 |
68 |
56 |
104 |
112 |
78 |
60 |
106 |
96 |
90 |
62 |
98 |
1. Рассчитать матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов корреляции.
Матрица коэффициентов парной корреляции между всеми имеющимися переменными имеет вид:
|
Y |
X1 |
X2 |
X3 |
t-статистики |
Y |
1 |
|
|
|
|
X1 |
0,748601826 |
1 |
|
|
3,193517878 |
X2 |
0,750978225 |
0,74132556 |
1 |
|
3,216720327 |
X3 |
0,663385064 |
0,697371882 |
0,616340147 |
1 |
2,5075384 |
Проанализируем коэффициенты корреляции между результирующим признаком Y и каждым из факторов Xj:
r(Y,X1) = 0.7486 > 0, следовательно, между переменными Y и Х1 наблюдается прямая корреляционная зависимость: чем выше X1, тем выше Y.
r(Y,X2 )= 0,75 > 0, следовательно, между переменными Y и Х2 наблюдается прямая корреляционная зависимость: чем выше X2, тем выше Y.
r(Y,X3 )= 0,663 > 0, следовательно, между переменными Y и Х3 наблюдается прямая корреляционная зависимость: чем выше X3, тем выше Y.
Для проверки значимости найденных коэффициентов корреляции используем критерий Стьюдента.
Для каждого коэффициента корреляции r(Y,Xj) вычислим t-статистику по формуле t=. Результаты вычислений занесены в дополнительный столбец таблицы t-статистики.
По таблице критических точек распределения Стъюдента при уровне значимости α = 5% = 0,05 и числе степеней свободы k = n − 2 = 10 − 2 = 8 определим критическое значение = 2,31 кр t. Сопоставим фактические значения t с критическим tkp, и сделаем выводы в соответствии со схемой:
не знач. знач.
0 t кр. T
t(r(Y,X2))=3.19>2.31, следовательно, коэффициент r (Y,X) отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной связи между признаками Y и Х1, зависимость У от Х1 является достоверной.
t(r(Y,X2))=3,21>2.31, следовательно, коэффициент r (Y,X) отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной связи между признаками Y и Х2, зависимость У от Х2 является достоверной.
t(r(Y,X2))=2,50>2.31, следовательно, коэффициент r (Y,X) отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной связи между признаками Y и Х3, зависимость У от Х3 является достоверной.
Таким образом, наиболее тесная и значимая зависимость наблюдается между X2 и Y.
2. Диаграмма «Поле корреляции»:
3. Рассчитать параметры линейных парных регрессий для всех факторов Х.
Расчет параметров линейных парных регрессий для всех факторов Х.
ВЫВОД ИТОГОВ ДЛЯ X2 |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,750978225 |
|||||||
R-квадрат |
0,563968295 |
|||||||
Нормированный R-квадрат |
0,509464331 |
|||||||
Стандартная ошибка |
18,53390886 |
|||||||
Наблюдения |
10 |
|||||||
Дисперсионный анализ |
||||||||
|
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
1 |
3554,35378 |
3554,35378 |
10,34728966 |
0,012299582 |
|||
Остаток |
8 |
2748,04622 |
343,5057775 |
|||||
Итого |
9 |
6302,4 |
|
|
|
|||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
-6,270716408 |
26,11771642 |
-0,24009436 |
0,816294907 |
-66,49827843 |
53,95684561 |
-66,49827843 |
53,95684561 |
X2 |
1,712776494 |
0,532460494 |
3,216720327 |
0,012299582 |
0,484920394 |
2,940632594 |
0,484920394 |
2,940632594 |
ВЫВОД ОСТАТКА |
||||||||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. Погрешности |
|||||
1 |
48,5381314 |
-12,5381314 |
34,82814277 |
|||||
2 |
62,24034335 |
-34,24034335 |
122,2869405 |
|||||
3 |
69,09144932 |
-3,091449323 |
4,684014126 |
|||||
4 |
41,68702542 |
32,31297458 |
43,66618186 |
|||||
5 |
79,36810829 |
0,631891713 |
0,789864642 |
|||||
6 |
89,64476725 |
-5,64476725 |
6,719961012 |
|||||
7 |
79,36810829 |
2,631891713 |
3,209624041 |
|||||
8 |
89,64476725 |
8,35523275 |
8,525747704 |
|||||
9 |
96,49587323 |
15,50412677 |
13,84297033 |
|||||
10 |
99,92142621 |
-3,921426213 |
4,084818972 |
|||||
Уравнение парной линейной модели для x2 имеет вид:
Yt=-6.27+1.7*x2. Коэффициент регрессии b=1,7, следовательно, при увеличении коэффициента x2, Y увеличивается в среднем на 1,7 ед.
ДЛЯ X1 |
||||||||
ВЫВОД ИТОГОВ |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,748601826 |
|||||||
R-квадрат |
0,560404693 |
|||||||
Нормированный R-квадрат |
0,50545528 |
|||||||
Стандартная ошибка |
18,60949174 |
|||||||
Наблюдения |
10 |
|||||||
Дисперсионный анализ |
||||||||
|
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
1 |
3531,894538 |
3531,894538 |
10,19855644 |
0,012735841 |
|||
Остаток |
8 |
2770,505462 |
346,3131827 |
|||||
Итого |
9 |
6302,4 |
|
|
|
|||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
14,45978153 |
20,02913289 |
0,72193747 |
0,490893081 |
-31,72748171 |
60,64704477 |
-31,72748171 |
60,64704477 |
X1 |
1,046921549 |
0,327827051 |
3,193517878 |
0,012735841 |
0,290951014 |
1,802892084 |
0,290951014 |
1,802892084 |
ВЫВОД ОСТАТКА |
||||||||
|
||||||||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. Погрешности |
|||||
1 |
56,3366435 |
-20,3366435 |
56,49067638 |
|||||
2 |
60,52432969 |
-32,52432969 |
116,1583203 |
|||||
3 |
43,77358491 |
22,22641509 |
33,67638651 |
|||||
4 |
68,89970209 |
5,100297915 |
6,892294479 |
|||||
5 |
66,80585899 |
13,19414101 |
16,49267627 |
|||||
6 |
81,46276068 |
2,537239325 |
3,020523006 |
|||||
7 |
87,74428997 |
-5,74428997 |
7,005231671 |
|||||
8 |
85,65044687 |
12,34955313 |
12,60158482 |
|||||
9 |
96,11966236 |
15,88033764 |
14,17887289 |
|||||
10 |
108,682721 |
-12,68272095 |
13,21116766 |
|||||
Уравнение парной линейной модели для x1 имеет вид:
Yt=-14.46+1.05*x1. Коэффициент регрессии b=1.05, следовательно, при увеличении коэффициента x1, Y увеличивается в среднем на 1,05 ед.
ДЛЯ X3 |
||||||||
ВЫВОД ИТОГОВ |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,663385064 |
|||||||
R-квадрат |
0,440079743 |
|||||||
Нормированный R-квадрат |
0,370089711 |
|||||||
Стандартная ошибка |
21,0025041 |
|||||||
Наблюдения |
10 |
|||||||
Дисперсионный анализ |
||||||||
|
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
1 |
2773,558571 |
2773,558571 |
6,28774883 |
0,03651068 |
|||
Остаток |
8 |
3528,841429 |
441,1051786 |
|||||
Итого |
9 |
6302,4 |
|
|
|
|||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
6,194299478 |
28,46449573 |
0,217614938 |
0,833176982 |
-59,44494532 |
71,83354428 |
-59,44494532 |
71,83354428 |
X3 |
0,834203131 |
0,332678108 |
2,5075384 |
0,03651068 |
0,067046039 |
1,601360224 |
0,067046039 |
1,601360224 |
ВЫВОД ОСТАТКА |
||||||||
|
||||||||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. Погрешности |
|||||
1 |
56,24648735 |
-20,24648735 |
56,24024265 |
|||||
2 |
62,9201124 |
-34,9201124 |
124,7146872 |
|||||
3 |
72,93054998 |
-6,93054998 |
10,5008333 |
|||||
4 |
69,59373745 |
4,406262545 |
5,954408845 |
|||||
5 |
42,89923725 |
37,10076275 |
46,37595343 |
|||||
6 |
86,27780008 |
-2,27780008 |
2,711666762 |
|||||
7 |
89,61461261 |
-7,614612605 |
9,286112933 |
|||||
8 |
92,95142513 |
5,04857487 |
5,15160701 |
|||||
9 |
94,61983139 |
17,38016861 |
15,51800768 |
|||||
10 |
87,94620634 |
8,053793657 |
8,389368393 |
Уравнение парной линейной модели для x3 имеет вид:
Yt=6.19+0.83*x3. Коэффициент регрессии b=0.83, следовательно, при увеличении коэффициента x3, Y увеличивается в среднем на 0.83 ед.
4. Оценить качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F критерия Фишера. Выбрать лучшую модель.
Коэффициенты детерминации R-квадрат определены для каждой модели программой РЕГРЕССИЯ (таблицы «Регрессионная статистика») и составляют:
Коэффициенты детерминации |
|||
Модель |
R-квадрат |
E-отн, % |
F |
Yt=14,459+1,046*x1 |
0,560404693 |
27,9727734 |
10,19855644 |
Yt=-6,27+1,713*x2 |
0,563968295 |
24,2638266 |
10,34728966 |
Yt=6,194+0,8348*x3 |
0,440079743 |
28,48428882 |
6,28774883 |
Оценим точность построенных моделей в соответствии со схемой:
точная удовлетв. неудовлетв.
0 5% 15% E отн
Еотн1 = 27,97%ø(5%, 15%) модель (1) имеет неудовлетворительную точность.
Еотн2 = 24,26% > 15%; Еотн3 = 28,48% > 15% точность моделей (2) и (3) неудовлетворительная.
Проверим значимость полученных уравнений с помощью F критерия Фишера.
F статистики определены программой РЕГРЕССИЯ и указаны в столбе F вышеуказанной таблице.
Критическое значение Fкр= 3,71 найдено для уровня значимости α=5% и чисел степеней свободы k1=1, k2=8 (Приложение 2 или функция FРАСПОБР).
Схема проверки:
Сравнение показывает: F = 10,2 > Fкр = 4,07; следовательно, уравнение модели (1) является значимым, его использование целесообразно, зависимая переменная У достаточно хорошо описывается включенной в модель факторной переменной Х1.
F = 10,35 > Fкр = 4,07 и F = 6.28 > Fкр = 4,07; следовательно, уравнения моделей (2) и (3) также являются значимыми, их использование целесообразно.
Вывод: на основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (2) зависимости x2 от Y. Эту модель целесообразно использовать для прогнозирования в реальных условиях.
5. С использованием лучшей модели осуществить прогнозирование среднего значения показателя У при уровне значимости α = 0,1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представить графически фактические и модельные значения У, результаты прогнозирования.
Согласно условию задачи прогнозное значение факторной переменной Х2 составит x* = 38,24. Рассчитаем по уравнению модели (2) прогнозное значение показателя У:
Y* = -6,27 + 1,713⋅ 38,24 = 59,235 .
Таким образом, если прогнозное значение фактора Х увеличится на 80% от среднего значения и составит 38,24, то значения показателя У будет около 59,235.
Зададим доверительную вероятность p = 1−α и построим доверительный прогнозный интервал для среднего значения Y.
Для этого нужно рассчитать стандартную ошибку прогнозирования для среднего значения результирующего признака S (Y*t).
Предварительно подготовим:
- стандартную ошибку модели Se$
- по столбцу исходных данных Х2 найдем среднее значение Хср. = 47.8
и определим Σ(Xi −X ср.)2 = 605,8.
- tкр.(10%, 12) = 1,81.
Следовательно, стандартная ошибка прогнозирования для среднего значения составляет
S(y*t)=18.53390886*
Размах доверительного интервала для среднего значения
U(yt * )= 1.81⋅ 9.283=16.80223
Границами прогнозного интервала будут
Uнижн=59,235 -16,80223= 42,43
Uверх=59,235+16,80223=76,037
Таким образом, с надежностью 90% можно утверждать, что прогнозное значение фактора Х увеличится на 80% от среднего значения и составит 38,24, то ожидаемое среднее значение показателя У будет от 42,43 до 76,037.
6. Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель формирования цены реализации за счет значимых фактров. Дать экономическую интерпретацию коэффициентов модели регрессии.
Методом включения построим двухфакторные модели, сохраняя в них наиболее информативный фактор x2.
В качестве «входного интервала Х» укажем значения факторов Х1 и Х2, с помощью программы РЕГРЕССИЯ получим:
|
Коэффициенты |
Y-пересечение |
-6,634579097 |
X1 |
0,595751398 |
X2 |
0,992525051 |
Таким образом, модель зависимости Y от Х1 и Х2 построена, ее уравнение имеет вид:
Yt=-6.63+0.60*x1+0.99*x2.
Используем в качестве «входного интервала Х» значения факторов Х1 и Х3, с помощью программы РЕГРЕССИЯ найдем:
Коэффициенты |
|
Y-пересечение |
1,344629283 |
X 1 |
0,778585232 |
X 3 |
0,345985495 |
Таким образом, модель зависимости Y от Х1 и Х3 построена, ее уравнение имеет вид:
Yt=1.345+0.78*x1+0.346*x3.
Построим множественную модель регрессии, учитывая все факторы (Х1, Х2 и Х3):
|
Коэффициенты |
Y-пересечение |
-14,01005991 |
X2 |
0,892170549 |
X1 |
0,446828534 |
X3 |
0,250835592 |
Таким образом, трехфакторная модель зависимости Y от Х1, Х2 и Х3 построена, ее уравнение имеет вид:
Yt=-14.01+0.447*x1+0.89*x2+0.25*x3.
Выберем лучшую из построенных множественных моделей.
Для сравнения моделей с различным количеством учтенных в них факторов используем нормированные коэффициенты детерминации, которые содержатся в строке «нормированный R-квадрат» итогов программы РЕГРЕССИЯ. Чем больше величина нормированного коэффициента детерминации, тем лучше модель.
Модель |
Нормированный R-квадрат |
Yt=-6,63+0,60*x1+0,99*x2 |
0,544 |
Yt=1,345+0,78*x1+0,346*x3 |
0,4848 |
Yt=-14,01+0,447*x1+0,89*x2+0,25*x3 |
0,4979 |
Таким образом, лучшей является модель зависимости Y от Х1 и Х2:
Yt=-6,63+0,60*x1+0,99*x2
Коэффициент регрессии b = 0,60, следовательно, при увеличении Х1 и неизменном X2 значение У увеличивается в среднем на 0,69.
Коэффициент регрессии b2 = 0,99 , следовательно, при увеличении Х2 и неизменной X1 значение У увеличивается в среднем на 0,99.
Свободный коэффициент не имеет экономического смысла.
7. Оценить качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дать оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β- и Δ- коэффициентов.
Для оценки качества выбранной множественной модели аналогично п. используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F критерий Фишера.
Коэффициент детерминации R-квадрат выпишем из итогов РЕГРЕССИИ (таблица «Регрессионная статистика» для модели).
R2 = 0,645 = 64,5 %, следовательно, вариация (изменение) Y на 64,5% объясняется по данному уравнению вариацией показателя Х1 и Х2.
Используем исходные данные yi и найденные программой РЕГРЕССИЯ остатки Ei (таблица «Вывод остатка» для модели (4)). Рассчитаем относительные погрешности и найдем среднее значение Еотн = 24,5%.
Сравнение показывает, что 5% < 15% < 24,5%. Следовательно, точность модели неудовлетворительная.
С помощью F критерия Фишера проверим значимость модели в целом.
Для этого выпишем из итогов РЕГРЕССИИ (таблица «Дисперсионный анализ» для модели F = 4,10. Определим критическое значение (5%, 2, 10) = 6,37
F=6,37>F кр=4.10. Следовательно, уравнение модели является значимым, его использование целесообразно, зависимая переменная У достаточно хорошо описывается включенными в модель факторными переменными Х1 и Х2.
Дополнительно с помощью t критерия Стьюдента проверим значимость отдельных коэффициентов модели.
t статистики для коэффициентов уравнения регрессии приведены в итогах программы РЕГРЕССИЯ. Для выбранной модели получены следующие значения:
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Y-пересечение |
-6,634579097 |
25,16983959 |
-0,263592427 |
0,799684995 |
X2 |
0,992525051 |
0,764518131 |
1,29823612 |
0,235340264 |
X1 |
0,595751398 |
0,468789307 |
1,27082975 |
0,244390643 |
Для свободного коэффициента a = -0.6345 определена статистика t(a) = -0,26 .
t(a) = -0,29 < = 2,20 kp t , следовательно, свободный коэффициент а не является значимым, его можно исключить из модели.
Для коэффициента регрессии b2 =0.99 определена статистика t(b1) =1.30.
|t(b1)| = 1.30<tкр = 2,20 t kp , значит, коэффициент регрессии b2 не является значимым.
Для коэффициента регрессии b1 = 0,5957 определена статистика
|t(b2)| = 1.27<tкр = 2,20, следовательно, коэффициент регрессии b1 не является значимым, и его можно исключить из модели.
Выводы о значимости коэффициентов модели сделаны на уровне значимости α=5%. Рассматривая столбец «Р-значение», отметим, что свободный коэффициент а можно считать значимым на уровне 0,80 = 80%; коэффициент регрессии b1 на уровне 23,5 %; а коэффициент регрессии b2 на уровне 24,4%.
При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества парной модели и выбранной множественной модели используем нормированные коэффициенты детерминации.
Модель |
Нормированный R-квадрат |
Yt=-6,63+0,60*x1+0,99*x2 |
0,544 |
Yt=14,459+1,046*x1 |
0,50545528 |
|
|
R12 = 0,51< R22 =0,544, таким образом, при добавлении в уравнение регрессии фактора Х2 качество модели улучшилось, что говорит в пользу сохранения фактора Х2 в модели.
Подготовим X1 = 58,4; X2 = 47,8; Y = 75,6 (функция СРЗНАЧ)
и найдем Э1=0,60*58,4/7,56=7,72; Э2= 0,99*47,8/7,56=6,26.
Следовательно, при увеличении Х1 на 1% и неизменном уровне X2 Y увеличивается в среднем на 7.72%.
Увеличение Х2 на 1% приводит к снижению Y в среднем на 6.26% (при неизменном значении X1.
Бета- коэффициенты.
Sx1= 18.92; S x2 = 13.65; Sy = 26.46.
Рассчитаем β1=0.60*18,92/26,46=0,43.
β2=0,99*13,65/26,46=0,50
Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0,43 своего стандартного отклонения Sy, а при увеличении только фактора Х2 на одно его стандартное отклонение увеличивается на 0,50 Sy.
Дельта - коэффициенты.
∆1=0,645*0,7486/0,645=0,7486
∆2 =0,645*0,7509/0,645=0,75089
Значит, по уравнению полученной линейной двухфакторной модели изменение результирующего фактора Y на 75% объясняется воздействием фактора Х2 и на 71% влиянием фактора Х1.
Задача № 2.
Исследование динамики экономического показателя
на основе анализа одномерного временного ряда
В течение девяти последовательных недель фиксировался спрос Y(t) (млн. руб.) на кредитные ресурсы финансовой компании. Временной ряд Y(t) этого показателя приведен ниже.
10 14 21 24 33 41 44 47 49
Задание:
1. Проверить наличие аномальных наблюдений.
2. Построить линейную модель временного ряда yˆt=a+b*t, параметры которой оценить МНК.
3. Оценить адекватность построенной модели, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения.
4. Оценить точность модели на основе использования средней относительной ошибки аппроксимации.
5. Осуществить прогноз спроса на следующие 2 недели (прогнозный интервал рассчитать при доверительной вероятности 70%).
6. Представить графически фактические значения показателя, результаты моделирования и прогнозирования.
1. Проверить наличие аномальных наблюдений.
Используем метод Ирвина, основанный на определении λ t статистик
Подготовим S y= 14,70639 (функция СТАНДОТКЛОН) и рассчитаем λ t статистики.
Результаты расчетов приведем в таблице:
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Y |
10 |
14 |
21 |
24 |
33 |
41 |
44 |
47 |
49 |
Критические значения кр λ приведены в Приложении 3. При n = 9 и уровне значимости α = 5% можно использовать λ кр = 1,5.
Величина статистики λ9=0,136 <λkp= 1,5, поэтому соответствующее наблюдение y9 = 0.136 не признается аномальным и не требует замены. В качестве нового значения можно принять среднее двух соседних значений.
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Y |
10 |
14 |
21 |
24 |
33 |
41 |
44 |
47 |
49 |
λ1 |
|
0,271991 |
0,475984 |
0,203993 |
0,611979 |
0,543981 |
0,203993 |
0,20399302 |
0,135995 |
Yсглаж |
10 |
15,5 |
19 |
27 |
32,5 |
38,5 |
44 |
46,5 |
30,85319 |
Полученный сглаженный ряд будем использовать для выполнения следующих пунктов задачи.
2. Построить линейную модель временного ряда yˆt=a+b*t, параметры которой оценить МНК.
С помощью программы регрессия найдём
|
Коэффициенты |
Y-пересечение |
4,944444444 |
t |
5,3 |
Таким образом, a = 4,94; b = 5,3 .
Модель построена, ее уравнение имеет вид yˆt = 4,94+5,3 ⋅ t.
Коэффициент регрессии b = 5,3 показывает, что с каждой неделей спрос на кредитные ресурсы финансовой компании(Y) увеличивается в среднем на 5,3 млн. руб.
3. Оценить адекватность построенной модели, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения.
Проверка перечисленных свойств состоит в исследовании Ряда остатков t e , который содержится в таблице «Вывод остатка» итогов РЕГРЕССИИ.
Наблюдение |
Предсказанное y |
Остатки |
1 |
10,24444444 |
-0,24444 |
2 |
15,54444444 |
-1,54444 |
3 |
20,84444444 |
0,155556 |
4 |
26,14444444 |
-2,14444 |
5 |
31,44444444 |
1,555556 |
6 |
36,74444444 |
4,255556 |
7 |
42,04444444 |
1,955556 |
8 |
47,34444444 |
-0,34444 |
9 |
52,64444444 |
-3,64444 |
Для проверки свойства независимости остаточной компоненты используем кри-
терий Дарбина-Уотсона.
Согласно этому критерию вычислим статистику d.
d = 52,32/44,82=1,167
По таблице d статистик Дарбина Уотсона (Приложение 4) определим критические уровни: нижний d1 = 0,82 и верхний d2 = 1,32.
Сравним полученную фактическую величину d с критическими уровнями d1 и d2 и сделаем вывод:
d=1.167 € (d2=0.8;1.32), следовательно, свойство независимости остатков для построенной модели выполняется.
Для проверки свойства случайности остаточной компоненты используем критерий поворотных точек (пиков), основой которого является определение количества поворотных точек для ряда остатков.
С помощью Мастера диаграмм построим график остатков еt.
Поворотными считаются точки максимумов и минимумов на этом графике (в данном случае вторая, третья, четвёртая, и шестая) Их количество p = 4 .
Вычислим критическое значение p кр.= [3/3*7-1,96*] = 2
Сравним значения p и pкр и сделаем вывод:
p = 4 > pк = 2, следовательно, свойство случайности для ряда остатков выполняется.
Для проверки соответствия ряда остатков нормальному закону распределения используется R/S критерий.
В соответствии с этим критерием вычислим статистику
R/ S = .
По таблице критических границ отношения R/S (Приложение 5) определим критический интервал. При n = 9 можно использовать (2,60; 3,60).
Сопоставим фактическую величину R/S с критическим интервалом и сделаем вывод:
3,12 € (2,60; 3,60), значит, для построенной модели свойство нормального распределения остаточной компоненты выполняется.
Проведенная проверка показывает, что для построенной модели выполняются все свойства. Таким образом, данная трендовая модель является адекватной реальному ряду наблюдений, её можно использовать для построения прогнозных оценок.
4. Оценить точность модели на основе использования средней относительной ошибки аппроксимации.
Используем исходные данные yt (сглаженный ряд) и найденные программой РЕГРЕССИЯ остатки et (таблица «Вывод остатка»).
Рассчитаем столбец относительных погрешностей и найдем среднее значение eотн = 6,0423%.
Сравнение показывает, что 5% < 6,0423% < 15%. Следовательно, точность модели удовлетворительная.
5. Осуществить прогноз спроса на следующие 2 недели (прогнозный интервал рассчитать при доверительной вероятности 70%).
«Следующие 2 недели» соответствуют периодам упреждения k 1= 1 и k 2= 2, при этом t*1= n + k1= 10; t*2 = n + k2=11.
Согласно уравнению модели получим точечные прогнозные оценки
yˆ*10=4.94+5.3*10=57.94
yˆ*11=4.94+5.3*11=63.24
Таким образом, ожидаемые цены на спрос кредитных ресурсов финансовой компании в следующие 2 недели будут составлять около 57,94 млн. руб. и 63,24 млн. руб. соответственно.
Для оценки точности прогнозирования рассчитаем границы прогнозных интервалов для индивидуальных значений результирующего признака (доверительная вероятность р = 70%).
Подготовим:
t kp = 1,89 (функция СТЬЮДРАСПОБР при α = 10%, k = 9- 2 = 7 );
S(e) = 2,53 (строка «стандартная ошибка» итогов РЕГРЕССИИ);
t = 5 (функция СРЗНАЧ).
Вычислим размах прогнозного интервала для индивидуальных значений:
U10=1.89*2.53*
U11=1.89*2.53*
При t1* =10 получим
u ниж10 =57,94-5,92=52,02
u верх10 =57,94-5,92=63,86
При t1* =11 получим
u ниж11 =63,24-6,25=56,99
u верх11 =63,24-6,25=69,49
Таким образом, с надежностью 70% можно утверждать, что спрос на кредитные ресурсы финансовой компании на следующей неделе будет составлять от 52,02 до 63,86 млн. руб., а через неделю от 56,99 до 69,49 млн. руб.
6. Представить графически фактические значения показателя, результаты моделирования и прогнозирования.