Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Лабораторна робота 5 Оцінювання параметрів регресійних рівнянь за допомогою пакету Eviews Мета роботи-

Работа добавлена на сайт samzan.net:


Лабораторна робота 5

Оцінювання параметрів регресійних рівнянь

за допомогою пакету Eviews

Мета роботи: Навчитись обчислювати за допомогою пакету Eviews оцінки коефіцієнтів рівняння авторегресії та регресії на основі вибірок статистичних даних. Пояснити призначення та використання параметрів (статистик), за допомогою яких визначається ступінь адекватності моделі процесу. Навчитись будувати модель нестаціонарного процесу (з трендом) на основі даних, що знаходяться у файлі на диску. Пояснити різницю в побудові моделі стаціонарного і нестаціонарного процесу. Розглянути поняття та призначення фіктивних змінних.

  1.  Теоретичні відомості

Стаціонарні та нестаціонарні процеси

Процеси, представлені часовими рядами, називають стаціонарними, якщо три основні статистичні характеристики відповідного часового ряду не залежать від часу, а саме: математичне сподівання, дисперсія та коваріація.

Формально стаціонарність процесу формулюють наступним чином:

  •   (постійне математичне сподівання);
  •   (постійна дисперсія);
  •  ,   (постійна коваріація).

Якщо хоча б одна із наведених статистичних характеристик процесу змінюється в часі, то процес називають нестаціонарним. Існують деякі інші визначення стаціонарності, але наведене є самим поширеним і саме воно найчастіше використовується на практиці.

У випадку, коли , тобто математичне сподівання змінюється в часі, то такий процес називають процесом з трендом або інтегрованим процесом (по аналогії із характером зміни сигналу на виході інтегратора) або процесом з одиничними коренями (відповідного характеристичного рівняння). Тренд (поточне середнє) може бути зростаючим або спадаючим, а за характером зміни в часі може бути детермінованим або стохастичним.

Детермінований тренд описують вибраною функцією, наприклад, поліномом від часу, сплайном, експонентою, комбінацією тригонометричних функцій і т. ін. Часто використовують поліноми від часу вигляду:

,   (1.1)

де  дискретний час, який зв’язаний з неперервним реальним часом  через період реєстрації (дискретизації) даних: ;  випадкова змінна, оцінку якої можна знайти після оцінювання рівняння: , де  похибка моделі. Очевидно, що після оцінювання моделі послідовність значень  буде містити всі коливання, що накладаються на тренд.

Випадкові тренди, тобто тренди, які не можна описати з необхідною точністю за допомогою детермінованих функцій, моделюють за допомогою випадкових процесів. В даній роботі цей підхід не розглядається.

Таким чином, описуючи тренд рівнянням (1.1), ми фактично видаляємо його з процесу і повна модель процесу буде складатись щонайменше з двох рівнянь: рівняння (1.1) для тренду і рівняння АРКС(p,q), яке описує коливання, що накладаються на тренд.

Тренд може бути видалений з процесу (даних) за допомогою різниць. Так, перші різниці видаляють тренд першого порядку (лінійний тренд), другі різниці видаляють квадратичний тренд і т.д. Наприклад, нехай . Перші різниці цього процесу

 

приводять до видалення лінійного тренду. Очевидно, що після видалення тренду ми вже не зможемо його спрогнозувати. Докладно задача моделювання процесів з трендом буде розглянута в подальшому.

Якщо процес містить сезонний ефект, то він враховується шляхом введення в праву частину рівняння залежної змінної із затримкою, що дорівнює періоду сезонного ефекту, або введення складової ковзного середнього з тією ж затримкою. Для зменшення дисперсії процесу з сезонним ефектом застосовують так звані “сезонні” різниці, тобто різниці вигляду: , де “4” означає періодичність сезонного ефекту.

Логарифмування даних. В процесі побудови математичних моделей зустрічаються статистичні дані, представлені досить великими числами, наприклад, десятки і сотні тисяч, мільйони і мільярди. Такі числа необхідно перетворювати у більш прийнятні для обчислювального процесу величини. Оскільки для алгоритмів оцінювання параметрів моделей характерним є накопичення похибок обчислень, а в деяких випадках необхідно обчислювати обернені матриці, то великі числа необхідно логарифмувати або нормувати у вибраному діапазоні значень.

2  Порядок виконання роботи

2.1  Згенерувати тестовий ряд даних 

За допомогою системи Eviews і різницевого рівняння авторегресії із ковзним середнім (АРКС), яке має вигляд:

, (2.1)

де залежна змінна; вхідна змінна процесу, згенерувати значення залежної змінної . Тип рівняння (2.1) скорочено записується як АРКС(2,1) (тобто, другий порядок по авторегресії і перший порядок відносно ковзного середнього). Виберіть коефіцієнти рівняння (2.1) таким чином, щоб  був стаціонарним процесом. Для цього необхідно щоб виконувалась необхідна умова  

  ,   і достатня   .

Для генерації вхідної послідовності  можна скористатись стандартною функцією пакета Eviews - оператор NRND (normally distributed random numbers) пакета Eviews.  Коли ми маємо значення випадкової величини, то значення залежної змінної  обчислюються за допомогою рівняння (2.1). Для цього необхідно скористатися опцією Generate Series.  

Пояснення: Створюємо робочий файл довжиною 100 значень. Генеруємо . Quick, General Series, e=nrnd. Підбираємо коефіцієнти с1, с2, с3. Їх сума повинна бути менша за 1. Генеруємо у=у. Заповнюємо перші дві клітинки. Генеруємо у: y=0.1*y(-1)+0.2*y(-2)+0.3*e(-1)+e.

2.2 Обчисліть коефіцієнти рівняння (2.1) за допомогою наступної опції:

                   Objects/New Object/Equation

У вікні Equation Specification задайте тип рівняння, яке описує ряд даних:

.    (2.2)

Це рівняння точно співпадає по формі з тим, яке було використане в програмі генерації вихідних даних.

В підменю Estimation Settings виберіть опцію Least Squares і натисніть ОК. В результаті з’явиться нове вікно Equation: UNTITLED Workfile: UNTITLED, в якому ви знайдете оцінки коефіцієнтів рівняння та супутні статистичні характеристики.

Порівняйте отримані значення оцінок коефіцієнтів  з точними значеннями, які були використані при генерації вибірки даних.

Оцінки та точні значення коефіцієнтів повинні бути дуже близькими. За допомогою статистичних параметрів, обчислених пакетом, визначте адекватність отриманої моделі.

  1.  Побудова моделі нестаціонарного процесу  

Для побудови моделі нестаціонарного процесу скористайтесь даними, що зберігаються у файлі US_M1.txt. Цей файл містить дані щодо агрегату М1 з першого кварталу 1960 року по четвертий квартал 1991 року для США (128 значень). За допомогою пакета Eviews організуйте робочий файл і введіть дані з диска. Обробка даних виконується в наступній послідовності:

А) Побудуйте графік введеного ряду і візуально визначте наявність нестаціонарності (тренду); обчисліть та надрукуйте параметри описової статистики. (Viev, Line Graph. З графіка робимо висновок, що ряд має тенденцію на підйом, значить матсподівання росте, значить ряд має тренд значить він нестаціонарний. Для отримання описової статистики виконуємо дії: Viev, Descriptive Statistic, Histogram and Stats).

Б) Знайдіть рівняння, що описує тренд:

,     (2.3)

де  дискретний час (він знаходиться у файлі discrtime.txt); , тобто залишку, отриманому після оцінювання рівняння (2.3), ця величина буде використана пізніше, а тому сформуйте додатково ряд  із значень  (позначте його, наприклад, ). Рівняння для оцінювання тренду прологарифмованих значень ряду має вигляд:

 ,

де ; значення  (дискретний час) необхідно брати з файла disctime.txt.

– Наскільки є адекватною отримана модель?

 Виконання: Імпортуємо ряд k(час) з папки лаб3. Генеруємо ряд lm1=log(m1) - (Quick, General Series).  Моделюємо тренд за допомогою полінома 2 степені: lm1=c(1)+c(2)*k+c(3)*k^2. Копіюємо resid в ek. (Quick, General Series). Робимо висновок про адекватність моделі по R^2 – коефіцієнту детермінації (для адекватної моделі він близький до 1).

В) Знайдіть значення автокореляційної функції (АКФ) для залишків ek.

Г) Обчисліть АКФ та часткову АКФ для перших різниць логарифмованих даних, тобто для , поясніть значення АКФ при значеннях лагу 4, 8 та 12 (тобто, чи містить цей процес сезонний ефект?):

Яку структуру моделі можна запропонувати для описання цього ряду?

 Виконання: перші різниці знаходимо за допомогою вбудованої функції d(). Генеруємо ряд dl=d(lm1). Будуємо графік для dl і з графіка робимо висновок, що ряд стаціонарний. Відкриваємо корелограму і по Autocorrelation бачимо, що лаги 4, 8, 12 виступають найбільше. Це свідчить про сезонний ефект. Для описання цього ряду можна запропонувати модель: dl=c(1)*dl(-1)+c(2)*dl(-3)+c(3)*dl(-4).

 

Д) Знайдіть сезонні різниці для логарифмованих даних наступним чином:

 ,

тобто згенеруйте ще один ряд даних із сезонних різниць. Знайдіть АКФ та часткову АКФ для отриманого ряду (сезонних різниць). Зробіть візуальний аналіз графіків цих функцій. Побудуйте модель для сезонних різниць:  .

Наскільки вона адекватна?

Виконання: Генеруємо ряд: ml=dl-dl(-4). Будуємо графік. Графік говорить про те, що цей процес стаціонарний (коливається біля 0). Будуємо модель: ml=c(1)+c(2)*ml(-4) (залишки моделі  в resid). Для визначення адекватності моделі аналізуємо R^2.

Є) Для ряду:     побудуйте модель типу  

 .

Запис для пакету Eviews: . Порівняйте її адекватність з попередніми.  

Виконання: Генеруємо ряд: ddml=d(ml). Моделюємо: Quick, estimate equation ek=ek(0)+c(1)*ek(-4). Для даної моделі коефіціент R^2=1. Значить модель адекватна.

  1.  Побудова моделі з використанням фіктивних змінних

Вище ми розглянули регресію, в якій регресори мали тільки кількісні значення. Однак, на залежну змінну можуть впливати, поряд з кількісними, якісні змінні – якість продукції, стать робітника, відношення до релігії, політичні погляди, страйки і т. ін. Такі фактори також можна вводити в регресію і досліджувати їх вплив на залежну змінну.

Часто якісні змінні є бінарними і приймають значення “1” або “0” при наявності або відсутності певної якості. Такі змінні називають фіктивними (dummy variables). (Фіктивними в тому смислі, що вони відрізняються від звичних змінних тим, що приймають тільки деякі специфічні значення.)

Звичайно, фіктивні змінні не обов’язково приймають значення (0 і 1). Пара (0, 1) може легко трансформуватись в будь-яку іншу пару шляхом лінійного перетворення типу

   , ,

де  константи;  приймає значення “1” або “0”. Так, якщо , то

   ,

а якщо , то .

Фіктивні змінні можуть застосовуватись у регресійних моделях разом з кількісними змінними, а можуть застосовуватись у моделях, де всі змінні – фіктивні. Розглянемо просту модель аналізу успішності студентів в залежності від їхньої успішності в школі:  

   ,

де  середній рейтинг успішності студента першого курсу університету;  фіктивна змінна, яка приймає значення , якщо середній бал студента в школі  ;  в протилежному випадку.

Наведена модель, , встановлює залежність успішного навчання в університеті від успішного навчання в школі. Як і у випадку класичної лінійної регресії, можна визначити:

  •  середній рейтинг відмінників: ;
  •  середній рейтинг всіх інших учнів: .

Таким чином, середній рейтинг відмінників , а для всіх інших учнів він дорівнює .

Фіктивні змінні широко використовують при аналізі агрегованих даних. Агреговані дані можуть бути отримані шляхом об’єднання спостережень, які відносяться до різної статі (чоловіки та жінки), до різних вікових, мовних та соціальних груп, до різних періодів часу.

В таких ситуаціях моделі, побудовані за окремими групами, можуть суттєво відрізнятися, і тоді модель, побудована за об’єднаними даними, не враховує цих відмінностей. Застосування фіктивних змінних дозволяє оцінити значущість вказаних відмінностей і за результатами цієї оцінки зупинитися чи на моделі з агрегованими даними, чи на моделі, в якій враховується відмінність параметрів зв’язку для різних груп (або періодів часу).

Приклад застосування фіктивних змінних

Побудуємо модель зв’язку між змінними  та , які в 15 спостереженнях приймали наступні значення:

X

Z

X

Z

X

Z

1

1.257

6

0.865

11

1.804

2

1.812

7

1.930

12

1.956

3

3.641

8

2.944

13

3.134

4

4.401

9

4.316

14

4.649

5

5.561

10

5.323

15

4.559

Оцінювання лінійної моделі зв’язку вказаних змінних дає наступні результати:

Dependent Variable: Z

Method: Least Squares

Date: 09/14/04   Time: 15:27

Sample: 1 15

Included observations: 15

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

C

2.245219

0.763984

2.938830

0.0115

X

0.111364

0.084027

1.325339

0.2079

R-squared

0.119034

   Mean dependent var

3.136133

Adjusted R-squared

0.051267

   S.D. dependent var

1.443531

S.E. of regression

1.406041

   Akaike info criterion

3.642999

Sum squared resid

25.70037

   Schwarz criterion

3.737405

Log likelihood

-25.32249

   F-statistic

1.756523

Durbin-Watson stat

1.466410

   Prob(F-statistic)

0.207880

-статистика для коефіцієнта при  приймає значення , що дає значення імовірності  і веде до невідхилення гіпотези щодо рівності цього коефіцієнта нулю. Значення коефіцієнта детермінації, яке дорівнює , є значно меншим за одиницю, тільки 11,9% дисперсії лінійної моделі відповідає дисперсії реальної моделі. Також статистика Дарбіна-Уотсона, яка для найкращої моделі має наближатися до двійки, для даної лінійної моделі складає . Таким чином, регресія змінної  на змінну  визнається незначущою в цілому.

Розглянемо графік залежності  від .

Рис. 2.1. Залежність  від .

Графік вказує на наявність трьох режимів лінійного зв’язку між змінними  та , які відповідають 5-ти першим, 5-ти центральним і 5-ти останнім спостереженням. Коефіцієнт при , здається, є однаковим для всіх трьох режимів, тоді як константи відрізняються.

Щоб врахувати виявлену за графіком наявність трьох режимів, застосуємо в якості додаткових пояснюючих змінних дві фіктивні змінні: змінну , яка дорівнює “” в п’яти центральних і “” в усіх інших спостереженнях, а також змінну , яка дорівнює “” в п’яти останніх і “” в усіх інших спостереженнях. Оцінювання розширеної моделі за участю цих додаткових пояснюючих змінних дає наступні результати:

Dependent Variable: Z

Method: Least Squares

Date: 09/14/04   Time: 15:45

Sample: 1 15

Included observations: 15

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

C

0.264200

0.307148

0.860172

0.4081

X

0.949400

0.079305

11.97147

0.0000

D2

-4.783800

0.482395

-9.916773

0.0000

D3

-9.386000

0.839288

-11.18329

0.0000

R-squared

0.928856

   Mean dependent var

3.136133

Adjusted R-squared

0.909453

   S.D. dependent var

1.443531

S.E. of regression

0.434373

   Akaike info criterion

1.393350

Sum squared resid

2.075475

   Schwarz criterion

1.582164

Log likelihood

-6.450126

   F-statistic

47.87210

Durbin-Watson stat

1.995423

   Prob(F-statistic)

0.000001

В цьому випадку регресія виявляється не тільки статистично значимою, але й має дуже високу значимість; те ж відноситься і до коефіцієнтів при змінних , та . Висока значимість двох останніх коефіцієнтів підтверджує значиму відмінність констант в моделях лінійного зв’язку між змінними  та .

Таким чином, ми підібрали три різні моделі лінійного зв’язку між  та :

  •  модель для першого режиму:

;

  •  модель для другого режиму:

;

  •  модель для третього режиму:

.

Dependent Variable: Z

Method: Least Squares

Date: 09/16/04   Time: 18:18

Sample: 1 15

Included observations: 15

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

X

1.002240

0.049610

20.20219

0.0000

D2

-4.942320

0.440947

-11.20841

0.0000

D3

-9.808720

0.672949

-14.57572

0.0000

R-squared

0.924071

   Mean dependent var

3.136133

Adjusted R-squared

0.911416

   S.D. dependent var

1.443531

S.E. of regression

0.429639

   Akaike info criterion

1.325115

Sum squared resid

2.215078

   Schwarz criterion

1.466725

Log likelihood

-6.938359

   Durbin-Watson stat

2.006267

Контрольні запитання 

  1.  Як отримати оцінки коефіцієнтів рівняння типу АР чи АРКС за допомогою пакету

     Eviews?

2.   Чому ми задаємо вхідний сигнал у вигляді псевдовипадкового процесу?

  1.  Для чого логарифмують значення часового ряду?
  2.  Поясніть значення статистичних величин, що використовуються для визначення

ступеня адекватності моделі (які генерує пакет після обчислення коефіцієнтів різницевого рівняння):  статистика.

  1.  В чому полягає різниця між стаціонарним і нестаціонарним процесами?
  2.  Дайте визначення стаціонарного процесу?
  3.  Чому є нестаціонарним процес, представлений даними у файлі US_M1.txt?
  4.  Розкажіть яка послідовність побудови моделі нестаціонарного процесу?
  5.  Для чого використовують перші та різниці вищих порядків?
  6.  Яка мета застосування “сезонних” різниць?
  7.  В чому полягає відмінність фіктивних змінних від звичайних кількісних?
  8.  Наведіть випадки, коли необхідно використовувати фіктивні змінні.

7

PAGE  1




1. Проектирование тягача лесной промышленности
2.  EXCEL На рисунке представлен фрагмент ТАБЛИЦЫ в ячейку В6 записана статистическая функция СЧЁТА1-В5
3. How to get control of your time nd your life
4. Доклад- Слепцов Василий
5. Особенности работы с локальными конкурентами и мерчендайзинг
6.  Амнистия
7. Логистические концепции
8. Фондовая регистрационная компаниях
9. Реферат- Тактика допроса обвиняемого
10. Ахматова жасминный куст обугленный туманом серым
11. Основы безопасности жизнедеятельности Рабочая программа
12. Формы государственного управления Шпоры по ГМУ ЗС
13. я ОДШБр ВДВ36 бригада вдв была сформирована осенью 1979 года в н.html
14. тематические методы в экономике Выполнил Студент группы ЗЭиУ431 Медведева Е
15. Архив оракула или Иньский оракул.
16. Пищевая ценность продуктов. Супы и бульоны
17. Unit1.h -- prgm pckgesmrtinit prgm resource
18. либо bundum Fingrium ~ вызывает появление большого количества пальцев
19. РАСКРОЙТЕ ЭКОНОМИЧЕСКУЮ СУЩНОСТЬ ФИНАНАНСОВ
20. Использование криминалистической фотографии при производстве отдельных следственных действий