Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
PAGE 122
Міністерство освіти і науки, молоді та спорту України
Харківський інститут фінансів
Українського державного університету фінансів
та міжнародної торгівлі
Кафедра економіко-математичних методів та інформаційних технологій
ЕКОНОМЕТРИКА
Опорний конспект лекцій
для студентів денної форми навчання
галузі знань 0305 «Економіка та підприємництво»
напряму підготовки 6.030509 «Облік і аудит»
6.030508 «Фінанси і кредит»
6.030505 «Управління персоналом та економіка праці»
6.030503 «Міжнародна економіка»
освітньо-кваліфікаційного рівня бакалавр
Укладач: Кузніченко В. М., к. ф.-м. н., доцент
Розглянуто та ухвалено
на засіданні кафедри
Протокол від 28.09.12 р. № 3
Харків
2012 рік
Зміст
Тема 1. Принципи побудови економетричних моделей. Парна лінійна регресія. Лекція 1. Основи економетричного моделювання. |
3 |
Лекція 2, 3. Модель парної регресії |
27 |
Тема 2. Лінійні моделі множинної регресії. Лекція 4. Багатомірна лінійна модель |
42 |
Лекція 5. Перевірка залишків регресії на мультиколінеарність. |
58 |
Лекція 6. Перевірка залишків регресії на гомоскедастичність та гетероскедастичність |
75 |
Тема 3. Економетричні моделі динаміки. Лекція 7, 8. Види економетричних моделей динаміки. |
92 |
Тема 4. Узагальнені економетричні моделі. Лекція 9. Системи економетричних рівнянь. |
110 |
Тема 1. Принципи побудови економетричних моделей. Парна лінійна регресія.
Лекція 1
Тема лекції: Основи економетричного моделювання
Мета: Ознайомитися з предметом, методами та завданнями дисципліни. Роллю економетричних досліджень в економіці, економетричною моделлю, її видами, особливостями та етапами економетричного моделювання.
План лекції:
Література:
1. ПРЕДМЕТ, МЕТОДИ ТА ЗАВДАННЯ ДИСЦИПЛІНИ. РОЛЬ ЕКОНОМЕТРИЧНИХ ДОСЛІДЖЕНЬ В ЕКОНОМІЦІ.
Обєктом дослідження є економічні системи та простори різного рівня складності та орієнтації: економіка галузей, регіонів, і світу в цілому, процеси, які в них відбуваються.
Метою дослідження є аналіз (у квантифікованому аспекті) реальних економічних систем та процесів, що в ній відбуваються, побудова і дослідження відповідних економетричних моделей, їх використання в конкретних економічних системах і просторах при системній організації управління ними.
Роль економетричних досліджень в економіці.
до загального комплексу традиційних методів і засобів моделювання структури і поведінки економічних систем, який включає власне статистичні методи: однокроковий метод найменших квадратів (1-МНК), дво- і трикроковий метод найменших квадратів (2-МНК, 3-МНК); метод максимальної правдоподібності; методи, побудовані на визначенні різних статистичних оцінок математичного сподівання, дисперсії, автокореляції, мультиколінеарності, довірчих інтервалів тощо для оцінювання параметрів моделі, їх верифікації, перевірки відповідних гіпотез тощо.
Крім того, методи економетрії включають в себе: спеціальні методи аналізу і моделювання власних часів протікання процесів і явищ в економічних просторах і системах; методи мікро- та макро-економіки; лінійної екстраполяції (МЛЕ); причинного аналізу; групового врахування параметрів (МГВА); моделі, спектрального аналізу, адаптивного та ітераційного моделювання і керування; одержання класів альтернативних рішень (зокрема, Парето-аналіз); організаційні методи прийняття рішень; методи каузальної алгебри (причинного аналізу), загальної теорії систем; спеціальні методи прийняття рішень; теорії адаптивних систем, актуарної математики тощо. Для опису економічних систем використовують мову теорії ресурсних класів систем, і каузальної алгебри, а для дослідження поведінки таких систем - методи, які покладені в основу системного, процесного і економетричного підходу .
Сучасні методи управління економічними системами та процесами базуються на широкому використанні математичних методів та ЕОМ. Застосовувати математику для розвязування певних економічних задач почали дуже давно, сотні років тому. Але протягом останніх 5060 років, коли економічна наука сягнула певних рубежів у своєму розвитку і в ній постали задачі, які не вдається розвязати за допомогою традиційних економічних методів, математика посіла в цій науці одне з основних місць. Сформувався напрямок теоретично-практичних досліджень економіко-математичне моделювання. Математичне моделювання є вираженням процесу математизації наукового економічного знання. Математика, проникаючи в сутність економічної науки, приносить із собою точність та універсальність розвязків, строгість і довершеність наукових концепцій. З розвитком математики, електронної обчислювальної техніки, загальнометодологічних та економічної наук дедалі стають різноманітнішими математичні моделі, виникають усе нові форми математичного моделювання.
Математична модель кожного обєкта (процесу, явища) містить у собі три групи елементів: 1) характеристику обєкта, який потрібно визначити (невідомі величини), вектор Y = (yj); 2) характеристики зовнішніх (щодо модельованого обєкта) умов, які змінюються, вектор X = (xj); 3) сукупність внутрішніх параметрів обєкта A.
Множини умов та параметрів X і A можуть розглядатись як екзогенні величини (тобто такі, які визначаються поза рамками моделі), а величини, що належать вектору Y, як ендогенні (тобто такі, які визначаються за допомогою моделі).
Математичну модель можна тлумачити як особливий перетворювач зовнішніх умов обєкта X (входу) на характеристики обєкта Y (виходу), які мають бути знайдені.
залежно від способу вираження співвідношень між зовнішніми умовами, внутрішніми параметрами та характеристиками, які мають бути знайдені, математичні моделі поділяються на дві групи: структурні та функціональні.
Структурні моделі відбивають внутрішню організацію обєкта: його складові частини, внутрішні параметри, їх звязок з «входом» і «виходом» і т.ін. Розрізняють три види структурних моделей:
1) Yj=fj(A,X); (1)
2) i(A,X,Y)=0; (2)
3) імітаційні моделі.
У моделях першого виду всі невідомі величини подаються у вигляді явних функцій від зовнішніх умов і внутрішніх параметрів обєкта.
У моделях другого виду невідомі визначаються одночасно із системи співвідношень і-го виду рівнянь, нерівностей і т.ін.
В імітаційних моделях невідомі величини визначаються також одночасно із вхідними параметрами, але конкретний вигляд співвідношень невідомий.
Моделі типу (1) (2) це досить визначені математичні задачі, які можна розвязати з допомогою чисельних алгоритмів. Модель (1) дає аналітичний розвязок, але можливості побудови таких моделей дуже обмежені. Для розвязування задачі (2), яка не зводиться до задачі (1), необхідно мати алгоритм, причому цей алгоритм може не лише застосовуватися для окремих розвязків, але й виявляти загальні властивості розвязків, які не залежать від конкретних параметрів задачі.
Імітаційні моделі не зводяться до чітко визначених математичних задач, а тому потрібно знаходити особливі способи для одержання розвязків. Такі моделі виникають при спробах дати математичний опис особливо складних обєктів (складних систем). Для дослідження цих обєктів (систем) використовуються порівняно нові математичні методи: теорія випадкових процесів, теорія ігор та статистичних рішень, теорія автоматів і т.ін. Активну роль в процесі такого моделювання відіграють ЕОМ.
Імітаційні моделі не мають чіткого зображення внутрішньої організації (структури) обєкта, і тому їм належить проміжне місце між структурними та функціональними моделями.
Основна ідея функціональних моделей пізнання сутності обєкта через найважливіші прояви цієї сутності: діяльність, функціонування, поведінку. Внутрішня структура обєкта при цьому не вивчається, а тому інформація про структуру не використовується. Функціональна модель описує поводження обєкта так, що задаючи значення «входу» X, можна дістати значення «виходу» Y (без участі інформації про параметри ):
Y=A(X). (3)
Побудувати функціональну модель означає знайти оператор A, який повязує X і Y.
Відмінності між структурними та функціональними моделями мають відносний характер. Вивчення структурних моделей дає одночасно цінну інформацію про поводження обєкта. З іншого боку, при вивченні функціональних моделей виникають гіпотези про внутрішню структуру обєкта.
Економетричні моделі належать до функціональних моделей. Вони кількісно описують звязок між вхідними показниками економічної системи (X) та результативним показником (Y). У загальному вигляді економетричну модель можна записати так:
Y =f(X,u),
де X вхідні економічні показники; u випадкова, або стохастична, складова.
Показники X найчастіше можуть бути детермінованими. Адитивна складова u є випадковою змінною, а отже, з огляду на те, що залежна змінна Y залежить від u, вона також є стохастичною. Звідси випливає висновок: економетрична модель є стохастичною.
Побудова і дослідження економетричних моделей мають ряд особливостей. Ці особливості повязані з тим, що економетричні моделі є стохастичними. Вони кількісно описують кореляційний звязок між економічними величинами. Отже, щоб побудувати економетричну модель, необхідно:
1) мати достатньо велику сукупність спостережень вихідних даних;
2) забезпечити однорідність сукупності спостережень;
3) забезпечити точність вихідних даних.
Формування сукупності спостережень
Поняття сукупності спостережень є основою економетричного моделювання. Слід розрізняти одиницю спостереження джерело даних і одиницю сукупності носія ознак, які підлягають спостереженню. Ці поняття найбільш чітко розрізняються в соціально-економічній статистиці. Наприклад, під час перепису населення одиницею спостереження буде сімя, а одиницею сукупності окрема людина. При статистичних дослідженнях із застосуванням методів багатовимірного статистичного аналізу ці поняття часто збігаються. Тому в економетричному моделюванні здебільшого йтиметься про одиницю сукупності.
Сукупність спостережень можна зобразити у вигляді упорядкованого набору (матриці) даних з параметрами n, m, T, де n число одиниць сукупності ; m число ознак, які описують кожну одиницю ; t проміжок часу, за який вивчається ознака певного спостереження. Наприклад, якщо через X позначити певну ознаку спостереження, то потрібно записати так: , або Xijt, що означає j-та ознака і-го спостереження в період t.
За одиницю сукупності спостережень часто беруть певний економічний обєкт, що функціонує. Вибрати одиницю сукупності означає визначити рівень обєкта моделювання, наприклад великий технологічний агрегат, цех, підприємство, галузь і т.ін.
Розрізняють три способи формування вибірки: часову, просторову і просторово-часову.
Якщо сукупність спостережень вивчається у статиці (просторова вибірка), то всі дані можна зобразити у вигляді матриці розміром nm, в якій кожний рядок несе інформацію про одиницю вибіркової сукупності, а стовпець характеризує певну ознаку.
Часова вибірка містить набір значень ознак функціонування окремого обєкта в динаміці mT, тобто по суті складається з двовимірного чи багатовимірного часового ряду.
Просторово-часова вибірка є комбінацією просторової і часової вибірок nmT.
Поняття однорідності спостережень
Існує багато різноманітних підходів до аналізу та оцінювання ступеня однорідності сукупності спостережень, на основі якої будується економетрична модель.Проте багато дослідників, хоча й мають неоднакові погляди на цю проблему, одностайні в тому, що економічні сукупності, як правило, неоднорідні.
В економетричному дослідженні ми користуємося поняттям відносної однорідності, і може йтися лише про досягнення розумного ступеня однорідності спостережень, для якого можна було б забезпечити достатню точність економічних висновків. Поняття однорідності сукупності спостережень охоплює якісну і кількісну однорідність. Під першою треба розуміти однорідність, яка визначається однотипністю економічних обєктів, їх однаковою якістю та певним призначенням, а під другою однорідність групи одиниць сукупності, що визначається на основі кількісних ознак. При цьому обидва поняття діалектично взаємоповязані, і кількісна однорідність можлива лише за наявності одноякісності явищ та процесів, що утворюють сукупність спостережень.
Ознаки, які включаються у вибірку для кожної одиниці спостереження, будуть виступати потім як змінні економетричної моделі, тому, формуючи сукупність спостережень, треба забезпечити порівнянність даних у просторі та часі.
Це означає, що дані вихідної сукупності спостережень повинні мати:
1) однаковий ступінь агрегування;
2) однорідну структуру одиниць сукупності;
3) одні й ті самі методи розрахунку показників у часі;
4) однакову періодичність обліку окремих змінних;
5) порівнянні ціни та однакові інші зовнішні економічні умови.
Точність вихідних даних
Висновки, які можна зробити в результаті економетричного моделювання, цілком зумовлені якістю вихідних даних їх повнотою та вірогідністю. Це одна з найважливіших особливостей економетричного моделювання, на яку звертають увагу багато видатних економетристів. При економічних розрахунках постає питання про точність (помилку) економічних показників. Похибки показників виникають і нагромаджуються при побудові алгоритму розрахунку, при формуванні даних, у процесі обчислень. Найістотніші похибки можуть виникати при переведенні понять економічної теорії в показники. Ці помилки можна назвати помилками, повязаними з розрахунком економічних показників. Вони спричинюються неточністю і неповнотою визначення змісту показників, невідповідністю між вимогами і фактичним змістом, коли в принципі не можна точно виміряти економічні процеси та явища.
Усі помилки поділяються на систематичні та випадкові.
Систематичні помилки або мають постійну величину, або змінюються, підпорядковуючись певній функціональній залежності. Вони завжди однонапрямлені і можуть бути істотними за величиною.
Випадкові помилки зумовлюються впливом випадкових чинників при формуванні показників. При повторних розрахунках економічних показників такі помилки можуть взаємно погашатись. Проте це не означає, що й економічні наслідки випадкових помилок мають ті самі властивості. Часто відхилення в оцінці показника в будь-який бік призводять до втрат або економічні наслідки є нелінійною функцією випадкових помилок. Тому, формуючи сукупність спостережень для побудови економетричної моделі, слід звертати увагу на можливість існування помилок у вихідних даних. Якщо немає змоги позбутись цих помилок (а впевненість в їх наявності існує), то слід використовувати спеціальні методи оцінювання параметрів економетричної моделі.
Вибір змінних і структура звязків
Економетричне моделювання базується на деякій сумі професійних знань про обєкт дослідження. До завдань попереднього аналізу належить вирішення таких основних питань:
1) визначення набору змінних, які описують процес функціонування досліджуваних обєктів;
2) аналіз взаємозвязків між окремими змінними;
3) установлення переліку допустимих операцій над змінними і звязками, тобто вибір раціонального типу економетричної моделі.
Питання вибору результативних ознак (економічних показників), що моделюються, вирішується відносно просто. Вони часто задані формулюванням мети дослідження. Вибір незалежних змінних (ознак-факторів) є процесом послідовного уточнення початкової гіпотези. У цьому процесі можна вирізнити такі етапи: формування початкової гіпотези про набір незалежних змінних; експертна оцінка цього набору; аналіз взаємозвязків; добір і звуження кола істотних для моделювання змінних.
В основу формування початкової гіпотези про набір змінних покладено загальну схему функціонування обєкта, що моделюється. На перелік змінних, які вносяться до початкового набору, має вплив призначення моделі, тип дослідження і т.ін.
Звуження початкового набору змінних процес багатостадійний, який відбувається на всіх етапах побудови моделі: під час проведення апріорного аналізу і формування робочої гіпотези (ще до збору вихідних даних), на етапі їх попереднього аналізу і перетворення і навіть на етапі побудови моделі. В основу процесу звуження набору змінних на стадії формування робочої гіпотези покладено результати експертного опитування та змістовні міркування різного типу; можливість і точність вимірювань; трудомісткість збору даних; діапазон варіації і можливість регулювання значень змінних; максимально допустиме їх число; функціональні звязки та ряд інших міркувань.
2. ЕКОНОМЕТРИЧНА МОДЕЛЬ, ЇЇ ВИДИ.
Моделі
Складні моделі
Приклад 1. Виробнича функція Кобба Дугласа
Виробнича функція це економетрична модель, яка кількісно описує звязок основних результативних показників виробничо-господарської діяльності з факторами, що визначають ці показники. До основних показників можна віднести дохід, прибуток, рентабельність, продуктивність праці, собівартість і т.ін.
Перше поняття виробничої функції повязане з математичним моделюванням технологічної залежності між обсягом продукції, що випускається, і кількісними характеристиками витрат ресурсів. Звідси і назва функції «виробнича». Уперше така функція була побудована американськими дослідниками Коббом і Дугласом ще в 30-ті роки ХХ ст. за даними про функціонування обробної промисловості США протягом двадцяти років і є класичним прикладом економетричного моделювання.
Функція Кобба Дугласа (CDPF) належить до найвідоміших виробничих функцій, що набули широкого застосування в економічних дослідженнях, особливо на макрорівні. Класична виробнича функція Кобба Дугласа має вигляд
Y =aFL1, (4)
де Y обсяг продукції; F основний капітал; L робоча сила.
У цій функції параметри a, і 1 є невідємними. Таке твердження можна довести, якщо з виробничої функції виключити один з факторів. Для цього, поділивши ліву і праву частини залежності Y = f(F,L) на L, дістанемо функцію двох змінних
W=f(V),
де продуктивність праці; фондоозброєність праці.
Нехай залежність між W і V має вигляд степеневої функції, тобто
W = aV.
Підставивши в цю функцію і , дістанемо:
, або Y = aFL1 .
Сума параметрів або степінь однорідності, класичної функції Кобба Дугласа дорівнює одиниці. А це означає, що при збільшенні обох виробничих ресурсів на одиницю обсяг продукції також збільшиться на одиницю. Отже, ефективність ресурсів у такому разі стала.
Практичні дослідження функції Кобба Дугласа показали, що припущення про лінійну однорідність на практиці виконується рідко. Тому була запропонована виробнича функція загальнішого вигляду
Y =aFL. (5)
Сума параметрів (+) на відміну від попереднього випадку може бути як меншою, так і більшою від одиниці. Якщо ( + ) > 1, то темпи росту обсягу продукції вищі за темпи росту виробничих ресурсів, а якщо ( + ) < 1, то, навпаки, темпи росту продукції нижчі за темпи росту ресурсів.
Припустимо,що рівень кожного виробничого ресурсу збільшився на r %, тоді величини їх дорівнюватимуть і .
Обсяг продукції на основі виробничої функції запишеться так:
Звідси при + > 1 обсяг продукції зростає більш ніж на r %; при + < 1 менш ніж на r %; при + = 1 продукція збільшиться на r %. Визначивши окремі коефіцієнти еластичності для виробничої функції Кобба Дугласа, дістанемо:
Це означає, що граничний приріст продукції за рахунок приросту кожного ресурсу визначається як добуток коефіцієнта еластичності на середню ефективність ресурсу. Параметр a у функції Кобба Дугласа залежить од вибраних одиниць вимірювання Y, F, L; водночас числове значення цього параметра визначається також ефективністю виробничого процесу. У цьому можна переконатись, порівнявши дві виробничі функції, які відрізняються одна від одної лише значенням параметра a.
Для фіксованих значень F і L тій функції, в якої більше числове значення параметра a, відповідає більше значення Y. Отже, і виробничий процес, який описується цією функцією, буде ефективнішим. Другі похідні функції Кобба Дугласа мають такий вигляд:
Узявши до уваги, що 0 < < 1 і 0<<1, YFF < 0 і YLL < 0, дійдемо висновку: при збільшенні ресурсів граничний приріст обсягу продукції зменшуватиметься. Якщо обсяг продукції у функції Кобба Дугласа вважати сталим (таким, що дорівнює const), то можна обчислити граничні норми заміщення ресурсів:
Звідси бачимо, що гранична норма заміщення ресурсів у функції
Кобба Дугласа визначається як добуток співвідношень величин ресурсів та їх коефіцієнтів еластичності.
Швидкість зміни норми заміщення ресурсів у звязку зі зміною величини ресурсів обчислюється так:
Мірою швидкості зміни h є еластичність заміщення ресурсів F і L, що визначається як відношення зміни величини ресурсів до зміни величини h:
.
Отже, еластичність заміщення в кожній точці кривої, що характеризує виробничу функцію Кобба Дугласа, дорівнює одиниці.
Розглянемо тепер поводження функції при зміні масштабу виробництва. Для цього припустимо, що витрати кожного ресурсу виробництва збільшилися в раз, тоді нове значення Y визначатиметься так:
Y=a(F)(L)=Y.
Степінь однорідності цієї функції дорівнює . Якщо =1, то рівень ефективності ресурсів не залежить від масштабів виробництва. Якщо <1, то з розширенням масштабів виробництва середні витрати в розрахунку на одиницю продукції зменшуються, а при >1 збільшуються. Причому ці властивості не залежать від числових значень F і L і зберігають силу в кожній точці виробничої функції.
За припущення, що мета господарської діяльності максимізація прибутку, можна проілюструвати інші властивості виробничої функції. Запишемо функцію прибутку:
П=bY r+1wL rF+[ f(F,L) Y ].
Підприємець вибирає такі значення Y, L, F, які максимізують прибуток при обмеженнях, що накладаються виробничою функцією. Величини b, w, r параметри функції прибутку, множник Лагранжа. Якщо виробничий процес у даному співвідношенні описується функцією Кобба Дугласа, то можна записати умови максимізації прибутку:
,
= (r + 1)P при r 1, де P = bY r.
Звідси обсяги ресурсів такі:
У такому випадку максимальне значення випуску продукції, якщо 1, можна записати так:
При r=1 згідно із записаними щойно умовами максимізації дістанемо:
Отже, необхідні умови для забезпечення максимізації прибутку дають змогу визначити відповідні витрати робочої сили і основного капіталу. З розширенням масштабів виробництва ефективність витрат ресурсів падає, що відповідає максимізації прибутку в умовах досконалої конкуренції. Наведений приклад виробничої функції показує, що ця економетрична модель дає змогу досить широко проаналізувати виробничу діяльність, визначити шляхи її вдосконалення з метою підвищення ефективності. Обгрунтованість такого аналізу повністю залежить од вірогідності економетричної моделі, від того, наскільки вона адекватна реальному процесу.
Проблема побудови виробничої функції або інших технологічних взаємозалежностей у виробництві класична проблема економетрії, висвітлюється далі.
Приклад 2. Моделі пропозиції і попиту
на конкурентному ринку
На конкурентному ринку рівновага обміну встановлюється через рівновагу між пропозицією і попитом. Нехай g1 і g2 кількість попиту і пропозиції деякого продукту в певний день на деякому ринку; p ціна, за якою реалізується продукція. Величини g1 і g2 залежать від p, оскільки ціна не влаштовує покупців і продавців, то кількість проданого товару зменшується. У результаті можна записати дві функції:
g1=f(p, u) функцію попиту;
g2=(p, ) функцію пропозиції.
Знаючи ціну p, можна визначити величини попиту і пропозиції. Для існування рівноваги на ринку необхідно, щоб виконувалась рівність. Отже, модель має такий вигляд:
g1=g2 ;
g1=f(p, u); (6)
g2=(p, ).
До неї входять дві функції, що характеризують залежність попиту і пропозиції від ціни, а також тотожність.
В реальних умовах попит і пропозиція певного товару залежать не лише від його ціни, а й від цін товарів, які можуть заміняти або доповнювати розглядуваний товар. Попит і пропозиція залежать також від інших чинників, наприклад, попит залежить від доходу покупців, а пропозиція від виробничих умов і т.ін. Тоді модель (2.6) можна записати так:
g1t = f(pt , X1t , X2t , ... Xmt , ut);
g2t = (pt 1, X1t , X2t , ... Xmt , t ); (7)
g1t = g2t .
В цій моделі на відміну від попередньої попит у періоді t залежить від ціни в цьому самому періоді, а пропозиція в періоді t залежить від ціни попереднього періоду (t 1).
Нехай залежність попиту і пропозиції від факторів, що впливають на них, лінійна. Тоді економетрична модель запишеться так:
g1t=a0+a1pt+a2X1t+a3X2t+ ... + am Xmt+ut ;
g2t = b0 + b1pt 1 + b2X1t + b3X2t + ... + bm Xmt + t ; (8)
g1t=g2t .
Щоб оцінити параметри цієї моделі, необхідно застосувати один з численних економетричних методів, які розглядаються далі.
Приклад 3. Модель Кейнса
Класична економічна теорія не вивчала спеціально фаз безробіття. Вона розглядала їх як тимчасові випадковості і довгостроковими проблемами рівноваги і росту цікавилася більше, ніж короткостроковими змінами. Проте протягом 19301940 рр. у переважній більшості розвинених країн спостерігалося тривале масове безробіття. Щоб передбачити розвиток економіки та вжити певних заходів впливу на економічний розвиток, потрібно було знати, як в даний момент фіксувати рівень випуску продукції та зайнятості і чому остання не буває ні дуже високою, ні дуже низькою.
Розвязання цієї проблеми був головною турботою Кейнса. Він намагався пояснити рівень виробництва в період неповного завантаження робочої сили та обладнання. Згодом численні дослідники вивчали це питання, намагаючись висвітлити нечіткі місця теорії Кейнса або запропонувати власні розвязання. Ці намагання привели до висновків, що капіталовкладення відіграють основну роль в конюнктурній еволюції з двох причин:
1) рішення про інвестиції значною мірою є автономними, вони впливають на зростання обсягів виробництва у двох секторах предметів споживання та засобів виробництва;
2) зростання обсягів виробництва збільшує доходи, а останні, у свою чергу, впливають на збільшення обсягу виробництва предметів споживання.
Покажемо, як наведені щойно міркування можна спрощено подати у вигляді моделі.
Нехай P загальний обсяг продукції; C виробництво предметів споживання; I виробництво засобів виробництва (що дорівнює капіталовкладенням); R доходи, які розподіляються. тоді модель запишеться так:
P=C + I ;
C=F(R, u);
R=P.
У цій моделі I задається автономно, а F є функція, що визначає відповідність між споживанням і розподіленими доходами.
Наведена модель дуже спрощена і повністю не відтворює ні ідей Кейнса, ні справжньої складності фактів. Проте вона порівняно добре пояснює досягнутий рівень виробництва. Адже з трьох записаних щойно рівнянь можна дістати таке рівняння:
P F(R,u)=I. (9)
Розвязавши його відносно P, знайдемо рівень виробництва, який повязаний з рівнем капіталовкладень. Так, наприклад, якщо F(R) є лінійна функція
, (10)
то рівняння (2.9) набирає вигляду
,
звідки
(11)
Рівняння (2.11) визначає залежність обсягу виробництва P від обсягу капіталовкладень I, які задаються автономно. Коефіцієнти і в цьому рівнянні залежать від функції споживання (2.10), тобто від звязку між R і C. Зокрема, ця функція вимірює збільшення споживання , яке повязане зі збільшенням доходу на одиницю і називається «граничною схильністю до споживання». Значення , як правило, менше за одиницю. Зокрема, у моделі Кейнса =0,6. Залежність (11) показує при цьому, що збільшення капіталовкладень на одиницю зумовлює зростання обсягу виробництва на 1/(1 ) коефіцієнт, який завжди перевищує одиницю (при =0,6 маємо 1/1=2,5). Цей коефіцієнт вимірює ефект взаємозвязку між автономним зростанням капіталовкладень та обсягом виробництва і називається мультиплікатором.
Модель (8) формалізує теорію Кейнса в її найпростішому вигляді. Але цінність згаданої моделі виходить за ці межі, бо вона дає змогу вивчати різні конкретні питання економічної конюнктури в країні, для якої було б знайдено адекватну форму функції F(R, u). Для забезпечення надійності результатів необхідно, щоб модель з потрібним ступенем точності відповідала дійсності, але досягти цього за такої вельми віддаленої схематизації не можна. Конюнктурні моделі, застосовувані для короткострокового прогнозування, використовують набагато більше змінних і рівнянь, але їх логічна природа досить близька до природи моделі (8).
Приклад 4. Модель споживання
Метою функціонування виробничих систем є виробництво матеріальних благ, які споживаються одразу після їх виробництва або надходять у запаси, щоб споживатися в майбутньому. Тому питання про те, як змоделювати використання матеріальних благ, посідають важливе місце серед проблем математичного моделювання виробничо-технічного рівня економічних систем. Усі види споживання (використання) матеріальних благ можна розбити на дві великі групи: виробниче і невиробниче споживання. Виробниче споживання повязане з використанням матеріальних благ у процесі виробництва у вигляді сировини, основних фондів і т.ін. Невиробниче споживання це задоволення потреб людей (як окремих осіб, так і суспільства в цілому), тобто це насамперед товари народного споживання. потреба в них значною мірою визначає структуру та обсяг виробництва в цілому.
Ціль вивчення обсягу споживання це пошук умов зміни споживання деякого товару або групи товарів залежно від їх ціни, доходів та інших істотних параметрів. Виявлення закономірностей зміни споживання базується на результатах спостережень. Наприклад, вивчивши споживання окремих сімей протягом деякого часу, визначають зміну споживання того чи іншого товару при загальному підвищенні доходів. Ці дослідження використовують деякі гіпотези щодо стабільності залежностей між споживанням і факторами, які його визначають. Постає запитання: чи можна кореляцію, що спостерігається для однієї обмеженої вибірки, інтерпретувати як доказ існування залежності в загальнішому випадку? При цьому гіпотези, які є основою для вивчення споживання, можна зобразити формально з допомогою моделі.
Нехай Ci споживання деякого продукту і-ю сімєю, дохід якої дорівнює ri. Припустимо, що для даного періоду відомі значення Ci і ri для невеликої кількості сімей. Як вивести звідси закономірність, на підставі якої можна визначити споживання даного продукту кожною сімєю і в кожний період?
Найпростіший підхід полягає в ствердженні існування деякого точного функціонального звязку між Ci і ri, який не залежить від часу або від окремих характеристик кожної сімї. Тоді модель можна подати у вигляді
Ci=f (ri). (12)
Проте неважко констатувати неадекватний характер цієї гіпотези і цієї моделі. Насправді вони припускають, що дві сімї з одним і тим самим доходом мають однакове споживання, а це, взагалі кажучи, неправильно, тому від моделі (12) потрібно відмовитися.
Перше узагальнення може полягати в тому, щоб крім доходу розглянути й інші незалежні змінні: ціну, склад сімї, величину наявних коштів і т.ін. Тоді можна повністю описати споживання, але суто функціональний звязок лишиться недосяжним навіть за наявності пяти і більше незалежних змінних. Дві сімї з однаковими доходами, структурним складом, заощадженнями тощо, все одно щодо споживання тих чи інших товарів поводитимуться по-різному.
Це означає, що в попередніх гіпотезах завжди має місце така фактична ситуація: споживання частково визначається не відомими нам факторами, які ми не можемо врахувати в моделі. Такі фактори є випадковими, і необхідно оцінити їх випадковий вплив. Для цього потрібно змінити модель (12), ввівши до неї випадкову складову:
Ci = f(ri)+ui . (13)
У моделі споживання випадкова складова містить у собі вплив усіх випадкових факторів, а також факторів, які не належать моделі. Ця складова називається помилкою, або залишком. Ці терміни, використовуватимемо далі під час викладання матеріалу.
Загальний вигляд моделі споживання залежно від доходу сімї такий:
C=f(r)+u. (14)
Якщо сукупність спостережень (кількість досліджуваних сімей) буде достатньою, щоб забезпечити вірогідність звязку, який визначається згідно з моделлю (14), то характеристики взаємозвязку можуть бути поширені на певну групу населення країни. При цьому слід памятати, що специфікація та методи оцінювання параметрів моделі також впливають на вірогідність звязку, що визначається економетричною моделлю.
3. ОСОБЛИВОСТІ ТА ЕТАПИ ЕКОНОМЕТРИЧНОГО МОДЕЛЮВАННЯ.
У стислому вигляді економетричний аналіз складається з таких етапів.
Підсумовуючи викладене можна зазначити, що практичне значення економетрії визначається наступними аспектами:
4. Випадкова складова економетричної моделі
Розглянемо економетричну модель з двома змінними у загальному вигляді:
Y =f(X)+u, (15)
де Y залежна змінна; X незалежна змінна; u випадкова складова.
Це означає, що ми ідентифікували змінну X, яка впливає на змінну Y. Назвемо таку економетричну модель простою моделлю.
Як відомо, численні взаємозвязки між економічними показниками не можна формалізувати лише на базі простої економетричної моделі. Наведені раніше приклади економетричних моделей показують, що вони описують вплив багатьох чинників на економічні процеси та явища. Причому для формалізації цих звязків може використовуватись не одне рівняння, а їх система.
На базі простої економетричної моделі розглянемо принципову структуру економетричної моделі та основні методи оцінювання її параметрів. Змістовне тлумачення взаємозвязку між економічними показниками [модель (15)] має підказати його конкретну аналітичну форму. Але оскільки одні й ті самі економічні умови можуть задовольняти різні функції, то краще звернутися до статистичного аналізу і з його допомогою зробити вибір серед можливих альтернативних варіантів.
Найпростішою є лінійна форма звязку між двома змінними:
Y =a0+bX ,
де a0 і a1 невідомі параметри, перший з яких визначає довжину відрізка, утворюваного перетином прямої з віссю ординат, а другий тангенс кута нахилу цієї прямої до осі абсцис.
Можливі й інші форми залежностей між двома змінними, наприклад:
Останнє з цих співвідношень є лінійним відносно , а перші два можна звести до лінійної форми для перетворених змінних, якщо взяти логарифми від виразів в обох частинах кожного з рівнянь:
lnY =lna+bX;
lnY =lna+bnX.
Навіть побіжне знайомство з економічними показниками, взаємозвязок між якими вимірюється, показує, що окремі експериментальні значення залежної змінної не можуть міститися строго на прямій лінії чи на графіку функції іншої форми. Певна частина фактичних спостережень над змінною лежатиме вище або нижче від значень, обчислених згідно з вибраною функцією. Якщо фактичні значення залежної змінної містяться на значній відстані від обчислених з допомогою функції, то можна припустити, що формалізація залежності між економічними показниками на основі функції типу (15) чи якоїсь іншої функції не адекватна реальному процесу взаємозвязків в економіці. Проте поняття «значна відстань» не є конкретним, а тому не може бути критерієм для оцінювання адекватності моделі.
Щоб розвязати цю задачу, до економетричної моделі вводять стохастичну складову, яка акумулює в собі всі відхилення фактичних спостережень змінної Y від обчислених згідно з моделлю.
Математичний аналіз цієї складової дасть змогу зробити висновок щодо того, чи можна вважати її стохастичною і чи містить вона систематичну частину відхилень, яка може бути зумовлена наявністю тих чи інших помилок у моделюванні.
Нехай вектор змінної Y описує витрати на споживання, а вектор X величину доходу сімї. Очевидно, що для окремих груп сімей існує певна залежність між споживчими витратами і доходом сімї. Проте, як уже зазначалося, на розмір споживчих витрат крім доходу можуть впливати інші фактори, частина яких є випадковими. Ці фактори й зумовлюють відхилення фактичних витрат на споживання від обчислених, наприклад, на основі регресійної функції:
(16)
Наблизити обчислені значення до фактичних формально можна введенням до моделі стохастичної складової:
Y =a+bX+u. (17)
У моделі (17) символом u позначено змінну, яка може набувати додатних та відємних значень, оскільки вона вимірює відхилення витрат на споживання кожної окремої сімї від обчисленого значення згідно з (16).
зауважимо, що в моделі (17) a і b оцінювані параметри, а в моделі (16) і їх оцінки.
Означення 1. Стохастичну складову u економетричної моделі називають помилкою (залишком,збуренням, відхиленням).
Введення до моделі (17) стохастичної складової має три підстави, кожна з яких не виключає решти двох.
1. Величину витрат на споживання визначає не лише рівень доходів, а й інші обєктивні чинники, наприклад розмір сімї, середній вік і т.ін.;
2. На величину споживання впливають випадкові фактори, наприклад схильність до ощадливості, стриманість чи навпаки надмірність у витратах і т.ін.;
3. Частина факторів, які впливають на величину споживчих витрат, не оцінюються кількісно, вони не квантифікуються. Крім того, можлива помилка вимірювання змінних.
Отже, замість залежності
Y =f(x1, x2, x3 ... xm),
де m досить велике, розглядається модель з невеликим числом незалежних змінних, причому Y відіграє роль функції від найважливіших , тоді як чистий сумарний ефект від впливу всіх інших чинників відбиває змінна u. У крайньому разі, якщо лишається одна незалежна змінна, маємо:
Y =f(X, u). (18)
У класичній лінійній економетричній моделі змінна u інтерпретується як випадкова змінна, яка має розподіл з математичним сподіванням, що дорівнює нулю, і сталою дисперсією . Це дає змогу розглядати змінну u як стохастичне збурення (помилку, відхилення). З огляду на те, що u охоплює вплив багатьох чинників, які можна вважати незалежними, на підставі центральної граничної теореми теорії ймовірностей, доходимо висновку: стохастична складова економетричної моделі розподілена за нормальним законом.
Рис. 2.1. Розділ залишків
Щодо нашого прикладу, коли витрати на споживання перебувають у лінійній залежності від доходу сімей, а змінна u є випадковою складовою, можна графічно зобразити цю залежність за умови, що величина доходів упорядкована від меншого значення до більшого (рис. 2.1).
Розподіл імовірностей P(u) групуватиметься при цьому навколо лінії регресії . Можливо, у цьому прикладі доцільніше було б припускати, що дисперсія відхилення u зростає зі збільшенням доходу X. Цю особливість розглянемо пізніше, бо вона може бути притаманна й іншим економічним залежностям (наприклад, залежності заощаджень від доходу, дивідендів від прибутку і т.ін.).
В економетричній моделі (16) параметри , невідомі. На підставі вибіркових спостережень X і Y потрібно не лише статистично оцінити ці параметри, а й перевірити виконання щодо них деяких гіпотез:
1) Чи можна вважати споживання пропорційними до доходу (= 0)?
2) Чи буде гранична схильність до споживання () більша за половину?
3) Чи виправдана для цієї вибіркової сукупності гіпотеза про сталу дисперсію залишків для всіх значень X ?
Усі наведені щойно запитання є типовими задачами економетричних досліджень, і основна мета економетрії вивчити класичні методи розвязування поставлених задач, а також опанувати нові методи розвязування складніших економічних задач, які максимально наближені до реальних умов.
Питання для самоконтролю.
Які методи застосовуються для оцінювання параметрів класичної регресійної моделі?
У чому сутність методу найменших квадратів (1МНК)?
Запишіть альтернативні варіанти оцінювання параметрів моделі методом 1МНК.
Як можна інтерпретувати параметри простої економетричної моделі?
Тема 1. Принципи побудови економетричних моделей. Парна лінійна регресія.
Лекція 2, 3.
Тема лекції: Модель парної регресії
Мета: ознайомити студентів з загальними принципами побудови економетричної моделі, побудова лінійного рівняння регресії та зведення загальних моделей до лінійних.
План лекції
Література:
1. ЗАГАЛЬНИЙ ВИД РІВНЯННЯ ПАРНОЇ РЕГРЕСІЇ.
Серед багаточисленних звязків між економічними показниками завжди можна виділити такий показник, вплив якого на результативну ознаку є основним, найбільш важливим. Щоб виміряти цей звязок кількісно, необхідно побудувати економетричну модель з двома змінними (просту модель). Загальний вигляд такої моделі:
Y = f (X, u),
де Y залежна змінна (результативна ознака); X незалежна змінна (фактор); u стохастична складова.
Аналітична форма цієї моделі може бути різною залежно від економічної сутності звязків. Найбільш поширені форми залежностей:
;
;
;
,
де а0, b невідомі параметри моделі.
Неважко переконатись, що наведені нелінійні форми залежностей за допомогою елементарних перетворень приводяться до лінійних. Якщо припустити, що економетрична модель з двома змінними є лінійною:
,
в якій стохастична складова (залишки) має нульове математичне сподівання та постійну дисперсію, то параметри моделі можна оцінити на основі звичайного методу найменших квадратів (1МНК).
В основі методу 1МНК лежить принцип мінімізації суми квадратів залишків моделі:
Реалізація цього принципу дає можливість отримати систему нормальних рівнянь:
В даній системі n кількість спостережень, , ,, величини, які можна розрахувати на основі вихідних спостережень над змінними і .
Розвязавши систему нормальних рівнянь, одержимо оцінки невідомих параметрів моделі і :
.
Достовірність побудованої економетричної моделі можна перевірити, користуючись елементами дисперсійного аналізу. Перш за все слід розрахувати залишки моделі
та знайти їх дисперсію:
,
де кількість змінних моделі ().
Необхідно визначити стандартну помилку кожного параметра моделі:
(1)
в цій формулі характеризує відповідний діагональний елемент матриці помилок (матриці, оберненої до матриці системи нормальних рівнянь).
На основі коефіцієнта детермінації
можна зробити висновок про ступінь значущості вимірюваного звязку на основі економетричної моделі
.
Оскільки коефіцієнт детермінації R2 характеризує, якою мірою варіація залежної змінної визначається варіацією незалежної змінної, то чим ближче R2 до одиниці, тим суттєвішим є звязок між цими змінними.
Коефіцієнт кореляції R = характеризує тісноту звязку між змінними моделі. Він може знаходитись на множині . Чим ближче R до одиниці по модулю, тим тіснішим є звязок. Відємний знак свідчить про обернений звязок, додатній про прямий.
2. ЗНАХОДЖЕННЯ параметрів моделі
методом найменших квадратів
Звернемося до прикладу простої економетричної моделі, де потрібно кількісно оцінити звязок між витратами на споживання та доходами сімї.Щоб оцінити параметри моделі (16), необхідно сформувати вихідну сукупність спостережень, кожна одиниця якої характеризуватиметься витратами на споживання і доходами сімей. Припустимо, що економетрична модель споживання будується для тієї групи людей, в якій зі збільшенням доходів зростають витрати на споживання, тобто модель має вигляд (16).
Рис. 2.2. Кореляційне поле точок
Зобразимо кожну пару спостережень у системі координат, де величина витрат на споживання відкладається на осі ординат, а доходів на осі абцис. У результаті дістанемо кореляційне поле точок (рис.2.2).
На підставі гіпотези про лінійність звязку між витратами на споживання і доходом сімей (див. рис.2.2), через кореляційне поле точок можна провести безліч прямих ліній, які різняться між собою параметрами і b.
Так, якщо витрати на споживання описуватимуться прямою I, то відхилення їх фактичних значень від розрахункових матимуть переважно знак «мінус». Якщо вони описуватимуться прямою III, то ці відхилення будуть переважно додатними, а якщо прямою II, то кількість відємних і додатних відхилень буде приблизно однаковою. Наявність серед відхилень переважно відємних чи додатних значень підтверджує, що вони мають невипадковий характер. А це означає: певна пряма лінія не адекватно описує фактичну залежність між витратами на споживання і доходом сімей. Звідси постає задача застосувати метод найменших квадратів для оцінювання параметрів моделі, щоб відхилення фактичних витрат від розрахункових на основі прямої мали приблизно однакову суму відємних і додатних значень, а також були б найменшими. Останнє буде свідчити про те, що розрахункові значення витрат на споживання максимально наближені до фактичних, а це є гарантом вірогідності моделі.
Не доцільно знаходити параметри економетричної моделі, мінімізуючи суму лінійних відхилень фактичних витрат на споживання від розрахункових, бо вона може дорівнювати нулю, якщо сума відємних і додатних відхилень буде однаковою. Тому мінімізації підлягає сума квадратів відхилень, і величина її залежатиме безпосередньо від розсіювання точок навколо лінії регресії, а саме:
.
Принцип найменших квадратів відхилень полягає в знаходженні таких і b, для яких найменша. Необхідна умова для цього перетворення на нуль похідних цієї функції за кожним із параметрів і b. Метод, який реалізує принцип найменших квадратів, називається методом найменших квадратів (1МНК). Оскільки
,
то
Виконавши елементарні перетворення, дістанемо систему нормальних рівнянь
(19)
Підставимо в систему (19) значення , , , , які можна дістати на підставі сукупності спостережень, і розвяжемо її відносно невідомих параметрів і b:
Оскільки оцінки найменших квадратів такі, що лінія регресії обовязково проходить через точку середніх значень (), то оцінки параметрів моделі можна знайти дещо інакше.
Поділивши перше рівняння системи (19) на n, дістанемо:
. (20)
Віднімемо (20) від (16):
.
Нехай , і , тоді
,
а відхилення фактичних значень від розрахункових будуть такі:
.
Сума квадратів залишків при цьому
.
Мінімізація цієї суми за невідомим параметром дає співвідношення
. (21)
Крім того, можна помітити, що тобто друга похідна за параметром b від суми квадратів відхилень додатна. Отже, знайдене значення b відповідає мінімуму суми квадратів відхилень.
Параметр a можна обчислити, використавши співвідношення (20):
. (22)
Співвідношення (21) можна було б дістати також, записавши друге рівняння системи (19) через відхилення кожної змінної від її середнього арифметичного значення, згадавши при цьому, що сума таких відхилень завжди дорівнює нулю.
Приклад 1. Побудувати економетричну модель, яка характеризує залежність витрат на одиницю продукції від рівня фондомісткості продукції. Вихідні дані і відповідні розрахунки для оцінювання параметрів наведені в табл.1.
Таблиця 1
№ п/п |
Yі |
Xі |
XіYі |
Xі |
Yі |
(Xі )2 |
(Xі )* (Yі ) |
і |
uі |
(Yі )2 |
||
1 |
50 |
90 |
8100 |
4500 |
-10,8 |
-4,2 |
116,64 |
45,36 |
48,8 |
1,2 |
1,44 |
17,64 |
2 |
40 |
75 |
5625 |
3000 |
-25,8 |
-14,2 |
665,64 |
336,36 |
41,3 |
-1,3 |
1,69 |
201,64 |
3 |
65 |
120 |
14400 |
7800 |
29,2 |
10,8 |
368,64 |
207,36 |
63,8 |
1,2 |
1,44 |
116,64 |
4 |
55 |
100 |
10000 |
5500 |
-0,8 |
0,8 |
0,64 |
-0,64 |
53,8 |
1,2 |
1,44 |
0,64 |
5 |
45 |
80 |
6400 |
3600 |
-20,8 |
-9,2 |
432,64 |
181,36 |
43,8 |
1,2 |
1,44 |
84,64 |
6 |
42 |
78 |
6084 |
3276 |
-22,8 |
-12,2 |
519,64 |
278,16 |
42,8 |
-0,8 |
0,64 |
148,84 |
7 |
56 |
110 |
12100 |
6160 |
9,2 |
1,8 |
84,64 |
16,56 |
58,8 |
-2,8 |
7,84 |
3,24 |
8 |
60 |
115 |
13225 |
6900 |
14,2 |
5,8 |
201,64 |
82,36 |
61,3 |
-1,3 |
1,69 |
33,64 |
9 |
64 |
115 |
13225 |
7350 |
14,2 |
9,8 |
201,64 |
139,16 |
61,3 |
2,7 |
7,29 |
96,04 |
10 |
65 |
125 |
15625 |
8125 |
24,2 |
10,8 |
585,64 |
261,26 |
66,3 |
-1,3 |
1,69 |
116,64 |
|
542 |
1008 |
104784 |
56221 |
3376 |
1587,5 |
26,6 |
819,6 |
Нехай залежність між витратами на одиницю продукції і рівнем фондомісткості описується прямою лінією
Y = a + bX + u,
де Y витрати на одиницю продукції; X рівень фондомісткості;
u залишки.
Розрахункові значення витрат на одиницю продукції можна знайти, скориставшись такою моделлю:
.
Щоб оцінити параметри моделі a і b методом 1МНК, запишемо систему нормальних рівнянь
Коефіцієнти для цих рівнянь системи знаходимо за табл.2.1:
Розвязком системи є параметри a = 3,8; b= 0,5. Економетрична модель має вигляд
Y =3,8+0,5X+u.
Скориставшись альтернативним способом обчислення параметрів за допомогою відхилень середніх арифметичних, (див. табл.1, стовпці 69) на підставі (21) і (22) дістанемо
Зауважимо, що оцінки параметрів моделі згідно з методом 1МНК є досить чутливими до точності розрахунків та адекватності аналітичної форми моделі. Оскільки вільний член моделі a= 3,8 0, то рівень витрат на одиницю продукції не є строго пропорційним до рівня фондомісткості. Кількісна оцінка параметра b= 0,5 показує, що граничне збільшення витрат при зростанні фондомісткості продукції на 1 грн. становить 0,5 грн. Еластичність витрат щодо фондомісткості продукції визначається коефіцієнтом еластичності
Значення цього коефіцієнта слід тлумачити так: при збільшенні фондомісткості продукціі на 1 % витрати на одиницю гранично зростуть на 0,93 %.
3. F I T КРИТЕРІЇ
Щоб мати загальне судження про якість моделі з відносних відхилень за кожним спостереженням, визначають середню помилку апроксимації:
=
Середня помилка апроксимації не повинна перевищувати 8-10%.
Відповідно до основної ідеї факторного аналізу, загальна сума квадратів відхилень змінної Y від середнього значення розкладається на дві частини:
,
де загальна сума квадратів відхилень; сума квадратів відхилень, пояснена регресією (або факторна сума квадратів відхилень); залишкова сума квадратів відхилень, що характеризує вплив неврахованих у моделі факторів.
Схема факторного аналізу має вигляд, представлений у таблиці 1 ( число спостережень, число параметрів при перемінній ).
Таблиця 1.
Компоненти дисперсії |
Сума квадратів |
Число ступенів волі |
Дисперсія на один ступінь волі |
Загальна |
|||
Факторна |
|||
Залишкова |
Визначення дисперсії на один ступінь свободи приводить дисперсії до порівнянного виду. Зіставляючи факторну і залишкову дисперсії в розрахунку на один ступінь свободи, одержимо величину -критерію Фишера:
F== (2)
Фактичне значення -критерію Фишера (4) порівнюється з табличним значенням при рівні значимості і ступенях волі і . При цьому, якщо фактичне значення -критерію більше табличного, то визнається статистична значимість рівняння в цілому.
Для парної лінійної регресії , тому
F== (3)
У парній лінійній регресії оцінюється значимість не тільки рівняння в цілому, але й окремих його параметрів. З цією метою по кожному з параметрів визначається його стандартна помилка: .
Стандартні помилки коефіцієнтів регресії визначаються по формулі(1) або можуть бути розраховані слідуючим чином:
, (4)
, (5)
де залишкова дисперсія на один ступінь свободи.
Величина стандартної помилки разом з -розподілом Стьюдента при ступенях волі застосовується для перевірки істотності коефіцієнтів регресії і для розрахунку його довірчого інтервалу.
Для оцінки істотності коефіцієнтів рівняння регресії його величини порівнюються з іхними стандартними помилками, тобто визначаються фактичні значення -критерію Стьюдента: та які потім порівнюються з табличним значенням при визначеному рівні значимості і числі ступенів волі . Довірчі інтервали для коефіцієнтів рівняння регресії визначаються як: i
Значимість лінійного коефіцієнта кореляції перевіряється на основі величини помилки коефіцієнта кореляції Sr:
Sr=. (6)
Фактичне значення -критерію Стьюдента визначається як tr=r/mr.
Існує зв'язок між -критерієм Стьюдента і -критерієм Фишера:
. (7)
Величина -критерію зв'язана з коефіцієнтом детермінації , і її можна розрахувати по наступній формулі:
4. ПРОГНОЗ.
У прогнозних розрахунках по рівнянню регресії визначається значення, що розраховується, як крапковий прогноз при , тобто шляхом підстановки в рівняння регресії відповідного значення . Однак крапковий прогноз явно не реальний. Тому він доповнюється розрахунком стандартної помилки , тобто , і відповідно інтервальною оцінкою прогнозного значення :
,
де , а середня помилка прогнозованого індивідуального значення:
.
4. ЕКОНОМЕТРИЧНА МОДЕЛЬ З ДВОМА ЗМІННИМИ:
ПОБУДОВА ТА АНАЛІЗ
Економічну модель парної регресії розглянемо на конкретному прикладі.
Приклад1. На основі даних про роздрібний товарообіг і доходи населення побудувати економетричну модель роздрібного товарообігу. Дати загальну характеристику достовірності моделі та зробити висновки.
Вихідні дані та елементарні перетворення цих даних для побудови моделі наведені в табл. 1.
Таблиця 1 |
|||||||||||||
N п/п |
X |
X2 |
XY |
||||||||||
1 |
17 |
18 |
324 |
306 |
16.67 |
-6.5 |
-5 |
42.25 |
32.5 |
0.33 |
0.1089 |
25 |
|
2 |
18 |
20 |
400 |
360 |
18.31 |
-4.5 |
-4 |
20.25 |
18.0 |
-0.31 |
0.0961 |
16 |
|
3 |
19 |
21 |
441 |
399 |
19.31 |
-3.5 |
-3 |
12.25 |
10.5 |
-0.13 |
0.0169 |
9 |
|
5 |
21 |
24 |
576 |
504 |
21.59 |
-0.5 |
-1 |
0.25 |
0.5 |
-0.59 |
0.3481 |
1 |
|
6 |
23 |
25 |
625 |
575 |
22.41 |
0.5 |
1 |
0.25 |
0.5 |
0.59 |
0.3481 |
1 |
|
7 |
24 |
27 |
729 |
648 |
24.05 |
2.5 |
2 |
6.25 |
5.0 |
-0.05 |
0.0125 |
4 |
|
8 |
25 |
28 |
784 |
700 |
24.87 |
3.5 |
3 |
12.25 |
10.5 |
0.13 |
0.0169 |
9 |
|
9 |
26 |
29 |
841 |
754 |
25.69 |
4.5 |
4 |
20.25 |
18.0 |
0.31 |
0.0961 |
16 |
|
10 |
27 |
31 |
961 |
837 |
27.33 |
6.5 |
5 |
42.25 |
32.5 |
-0.33 |
0.1089 |
25 |
|
220 |
245 |
6165 |
5523 |
----- |
---- |
-- |
162.5 |
133. |
---- |
1.145 |
110 |
Розвязання:
1. Ідентифікуємо змінні:
роздрібний товарообіг (залежна змінна);
доходи населення (незалежна змінна).
2. Нехай специфікація моделі визначається лінійною функцією; вона має такий вигляд:
,
де параметри моделі;
стохастична складова, залишки.
3. Оцінимо параметри моделі за методом 1МНК. Для цього запишемо систему нормальних рівнянь:
n = 10 кількість спостережень.
Підставимо в цю систему величини n, , , , які розраховані на основі вихідних даних табл. 1; тоді система набуде такого вигляду:
Розвяжемо цю систему відносно невідомих параметрів .
Таким чином, економетрична модель запишеться так:
.
4. Знайшовши відхилення кожної змінної від своєї середньої арифметичної, розрахуємо параметри моделі альтернативним способом:
5. Розрахуємо дисперсії залежної змінної та залишків:
6. Визначимо коефіцієнти детермінації та кореляції:
Оскільки коефіцієнт детермінації R2 = 0,99, це свідчить, що варіація обсягу роздрібного товарообігу на 99% визначається варіацією доходів населення. Коефіцієнт кореляції характеризує тісний звязок між цими соціально-економічними показниками. Величини R2 і R для парної економетричної моделі свідчать про її достовірність, якщо вони наближаються до одиниці.
7. Знайдемо матрицю помилок C (матрицю, обернену до матриці системи нормальних рівнянь):
матриця помилок.
8. Визначимо стандартні помилки оцінок параметрів моделі, враховуючи дисперсію залишків:
9.Розрахуємо фактичний коефіцієнт Фішера і порівняємо його з табличним: F=
F(0.05,1,8)=5,32. Оскільки фактичне значення критерія Фішера більше ніж табличне, то визнаємо статичну значимість рівняння регресії в цілому.
Розрахуємо фактичні значення критерія Стьюдента та і порівняємо їх з табличним: =
=
t(0.05,8)=2,306. Оскільки фактичні значення критерія Стьюдента по параметрах моделі більші ніж табличне значення, то ми визнаємо статичну значимість кожного з параметрів моделі.
Економетрична модель кількісно описує звязок роздрібного товарообігу і доходів населення.
Параметр характеризує граничну величину витрат на купівлю товарів у роздрібній торгівлі, коли дохід збільшується на одиницю, тобто при збільшенні доходів на одиницю обсяг роздрібного товарообігу зростає на 0,82 одиниці .
Питання для самоконтролю.
Тема 2. Лінійні моделі множинної регресії.
Лекція 4
Тема лекції. Багатомірна лінійна модель.
Мета: ознайомити студентів з загальними принципами побудови багатомірної лінійної економетричної моделі
План лекції
(1 МНК).
Література:
(1 МНК).
Множинна регресія - рівняння зв'язку з декількома незалежними змінними:
y=f(x1,x2,…,xm),
де у залежна змінна (результативна ознака);
x1,x2,…,xm - незалежні змінні (фактори).
Множинна регресія застосовується в ситуаціях, коли з безлічі факторів, що впливають на результативну ознаку, не можна виділити один домінуючий фактор і необхідно враховувати вплив декількох факторів.
Основна мета множинної регресії - побудувати модель з великим числом факторів, визначивши при цьому вплив кожного з них окремо, а також сукупний їх вплив на модельований показник.
Як і у випадку парної регресії, побудова рівняння множинної регресії здійснюється у два етапи
- специфікація моделі;
- оцінка параметрів вибраної моделі.
Включення в рівняння множинної регресії того чи іншого набору факторів пов'язано, перш за все, з поданням дослідника про природу взаємозв'язку модельованого показника з іншими економічними явищами.
Фактори, що включаються у множинну регресію, повинні відповідати наступним вимогам:
1. Вони повинні бути кількісно виміряні.
2. Фактори не повинні бути взаємно корельовані і тим більше знаходитися в точній функціональній залежності. Якщо між факторами існує висока кореляція, то не можна визначити їх ізольований вплив на результативний показник.
Включені у множинну регресію фактори повинні пояснити варіацію незалежної змінної. Якщо будується модель з набором m факторів, то для неї розраховується показник детермінації R2, який фіксує частку поясненої варіації результативної ознаки за рахунок розглянутих у регресії m факторів.
Вплив інших, не врахованих у моделі, факторів оцінюється як 1-R2 з відповідною залишкової дисперсією S2.
При додатковому включенні в регресію (m+1) фактора хm+1 коефіцієнт детермінації повинен зростати, а залишкова дисперсія зменшиться , тобто
та .
Якщо цього не відбувається і дані показники мало відрізняються один від одного, то включений в аналіз фактор хm+1 не покращує модель і практично є зайвим чинником.
Насичення моделі зайвими факторами не тільки не знижує величину залишкової дисперсії і не збільшує показник детермінації, але призводить до статистичної незначущості параметрів регресії за t-критерієм Стьюдента.
Нехай економетрична модель у матричній формі має вигляд
(1)
де Y вектор значень залежної змінної;
X матриця незалежних змінних розміром (n число спостережень, m кількість незалежних змінних);
A вектор оцінок параметрів моделі;*
u вектор залишків.
Щоб застосувати 1МНК для оцінки параметрів моделі, необхідне виконання таких умов(умови Гаусса-Маркова):
1) математичне сподівання залишків дорівнює нулю, тобто
(2)
2) значення ui вектора залишків u незалежні між собою і мають постійну дисперсію, тобто
(3)
де Е одинична матриця;
3) незалежні змінні моделі не повязані із залишками:
(4)
4) незалежні змінні моделі утворюють лінійно незалежну систему векторів, або, іншими словами, незалежні змінні не повинні бути мультиколінеарними, тобто :
(5)
,
де Xk k-й вектор матриці пояснювальних змінних; Xj j-й вектор цієї матриці пояснювальних змінних X, .
Перша умова, здавалося б, є очевидною. Адже коли математичне сподівання залишків не дорівнює нулю, то це означає, що існує систематичний вплив на залежну змінну, а до модельної специфікації не введено всіх основних незалежних змінних. Якщо ця передумова не виконується, то йдеться про помилку специфікації.
зауважимо, що коли економетрична модель має вільний член, то майже завжди за рахунок його значення можна скоригувати рівняння так, щоб математичне сподівання залишків дорівнювало нулю. Отже, для таких моделей перша умова практично виконуватиметься завжди.
Друга умова передбачає наявність сталої дисперсії залишків. Цю властивість називають гомоскедастичністю. Проте вона може виконуватись лише тоді, коли залишки u є помилками вимірювання. Якщо залишки акумулюють загальний вплив змінних, які не враховані в моделі, то звичайно дисперсія залишків не може бути сталою величиною, вона змінюється для окремих груп спостережень. У такому разі йдеться про явище гетероскедастичності, яке впливає на методи оцінювання параметрів.
Третя умова передбачає незалежність між залишками і пояснювальними змінними, яка порушується насамперед тоді, коли економетрична модель будується на базі одночасових структурних рівнянь або має лагові змінні. Тоді для оцінювання параметрів моделі використовуються, як правило, дво- або трикроковий метод найменших квадратів.
Четверта умова означає, що всі пояснювальні змінні, які входять до економетричної моделі, мають бути незалежними між собою. Проте очевидно, що в економіці дуже важко вирізнити такий масив незалежних (пояснювальних) змінних, які були б зовсім не повязані між собою. Тоді щоразу необхідно зясовувати, чи не впливатиме залежність пояснювальних змінних на оцінку параметрів моделі.
Це явище називають мультиколінеарністю змінних, що призводить до ненадійності оцінки параметрів моделі, робить їх чутливими до вибраної специфікації моделі та до конкретного набору даних. Знижується рівень довіри до результатів верифікації моделей з допомогою 1МНК.Отже, це явище з усіх точок зору є дуже небажаним. Але воно досить поширене. Далі розглянемо методи виявлення мультиколінеарності і способи її врахування з допомогою специфікації моделі чи спеціальних методів оцінювання параметрів.
Скористаємося моделлю (1), для якої виконуються умови (2)(5), щоб оцінити параметри методом 1МНК.
Рівняння (1) подамо у вигляді: . Тоді суму квадратів залишків u можна записати так:
Продиференціюємо цю умову за А і прирівняємо похідні до нуля:
або
(6)
Тут матриця, транспонована до матриці незалежних змінних X.
Звідси
(7)
Рівняння (6) дає матричну форму запису системи нормальних рівнянь, а формула (7) показує, що значення вектора А є розвязком системи таких рівнянь.
Розглянемо приклад оцінювання параметрів моделі 1МНК.
Для оцінки параметрів рівняння множинної регресії застосовують метод найменших квадратів (1МНК). Для лінійних рівнянь регресії (і нелінійних рівнянь, які зводяться до лінійних) будується система нормальних рівнянь, рішення якої дозволяє одержати оцінки параметрів регресії. У випадку лінійної множинної регресії
y=a+b1x1+b2x2+…+bmxm
система нормальних рівнянь має вигляд:
Для визначення значущості факторів і підвищення точності результату використовується рівняння множинної регресії у стандартизованому масштабі
ty=
де - стандартизовані змінні
,
для яких середнє значення дорівнює нулю , а середнє квадратичне відхилення дорівнює одиниці.
Коефіцієнти βi звуться стандартизованими коефіцієнтами регресії.
К рівнянню множинної регресії в стандартизованому масштабі застосовують МНК. Стандартизовані коефіцієнти регресії визначаються з системи рівнянь:
або з системи рівнянь
У парній залежності стандартизований коефіцієнт регресії є не що інше, як лінійний коефіцієнт кореляції ryx.
Зв'язок коефіцієнтів множинної регресії з стандартизованими коефіцієнтами описується співвідношенням
Параметр а визначається зі співвідношення
a=
На основі лінійного множинного рівняння регресії
y=a+b1x1+b2x2+…+bmxm+ε
можна знайти частинні рівняння регресії, які звязують результативну ознаку з відповідними факторами xi при закріплених інших, які враховуються в множинній регресії, факторів на середньому рівні. Частинні рівняння регресії мають вигляд:
……………………………………….
При підстановці в ці рівняння середніх значень відповідних факторів вони приймають вигляду парних рівнянь лінійної регресії, тобто маємо
…………………
де
…………………………
Таблиця 1
№ п/п |
Витрати на харчування y |
Загальні витрати x1 |
Розмір сімї x2 |
1 |
22 |
45 |
1,5 |
2 |
34 |
75 |
1,6 |
3 |
50 |
125 |
1,9 |
4 |
67 |
223 |
1,8 |
5 |
47 |
92 |
3,4 |
6 |
66 |
146 |
3,6 |
7 |
81 |
227 |
3,4 |
8 |
106 |
358 |
3,5 |
9 |
70 |
135 |
5,5 |
10 |
95 |
218 |
5,4 |
11 |
119 |
331 |
5,4 |
12 |
147 |
490 |
5,3 |
13 |
93 |
175 |
8,5 |
14 |
133 |
305 |
8,3 |
15 |
169 |
468 |
8,1 |
16 |
197 |
749 |
7,3 |
Приклад 1. Оцінити параметри економетричної моделі, що характеризує залежність між тижневими витратами на харчування, загальними витратами та розміром сімї. Вихідні дані наведені в табл.1.
Розвязання. Запишемо економетричну модель:
де y, відповідно фактичні та розрахункові значення тижневих витрат на харчування за моделлю; x1 загальні витрати; x2 розмір сімї; u залишки; , , оцінка параметрів моделі.
Оператор оцінювання параметрів моделі за 1МНК має вигляд
де ;
матриця, транспонована до матриці X.
Матриця X крім двох векторів незалежних змінних містить вектор одиниць. Він дописується в цій матриці ліворуч тоді, коли економетрична модель має вільний член. не дописуючи такого вектора одиниць, вільний член можна обчислити, скориставшись рівністю:
де середнє значення залежної змінної; , середні значення незалежних змінних і .
Згідно з оператором оцінювання знайдемо:
1)
2)
3) ;
4)
Отже, економетрична модель має вигляд
Знайдені методом 1МНК оцінки параметрів такі: = 8,8;b1=0,2; b2= 6,97, тобто
.
3. Множинний коефіцієнт кореляції і детермінації
Тіснота звязку загального впливу всіх незалежних змінних на залежну визначається коефіцієнтами детермінації і множинної кореляції.
Щоб дати метод їх розрахунку необхідно показати, що варіація залежної змінної (Y) навколо свого вибіркового середнього значення ()* може бути розкладена на дві складові:
1) варіацію розрахункових значень () навколо середнього значення ;
2) варіацію розрахункових значень () навколо фактичних (Y).
Необхідні при цьому обчислення зведемо в табл.2.
Таблиця 2
Джерело |
Сума квадратів відхилень |
Ступені свободи |
Середнє квадратів відхилень або дисперсія |
Факторна () |
|||
Залишок |
|||
Загальна варіація |
|
Зауважимо, що всі змінні Y i X взяті як відхилення від свого середнього значення.
Використаємо середні квадратів відхилень (дисперсії) (див. табл. 2) і запишемо формулу для обчислення коефіцієнта детермінації:
(8)
або, не враховуючи ступенів свободи:
(9)
Оскільки у (8) задані незміщені оцінки дисперсії з урахуванням числа ступенів свободи, то коефіцієнт детермінації може зменшуватись при введені в модель нових незалежних змінних. Тоді як для коефіцієнта детермінації, обчисленого без урахування поправки (n 1/m 1) на число ступенів свободи (9), коефіцієнт детермінації ніколи не зменшується. Залежність між цими двома коефіцієнтами можна подати так:
(10)
де коефіцієнт детермінації з урахуванням числа ступенів свободи;
коефіцієнт детермінації без урахування числа ступенів свободи.
Для функції з двома і більше незалежними змінними коефіцієнт детермінації може набувати значень на множині . Числове значення коефіцієнта детермінації характеризує, якою мірою варіація залежної змінної () визначається варіацією незалежних змінних. Чим ближчий він до одиниці, тим більше варіація залежної змінної визначається варіацією незалежних змінних.
Множинний коефіцієнт кореляції:
Він характеризує тісноту звязку усіх незалежних змінних із залежною.
Для множинного коефіцієнта кореляції з урахуваннням і без урахуванння числа ступенів свободи характерна така сама зміна числового значення, як і для коефіцієнта детермінації.
Розглянемо альтернативний спосіб обчислення коефіцієнтів детермінації і кореляції, коли система нормальних рівнянь будується на основі коефіцієнтів парної кореляції .
У такому разі оцінку параметрів моделі можна записати:
(11)
де алгебраїчне доповнення матриці до елемента .
Сума квадратів відхилень (залишків) також може бути виражена через алгебраїчне доповнення матриці :
де визначник кореляційної матриці. А це, у свою чергу, дає нам альтернативний вираз для коефіцієнта детермінації:
(12)
Ще один альтернативний метод розрахунку коефіцієнтів детермінації на основі матриці можна подати у вигляді
(13)
Звідси коефіцієнт кореляції
(14)
4. Частинні коефіцієнти кореляції
і коефіцієнти регресії
Частинні коефіцієнти кореляції так само, як і парні, характеризують тісноту звязку між двома змінними. Але на відміну від парних частинні коефіцієнти характеризують тісноту звязку за умови, що інші незалежні змінні сталі.
Можна дістати спрощений вираз для розрахунку коефіцієнта частинної кореляції, обравши інший спосіб інтерпретації цього коефіцієнта. Для випадку простої регресії двох змінних маємо
де характеризує коефіцієнт при у рівнянні , а коефіцієнт при в рівнянні . Отже, квадрат коефіцієнта парної кореляції дорівнює добутку двох наведених коефіцієнтів. Коефіцієнт частинної кореляції можна визначити аналогічно. Наприклад, розглянемо два регресійні рівняння:
;
Нехай в цих рівняннях дорівнює деякій довільній величині , тоді член, який відповідає змінній збігатиметься з вільним членом, а отже, дістанемо дві прості регресії, які відбивають загальну зміну і на площині = . Оскільки модель є лінійною, то коефіцієнти регресії і лишаються незмінними при різних значеннях , тобто можна стверджувати: квадрат коефіцієнта частинної кореляції між і дорівнює добутку коефіцієнтів при і у двох множинних регресіях.
Згідно з (8) запишемо ці рівняння у вигляді
де алгебраїчні доповнення до елемента матриці .
Звідси
.
Для знаходження частинного коефіцієнта кореляції змінної y з x2 за умови, що змінна x3 стала, достатньо взяти добуток параметрів при x2 і y в наведених щойно рівняннях з протилежним знаком.
Аналогічно
Тоді частинні коефіцієнти кореляції будуть такі:
; (15)
Ці висновки можна поширити на випадок, коли економетрична модель має незалежних змінних , але при цьому решта незалежних змінних (крім двох) є константами.
5. F і t критерії.
Значущість економетричної моделі
Гіпотезу про рівень значущості звязку між залежною і незалежною змінними можна перевірити з допомогою F-критерію:
(16)
При цьому ми виходимо з того, що залишки u розподілені нормально, тобто користуємося фундаментальною теоремою про те, що для нормально розподіленої випадкової величини з нульовою середньою і одиничною дисперсією сума квадратів її n випадково вибраних значень має розподіл з n ступенями свободи.
Дисперсії, які застосовуються для обчислення F-критерію, наведено в табл.2.
Фактичне значення F-критерію порівнюється з табличним при ступенях свободи n m і m 1 і вибраному рівні значущості. Якщо Fфакт > Fтабл, то гіпотеза про істотність звязку між залежною і незалежними змінними економетричної моделі підтвержується, у противному разі - відкидається.
Значущість коефіцієнта кореляції
Оскільки коефіцієнт кореляції є також вибірковою характеристикою, яка може відхилятись від свого “істинного” значення, значущість коефіцієнта кореляції також потребує перевірки. Базується вона на t-критерії
де коефіцієнт детермінації моделі; коефіцієнт кореляції; число ступенів свободи.
Якщо , де відповідне табличне значення t-розподілу з ступенями свободи, то можна зробити висновок про значущість коефіцієнта кореляції між залежною і незалежними змінними моделі.
Значущість оцінок параметрів моделі
Перевіримо значущість оцінок параметрів В і знайдемо для них довірчі інтервали, припустивши для цього, що залишки u нормально розподілені, тобто . Тоді параметри моделі В задовольняють багатовимірний нормальний розподіл:
(17)
Коли відома величина , то цей результат можна бути використати для перевірки значущості елементів вектора та оцінювання довірчих інтервалів елементів цього вектора. Проте дисперсія невідома, а отже, потрібно розглянути методи її знаходження.
Для цього визначимо залишки:
(18)
Таким чином, залишки, які можна дістати на підставі експериментальних даних, записано у вигляді лінійних функцій від невідомих залишків . Тоді суму квадратів відхилень подамо у вигляді
(19)
де N симетрична ідемпотентна матриця.
У цих перетвореннях ми виходили з того, що N є симетричною ідемпотентною матрицею, оскільки En одинична матриця, а симетрична розміром n m.
Знайдемо математичне сподівання для обох частин рівняння (19) і застосуємо спочатку властивість, яка полягає в тому, що , де слід матриці N, а далі властивість комутативності добутку матриць відносно операцій обчислення сліду матриці.
З огляду на сказане маємо:
(20)
У цьому співвідношенні матриця має порядок , добуток дорівнює , а її слід дорівнює . Звідси
. (21)
Співвідношення (21) дає нам незміщену оцінку дисперсії залишків.
Нарешті, лишилося показати, що сума квадратів залишків розподілена незалежно від В. Для цього знайдемо коваріацію залишків:
(22)
Оскільки і В є лінійні функції від нормально розподілених змінних, то вони також розподілені нормально і, як було показано, їх коваріації дорівнюють нулю.
Це дає нам змогу скористатися t-розподілом для перевірки гіпотез відносно істотності кожного з параметрів економетричної моделі
Перевірку гіпотези виконаємо згідно з t-критерієм:
, (23)
де діагональний елемент матриці . Знаменник відношення (23) називається стандартною помилкою оцінки параметра моделі.
Обчислене значення t-критерію порівнюється з табличним при вибраному рівні значущості і ступенях свободи. Якщо t факт > t табл, то відповідно оцінка параметра економетричної моделі є достовірною.
На основі t-критерію і стандартної помилки побудуємо довірчі інтервали для параметрів :
(24)
Питання для самоконтролю.
1. Коли для оцінки параметрів моделі можна застосувати 1МНК?
2. Запишіть оператор оцінювання 1МНК. Як його можна дістати?
3. Які властивості повинні мати оцінки параметрів економетричної моделі?
4. Чим відрізняються коефіцієнти парної та часткової кореляції?
5. запишіть співвідношення між коефіцієнтами кореляції і детермінації.
6. Як визначаються дисперсія залишків, загальна дисперсія і дисперсія регресії? Який між ними звязок?
7. Як визначається F-критерій? Для чого він застосовується?
8. Покажіть залежність між F-критерієм і .
9. Як оцінити вірогідність коефіцієнта кореляції?
10. Доведіть, чому для визначення значущості параметрів моделі можна застосувати t-критерій?
11. Як обчислюється t-критерій?
Тема 2. Лінійні моделі множинної регресії.
Лекція 5
Тема лекції. Перевірка залишків регресії на мультиколінеарність
Мета: ознайомити студентів з явищами мультиколеніарністі та методами її усунення.
План лекці
3.1. Метод Феррара Глобера.
3.2. Метод головних компонентів.
Література:
Однією з чотирьох умов, які необхідні для оцінювання параметрів загальної лінійної моделі 1МНК (умови Гауса-Маркова), є умова незалежності пояснюючих змінних, яка стосується матриці вихідних даних X. Ця матриця має розміри і повинна мати ранг m, тобто серед пояснювальних змінних моделі не повинно бути лінійно залежних. Проте оскільки економічні показники, які входять до економетричної моделі як пояснювальні змінні, на практиці дуже часто повязані між собою, то це може стати перешкодою для оцінювання параметрів моделі 1МНК та істотно вплинути на якість економетричного моделювання.
Тому в економетричних дослідженнях важливо зясувати, чи існують між пояснювальними змінними взаємозвязки, які називають мультиколінеарністю.
Означення 1. Мультиколінеарність означає існування тісної лінійної залежності, або кореляції, між двома чи більше пояснювальними змінними.
Вона негативно впливає на кількісні характеристики економетричної моделі або робить її побудову взагалі неможливою.
Так, мультиколінеарність пояснювальних змінних призводить до зміщення оцінок параметрів моделі, через що з їх допомогою не можна зробити коректні висновки про результати взаємозвязку залежної і пояснювальних змінних. У крайньому разі, коли між пояснювальними змінними існує функціональний звязок, оцінити вплив цих змінних на залежну взагалі неможливо. Тоді для оцінювання параметрів моделі метод найменших квадратів не придатний, оскільки матриця буде виродженою.
Нехай звязок між пояснювальними змінними не функціональний, проте статистично істотний. Тоді попри те, що оцінити параметри методом найменших квадратів теоретично можливо, знайдена оцінка може призвести до таких помилкових значень параметрів, що сама модель стане беззмістовною.
Основні наслідки мультиколінеарності.
1. Падає точність оцінювання, яка виявляється так:
а) помилки деяких конкретних оцінок стають занадто великими;
б) ці помилки досить корельовані одна з одною;
в) дисперсії оцінок параметрів різко збільшуються.
2. Оцінки параметрів деяких змінних моделі можуть бути незначущими через наявність їх взаємозвязку з іншими змінними, а не тому, що вони не впливають на залежну змінну. У такому разі множина вибіркових даних не дає змоги цей вплив виявити.
3. Оцінки параметрів стають досить чутливими до обсягів сукупності спостережень. Збільшення сукупності спостережень іноді може спричинитися до істотних змін в оцінках параметрів.
З огляду на перелічені наслідки мультиколінеарності при побудові економетричної моделі потрібно мати інформацію про те, що між пояснювальними змінними не існує мультиколінеарністі.
2. Ознаки мультиколінеарності
1. Коли серед парних коефіцієнтів кореляції пояснювальних змінних є такі, рівень яких наближається або дорівнює множинному коефіцієнту кореляції, то це означає можливість існування мультиколінеарності. Інформацію про парну залежність може дати симетрична матриця коефіцієнтів парної кореляції:
. (1)
Проте коли до моделі входять більш як дві пояснювальні змінні, то вивчення питання про мультиколінеарність не може обмежуватись інформацією, що її дає ця матриця. Явище мультиколінеарності в жодному разі не зводиться лише до існування парної кореляції між незалежними змінними.
Більш загальна перевірка передбачає знаходження визначника (детермінанта) матриці r, який називається детермінантом кореляції і позначається . Числові значення детермінанта кореляції задовольняють умову: .
2. Якщо = 0, то існує повна мультиколінеарність, а коли = 1, мультиколінеарність відсутня. чим ближче до нуля, тим певніше можна стверджувати, що між пояснювальними змінними існує мультиколінеарність. Незважаючи на те, що на числове значення впливає дисперсія пояснювальних змінних, цей показник можна вважати точковою мірою рівня мультиколінеарності.
3. Якщо в економетричній моделі знайдено мале значення параметра при високому рівні частинного коефіцієнта детермінації і при цьому F-критерій істотно відрізняється від нуля, то це також свідчить про наявність мультиколінеарності.
4. Коли коeфіцієнт частинної детермінації , який обчислено для регресійних залежностей між однією пояснювальною змінною та іншими, має значення, яке близьке до одиниці, то можна говорити про наявність мультиколінеарності.
5. Нехай при побудові економетричної моделі на основі покрокової регресії введення нової пояснювальної змінної істотно змінює оцінку параметрів моделі при незначному підвищенні (або зниженні) коефіцієнтів кореляції чи детермінації. тоді ця змінна перебуває, очевидно, у лінійній залежності від інших, які було введено до моделі раніше.
Усі ці ознаки мультиколінеарності мають один спільний недолік: ні одна з них чітко не розмежовує випадки, коли мультиколінеарність істотна і коли нею можна знехтувати.
3. АЛГОРИТМИ УСУНЕННЯ МУЛЬТИКОЛІНЕАРНОСТІ.
3.1. Алгоритм Феррара - Глобера
Найповніше дослідити мультиколінеарність можна за допомогою алгоритму Феррара Глобера. Цей алгоритм має три види статистичних критеріїв, згідно з якими перевіряється мультиколінеарність всього масиву незалежних змінних (- «хі» квадрат); кожної незалежної змінної з рештою змінних (F-критерій); кожної пари незалежних змінних (t-критерій).
Усі ці критерії при порівнянні з їх критичними значеннями дають змогу робити конкретні висновки щодо наявності чи відсутності мультиколінеарності незалежних змінних.
Опишемо алгоритм Феррара Глобера.
Крок 1. Стандартизація (нормалізація) змінних.
Позначимо вектори незалежних змінних економетричної моделі через . Елементи стандартизованих векторів обчислимо за формулою:
(2)
де число спостережень ;
число пояснювальних змінних, ;
середнє арифметичне k-ї пояснювальної змінної;
дисперсія k-ї пояснювальної змінної.
Крок 2. Знаходження кореляційної матриці
(3)
де матриця стандартизованих незалежних (пояснювальних) змінних, матриця, транспонована до матриці .
Крок 3. Визначення критерію («хі»-квадрат):
(4)
де визначник кореляційної матриці r.
Значення цього критерію порівнюється з табличним при ступенях свободи і рівні значущості . Якщо то в масиві пояснювальних змінних існує мультиколінеарність.
Крок 4. Визначення оберненої матриці:
(5)
Крок 5. Очислення F-критеріїв:
(6)
де діагональні елементи матриці C. Фактичні значення критеріїв порівнюються з табличними при n m і m 1 ступенях свободи і рівні значущості . Якщо Fkфакт > Fтабл, то відповідна k-та незалежна змінна мультиколінеарна з іншими.
Коефіцієнт детермінації для кожної змінної
(7)
Крок 6. Знаходження частинних коефіцієнтів кореляції:
(8)
де елемент матриці C, що міститься в k-му рядку і j-му стовпці; i діагональні елементи матриці C.
Крок 7. Обчислення t-критеріїв:
(9)
Фактичні значення критеріїв порівнюються з табличними при ступенях свободи і рівні значущості . Якщо tkj(ф) > t табл, то між незалежними змінними і існує мультиколінеарність.
Розглянемо застосування алгоритму Феррара Глобера для розвязування конкретної задачі.
Приклад 1. На середньомісячну заробітну плату впливає ряд чинників. Вирізнимо серед них продуктивність праці, фондомісткість та коефіцієнт плинності робочої сили. Щоб побудувати економетричну модель заробітної плати від згаданих чинників згідно з методом найменших квадратів, потрібно переконатися, що продуктивність праці, фондомісткість та коефіцієнт плинності робочої сили як незалежні змінні моделі не мультиколеніарні.
Вихідні дані наведені у табл.1.
Таблиця 1
Номер |
Продуктивність праці, людино-днів |
Фондомісткість, |
Коефіцієнт плинності |
1 |
32 |
0,89 |
19,5 |
2 |
29 |
0,43 |
15,6 |
3 |
30 |
0,70 |
13,5 |
4 |
31 |
0,61 |
9,5 |
5 |
25 |
0,51 |
23,5 |
6 |
34 |
0,51 |
12,5 |
7 |
29 |
0,65 |
17,5 |
8 |
24 |
0,43 |
14,5 |
9 |
20 |
0,51 |
14,5 |
10 |
33 |
0,92 |
7,5 |
Дослідити наведені чинники на наявність мультиколеніарністі.
Розвязання.
Крок 1. Нормалізація змінних.
Позначимо вектори незалежних змінних продуктивності праці, фондомісткості, коефіцієнтів плинності робочої сили через . Елементи стандартизованих векторів обчислимо за формулою:
де n кількість спостережень, n = 10; m число незалежних змінних, m = 3; середнє арифметичне значення вектора ; дисперсія змінної .
Із формули бачимо, що спочатку потрібно обчислити середні арифметичні для кожної пояснювальної змінної:
Усі розрахункові дані для стандартизації змінних згідно з поданими співвідношеннями наведено в табл.2.
Таблиця 2
3,3 |
0,004 |
-3,4 |
10,89 |
0,000016 |
11,56 |
0,2487 |
0,0091 |
-0,2518 |
0,3 |
-0,156 |
1,6 |
0,09 |
0,024336 |
2,56 |
0,0226 |
-0,3531 |
0,1185 |
1,6 |
0,114 |
-0,4 |
1,89 |
0,012995 |
0,16 |
0,0980 |
0,2580 |
-0,0296 |
2,3 |
0,024 |
-4,4 |
5,29 |
0,000576 |
19,36 |
0,1733 |
0,0543 |
-0,3258 |
-3,7 |
-0,676 |
9,6 |
13,89 |
0,005776 |
92,16 |
-0,2788 |
-0,1720 |
0,7108 |
5,3 |
-0,078 |
-1,4 |
28,09 |
0,005776 |
1,96 |
0,3994 |
-0,1720 |
-0,1037 |
0,3 |
0,064 |
-3,6 |
0,09 |
0,004096 |
12,96 |
0,0226 |
0,1448 |
0,2666 |
-4,7 |
-0,156 |
0,6 |
22,09 |
0,024336 |
0,35 |
-0,3541 |
-0,3531 |
0,0444 |
-8,7 |
-0,076 |
0,6 |
75,89 |
0,005778 |
0,35 |
-0,6556 |
-0,1720 |
0,0444 |
4,3 |
0,334 |
-6,4 |
14,49 |
0,111555 |
40,95 |
0,3240 |
0,7559 |
-0,4739 |
Всього |
176,1 |
0,19524 |
182,4 |
Дисперсії кожної незалежної змінної мають такі значення:
Тоді знаменник для стандартизації кожної незалежної змінної буде такий:
:
:
:
Матриця стандартизованих змінних подається у вигляді:
.
Крок 2. Знаходження кореляційної матриці:
де матриця, транспонована до .
Ця матриця симетрична і має розмір 3 х 3.
Для даної задачі
Кожний елемент цієї матриці характеризує тісноту звязку однієї незалежної змінної з іншою. Оскільки діагональні елементи характеризують тісноту звязку кожної незалежної з цією самою змінною, то вони дорівнюють одиниці. Зауважимо, що при знаходженні добутку матриць за рахунок зміщеності коефіцієнтів парної кореляції числові значення діагональних елементів можуть наближатись до одиниці. Якщо це так, то вони заміняються одиницями, а інші значення матриці r збільшуються на величину, що визначається як різниця між одиницею і діагональним елементом.
Інші елементи матриці r дорівнюють:
тобто вони є парними коефіцієнтами кореляції між пояснювальними змінними. Користуючись цими коефіцієнтами, можна зробити висновок, що між змінними існує звязок. Але чи можна стверджувати, що цей звязок є виявленням мультиколінеарності, а через це негативно впливатиме на оцінку економетричної моделі?
Щоб відповісти на це запитання, потрібно ще раз звернутися до алгоритму Феррара Глобера і знайти статистичні критерії оцінки мультиколінеарності.
Крок 3. Обчислимо детермінант кореляційної матриці r і критерій :
а)
б)
При ступені свободи і рівні значущості = 0,01 критерій табл = 11,34. оскільки факт < табл, доходимо висновку, що в масиві змінних не існує мультиколінеарності.
Крок 4. Знайдемо матрицю, обернену до матриці r:
Крок 5. Використовуючи діагональні елементи матриці C, обчислимо F-критерії:
Для рівня значущості = 0,05 і ступенів свободи = 7 і = 2 критичне (табличне) значення критерію F = 4,74.
Оскільки
F1факт < Fтабл;
F2факт < Fтабл;
F3факт < Fтабл,
то ні одна з незалежних змінних не мультиколінеарна з двома іншими.
Щоб визначити наявність попарної мультиколінеарності, продовжимо дослідження і перейдемо до кроку 6.
Крок 6. Обчислимо частинні коефіцієнти кореляції, скориставшись елементами матриці C:
Частинні коефіцієнти кореляції характеризують тісноту звязку між двома змінними за умови, що третя не впливає на цей звязок.
Порівнявши частинні коефіцієнти кореляції з парними, які було наведено раніше, можна помітити, що частинні коефіцієнти значно менші за парні. Це ще раз показує, що на підставі парних коефіцієнтів кореляції не можна зробити висновків про наявність мультиколінеарності чи її відсутність.
Крок 7. Визначимо t-критерій на основі частинних коефіцієнтів кореляції.
Табличне значення t-критерію при = 7 ступенях свободи і рівні значущості = 0,05 дорівнює 1,69. Усі числові значення t-критеріїв, знайдених для кожної пари змінних, менші за їх табличні значення. Звідси робимо висновок, що всі пари незалежних змінних не є мультиколінеарними.
Отже, незважаючи на те, що між пояснювальними змінними досліджуваної моделі існує лінійна залежність, це не мультиколінеарність, тобто негативного впливу на кількісні оцінки параметрів економетричної моделі, не буде.
Якщо F-критерій більший за табличне значення, тобто коли k-та змінна залежить від усіх інших у масиві, то необхідно вирішувати питання про її вилучення з переліку змінних.
Якщо критерій більший за табличний, то ці дві змінні ( і ) тісно повязані одна з одною. Звідси, аналізуючи рівень обох видів критеріїв і , можна зробити обгрунтований висновок про те, яку зі змінних необхідно вилучити з дослідження або замінити іншою. Проте заміна масиву незалежних змінних завжди має узгоджуватись з економічною доцільністю, що випливає з мети дослідження.
Найпростіше позбутися мультиколінеарності в економетричній моделі можна, відкинувши одну зі змінних мультиколінеарної пари. Але на практиці вилучення якогось чинника часто суперечить логіці економічних звязків. Тоді можна перетворити певним чином пояснювальні змінні моделі:
а) взяти відхилення від середньої;
б) замість абсолютних значень взяти відносні;
в) стандартизувати пояснювальні змінні
і т. iн.
За наявності мультиколінеарності змінних потрібно звертати увагу й на специфікацію моделі. Іноді заміна однієї функції іншою, якщо це не суперечить апріорній інформації, дає змогу уникнути явища мультиколінеарності.
Коли жодний з розглянутих способів не дає змоги позбутися мультиколінеарності, то параметри моделі слід оцінювати за методом головних компонентів.
3.2. Метод головних компонентів
Цей метод призначений для оцінювання моделей великого розміру, а також для оцінки параметрів моделі, якщо до неї входять мультиколінеарні змінні.
Існують різні модифікації методу головних компонентів, які різняться між собою залежно від того, що береться за основу при визначенні ортогональних змінних коваріаційна чи кореляційна матриця незалежних змінних.
Нехай маємо матрицю Х, яка описує незалежні змінні моделі. Оскільки спостереження, що утворюють матрицю Х, як правило, корельовані між собою, то можна поставити питання про кількість реально незалежних змінних, які входять до цієї матриці.
Точніше, ідея методу полягає в тому, щоб перетворити множину змінних Х на нову множину попарно некорельованих змінних, серед яких перша відповідає максимально можливій дисперсії, а друга максимально можливій дисперсії в підпросторі, який є ортогональним до першого, і т.д.
Нехай нова змінна запишеться:
У матричній формі
(10)
де вектор значень нової змінної; m-вимірний власний вектор матриці .
Суму квадратів елементів вектора подамо у вигляді:
(11)
Звідси необхідно вибрати такий вектор , який максимізуватиме , але на вектор треба накласти обмеження, щоб він не став дуже великим. Тому ми його нормуємо, наклавши обмеження:
(12)
Оскільки Z1 = Xa1, то максимізація a1 буде максимізувати Z1, а Z1 характеризує вклад змінної Z1 в загальну дисперсію.
Задача тепер полягає в тому, щоб максимізувати за умов (12). Побудуємо функцію Лагранжа:
де множник Лагранжа.
Узявши , дістанемо
. (13)
Звідси бачимо, що власний вектор матриці , який відповідає характеристичному числу .
Підставивши значення (13) у (11), дістанемо:
(14)
Отже, потрібно для значення вибрати найбільший характеристичний корінь матриці . За відсутності мультиколінеарності матриця буде додатно визначеною і, відповідно, її характеристичні корені будуть додатними. Першим головним компонентом матриці X буде вектор Z1.
Визначимо тепер . При цьому вектор має максимізувати вираз за таких умов:
1) ;
2)
Друга умова забезпечить відсутність кореляції між і , бо коваріація між і подається у вигляді , причому вона дорівнює нулю лише тоді, коли .
Для розвязування цієї задачі функцію Лагранжa запишемо у вигляді
де і множники Лагранжa.
Узявши і , дістанемо де для значення треба вибрати другий за величиною характеристичний корінь матриці .
Цей процес триває доти, доки всі m характеристичних значень матриці не будуть знайдені; знайдені m власних векторів матриці обєднаємо в ортогональну матрицю:
.
Отже, головні компoненти матриці X задаються матрицею
(15)
розміром nm.
. (16)
Вираз (16) означає, що головні компоненти дійсно попарно некорельовані, а їх дисперсії визначаються так:
(17)
Співвідношення характеризують пропорційний внесок кожного з векторів у загальну варіацію змінних X, причому оскільки ці компоненти ортогональні, сума всіх внесків дорівнює одиниці.
Зауважимо, що вектори вихідних даних (матриця X) повинні мати однакові одиниці вимірювання, бо в противному разі дуже важко дати змістовне тлумачення поняттю загальної варіації змінних X і розкладанню цієї варіації на складові, виконаному відповідно до внеску кожного з векторів, якими подаються головні компоненти.
Іноді буває важко надати конкретного змісту знайденим головним компонентам. Для цього можна обчислити коефіцієнти кореляції кожного компонента з різними змінними X. Так, наприклад, візьмемо перший головний компонент Z1 і знайдемо коефіцієнти його кореляції її з усіма змінними X. Для цього потрібно обчислити перехресні добутки між головним компонентом Z1 і кожною з пояснювальних змінних X. Оскільки
маємо коефіцієнти кореляції для першого компонента:
(18)
У загальному випадку коефіцієнт кореляції між і
(19)
Частка різних головних компонентів в варіації визначається показником , а оскільки компоненти не корелюють один з одним, то сума їх часток дорівнює одиниці.
Визначивши всі головні компоненти і відкинувши ті з них, які відповідають невеликим значенням характеристичних коренів, знаходимо звязок залежної змінної Y з основними головними компонентами, а далі з допомогою оберненого перетворення повертаємося від параметрів моделі з головними компонентами до знаходження оцінок параметрів змінних X.
Приклад 2. Нехай для пяти змінних матриці X знайдено пять головних компонентів. Порівнявши їх значення, вибираємо лише два:
(20)
Тоді модель, що характеризує звязок між Y, Z1 i Z2, має вигляд:
(21)
Підставимо в (21) значення головних компонентів із (20):
(22)
У разі, коли було б збережено всі головні компоненти, коефіцієнти рівняння (22) були б такі самі, як коефіцієнти, знайдені на основі прямої регресії Y на всі змінні X.
Розглянемо, як обчислити параметри моделі з головними компонентами:
Звідси (23)
Оскільки , то, підставивши цей вираз у (23), дістанемо:
тобто
. . . . . . . . . .
, тому нормально і незалежно розподілені навколо b.
Алгoритм головних компонентів
Крок 1. Нормалізація всіх пояснювальних змінних:
Крок 2. Обчислення кореляційної матриці
Крок 3. Знаходження характеристичних чисел матриці r з рівняння
де E одинична матриця розміром m m.
Крок 4. Власні значення упорядковуються за абсолютним рівнем вкладу кожного головного компонента до загальної дисперсії.
Крок 5. Обчислення власних векторів розвязуванням системи рівнянь
за таких умов:
Крок 6. Знаходження головних компонентів векторів
Головні компоненти мають задовольняти умови:
;
;
Крок 7. Визначення параметрів моделі :
Крок 8. Знаходження параметрів моделі :
Питання для самоконтролю.
1. Що означає мультиколінеарність змінних?
2. ознаки мультиколінеарності.
3. Як впливає наявність мультиколінеарність змінних на оцінку параметрів моделі?
4. Які статистичні критерії використовуються для виявлення мультиколінеарністі?
5. Дайте коротку характеристику алгоритму Феррара Глобера.
6. На чому грунтується метод головних компонентів? Коли він застосовується?
7. Як обчислити головні компоненти і які умови вони задовольняють?
8. Як оцінюються параметри моделі на основі головних компонентів?
Тема 2. Лінійні моделі множинної регресії.
Лекція 6
Тема лекції. Перевірка залишків регресії на гомокседактичність та гетероскедаксичність
Мета: ознайомити студентів з явищами гетероскедасичності та методами її усунення.
План лекці
1. Гетероскедаксичність.
Література:
1.ГЕТЕРОСКЕДАСТИЧНІСТЬ.
Означення 1. Якщо дисперсія залишків стала для кожного спостереження, тобто , то ця її властивість називається гомоскедастичністю.
Часто у практичних дослідженнях явище гомоскедастичності порушується. Випробування на наявність чи відсутність гомоскедастичності звичайно не практикується, але здебільшого можна висунути гіпотези про правдоподібність альтернативних припущень щодо пропорційності помилки до X. Так, наприклад, при побудові економетричної моделі, що характеризує залежність між заощадженнями і доходами населення на підставі теоретичної та практичної інформації, можна висунути гіпотезу, що дисперсія залишків за окремими групами населення змінюватиметься і буде пропорційною до середнього доходу цієї групи. Коли розглядати економетричну модель, що характеризує залежність між дивідендами і розміром прибутку або між витратами на харчування і доходом на одного члена сімї, витратами на харчування і загальними витратами, то також можна припустити, що дисперсія залишків для окремих груп спостережень змінюватиметься.
Означення 2. Якщо дисперсія залишків змінюється для кожного спостереження або групи спостережень, тобто , то це явище називається гетероскедастичністю*.
Якщо існує гетероскедастичність залишків, то це спричинюється до того, що оцінки параметрів моделі 1МНК будуть незміщеними, обгрунтованими, але неефективними. При цьому формулу для стандартної помилки оцінки, строго кажучи, застосувати не можна.
припустимо, що дисперсія залишків для моделі пропорційна до величини Х. Тоді доцільно виконати перетворення вихідної інформації, поділивши, наприклад, усі змінні на Х. Модель набере вигляду
.
У результаті для оцінювання параметрів можна застосувати 1МНК. Зауважимо, що параметри а0 і а1 помінялися ролями. Вільним членом моделі замість а0 став параметр а1.
Приклад 1. побудуємо економетричну модель, що характеризує залежність між заощадженнями та доходом населення, млрд ф.ст. (табл. 1).
Таблиця1
Рік |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Заощадження |
0,36 |
0,2 |
0,08 |
0,20 |
0,10 |
0,12 |
0,41 |
0,50 |
0,43 |
Дохід |
8,8 |
9,4 |
10,0 |
10,6 |
11,0 |
11,9 |
12,7 |
13,5 |
14,3 |
Рік |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
Заощадження |
0,59 |
0,90 |
0,95 |
0,82 |
1,04 |
1,53 |
1,94 |
1,75 |
1,99 |
Дохід |
15,5 |
16,7 |
17,7 |
18,6 |
19,7 |
21,1 |
22,8 |
23,9 |
25,2 |
Скориставшись оператором оцінювання 1МНК
дістанемо = 1,081; = 0,1178.
Економетрична модель має вигляд
.
Коефіцієнт детермінації для цієї моделі = 0,918, а це означає, що варіація заощаджень Y на 91,8% визначається варіацією доходів населення.
На перший погляд, результат наводить на думку, що специфікація моделі не містить помилки.
Але логічно висунути гіпотезу, що відхилення заощаджень від норми можуть бути пропорційними до доходу, тобто для цієї моделі дуже ймовірне існування гетероскедастичності залишків.
Отже, вихідну інформацію доцільно перетворити, поділивши обидві змінні на величину доходу X (табл. 2):
Таблиця 2.
Рік |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
0,041 |
0,022 |
0,008 |
0,019 |
0,009 |
0,010 |
0,032 |
0,037 |
0,030 |
|
0,114 |
0,106 |
0,100 |
0,094 |
0,091 |
0,084 |
0,079 |
0,074 |
0,070 |
|
Рік |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
0,038 |
0,054 |
0,054 |
0,044 |
0,053 |
0,073 |
0,085 |
0,073 |
0,079 |
|
0,065 |
0,060 |
0,056 |
0,054 |
0,051 |
0,047 |
0,044 |
0,042 |
0,040 |
Нове рівняння звязку згідно з даними табл.2 має вигляд
.
У результаті перетворення вихідних даних практично повністю змінилася специфікація моделі. Оскільки , то цей звязок нелінійний. По-друге, характеризує відносний показник рівень заощаджень, який припадає на одиницю доходу.
Виконавши цю процедуру, дістанемо таке: спостереження з меншими значеннями мають відносно більшу питому вагу при оцінюванні параметрів моделі, ніж у першому варіанті.
З наведеного прикладу бачимо, що явище гетероскедастичності не впливатиме на оцінки параметрів 1МНК, якщо певним чином перетворити вихідну інформацію. Це перетворення, значно ускладнюється, якщо будується економетрична модель з багатьма змінними. У такому разі потрібно зясувати зміст гіпотези, згідно з якою , де лишається невідомим параметром, а відома симетрична додатно визначена матриця.
2. Методи визначення гетероскедастичності
Можливість перевірки припущень про наявність гетероскедастичності залежить від природи вихідних даних. Розглянемо методи перевірки гетероскедастичності для різних вихідних даних.
Перевірка гетероскедастичності на основі критерію
Цей метод застосовується тоді, коли вихідна сукупність спостережень досить велика. Розглянемо відповідний алгоритм.
Крок 1. Вихідні дані залежної змінної Y розбиваються на k груп відповідно до зміни рівня величини Y.
Крок 2. За кожною групою даних обчислюється сума квадратів відхилень:
Крок 3. Визначається сума квадратів відхилень в цілому по всій сукупності спостережень:
Крок 4. Обчислюється параметр :
де n загальна сукупність спостережень; nr кількість спостережень r-ї групи.
Крок 7. Обчислюється критерій:
який наближено відповідатиме розподілу при ступені свободи , коли дисперсія всіх спостережень однорідна. Тобто якщо значення не менше за табличне значення при вибраному рівні довіри і ступені свободи , то спостерігається гетероскедастичність.
Приклад 2. Для даних, які наведено в прикладі 1, перевіримо наявність гетероскедастичності згідно з критерієм .
Розвязання.
Крок 1. Розібємо дані, які наведені в табл. 1, на три групи, по шість спостережень у кожній.
група I |
група II |
група III |
0,36 |
0,41 |
0,82 |
0,20 |
0,50 |
1,04 |
0,08 |
0,43 |
1,53 |
0,20 |
0,59 |
1,94 |
0,10 |
0,90 |
1,75 |
0,12 |
0,95 |
1,99 |
Крок 2. Обчислимо суму квадратів відхилень індивідуальних значень кожної групи від свого середнього значення:
2.1.
2.2.
Крок 3. Знайдемо суму квадратів відхилень за всіма трьома групами:
= S1 + S2 + S3 = 0,05313 + 0,2822 + 1,1703 = 1,5056.
Крок 4. Обчислимо параметр
Крок 5. Знайдемо критерій
Цей критерій наближено задовольняє розподіл 2 з k 1 = 2 ступенями свободи. Порівняємо значення критерію з табличним значенням критерію 2 з k 1 = 2 ступенями свободи при рівні довіри 0,99 2кр = 9,21. Оскільки > 2кр, то дисперсія може змінюватись, тобто для даних табл. 1 спостерігається гетероскедастичність.
Параметричний тест Гольдфельда Квандта
Коли сукупність спостережень невелика, то розглянутий метод не застосовний.
У такому разі Гольдфельд і Квандт запропонували розглянути випадок, коли , тобто дисперсія залишків зростає пропорційно до квадрата однієї з незалежних змінних моделі:
Y = XA + u.
Для виявлення наявності гетероскедастичності згадані вчені склали параметричний тест, в якому потрібно виконати такі кроки.
Крок 1. Упорядкувати спостереження відповідно до величини елементів вектора Xj.
Крок 2. Відкинути c спостережень, які містяться в центрі вектора. Згідно з експериментальними розрахунками автори знайшли оптимальні співвідношення між параметрами c і n, де n кількість елементів вектора :
Крок 3. Побудувати дві економетричні моделі на основі 1МНК за двома утвореними сукупностями спостережень за умови, що перевищує кількість змінних m.
Крок 4. Знайти суму квадратів залишків за першою (1) і другою (2) моделями і :
, де залишки за моделлю (1);
, де залишки за моделлю (2).
Крок 7. Обчислити критерій
який в разі виконання гіпотези про гомоскедастичність відповідатиме F-розподілу з , ступенями свободи. Це означає, що обчислене значення R* порівнюється з табличним значенням F-критерію для ступенів свободи і і вибраного рівня довіри. Якщо , то гетероскедастичність відсутня.
Приклад 3. У табл. 3 наведено дані про загальні витрати та витрати на харчування. Для цих даних перевірити гіпотезу про відсутність гетероскедастичності.
Таблиця3
Номер |
Витрати на |
Загальні витрати |
u |
u2 |
|
1 |
2,30 |
15 |
2,16 |
0,14 |
0,020 |
2 |
2,20 |
15 |
2,16 |
0,04 |
0,002 |
3 |
2,08 |
16 |
2,20 |
-0,12 |
0,015 |
4 |
2,20 |
17 |
2,25 |
-0,05 |
0,002 |
5 |
2,10 |
17 |
2,25 |
-0,15 |
0,022 |
6 |
2,32 |
18 |
2,29 |
0,26 |
0,0007 |
7 |
2,45 |
19 |
2,34 |
0,11 |
0,012 |
8 |
2,50 |
20 |
|||
9 |
2,20 |
20 |
|||
10 |
2,50 |
22 |
|||
11 |
3,10 |
64 |
|||
12 |
2,50 |
68 |
2,37 |
0,13 |
0,016 |
13 |
2,82 |
72 |
2,52 |
0,29 |
0,085 |
14 |
3,04 |
80 |
2,68 |
0,36 |
0,128 |
15 |
2,70 |
85 |
2,99 |
-0,29 |
0,084 |
16 |
3,94 |
90 |
3,18 |
0,76 |
0,573 |
17 |
3,10 |
95 |
3,38 |
-0,28 |
0,076 |
18 |
3,99 |
100 |
3,57 |
0,42 |
0,178 |
Розвязання.
1. Ідентифікуємо змінні:
Y витрати на харчування, залежна змінна;
X загальні витрати, незалежна змінна;
Y = f (X, u).
2. Для перевірки гіпотези про відсутність гетероскедастичності застосуємо параметричний тест Гольдфельда - Квандта.
2.1. Упорядкуємо значення незалежної змінної від меншого до більшого і відкинемо c значень, які містяться всередині впорядкованого ряду:
c 4.
2.3. Визначимо залишки за цими двома моделями:
uI = YI ;
uII = YII .
Залишки та квадрати залишків наведено в табл. 2.
2.4. Обчислимо залишкові дисперсії та знайдемо їх співвідношення:
2.5. Порівняємо критерій R* з критичним значенням F-критерію при 1 = 5 і 2 = 5 ступенях свободи і рівні довіри Р = 0,99 F = 0,01 = 11. Оскільки R* > Fкр, то вихідні дані мають гетероскедастичність.
Непараметричний тест Гольдфельда - Квандта
Гольдфельд і Квандт для оцінювання наявності гетероскедастичності запропонували також непараметричний тест. Цей тест базується на числі піків у величини залишків після упорядкування спостережень за .
Закономірність зміни залишків, коли дисперсія є однорідною, явище гомоскедастичності ілюструє рис.1, а на рис.2 спостерігається явище гетероскедастичності.
Цей тест, звичайно, не такий надійний, як параметричний, але він досить простий.
Зауважимо, що на рис.1 зображено, як змінюються залишки, що мають постійну дисперсію, а на рис.2 залишки, дисперсія яких змінна для різних груп стостережень.
Тест Глейсера
Ще один тест для перевірки гетероскедастичності склав Глейсер. Він запропонував розглядати регресію абсолютних значень залишків , що відповідають регресії найменших квадратів, як певну функцію від , де та незалежна змінна, яка відповідає зміні дисперсії . Для цього використовуються такі види функцій:
1)
2)
3) і т.ін.
Рішення про відсутність гетероскедастичності залишків приймається на підставі статистичної значущості коефіцієнтів і . Переваги цього тесту визначаються можливістю розрізняти випадок чистої і замішаної гетероскедастичності. Чистій гетероскедастичності відповідають значення параметрів , а змішаній . Залежно від цього треба користуватись різними матрицями S. Нагадаємо, що .
Приклад 4. Нехай потрібно перевірити наявність гетероскедастичності при побудові економетричної моделі, яка описуватиме залежність між доходом і рівнем заощаджень. Вихідні дані наведено в табл.3.
Таблиця 4
Місяць |
Дохід |
Заощадження |
Місяць |
Дохід |
Заощадження |
1 |
10,8 |
2,36 |
10 |
17,5 |
2,59 |
2 |
11,4 |
2,20 |
11 |
18,7 |
2,90 |
3 |
12,0 |
2,08 |
12 |
19,7 |
2,95 |
4 |
12,6 |
2,20 |
13 |
20,6 |
2,82 |
5 |
13,0 |
2,10 |
14 |
21,7 |
3,04 |
6 |
13,9 |
2,12 |
15 |
23,1 |
3,53 |
7 |
14,7 |
2,41 |
16 |
24,8 |
3,44 |
8 |
15,5 |
2,50 |
17 |
25,9 |
3,75 |
9 |
16,3 |
2,43 |
18 |
27,2 |
3,99 |
Використаємо параметричний тест Гольдфельда Квандта для встановлення гетероскедастичності при визначенні залежності між наведеними показниками.
Розвязання. Ідентифікуємо змінні:
Y заощадження залежна змінна;
Х дохід пояснювальна змінна, Y = f(X).
Крок 1. Вихідна сукупність спостережень упорядковується відповідно до величини елементів вектора Х, який може впливати на зміну величини дисперсії залишків. Оскільки в табл. 4 дані про дохід упорядковані, то переходимо до наступного кроку.
Крок 2. Відкинемо c спостережень, які міститимуться в центрі векторів Х і Y, де , і поділимо сукупність спостережень на дві частини, кожна з яких містить спостережень.
Крок 3. Побудуємо економетричну модель за першою сукупністю, яка включає спостереження від першого по сьомий місяць включно: . Система нормальних рівнянь для визначення параметрів цієї моделі запишеться так:
Звідси = 2,1216;
= 0,007.
Економетрична модель має вигляд
I: .
Крок 4. Побудуємо економетричну модель виду за другою сукупністю спостережень, починаючи від дванадцятого по вісімнадцятий місяць.
Система нормальних рівнянь для визначення параметрів цієї моделі запишеться так:
Звідси = 0,408;
= 0,165.
Економетрична модель має вигляд:
II:
Крок 5. Знайдемо розрахункові значення залежної змінної моделі величини заощадження за кожною з двох моделей і визначимо відхилення фактичних значень заощаджень від розрахункових.
Таблиця 5 Таблиця 6
Місяць |
у |
u |
u2 |
Місяць |
y |
u |
u2 |
|||
1 |
2,36 |
2,00 |
0,36 |
0,1296 |
12 |
2,95 |
2,99 |
0,04 |
0,0016 |
|
2 |
2,20 |
2,06 |
0,14 |
0,0196 |
13 |
2,82 |
3,09 |
0,27 |
0,0729 |
|
3 |
2,08 |
2,13 |
0,05 |
0,0025 |
14 |
3,04 |
3,21 |
0,17 |
0,0289 |
|
4 |
2,20 |
2,19 |
0,01 |
0,0001 |
15 |
3,53 |
3,37 |
0,16 |
0,0256 |
|
5 |
2,10 |
2,24 |
0,14 |
0,0196 |
16 |
3,94 |
3,56 |
0,38 |
0,1444 |
|
6 |
2,12 |
2,34 |
0,22 |
0,0484 |
17 |
3,75 |
3,68 |
0,07 |
0,0049 |
|
7 |
2,41 |
2,43 |
0,02 |
0,0004 |
18 |
3,99 |
3,83 |
0,16 |
0,0256 |
|
Разом |
0,2202 |
Разом |
0,3039 |
У табл.5 наведено результати обчислення суми квадратів залишків за першою моделлю S1 = 0,2202.
У табл.6 наведено обчислення суми квадратів залишків за другою моделлю S2 = 0,3039.
Крок 6. Обчислимо критерій R*, який наближено відповідає F-розподілу:
Порівняємо його значення з табличним значенням F-критерію при вибраному рівні довіри Р = 0,99 і ступенях свободи 1 = 5 і 2 = 5. Fтабл = 11. Звідси R* < Fтабл, що свідчить про відсутність гетероскедастичності.
ВИзначення матриці S
Щоб оцінити параметри моделі, коли дисперсії залишків визначаються , потрібно визначити матрицю S.
Спинимось на визначенні матриці S.
оскільки явище гетероскедастичності повязане лише з тим, що змінюються дисперсії залишків, а коваріація між ними відсутня, то матриця S має бути діагональною, а саме:
Щоб пояснити, чому саме такий вигляд має ця матриця, потрібно ще раз наголосити: за наявності гетероскедастичності для певних вихідних даних одна (або кілька) пояснювальних змінних можуть різко змінюватись від одного спостереження до іншого, тоді як залежна змінна має такі самі коливання, як і для попередніх спостережень.
Але це означає, що дисперсія залишків, яка змінюватиметься від одного спостереження до іншого (чи для групи спостережень), може бути пропорційною до величини пояснювальної змінної X (або до її квадрата), яка зумовлює гетероскедастичність, або пропорційною до квадрата залишків.
Звідси в матриці S значення можна обчислити, користуючись гіпотезами:
а) , тобто дисперсія залишків пропорційна до зміни пояснювальної змінної ;
б) , тобто зміна дисперсії пропорційна до зміни квадрата пояснювальної змінної ();
в) , тобто дисперсія залишків пропорційна до зміни квадрата залишків за модулем.
Для першої гіпотези:
Для другої гіпотези:
Для третьої гіпотези: або , або .
Оскільки матриця S симетрична і додатно визначена, то при , матриця P має вигляд:
.
3. Узагальнений метод найменших квадратів
(метод Ейткена)
Економетрична модель, якій притаманна гетероскедастичність, є узагальненою моделлю, і для оцінювання її параметрів слід скористатися узагальненим методом найменших квадратів. Розглянемо цей метод.
Нехай задано економетричну модель
(1)
коли .
Задача полягає в знаходженні оцінок елементів вектора А в моделі. Для цього використовується матриця S, за допомогою якої коригується вихідна інформація. Ця ідея була покладена в основу методу Ейткена.
Оскільки S додатно визначена матриця, то вона може бути зображена як добуток , де матриця P є невиродженою, тобто:
, (2)
коли
; (3)
і
. (4)
Помноживши рівняння (1) ліворуч на матрицю , дістанемо:
. (5)
Позначимо ;
;
.
Тоді модель матиме вигляд:
. (6)
Використовуючи (3), неважко показати, що
,
тобто модель (6) задовольняє умови (2, Гаусса-Маркова), коли параметри моделі можна оцінити на основі 1МНК.
Звідси
. (7)
Ця оцінка є незміщеною лінійною оцінкою вектора А, який має найменшу дисперсію і матрицю коваріацій
(8)
Hезміщену оцінку для дисперсії можна дістати так:
(9)
Оцінка параметрів , яку знайдено за допомогою (7), є оцінкою узагальненого методу найменших квадратів (методу Ейткена).
При заданій матриці S оцінку параметрів моделі можна обчислити згідно із (7), а стандартну помилку згідно із (8). Тому можна сконструювати звичайні критерії значущості і довірчі інтервали для параметрів .
Визначивши залишки і помноживши ліворуч на матрицю , дістанемо:
,
або .
Звідси .
Тоді .
Оскільки ,
то (10)
Отже, ми розбили загальну суму квадратів для (6) на суму квадратів регресії і залишкову. Згідно з цими даними дисперсійний аналіз буде виконано для перетворених вихідних даних. Крім того, коли незалежна змінна виміряна відносно початку відліку, а не у формі відхилення від середньої, то необхідно визначити її середнє значення і скористатись ним для корекції загальної суми квадратів і суми квадратів регресії.
Модель узагальненого методу найменших квадратів іноді специфікується у вигляді
(11)
де відома симетрична додатно визначена матриця. Тоді вираз для оцінки параметрів згідно з методом Ейткена запишеться так:
, (12)
а для її коваріаційної матриці
. (13)
Питання для самоконтролю.
1. Дайте означення гомоскедастичності і гетероскедастичності.
2. Як впливає явище гетероскедастичності на оцінку параметрів моделі?
3. Назвіть методи визначення гетероскедастичності.
4. Як перевіряється гетероскедастичність згідно з критерієм ?
5. Як застосовується параметричний тест для визначення гетероскедастичності?
6. У чому сутність непараметричного тесту?
7. Як визначається гетероскедастичність з допомогою регресії залишків?
8. Опишіть методи формування матриці S в умові .
9. Як використовується матриця S в методі Ейткена?
10. Які властивості повинна мати матриця S ?
11. Запишіть формулу обчислення матриці коваріацій параметрів моделі. Чим вона відрізняється від формули при застосуванні 1МНК?
12. Як дістати незміщену оцінку дисперсії залишків за наявності гетероскедастичності?
13. Запишіть оператор оцінювання параметрів моделі за методом Ейткена.
14. Як виконується прогноз за методом Ейткена?
Тема 3. Економетричні моделі динаміки.
Лекція 7,8
Тема лекції. Види економетричних моделей динаміки.
Мета: ознайомити студентів з загальними принципами побудови тимчасових рядів динаміки, видами моделей та методами згладжування .
План лекції
Література:
1. ТРЕНД, ЦИКЛІЧНА,СЕЗОННА ТА ВИПАДКОВА КОМПОНЕНТА.
При побудові эконометричної моделі використовуються два типи даних:
Моделі, побудовані за даними першого типу, називаються просторовими моделями. Моделі, побудовані на основі другого типу даних, називаються моделями тимчасових рядів.
Часовий ряд (ряд динаміки) це сукупність значень якого-небудь показника за кілька послідовних моментів або періодів часу. Кожен рівень тимчасового ряду формується під впливом великого числа факторів, що умовно можна підрозділити на три групи:
Розглянемо вплив кожного фактора на часовий ряд окремо.
Більшість тимчасових рядів економічних показників мають тенденцію, що характеризує сукупний довгостроковий вплив безлічі факторів на динаміку досліджуваного показника. Усі ці фактори, узяті окремо, можуть робити різнонаправлений вплив на досліджуваний показник. Однак у сукупності вони формують його зростаючу або убутну тенденцію. На мал. 9.1 показаний гіпотетичний часовий ряд, що містить зростаючу тенденцію.
Рис. 1.
Також досліджуваний показник може бути підданий циклічним коливанням. Ці коливання можуть носити сезонний характер, оскільки економічна діяльність ряду галузей економіки залежить від часу року (наприклад, ціни на сільськогосподарську продукцію в літній період вище, ніж у зимовий; рівень безробіття в курортних містах у зимовий період вище в порівнянні з літнім). При наявності великих масивів даних за тривалі проміжки часу можна виявити циклічні коливання, зв'язані з загальною динамікою кон'юнктури ринку. На рис. 2 представлений гіпотетичний часовий ряд, що містить тільки сезонну компоненту.
Рис. 2.
Деякі тимчасові ряди не містять тенденції і циклічної компоненти, а кожен наступний їхній рівень утворюється як сума середнього рівня ряду і якоїсь (позитивної або негативної) випадкової компоненти. Приклад ряду, що містить тільки випадкову компоненту, приведений на рис. 3.
Рис. 3.
Очевидно, що реальні дані не випливають цілком і цілком з яких-небудь описаних вище моделей. Найчастіше вони містять усі три компоненти. Кожен їхній рівень формується під впливом тенденції, сезонних коливань і випадкової компоненти.
У більшості випадків фактичний рівень тимчасового ряду можна представити як суму або добуток трендової, циклічної і випадкової компонентів. Модель, у якій часовий ряд представлений як сума перерахованих компонентів, називається аддитивною моделлю тимчасового ряду. Модель, у якій часовий ряд представлений як добуток перерахованих компонентів, називається мультиплікативною моделлю тимчасового ряду. Основна задача эконометричного дослідження окремого тимчасового ряду виявлення і додання кількісного виразу кожної з перерахованих вище компонентів для того, щоб використовувати отриману інформацію для прогнозування майбутніх значень ряду або при побудові моделей взаємозв'язку двох або більш тимчасових рядів.
2. АНАЛІЗ АДИТИВНОЇ ТА МУЛЬТИПЛІКАТИВНОЇ МОДЕЛІ ТИМЧАСОВОГО РЯДУ.
Ми будемо розглядати моделі лінійного тренду, тобто параметри тренда можливо розрахувати за допомогою моделі лінійної регресії.
Спочатку на основі минулих даних знаходимо сезонну варіацію. Виключив сезонну варіацію за допомогою лінійної регресії знаходимо рівняння тренду. По рівнянню тренда та минулих даних обчислюємо величини похибок. Це середнє абсолютне відхилення MAD= та середньоквадратична похибка МSE=, де et - це різниця між фактичними та прогнозними даними в момент часу t, n кількість даних спостережень.
Для адитивної моделі тимчасового ряду маємо: фактичне значення А= трендові значення Т + сезонна варіація S + похибка Е.
Для мультиплікативної моделі тимчасового ряду маємо: фактичне значення А= трендові значення Т х сезонна варіація S х похибка Е.
Побудова аддитивной і мультиплікативної моделей зводиться до розрахунку значень , і для кожного рівня ряду.
Процес побудови моделі містить у собі наступні кроки.
3. АВТОКОРЕЛЯЦІЯ В ЗАЛИШКАХ.
Автокореляція в залишках може бути викликана декількома причинами, що мають різну природу.
Від щирої автокореляції залишків варто відрізняти ситуації, коли причина автокореляції полягає в неправильній специфікації функціональної форми моделі. У цьому випадку варто змінити форму моделі, а не використовувати спеціальні методи розрахунку параметрів рівняння регресії при наявності автокореляції в залишках.
Один з більш розповсюджених методів визначення автокореляції в залишках це розрахунок критерію Дарбина-Уотсона:
. (1)
Т.е. величина є відношення суми квадратів разностей послідовних значень залишків до залишкової суми квадратів по моделі регресії.
Можна показати, що при великих значеннях існує наступне співвідношення між критерієм Дарбина-Уотсона і коефіцієнтом автокореляції залишків першого порядку :
. (2)
Таким чином, якщо в залишках існує повна позитивна автокореляція і , те . Якщо в залишках повна негативна автокореляція, то і, отже, . Якщо автокореляція залишків відсутній, то і . Тобто .
Алгоритм виявлення автокореляції залишків на основі критерію Дарбина-Уотсона наступний. Висувається гіпотеза про відсутність автокореляції залишків. Альтернативні гіпотези і складаються, відповідно, у наявності позитивної або негативної автокореляції в залишках. Далі по спеціальних таблицях визначаються критичні значення критерію Дарбина-Уотсона і для заданого числа спостережень , числа незалежних перемінні моделі і рівня значимості . За цими значеннями числовий проміжок розбивають на п'ять відрізків. Прийняття або відхилення кожної з гіпотез з імовірністю здійснюється в такий спосіб:
є позитивна автокореляція залишків, відхиляється, з імовірністю приймається ;
зона невизначеності;
немає основ відхиляти , тобто автокореляція залишків відсутній;
зона невизначеності;
є негативна автокореляція залишків, відхиляється, з імовірністю приймається .
Якщо фактичне значення критерію Дарбіна-Уотсона попадає в зону невизначеності, то на практиці припускають існування автокореляції залишків і відхиляють гіпотезу .
4. МЕТОДИ ЗГЛАДЖУВАННЯ ЧАСОВИХ РЯДІВ.
При аналізі часових рядів ми використовували метод ковзаної середньої, де усі дані (і піздні, і ранні) були рівноправні. Більш правильним представляється спосіб, в якому даним приписують вагу : більш пізнім даним придається більшу вагу, чим більш ранім.
Проста модель експоційного згладжування.
Новий прогноз= αх (фактичний результат в останньому періоді) + (1-α)х (прогноз в останньому періоді), тобто Ft+1= αAt + (1-α)Ft.
Константу згладжування α дослідник вибирає з відрізка (0,1). В умовах стабільності частіше αє (0,2;0,4).
Модель експоційного згладжування з поправкою на тренд.
Будуємо прогноз методом простого згладжування, а потім корегуємо його з поправкою на тренд за допомогою формули:
Прогноз з урахуванням тренда FITt = прогноз Ft + тренд Tt.
Тренд Тt = (1-b)Tt-1 + b(Ft Ft-1), де Tt і Tt-1 - загладжуваний тренд в періоди t і (t-1) , b - константа згладжування.
Приклад:
Часові ряди
Є умовні дані про обсяги споживання електроенергії (yt) жителями регіону за 16 кварталів (№ варіанта).
Потрібно:
1. Побудувати автокореляційну функцію і зробити висновок про наявність сезонних коливань.
2. Побудувати адитивну і мультиплікативну моделі часового ряду.
3. Зробити прогноз на 2 квартали вперед.
Розвязування.
1. Нехай є деякі умовні дані про обсяги споживання електроенергії жителями регіону (табл. 5.1).
Таблиця 5.1.
Побудуємо поле автокореляції (рис.5.1).
Рис. 5.1.
З графіка видно, що значення у утворюють пилкоподібну фігуру. Розрахуємо декілька послідовних коефіцієнтів автокореляції. Для цього складемо першу додаткову таблицю (табл. 5.2).
Таблиця 5.2.
Варто зауважити, що середні значення одержуються шляхом ділення не на 16, а на 15, оскільки тепер на одно спостереження менше.
Обчислюємо коефіцієнт автокореляції першого порядку:
Складемо додаткову таблицю для розрахунку коефіцієнта автокореляції другого порядку (табл. 5.3).
Таблиця 5.3.
Отже,
Аналогічно знаходяться коефіцієнти автокореляції більш високих порядків, а всі одержані значення заносимо у зведену таблицю (табл. 5.4).
Таблиця 5.4.
Корелограма (рис. 5.2).
Рис. 5.2.
Аналіз корелограми і графіка початкових рівнів часового ряду дозволяє зробити висновок про наявність у часовому ряді, який вивчається, сезонних коливань з періодом у 4 квартали.
2. Розрахуємо компоненти адитивної моделі заданого часового ряду.
Крок 1. Проведемо вирівнювання початкових рівнів ряду методом ковзної середньої. Для цього:
2.1. Сумуємо рівні ряду послідовно за кожні чотири квартали зі зсувом на один момент часу і визначимо умовні річні обсяги споживання електроенергії (колонка 3 таблиці 5.5).
2.2. Розділимо одержані суми на 4, знайдемо ковзні середні (колонка 4 таблиці 5.5). Одержані таким чином вирівняні значення не містять сезонної компоненти.
2.3. Приведемо ці значення у відповідність з фактичними моментами часу, для чого знайдемо середні значення із двох послідовних ковзних середніх центровані ковзні середні (колонка 5 таблиці 5.5).
Таблиця 5.5.
Крок 2. Знайдемо оцінки сезонної компоненти як різницю між фактичними рівнями ряду і центрованими ковзними середніми (колонка 6 таблиці 5.5). Використовуємо ці оцінки для розрахунку значень сезонної компоненти Si (таблиця 5.6). Для цього знайдемо середні за кожний квартал (для всіх років) оцінки сезонної компоненти Si.
Таблиця 5.6.
В моделях із сезонною компонентою, як правило, вважають, що сезонні впливи за період взаємогасяться. В адитивній моделі це виражається в тому, що сума значень сезонної компоненти для всіх кварталів повинна дорівнювати нулю.
Для даної моделі маємо:
Коригуючий множник:
Розрахуємо кореговані значення сезонної компоненти (Si=-k) і заносимо одержані дані в таблицю 5.6.
Перевіримо рівність нулю суми значень сезонної компоненти:
Крок 3. Виключимо вплив сезонної компоненти, обчислюючи її значення для кожного рівня початкового часового ряду. Одержимо величини Т+Е=Y-S (колонка 4 таблиці 5.7). Ці значення розраховуються для кожного періоду часу і містять тільки тенденцію і випадкову компоненту.
Таблиця 5.7.
Крок 4. Визначимо компоненту Т даної моделі. Для цього проведемо аналітичне вирівнювання ряду (Т+Е) за допомогою лінійного тренду. Результати аналітичного вирівнювання такі:
Підставивши в це рівняння значення t=1, 2, …, 16, знайдемо рівні для кожного моменту часу (колонка 5 таблиці 5.7).
Крок 5. Знайдемо значення рівнів ряду, одержані з адитивної моделі. Для цього додамо до рівнів Т значення сезонної компоненти для відповідних кварталів (колонка 6 таблиці 5.7).
На одному графіку відкладемо фактичні значення рівнів часового ряду і теоретичні, одержані з адитивної моделі (рис. 5.3).
Рис. 5.3.
Для оцінки якості побудованої моделі застосуємо суму квадратів одержаних абсолютних похибок:
Отже, можна сказати, що адитивна модель пояснює 97% загальної варіації рівнів часового ряду по кварталах за 4 роки.
Крок 6. Прогнозування за адитивною моделлю. Вважаємо, що у нашому прикладі необхідно дати прогноз про споживання електроенергії на 1-й і 2-й квартали 2003 року. Прогнозне значення Ft рівня часового ряду в адитивній моделі є сумою трендової і сезонної компонент. Для визначення трендової компоненти скористаємося рівнянням тренду:
Одержимо:
Значення сезонних компонент за відповідні квартали дорівнюють:
Таким чином,
Тобто за перші два квартали 2003 р. варто очікувати порядку 395 і 422 обсяги споживання електроенергії відповідно.
Побудуємо тепер мультиплікативну модель.
Крок 1. Методика, яка використовується на цьому кроці співпадає з методикою побудови адитивної моделі (табл. 5.8).
Таблиця 5.8.
Крок 2. Знайдемо оцінки сезонної компоненти як частки від ділення фактичних рівнів ряду на центровані ковзні середні (колонка 6 таблиці 5.8). Ці оцінки використовуються для розрахунку сезонної компоненти S (табл. 5.9). Для цього знайдемо середні за кожний квартал оцінки сезонної компоненти St. Так як і в адитивній моделі вважається, що сезонні впливи за період взаємопогашаються. В мультиплікативній моделі це виражається в тому, що сума значень сезонної компоненти для всіх кварталів повинна дорівнювати числу періодів у циклі. В нашому випадку число періодів одного циклу дорівнює 4.
Таблиця 5.9.
Маємо:
Визначаємо коригуючий коефіцієнт:
Скориговані значення сезонної компоненти St одержуються при множенні її середньої оцінки на коригуючий множник k.
Перевіряємо рівність 4 суми значень сезонної компоненти:
Крок 3. Розділимо кожний рівень початкового ряду на відповідне значення сезонної компоненти. В результаті одержуємо величини (колонка 4 таблиці 5.10), які містять тільки тенденцію і випадкову компоненту.
Таблиця 5.10.
Крок 4. Визначимо компоненту Т в мутиплікативній моделі. Для цього розрахуємо параметри лінійного тренду, використовуючи рівні ТЕ. В результаті одержимо рівняння тренду:
Підставивши в це рівняння значення t=1, 2, ..., 16, знайдемо рівні Т для кожного моменту часу (колонка 5 таблиці 5.10).
Крок 5. Знайдемо рівні ряду, помноживши значення Т на відповідні значення сезонної компоненти (колонка 6 таблиці 5.10). На одному графіку відкладемо фактичні значення рівнів часового ряду і теоретичні, одержані за мультиплікативною моделлю (рис. 5.4).
Рис. 5.4.
Розрахунок похибки в мультиплікативній моделі проводиться за формулою:
Для порівняння мультиплікативної моделі з іншими моделями часового ряду можна за аналогією з адитивною моделлю використати суму квадратів абсолютних похибок :
Порівнюючи показники детермінації адитивної і мультиплікативної моделей, робимо висновок, що вони наближено однаково апроксимують початкові дані.
Крок 6. Прогнозування за мультиплікативною моделлю. Якщо вважати, що для нашого прикладу необхідно дати прогноз про споживання електроенергії на 1 і 2 квартали 2003 р., прогнозне значення Ft рівня часового ряду в мультиплікативній моделі є добуток трендової і сезонної компонент. Для визначення трендової компоненти користуємось рівняння тренду:
Одержуємо:
Значення сезонних компонент за відповідні квартали дорівнюють:
Таким чином:
Отже, в перші 2 квартали 2003 р. варто очікувати споживання електроенергії в 409 і 436 одиниць відповідно.
Робимо загальний висновок: адитивна і мультиплікативна моделі дають приблизно однаковий результат із прогнозу.
Перевіримо тепер гіпотезу про наявність автокореляції в залишках для адитивної моделі нашого часового ряду. Початкові дані і проміжні результати розрахунку заносимо в табл. 5.11.
Таблиця 5.11.
Фактичні значення критерію Дарбіна-Уотсона для даної моделі складають:
Сформулюємо гіпотези: Н0 в залишках немає автокореляції; Н1 в залишках є додатна автокореляція; Н1* - в залишках є відємна автокореляція. Задамо рівень значимості =0,05. В таблиці значень критерію Дарбіна-Уотсона знаходимо для числа незалежних параметрів моделі к=1 (розглядаємо тільки залежність від часу t) критичні значення dL=1,10, dU=1,37. Фактичне значення d-критерію Дарбіна-Уотсона потрапляє в інтервал
Отже, немає підстав відхиляти гіпотезу Н0 про відсутність автокореляції в залишках.
Питання для самоконтролю.
Тема 4. Узагальнені економетричні моделі
Лекція 9
Тема лекції: Системи економетричних рівнянь
Мета: ознайомити студентів з загальними принципами побудови системи економетричних рівнянь.
План лекції
Література:
При використанні окремих рівнянь регресії, наприклад для економічних розрахунків, в більшості випадків припускають, що аргументи (фактори) можна зміняти незалежно один від іншого. Однак це припущення є дуже грубим: практично зміна однієї змінної, як правило, не може відбуватися при абсолютній незмінності інших. Її зміна проїзведе до зміни во всій системі взаємо звязаних при знаків. Це означає що, окреме рівняння регресії не може характеризувати істинні зміни окремих при знаків на варіацію результативної змінної.
Саме тому в останні десятиліття в економічних дослідженнях важливе місце зайняла проблема опису структури зв'язків між змінними системою так званих одночасних рівнянь, званих також структурними рівняннями. Саме тому в останні десятиліття в економічних дослідженнях важливе місце зайняла проблема опису структури зв'язків між змінними системою так званих одночасних рівнянь, званих також структурними рівняннями.
Система рівнянь в економетричних дослідженнях може бути побудована по-різному.
Можлива система незалежних рівнянь, коли кожна залежна змінна у розглядається як функція одного і того ж набору факторів х:
(1)
Набір факторів у кожному рівнянні може варіроватися. Кожне рівняння системи незалежних рівнянь може розглядатися самостійно. Для знаходження його параметрів використовують метод найменших квадратів (МНК). По суті, кожне рівняння цієї системи є рівнянням регресії. Так як фактичні значення залежної змінної відрізняються від теоретичних на величину випадкової похибки, то в кожному рівнянні присутня випадкова похибка εi.
Якщо залежна змінна у одного рівняння виступає у вигляді фактора х в другому рівнянні, то дослідник може будувати модель у вигляді системи рекурсійних рівнянь:
(2)
У даній системі залежна змінна y включена в кожне наступне рівняння в якості факторів усі залежні змінні попередніх рівнянь поряд з набором власне факторів х. Кожне рівняння цієї системи може розглядатися самостійно, та його параметри можна знайти методом найменших квадратів.
Найбільш розповсюджене в економетричних дослідженнях знайшла система взаємо залежних рівнянь:
(3)
Система взаємно залежних рівнянь получила назву системи одночасових структурних рівнянь. Тим самим підкреслюється, що в системі одні і тіж змінні одноразово розглядаються як залежні в одних рівняннях, так і як незалежні в інших. В економетриці ця система рівнянь получила назву структурної форми моделі (СФМ).
На відміну від попередніх систем кожне рівняння системи одночасних рівнянь не може розглядатися самостійно, і для знаходження його параметрів традиційний метод МНК непридатний. З цією метою використовуються спеціальні прийоми оцінювання.
Система спільних, одночасних рівнянь (СФМ) зазвичай містить ендогенні та екзогенні змінні.
Ендогенні змінні - це залежні змінні, число яких дорівнює числу рівнянь в системі і які позначаються через у.
Екзогенні змінні - це зумовлені змінні, що впливають на ендогенні змінні (незалежні) і які позначаються через х.
Економічні змінні можуть виступати в одних моделях як ендогенні, а в інших як екзогенні змінні.
Структрная форма моделі в правій частині містить при ендогенних змінних коефіцієнти bik і екзогенних змінних - коефіцієнти aij, які називаються структурними коефіцієнтами моделі. Всі змінні в моделі виражені у відхиленнях від середнього рівня, тобто під х мається на увазі (), а під у - відповідно (). Тому вільний член у кожному рівнянні системи (3) відсутній.
Використання МНК для оцінювання структурних коефіцієнтів моделі дає, як прийнято вважати в теорії, зміщені і неспроможні оцінки. Тому зазвичай для визначення структурних коефіцієнтів моделі СФМ перетвориться в зведену форму моделі (ЗФМ).
Зведена форма моделі являє собою систему лінійних рівнянь ендогенних змінних від екзогенних:
(4)
де - коефіцієнти ЗФМ, ui залишкова величина для ЗФМ.
За своїм виглядом наведена форма моделі нічим не відрізняється від системи незалежних рівнянь, параметри якої оцінюються традиційним МНК. Застосовуючи МНК, можна оцінити , а потім оцінити значення ендогенних змінних через екзогенні.
Коефіцієнти ЗФМ представляють собою нелінійні функції коефіцієнтів СФМ. Розглянемо це положення на прикладі найпростішої структурної моделі.
Для структурної моделі вигляду
(5)
зведена форма моделі має вигляд
(6)
З першого рівняння (5) можна визначити у2 слідуючим чином (заради спрощення виразу випадкову змінну опустимо):
y2=.
Підставимо в друге рівняння (5) у2:
або
y1=.
Поступивши з другим рівнянням системи (5) відповідно, получемо:
y2=,
тобто система (5) прийме вигляд:
Таким чином, можна зробити висновок про те, що коефіцієнти зведеної форми моделі будуть виражатися через коефіцієнти структурної форми наступним чином:
Слід зазначити, що ПФМ хоча і дозволяє отримати значення ендогенної змінної через значення екзогенної змінних, але аналітично вона поступається СФМ, тому що в ній відсутні оцінки взаємозв'язку між ендогенними змінними.
При переході від зведеної форми моделі до структурної економетріст стикається з проблемою ідентифікації. Ідентифікація - це єдиність відповідності між наведеної та структурної формами моделі.
Структурна модель (3) у повному вигляді містить m(m+n-1) параметрів, а зведена форма моделі в повному вигляді містить mn параметрів. Тобто в повному вигляді ЗФМ містить більше число параметрів, ніж СФМ. Відповідно m(m+n-1) параметрів СФМ не можуть бути однозначно визначені з mn параметрів ЗФМ.
Щоб отримати єдино можливе рішення для структурної моделі, необхідно припустити, що деякі з структурних коефіцієнтів моделі через слабкий взаємозв'язок ознак з ендогенною змінною в лівій частини системи рівнянь дорівнюють 0. Тим самим зменшиться кількість структурних коефіцієнтів моделі.
З позиції ідентифікації структурні моделі можна підрозділити на три види:
а) ідентифіковані;
б) неідентифіковані;
в)понад ідентіфіковані.
Модель ідентифікована, якщо всі структурні її коефіцієнти визначаються однозначно, єдиним чином за коефіцієнтами ЗФМ, тобто число параметрів СФМ дорівнює числу параметрів ЗФМ. У цьому випадку структурні коефіцієнти моделі оцінюються через параметри ЗФМ і модель ідентифікується.
Модель неідентіфікована, якщо число зведених коефіцієнтів менше числа структурних коефіцієнтів, і в результаті структурні коефіцієнти не можуть бути оцінені через коефіцієнти зведеної форми моделі.
Модель понад ідентифікована, якщо число зведених коефіцієнтів більше числа структурних коефіцієнтів. У цьому випадку на основі коефіцієнтів зведеної форми можна отримати два і більше значень одного структурного коефіцієнта. У цій моделі число структурних коефіцієнтів менше числа коефіцієнтів зведеної форми. Понад ідентіфікована модель на відміну від неідентифікованої моделі практично вирішувана, але вимагає для цього спеціальних методів обчислення параметрів.
Структурна модель завжди являє собою систему спільних рівнянь, кожне з яких потрібно перевіряти на ідентифікацію. Модель вважається ідентифікованою, якщо кожне рівняння системи ідентифіковане. Якщо хоча б одне з рівнянь системи неідентифіковане, то і вся модель вважається неідентифікованою.
Понад ідентіфікована модель має хоча б одне понад ідентіфіковане рівняння.
Якщо позначити число ендогенних змінних у i-му рівнянні системи через Н, а число екзогенних (зумлених) змінних, які містяться в системі, але не входять в дане рівняння, - через D, то умова ідентифікації моделі може бути записана у вигляді рахункового правила:
Таблиця 1.
D+1=H |
Рівняння ідентіфіковане |
D+1<H |
Рівняння неідентіфіковане |
D+1>H |
Рівняння понад ідентіфіковане |
Для оцінки параметрів структурної моделі система повинна бути ідентифікована або понад ідентифікована.
Розглянуте рахункове правило відображає необхідну умову але не достатню умову ідентифікації. Рівняння є ідентифікованим, якщо щодо відсутніх у ньому змінним (ендогенним і екзогенним) можна з інших рівнянь системи отримати матрицю, визначник якої не дорівнює нулю, а ранг матриці не менше, ніж число ендогенних змінних у системі без одного.
У економетричних моделях часто поряд з рівняннями, параметри яких повинні бути статистично оцінені, використовуються балансові тотожності змінних, коефіцієнти яких дорівнюють ±1. У цьому випадку, хоча саме тотожність і не вимагає перевірити на ідентифікацію, бо коефіцієнти при змінних в тотожності відомі, у перевірці на ідентифікацію власне структурних рівнянь системи тотожності беруть участь.
Приклад 1. Розглянемо систему одночасних рівнянь:
(7)
Составимо таблицю 2 для перевірки рахункового правила.
Таблиця 2.
Рівняння |
Число присутніх у рівнянні ендогенних змінних Н |
Число відсутніх у рівнянні екзогенних змінних D |
Рахункове правило |
I |
y1,y2,y3, H=3 |
x3,x4, D=2 |
H=D+1, рівняння ідентіфіціруємо |
II |
y1,y2, H=2 |
x4, D=1 |
H=D+1, рівняння ідентіфіціруємо |
III |
y1,y2,y3, H=3 |
x1,x2, D=2 |
H=D+1, рівняння ідентіфіціруємо |
Таким чином, система (7) ідентіфіціруємо.
Нехай у розглянутій системі (7) a21=0, a33=0. Тоді система прийме вигляд:
(8)
Побудуємо таблицю 3 для перевірки рахункового правила.
Таблиця 3.
Рівняння |
Число присутніх у рівнянні ендогенних змінних Н |
Число відсутніх у рівнянні екзогенних змінних D |
Рахункове правило |
I |
y1,y2,y3, H=3 |
x3,x4, D=2 |
H=D+1, рівняння ідентіфіціруємо |
II |
y1,y2, H=2 |
x1, x4, D=2 |
H<D+1, рівняння понад ідентіфіціруємо |
III |
y1,y2,y3, H=3 |
x1,x2, x3, D=3 |
H<D+1, рівняння понад ідентіфіціруємо |
Модель (8) в цілому понад ідентіфіціруємо.
Нехай в останньому рівнянні системи (8) останнє рівняння має вигляд:
y3=b31y1+b32y2+a31x1+a32x2+a34x4,
тобто в останне рівняння включено ще дві екзогенні змінні х1,х2. В цьому випадку рівняння стає не індентіфікованим, так як Н=3, D=1 та (D+1<Н, 1+1<3).
І так, не дивлячись на те що перше рівняння ідентіфіковане, друге понад ідентіфіковане, вся модель вважається неідентифікованою і не має статистичного рішення.
Доцільність перевірки умови ідентифікації моделі через визначник матриці коефіцієнтів, відсутніх у даному рівнянні, але присутніх в інших рівняннях, пояснюється тим, що можлива ситуація, коли для кожного рівняння системи виконано рахункове правило, а визначник матриці названих коефіцієнтів дорівнює нулю. У цьому випадку дотримується лише необхідне, але не достатня умова ідентифікації.
Приклад 2. Розглянемо систему одночасних рівнянь:
(9)
Перевіремо кожне рівняння системи (9) на необхіне та достатнью умови ідентіфікації. Составимо таблицю 4 для перевірки рахункового правила.
Таблиця 4.
Рівняння |
Число присутніх у рівнянні ендогенних змінних Н |
Число відсутніх у рівнянні екзогенних змінних D |
Рахункове правило |
I |
y1,y2,y3, H=3 |
x3,x4, D=2 |
H=D+1, рівняння ідентіфіковане |
II |
y1,y2, H=2 |
x1, D=1 |
H=D+1, рівняння ідентіфіковане |
III |
y1,y2,y3, H=3 |
x3, x4, D=2 |
H=D+1, рівняння ідентіфіковане |
Необхідна умова ідентифікації виконана.
Для перевірки на достатню умову ідентифікації першого рівняння заповнимо таблицю 5,
Таблиця 5.
Рівняння |
Змінні |
А= |
|
х3 |
х4 |
||
2 |
а23 |
а24 |
|
3 |
0 |
0 |
Достатня умова ідентифікації для першого рівняння не виканане.
Для перевірки на достатню умову ідентифікації другого рівняння заповнимо таблицю 6.
Таблиця 6.
Рівняння |
Змінні |
А= |
|
у3 |
х1 |
||
1 |
b13 |
а11 |
|
3 |
-1 |
a31 |
Достатня умова ідентифікації для другого рівняння виканане.
Для перевірки на достатню умову ідентифікації третього рівняння заповнимо таблицю 7.
Таблиця 7.
Рівняння |
Змінні |
А= |
|
х3 |
Х4 |
||
1 |
0 |
0 |
|
2 |
а23 |
a24 |
Достатня умова ідентифікації для третього рівняння не виканане.
Висновок: в цілому структурна модель не може бути ідентіфікованою.
Коефіцієнти структурної моделі можуть бути оцінені різними способами залежно від вигляду системи односачасних рівнянь. Найбільше розповсюдження в літературі отримали наступні методи оцінювання коефіцієнтів структурної моделі
1. непрямий метод найменших квадратів (НМНК);
2. двокроковий метод найменших квадратів (2МНК);
3. трикроковий метод наіменшіх квадратів (3МНК);
4. метод максимальної правдоподібності з повною інформацією;
5. метод максимальної правдоподібності при обмеженій інформації.
Розглянемо коротко сутність каждого з цих методів:
Непрямий метод найменших квадратів.
Процедура застосування НМНК передбачає виконання наступних етапів роботи:
1. Структурна модель перетворюється у приведену форму моделі.
2. Для кожного рівняння приведеної форми моделі звичайним МНК оцінюються приведені коефіцієнти
3. Коефіцієнти приведеної форми моделі трансформуються в параметри структурної моделі.
Якщо система понад ідентіфікована, то НМНК не використовується, бо він не дає однозначних оцінок параметрів структурної моделі. У цьому випадку можуть використовуватися інші методи оцінювання, серед яких найбільш розповсюдженим та простим є ДМНК.
Двокроковий метод найменших квадратів.
Основна ідея ДМНК - на основі приведеної форми моделі отримати для понад ідентифікованого рівняння теоретичні значення ендогенних змінних, що містяться в правій частині рівняння.
Далі, підставивши іх замість фактичних значень, можна застосувати звичайний МНК до структурної формі понад ідентифікованого рівнянням. Метод отримав назву ДМНК, бо двічі використовується МНК: на першому кроці при визначенні ghbведеної форми моделі і перебування на її основі оцінок теоретичних значень ендогенної змінної і на другому кроці стосовно структурного понад ідентіфікованого рівнянню при визначенні значень ендогеннх змінних.
Метод максимальної правдоподібності з повною інформацією та метод максимальної правдоподібності при обмеженій інформації.
Метод максимальної правдоподібності розглядається як найбільш загальний метод оцінювання, результати якого при нормальному розподілу ознак збігається з МНК. Однак при великому числі рівнянь системи цей метод призводить до досить складних обчислювальних процедур. Тому в якості модифікації використовується метод максимальної правдоподібності при обмеженій інформації (метод найменшого дисперсійного відношення), розроблений у 1949 р. Т. Андерсоном і Н. Рубіним.
На відміну від методу максимальної правдоподібності в даному методі зняті обмеження на параметри, пов'язані з функціонуванням системи в цілому. Це робить рішення більш простим, але трудомісткість обчислення залишається досить високою. Незважаючи на його популярність, до середини 60-х років він був витіснений ДМНК у зв'язку з набагато більшою простотою останнього.
Подальшим розвитком ДМНК є ТМНК, запропонований в 1962 р. А. Зельнером та Г. Тейлом. Цей метод оцінювання придатний для всіх видів рівнянь структурної моделі. Однак при деяких обмеженнях на параметри більш ефективним є ДМНК.
Приклад 3. Розглянемо застосування НМНК для найпростішої ідентифікованої моделі з двома ендогенними і двома екзогенними змінними:
Для побудови даної моделі ми маємо в своєму розпорядженні деякою інформацією з п'яти регіонів:
Регіон |
у1 |
у2 |
х1 |
х2 |
1 |
2 |
5 |
1 |
3 |
2 |
3 |
6 |
2 |
1 |
3 |
4 |
7 |
3 |
2 |
4 |
5 |
8 |
2 |
5 |
5 |
6 |
5 |
4 |
6 |
Середне значення |
4 |
6,2 |
2,4 |
3,4 |
ПФМ має вигляд:
де u1,u2 - випадкові похибки ЗФМ.
Для кожного рівняння ЗФМ використовуємо МНК та визначаємо δ коефіцієнти.
Щоб спростити процедуру розрахунків будемо працювати з відхиленнями від середніх, тобто з τ=, .
Тоді для першого рівняння ЗФМ система нормальних рівнянь має вигляд:
Стосовно до нашого прикладу маємо:
=0,852t1+0,373t2+u1
Для другого рівняння ЗФМ система нормальних рівнянь має вигляд:
Стосовно до нашого прикладу маємо:
Таким чином, ЗФМ має вигляд:
Перейдемо від ЗФМ до СФМ:
Для цієї мети з першого рівняння ЗФМ треба виключити t2 виключивши його з другого рівняння ЗФМ і підставивши в перше:
t2=(-0,072 t1-τ2)/0,00557.
Тоді - перше рівняння СФМ.
Щоб знайти друге рівняння СФМ треба з другого рівняння виключити t1 і підставити в друге рівняння:
t1=(-0,373 t2-τ1)/0,852.
Тоді - друге рівняння СФМ.
І так, структурна форма моделі має вигляд:
Перейдемо від середніх значень до змінних х та у. Вільні члени рівнянь знайдемо за формулами:
A01=
A02=
Тоді структурна форма моделі прийме вигляд:
Питання для самоконтролю.
1. Запишіть в загальному вигляді структурну форму моделі на основі одночасових рівнянь.
2. Що означає зведена форма моделі? Як її одержати?
3. Дайте визначення рекурсивних систем і запишіть модель на основі рекурсивної системи.
4. Яка система рівнянь називається точно ідентифікованою?
5. Яка система рівнянь називається надідентифікованою?
6. Запишіть умову ідентифікованності системи рівнянь.
7. На основі якого методу можна оцінити параметри моделі, якщо вона складається із системи рекурсивних рівнянь?
8. Який метод оцінки параметрів можна застосувати, коли всі рівняння моделі є точно ідентифікованими?
9. На основі якого методу можна оцінити параметри моделі, якщо вона має надідентифіковані рівняння?
10. Чи можна виконувати оцінку параметрів моделі окремо для групи точно ідентифікованих і надідентифікованих рівнянь?