Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
1.Тест Дарбина Уотсона некоррелированности случайных возмущений в схеме Гаусса Маркова.
Этот тест предназначен для проверки третьей предпосылки (9.19) теоремы ГауссаМаркова, точнее, частного случая данной предпосылки, а именно:
Cov(ui ,uj) = 0 при j = i-1. (10.8)
Неадекватность условия (10.8) индуцирует негативные для мнк-оценок параметров модели последствия, которые будут обсуждены на следующем занятии.
Замечание 10.4. Часто истинной причиной неадекватности предпосылки (10.8) оказывается ошибка в выборе функции регрессии в спецификации модели, например пропуск значимой предопределённой переменной. Вследствие данного обстоятельства тест ДарбинаУотсона рассматривается в эконометрике как один из наиболее важных.
Этот тест реализуется в итоге следующих шагов.
1. По уравнениям наблюдений объекта (9.5) вычислить МНК-оценки (9.21) коэффициентов модели и оценки случайных возмущений (10.4).
2. Вычислить величину
(10.9)
именуемую статистикой фон НейманаДарбинаУотсона. Подчеркнём, что при выполнении условия (10.8) значения случайной переменной DW концентрируются в окрестности константы c = 2. В любом случае область изменения W(DW) величины DW есть отрезок [0, +4] числовой прямой.
3. Из табл. 10.2, составленной Дарбиным и Уотсоном, по значению n и количеству k объясняющих переменных выбрать пару констант (dL,dU).
4. Проверить, в какое из пяти подмножеств M1, M2, M3, M4 или M5 области W (DW) попала величина DW (см. рис. 10.1). Сделать вывод, обозначенный на этом рисунке. Заметим, что если статистика DW попадает в подмножество M2 = (dL, dU) или M4 = (4-dU, 4-dL), то принять решение об адекватности или, напротив, неадекватности предпосылки (10.8) нельзя.
Cov(ui ,uj)>0 ¬ ? ®¬Cov(ui,uj)=0 ®¬ ? ®¬ Cov (ui, uj) <0 ®
0 dL dU 2 4-dU 4-dL 4
¬ M1 ®¬ M2 ®¬ M3 ®¬ M4 ®¬ M5 ®
Отметим, что обсуждённый выше тест корректен в ситуации, когда случайные возмущения в уравнениях наблюдений (9.4) распределены по нормальному закону и гомоскедастичны.
2.Метод имитационного моделирования. Исследование последствий нарушения условий теоремы Гаусса Маркова.
Первая предпосылка теоремы Гаусса Маркова: E (u1) = E (u2) = … = E (un). Ожидаемые значения случ возмущений равны м/у собой и равны 0. Это влечет св-во несмещенности оценок, найденных методом наименьших квадратов параметра a0 и его точностных характеристик. Вообще, сущность метода ИМ состоит в воспроизведении n-раз ситуаций, в которых каждая из случайных возмущений (u1,...,un) получает свое конкретное значение в заданных уравнениях наблюдения объекта какой-либо модели. При моделировании конкретных значений СВ U1(j), U2(j),..., Un(j) в случае нарушения 1-ой предпосылки используется формула: Ui(j) = бi * U*i(j) + mi, но величина mi выбирается константой, отличной от 0. Значения U*i(j) опр-ся по таблице «Значения независимых нормально распределенных стандартных случ переменных u1*, u2*, …, un* по прошествии определенного числа опытов. Полученные значения Ui(j) исп-ся для получения оценочных значений, которые затем мы оцениваем с помощью МНК. Сравниваем полученные оценочные значения a0 со значением исходного a0. В случае сильного отличия (больше ошибки) считается, что коэф-т a0 не обладает свойством несмещенности. Вообще, сущность метода ИМ состоит в воспроизведении n-раз ситуаций, в которых каждая из случайных возмущений (u1,...,un) получает свое конкретное значение в заданных уравнениях наблюдения объекта какой-либо модели. 2-ая предпосылка теоремы Гаусса- Маркова: дисперсии СВ одинаковы: var (u1) = var (u2) = ... = var (un) = σ2u. Это влечет след последствия: 1) оценки коэф-тов утрачивают св-во наименьшей дисперсии, оставаясь при этом несмещенными; → оценочные значения рассеяны вокруг истинного значения, но разница м/у истинным значением эндог переменной и той, которую можно рассчитать при помощи коэф-тов, будет большая; 2) среднеквадратические ошибки оценок перестают объективно отражать точность оценок; 3) оценка пар-ра ~σ2 утрачивает св-во несмещенности. Значения U1(j), U2(j), ..., Un(j) вычисляются по правилу Ui(j) = бi * U*i(j) + mi: mi = 0, → Ui(j) = бi * U*i(j).
Свойства оценок коэффициентов регрессии, полученных с помощью метода наименьших квадратов. Теорема Гаусса-Маркова - формулировка, смысл теоремы. Условия Гаусса-Маркова и последствия их нарушения
Теорема ГауссаМаркова
оценки по обычному методу наименьших квадратов являются не только несмещенными оценками коэффициентов регрессии, но и наиболее эффективными в том случае, если выполнены условия ГауссаМаркова. С другой стороны, если условия ГауссаМаркова не выполнены, то, вообще говоря, можно найти оценки, которые будут более эффективными по сравнению с оценками, полученными обычным методом наименьших квадратов. В данной работе не приводится общее рассмотрение этих вопросов. Тем не менее в том случае, если условия ГауссаМаркова для остаточного члена выполнены, коэффициенты регрессии, построенной обычным методом наименьших квадратов, будут наилучшими линейными несмещенными оценками (best linear unbiased estimators, или BLUE): несмещенными, как уже было показано; линейными, так как они являются линейными функциями значений у; наилучшими, так как они являются наиболее эффективными в классе всех несмещенных линейных оценок. Теорема ГауссаМаркова доказывает это (краткое изложение, не использующее матричной алгебры, дано в работе Дж. Томаса
для того чтобы регрессионный анализ, основанный на обычном методе наименьших квадратов, давал наилучшие из всех возможных результаты, случайный член должен удовлетворять четырем условиям, известным как условия ГауссаМаркова.
1-е условие ГауссаМаркова: E(Ut) = 0 для всех наблюдений. Первое условие состоит в том, что математическое ожидание случайного члена в любом наблюдении должно быть равно нулю. Иногда случайный член будет положительным, иногда отрицательным, но он не должен иметь систематического смещения ни в одном из двух возможных направлений. Vipolnjaetsja avtomaticeski,esli urava soderzit konstantu
2-е условие ГауссаМаркова: pop. var (u) постоянна для всех наблюдений. Второе условие состоит в том, что дисперсия случайного члена должна быть постоянна для всех наблюдений. Иногда случайный член будет больше, иногда меньше, однако не должно быть априорной причины для того, чтобы он порождал большую ошибку в одних наблюдениях, чем в других. Одна из задач регрессионного анализа состоит в оценке стандартного отклонения случайного члена. Если рассматриваемое условие не выполняется, то коэффициенты регрессии, найденные по обычному методу наименьших квадратов, будут неэффективны. Narushenie privodit k geteroskedasticnosti
3- е условие Это условие предполагает отсутствие систематической связи между значениями случайного члена в любых двух наблюдениях. Например, если случайный член велик и положителен в одном наблюдении, это не должно обусловливать систематическую тенденцию к тому, что он будет большим и положительным в следующем наблюдении (или большим и отрицательным, или малым и положительным, или малым и отрицательным). Случайные члены должны быть абсолютно независимы друг от друга. Narushenie privodit k avtokorreljacii
4-е условие случайный член должен быть распределен независимо от объясняющих переменных В большинстве глав книги мы будем в сущности использовать более сильное предположение о том, что объясняющие переменные не являются стохастическими, т. е. не имеют случайной составляющей. Значение любой независимой переменной в каждом наблюдении должно считаться экзогенным, полностью определяемым внешними причинами, не учитываемыми в уравнении регрессии. Если это условие выполнено, то теоретическая ковариация между независимой переменной и случайным членом равна нулю. Дело в том, что если случайный член и нормально распределен, то так же будут распределены и коэффициенты регрессии.
Предположение о нормальности основывается на центральной предельной теореме. В сущности, теорема утверждает, что если случайная величина является общим результатом взаимодействия большого числа других случайных величин, ни одна из которых не является доминирующей, то она будет иметь приблизительно нормальное распределение, даже если отдельные составляющие не имеют нормального распределения.
3.Анализ вариации зависимой переменной в регрессии.
После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.
Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т. е. b = 0, и, следовательно, фактор х не оказывает влияния на результат у.
Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения у на две части «объясненную» и «необъясненную».
+ (7.1)
TSS |
RSS |
ESS |
где
TSS общая сумма квадратов отклонений;
RSS сумма квадратов отклонений, объясненная регрессией;
ESS остаточная сумма квадратов отклонений.
Общая сумма квадратов отклонений индивидуальных значений результативного признака у от среднего значения у вызвана влиянием множества причин.
Условно разделим всю совокупность причин на две группы: изучаемый фактор х и прочие факторы. Если фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси ОХ и среднее значение у равно оценке ( ). Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной. Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов
4.Ошибки спецификации переменных в уравнениях регрессии; их симптомы, последствия и методика устранения.
Нередко на четвёртом этапе приходится констатировать, что оценённая модель неадекватна объекту-оригиналу. Это значит, что на этапе спецификации модели, вероятно, допущены какие-то ошибки. Чаще всего они содержатся в спецификации переменных в уравнении регрессии. Вот типичные ошибки такого вида:
Неверный выбор уравнения парной регрессии («а»)
Пусть на первом этапе экономист составил спецификацию модели парной регрессии (15.1):
с ошибочно выбранным уравнением регрессии:
yR= fF (x;a0,a1)
линейным по коэффициентам (а0, а1) Предположим, что истинное уравнение регрессии у на х задаётся такой функцией:
yR= fT (x;a0,a1)
при которой:fT (x;a0,a1)- fF (x;a0,a1)=φ(x)≠0 (15.4)
Это значит, что E(u|x)= fT (x;a0,a1),
но в силу условия (15.4)
E(u|x)≠ fF (x;a0,a1).(15.6)
Из неравенства (15.6) следует, что предпосылка
Е(у|х)=0, (15.7)
принятая в спецификации (15.1), ложна, так как на самом деле справедливо иное соотношение:
Е(у|х)=E(y- fF (x;a0,a1)| x)= Е(у|х) - fF (x;a0,a1)|= φ(x)≠0 (15.8)
Итак, последствием ошибочного выбора функции в качестве уравнения регрессии является нарушение предпосылки 15.7 о нулевом ожидаемом значении случайного возмущения. В итоге МНК-оценки коэффициентов модели оказываются смещёнными, и их среднеквадратические ошибки уже не являются объективными характеристиками точности. В конечном счёте, прогноз (точечный и интервальный) значения у0 эндогенной переменной у, вычисленный при х = хо оценённой модели оказывается неадекватным.
Симптомы ошибки:
В линейное уравнение множественной регрессии включена лишняя объясняющая переменная («б»)
Пусть на первом этапе экономист составил спецификацию модели множественной регрессии
(15.16)
в ситуации, когда одна из объясняющих переменных, скажем, х2, является лишней, но экономист об этом не знает и оценивает МНК параметров по выборке: (a0, a1,a2;σu2) модели, где а2=0.
Результат: МНК-оценки параметров: не имеют смещения, однако их точность не является максимально возможной, ошибка «б» способна привести экономиста к выводу, что оценённая модель неадекватна.
В линейном уравнении множественной регрессии пропущена значимая объясняющая переменная («в»)
Ошибка этого типа противоположна ошибке типа «б» эквивалентна по последствиям и симптомам ошибке типа «а» Следовательно, все последствия и симптомы ошибки типа «а» без каких-либо изменений переносятся и на данную ошибку.
5.Коэффициент детерминации как мера качества спецификации эконометрической модели.
Эконометрические модели строятся, как известно, для объяснения текущих значений эндогенных переменных при помощи заданных значений предопределённых переменных. Так, модель линейной множественной регрессии создаётся для объяснения эндогенной переменной y при помощи экзогенных переменных x1, x2, …, xk. По этой причине переменные x1, x2, …, xk часто называют объясняющими переменными, или (кратко) регрессорами. Коэффициент детерминации, который традиционно обозначают символом R2, служит мерой объясняющей способности регрессоров x1, x2, …, xk. Эта мера имеет наглядный смысл, как-то: R2 - есть объяснённая регрессорами доля дисперсии эндогенной переменной y. Однако R2 зависит от выборки и поэтому является случайной переменной (СП). Последнее обстоятельство снижает уровень объективности заключения о качестве спецификации модели, сделанного на основании значения коэффициента детерминации. F-тест*, целиком базирующийся на интерпретации R2 как СП, призван компенсировать этот эффект, то есть придать суждению о качестве спецификации модели объективный (формализованный) характер.
Смысл коэффициента детерминации. Пусть имеется оценённая МНК (методом линейных квадратов) линейная модель парной регрессии,
. (12.1)
Предполагается, что МНК-оценки её параметров получены по выборке в ситуации, когда предпосылки теоремы ГауссаМаркова адекватны.
В уравнении (12.1) обозначим символом
(12.2)
оценку уравнения регрессии модели (9.1). Подчеркнём, что регрессор x полностью объясняет левую часть равенства (12.2) - случайную переменную . Следовательно, с учётом (12.2) и уравнений наблюдений справедливы равенства:
. (12.3)
Здесь n - количество уравнений наблюдений, по которым и найдена МНК-оценка (12.1) модели (9.1); далее, первое слагаемое в формуле (12.3) полностью объясняется в рамках данной модели регрессором x ; напротив, второе слагаемое никак не объясняется этим регрессором. Поэтому
ясно, что объясняющая способность x тем выше, чем большую долю в величине y составляет первое слагаемое. Как измерить эту долю? Ведь y - переменная величина! Осуществить такую процедуру можно, если привлечь понятие дисперсии*.
Согласно свойству операции оценивания дисперсии по выборочным данным справедливо равенство
(12.4)
где
(12.5)
(12.6)
Можно показать, что, во-первых, последнее слагаемое в правой части равенства равно нулю, то есть
(12.7)
а во-вторых, второе слагаемое в правой части (12.4)
(12.8)
Следовательно, в качестве меры, объясняющей способности регрессора x в рамках модели (9.1), может служить величина
(12.9)
Она именуется коэффициентом детерминации модели* и равна доле дисперсии переменной y, которая объясняется в рамках модели (9.1) её регрессором, x. Из равенств (12.5), (12.7) и (12.9) следует, что всегда
0 £ R2 £ 1, (12.10)
причем если R2 = 1, то значения yt переменной y полностью объясняется значениями xt регрессора x при t = 1, 2,..., n, поскольку ESS = 0 и, следовательно,
при t = 1, 2, ..., n. (12.11)
Напротив, когда R2 = 0, то спецификация (9.1), очевидно, совершенно плоха, так как в рамках такой модели регрессор x абсолютно неспособен объяснять значения y . Заметим, что ситуация совершенно плохой спецификации равносильна справедливости предположения
H0 : a1 = 0 (12.12)
о коэффициенте a1 модели (9.1). Предположение (12.12) именуется статистической гипотезой* о параметре a1 модели (9.1).
6. Компьютерное моделирование эконометрических систем.
7.F Тест качества спецификации эконометрической модели.
F-тест - оценивание качества уравнения регрессии - состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется как
гду n число единиц совокупности;
m - число параметров при переменных х
Fтабл это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости а. Уровень значимости а - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно а принимается равной 0,05 или 0,01.
Если Fтабл<Fфакт, то Н0 - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл>Fфакт, то гипотеза Н0 не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R2
0≤ R2≤1. причем если R2= 1 то переменная полностью объясняется регрессором xt.
8. Процедура точечного прогнозирования по оцененной линейной эконометрической модели парной регрессии значений эндогенной переменной
Помимо метода наименьших квадратов, с помощью которого в большинстве случаев определяются неизвестные параметры модели регрессии, в случае линейной модели парной регрессии осуществим иной подход к решению данной проблемы.
Линейная модель парной регрессии может быть записана в виде:
где у значения зависимой переменной;
х значения независимой переменной;
среднее значение зависимой переменной, которое определяется на основании выборочных данных вычисленное по формуле средней арифметической:
уi значения зависимой переменной,
n объём выборки;
среднее значение независимой переменной, которое определяется на основании выборочных данных вычисленное по формуле средней арифметической:
Параметр βyx называется выборочным коэффициентом регрессии переменной у по переменной х. Данный параметр показывает, на сколько в среднем изменится зависимая переменная у при изменении независимой переменной х на единицу своего измерения.
Выборочный коэффициент регрессии переменной у по переменной х рассчитывается по формуле:
где ryx это выборочный парный коэффициент корреляции между переменными у и х, который рассчитывается по формуле:
среднее арифметическое значение произведения зависимой и независимой переменных:
Sy показатель выборочного среднеквадратического отклонения зависимой переменной у. Этот показатель характеризует, на сколько единиц в среднем отклоняются значения зависимой переменной у от её среднего значения. Он рассчитывается по формуле:
среднее значение из квадратов значений зависимой переменной у:
квадрат средних значений зависимой переменной у:
Sx показатель выборочного среднеквадратического отклонения независимой переменной х. Этот показатель характеризует, на сколько единиц в среднем отклоняются значения независимой переменной х от её среднего значения. Они рассчитывается по формуле:
среднее значение из квадратов значений независимой переменной х:
квадрат средних значений независимой переменной х:
При использовании рассмотренного подхода оценивания неизвестных параметров линейной модели парной регрессии, следует учитывать что ryx=rxy, однако βyx≠βxy.
9.Интервальное прогнозирование по оцененной линейной эконометрической модели парной регрессии значений эндогенной переменной.
Одна из задач эконометрического моделирования заключается в прогнозировании поведения исследуемого явления или процесса в будущем. В большинстве случаев данная задача решается на основе регрессионных моделей, с помощью которых можно спрогнозировать поведение результативной переменной в зависимости от поведения факторных переменных.
Рассмотрим подробнее процесс прогнозирования для линейной модели парной регрессии.
Точечный прогноз результативной переменной у на основе линейной модели парной регрессии при заданном значении факторной переменной хm будет осуществляться по формуле:
ym=β0+β1xm+εm.
Точечный прогноз результативной переменной ym с доверительной вероятностью γ или (1а) попадает в интервал прогноза, определяемый как:
ymt*ω(m)≤ ym≤ ym+t*ω(e),
t t-критерий Стьюдента, который определяется в зависимости от заданного уровня значимости a и числа степеней свободы (n-2) для линейной модели парной регрессии;
ω(e) величина ошибки прогноза в точке m.
Для линейной модели парной регрессии величина ошибки прогноза определяется по формуле:
где S2(ε) несмещённая оценка дисперсии случайной ошибки линейной модели парной регрессии.
Рассмотрим процесс определения величины ошибки прогноза β(e).
Предположим, что на основе выборочных данных была построена линейная модель парной регрессии вида:
Факторная переменная х в данной модели представлена в центрированном виде.
Задача состоит в расчёте прогноза результативной переменной у при заданном значении факторной переменной хm, т. е.
Математическое ожидание результативной переменной у в точке m рассчитывается по формуле:
Дисперсия результативной переменной у в точке m рассчитывается по формуле:
где D(β0) дисперсия оценки параметра β0 линейной модели парной регрессии, которая рассчитывается по формуле:
Следовательно, точечная оценка прогноза результативной переменной у в точке m имеет нормальный закон распределения с математическим ожиданием
и дисперсией
Если в формулу дисперсии результативной переменной у в точке m вместо дисперсии G2 подставить её выборочную оценку S2, то получим доверительный интервал для прогноза результативной переменной у при заданном значении факторной переменной хm:
где выборочная оценка генеральной дисперсии S2 для линейной модели парной регрессии рассчитывается по формуле:
В этом случае прогнозный интервал можно преобразовать к виду:
что и требовалось доказать.
10.Множественная линейная регрессионная модель. Оценивание параметров множественной регрессии методом наименьших квадратов.
Оценивание (настройка) эконометрической модели составляет содержание третьего этапа схемы её построения. В результате этой процедуры отыскиваются оценки (приближённые значения) неизвестных параметров спецификации модели.
модель множественной регрессии это модель в виде изолированных линейных уравнений с многими переменными.
Основная идея ДМНК на основе приведенной формы модели получить для сверхидентифицируемого уравнения теоретические значения эндогенных переменных, содержащихся в правой части уравнения. Далее, подставив их вместо фактических значений, можно применить обычный МНК к структурной форме сверхидентифицируемого уравнения. Метод получил название двухшагового МНК, ибо дважды используется МНК: на первом шаге при определении приведенной формы модели и нахождении на ее основе оценок теоретических значений эндогенной переменной:
ŷi=δi1x1 + δi2x2+…+ δijxj
и на втором шаге применительно к структурному сверхидентифицируемому уравнению при определении структурных коэффициентов модели по данным теоретических (расчетных) значений эндогенных переменных.
Сверхидентифицируемая структурная модель может быть двух типов:
все уравнения системы сверхидентифицируемы;
система содержит наряду со сверхидентифицируемыми точно идентифицируемые уравнения.
Если все уравнения системы сверхидентифицируемые, то для оценки структурных коэффициентов каждого уравнения используется ДМНК. Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним находятся из системы приведенных уравнений.
Применим ДМНК к простейшей сверхидентифицируемой модели:
Данная модель может быть получена из предыдущей идентифицируемой модели:
если наложить ограничения на ее параметры, а именно: b12 =a11
В результате первое уравнение стало сверхидентифицируемым: Н=1 (у1), D=1(х2) и D+1 > Н. Второе уравнение не изменилось и является точно идентифицируемым: Н = 2 и D=1
На первом шаге найдем приведенную форму модели, а именно:
ДМНК является наиболее общим и широко распространенным методом решения системы одновременных уравнений.
Несмотря на важность системы эконометрических уравнений, на практике часто не принимают во внимание некоторые взаимосвязи, применение традиционного МНК к одному или нескольким уравнениям также широко распространено в эконометрике. В частности, при построении производственных функций анализ спроса можно вести, используя обычный МНК.
11.Определение границ доверительных интервалов точечных оценок множественной регрессионной модели.
Множественная регрессия позволяет построить и проверить модель линейной связи между зависимой (эндогенной) и несколькими независимыми (экзогенными) переменными: y = f(x1,...,xр ), где у - зависимая переменная (результативный признак); х1,...,хр - независимые переменные (факторы).
Для построения уравнения множественной регрессии чаще используются следующие функции:
Можно использовать и другие функции, приводимые к линейному виду
Определение границ доверительных интервалов оценок параметров модели
В условиях нормальной линейной множественной регрессионной модели, при построении доверительных интервалов оценок параметров t-статистика вида:
Доверительный интервал имеет границы:
где ta - табличное значение статистики Стьюдента с n-k степенями свободы для α%-го уровня значимости.
Определение границ доверительного интервала прогноза зависимой переменной
Доверительный интервал для отдельного (индивидуального) значения зависимой переменной строится с учетом рассеяния индивидуальных значений вокруг линии регрессии, т.е. с учетом ошибки регрессии: ,
где
12.Оценивание параметров модели взвешенным методом наименьших квадратов.
Оценивание эконометрической модели составляет содержание третьего этапа схемы ее построения. В результате этой процедуры отыскиваются оценки (приближенные значения) неизвестных параметров спецификации модели. Рассмотрим метод наименьших квадратов на примере оценивания эконометрических моделей в виде изолированных уравнений с двумя переменными (моделей парной регрессии). Спецификация линейной эконометрической модели из изолированного уравнения с гомоскедастичными возмущениями имеет вид:
(1)
В частном случае, когда уравнение модели содержит две экономические переменные эндогенную yt и предопределенную xt модель имеет вид:
(2)
и именуется моделью линейной парной регрессии. Данная спецификация содержит три неизвестных параметра: a0 , a1 , σ. (3)
Пусть имеется выборка: (х1, y1), (х2, y2),… (хn , y n) (4)
Тогда в рамках исследуемой модели виличины связаны следующим образом:
y1 = a0 + a1 * x1 + u1,
y2 = a0 + a1 * x2 + u2,
…………………….. (5)
yn = a0 + a1 * x n + u n.
Она называется системой уравнений наблюдения объекта в рамках исследуемой линейной модели, или иначе схемой Гаусса-Маркова. Вот компактная запись этой схемы: (6)
где (7) - вектор известных значений эндогенной переменной yt модели;
(8) - вектор неизвестных значений случайных возмущений ut
(9) - матрица известных значений предопределенной переменной xt модели, расширенная столбцом единиц; наконец,
а = (a0 a1 ) Т (10) вектор неизвестных коэффициентов уравнения модели.
Оценку вектора обозначим: ã=(ã0 ã1)Т (11)
Тот факт, что эта оценка вычисляется по выборочным данным (7) и (9) при помощи некоторой процедуры, отразим: (12)
где Р(· , ·) символ процедуры. Процедура (12) именуется линейной относительно вектора (7) значений эндогенной переменной yt, если: (13)
где (14)
матрица коэффициентов, зависящих только от выборочных значений (9) предопределенной переменной хt.
Теорема Гаусса-Маркова. Пусть матрица Х коэф-тов ур-ий наблюдений (6) имеет полный ранг, а случайные возмущения (8) удовл-т четырем условиям:
E(u1) = E(u2) = … = E(un) = 0, (18)
Var(u1) = Var(u2) = … = Var(un) = σ2 (19)
Cov (ui, uj) = 0 при i≠j (20)
Cov(xi,uj) = 0 при всех зн-ях i и j (21)
Тогда: а) наилучшая линейная процедура (13), приводящая к несмещенной и эффективной оценке (11), имеет вид:
(22)
б) линейная несмещенная эффективная оценка (22) обладает св-вом наименьших квадратов: (23)
в) ковариационная матрица оценки (22) вычисляется по правилу:
(24)
г) несмещенная оценка параметра σ2 модели (2) нах-ся по формуле:
(25)
Следствие. Оценка ã, доставляемая процедурой (22) метода наименьших квадратов, может быть вычислена в процессе решения системы двух линейных алгебраических ур-ий:
(26)
именуемой системой нормальных ур-ий. Ее коэф-ты и свободные члены вычисляются по правилам:
[x] = x1 + x2 +…+ xn,
[y] = y1 + y2 +…+ yn, (27)
[x2] = x12 + x22 +…+ xn2,
[xy] = x1*y1 + x2*y2 + … + xn*yn .
Вот явный вид решения системы (26):
13.Модель Марковица.
Портфельная теория Марковица подход, основанный на анализе ожидаемых средних значений и вариаций случайных величин) разработаннаяГарри Марковицем методика формирования инвестиционного портфеля, направленная на оптимальный выбор активов исходя из требуемого соотношения доходность/риск. Сформулированые им в 1950-х годах идеи составляют основу современной портфельной теории.
После проведённой Марковицем формализации, с математической точки зрения задача по формированию оптимального портфеля представляла собой задачу квадратической оптимизации при линейных ограничениях[4]. Этот класс задач, является одним из наиболее изученных классов оптимизационных задач, для которых существует большое число эффективных алгоритмов[7].
Для построения пространства возможных портфелей Марковиц предложил использовать класс активов, вектор их средних ожидаемых доходностей и матрицу ковариаций[4].
На основе этих данных строится множество возможных портфелей с различными соотношениями доходность-риск[4].
Так как в основе анализа лежат два критерия, менеджер выбирает портфели[4]:
Либо поиском эффективных, или неулучшаемых решений. В этом случае любое другое решение, лучше найденных по одному параметру обязательно будет хуже по другому.
Либо выбирая главный критерий (например, доходность должна быть не ниже определённой величины) остальные используя лишь в качестве критериальных ограничений.
Либо задавая некий суперкритерий, который является суперпозицией указанных двух (например, их функцией).
Портфель Марковица минимального риска
Задача оптимизации портфеля активов с вектором средней доходности ковариационной матрицей может быть сформулирована следующим образом
К этим условиям в задаче оптимизации портфеля активов следует добавить условие положительности портфеля (долей). Однако, в общем случае финансовых инструментов предполагается возможность открытия коротких позиций (отрицательных долей инструментов в портфеле). Тогда можно найти общее аналитическое решение задачи. Если обозначить,
то решение задачи имеет вид
Тогда зависимость дисперсии оптимизированного (эффективного) портфеля от требуемой доходности будет иметь вид
где минимально возможная дисперсия доходности портфеля и соответствующая ему средняя доходность
доходность портфеля, с соотношением риск-доходность таким же как и портфель минимального риска (графически это единственная точка пересечения с параболой прямой, проходящей через начало координат и вершину параболы)
14.Эконометрические модели прогнозирования инфляции.
На практике для краткосрочного прогнозирования инфляции используют модели, полностью основанные на статистических данных. При эконометрическом моделировании инфляции, как правило, учитываются следующие факторы :Темп инфляции за несколько предыдущих периодов;Темп роста денежной массы за эти же периоды;Темп роста национального дохода.Дополнительно могут быть включены в модель факторы, провоцирующие инфляцию, такие, как 1) темп роста заработной платы; 2) процентная ставка по кредитам. Всем факторам в эконометрической модели приписываются некоторые веса, которые определяются методами регрессионного анализа статистических данных за достаточно длинный период наблюдений. Веса факторов в эконометрических моделях не остаются неизменными; они постоянно меняются из-за влияния различных факторов. В качестве эконометрической модели инфляции мы более подробно рассмотрим простую модель инфляции на основании ценового разрыва. Ценовой разрыв относительная разность между текущим уровнем цен и их естественным уровнем, т.е. :
PG = ( p p* ) : p*
При этом естественный уровень цен определяется по основному уравнению количественной теории денег :
p* = M v* / y*
Где y* равновесный уровень национального дохода, а v* средняя за длительный период скорость обращения денег.
Инфляция будет возрастать при увеличении ценового разрыва и убывать при его сокращении; можно считать, что инфляция в будущем периоде пропорциональна текущей величине ценового разрыва :
t = * + PG
Где просто коэффициент пропорциональности, a * параметр, описывающий равновесный рост цен.
15.Определение границ доверительного интервала прогноза зависимой переменной.
Доверительный интервал для отдельного (индивидуального) значения зависимой переменной строится с учетом рассеяния индивидуальных значений вокруг линии регрессии, т.е. с учетом ошибки регрессии: ,
где
15. Определение границ доверительного интервала прогноза зависимой переменной.
Ошибка предсказания равна
и хотелось бы уяснить, является ли она допустимой с точки зрения точности использованной нами модели. Другое дело, устроит эта точность заказчика лицо, принимающее решение. Но нам следует убедиться пока лишь в том, что эта ошибка укладывается в рамки статистической точности, гарантированной методом наименьших квадратов.
Эту формулу можно преобразовать к виду, более удобному для расчета среднеквадратичного отклонения прогноза . Из обеих частей формулы (2) извлечем квадратный корень:
Обозначим:
Тогда Оценим дисперсию ошибки прогноза исходя из полученных ранее оценок: n = 12, Xp = 3,38. , среднее значение Х, вычисленное с помощью функции СРЗНАЧ, равно 16,11,
16.Проверка гипотез относительно коэффициентов парной регрессии.
Эмпирического ур-ия регрессии строятся на основе конечной выборки, извлеч-й из генер сов-ти случ образом, поэтому как б показано коэф-ты ур-ия яв-ся случ вел-нами.
При проведении эк анализа перед иссл-лями оч часто возн-т необ-ть сравнить расчет коэф-ты bo и b1 с нек-ми теоретич коэф-ми βо и β1.
Это срав-ие осущ-ся по схеме проверки гипотез. Предпол-м, провер-ся гипотеза Но:, состоящая в том, что эти вел-ны совпадают.
Но:=b1=β1. Тогда с ней конкурир-ая гипотеза Н1: не совпадает. Как изв-но из тер.вера для проверки таких гипотез рассч-ся tстат-ка Стьюдента, кот-ая при справед-ти гипотезы но имеет распред-ие Стьюдента с числом степеней свободы с парной регр-ей
tb1= (b1-β1)/Sb1
ν=n-2 (n-m-1)
n объем выборки
m кол-во объясняющ перем-х
Гипоеза Но б отклонена, если расчет знач-ие по модулю, т.к. нам безрал-но в какую сто-ну произошло откл-ие, окаж-ся > или = вел-ной, найденной из табл Стьюдента.
α-ур-нь знач-ти.
Сч-ся, что в эк задачах α м принимать знач-я 0,05 или 0,01, т.е. мы поверяем гипотезу с вер-тью 95 или 99%.
α/2 берется в связи с тем, что откл-ие м.б. как отриц, так и положит.
При невып-ии этого усл-ия сч-ся, что нет осн-ий для откл-ия гипотезы Но. Однако вел-ны теорет коэф-в как правило неиз-ны, поэтому на начал этапе анализа рассм-ся задача о наличие зав-ти м/у фак-ми х и у. Эта проблема провер-ся на основе гипотезы Но:b1=0 связи нет. С ней конкур-т H1:b1≠0 связь присут-т.
В такой пост-ке гов-т, что провер-ся гипотеза о стат знач-ти коэф-та ур-ия регр-ии.
Если приход-ся принять гипотезу Но, то мы гов-м коэф-т незначим (слишком близок к 0) и соответ-ю объясняющ перем-ую скорее всего из ур-ия следует искл-ть. В против случае коэф-т стат-ки значим. Н указ-т на наличие опр-й лин зав-ти м/у фак-ми.
Тогда расч-ся стат-ка Стьюдента по соотн-ю и по таблицам Стьюдента находят соответ-но вел-ну .
Если она ≤ расчет вел-ны, то мы м сказать, что есть осн-ия отклонить гипотезу Но и принять Н1.
Коэф-т отличен от 0. Для парной регр-ии мы не б проверять стат знач-ть bo, т.к. он только гаран-т прохождение линии регр-ии ч/з ср точку выборки.
Сущ-т грубое правило, позвол-ее делать первонач выводы о поведении коэф-в ур-ия при отсут-ии таблиц Стьюдента.
По нему срав-ся вел-на ошибки Sb1, допущенной при нахождении коэф-та с вел-ной этого коэф-та.
А). Если станд ошибка > чем коэф-т, то 0<|tb1|≤1. В этом случае гов-т коэф-т незначим.
Б). Если ошибка не превосх-т половины вел-ны коэф-та, то 1<|tb1|≤2. Гов-т коэф-т слабозначим.
В). Если они соот-ся в диапозоне 2<|tb1|≤3, то коэф-т значим.
Г). Если ошибка <1/3 коэф-та, то 3<|tb1|, коэф-т сильно значим. Это гарантия наличия практ-ки лин зав-ти м/у изучаемыми фак-ми.
Безусл-но на tb1 сущест влияние оказ-т объем выборки n.
Чем >n, тем <погр-ть.
Но при n>10 выписанное грубое правило оценки раб-т практически всегда.
17.Автокорреляция случайного возмущения.
В классической регрессионной модели выполнение третьего условия Гаусса-Маркова (Соv(εt εS) = 0,при t ≠ s) гарантирует некоррелированность значений случайных членов в различные моменты наблюдений и это позволяет получить несмещенные МНК-оценки с минимальной дисперсией. Зависимость значений случайных членов в различные моменты времени называется автокорреляцией (сериальной корреляцией).
Формальной причиной автокорреляции в регрессионных моделях является нарушение третьего условия теоремы Гаусса-Маркова, действительной же причиной может быть: неправильная спецификация переменных (пропуск важной объясняющей переменной); использование ошибочной функциональной зависимости, а иногда и характер наблюдений (например, временные ряды).
Для проверки на автокорреляцию используется ряд критериев, из которых наиболее широкое применение получил критерий Дарбина-Уотсона:
Критерий DW связан с выборочным коэффициентом корреляции между еt и еt-1, соотношением: DW≈2(1-r),
Если автокорреляция отсутствует, то DW ≈ 2, при наличии положительной автокорреляции DW<2, если автокорреляция отрицательна, DW>2. И поскольку коэффициент корреляции принимает значения -1 ≤ r ≤ 1, то 0≤ DW ≤ 4. Полученное для данной регрессии значение статистики сравнивается с верхней и нижней границами ее критического значения dL ≤ dкрит ≤dU. Границы dU и dL выбираются из таблиц по числу наблюдений n, числу регрессоров k и уровню значимости α. При этом возможны следующие случаи:
Зоны неопределенности: dL<DW< dU или 4- dU <DW<4-dL.
18.Гетероскедастичность случайного возмущения.
Общий случай
Подобрать простое преобразование для того, чтобы добиться гомоскедастичности удается не всегда. В общем случае используют следующую процедуру
ü Расчитываются МНК-оценки коэффицентов регресии
ü Находят остатки еi и их квадраты
ü Находят логарифмы отстатков
ü Расчитывают регрессию
ü Плучают прогноз
ü Находят веса наблюдений wi
ü Полученные веса wi используют во взвешенном методе наименьших квадратов
Явление гетероскедастичности возникает, как правило, при анализе неоднородных объектов. Например, при построении зависимости прибыли фирмы от размера основного фонда (или каких-либо других факторов) гетероскедастичность вызвана тем, что у больших фирм колебания прибыли будут выше, чем у малых.
МНК при наличии гетероскедастичности позволяет получить несмещенные оценки параметров модели, но оценка дисперсии ошибки, и, следовательно, границы доверительных интервалов оценок параметров модели и прогноза зависимой переменной будут неверными, т.к. они вычисляются на основании предположения гомоскедастичности ошибок.
Для проверки на гетероскедастичность существует большое число тестов. Мы остановимся на тсте Голдфельда-Квандта.
Тест Голдфелъда-Квандта применяется в том случае, когда имеются предположения:
Алгоритм теста:
F = е1'е1 / е2'е2- в случае обратной пропорциональности
F = е2'е2 / е1'е1- в случае прямой пропорциональности.
Статистика F имеет распределение Фишера с (n'- k- 1) степенями свободы, где k- число объясняющих переменных в регрессионном уравнении. Если значение статистики превышает критически значение при определенном уровне значимости, то нулевая гипотеза Н0 об отсутствии гетероскедастичности отвергается.
19.Система нормальных уравнений и явный вид ее решения при оценивании методом наименьших квадратов линейной модели парной регрессии.
В результате оценивания эконометрической модели отыскиваются оценки неизвестных параметров. Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК).
Метод наименьших квадратов позволяет получить такие оценки параметров a и b, при которых сумма квадратов отклонений фактических значений результативного признака y от расчетных (теоретических) ŷx минимальна: (1)
Для того чтобы найти минимум функции (1), надо вычислить частные производные по каждому из параметров a и b и приравнять их к нулю. Тогда мы получаем следующую систему нормальных уравнений для оценки параметров a и b
Решая систему нормальных уравнений либо методом последовательного исключения переменных, либо методом определителей, найдем искомые оценки параметров a и b. Можно воспользоваться следующими формулами для a и b:
Эта формула получена из первого уравнения системы, если все его члены разделить на n:
где cov(x,y) ковариация признаков; σх2 дисперсия признака х
Поскольку , получим следующую формулу расчета оценки параметра b
Таким образом явный вид решения системы нормальных уравнений:
20.Система нормальных уравнений и явный вид ее решения при оценивании методом наименьших квадратов линейной модели множественной регрессии.
Множественная регрессия позволяет построить и проверить модель линейной связи между зависимой (эндогенной) и несколькими независимыми (экзогенными) переменными: y = f(x1,...,xр ), где у - зависимая переменная (результативный признак); х1,...,хр - независимые переменные (факторы).
Линейное уравнение множественной корреляции: y=a+b1x1+b2x2+…+bpxp+ε
Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Для линейных уравнений и нелинейных уравнений, приводимых к линейным, строится следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:
Для ее решения может быть применён метод определителей: a=∆a / ∆, b1=∆b1 / ∆,…, bp=∆bp / ∆,
- определитель системы
∆a, ∆b1,…, ∆bp частные определители; которые получаются путем замены соответствующего столбца матрицы определителя системы данными левой части системы.
21.Модель парной регрессии. Границы доверительных интервалов.
Парная регрессия представляет собой регрессию между двумя переменными х и у, т.е. модель вида: ŷ = f(x),
Где у зависимая переменная (результативный признак); х независимая, или объясняющая, переменная (признак-фактор).
Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем в целом по совокупности наблюдений. В уравнении регрессии корреляционная связь признаков представляется в виде функциональной связи, выраженной соответствующей математич функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых:
yj = ŷxj + εj
где yj фактическое зн-ие результативного признака;
ŷxj теоретическое зн-ие результативного признака, найденное исходя из ур-ия регрессии;
εj - случайная величина, характеризующая отклонения реального зн-ия результативного признака от теоретического, найденного по ур-ию регрессии.
Случайная величина ε (случайное возмущение) включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели порождено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.
Класс математических ф-ий для описания связи двух переменных достаточно широк. Основными явл-ся следующие:
22.Гетероскедастичность случайной компоненты. Тесты на наличие гетероскедастичности.
Явление гетероскедастичности возникает, как правило, при анализе неоднородных объектов. Например, при построении зависимости прибыли фирмы от размера основного фонда (или каких-либо других факторов) гетероскедастичность вызвана тем, что у больших фирм колебания прибыли будут выше, чем у малых.
МНК при наличии гетероскедастичности позволяет получить несмещенные оценки параметров модели, но оценка дисперсии ошибки, и, следовательно, границы доверительных интервалов оценок параметров модели и прогноза зависимой переменной будут неверными, т.к. они вычисляются на основании предположения гомоскедастичности ошибок.
Для проверки на гетероскедастичность существует большое число тестов. Мы остановимся на тсте Голдфельда-Квандта.
Тест Голдфелъда-Квандта применяется в том случае, когда имеются предположения:
Алгоритм теста:
F = е1'е1 / е2'е2- в случае обратной пропорциональности
F = е2'е2 / е1'е1- в случае прямой пропорциональности.
Статистика F имеет распределение Фишера с (n'- k- 1) степенями свободы, где k- число объясняющих переменных в регрессионном уравнении. Если значение статистики превышает критически значение при определенном уровне значимости, то нулевая гипотеза Н0 об отсутствии гетероскедастичности отвергается.
23. Автокорреляция случайной составляющей. Тесты на наличие автокорреляции
Корреляционная зависимость между текущими уровнями некоторой переменной и уровнями этой же переменной, сдвинутыми на несколько шагов, называется автокорреляцией.
Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.
Наличие (отсутствие) автокорреляции в отклонениях проверяют с помощью критерия ДарбинаУотсона. Численное значение коэффициента равно
где
у,- - yi
Значение dw статистики близко к величине 2(1 - г(1)), где выборочная автокорреляционная функция остатков первого порядка. Таким образом, значение статистики ДарбинаУотсона распределено в интервале 04. Соответственно идеальное значение статистики 2 (автокорреляция отсутствует). Меньшие значения критерия соответствуют положительной автокорреляции остатков, большие значения отрицательной. Статистика учитывает только автокорреляцию первого порядка. Оценки, получаемые по критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (rf5) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели. Значения этих границ для уровня значимости а - 0,05 даны в специальных таблицах (см. Приложение 2). При сравнении расчетного значения dw статистики с табличным могут возникнуть такие ситуации: d2 < dw < 2 ряд остатков не коррелирован; dw < d] остатки содержат автокорреляцию; dx < dw < d2 область неопределенности, когда кет оснований ни принять, ни отвергнуть гипотезу о существовании автокорреляции. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед сравнением с табличными значениями dw критерий следует преобразовать по формуле dw' = 4 - dw.
Установив наличие автокорреляции остатков, переходят к улучшению модели. Если же ситуация оказалась неопределенной (dl < dw< d2), то применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции
(4.10)
Для принятия решения о наличЛ* или отсутствии автокорреляции в исследуемом ряду фактическое значение коэффициента автокорреляции г(1) сопоставляется с табличным (критическим) значением для 5%-ного уровня значимости (вероятности допустить ошибку при принятии нулевой гипотезы о независимости уровней ряда). Если фактическое значение коэффициента автокорреляции меньше табличного, то гипотеза об отсутствии автокорреляции в ряду может быть принята, а если фактическое значение больше табличного делают вывод о наличии автокорреляции в ряду динамики.
Обнаружение гетероскедастичности. Для обнаружения гетеро-скедастичности обычно используют три теста, в которых делаются различные предположения о зависимости между дисперсией случайного члена и объясняющей переменной: тест ранговой корреляции Спирмена, тест ГолдфельдаКвандта и тест Глейзера.
При малом объеме выборки для оценки гетероскедастичности может использоваться метод ГолдфельдаКвандта.
Данный тест используется для проверки такого типа гетероскедастичности, когда дисперсия остатков возрастает пропорционально квадрату фактора. При этом делается предположение, что случайная составляющая распределена нормально.
Чтобы оценить нарушение гомоскедастичности по тесту ГолдфельдаКвандта, необходимо выполнить следующие шаги.
Упорядочение п наблюдений по мере возрастания перемен
ной х,
Разделение совокупности на две группы (соответственно с
малыми и большими значениями фактора х) и определение
по каждой из групп уравнений регрессии.
Определение остаточной суммы квадратов для первой регрессии
s\y = 2 {}'i ~Уи) и второй регрессии S2p = 2 [Уг -Уц) ■
4. Вычисление отношений S2pjSXp (или S^jS^}. В числителе
должна быть большая сумма квадратов.
Полученное отношение имеет F распределение со степенями свободы кх = «j т и к2 = n-nl-m (т число оцениваемых параметров в уравнении регрессии).
Если то гетероскедастичность имеет место.
Чем больше величина F превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.
24.Уточнение эконометрических моделей путем датирования переменных.
Главным инструментом эконометрического исследования является модель. Выделяют три основных класса эконометрических моделей:
Моделью временных рядов называется зависимость результативной переменной от переменной времени или переменных, относящихся к другим моментам времени.
К моделям временных рядов, характеризующих зависимость результативной переменной от времени, относятся:
а) модель зависимости результативной переменной от трендовой компоненты или модель тренда;
б) модель зависимости результативной переменной от сезонной компоненты или модель сезонности;
в) модель зависимости результативной переменной от трендовой и сезонной компонент или модель тренда и сезонности.
К моделям временных рядов, характеризующих зависимость результативной переменной от переменных, датированных другими моментами времени, относятся:
а) модели с распределённым лагом, объясняющие вариацию результативной переменной в зависимости от предыдущих значений факторных переменных;
б) модели авторегрессии, объясняющие вариацию результативной переменной в зависимости от предыдущих значений результативных переменных;
в) модели ожидания, объясняющие вариацию результативной переменной в зависимости от будущих значений факторных или результативных переменных.
Кроме рассмотренной классификации, модели временных рядов делятся на модели, построенные по стационарным и нестационарным временным рядам.
Стационарным временным рядом называется временной ряд, который характеризуется постоянными во времени средней, дисперсией и автокорреляцией, т. е. данный временной ряд не содержит трендовой и сезонной компонент.
Нестационарным временным рядом называется временной ряд, который содержит трендовую и сезонную компоненты.
Определение. Моделью регрессии с одним уравнением называется зависимость результативной переменной, обозначаемой как у, от факторных (независимых) переменных, обозначаемых как х1,х2,…,хn. Данную зависимость можно представить в виде функции регрессии или модели регрессии:
y=f(x,β)=f(х1,х2,…,хn, β1…βk)
где β1…βk параметры модели регрессии.
Можно выделить две основных классификации моделей регрессии::
а) классификация моделей регрессии на парные и множественные регрессии в зависимости от числа факторных переменных;
б) классификация моделей регрессии на линейные и нелинейные регрессии в зависимости от вида функции f(x,β).
В качестве примеров моделей регрессии с одним уравнением можно привести следующие модели:
а) производственная функция вида Q=f(L,K), выражающая зависимость объёма производства определённого товара (Q) от производственных факторов от затрат капитала (К) и затрат труда (L);
б) функция цены Р=f(Q,Pk), характеризующая зависимость цены определённого товара (Р) от объема поставки (Q) и от цен конкурирующих товаров (Pk);
в) функция спроса Qd=f(P,Pk,I), характеризующая зависимость величины спроса на определённый товар (Р) от цены данного товара (Р), от цен товаров-конкурентов (Pk) и от реальных доходов потребителей (I).
Системой одновременных уравнений называется модель, которая описывается системами взаимозависимых регрессионных уравнений.
Системы одновременных уравнений могут включать в себя тождества и регрессионные уравнения, в каждое из которых могут входить не только факторные переменные, но и результативные переменные из других уравнений системы.
Регрессионные уравнения, входящие в систему одновременных уравнений, называютсяповеденческими уравнениями. В поведенческих уравнениях значения параметров являются неизвестными и подлежат оцениванию.
Основное отличие тождеств от регрессионных уравнений заключается в том, что их вид и значения параметров известны заранее.
Примером системы одновременных уравнений является модель спроса и предложения, в которую входит три уравнения:
а) уравнение предложения: =а0+а1*Рt+a2*Pt-1;
б) уравнение спроса: =b0+b1* Рt+b2*It;
в) тождество равновесия: QSt = Qdt,
где QSt предложение товара в момент времени t;
Qdt спрос на товар в момент времени t;
Рt цена товара в момент времени t;
Pt-1 цена товара в предшествующий момент времени (t-1);
It доход потребителей в момент времени.
В модели спроса и предложения выражаются две результативные переменные:
а) Qt объём спроса, равный объёму предложения в момент времени t;
б) Pt цена товара в момент времени t.
25.Эконометрические модели прогнозирования инфляции.
На практике для краткосрочного прогнозирования инфляции используют модели, полностью основанные на статистических данных. При эконометрическом моделировании инфляции, как правило, учитываются следующие факторы :Темп инфляции за несколько предыдущих периодов;Темп роста денежной массы за эти же периоды;Темп роста национального дохода.Дополнительно могут быть включены в модель факторы, провоцирующие инфляцию, такие, как 1) темп роста заработной платы; 2) процентная ставка по кредитам. Всем факторам в эконометрической модели приписываются некоторые веса, которые определяются методами регрессионного анализа статистических данных за достаточно длинный период наблюдений. Веса факторов в эконометрических моделях не остаются неизменными; они постоянно меняются из-за влияния различных факторов. В качестве эконометрической модели инфляции мы более подробно рассмотрим простую модель инфляции на основании ценового разрыва. Ценовой разрыв относительная разность между текущим уровнем цен и их естественным уровнем, т.е. :
PG = ( p p* ) : p*
При этом естественный уровень цен определяется по основному уравнению количественной теории денег :
p* = M v* / y*
Где y* равновесный уровень национального дохода, а v* средняя за длительный период скорость обращения денег.
Инфляция будет возрастать при увеличении ценового разрыва и убывать при его сокращении; можно считать, что инфляция в будущем периоде пропорциональна текущей величине ценового разрыва :
t = * + PG
Где просто коэффициент пропорциональности, a * параметр, описывающий равновесный рост цен.
26.Спецификация и преобразование к приведенной форме динамических моделей. Лаговые и предопределенные переменные динамической модели.
Невозможно построить модель вида Y=f(x), с помощью которой можно однозначно определить связь между расходами и доходами домашних хозяйств
Зависимость между доходами и расходами домашних хозяйств носит случайный характер
Рассмотренные нами модели записаны при молчаливом допущении, что они остаются неизменными во времени. Из теории известно, что все переменные объекта изменяются со временем. Этот факт должен быть отражен в моделях. Для этого каждой переменной, которая изменяется со временем добавляется индекс “t”.
Например, Ydt означает, что переменная уровень спроса относится к текущему моменту времени.
С учетом сказанного модель (1.4) конкурентного рынка должна иметь вид: рис 2.1
Дополнительно необходимо учесть, что
Например, производитель не может мгновенно реорганизовать производство, чтобы увеличить или уменьшить выпуск продукции в соответствии с изменившимся спросом и он не знает какой будет равновесная цена
Для учета этого факта в моделях применяются переменные, отнесенные к прошлому периоду времени, значения которых в текущий момент уже известны
С учетом сказанного, модель (2.1) следует записать в виде: рис 2.2.
В модели (2.2) переменная pt-1 значение цены на продукцию в предыдущий период времени
Замечание. Модель (2.2) получила название « паутинная модель конкурентного рынка».
Определение. Переменные модели, отнесенные к предыдущим моментам времени, называются «лаговыми»
Определение. Все лаговые переменные (эндогенные и экзогенные) и текущие экзогенные переменные составляют группу «предопределенных» переменных
Уточнение. В приведенной форме модели каждая текущая эндогенная переменная должна быть выражена через предопределенные переменные
Определение. Экономические модели, значения переменных которых привязаны к моменту времени, называются динамическими
Определение. Переменные, связанные с моментом времени, называются датированными
Необходимость соотнесения переменных модели к моменту времени является третьим принципом спецификации модели
В модели (2.2) второе уравнение получило приведенную форму на этапе спецификации. Для полного преобразование модели (2.2) к приведенной форме достаточно найти выражения для pt и Ydt:
Рис 2.3.
27.Парная регрессия. Оценивание параметров методом наименьших квадратов.
Метод наименьших квадратов. Вывод формул метода наименьших квадратов для парного случая. Суть метода, графическое представление, условия применения
Метод наименьших квадратов метод нахождения оптимальных параметров линейной регрессии, таких, что сумма квадратов ошибок (регрессионных остатков) минимальна.
Метод заключается в минимизации евклидова расстояния между двумя векторами -- вектором восстановленных значений зависимой переменной и вектором фактических значений зависимой переменной.
Применение. Задача метода наименьших квадратов состоит в выборе вектора , минимизирующего ошибку .
Метод наименьших квадратов имеет следующие преимущества:
- не требуется знания закона распределения случайного возмущения
- дает оценки по крайней мере состоятельные
- в случае нормального распределения случайного возмущения оценки параметров линейной модели несмещенные и эффективные
Formula:
28.Тест Голдфелда Квандта гомоскедастичности случайных возмущений в схеме Гаусса Маркова.
Теорема ГауссаМаркова
оценки по обычному методу наименьших квадратов являются не только несмещенными оценками коэффициентов регрессии, но и наиболее эффективными в том случае, если выполнены условия ГауссаМаркова. С другой стороны, если условия ГауссаМаркова не выполнены, то, вообще говоря, можно найти оценки, которые будут более эффективными по сравнению с оценками, полученными обычным методом наименьших квадратов. В данной работе не приводится общее рассмотрение этих вопросов. Тем не менее в том случае, если условия ГауссаМаркова для остаточного члена выполнены, коэффициенты регрессии, построенной обычным методом наименьших квадратов, будут наилучшими линейными несмещенными оценками (best linear unbiased estimators, или BLUE): несмещенными, как уже было показано; линейными, так как они являются линейными функциями значений у; наилучшими, так как они являются наиболее эффективными в классе всех несмещенных линейных оценок. Теорема ГауссаМаркова доказывает это (краткое изложение, не использующее матричной алгебры, дано в работе Дж. Томаса
29.Дисперсионный анализ в парной регрессии
Линейная парная регрессионная модель используется для описания взаимосвязи двух переменных Y и X, если имеется предположения, что между ними существует линейная стохастическая зависимость: y=a+bx+ε,
где а и b параметры модели (постоянные неизвестные коэффициенты); Х- независимая переменная; Y зависимая переменная; ε - случайная переменная (возмущение, ошибка), возникающая из-за влияния различных неучтенных факторов.
Уравнение для отдельных наблюдений зависимой переменной Y записывается в виде: yt=a+bxt+εt
где Хt Yt, - набор данных (наблюдений), t = 1, 2,..., n;
Xt экзогенная переменная модели); εt - случайная ошибка в наблюдении t.
Если отклонение зависимой переменной Yt, от ее выборочного среднего значения представить в виде суммы двух отклонений:
и выборочную дисперсию var(Y) можно представить в виде двух частей:
Часто это уравнение записывают так:
TSS = ESS + RSS,
где TSS = var(Y) полная дисперсия (общая сумма квадратов отклонений зависимой переменной от ее выборочного значения);
ESS = Σ(Yt-Ŷt)2 часть дисперсии, необъясненная регрессией (т.к. она содержит ошибки регрессии εt);
- часть дисперсии, объясненная регрессией (объясненная сумма квадратов отклонений).
Качество подгонки регрессионной модели к наблюденным значениям Yt оценивается при помощи статистики R2 (коэффициента детерминации).
Коэффициент детерминации определяется по формуле
R2 = 1-ESS / TSS = RSS / TSS; 0≤R2≤1
Часто это уравнение записывают так:
TSS = ESS + RSS,
где TSS = var(Y) полная дисперсия (общая сумма квадратов отклонений зависимой переменной от ее выборочного значения);
ESS = Σ(Yt-Ŷt)2 часть дисперсии, необъясненная регрессией (т.к. она содержит ошибки регрессии εt);
- часть дисперсии, объясненная регрессией (объясненная сумма квадратов отклонений).
Качество подгонки регрессионной модели к наблюденным значениям Yt оценивается при помощи статистики R2 (коэффициента детерминации).
Коэффициент детерминации определяется по формуле
R2 = 1-ESS / TSS = RSS / TSS; 0≤R2≤1
Чем ближе значение коэффициента детерминации к 1, тем лучше качество подгонки и прогноз Ŷ более точно аппроксимирует Y.
Для проверки значимости коэффициента детерминации используется F-статистика:
где k - число независимых переменных.
Связь между статистиками F и R2 для случая парной регрессии (k = 1) имеет вид
30.Понятие статистической процедуры оценивания параметров эконометрической модели. Требования к наилучшей статистической процедуре: несмещенность и минимальные дисперсии оценок параметров.
Оценкой ân параметра a называют всякую функцию результатов наблюдений над случайной величиной X (иначе статистику), с помощью которой судят о значениях параметра a.
Статистические проверки параметров регрессии основаны на непроверяемых предпосылках распределения случайной величины. Они носят лишь предварительный характер. После построения уравнения регрессии проводится проверка наличия у оценок тех свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критериям: быть несмещенными, состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важное практическое значение в использовании результатов регрессии и корреляции.
В отличие от параметра, его оценка ã n величина случайная. «Наилучшая оценка» ã n должна обладать наименьшим рассеянием относительно оцениваемого параметра a, например, наименьшей величиной математического ожидания квадрата отклонения оценки от оцениваемого параметра М(ã - a)2.
Оценка â n параметра a называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т. е. М(ã) = a.
В противном случае оценка называется смещенной.
Если это равенство не выполняется, то оценка ã , полученная по разным выборкам, будет в среднем либо завышать значение a (если М(ã) > a , либо занижать его (если М(ã) < 0). Таким образом, требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.
Оценка â n параметра a называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру:
В случае использования состоятельных оценок оправдывается увеличение объема выборки, так как при этом становятся маловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки.
Несмещенная оценка ã n параметра a называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра a, вычисленных по выборкам одного и того же объема n.
Так как для несмещенной оценки M(ã n - a)2 есть ее дисперсия , то эффективность является решающим свойством, определяющим качество оценки.
Для нахождения оценок параметров (характеристик) генеральной совокупности используется ряд методов.
Указанные критерии оценок (несмещенность, состоятельность, эффективность) обязательно учитываются при разных способах оценивания.
Дополнительное:
Обобщенный метод наименьших квадратов, теорема Айткена
Применение обычного метода наименьших квадратов при нарушении условия гомоскедастичности приводит к следующим отрицательным последствиям:
1. оценки неизвестных коэффициентов β неэффективны, то есть существуют другие оценки, которые являются несмещенными и имеют меньшую дисперсию.
2. стандартные ошибки коэффициентов регрессии будут занижены, а, следовательно, t -статистики завышены, и будет получено неправильное представление о точности уравнения регрессии.
Обобщенный метод наименьших квадратов
Рассмотрим метод оценивания при нарушении условия гомоскедастичности, матрица имеет вид β= (ХТ Ω-1 Х)-1 ХТ Ω-1у
Расчёт неизвестных коэффициентов регрессии по данной формуле называют обобщённым методом наименьших квадратов (ОМНК).
Теорема Айткена: при нарушении предположения гомоскедастичности оценки, полученные обобщенным методом наименьших квадратов, являются несмещенными и наиболее эффективными (имеющими наименьшую вариацию). На практике матрица Ω практически никогда не известна. Поэтому часто пытаются каким-либо методом оценить оценки матрицы Ω и использовать их для оценивания. Этот метод носит название доступного обобщенного метода наименьших квадратов.