Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
2. Закономерность распределения. Базовые характеристики распределения.
Ряд распределения распределение единиц совокупности по значениям того или иного признака в конкретны условиях места и времени.
вариационный (строится на основе количественного признака)
атрибутивный (строится на основе атрибутивного признака).
Для целей анализа и сравнительной характеристики различных рядов распределения применяются обобщающие показатели вариационного ряда. В зависимости от характеризуемых особенностей распределения обобщающие показатели можно разбить на три группы:
1. показатели центра и структуры распределения;
2. показатели степени вариации;
3. показатели формы распределения.
Показатели центра и структуры распределения
Показателем, который характеризует совокупность в целом, отражает типический уровень признака в данной совокупности, является средняя арифметическая величина.
По исходным данным средняя величина рассчитывается по средней арифметической простой; если по вариационному ряду по средней арифметической взвешенной. Если среднее рассчитывается по интервальному ряду, в качестве индивидуальных значений признака используются середины интервала.
Мода (M0) наиболее часто встречающееся значение признаков совокупности.
Сначала находится модальный интервал (интервал, которому соответствует максимальная частота).
Медиана (Ме) значение признака у единицы, делящей ранжированный ряд пополам.
При определении медианы по ранжированному ряду без группировки
Если медиана рассчитывается по интервальному вариационному ряду, то сначала находят медианный интервал, а затем по формуле рассчитывается значение медианы.
Медианный интервал это первый интервал, в который попадает 50% совокупности.. Медиана как значение показателя у единицы, делящей ранжированный ряд пополам, одновременно является характеристикой структуры распределения.
Для более детальной характеристики структуры совокупности, используются такие показатели, как квартили, делящие ранжированный ряд на 4 равные части, децили на 10 равных частей, перцентили ни 100, и другие.
Перечисленные показатели рассчитываются аналогично расчету медианы. То есть для расчета первого или нижнего квартиля сначала находят квартильный интервал, а затем значение первого квартиля.
Межквартильное расстояние Q3 - Q1 характеризует размах вариации в центре распределения. На этом интервале находится 50% единиц изучаемой совокупности.
Показатели вариации
Вариация это различия в индивидуальных значениях признака у единиц совокупности. От степени вариации признаков совокупности зависит типичность показателей центра распределения. Чем меньше вариация, тем в большей степени средняя выполняет роль характеристики типического уровня признака.
Для оценки вариации существуют абсолютные и относительные показатели вариации.
Абсолютные показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.
Характеризует на какую величину различаются между собой крайние значения изучаемого распределения
3. дисперсии яσ2 =
Показатель дисперсии в экономических исследованиях содержательно не интерпретируется, но благодаря своим свойствам широко используется в расчете многих статистических характеристик.
4. среднее квадратическое (стандартное) отклонение
σ =
Характеризует на сколько в среднем отклоняются индивидуальные значения признака от типического уровня признака по совокупности.
Относительные показатели вариации рассчитываются на основе абсолютных показателей вариации путем сопоставления их со средней величиной показателя.
коэффициент осцилляции
- коэффициент вариации
Характеризует относительную меру изменчивости. По его величине делается вывод об однородности или неоднородности изучаемой совокупности.
Если V ≤ 33 % , то совокупность признается однородной.
Характеристика формы распределения
Как распределены единицы совокупности относительно центра.
К показателям формы распределения относятся:
- показатель асимметрии
- показатель эксцесса
- коэффициент асимметрии
На основе этого показателя определяется вид асимметрии.
Если > M0 (Me), то в распределении присутствует положительная правосторонняя асимметрия. < M0 (Me)- отрицательная левосторонняя асимметрия. Чем меньше значение признака, тем реже оно встречается в изучаемой совокупности.
Показатель асимметрии Пирсона в большей степени оценивает асимметрию в центре распределения. Чтобы учесть асимметрию на концах распределения, используется показатель асимметрии, рассчитанный на основе центрального момента третьего порядка.
Чтобы оценить статистическую значимость коэффициента асимметрии, то есть понять под влиянием каких факторов (случайных или не случайных) сформировано значение показателя. Рассчитывают стандартизованный коэффициент асимметрии.- tAs ≥ 3 - асимметрия признается существенной, то есть сформированной под влиянием неслучайных факторов, и величина коэффициента асимметрии является статистически значимой.
Коэффициент эксцесса.
Характеризует выпад вершины эмпирического распределения вверх или вниз относительно кривой нормального распределения.
Присутствие положительного эксцесса в изучаемом распределении означает, что в совокупности есть сформировавшееся ядро, то есть у большинства единиц совокупности близки значения изучаемой совокупности.
Для оценки существенности эксцесса рассчитывается также стандартизованный эксцесс (куртозис):
Если tEx ≥ 3, то эксцесс признается существенным, то есть сформированным под влиянием неслучайных факторов.
Если tEx < 3 , то эксцесс несуществененный, то есть сформированный под влиянием случайных факторов.
5.Оценка параметров генеральной совокупности (среднего и доли) по выборке.
Основные параметры генеральной и выборочной совокупностей
Распределение случайной величины в генеральной совокупности носит теоретический, идеальный характер, а ее выборочный аналог является эмпирическим распределением.
Для выборки функцию распределения определить трудно, а иногда невозможно, поэтому параметры оценивают по эмпирическим данным, а затем их подставляют в аналитическое выражение, описывающее теоретическое распределение.
6.Проверка статистических гипотез о значении средней величины, о форме распределения.
Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки.
Примером статистических гипотез является предположение: генеральная совокупность распределена по экспоненциальному закону - предположение о виде закона распределения.
Проверка гипотезы основывается на вычислении некоторой случайной величины критерия, точное или приближенное распределение которого известно. Процедура проверки гипотезы предписывает каждому значению критерия одно из двух решений принять или отвергнуть гипотезу.
В зависимости от сущности проверяемой гипотезы и используемых мер расхождения оценки характеристики от ее теоретического значения применяют различные критерии.
При проверке гипотез широкое применение находит ряд теоретических законов распределения. Наиболее важным из них является нормальное распределение. С ним связаны распределения хи-квадрат, Стьюдента, Фишера. Для указанных законов функции распределения аналитически не представимы. Значения функций определяются по таблицам или с использованием стандартных процедур пакетов прикладных программ.
На практике с целью оценки степени соответствия теоретического и фактического распределения рассчитываются специальные критерии, получившие название критериев согласия. Наиболее используемыми являются критерий Пирсона χ2 и критерий Колмогорова λ.
Критерий Пирсона χ2
, где
fэ и fт - соответственно частоты эмпирического и теоретического распределений
Теоретическая частота рассчитывается по формуле соответствующего теоретического распределения с учетом параметров фактического распределения.
При выравнивании по нормальному распределению рассчитывается
- нормированное отклонение;
h величина группировочного интервала.
Критерий χ2 табулирован, то есть составлены таблицы, содержащие критическое значение критерия, превышение которого будет означать, что отклонение эмпирических частот от теоретических не случайны, следовательно, фактическое распределение не соответствует теоретическому распределению, с которым производится сравнение. Следовательно, если:
χ2ф ≤ χ2т, то изучаемое (фактическое) распределение соответствует теоретическому распределению.
Критерий Колмогорова-Смирнова
D - максимальная разность между эмпирической и теоретической частотами.
Критерий табулирован. Оценка по критерию проводится аналогично оценке по χ2.
7.Кросс-секционные данные. Условия применения регрессионного анализа и прогнозирования.
Кросс-секционные - это данные, собранные в фиксированный момент времени и характеризующие множество единиц однокачественной совокупности.
Условия применения регрессионного анализа:
При построении уравнения множественной регрессии возникает проблема отбора факторов, она связна с ограничением объема изучаемой совокупности и наличием мультиколлиниарности.
Коллинеарно связанными факторами называются факторы, между которыми существует тесная линейная зависимость, то есть коэффициент корреляции (0.8 для малых выборок).
Отбор факторов в уравнении множественной регрессии, как правило, осуществляется на основе матрицы парных коэффициентов корреляции.
Так как парный коэффициент корреляции показатель симметричный, то матрица тоже симметрична относительно единичной диагонали, поэтому достаточно заполнить только первую часть матрицы.
Матрица парных коэффициентов корреляции.
y |
X1 |
X2 |
X3 |
……….. |
Xn |
|
y |
1 |
|||||
X1 |
1 |
|||||
X2 |
1 |
|||||
X3 |
1 |
|||||
…. |
1 |
|||||
Xn |
1 |
Верхняя строчка матрицы содержит парные коэффициенты, характеризующие степень тесноты связи между признаком-результатом и каждым из признаков-факторов. Остальное поле занимают коэффициенты, характеризующие степень тесноты связи между признаками-факторами. По значению этих коэффициентов делается вывод о наличии или отсутствии мультиколлинеарности.
Для отбора факторов, прежде всего, рассматриваются значения коэффициентов верхней строки. Если величина коэффициента корреляции ≤ 0.3, связь практически отсутствует, данный фактор не имеет смысла включать в уравнение.
Если , то факторы коллинеальны, между ними существует тесная линейная зависимость и один их факторов должен быть исключен из уравнения. Исключается то фактор, связь которого с признакомрезультатом менее тесная.
8.Практическое значение и интерпретация коэффициентов эластичности и В-коэффициентов.
Коэффициенты множественной регрессии позволяют перейти к сравнительному анализу силы влияния отдельных факторов на результат. Но поскольку факторы могут иметь разные единицы измерения, это затрудняет содержательную интерпретацию. Поэтому для сравнительного анализа от значений коэффициентов регрессии переходят к показателям: коэф. эластичности и бета-коэф.
Эти показатели переводят коэффициенты регрессии в относительные величины.
, где
bi коэффициент регрессии при факторе i.
среднее значение данного фактора
- среднее значение признака-результата.
Коэффициенты эластичности показывают, на сколько процентов от своего среднего изменится признак-результат при изменении признака фактора на 1 % своей средней величины.
, где
bi коэффициент регрессии при факторе i.
- среднее квадратическое отклонение признака-фактора.
- среднее квадратическое отклонение признака-результата.
-коэффициенты показывают, на какую величину среднего квадратического отклонения изменится признак-результат при изменении признака-фактора 1 σ.
9.Интерпретация параметров регрессионной модели. Оценка статистической значимости параметров и уравнения в целом.
Простейший вид уравнения регрессии:
а и а1 параметры уравнения регрессии.
Параметр а1 в уравнении регрессии называется коэффициентом регрессии и характеризует на сколько единиц своего измерения изменится признак-результат при изменении признака-фактора на единицу своего измерения. Знак при коэффициенте регрессии характеризует направленность зависимости (прямая или обратная). Параметр а в уравнении регрессии содержательно не интерпретируется, а характеризует лишь расположение линии на графике.
Оценка статистической значимости уравнения регрессии и его параметров
При построении уравнения регрессии не стоит ожидать получения точного соотношения между признаком-результатом и признаком-фактором.
Поэтому уравнение регрессии надо дополнить величиной ошибки, которая является случайной величиной.
Рассчитав значение параметров уравнения и подставив фактические данные признака фактора, мы получаем теоретическое (выровненное) значение признака-результата.
Оценка статистической значимости уравнения регрессии
Оценка статистической значимости уравнения регрессии осуществляется с использованием F-критерия Фишера, который представляет собой отношение факторной и остаточных дисперсий, рассчитанных на одну степень свободы.
Факторная дисперсия объясненная дисперсия признака-результата, то есть обусловленная теми факторами, которые включены в анализ.
σфакт =
Остаточная дисперсия необъясненная дисперсия, то есть, обусловлена прочими факторами, не включенными в анализ.
σост =
Сумма факторной и остаточной дисперсий - это общая дисперсия.
F-критерия Фишера рассчитывается по следующей формуле:
F-критерий Фишера критическая величина соотношения между факторной и остаточной дисперсиями, которая позволяет сказать: объясняют ли включенные в анализ факторы статистическую значимую часть вариации признака-результата. F-критерий Фишера табулирован (входом в таблицу является число степеней свободы факторной и остаточной дисперсий). Если фактическое значение F-критерия Фишера больше либо равен табличному, то уравнение регрессии признается статистически значимым и, соответственно, статистически значимы коэффициенты корреляции и детерминации.
Оценка статистической значимости параметров уравнения
Оценка статистической значимости параметров уравнения осуществляется на основе t-статистики Стьюдента, которая рассчитывается как отношение параметров уравнения регрессии по модулю к их стандартной ошибке.
, где
, где
В любой статистической программе расчет параметров всегда сопровождается расчетом значений их стандартных (среднеквадратических) ошибок и t-статистикой.
t-статистика табулирована. Параметр признаются статистически значимым, если фактическое значение t-статистики больше либо равно табличному.
Оценка параметров на основе t-статистики по существу является проверкой нулевой гипотезы о равенстве параметров нулю (H0: a=0; H0: b=0;), то есть о незначимости параметров уравнения регрессии.
- уровень значимости принятия нулевых гипотез = 1-0,95=0,05.
Если уровень значимости 0,05 или выше, то нулевая гипотеза принимается и параметр признается статистически незначимым, если ниже, то отвергается, тогда принимается альтернативная гипотеза о статистической значимости параметров.
10. Практическое значение, методика расчета, интерпретация средних показателей временных рядов.
Средние показатели рядов динамики
Средние обобщающие характеристики динамического ряда и скорости и интенсивности изменения уровней ряда.
Средний уровень ряда
Для интервальных динамических рядов средний уровень ряда рассчитываются на основе средней арифметической простой:
, где n число уровней ряда.
Для моментных рядов средний уровень ряда рассчитывается на основе средней хронологической:
Рассчитывается на основе цепных абсолютных приростов и характеризует на сколько в среднем в единицу времени изменялись уровни изучаемого ряда.
Рассчитывается по средней геометрической
На сколько процентов в среднем в единицу времени изменялись уровни изучаемого временного ряда.
При комментарии полученных значений средних показателей обязательно следует указывать на период времени, который описывается динамическим рядом, а также на период времени, к которому относится уровень изучаемого ряда.
11.Факторы, определяющие выбор метода прогнозирования
Первый шаг к выбору модели:
Стационарный ряд - это ряд, в котором отсутствует тенденция, т.е. основные характеристики (среднее значение уровня и дисперсия) остаются неизменными во времени.
Условия появления стационарных рядов:
(объем продаж товара или услуг на стадии насыщения их жизненного цикла или при постоянном уровне усилий, направленных на стимулирование сбыта; число поломок на линии сборки при постоянной ее производительности и т.п.).
Признак стационарности: довольно быстрое убывание до нуля значений коэффициентов автокорреляции или отсутствие вообще статистически значимых коэффициентов автокорреляции.
Методы прогнозирования стационарных рядов:
наивные методы;
Методы прогнозирования рядов, имеющих тренд: