Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

Подписываем
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Предоплата всего
Подписываем
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ВОЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ВОЕННОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
КАФЕДРА ЭКОНОМИКИ СТРОИТЕЛЬСТВА
УТВЕРЖДАЮ
ЗАВ. КАФЕДРОЙ
профессор Новикова Н.Н.
(воинское звание, подпись, фамилия)
«______»__________________2013 г.
Учебная дисциплина: СТАТИСТИКА
Специальность: 080502 «Экономика и управление на предприятии строительства»
Специализация: «Организация производства»
ЛЕКЦИЯ № 4
ТЕМА: «Показатели вариации»
АВТОР:
ВРЕМЯ: _2_ часа.
Обсуждено на заседании
ПМК №___ Протокол №___
«___»____________2013 г.
БАЛАШИХА 2013
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
Учебные вопросы:
Вариация признака в совокупности и значение её изучения
1.1. Понятие вариации и вариационного ряда
1.2. Графическое изображение вариационного ряда
Показатели вариации
2.1. Показатели центра распределения и структурные характеристики вариационного ряда
2.2. Показатели размера и интенсивности вариации
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА:
Основная литература:
Дополнительная литература:
Наглядные пособия и ТСО: Ноутбук, мультимедийный проектор.
Задание на самоподготовку:
Подготовить доклады и сообщения в соответствии с заданием к семинарскому занятию; разобрать проблемные вопросы, поставленные на лекции и указанные в задании к семинарскому занятию._____________________________________________
Ст. преподаватель кафедры экономики строительства Белю Л.П.
«____»_________ 2013 г.
ТЕМА: «Показатели вариации»
Введение
На прошлой лекции мы с вами разобрали абсолютные, относительные и средние величины.
Средняя величина дает общую характеристику всей совокупности изучаемого явления. Однако два ряда распределения, имеющие одинаковую среднюю арифметическую величину, могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака. Таким образом, информации о средних уровнях исследуемых показателей обычно бывает недостаточно для глубокого анализа изучаемого процесса или явления и необходимо также учитывать и вариацию значений отдельных единиц относительно средней, которая является важной характеристикой изучаемой совокупности. Значительной вариации, например, подвержены курсы акций, объемы спроса и предложения, процентные ставки и разные периоды.
Сегодня на лекции мы должны с вами уяснить понятие о вариации и значение её изучения, а также рассмотреть основные показатели вариации.
1.1. Понятие вариации и вариационного ряда
Вариацией называется различие значений признака у отдельных единиц изучаемой совокупности в один и тот же период или момент времени.
Статистический анализ вариации предполагает выполнение следующих основных этапов:
1. Построение вариационного ряда.
2. Графическое изображение вариационного ряда.
З. Расчет показателей центра распределения и структурных характеристик вариационного ряда.
4. Расчет показателей размера и интенсивности вариации.
5. Оценка вариационного ряда на асимметрию и эксцесс.
Построение вариационного ряда (ряда распределения) - это упорядоченное распределение единиц совокупности по возрастающим или убывающим значениям признака и подсчет числа единиц с тем или иным его значением.
Предположим, в результате обобщения итогов выборочного бюджетного обследования населения города N-ска построен вариационный ряд, отражающий распределение жителей города по величине среднедушевого дохода (табл. 1. гр. 1- З).
Таблица 1.
Обобщение итогов выборочного бюджетного обследования населения города N-ска
Среднедушевой доход в среднем за месяц, тыс.руб. |
Число жителей |
Накопленные частоты (S) |
Середина интервала (х) |
xf |
хω |
|
xел. (f) |
в % к итогу (ω) |
|||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
До 0,5 |
26 |
0,9 |
0,9 |
0,25 |
6,5 |
0,225 |
0,5 1,0 |
463 |
16,5 |
17,4 |
0,75 |
347,25 |
12,375 |
1,0 1,5 |
690 |
24,6 |
42,0 |
1,25 |
862,5 |
30,75 |
1,5 2,0 |
528 |
18,8 |
60,8 |
1,75 |
924,0 |
32,9 |
2,0 2,5 |
434 |
15,4 |
76,2 |
2,25 |
976,5 |
34,65 |
2,5 3,0 |
350 |
12,5 |
88,7 |
2,75 |
962,5 |
34,375 |
3,0 и более |
318 |
11,3 |
100,0 |
3,25 |
1033,5 |
36,725 |
Итого |
2809 |
100 |
- |
- |
5112,75 |
2,0 |
В составе любого вариационного ряда можно выделить три составных элемента: варианты, частоты, частости.
Варианты это значения, которые принимает исследуемый признак. Если варианты представлены в виде целочисленных величин, вариационный ряд называют дискретным, если в виде интервалов - интервальным. В табл. 1 представлен интервальный вариационный ряд, вариантами которого являются значения среднедушевого денежного дохода населения (гр. 1).
Частоты вариационного ряда это абсолютная численность отдельных групп с различными значениями признака (гр.2).
Частости вариационного ряда удельные веса (доли) отдельных групп в общей численности совокупности (гр.3)
1.2. Графическое изображение вариационного ряда
Графическое изображение вариационных рядов облегчает их анализ и позволяет судить о форме распределения. Для графического изображения вариационного ряда в статистике строят гистограмму, полигон и кумуляту распределения.
Гистограмма - столбиковая диаграмма, для построения которой на оси абсцисс откладывают отрезки, равные величине интервалов вариационного ряда. На отрезках строят прямоугольники, высота которых в принятом масштабе по оси ординат соответствует частотам (или частостям) (рис. 1).
Рис.1.Гистограмма распределения населения по величине среднедушевого дохода
Для графического изображения дискретного вариационного ряда применяют полигон распределения, для построения которого необходимо соединить прямыми отрезками точки с координатами х, ω (рис. 2). Крайние точки полученного графика соединяют с точками по оси абсцисс, отстающими на одно деление в принятом масштабе от минимального и максимального значения вариант. Полигон может быть построен и для интервального вариационного ряда, для этого в качестве координат по оси абсцисс используют середины интервалов. Очевидно, что гистограмма легко может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить отрезками прямых, при этом середины верхних сторон двух крайних прямоугольников соединить с осью абсцисс в точках, отстоящих в принятом масштабе на величину интервалов от середины первого и последнего интервалов.
Рис.2. Полигон распределения населения по величине среднедушевого дохода
Кумулята распределения строится по накопленным частотам (частостям). Накопленные частоты (частости) определяют последовательным суммированием частот (частостей), они показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое значение (гр. 4, табл. 1).
Рис.3.Кумулята распределения населения по величине среднедушевого дохода
При построении кумуляты интервального ряда (рис. 3) нижней границе первого интервала соответствует нулевая частота (частость), верхней - вся частота (частость) первого интервала. Верхней границе второго интервала сумма частот (частостей) первого и второго интервалов и т. д. Верхней границе последнего интервала - сумма накопленных частот (частостей) во всех интервалах, что соответствует общей численности изучаемой совокупности или 100%.
Вывод по 1-му вопросу:
При изучении социально-экономических явлений и процессов статистика встречается с разнообразной вариацией признаков, характеризующих отдельные единицы совокупности. Величины признаков колеблются под воздействием различных причин. Возможно как табличное, так и графическое представление вариационного ряда.
2. Показатели вариации
2.1. Показатели центра распределения и структурные характеристики вариационного ряда
Для характеристики среднего значения признака в вариационном ряду используются так называемые показатели центра распределения. К ним относятся средняя величина признака, мода и медиана.
Расчет средней величины признака () в вариационном ряду осуществляется по формуле средней арифметической взвешенной:
, (1)
где x варианты признака; f частоты (частости)
При расчете средней величины интервального ряда в качестве вариантов признака используются значения середины интервалов (гр. 5, табл. 1). Для нахождения середины открытых интервалов (в нашем примере это первая и последняя группы) необходимо их предварительно условно закрыть, т. е. определить недостающую верхнюю и нижнюю границы. Принято считать, что в первой группе величина интервала равна интервалу второй группы, а в последней - интервалу предыдущей. В рассматриваемом примере используется ряд с равными интервалами, величина которых 0.5 тыс. руб. Тогда условная нижняя граница первого интервала будет равна: 0.5 тыс. руб. - 0,5 тыс. руб. = 0, а середина - 0.25 тыс. руб., условная верхняя граница последнего интервала: 3,0 тыс. руб. + 0,5 тыс. руб. = 3,5 тыс. руб.. а середина - 3,25 тыс. руб.
Осуществим расчет средней величины месячного среднедушевого денежного дохода (х), используя в качестве весов частоты распределения (f). Промежуточные расчеты запишем в гр. 6 табл. 1. Тогда
тыс.руб.
Месячный среднедушевой доход составляет 1820 руб.
Можно при расчете средней величины в качестве весов использовать частости распределения (ω) (промежуточные расчеты в гр. 7 табл. 1). Величина средней от этого не меняется.
тыс.руб.
Мода - значение признака, наиболее часто встречающееся в изучаемой совокупности. В дискретном ряду модой является вариант с наибольшей частотой (частостью). В интервальном вариационном ряду мода рассчитывается по формуле:
, (2)
где
где - нижняя граница модального интервала;
- величина модального интервала;
- частоты (частости) соответственно модального, домодального и послемодального интервалов.
Модальный интервал - это интервал, имеющий наибольшую частоту (частость). В нашем примере это третий интервал - от 1,0 ,до 1,5 тыс. руб.
Рассчитаем модальное значение признака, используя в качестве весов частости распределения:
тыс.руб.
Таким образом, в нашем примере наиболее часто встречающаяся величина среднедушевого дохода составляет 1290 руб.
Расчет моды с использованием в качестве весов частот распределения даст аналогичный результат:
тыс.руб.
Отметим, что вычисление моды в интервальном ряду является весьма условным.
Приближенно модальное значение признака можно определить и графически - по гистограмме. Для этого нужно взять столбец, имеющий наибольшую высоту, и из его левого верхнего угла провести отрезок в верхний угол последующего столбца, а из правого угла в верхний правый угол предыдущего (см. рис. 1). Абсцисса точки пересечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности.
Медиана - вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким образом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина - больше, чем медиана.
В интервальном ряду медиана определяется по формуле:
, (3)
где
. - начало медианного интервала;
- величина медианного интервала;
- сумма частот (частостей) вариационного ряда;
- частота (частость) медианного интервала;
- сумма накопленных частот (частостей) в домедианном интервале.
Медианный интервал - это интервал, в котором находится порядковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот (частостей) до числа, превышающего половину объема совокупности.
По данным гр. 4 табл. 1 находим интервал, сумма накопленных частот в котором превышает 50%. Это интервал от 1,5 до 2,0 тыс. руб. (S = 60,8%), он и является медианным. Тогда
тыс. руб.
Следовательно, половина жителей города в нашем примере имеет месячный среднедушевой доход меньше 1720 руб., а половина - больше этой суммы.
Расчет медианного значения по частостям распределения даст аналогичный результат:
тыс. руб.
где 1179 - сумма накопленных частот в домедианном интервале.
Медиану приближенно можно определить графически - по кумуляте. Для этого высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения и является медианой (см. рис. 3).
Расчет модального и медианного значений для вариационных рядов с неравными интервалами осуществляется по формулам, аналогичным приведенным выше, только вместо показателей частот (частостей) используются показатели абсолютной или относительной плотности распределения, которые обеспечивают сопоставимость неравных интервалов.
Показатели плотности распределения находятся как отношения частот (частостей) к величине интервала:
- абсолютная плотность распределения
(4)
- относительная плотность распределения
(5)
где i - величина интервала.
По соотношению характеристик центра распределения (средней величины, моды и медианы) можно судить о симметричности эмпирического ряда распределения.
Симметричным является распределение, в котором частоты двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой. В симметричном распределении средняя величина, медиана и мода равны между собой:
Если , то имеет место правосторонняя асимметрия, т. е. большая часть единиц совокупности имеет значения изучаемого признака, превышающие модальное значение. На графике распределения правая ветвь относительно максимальной ординаты вытянута больше, чем левая.
Соотношение характерно для левосторонней асимметрии, при которой большая часть единиц совокупности имеет значения признака ниже модального. На графике распределения левая ветвь вытянута больше, чем правая.
Нашему примеру соответствует соотношение (1820 руб. > 1720 руб. > 1290 руб.), характерное для правосторонней асимметрии, что подтверждается графиками - гистограммой и полигоном распределения (см. рис. 1 и 2). Наличие правосторонней асимметрии свидетельствует о том, что большая часть жителей города имела месячный среднедушевой доход выше, чем его модальное значение (1290 руб.).
При анализе вариационного ряда важно знать не только направление асимметрии (правосторонняя или левосторонняя), но и ее степень, которая измеряется с помощью коэффициентов асимметрии. Методика их расчета будет рассмотрена ниже.
Моду и медиану называют еще структурными средними, поскольку они дают количественную характеристику структуры строения вариационных рядов. К структурным характеристикам относятся и другие порядковые статистики: квартили - делящие ряд на 4 равные части, децили - делящие ряд на 10 частей, перцинтили - на 100 частей и др.
2.2. Показатели размера и интенсивности вариации
Обязательным этапом в изучении вариационных рядов является расчет показателей размера и интенсивности вариации.
Для характеристики размера вариации в статистике применяются абсолютные показатели вариации:
Размах вариации (размах колебаний) представляет собой разность между максимальным и минимальным значениями признака в совокупности:
(6)
Для группировок c открытыми первым и последним интервалами, когда неизвестны реальные минимальное и максимальное значения признака в совокупности. расчет размаха вариации некорректен.
Размах вариации зависит от величины только крайних значений признака. Более точно характеризуют вариацию признака показатели, основанные, на учете колеблемости всех значений признака - среднее линейное отклонение (d) и среднее квадратическое отклонение (σ).
Для сгруппированных данных они рассчитываются по формулам:
, (7)
, (8)
где - значение признака в i-й группе интервальных вариационных рядов - середина i-го интервала);
- средняя величина признака в совокупности;
- частота (частость ) i-го интервала.
Квадрат среднего квадратического отклонения называется дисперсией (σ²):
(9)
Рассчитать дисперсию можно также по преобразованной формуле:
(10)
где - средний квадрат значений признака в совокупности:
(11)
- квадрат среднего значения признака в совокупности.
При расчете дисперсии по этой формуле исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от его средней величины, за счет этого уменьшается ошибка, связанная с округлением значений промежуточных вычислений.
Размах вариации, среднее линейное отклонение и среднее квадратическое отклонение являются величинами именованными, т. е. имеют ту же единицу измерения, что и изучаемый признак. Дисперсия единицы измерения не имеет.
Правило сложения дисперсий, межгрупповая дисперсия
В общем случае вариация результативного признака обусловлена различными факторами в их совокупности, а не только воздействием одного из них. Если статистическую совокупность разбить на группы по какому-либо признаку, то наряду с изучением вариации результативного признака по всей совокупности в целом под воздействием всех факторов получаем возможность изучить вариацию для каждой из составляющих всю совокупность групп по отдельности. Также можно изучить при этом вариацию между группами. В простейшем случае вся исходная совокупность разбивается на отдельные группы по одному фактору. Тогда указанный выше анализ вариации сводится к расчету и анализу трех видов дисперсии: общей, внутригрупповой и межгрупповой.
Общая дисперсия измеряет вариацию результативного признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию.
Межгрупповая дисперсия δ2 характеризует систематическую вариацию под воздействием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней для всей совокупности:
, (12)
где f численность единиц в группе (частота).
Внутригрупповая дисперсия есть уже известная нам дисперсия (для всей совокупности, называемая общей), но теперь эта формула применяется только к отдельной группе. Соответственно и обозначается она σ2 , но уже с индексом i, который подчеркивает, что расчет выполняется для отдельной i-группы.
Внутригрупповая дисперсия отражает случайную вариацию, т.е. ту ее часть, которая обусловлена влиянием прочих (неучтенных) факторов, отличных от основания группировки. По отдельным внутригрупповым дисперсиям, рассматривая их как значения некоторого особого признака, рассчитывают среднюю по внутригрупповым дисперсиям, которая уже характеризует вариацию по всей совокупности в целом под воздействием всех прочих (неучтенных) факторов, отличных от основания группировки.
Существует простая и важная формула, связывающая общую дисперсию, межгрупповую дисперсию и среднюю по внутригрупповым дисперсиям:
. (13)
Это означает, что общая дисперсия равна сумме межгрупповой дисперсии и средней по внутригрупповым дисперсиям. Следовательно, зная две из трех дисперсий, можно всегда найти и третью.
Правило сложения дисперсий показывает, что чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый результативный признак. Такие соображения естественным образом приводят к количественной характеристике такого влияния, мере стохастической связи между признаками. Она называется эмпирическим коэффициентом детерминации и обозначается η2 , характеризуя силу влияния группировочного признака на образование общей вариации:
. (14)
При отсутствии связи он просто равен нулю, при чисто функциональной связи 1. В общем случае коэффициент детерминации принимает значения между 0 и 1. Это видно и из правила сложения дисперсий.
Помимо коэффициента детерминации используют также и эмпирическое корреляционное отношение, которое представляет собой корень квадратный из коэффициента детерминации. И опять оно весьма подходит для измерения линейной связи.
В общем случае нелинейной связи предпочтительнее использовать, что правильнее, коэффициент детерминации. Если связь отсутствует, то корреляционное отношение равно нулю и, следовательно, все групповые средние равны между собой, а межгрупповой вариации просто в этом случае нет.
Группировочный признак при этом никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение равно 1. Дисперсия групповых средних равна общей дисперсии и межгрупповой дисперсии, поэтому внутригрупповой вариации не будет. Таким образом, группировочный признак целиком определяет вариацию изучаемого результативного признака.
Определим среднее линейное, среднее квадратическое отклонение и дисперсию для нашего условного примера о распределении жителей города по величине месячного среднедушевого дохода. Все промежуточные вычисления приведены в табл. 2.
Среднедушевой доход в среднем за месяц, тыс.руб |
Число жителей в % к итогу (fi) |
Середина интервала (xi) |
|||
До 0,5 |
0,9 |
0,25 |
1,57 |
1,413 |
2,218 |
0,5 1,0 |
16,5 |
0,75 |
1,07 |
17,655 |
18,891 |
1,0 1,5 |
24,6 |
1,25 |
0,57 |
14,022 |
7,993 |
1,5 2,0 |
18,8 |
1,75 |
0,07 |
1,316 |
0,092 |
2,0 2,5 |
15,4 |
2,25 |
0,43 |
6,622 |
2,847 |
2,5 3,0 |
12,5 |
2,75 |
0,93 |
11,625 |
10,811 |
3,0 и более |
11,3 |
3,25 |
1,43 |
16,159 |
23,107 |
Итого |
100 |
- |
- |
68,812 |
65,959 |
Среднее линейное отклонение, дисперсия и среднее квадратическое отклонение соответственно составят:
тыс.руб.
Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем величина месячного среднедушевого дохода жителей города отличалась от среднего дохода по городу. По формуле среднего линейного отклонения это отличие составляло: +- 688 руб., по формуле среднего квадратического отклонения: +-812 руб.
Среднее квадратическое отклонение по величине всегда больше среднего линейного отклонения.
Соотношение σ: d зависит от наличия в совокупности резких отклонений и может служить индикатором «засоренности» совокупности нетипичными. выделяющимися из основной массы единицами. Для нормального распределения это соотношение равно 1,25.
Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака: относительный размах вариации (коэффициент осцилляции); относительное линейное отклонение и др.
Наиболее часто на практике применяют коэффициент вариации (v), который представляет собой относительное квадратическое отклонение:
(15)
По величине коэффициента вариации можно судить об интенсивности вариации признака, а следовательно, и об однородности состава изучаемой совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации.
Коэффициент вариации (%) |
Степень однородности совокупности |
До 30 |
Однородная |
30-60 |
Средняя |
60 и более |
Неоднородная |
Отметим, что приведенная выше шкала оценки однородности совокупности весьма условна. Вопрос о степени интенсивности вариации должен решаться для каждого изучаемого признака индивидуально исходя из сравнения наблюдаемой вариации с некоторой ее обычной интенсивностью, принимаемой за норму.
Для нашего примера коэффициент вариации составил:
,
что свидетельствует о средней колеблемости признака и, следовательно, о средней однородности совокупности жителей города по величине среднедушевых доходов.
Вывод по 2-му вопросу: информативность показателей вариации повышается, если они рассчитываются для целей сравнительного анализа. При этом показатели, рассчитанные по одной совокупности, сопоставляются с показателями, рассчитанными по другой аналогичной совокупности или по той же самой, но относящейся к другому периоду времени.
Показатели вариации также являются составной частью или основой для расчетов других статистических показателей. Они используются в анализе взаимосвязей между признаками, в измерении структурных сдвигов в экономике, в оценке рисков.
Выводы по лекции: рассматривая зарегистрированные в процессе статистического наблюдения величины того или иного признака у отдельных единиц совокупности, можно обнаружить между ними различия. Колеблемость, многообразие, изменяемость величины признака у единиц совокупности называются вариацией.
Вариация порождается комплексом условий, действующих на совокупность и её единицы.
Исследование вариации в статистике имеет важное значение. Особенно актуально оно в настоящее время, когда формируется многоукладная экономика.
Измерение вариации дает возможность оценить степень воздействия на данный признак других варьирующих признаков, установить, например, какие факторы и в какой степени влияют на смертность населения, финансовое положение предприятий, урожайность и т.д. Всеми этими теоретическими положениями мы будем пользоваться при изучении социально-экономической статистики.