Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Тема 1.
Группировка данных и сводка материалов статистического наблюдения. Формирование материалов статистических таблиц
Под группировкой понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении в целях выделения типов явлений, изучения структуры и взаимосвязей.
В соответствии с этим, статистические группировки по задачам, решаемым с их помощью, делятся на типологические, структурные и аналитические.
Под типологической группировкой понимают разделение изучаемой совокупности преступлений, преступников или других явлений, имеющих юридическое значение, на отдельные, качественно однородные совокупности по важнейшим существенным качественным признакам, в соответствии с правилами научной группировки. В гражданской, правовой статистике анализ гражданских дел так же невозможен без изначально типологической группировки по их категориям или отраслям права: трудовые, жилищные, семейные, имущественные, финансовые, авторские и другие.
Структурная или вариационная группировка статистических данных может производиться, чтобы изучить изменение структуры типически однородных групп преступлений правонарушителей, гражданских исков и других групп, по какому-либо варьирующему признаку. Например, структурные различия могут раскрывать криминологическую обстановку в том или ином регионе, состав населения по полу и т.д.
Аналитическая группировка юридически значимых показателей позволяет обнаружить взаимосвязь и зависимость между изучаемыми явлениями и процессами и их признаками. Всю совокупность признаков можно разделить на две группы: факторные и результативные. Факторными называются признаки, под воздействием которых изменяются другие признаки они и образуют группу результативных признаков. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает среднее значение признака результативного.
Особенности аналитической группировки следующие:
Аналитические группировки позволяют изучить многообразие связей и зависимости между варьирующими признаками. Преимущество метода аналитических группировок перед другими методами анализа связи состоит в том, что он не требует соблюдения каких-либо условий для своего применения, кроме одного качественной однородности исследуемой совокупности.
Признак, на основе которого производится подразделение единиц на группы, называется группировочным признаком или основанием группировки. Группировка может выполняться по одному признаку (простая группировка) и по нескольким признакам (комбинированная группировка).
Группировочный признак может быть атрибутивным (профессия, национальность, по виду преступления: умышленное, неосторожное и др.) и количественным (стаж работы, доходы, удельные веса преступлений, лиц, дел, возраст правонарушителей, суммы иска, суммы ущерба, срок расследования уголовных или гражданских дел и т.д.).
При группировке по количественному признаку число групп определяется в зависимости от характера изменения признака и задач исследования. Если количественный признак меняется прерывно (дискретно), то число групп может соответствовать количеству значений признака. При непрерывном изменении признака ограничиваются значениями признака в интервале "от и до". Интервалом называется разница между максимальным и минимальным значениями в каждой группе. На практике используется три вида интервалов: равные, неравные и специализированные.
Равные интервалы исчисляются по формуле:
, соответственно наибольшее и наименьшее значения признака в изучаемой совокупности;
число групп, назначаемое (принятое).
Возможен другой способ определения величины интервала, не требующее предварительного установления числа групп с использованием формулы Стерджеса
число наблюдений.
Под статистической сводкой понимается подсчет числа единиц в группах (подгруппах), выделенных при группировке и подведение итогов по количественным признакам.
Результаты группировки и сводки материалов оформляются в виде статистических таблиц. В статистической таблице выделяются два элемента:
подлежащее (обычно помещается в первой вертикальной или в горизонтальной графе) перечень единиц или групп, на которые подразделена вся масса наблюдения;
сказуемое цифры, при помощи которых характеризуются выделенные в подлежащем единицы или группы.
Над таблицей помещается заголовок, отражающий в сжатой форме ее основное содержание. В зависимости от характера подлежащего различают три вида таблиц: простые, групповые, комбинационные.
Задача 1. По юридическим консультациям города имеются следующие данные за отчетный год:
№ |
Число дел, переданных в суд |
Годовой объем произведенных работ ( тыс. руб.). |
Среднесписочное число сотрудников, чел. |
Прибыль тыс. руб. |
1 |
195 |
110,5 |
9 |
14,5 |
2 |
590 |
322,8 |
16 |
37,2 |
3 |
460 |
218,5 |
15 |
97,2 |
4 |
295 |
152,3 |
13 |
54,4 |
5 |
574 |
222,0 |
15 |
36,0 |
6 |
480 |
119,0 |
14 |
80,4 |
7 |
578 |
221,8 |
12 |
128,4 |
8 |
201 |
99,4 |
8 |
40,6 |
9 |
490 |
230,4 |
13 |
111,8 |
10 |
295 |
113,6 |
12 |
49,6 |
11 |
423 |
217,8 |
14 |
105,8 |
12 |
198 |
118,8 |
10 |
40,7 |
13 |
370 |
314,0 |
14 |
84,8 |
14 |
209 |
210,2 |
9 |
43,3 |
1. Требуется выполнить группировку предприятий по числу дел, переданных в суд, приняв следующие интервалы: 1) до 200; 2) от 200-400; 3) 400-600.
2. По каждой группе и в целом по всем группам определить: число консультаций, число дел, среднесписочное число сотрудников, среднюю нагрузку дел на одного сотрудника.
Результаты группировки представить в виде статистической таблицы.
Решение.
Для решения задачи необходимо произвести группировку по числу дел в заданных интервалах.
Расположим данные по степени возрастания группировочного признака (в нашем случае число дел).
№ |
Число дел, переданных в суд |
Годовой объем произведенных работ ( тыс. руб.). |
Среднесписочное число сотрудников, чел. |
Прибыль тыс. руб. |
1 |
195 |
110,5 |
9 |
14,5 |
12 |
198 |
118,8 |
10 |
40,7 |
8 |
201 |
99,4 |
8 |
40,6 |
14 |
209 |
210,2 |
9 |
43,3 |
4 |
295 |
152,3 |
13 |
54,4 |
10 |
295 |
113,6 |
12 |
49,6 |
13 |
370 |
314,0 |
14 |
84,8 |
11 |
423 |
217,8 |
14 |
105,8 |
3 |
460 |
218,5 |
15 |
97,2 |
6 |
480 |
119,0 |
14 |
80,4 |
9 |
490 |
230,4 |
13 |
111,8 |
5 |
574 |
222,0 |
15 |
36,0 |
7 |
578 |
221,8 |
12 |
128,4 |
2 |
590 |
322,8 |
16 |
37,2 |
Составим вспомогательную таблицу:
Интервалы по числу дел |
Число дел консультаций, входящих в интервал |
Общее число консультаций |
Число сотрудников консультаций, входящих в интервал |
до 200 |
195 198 |
9 10 |
|
Итого по интервалу |
393 |
2 |
19 |
200-400 |
201 209 295 295 370 |
8 9 12 13 14 |
|
Итого по интервалу |
1370 |
5 |
40 |
400-600 |
423 460 480 490 574 578 590 |
14 15 14 13 15 12 16 |
|
Итого по интервалу |
3595 |
7 |
99 |
Итого: |
5358 |
14 |
158 |
На основе вспомогательной таблицы по каждой группе выделенных интервалов определяют число консультаций, суммарное число, среднесписочное число сотрудников, среднюю нагрузку на одного сотрудника (например, и т. д.) в каждом интервале, затем все эти показатели подсчитывают в целом по всему числу консультаций и данные оформляют в виде статистической таблицы.
Консультации по заданным интервалам |
Общее число консуль- таций |
Общее число дел |
Общее число сотрудников |
Среднеспи-сочное число сотрудников |
Средняя нагрузка на одного сотрудника |
до 200 |
2 |
393 |
19 |
9,5 |
20,7 |
200-400 |
5 |
1370 |
40 |
8 |
34,3 |
400-600 |
7 |
3595 |
99 |
14,1 |
36,3 |
Итого |
14 |
5358 |
158 |
31,6 |
91,3 |
Среднее по интервалам |
|
178,6 |
52,67 |
10,5 |
33,9 |
Тема 2.
Абсолютные, относительные, средние величины.
Абсолютные величины характеризуют численность совокупности и объем (размер) изучаемого социально-экономического явления в определенных границах места и времени. Они являются всегда именованными числами, т.е. имеют какие-либо единицы измерения.
Относительная величина представляет собой результат сопоставления двух статистических показателей, дает цифровую меру их соотношения. Относительные величины делятся на две группы.
К относительным величинам первой группы относятся: относительные величины динамики, относительные величины планового задания, относительные величины выполнения плана, т.е. относительные величины, полученные в результате сопоставления одноименных статистических показателей.
Вторая группа относительных величин, представляющая собой результат сопоставления разноименных статистических показателей, носит название относительных величин интенсивности. В эту группу включаются показатели производства на душу населения, показатели, отражающие обеспеченность населения материальными и культурными благами, техническую оснащенность т.д..
Относительные величины динамики характеризуют изменение явления во времени. Они показывают, во сколько раз увеличился (или уменьшился) объем явления за определенный период времени, их называют коэффициентами роста.
Коэффициентами роста можно исчислять в процентах, для этого отношения умножают на 100. Их называют темпами роста. Коэффициенты роста и темпы роста можно определять с переменной и постоянной базой.
Пусть , , , уровни явления за одинаковые последовательные периоды (например, данные об объеме денежных сумм по договорам по кварталам года или годам).
Темпы роста в процентах с постоянной базой (базисные темпы роста):
; ; ;
постоянная база для сравнения.
Темпы роста в процентах с переменной базой (цепные темпы роста):
; ; ;
Относительные величины планового задания относительные величины показателя по плану () к его фактической величине в предшествующем периоде (), т.е. :.
Относительная величина выполнения плана отношение фактической (отчетной) величины показателя () к запланированной его величине () на тот же период, т.е. :.
Относительная величина динамики отношение фактической (отчетной) величины показателя () к фактической величине предшествующего периода (), т. е. :.
Задача 2.
По каждому из трех юридических отделов фирмы ( - порядковый номер отдела) имеются данные о фактическом объеме денежных сумм по заключенным в 2001 г. договорам (, млн. руб.), о плановом задании по росту указанных сумм по договорам на реализацию продукции на 2002 г. (, %), а так же о фактическом объеме денежных сумм по заключенным в 2002 г. договорам (, млн. руб.). Статистические данные приведены в таблице.
1 |
40 |
104 |
44 |
2 |
62 |
106 |
65 |
3 |
80 |
102,5 |
85 |
Требуется определить в целом по фирме:
1) размер планового задания по росту общей денежной суммы, на которую заключены договора на реализацию продукции в 2002 г. ();
2) процент выполнения плана по росту общей денежной суммы, на которую заключены договора на реализацию в 2002 г.;
3) показатель динамики роста общей денежной суммы.
Решение.
; =;
= |
= |
|||
1 |
40 |
104 |
41,6 |
44 |
2 |
62 |
106 |
65,7 |
65 |
3 |
80 |
102,5 |
82,0 |
85 |
Итого |
182 |
104,0 |
189,3 |
194,0 |
1) Размер планового задания дан в виде коэффициента темпа роста в процентах с постоянной базой.
, следовательно, =, итого, в целом по фирме: =++=41,6+65,7+82,0=189,3.
2) Процент выполнения плана по росту общей денежной суммы, т.е. отношение фактической величины к планируемой, умноженной на 100.
; ==102,5.
Или 102,5%, т.е. план по росту общей денежной суммы превышен на 2,5%.
3) определить показатель динамики роста денежной суммы.
Относительная величина динамики
Тема 3.
Статистические распределения; числовые характеристики в случае сгруппированных статистических данных
Вариационным рядом называется последовательность наблюдаемых значений xi признака X (i=1,2,…,n), расположенных в неубывающем порядке: . Каждое значение x вариационного ряда называется вариантой.
Для характеристики центра распределения (среднего значения) применяется средняя арифметическая:
расчет простой средней арифметической.
()
; () средняя арифметическая для сгруппированных данных.
варианты значений признака;
частота повторения данного варианта;
Для характеристики размера вариации используется показатель вариации среднее квадратическое отклонение () и дисперсия ().
; ()
Формула для расчета дисперсии может быть преобразована: , т.е. дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины.
Влияние фактора, определяющего колеблемость индивидуальных значений (вариант) признака, можно определить при помощи метода группировок. При этом, кроме общей средней по всей совокупности исчисляются средние по отдельным группам, когда единицы изучаемой совокупности подразделяются на однородные группы по признаку-фактору и три показателя дисперсии:
общая дисперсия;
межгрупповая дисперсия;
средняя внутригрупповая дисперсия.
Величина общей дисперсии () характеризует вариацию признака под влиянием всех факторов и определяется по формуле
,
где общая средняя арифметическая для всей изучаемой совокупности.
Межгрупповая дисперсия (дисперсия групповых средних ) отражает различия в величине изучаемого признака положенного в основу группировки
,
средняя по отдельной группе;
число единиц в определенной группе.
Средняя внутригрупповая дисперсия () характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов и не зависит от условия положенного в основу группировки.
; или
где дисперсия по отдельной группе .
Указанные дисперсии взаимосвязаны между собой
.
Опираясь на это правило можно определить, какая часть (доля) общей дисперсии складывается под влиянием признака-фактора, положенного в основу группировки.
Для характеристики однородности совокупности наиболее часто применяется коэффициент вариации
.
Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений близких к нормальному).
Задача 3.
По каждой из трех профессий ( порядковый номер профессии: 1 адвокат; 2 следователь; 3 судья) имеются соответствующие данные о числе специалистов профессии (, чел.), о средней заработной плате (, руб.), а также о внутригрупповой дисперсии заработной платы (, руб.2). статистические данные за месяц приведены в таблице.
, чел |
, руб. |
, руб.2 |
|
1 |
20 |
2650 |
2500 |
2 |
15 |
2800 |
3025 |
3 |
5 |
2400 |
900 |
Требуется:
1. Определить общую дисперсию заработной платы
2. Оценить однородность совокупности по уровню месячной заработной платы.
3. Определить, на сколько процентов дисперсия в размере заработной платы обусловлена различиями и влиянием других причин.
Решение.
Поскольку по условию задачи не заданы индивидуальные значения переменной "заработная плата", а даны значения средней по каждой группе, общую дисперсию вычисляем по формуле
;
межгрупповая дисперсия
.
Для расчета межгрупповой дисперсии необходимо подсчитать общую среднюю арифметическую всей переменой "заработная плата".
для сгруппированных данных
(руб.)
.
общая дисперсия заработной платы.
2) Однородность совокупности по уровню месячной заработной платы
; .
Вывод: , совокупность считается однородной.
3) Процент дисперсии, обусловленный различиями в заработной плате (фактор группировки данных) .
Процент дисперсии, обусловленный другими случайными причинами
.
Вывод:
Полученный результат показывает, что дисперсия или (% дисперсии) на 86,22% обусловлены различиями в профессии, и только на 13,78% другими случайными причинами.
Тема 4.
Ранговая корреляционная связь и ее изучение.
Корреляционная связь связь, проявляющаяся не в каждом отдельном случае, а в массе случаев в средних величинах в форме тенденции. Связь двух признаков (x,y) называется парной корреляцией.
Установить факт наличия связи можно при помощи анализа аналитической группировки по признаку фактору. Устанавливается результативный показатель () и фактор его изменения, характеризуемый его показателем x. Одним из основных методов выявления наличия корреляционной связи является метод аналитической группировки и определение групповых средних. Все единицы совокупности разбиваются на группы по величине признака - фактора и для каждой группы определяется средняя величина результативного признака. На основе данных аналитической группировки строится график эмпирической линии связи, вид которой не только позволяет судить о возможном наличии связи, но и дает некоторое представление о форме корреляционной связи. Если эмпирическая линия связи по своему виду приближается к прямой линии, то можно предположить наличие прямолинейной корреляционной связи.
Качественная переменная. Ранжирование объектов по качественному признаку. Согласованные последовательности рангов.
Напомним, что качественной (порядковой) переменной называется такая переменная X, которую нельзя измерить в физических единицах, но которая позволяет сравнивать наблюдаемые объекты (субъекты) между собой и упорядочивать их по степени проявления качества, например в порядке убывания качества. Примеры качественных переменных приведены в разд. 1.1.
Ранжированием объектов по качественной переменной X называется процесс упорядочения объектов по степени убывания (возрастания) их качества. Результат ранжирования называется ранжировкой. Рангом объекта называется порядковый номер объекта в ранжировке.
Если все объекты выборки получают разные ранги, то ранжировка будет строгой; если несколько объектов выборки имеют одинаковое качество, то нестрогой.
В случае нестрогой ранжировки применяют способ средних рангов: каждому из объектов однородной группы с одинаковым качеством присваивается ранг, равный среднему арифметическому порядковых номеров этих объектов в условно строгой ранжировке.
Перейдем к построению согласованных последовательностей рангов. Пусть изучается связь между парой качественных переменных X и Y, для чего сформирована выборка результаты последовательных наблюдений . Сначала расположим наблюдаемые пары в порядке убывания (невозрастания) качества по первой переменной X:
… |
|||||
… |
Затем присвоим этим парам порядковые номера в соответствующих условно строгих ранжировках по переменным X и Y. Получим следующую таблицу:
X |
1 |
2 |
… |
… |
||
Y |
… |
… |
В данной таблице ранг (порядковый номер) по переменной Y того объекта, который имеет ранг в первой ранжировке по переменной X.
Далее (если несколько объектов имеют одинаковое качество по некоторой переменной) применяем способ средних рангов, в результате получаем две согласованные последовательности рангов:
… |
||||
… |
В первой строке таблицы представлена ранджировка по переменной X, во второй согласованная с ней ранжировка по переменой Y.
Выборочный коэффициент ранговой корреляции Спирмена
и проверка его статистической значимости
Этот коэффициент используется для оценки тесноты ранговой корреляционной связи между двумя качественными переменными X и Y по данным выборки , . Условия его применимости следующие:
Важно отметить, что ранговая корреляция может применяться и для количественных переменных в случае, если заранее не гарантируется нормальность распределения.
Пусть проведено ранжирование объектов и получены две согласованные последовательности рангов , . Выборочный коэффициент ранговой корреляции Спирмена вычисляется по формуле
,
где разность рангов.
Он варьирует от 1,0 до +1,0. Чем ближе он по абсолютной величине к 1, тем теснее связь. Знак при нем указывает направление связи: знак “ + ” соответствует прямой зависимости, знак “ - ” - обратной.
Для проверки статистической значимости выборочного коэффициента ранговой корреляции Спирмена на заданном уровне значимости выдвигается гипотеза об отсутствии ранговой корреляционной связи:
при .
Для проверки выдвинутой гипотезы используется статистика Стьюдента:
.
При условии справедливости нулевой гипотезы случайная величина T имеет -распределение Стьюдента с степенями свободы.
Зная коэффициент Спирмена , вычисляем наблюдаемое значение статистики Стьюдента. По таблице квантилей распределения Стьюдента определяем критическую точку статистики Стьюдента:
при .
Критерий проверки (разрешающее правило):
1. Если , то гипотеза сохраняется (ранговая корреляционная связь практически отсутствует).
2. Если , то гипотеза решительно отвергается (существует значимая ранговая корреляционная связь между качественными переменными X,Y).
Задача 4
По 14-ти юридическим консультациям имеются соответствующие данные об объеме продукции (услуг) за месяц (, тыс.руб.) и уровне компьютеризации труда (, %). Статистические данные приведены в таблице.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
|
84 |
59 |
90 |
62 |
89 |
95 |
86 |
55 |
68 |
73 |
95 |
87 |
78 |
94 |
|
78 |
72 |
88 |
84 |
96 |
105 |
94 |
70 |
85 |
87 |
104 |
95 |
80 |
102 |
Для выявления наличия корреляционной связи между объемом оказанных услуг и уровнем компьютеризации требуется:
1. Построить аналитическую таблицу и дать графическое линии связи.
2. Измерить тесноту связи между признаками с помощью коэффициента рангов; проверить его достоверность.
Решение.
Результативный признак объем услуг ();
Факторный признак уровень компьютеризации труда ().
Первичная информация проверяется на однородность по признаку-фактору с помощью коэффициента вариации.
100; .
Для расчета используем вспомогательную таблицу 1.
Таблица 1.
№ по порядку |
Уровень компьютериза-ции, Х ,% |
Объем услуг, y, тыс.руб. |
хi- |
(хi-)2 |
1 |
55 |
70 |
-24,6429 |
607,2704 |
2 |
59 |
72 |
-20,6429 |
426,1276 |
3 |
62 |
84 |
-17,6429 |
311,2704 |
4 |
68 |
85 |
-11,6429 |
135,5561 |
5 |
73 |
87 |
-6,64286 |
44,12755 |
6 |
78 |
80 |
-1,64286 |
2,69898 |
7 |
84 |
78 |
4,357143 |
18,98469 |
8 |
86 |
94 |
6,357143 |
40,41327 |
9 |
87 |
95 |
7,357143 |
54,12755 |
10 |
89 |
96 |
9,357143 |
87,55612 |
11 |
90 |
88 |
10,35714 |
107,2704 |
12 |
94 |
102 |
14,35714 |
206,1276 |
13 |
95 |
104 |
15,35714 |
235,8418 |
14 |
95 |
105 |
15,35714 |
235,8418 |
Итого: |
1115 |
2513,214 |
||
Среднее: |
79,64 |
179,5153 |
||
Ср.квадр. |
0,16823 |
13,39833 |
;
; 100 (%); 33%,
следовательно, совокупность можно считать однородной.
Для установления факта наличия связи производится группировка по признаку-фактору. Группировка выполняется при равных интервалах и числе групп .
Величина интервала определяется по формуле
.
Построим групповую аналитическую таблицу (таблицу средних).
Зависимость объема услуг от уровня компьютеризации
уровень компьютеризации, % () |
Число консультаций, |
Средняя величина объема услуг, тыс.руб. () |
|
55-60 |
2 |
144 |
71 |
60-65 |
1 |
84 |
84 |
65-70 |
1 |
85 |
85 |
70-75 |
1 |
87 |
87 |
75-80 |
1 |
80 |
80 |
80-85 |
1 |
78 |
76 |
85-90 |
3 |
285 |
95 |
90-95 |
4 |
399 |
99,7 |
Как видно из данных групповой таблицы с увеличением уровня компьютеризации увеличивается объем предоставляемых услуг.
2. Для расчета коэффициентов корреляции рангов предварительно выполняется ранжирование по каждому признаку.
№ кон-суль-тации |
Уровень компьютеризации |
Объем услуг |
№ кон-суль-тации |
Уровень компьютеризации |
Ранг по |
№ кон-суль-тации |
Объем услуг |
Ранг по y |
1 |
84 |
78 |
8 |
55 |
1 |
8 |
70 |
1 |
2 |
59 |
72 |
2 |
59 |
2 |
2 |
72 |
2 |
3 |
90 |
88 |
4 |
62 |
3 |
4 |
84 |
5 |
4 |
62 |
84 |
9 |
68 |
4 |
9 |
85 |
6 |
5 |
89 |
96 |
10 |
73 |
5 |
10 |
87 |
7 |
6 |
95 |
105 |
13 |
78 |
6 |
13 |
80 |
4 |
7 |
86 |
94 |
1 |
84 |
7 |
1 |
78 |
3 |
8 |
55 |
70 |
7 |
86 |
8 |
7 |
94 |
9 |
9 |
68 |
85 |
12 |
87 |
9 |
12 |
95 |
10 |
10 |
73 |
87 |
5 |
89 |
10 |
5 |
96 |
11 |
11 |
95 |
104 |
3 |
90 |
11 |
3 |
88 |
8 |
12 |
87 |
95 |
14 |
94 |
12 |
14 |
102 |
12 |
13 |
78 |
80 |
6 |
95 |
13,5 |
6 |
104 |
13 |
14 |
94 |
102 |
11 |
95 |
13,5 |
11 |
105 |
14 |
Вспомогательная таблица для расчета коэффициента корреляции рангов Спирмена
№ консуль-тации, |
Уровень компьютеризации |
Объем услуг |
Ранги |
(ранг - ранг ) |
||
1 |
55 |
70 |
1 |
1 |
0 |
0 |
2 |
59 |
72 |
2 |
2 |
0 |
0 |
3 |
62 |
84 |
3 |
5 |
-2 |
4 |
4 |
68 |
85 |
4 |
6 |
-2 |
4 |
5 |
73 |
87 |
5 |
7 |
-2 |
4 |
6 |
78 |
80 |
6 |
4 |
2 |
4 |
7 |
84 |
78 |
7 |
3 |
4 |
16 |
8 |
86 |
94 |
8 |
9 |
-1 |
1 |
9 |
87 |
95 |
9 |
10 |
-1 |
1 |
10 |
89 |
96 |
10 |
11 |
-1 |
1 |
11 |
90 |
88 |
11 |
8 |
3 |
9 |
12 |
94 |
102 |
12 |
12 |
0 |
0 |
13 |
95 |
104 |
13,5 |
13 |
0,5 |
0,25 |
14 |
95 |
105 |
13,5 |
14 |
-0,5 |
0,25 |
Сумма |
0 |
44.5 |
.
Для проверки статистической значимости выборочного коэффициента ранговой корреляции Спирмена на заданном уровне значимости =0.05 выдвигается гипотеза об отсутствии ранговой корреляционной связи:
при .
Для проверки выдвинутой гипотезы исчисляется статистика Стьюдента:
.
При условии справедливости нулевой гипотезы случайная величина T имеет -распределение Стьюдента с степенями свободы.
Зная коэффициент Спирмена , вычисляем наблюдаемое значение статистики Стьюдента. По таблице квантилей распределения Стьюдента определяем критическую точку статистики Стьюдента:
при . , tкр=2,178
Критерий проверки (разрешающее правило):
1. Если , то гипотеза сохраняется (ранговая корреляционная связь практически отсутствует).
2. Если , то гипотеза решительно отвергается (существует значимая ранговая корреляционная связь между качественными переменными X,Y).
В нашем случае , 6,7 2,18, следовательно, принимается гипотеза о значимости корреляционная связь между качественными переменными X,Y), т.е. с повышения уровня компьютеризации растет объем услуг.
Тема 5. Ряды динамики: выявление и характеристика основной тенденции развития, скользящая средняя, аналитическое выравнивание, интерполяция, экстраполяция.
Социально-экономические явления общественной жизни находятся в непрерывном развитии. Их изменение во времени статистика изучает при помощи построения и анализа рядов динамики. Ряд динамики числовые значения статистического показателя, представленные во временной последовательности. Он состоит из двух граф: в первой указываются периоды (или даты, во второй показатели, характеризующие изучаемый объект за эти периоды (или на эти даты).
Показатели второй графы носят название уровней ряда: первый показатель называется начальным уровнем, последний конечным, уровень любого периода (кроме первого) называется уровнем текущего периода.
Выявление общей тенденции изменения динамического ряда обеспечивается при помощи особых приемов. Наиболее простым способом является укрупнение интервалов и определение итога уровня для этих интервалов или исчисление средних для каждого укрупненного интервала, при этом используют либо переменную среднюю, либо скользящую среднюю.
Переменная средняя исчисляется по формуле простой средней арифметической.
Например, если укрупненный интервал образован объединением двух периодов. То средние для укрупненных интервалов определяются следующим образом: , , и т.д.
Скользящая средняя подвижная динамическая средняя, которая исчисляется по ряду при последовательном передвижении на один интервал, т.е. сначала исчисляют средний уровень из определяемого числа первых по порядку уровней ряда, затем средний уровень из такого же числа членов, начиная со второго. если в ряду динамики имеются периодические колебания, то период скользящей средней должен совпадать с периодом колебания или быть кратным ему. Если в ряду периодических колебаний нет, то период скользящей средней подбирают начиная с наименьшего, т.е. с двух уровней, если в этом случае тенденция не проявляется, то период укрупняют. Период скользящей может быть четным или нечетным, практически удобнее использовать нечетный период, т.к. в этом случае скользящая средняя будет оттеснена к середине периода скольжения.
Скользящие средние с продолжительностью периода, равной 3 следующие:
; ; ; и т.д.
Полученные средние записываются к соответствующему интервалу (второму, третьему и.д.). Сглаженный ряд "укорачивается" по сравнению с фактическим на члена с одного и другого конца, где количество уровней, входящих в интервал.
Обеспечиваемое при применении способа скользящей средней погашение колебаний величин индивидуальных уровней ряда динамики называется сглаживанием динамического ряда.
Рассмотренные приемы выявления общей тенденции изменения динамического ряда не позволяют получить описание плавной линии развития (тренда) данного ряда. для этой цели используется аналитическое выравнивание, сущность которого заключается в нахождении уравнения, выражающего закономерность изменения явления как функцию времени . Вид уравнения определяется характером динамики развития конкретного явления; если первые разноси уровней приблизительно равны, сглаживание может быть выполнено по прямой. выбор формы кривой может быть основан на анализе графического изображения уровней динамического ряда, (линейной диаграммы), при этом целесообразнее воспользоваться графическим изображением сглаженных уровней, в которых случайные колебания погашены. Наиболее часто используются виды трендовых моделей: линейная , парабола второго порядка .
Коэффициенты и для линейной модели находятся из системы нормальных уравнений
Вычислительный процесс нахождения параметров уравнения при сохранении полной идентичности конечных результатов может быть значительно упрощен, если ввести обозначения дат (периодов) времени с помощью натуральных чисел , с тем, чтобы .
а) если количество уровней в ряду динамики нечетное, то временные даты обозначаются следующим образом
Временные даты (периоды) |
январь |
февраль |
март |
апрель |
май |
Уровни ряда динамики |
|||||
Обозначения временных дат |
-2 |
-1 |
0 |
1 |
2 |
б) если количество уровней в ряду динамики четное, то обозначения временных дат будут следующие
Временные даты (периоды) |
январь |
февраль |
март |
апрель |
май |
июнь |
Уровни ряда динамики |
||||||
Обозначения временных дат |
-5 |
-3 |
-1 |
1 |
3 |
5 |
Тогда система нормальных уравнений при выравнивании по прямой примет вид: , откуда , .
Для упорядочения расчета сумм целесообразно ввести таблицу, например, при выравнивании по прямой
Дата |
Уровни ряда динамики |
Обозначения временных дат |
||
… |
||||
По полученной модели для каждого периода (каждой даты) определяются теоретические уровни тренда () и стандартная ошибка аппроксимации (среднее квадратическое отклонение) по формуле
;
, расчетные и фактические значения уровней,
число уровней ряда,
число параметров в уравнении тренда.
Аналитическое сглаживание позволяет не только определить общую тенденцию изменения явления на рассматриваемом отрезке времени, но и выполнять расчеты для таких периодов, в отношении которых нет исходных данных.
Нахождение по имеющимся данным за определений период времени некоторых недостающих значений признака внутри этого периода называется интерполяцией.
Нахождение значений признака за пределами анализируемого периода называется экстраполяцией. Применение экстраполяции для прогнозирования должно основываться на предположении, что найденная закономерность развития внутри динамического ряда сохраняется и вне этого ряда.
Задача 5.
Динамика роста числа гражданских исков, принятых к рассмотрению в районных судах, по городу представлена в таблице.
Требуется:
1) произвести сглаживание ряда методом трехлетней скользящей средней;
2) выровнять ряд по прямой;
3) методом экстраполяции определить прогноз показателя на 2002 г
4) начертить графики первичного и вторичного рядов.
1994 |
1995 |
1996 |
1997 |
1998 |
1999 |
2000 |
2001 |
|
360 |
381 |
401 |
422 |
443 |
463 |
485 |
505 |
Составим вспомогательную таблицу
Дата |
Уровни ряда динамики |
первые разности |
Теоретический уровень |
|||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1994 |
360 |
|
|
-7 |
49 |
-2520 |
359,7 |
0,09 |
1995 |
381 |
380,7 |
21 |
-5 |
25 |
-1905 |
380,5 |
0,25 |
1996 |
401 |
401,3 |
20 |
-3 |
9 |
-1203 |
401,3 |
0,09 |
1997 |
422 |
422,0 |
21 |
-1 |
1 |
-422 |
422,1 |
0,01 |
1998 |
443 |
442,6 |
21 |
+1 |
1 |
443 |
442,9 |
0,01 |
1999 |
463 |
464,0 |
20 |
+3 |
9 |
1389 |
463,7 |
0,49 |
2000 |
485 |
484,0 |
22 |
+5 |
25 |
2425 |
484,5 |
0,25 |
2001 |
505 |
|
20 |
+7 |
49 |
3535 |
505,3 |
0,09 |
Итого |
= 3460 |
0 |
168 |
1742 |
3460 |
1,28 |
Для нахождения и используется система нормальных уравнений
;
Для упрощения системы уравнений показатели времени ,обозначаются так, чтобы , тогда система принимает вид: .
Откуда , ..
Модель тренда (линия развития после аналитического выравнивания): .
Вычислим теоретические уровни (графа 8).
Например: и т.д.
Точечный прогноз на 2002г.
(число гражданских исков)
1998г.
2000г.
Графики первичного, выровненного ряда и объем
первичный ряд
выровненный ряд
теоретическая кривая
1998г.
2000г.
Задача 1.
По юридическим консультациям города имеются следующие данные за отчетный год:
№ предприятия |
Число дел, переданных в суд |
Среднегодовая стоимость произведенных работ, тыс.руб. |
Среднесписочное число работников, чел. |
Прибыль, тыс.руб. |
1 |
197 |
10,0 |
90 |
13,5 |
2 |
592 |
22,8 |
150 |
136,2 |
3 |
465 |
18,4 |
141 |
97,6 |
4 |
296 |
12,6 |
120 |
44,4 |
5 |
584 |
22,0 |
148 |
146,0 |
6 |
480 |
19,0 |
142 |
110,4 |
7 |
578 |
21,6 |
139 |
138,7 |
8 |
204 |
9,4 |
81 |
30,6 |
9 |
466 |
19,4 |
137 |
111,8 |
10 |
292 |
13,6 |
120 |
49,6 |
11 |
423 |
17,6 |
136 |
105,8 |
12 |
192 |
8,8 |
85 |
30,7 |
13 |
360 |
14,0 |
129 |
64,8 |
14 |
208 |
10,2 |
90 |
33,3 |
1.1. Требуется выполнить группировку предприятий по числу дел,
переданных в суд, приняв следующие интервалы:
1) до 200; 2) от 200 до 400; 3) от 400 до 600.
По каждой группе и в целом по всем консультациям определить: число консультаций, число дел, среднесписочное число работников, среднюю нагрузку на одного работника. Результаты группировки представить в виде статистической таблицы.
1.2. Решить задачу 1.1., приняв следующие интервалы группировки:
1) до 250. 2) от 250 до 500; 3) от 500 и более
1.3. Решить задачу 1.1., приняв следующие интервалы группировки:
1) до 300. 2) от 300 до 500.; 3) более 500.
1.4. Требуется произвести группировку консультаций по стоимости произведенных работ, приняв следующие интервалы:
1) до 12 тыс.руб. 2) от 12 до 18 тыс.руб.; 3) от 18 тыс.руб. и выше
По каждой группе и в целом по всем консультациям определить: число консультаций, среднегодовую стоимость произведенных работ. Результаты представить в виде статистической таблицы.
1.5. Решить задачу 1.4., приняв следующие интервалы группировки:
1) менее 10 тыс.руб. 2) от 10 до 20 тыс.руб.; 3) более 20 тыс.руб.
1.6. Решить задачу 1.4., приняв следующие интервалы группировки:
1) менее 14 тыс.руб. 2) от 14 до 19 тыс.руб.; 3) от 19 тыс.руб. и более
1.7. Требуется произвести группировку консультаций по численности работников, приняв следующие интервалы:
1) до 100 чел. 2) от 100 до 130 чел.; 3) от 130 чел. и более
По каждой группе и в целом по всем консультациям определить: число консультаций, число дел, среднесписочное число работников, среднюю нагрузку на одного работника, а также среднегодовую стоимость произведенных работ. Результаты группировки представить в виде статистической таблицы.
1.8. Решить задачу 1.7., приняв следующие интервалы группировки:
1) не более 90 чел. 2) от 900 до 140 чел. 3) более 140 чел.
1.9. Требуется произвести группировку предприятий по величине прибыли, приняв следующие интервалы:
1) до 50 тыс.руб. 2) от 50 до 100 тыс.руб.; 3) от 100 до 150 тыс.руб.
По каждой группе и в целом по всем консультациям определить: число консультаций, число дел, среднесписочное число работников, среднюю нагрузку на одного работника, а также среднегодовую стоимость произведенных работ. Результаты группировки представить в виде статистической таблицы.
1.10. Решить задачу 1.9., приняв следующие интервалы группировки:
1) до 70 тыс.руб. 2) от 70 до 110 тыс.руб.; 3) свыше 110 тыс.руб.
Задача 2.
По каждому из трех юридических отделов фирмы (-порядковый номер отдела) имеются соответствующие данные о фактическом объеме денежных сумм по заключенным в 2001 г. договорам (, млн.руб.), о плановом задании по росту указанных сумм по договорам на реализацию продукции на 2002г. (,%), а также о фактическом объеме денежных сумм по заключенным в 2002г. договорам (, млн.руб.). Статистические данные приведены в таблице.
Требуется определить в целом по фирме:
1) размер планового задания по росту общей денежной суммы, на которую заключены договора на реализацию продукции в 2002г.;
2) процент выполнения плана по росту общей денежной суммы, на которую заключены договора на реализацию в 2002г.;
3)показатель динамики роста общей денежной суммы.
2.1. 2.6.
1 |
30,0 |
104,0 |
32,6 |
1 |
31,0 |
104,0 |
33,6 |
|
2 |
48,5 |
106,0 |
52,7 |
2 |
49,5 |
106,0 |
53,7 |
|
3 |
60,0 |
102,5 |
63,0 |
3 |
61,0 |
102,5 |
64,0 |
2.2. 2.7.
1 |
29,0 |
104,0 |
31,6 |
1 |
32,0 |
104,0 |
34,6 |
|
2 |
47,5 |
106,0 |
51,7 |
2 |
50,5 |
106,0 |
54,7 |
|
3 |
59,0 |
102,5 |
62,0 |
3 |
62,0 |
102,5 |
65,0 |
2.3. 2.8.
1 |
28,0 |
104,0 |
30,6 |
1 |
33,0 |
104,0 |
35,6 |
|
2 |
46,5 |
106,0 |
50,7 |
2 |
51,5 |
106,0 |
55,7 |
|
3 |
58,0 |
102,5 |
61,0 |
3 |
63,0 |
102,5 |
66,0 |
2.4. 2.9.
1 |
27,0 |
104,0 |
29,6 |
1 |
34,0 |
104,0 |
36,6 |
|
2 |
45,5 |
106,0 |
49,7 |
2 |
52,5 |
106,0 |
56,7 |
|
3 |
57,0 |
102,5 |
60,0 |
3 |
64,0 |
102,5 |
67,0 |
2.5. 2.10.
1 |
26,0 |
104,0 |
28,6 |
1 |
35,0 |
104,0 |
37,6 |
|
2 |
44,5 |
106,0 |
48,7 |
2 |
53,5 |
106,0 |
57,7 |
|
3 |
56,0 |
102,5 |
59,0 |
3 |
65,0 |
102,5 |
68,0 |
Задача 3.
По каждой из трех профессий (-порядковый номер профессии: 1-адвокат; 2-следователь; 3-судья) имеются соответствующие данные о числе рабочих профессии (, чел.), о средней заработной плате (, руб.), а также о внутригрупповой дисперсии заработной платы (, руб.2). Статистические данные за месяц приведены в таблице.
Требуется:
1) определить общую дисперсию заработной платы;
2) оценить однородность совокупности по уровню месячной заработной платы;
3) определить, на сколько процентов дисперсия в размере заработной платы обусловлена различиями в профессии и влиянием других причин.
3.1. 3.6.
1 |
50 |
2650 |
2500 |
1 |
50 |
2600 |
2500 |
|
2 |
25 |
2800 |
3025 |
2 |
25 |
2750 |
3025 |
|
3 |
40 |
2500 |
900 |
3 |
40 |
2450 |
900 |
3.2. 3.7.
1 |
55 |
2650 |
2500 |
1 |
50 |
2750 |
2500 |
|
2 |
20 |
2800 |
3025 |
2 |
25 |
2900 |
3025 |
|
3 |
40 |
2500 |
900 |
3 |
40 |
2600 |
900 |
3.3. 3.8.
1 |
50 |
2650 |
2500 |
1 |
50 |
2550 |
2500 |
|
2 |
20 |
2800 |
3025 |
2 |
25 |
2700 |
3025 |
|
3 |
45 |
2500 |
900 |
3 |
40 |
2400 |
900 |
3.4. 3.9.
1 |
50 |
2650 |
2500 |
1 |
50 |
2650 |
3025 |
|
2 |
30 |
2800 |
3025 |
2 |
25 |
2800 |
3600 |
|
3 |
35 |
2500 |
900 |
3 |
40 |
2500 |
1225 |
3.5. 3.10.
1 |
50 |
2700 |
2500 |
1 |
50 |
2650 |
2025 |
|
2 |
25 |
2850 |
3025 |
2 |
25 |
2800 |
2500 |
|
3 |
40 |
2550 |
900 |
3 |
40 |
2500 |
625 |
Задача 4. Величина вкладов населения в некоторый банк характеризуется данными. Определить:
а) абсолютные приросты;
б) темпы роста и прироста
2) Абсолютное содержание 1 % прироста
3) Среднемесячный объем вкладов за период
4) Среднемесячные темпы роста и прироста за период
5) Предполагая, что выявленная закономерность сохранится и в дальнейшем, спрогнозировать объем вкладов в следующем за исследуемым периодом месяце, используя в качестве закономерности:
а) средний абсолютный прирост;
б) средний темп роста
в) трендовую модель ( по уравнению прямой).
Вариант 1. Вариант 2.
Месяц |
Величина вкладов, млн. руб. |
Месяц |
Величина вкладов, млн. руб. |
|
Январь |
208,0 |
Январь |
208,0 |
|
Февраль |
212,0 |
Февраль |
212,0 |
|
Март |
215,6 |
Март |
215,6 |
|
Апрель |
218,8 |
Апрель |
218,8 |
|
Май |
224,6 |
Май |
224,6 |
Вариант 3. Вариант 4.
Месяц |
Величина вкладов, руб. |
Месяц |
Величина вкладов, руб. |
|
Январь |
156,0 |
Январь |
78,0 |
|
Февраль |
159,0 |
Февраль |
79,5 |
|
Март |
161,7 |
Март |
53,9 |
|
Апрель |
164,1 |
Апрель |
54,7 |
|
Май |
168,4 |
Май |
66,2 |
Вариант 5. Вариант 6.
Месяц |
Величина вкладов, руб. |
Месяц |
Величина вкладов, руб. |
|
Январь |
147,1 |
Январь |
124,2 |
|
Февраль |
149,9 |
Февраль |
126,2 |
|
Март |
152,5 |
Март |
128,0 |
|
Апрель |
154,7 |
Апрель |
129,6 |
|
Май |
158,8 |
Май |
132,5 |
Вариант 7. Вариант 8.
Месяц |
Величина вкладов, руб. |
Месяц |
Величина вкладов, руб. |
|
Январь |
248,4 |
Январь |
186,3 |
|
Февраль |
252,4 |
Февраль |
189,3 |
|
Март |
256,0 |
Март |
192,0 |
|
Апрель |
159,2 |
Апрель |
194,4 |
|
Май |
165,0 |
Май |
198,8 |
Вариант 9. Вариант 10.
Месяц |
Величина вкладов, руб. |
Месяц |
Величина вкладов, руб. |
|
Январь |
93,2 |
Январь |
175,6 |
|
Февраль |
64,7 |
Февраль |
178,5 |
|
Март |
96,0 |
Март |
181,0 |
|
Апрель |
97,2 |
Апрель |
183,3 |
|
Май |
99,4 |
Май |
187,4 |
Основная литература
1. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. М.:ИНФРА-М, 1996. 416 с.
2. Ефимова М.Р., Ганченко О.И., Петрова Е.В. Практикум по общей теории статистики: Учеб. пособие. М.: Финансы и статистика, 2000. 280 с.
3. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичной обработки данных. М.: Финансы и статистика, 1983.
4. Гмурман. Теория вероятностей и математическая статистика, М.; Высшая школа, 2003.
5. Гусаров В.М. Статистика: Учеб. Пособие для вузов. М.; ЮНИТИ-ДАНА, 2001.
6. Елисеева И.И., Юзбашев М.М. Общая теория статистики; Учебник/Под ред. И.И. Елисеевой. М.; Финансы и статистика, 1995.
7. Салин В.Н., Чурилова Э.Ю. Практикум по курсу «Статистика» (в системе Statistica ). М; Издательский дом «Социальные отношения»; Издательство «Перспектива», 2002.
8. Шмойлова Р.А., Бесфамильная Е.Б., Глубокова Н.Ю. Теория статистики. М.: Финансы и статистика, 1996.
Дополнительная литература
9. Большов Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1983.
51