Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
СТАТИСТИКА
Важным этапом статистического исследования является сводка комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.
Отдельные единицы статистической совокупности объединяются в группы при помощи метода группировки. Это позволяет сжать информацию, полученную в ходе наблюдения, и на этой основе выявить закономерности.
Статистические группировки по задачам, решаемым с их помощью, делятся на: типологические, структурные и аналитические.
Для определения оптимального числа групп при проведении группировки по количественному признаку используются формула Стерджесса:
,
где N объем совокупности.
Задача. За отчетный период имеются следующие данные о производственных показателях предприятий одной из отраслей промышленности.
№ завода |
Среднегодовая стоимость основных фондов, млн. руб. |
Товарная продукция, млн. руб. |
№ завода |
Среднегодовая стоимость основных фондов, млн. руб. |
Товарная продукция, млн. руб. |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
12,8 |
18,0 |
16 |
7,3 |
11,2 |
2 |
7,8 |
12,0 |
17 |
2,9 |
4,2 |
3 |
4,3 |
11,9 |
18 |
4,5 |
4,9 |
4 |
0,8 |
0,9 |
19 |
5,3 |
9,6 |
5 |
4,1 |
5,5 |
20 |
1,4 |
3,2 |
6 |
8,6 |
14,6 |
21 |
7,6 |
8,6 |
7 |
4,3 |
4,8 |
22 |
3,6 |
4,6 |
8 |
5,5 |
5,5 |
23 |
4,4 |
6,7 |
9 |
4,3 |
4,8 |
24 |
6,9 |
8,4 |
10 |
9,1 |
10,9 |
25 |
4,6 |
6,8 |
1 |
2 |
3 |
4 |
5 |
6 |
11 |
5,2 |
9,7 |
26 |
5,8 |
6,9 |
12 |
4,9 |
7,2 |
27 |
11,7 |
17,9 |
13 |
12,7 |
21,6 |
28 |
7,4 |
10,6 |
14 |
6,9 |
7,6 |
29 |
8,9 |
17,8 |
15 |
5,2 |
9,7 |
30 |
10,9 |
18,9 |
Произведите аналитическую группировку предприятий по стоимости основных промышленно-производственных фондов, образовав 4 группы предприятий с равными интервалами.
По каждой группе и по итогу в целом подсчитайте:
Результаты представьте в виде групповой таблицы, сделайте выводы.
Решение.
Факторным признаком в данном случае является величина основных промышленно-производственных фондов. Определим величину интервала:
, , , , .
2. Обозначим границы групп:
Группа |
Фонды, млн. руб. |
||
1 |
0,8 |
|
3,8 |
2 |
3,8 |
|
6,8 |
3 |
6,8 |
|
9,8 |
4 |
9,8 |
|
12,8 |
3. Составим рабочую таблицу.
предприятий по стоимости основных промышленно-производственных
фондов [I группа предприятий (0,8 3,8 млн. руб.)]
Номера предприятий |
Стоимость основных фондов, млн. руб. |
Товарная продукция в сопоставимых ценах, млн. руб. |
4 |
0,8 |
0,9 |
17 |
2,9 |
4,2 |
20 |
1,4 |
3,2 |
22 |
3,6 |
4,6 |
Итого 4 |
8,7 |
12,9 |
II группа предприятий (3,8 6,8 млн. руб.)
Номера предприятий |
Стоимость основных фондов, млн. руб. |
Товарная продукция в сопоставимых ценах, млн. руб. |
3 |
4,3 |
11,9 |
5 |
4,1 |
5,5 |
7 |
4,3 |
4,8 |
8 |
5,5 |
5,5 |
9 |
4,3 |
4,8 |
11 |
5,2 |
9,7 |
12 |
4,9 |
7,2 |
15 |
5,2 |
9,7 |
18 |
4,5 |
4,9 |
19 |
5,3 |
9,6 |
23 |
4,4 |
6,8 |
25 |
4,6 |
6,8 |
26 |
5,8 |
6,9 |
Итого 13 |
62,4 |
94,0 |
III группа предприятий (6,8 9,8 млн. руб.)
Номера предприятий |
Стоимость основных фондов, млн. руб. |
Товарная продукция в сопоставимых ценах, млн. руб. |
2 |
7,8 |
12,0 |
6 |
8,6 |
14,6 |
10 |
9,1 |
10,9 |
14 |
6,9 |
7,6 |
16 |
7,3 |
11,2 |
21 |
7,6 |
8,6 |
24 |
6,9 |
8,4 |
28 |
7,4 |
10,6 |
29 |
8,9 |
17,8 |
Итого 9 |
70,5 |
101,7 |
IV группа предприятий (9,8 12,8 млн. руб.)
Номера предприятий |
Стоимость основных фондов, млн. руб. |
Товарная продукция в сопоставимых ценах, млн. руб. |
1 |
12,8 |
18,0 |
13 |
12,7 |
21,6 |
27 |
11,7 |
17,9 |
30 |
10,9 |
18,9 |
Итого 4 |
48,1 |
76,4 |
Всего 30 |
189,7 |
285,0 |
предприятий по стоимости основных
промышленно-производственных фондов
Группы предпри-ятий |
Коли-чество предпри-ятий |
Стоимость фондов, млн. руб. |
Товарная продукция в сопоставимых ценах, млн. руб. |
||
всего |
в среднем на 1 предприятие |
всего |
в среднем на 1 предприятие |
||
до 3,8 |
4 |
8,7 |
2,2 |
12,9 |
3,2 |
3,8 6,8 |
13 |
62,4 |
4,8 |
94,0 |
7,2 |
6,8 9,8 |
9 |
70,5 |
7,8 |
101,7 |
11,3 |
свыше 9,8 |
4 |
48,1 |
12,0 |
76,4 |
19,1 |
Итого |
30 |
189,7 |
6,3 |
285,0 |
9,5 |
По анализируемой совокупности заводов, в среднем на одно предприятие основных промышленно-производственных фондов приходится 6,3 млн. руб., товарная продукция в сопоставимых ценах 9,5 млн. руб. Сопоставление колонок 4 и 6 позволяет сделать вывод о наличии зависимости между ростом фондов и стоимостью произведенной продукции.
Правила составления и оформления статистических таблиц:.
1. Таблица должна быть небольшой по объему. При необходимости наложения большого табличного материала нужно составить несколько самостоятельных таблиц.
2. Тематическое название таблицы, графы ее шапки следует сформулировать кратко и четко. Название таблицы должно характеризовать ее основное содержание. В графах и головке указывают время, место события и общую единицу измерения. Если единицы измерения разные, они указываются в отдельной графе.
3. Показатели подлежащего и сказуемого располагают в определенной логической последовательности: по принципу от частного к общему, т.е. сначала показывают слагаемые, а в конце подводят итоги. Если приводятся не все слагаемые, а выделяются наиболее важные из них, то сначала показывают общие итоги, а затем дают пояснения «в том числе».
4. Если таблица не умещается на странице, то все графы нумеруются и при переносе таблицы на другую страницу головка не повторяется, а указываются только номера граф.
5. Данные всех граф должны приводиться с одинаковой степенью точности. Ничтожно малые величины обозначаются следующим образом: 0,0 значительно меньше 0,1; 0,00 значительно меньше 0,01.
6. При заполнении таблицы пользуются следующими условными обозначениями: в случае, если нет данных и они не могут быть получены, ставят многоточие или пишут «Нет свед.»; нулевые значения признака обозначают знаком (-). При наличии клеток, не подлежащих заполнению, ставят знак (х).
7. Таблицы, как правило, должны быть замкнутыми, т.е. иметь итоги по группам, подгруппам («Итого») и в целом по таблице («Всего»).
Задание № 2 (самостоятельно)
Таблица основные показатели деятельности коммерческих банков (распечатанная таблица)
Тема 2: ОТНОСИТЕЛЬНЫЕ ВЕЛИЧИНЫ
Относительный показатель представляет собой результат деления одного абсолютного показателя на другой и выражает соотношение между количественными характеристиками явлений. Относительные показатели являются производными (вторичными). При этом абсолютный показатель, находящийся в числителе отношения, называется текущим (сравниваемым); показатель, с которым производится сравнение и который находится в знаменателе, называется основанием или базой сравнения. Относительные показатели могут выражаться в коэффициентах, процентах, промилле и т.д.
Все используемые на практике относительные статистические показатели можно разделить на виды:
Задача. По промышленному предприятию за отчетный год имеются следующие данные о выпуске продукции:
Наименование продукции |
План на I квартал, тыс. т. |
Фактический выпуск, тыс. т. |
Отпускная цена за 1 т., руб. |
||
январь |
февраль |
март |
|||
Сталь арматур-ная |
335 |
110 |
115 |
108 |
1700 |
Прокат листо-вой |
255 |
75 |
90 |
100 |
2080 |
Определить процент выполнения квартального плана по выпуску каждого вида продукции и в целом по выпуску всей продукции.
Решение.
Фактический выпуск каждого вида продукции за I квартал следующий:
сталь арматурная ;
прокат листовой
Процент выполнения квартального плана по выпуску каждого вида продукции:
сталь арматурная:
т.е. фактический выпуск ниже плана на 0,6% (99,4 100);
прокат листовой: .
т.е. план перевыполнен на 3,9% (103,9 100).
Для расчета выполнения плана по выпуску всей продукции необходимо определить общий итог продукции по плану и фактический в денежном выражении:
;
Процент выполнения плана по выпуску всей продукции:
.
Следовательно, план выпуска всей продукции перевыполнен на 1,6%.
Задание № 3: (самостоятельно) оформить статистическую совокупность в табличном виде. В качестве единиц совокупности будут выступать субъекты РФ 2-х Федеральных округов (на выбор), выбираем статистику по трем показателям за 2011 год, один из которых численность населения. Включить в исходную (рабочую) таблицу «итого по РФ» и «итого по ФО», для того, чтобы в итоговой таблице рассчитать относительные показатели для субъектов РФ.
В итоговой таблице сгруппировать субъекты РФ в 3 группы, в качестве факторного признака выбираем численность населения субъекта РФ за 2011 г., остальные два признака за 2011 год выбираем самостоятельно. *
Для каждого субъекта РФ по всем трем показателям рассчитываем относительные показатели (соотносим с показателем Федерального округа, в который входит субъект РФ и с показателем по РФ в целом).
Итоговая таблица
Субъекты РФ |
Численность, тыс. чел. |
% от численности ФО |
% от численности РФ |
ВРП, млн. руб. |
Основные фонды, млн. руб. |
|||||
1 группа |
||||||||||
Итого: |
||||||||||
2 группа |
||||||||||
Итого: |
||||||||||
3 группа |
||||||||||
Итого: |
||||||||||
Итого: |
* Можно усложнить задачу и каждую группу разбить на 2 подгруппы по другому факторному признаку.
Для характеристики колеблемости признака используется ряд показателей. Наиболее простой из них размах вариации, определяемый как разность между наибольшим и наименьшим значениями вариантов: . Чтобы дать обобщающую характеристику распределения отклонений, исчисляют среднее линейное отклонение , которое учитывает различия всех единиц изучаемой совокупности. Среднее линейное отклонение определяется как средняя арифметическая из отклонений индивидуальных значений от средней без учета знака этих отклонений:
- простое;
- взвешенное.
На практике меру вариации более объективно отражает показатель дисперсии (σ2 средний квадрат отклонений), определяемый как средняя из отклонений, возведенных в квадрат: :
простая;
взвешенная.
Корень квадратный из дисперсии σ2 «среднего квадрата отклонений» представляет собой среднее квадратическое отклонение:
.
Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.
Для целей сравнения колеблемости различных признаков в одной и той же совокупности или при сравнении колеблемости одного и того же признака в нескольких совокупностях используются относительные показатели вариации:
Наиболее часто в практических расчетах применяется показатель относительной вариации коэффициент вариации. Совокупность считается однородной , если V < 33%.
Задача. Известен тарифный разряд 60 рабочих: 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6.
Построить дискретный ряд распределения. Вычислить показатели центра распределения и вариации.
Решение. Найдем частоту fi каждой варианты xi:
Тарифный разряд, xi |
2 |
3 |
4 |
5 |
6 |
Число рабочих, fi |
8 |
16 |
17 |
12 |
7 |
Найдем средний тарифный разряд рабочих по формуле средней арифметической взвешенной:
Для нахождения остальных величин построим вспомогательную таблицу:
xi |
fi |
Расчетные показатели |
|||
2 |
8 |
1,9 |
15,2 |
3,61 |
28,88 |
3 |
16 |
0,9 |
14,4 |
0,81 |
12,96 |
4 |
17 |
0,1 |
1,7 |
0,01 |
0,17 |
5 |
12 |
1,1 |
13,2 |
1,21 |
14,52 |
6 |
7 |
2,1 |
14,7 |
4,41 |
30,87 |
Итого |
60 |
|
59,2 |
|
87,04 |
Среднее линейное отклонение:
Дисперсия: .
Среднее квадратическое отклонение: .
Коэффициент вариации: . Это означает, что совокупность однородная.
Задание № 4 самостоятельно: По данным распределения возраста студентов одного из факультетов вуза
Группы студентов по возрасту x, лет |
Число студентов fi |
17 |
10 |
18 |
70 |
19 |
80 |
20 |
100 |
21 |
120 |
22 |
160 |
23 |
90 |
Итого |
630 |
Определить: размах вариации, среднее квадратическое отклонение, коэффициент вариации и сделать вывод об однородности совокупности.
Задача. Имеются следующие данные о возрастном составе рабочих цеха (лет): 18; 38; 28; 29; 26; 38; 34; 22; 28; 30; 22; 23; 35; 33; 27; 24; 30; 32; 28; 25; 29; 26; 31; 24; 29; 27; 32; 25; 29; 29.
Для анализа распределения рабочих цеха по возрасту требуется: 1) построить интервальный ряд распределения; 2) дать графическое изображение ряда; 3) исчислить показатели центра распределения, показатели вариации и формы распределения. Сформулировать вывод.
Решение.
1. Величина интервала группировки определяется по формуле:
,
где n принимаем равным 7.
Группы рабочих по возрасту (лет), х |
Число рабочих, f |
Накопленная частота, S |
18 21 |
1 |
1 |
21 24 |
3 |
4 |
24 27 |
6 |
10 |
27 30 |
10 |
20 |
30 33 |
5 |
25 |
33 36 |
3 |
28 |
36 39 |
2 |
30 |
Итого |
30 |
|
2. Графически интервальный вариационный ряд может быть представлен в виде гистограммы, полигона, кумуляты.
Гистограмма строится в прямоугольной системе координат. По оси абсцисс откладывают интервалы значений вариационного признака, причем число интервалов целесообразно увеличить на два (по одному в начале и в конце имеющегося ряда) для удобства преобразования гистограммы в полигон частот. На отрезках (интервалах) строятся прямоугольники, высота которых соответствует частоте.
Построим полигон для полученного интервального ряда.
На Рис. 1. Гистограмма и полигон распределения рабочих цеха по возрасту
3. Найдем среднюю арифметическую для данного интервального ряда:
где х/ среднее значение признака в интервале (центр интервала).
Для расчета показателей вариации составляется вспомогательная таблица.
Группы рабочих по возрасту, лет |
Центр интервала, лет (х/) |
f |
x/ f |
d= x/-x |
/d/ f |
d2 |
d2 f |
18 21 |
19,5 |
1 |
19,5 |
- 9,2 |
9,2 |
84,64 |
84,64 |
21 24 |
22,5 |
3 |
67,5 |
- 6,2 |
18,6 |
28,44 |
115,32 |
24 27 |
25,5 |
6 |
153,0 |
- 3,2 |
19,2 |
10,24 |
61,44 |
27 30 |
28,5 |
10 |
285,0 |
- 0,2 |
20,0 |
0,04 |
0,40 |
30 33 |
31,5 |
5 |
157,5 |
2,8 |
14,0 |
7,84 |
39,20 |
33 36 |
34,5 |
3 |
103,5 |
5,8 |
17,4 |
33,64 |
100,92 |
36 39 |
37,5 |
2 |
75,0 |
8,8 |
17,6 |
77,44 |
154,88 |
Итого |
|
30 |
861,0 |
|
116,0 |
|
556,80 |
среднее линейной отклонение
среднее квадратическое отклонение
коэффициент вариации
.
Следовательно, вариация возраста у рабочих данного цеха не является значительной, что подтверждает достаточную однородность совокупности.
Структурные средние мода и медиана - используются для изучения внутреннего строения рядов распределения значений признака.
Мода (Mo) наиболее часто повторяющееся значение признака.
В дискретном ряду мода это варианта с наибольшей частотой.
Пример. Количество проданной обуви представлено в таблице:
Размер |
34 |
35 |
36 |
37 |
38 |
39 |
40 |
Число пар |
2 |
10 |
20 |
88 |
19 |
9 |
1 |
Mo = 37.
В интервальном вариационном ряду модой приближенно считают центральную варианту так называемого модального интервала.
Мода для интервального ряда находится по формуле:
,
где xMo нижняя граница модального интервала;
iMo величина модельного интервала;
fMo частота, соответствующая модальному интервалу;
fMo-1 частота интервала, предшествующего модальному;
fMo+1 частота интервала, следующего за модальным.
Пример:
Стаж (лет) |
Число работников |
до 2 |
4 |
2 4 |
23 |
4 6 |
20 |
6 8 |
35 |
8 10 |
11 |
свыше 10 |
7 |
.
Медиана (Mе) величина признака, которая делит упорядоченную последовательность его значений на 2 равные по численности части. Поэтому у одной половины единиц совокупности значение признака не превышает медианного, а у другой не меньше его.
Медиана Ме в ранжированном ряду (т.е. построенном в порядке возрастания или убывания) вычисляется следующим образом:
.
Для интервальных рядов медиану считают по формуле:
,
где x0 нижняя граница медианного интервала;
порядковый номер медианы;
SMе-1 накопленная частота медианного интервала;
fMе частота медианного интервала.
Пример. Определить медиану в заданном распределении рабочих по размеру заработной платы.
Месячная заработная плата |
Число рабочих, fi |
Накопленная частота, S |
400 500 |
10 |
10 |
500 600 |
20 |
20 |
600 700 |
48 |
78 |
700 800 |
60 |
138 |
800 900 |
42 |
180 |
900 1000 |
40 |
200 |
220 |
|
Определяем порядковый номер (N) медианы:
.
По накопленным частотам видно, что стодесятая единица находится в интервале (700 800).
.
Задание № 5 самостоятельно. Найти структурные средние для интервального ряда из предыдущего параграфа.
Группы рабочих по возрасту (лет), х |
Число рабочих, f |
Накопленная частота, S |
18 21 |
1 |
1 |
21 24 |
3 |
4 |
24 27 |
6 |
10 |
27 30 |
10 |
20 |
30 33 |
5 |
25 |
33 36 |
3 |
28 |
36 39 |
2 |
30 |
Итого |
30 |
|
Тема 5: Выборочное наблюдение
Генеральная совокупность вся исследуемая совокупность.
Выборочная совокупность это единицы, отобранные из генеральной совокупности.
Выборочное наблюдение это статистическое исследование, при котором наблюдению подвергаются не все единицы совокупности, а лишь ее определенная часть.
Цель выборочного наблюдения определение характеристик генеральной совокупности, таких как: среднее значение, дисперсия (мера отклонения от средней).
Характеристики выборочной совокупности: выборочная средняя и выборочная доля отличаются от генеральных характеристик на величину ошибки выборки .
Поэтому для определения характеристик генеральной совокупности вычисляют ошибку выборки (или ошибку репрезентативности), которая определяется по формулам, разработанным в теории вероятностей для каждого вида выборки и способа отбора.
ОШИБКА РЕПРЕЗЕНТАТИВНОСТИ
Предельная ошибка выборки:
,
где t коэффициент, вычисляемый по таблицам в зависимости от вероятности;
μ средняя ошибка выборки.
Наиболее часто используются вероятности, которым соответствуют следующие значения t:
Р |
0,95 |
0,954 |
0,997 |
t |
1,96 |
2 |
3 |
Соотношение между генеральной и выборочными дисперсиями:
,
где генеральная дисперсия;
выборочная дисперсия;
n численность выборки.
Средняя ошибка собственно-случайной выборки:
;
,
где N численность генеральной совокупности.
Средняя ошибка механической выборки:
.
НЕОБХОДИМЫЙ ОБЪЕМ ВЫБОРКИ ПРИ ОПРЕДЕЛЕНИИ
СРЕДНЕГО ЗНАЧЕНИЯ ПРИЗНАКА
Необходимый объем собственно-случайной и механической выборки:
;
.
Задача. Из партии электроламп взята 20%-ная случайная бесповторная выборка для определения среднего веса спирали (предполагаем, что отклонение веса спирали от номинального имеет нормальное распределение: если на какой-то параметр действует некоторое кол-во независимых факторов, каждый из которых не имеет решающего значения, то распределение вероятности стремится к известному закону, который называется нормальным, в противном случае, необходимы дополнительные исследования по определению распределения вероятности).
Результаты выборки следующие:
Вес, мг |
38 - 40 |
40 - 42 |
42 - 44 |
44 - 46 |
Число спиралей |
15 |
30 |
45 |
10 |
Определить с вероятностью 0,95 доверительные пределы, в которых лежит средний вес партии электроламп.
Решение.
Доверительные интервалы для генеральной средней с вероятностью Р:
,
- средний уровень признака по выборке (выборочная средняя)
численность генеральной совокупности
При вероятности Р = 0,95 t = 1,96 (по таблице).
Р |
0,95 |
0,954 |
0,997 |
t |
1,96 |
2 |
3 |
Найдем выборочную дисперсию (меру вариации):
Найдем ошибку выборки по формуле
Доверительные интервалы для генеральной средней с вероятностью Р = 0,95:
Задание № 6 самостоятельно
7.12, 7.13, 7.14. 7.15
Число рабочих (f)
озраст,
лет (х)
10
8
6
4
2
18
21
24
27
30
33
36
39
42