Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Тема 3 Сводка и группировка статистических данных Не в совокупности ищи единства но более ~ в единообра

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 9.11.2024

Тема 3. Сводка и группировка статистических данных

Не в совокупности ищи единства, но более –

в единообразии разделения

Козьма Прутков, Плоды раздумья

План

1

Содержание и виды статистической сводки

2

Метод и задачи группировки. Виды группировок

3

Принципы построения статистических группировок

4

Классификации. Многомерные группировки

5

Статистические таблицы

6

Графическое изображение статистических данных

Первичный материал статистического наблюдения, собранный в виде отчетности, анкет и других документов представляет собой сведения об отдельных единицах исследуемого объекта. Однако, на основе этой разрозненной, необобщенной информации нельзя выявить качественные и количественные закономерности, присущие всему исследуемому объекту, то есть нельзя достигнуть цели статистического наблюдения. Именно поэтому на этапе статистического анализа, следующем за статистическим наблюдением, первичные данные должны быть систематизированы и обобщены. Этот сложный, но чрезвычайно важный процесс происходит на этапе сводки и группировки результатов статистического наблюдения.

3.1. Содержание и виды статистической сводки

Сводка является следующим после статистического наблюдения этапом статистической работы, подводящим нас к цели статистического исследования вообще – к цифровому освещению явлений и процессов. Сводка представляет собой научно организованную обработку материалов наблюдения, в ходе которой проводится контроль собранных данных, их систематизация и группировка, а также построение таблиц и графиков, расчет итогов и производных показателей в виде средних и относительных величин.

Целью сводки является получение обобщающих статистических показателей, отражающих сущность и статистические закономерности анализируемого социально-экономического явления.

Программа статистической сводки разрабатывается до начала сбора статистических данных. Ее разработка осуществляется в рамках составления плана и программы статистического наблюдения. Программа сводки включает:

  1.  определение групп и подгрупп, по которым классифицируется статистическая совокупность;
  2.   разработку системы показателей, характеризующих группы и статистическую совокупность в целом;
  3.  разработку макетов статистических таблиц для представления результатов сводки.

По глубине обработки материала различают простую и сложную сводку.

Простая сводка предполагает подсчет общих итогов по совокупности в целом.

При сложной сводке проводится целый комплекс операций, включающий в себя группировку единиц наблюдения, подведение групповых и общих итогов, а также оформление результатов в виде статистических таблиц.

По форме обработки материала сводка бывает централизованной и децентрализованной.

При централизованной сводке весь процесс обработки информации от первичного материала до получения итоговых показателей происходит в одной организации (комитет, фонд, комиссия). Централизованная сводка характерна для единовременных статистических обследований.

При децентрализованной сводке обработка материала поэтапно проводится несколькими организациями (структурными подразделениями). Так, при обработке статистической отчетности отчеты предприятий и организаций сводятся территориальными статистическими органами по каждому субъекту РФ, а итоги по региону передаются в Росстат, который определяет экономические показатели по России в целом.

3.2. Метод группировки. Виды группировок

Статистическая сводка осуществляется методом группировки.

Группировки – это распределение единиц по группам в соответствии со следующим принципом: различия между единицами, отнесенными к одной группе, должны быть меньше, чем между единицами, отнесенными к разным группам.

Разделение явлений на группы обусловлено наличием вариации

Под группировкой понимают расчленение множества единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучения их структуры и взаимосвязей.

Группировка позволяет систематизировать данные наблюдения. Результатом группировки является превращение исходных данных в упорядоченную статистическую информацию, необходимую для проведения статистического анализа.

Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

С помощью метода группировок решаются следующие задачи:

  •  выделение социально-экономических типов явлений;
  •  изучение структуры явления и структурных сдвигов, происходящих в нем;
  •  выявление взаимосвязи и взаимозависимости между явлениями.

В ходе проведения группировки необходимо выбрать группировочный признак, определить интервалы группировки и рассчитать число групп.

Группировочным называется признак, по которому происходит объединение отдельных единиц совокупности в группы, однородные по этому признаку. При этом признаки, по которым проводится группировка, могут быть как атрибутивными, то есть качественными (пол, образование, национальность), так и количественными (возраст, величина дохода, размер прибыли).

В зависимости от задач исследования и признаков, положенных в основу группировки, различают типологические, структурные и аналитические группировки.

 Типологическая группировка предполагает разделение единиц наблюдения качественно разнородной совокупности на классы, социально-экономические типы и однородные группы. Например, распределение совокупности предприятий по отраслям экономики, формам собственности и ряду других признаков. В основе типологической группировки, как правило, лежит качественный признак. Так, например, в таблице 1 основанием группировки является признак административного деления территории.

Таблица 1

Административно-территориальное деление Российской Федерации

(на 1 января 2010 г.)

Административная единица

Всего

Республика

21

Край

9

Область

46

Город федерального значения

2

Автономная область

1

Автономный округ

4

Район

1868

Город, в том числе федерального значения

1099

Городской районы и округ

328

Поселок городского типа

1395

Источник: Регионы России, 2010:Стат. справочник/Росстат. – М., 2010. – С. 7.

Другими примерами типологической группировки могут служить: группировки хозяйственных объектов по формам собственности, видам экономической деятельности, населения по общественным группам.

При структурной группировке проводится разделение единиц однородной совокупности на группы с целью выявления структуры по одному из признаков. Посредством структурной группировки анализируется, например, состав населения по полу, возрасту, месту проживания, величине доходов и т.д. В основе структурной группировки, как правило, лежит количественный признак.

Таблица 2

Распределение населения РФ

по величине среднедушевых денежных доходов в 2009гг.

( в процентах в итогу)

 

2009

Все население

100

в том числе со среднедушевыми
денежными доходами в месяц, руб.:

до 4000,0

7,4

4000,1-6000,0

10,3

6000,1-8000,0

11,1

8000,1-10000,0

10,4

10000,1-15000,0

20,4

15000,1-20000,0

13,3

20000,1-30000,02)

14,1

свыше 30000,0

13,0

Источник: Социальное положение и уровень жизни населения России. 2010. Стат.сб. / Росстат - M., 2010.

 

Социально-экономические явления и отражающие их признаки взаимосвязаны между собой. Для выявления взаимосвязей между отдельными признаками исследуемого социально-экономического явления используется аналитическая группировка.

Посредством аналитической группировки можно выявить взаимосвязи между затратами на производство продукции и прибылью, доходами семьи и ее сбережениями, числом посетителей супермаркета и величиной выручки и т.д. При этом признаки, взаимодействующие между собой подразделяют на факторные (независимые) и результативные (зависимые). Результативные признаки изменяются под воздействием факторных признаков. Например, затраты на производство – факторный (независимый) признак, под воздействием которого изменяется выручка, как результативный (зависимый) признак. По результатам аналитической группировки можно определить направление связи между признаками. Так, если с увеличением (уменьшением) факторного признака растут (снижаются) значения результативного признака, то есть движение признаков однонаправлены, то связь называют прямой. Если же движение признаков разнонаправлены, то есть с увеличением (уменьшением) факторного признака снижаются (растут) значения результативного признака, то связь называют обратной.

Особенностью аналитической группировки является то, что в качестве группировочного признака всегда выбирается факторный признак, а каждая выделенная группа характеризуется средними значениями результативного признака. Пример аналитической группировки, представленный в таблице 3, позволяет утверждать, что между ставкой кредитования и средней суммой выданного кредита существует обратная связь.

Таблица 3

Группировка процентных ставок по

объемам выданных кредитов банка N (условные данные)

Ставка кредитования, %

Количество выданных кредитов

Сумма выданных кредитов, тыс. руб.

До 9

45

485

9-11

29

311

11-13

20

257

13-15

14

180

Свыше 15

9

90

Итого

117

329,094

Необходимо отметить, что вследствие многообразия реальных связей между объектами социально-экономического явления его полная характеристика возможна только в том случае, что применяется система признаков (система показателей). Подобный комплексный подход позволяет выявить реальные взаимосвязи, взаимоотношения отдельных сторон процесса и отобразить процесс развития анализируемого явления.

Если группировка произведена по одному признаку, то она называется простой. Так, в таблице 4 произведена группировка по одному признаку – ставке кредитования.

Если же разделение совокупности на группы производится по двум и более признакам, то группировку называют сложной. Сложная группировка может быть выполнена в виде многомерной или комбинационной группировки.

Многомерная группировка основана на измерении сходства или различий между единицами совокупности. Она осуществляется не последовательно по отдельным признакам, а одновременно по комплексу признаков. Единицы, отнесенные к одной группе, имеют между собой меньше различий, чем единицы, отнесенные к другой группе. Нахождение этих групп осуществляется методами кластерного анализа при помощи таких специализированных пакетов программ, как Statistica, SPSS, SAS и ряда других.

Частным случаем многомерной группировки является комбинационная группировка, при которой группы, выделенные по одному признаку, подразделяются на группы по другому признаку и т.д., то есть в основании группировки лежат несколько признаков, взятых в комбинации.

Таблица 4

Внешнеторговый оборот России в 2006 г.

Внешнеторговые операции

В том числе

Объем операций, млрд. долл. США

Со странами дальнего зарубежья

экспорт

импорт

261,1

138,6

Итого оборот со странами дальнего зарубежья

399,7

Со странами СНГ

экспорт

импорт

43,4

25,2

Итого оборот со странами СНГ

68,7

Всего

экспорт

импорт

304,5

163,9

Итого внешнеторговых операций

468,4

Составлено по источнику: Россия 2007:Стат. справочник/Росстат. – М., 2007. – С.47.

В таблице 5 по первому признаку – признаку страны выделены две группы – операции со странами дальнего зарубежья и операции со странами СНГ. По второму признаку - признаку направления операций также выделены два признака – экспорт и импорт.

Нередки случаи, когда качественный признак, лежащий в основе группировки, имеет большое число разновидностей и перечислить их все не представляется целесообразным. Например, профессии рабочих, номенклатура выпускаемой продукции, виды основных фондов и т.п. Для таких и многих других хорошо изученных социально-экономических явлений и процессов предусмотрено устойчивое разбиение этих совокупностей на группы достаточно однородных явлений. В таких случаях разрабатывают классификацию разновидностей, т.е. сходные по своим особенностям разновидности объединяются в группы (классы). Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия.

Отличительными чертами классификаций является:

  •  в их основе лежит качественный признак;
  •  классификации стандартны и устанавливаются органами государственной и международной статистики;

Классификации играют большую роль при систематизации статистических данных. Они служат нормативом, в соответствии с которым группируется статистическая информация. Классификации не остаются неизменными. Например, классификация форм собственности, разработанная в плановой экономике, не соответствует требованиям рыночной экономики, поэтому в настоящее время в РФ действует иной классификатор форм собственности, чем двадцать лет назад.

Следует учитывать, что полную характеристику каждому типу явлений можно дать при использовании системы признаков (системы показателей). Только совокупность признаков позволяет отобразить процессы развития, всесторонне выявить реальные связи, взаимоотношения отдельных сторон процесса.

В ходе проведения экономического анализа часто приходится проводить перегруппировку данных по новым границам. Как правило, массив первичных данных при этом является недоступным. В этом случае приходится осуществлять вторичную группировку, в виде образования новых групп на основе ранее сгруппированных данных, без использования массива первичных данных. Вторичная группировка может быть осуществлена двумя методами: методом объединения первоначальных интервалов или методом долевой перегруппировкой.

Пример 1. Рассмотрим реализацию этих методов на примере, исходные данные для которого приведены в таблице 6.

Таблица 5

Распределение супермаркетов сети по объему среднедневной выручки

Средний размер дневной выручки, тыс. руб.

Количество супермаркетов

До 100

12

100-200

25

200-300

30

300-400

20

400-500

10

500-600

8

Итого

105

Метод объединения первоначальных интервалов используется в том случае, когда границы старых и новых групп совпадают. Перегруппируем данные, образовав новые интервалы: 0 - 200, 200 - 400, 400 - 600. Так как границы старых и новых интервалов совпадают, очевидно, что в первый «новый» интервал будут отнесены первый и второй «старые» интервалы, во второй «новый» интервал попадают третий и четвертый «старые» интервалы и т.д. При объединении интервалов суммируются и единицы наблюдения, прежде отнесенные к тому или иному интервалу. Результаты перегруппировки представлены таблице 7.

Таблица 6

Распределение супермаркетов сети по объему среднедневной выручки (вторичная группировка)

Размер дневной выручки, тыс. руб.

Количество супермаркетов

до 200

37

200 – 400

50

400 – 600

18

Итого

105

Метод долевой перегруппировки основывается на предпосылке равномерности распределения единиц наблюдения внутри границ интервальных групп. Предположим, что необходимо образовать новые интервалы: 0 – 120, 120 – 240, 240 – 360, 360 – 480, 480 – 600.

В первый вторичный интервал полностью войдет первый интервал первичной группировки и часть второго интервала, который разбивается на два отрезка: 100 – 120 и 120 – 200. Найдем долю, которая составляет длина отрезка 100 – 120 в первичном интервале 100 – 200 как . Таким образом из второго первичного интервала в первый вторичный интервал войдут 5 единиц (0,2*25), т.е. первый вторичный интервал будет содержать 17 супермаркетов(12+5). Второй «новый» интервал будет содержать 32 единицы, образовавшиеся как сумма оставшейся части второго первичного интервала - 20 единиц (25-5) и части третьего первичного интервала – 12 единиц (, и далее 0,4*30). Следующие три интервала будут образованы с использованием такой же техники.

Таблица 7

Распределение супермаркетов сети по объему среднедневной выручки (вторичная группировка с использованием метода долевой перегруппировки)

Размер дневной выручки, тыс. руб.

Количество супермаркетов

0 – 120

17

120 – 240

32

240 – 360

30

360 – 480

16

480 – 600

10

Итого

105

Метод долевой перегруппировки применяется также в тех случаях, когда приходится сравнивать несколько групп данных, имеющих разные границы группировки. В этом случае одна из группировок выбирается в качестве базовой, а все остальные перегруппировываются в соответствии с ее границами.

Понятие статистических таблиц

Результаты сводки и группировки можно представить в виде таблиц. Таблица – компактное изображение собранного материала. В таблицах наиболее наглядно проявляется связь между признаками изучаемого явления. Незаполненная цифрами статистическая таблица называется макетом. Макет таблицы – это сетка, состоящая из горизонтальных строк и вертикальных колонок (граф), каждая из которых имеет название. Клетки, образуемые на пересечении строк и колонок, заполняются статистическими данными.

Название таблицы

(общий заголовок)

Содержание строк

Наименование граф (верхние заголовки)

А

1

2

3

4

5

Наименование строк

(боковые заголовки)

Итоговая строка

Итоговая

графа

Таблица состоит из следующих элементов:

  •  заглавие таблицы, где отражено ее основное содержание;
  •  подлежащее, то о чем говориться в таблице, располагается в левой части таблицы по строкам. Подлежащим таблицы являются единицы статистической совокупности или их группы.
  •  сказуемое – признаки, характеризующие подлежащее. Располагается в правой части таблицы по графам. Сказуемое таблицы отражает то, что в ней говорится о подлежащем с помощью цифровых данных.
  •  сетка – пересечение горизонтальных и вертикальных линий;
  •  содержание – цифровая характеристика, которая заносится в клетки таблицы.

Все строки и графы таблицы должны иметь названия, повторяющиеся термины надо выносить в общие заголовки.

В строках и графах таблицы должны быть указаны единицы измерения, соответствующие показателям, содержащимся в подлежащем и сказуемом.

Все клетки таблицы должны быть заполнены. Причины отсутствия данных в той или иной клетке различны, поэтому при заполнении таблиц используют следующие условные обозначения:

  •  «…» (многоточие) – явление существует, но сведений о нем нет;
  •  «0» (нуль) – явление существует, но значение его показателя меньше половины единицы, принятой при округлении;
  •  «– » (тире) – явление отсутствует;
  •  «×» (крестик) – клетка не подлежит заполнению.

Необходимо указывать источники данных, приведенных в таблице.

По построению подлежащего различают простые, групповые и комбинационные таблицы.

В простых (перечневых) таблицах содержатся сводные показатели, относящиеся к перечню единиц наблюдения, или к перечню хронологических дат или территориальных подразделений, Соответственно таблицы могут быть названы простыми перечневыми, хронологическими или территориальными. Подлежащее простой (перечневой) таблицы представляет собой перечень отдельных единиц совокупности или дат. Примером такой таблицы является ведомость на получение стипендии.

Таблица 8

МНЕНИЕ НАСЕЛЕНИЯ ОБ ОЦЕНКЕ БЛАГОПРИЯТНОСТИ УСЛОВИЙ
ДЛЯ ФОРМИРОВАНИЯ СБЕРЕЖЕНИЙ В 4 КВАРТАЛЕ 2009 ГОДА

по данным выборочного обследования потребительских ожиданий населения;


в процентах от общей численности опрошенных

Всего

100

в том числе:

очень благоприятные

0,4

скорее благоприятные, чем неблагоприятные

3,8

"плюсов" и "минусов" одинаково

22,5

скорее неблагоприятные,
чем благоприятные

35,8

совсем неблагоприятные

33,2

затрудняюсь ответить

4,3

нет ответа

-

*В групповых таблицах статистическая совокупность расчленяется на отдельные группы по какому-либо одному признаку, причем каждая из групп может быть охарактеризована рядом показателей. В подлежащем таблицы выделяются группы по какому-либо признаку. Например, группы студентов академии по формам обучения.

Таблица 9

Распределение населения РФ

по величине среднедушевых денежных доходов в 2006-2009гг.

( в процентах в итогу)

 

2006

2007

2008

2009

Все население

100

100

100

100

в том числе со среднедушевыми
денежными доходами в месяц, руб.:

до 4000,0

20,5

14,3

9,9

7,4

4000,1-6000,0

17,7

14,8

12,2

10,3

6000,1-8000,0

14,7

13,6

12,3

11,1

8000,1-10000,0

11,2

11,3

10,9

10,4

10000,1-15000,0

17,1

19,1

20,2

20,4

15000,1-20000,0

8,4

10,6

12,3

13,3

20000,1-30000,02)

10,4

9,6

12,2

14,1

свыше 30000,0

6,7

10,0

13,0

Источник: Социальное положение и уровень жизни населения России. 2010. Стат.сб. / Росстат - M., 2010.

 В этой таблице подлежащим выступают группы населения с различным среднедушевым доходом в месяц в различные периоды, а сказуемым удельный вес каждой группы в определенном году.

В комбинационных таблицах каждую группу разбивают на подгруппы по одному или нескольким другим признакам. Например, группы студентов академии разбить не только по формам обучения, но и по полу и возрасту.

Таблица 10

БЛАГОУСТРОЙСТВО НАСЕЛЕННЫХ ПУНКТОВ
(на конец года)

Годы

Число населенных пунктов, имеющих

водопровод

водоотведение (канализацию)

городов

поселков
г
ородского типа

сельских населенных пунктов

городов

поселков
г
ородского типа

сельских населенных пунктов

2004

1094

1554

45171

1066

1249

6410

2005

1087

1320

46066

1072

1088

6899

2006

1091

1295

46192

1066

1086

7380

2007

1092

1302

46465

1068

1095

7112

2008

1096

1289

48020

1072

1090

7764

2009

1096

1268

48274

1071

1079

7977

В этой таблице подлежащим выступает группировка населенных пунктов по годам. Сказуемое здесь представляет группировку по двум признакам: наличие водопровода и канализации, каждый из которых комбинируется с типом поселения.

Выбор типа таблицы зависит всегда от цели ее построения. Если таблицы используются для практических нужд планирования и управления, то в них должны содержаться сведения по тем частям, в разрезе которых ведется планирование и управление. Чаще всего этой задаче соответствуют простые таблицы, используются также и групповые. В отличие от простых групповые и комбинационные таблицы обладают важными аналитическими свойствами: они позволяют производить наглядные сравнения и вскрывать существенные связи и различия в развитии явлений. Если же ставится задача более глубокого познания исследуемого объекта, то используются групповые и комбинационные таблицы.

Результаты комбинационной группировки по большому количеству признаков даже при небольшом числе интервалов группировки становятся трудно обозримыми, и таблица теряет свое важнейшее преимущество - наглядность. Поэтому нецелесообразно составлять комбинационные таблицы по сочетанию более чем трех признаков и при количестве интервалов более четырех. Использование комбинационных таблиц и системы взаимосвязанных группировок позволяет провести глубокий и всесторонний анализ сложных общественных явлений.


Принципы построения статистических группировок

(перенести на практику, предварительно задать повторение темы «Вариационные ряды»

Построение статистических группировок осуществляется по следующим этапам:

  1.  Определение группировочного признака.
  2.  Определение числа групп.
  3.  Расчет ширины интервала группировки.
  4.  Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качественные признаки.

Количественные признаки - это признаки, которые имеют числовое выражение (объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т.д.). Качественные признаки отражают состояние единицы совокупности (пол, отраслевая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков. Так, например, группировка сотрудников фирмы по полу учитывает только две градации: "мужской" и "женский".

В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупности и степень колеблемости группировочного признака.

При небольшом объеме совокупности (n<50) не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше можно образовать групп.

Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оценить вариацию признака между крайними значениями признака - максимальным (Xmax) и минимальным (Xmin) и определяется по следующей формуле:

R = хmax - хmin 

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы наблюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизвести характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенностей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами. Формально-математический способ предполагает использование формулы Стерджесса:

n = 1 + 3,322 · lg N,    (3.1)

где:n - число групп;N - число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если совокупность состоит из большого числа единиц наблюдения (n>50).

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (s). Если величина интервала равна 0,5s, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3s и s, то совокупность делится, собственно, на 9 и 6 групп. Однако, при определении групп данными методами существует большая вероятность получения "пустых" или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.

Когда определено число групп, то следует определить интервалы группировки.

Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают:

  •  равные и неравные;
  •  открытые и закрытые.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь неравные интервалы подразделяются на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

       (3.2)

где: хmax, xmin - максимальное и минимальное значения признака в совокупности;
n - число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (3.2) представляет собой величину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например, 14,876), то это значение необходимо округлить до целого числа (до 15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами. Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно возрастающие или прогрессивно убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии определяются следующим образом:

hi+1 = hi + a,

а в геометрической прогрессии:

hi+1 = hi · q,

где:а - константа: для прогрессивно-возрастающих интервалов имеет знак "+", а при прогрессивно-убывающих - знак "-";q - константа: для прогрессивно-возрастающих - больше "1"; для прогрессивно-убывающих - меньше "1".

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000, 1000-2000, 2000-3500, т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае - объединять.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по-разному, в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственными силами (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. - соответственно второго и третьего и т.д., т.е. верхняя граница i - го интервала равна нижней границе (i+1) - го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти строительная фирма с объемом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу "исключительно", то фирма должна быть отнесена к третьей группе, в противном случае - ко второй. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строительных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала. Возможны два случая обозначения последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100-150, 151-200, 201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами. Специализированные интервалы - это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно возрастающими, ни прогрессивно убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.

Пример.

Произведем группировку совокупности, включающей 30 банков Российской Федерации (на 01.01.04 г.):

Номер банка

Капитал, млн. руб.

Рабочие активы, млн. руб.

Уставный фонд, млн. руб.

1

207,7

2,48

1,14

2

200,3

2,40

1,10

3

190,2

2,28

1,05

4

323,0

3,88

1,88

5

247,1

2,96

1,36

6

177,7

2,12

0,97

7

242,5

2,90

1,33

8

182,9

2,18

0,99

9

315,6

3,78

1,73

10

183,2

2,20

1,01

11

320,2

3,84

1,76

12

207,3

2,48

1,14

13

181,0

2,17

0,99

14

172,4

2,06

0,94

15

234,3

2,81

1,29

16

189,5

2,27

1,04

17

187,8

2,24

1,03

18

166,9

1,99

0,91

19

157,7

1,88

0,86

20

168,3

2,02

0,93

21

224,4

2,69

1,23

22

166,5

1,99

0,91

23

198,5

2,38

1,09

24

240,4

2,88

1,32

25

229,3

2,75

1,26

26

175,2

2,10

0,96

27

156,8

1,87

0,86

28

160,1

1,92

0,88

29

178,7

2,14

0,98

30

171,6

2,05

0,94

В качестве группировочного признака возьмем капитал банка. Образуем четыре группы банков с равными интервалами. Величину интервала определим по формуле:

Обозначим границы групп:

1-я группа - 156,0-197,8

2-я группа - 197,8-239,6

3-я группа - 239,6-281,4

4-я группа - 281,4-323,2

После того как определен группировочный признак - капитал, задано число групп - 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы и определить их величины по каждой группе. Показатели, характеризующие банки, разносятся по четырем указанным группам и подсчитываются групповые итоги. Результаты группировки заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.

Таблица 1

Группировка коммерческих банков по величине капитала

Группы банков по величине капитала, млн. руб.

Число банков

Капитал, млн. руб.

Активы, млн. руб.

Работающие активы, млн. руб.

A

1

2

3

4

156,0-197,8

17

2966,5

35,48

16,25

197,8-239,6

7

1501,8

17,99

8,25

239,6-281,4

3

730,0

8,74

4,01

281,4-323,2

3

958,8

11,5

5,37

Итого

30

6157,1

73,71

33,88

Структурная группировка коммерческих банков на основе данных таблицы 1 будет иметь вид:

Таблица .2

Группировка коммерческих банков по величине капитала (в %% к итогу)

Группы банков по величине капитала, млн. руб.

Число банков

Капитал

Активы

Работающие активы

156,0-197,8

56,7

48,2

48,1

48,0

197,8-239,6

23,3

24,4

24,4

24,3

239,6-281,4

10,0

11,9

11,9

11,8

281,4-323,2

10,0

15,5

15,6

15,9

Итого

100,0

100,0

100,0

100,0

Из таблицы 2 видно, что в совокупности в основном преобладают малые банки - 56,7%, на долю которых приходится 48,2% всего капитала. Более конкретный анализ взаимосвязи показателей можно сделать на основе аналитической группировки.


Таблица.3

Группировка коммерческих банков по величине капитала

Группы банков по величине капитала, млн. руб.

Число банков

Капитал, млн. руб.

Активы, млн. руб.

Работающие активы, млн. руб.

всего

в среднем на один банк

всего

в среднем на один банк

всего

в среднем на один банк

156,0-197,8

17

2966,5

174,5

35,48

2,09

16,25

0,96

197,8-239,6

7

1501,8

214,5

17,99

2,57

8,25

1,18

239,6-281,4

3

730,0

243,3

8,74

2,91

4,01

1,34

281,4-323,2

3

958,8

319,6

11,5

3,83

5,37

1,79

Итого

30

6157,1

205,2

73,71

2,46

33,88

1,13


Величина капитала, все активы банка и работающие активы прямо зависят между собой, и чем крупнее банк, тем эффективнее управление работающими активами.

Мы рассмотрели примеры группировок по одному признаку. Однако в ряде случаев для решения поставленных задач такая группировка является недостаточной. В этих случаях переходят к группировке исследуемой совокупности по двум и более существенным признакам во взаимосвязи (комбинационной группировке).

Произведем группировку данных коммерческих банков по двум признакам: величине капитала и работающим активам.

Каждую группу и подгруппу охарактеризуем следующими показателями: число коммерческих банков, капитал, работающие активы.


Таблица 4. Группировка коммерческих банков по величине капитала и работающим активам

Номер группы

Группы банков по величине капитала, млн. руб.

Подгруппы по величине работающих активов, млн. руб.

Число банков

Капитал, млн. руб.

Работающие активы, млн. руб.

1

2

3

4

5

6

1

156,0-197,8

0,86-1,37

17

2966,5

16,25

1,37-1,88

-

-

-

Итого

 

17

2966,5

16,25

2

197,8-239,6

0,86-1,37

7

1501,8

8,25

1,37-1,88

-

-

-

Итого

 

7

1501,8

8,25

3

239,6-281,4

0,86-1,37

3

730,0

4,01

1,37-1,88

-

-

-

Итого

 

3

730,0

4,01

4

281,4-323,2

0,86-1,37

-

-

-

1,37-1,88

3

958,8

5,37

Итого

 

3

958,8

5,37

5

Всего по подгруппам

0,86-1,37

27

5198,3

28,51

1,37-1,88

3

958,8

5,37

Всего

 

30

6157,1

33,88


ПРАКТИЧЕСКОЕ ЗАНЯТИЕ И ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ ПО ТЕМЕ 3

«Сводка и группировка»

Контрольные вопросы (ответы дать в письменном виде)

  1.  Дайте краткую характеристику сводки. Приведите любые примеры сводки данных, кроме сводки метеобюро, о которых вы слышали по радио и телевидению.
  2.  Что представляет собой статистическая группировка?
  3.  В чем заключаются особенности выбора группировочного признака и как это связано с выбором числа групп?
  4.  Раскройте понятие интервал группировки и какие интервалы группировок могут быть.
  5.  Какие задачи решает статистика при помощи метода группировок?
  6.  Какие виды группировок Вы знаете и в чем заключается их основное отличие?
  7.  Что представляют собой статистические ряды распределения и по каким признакам они могут быть образованы?
  8.  Из каких элементов состоит вариационный ряд распределения?
  9.  Перечислите основные правила построения и составления статистических таблиц.
  10.   К каким группировочным признакам - атрибутивным или количественным - относятся:
    1.  возраст человека;
    2.  национальность;
    3.  балл успеваемости;
    4.  доход сотрудника фирмы;
    5.  форма собственности?

Контрольные задания

Задание 1. Определите, к какому виду группировки относится статистическая таблица, характеризующая группировку промышленных предприятий по размеру основных фондов:

Группы предприятий по размеру основных фондов

Число предприятий

Объем выпускаемой продукции, млн. руб.

Численность занятых, чел.

всего

на одном предприятии

всего

на одном предприятии

Мелкие
Средние
Крупные

20
20
10

1500
2000
4500

75
100
450

2000
3000
5000

100
150
500

Итого

50

8000

160

10000

200

Задание 2. Определите вид ряда распределения и постройте полигон распределения по данным о распределении рабочих завода по тарифному разряду:

Номер тарифного разряда

Число рабочих, чел.

Удельный вес, % к итогу

1
2
3
4
5

5
6
5
12
22

10
12
10
24
44

Итого

50

100

Задание 3. Определите, к какому виду группировок относится статистическая таблица, характеризующая коммерческие банки по величине балансовой прибыли:

Номер группы

Группы коммерческих банков по величине балансовой прибыли, млн. руб.

Число банков, ед.

Балансовая прибыль, млн. руб.

Уставный капитал, млн. руб.

Работающие активы, млн. руб.

1
2
3

200 - 400
400 - 600
600 - 800

40
40
20

43,2
35,6
21,2

40,2
41,7
18,1

37,1
37,0
25,9

 

Итого

100

100,0

100,0

100,0

Задание 4. Какие из указанных ниже группировок являются типологическими:

  1.  группировка населения по полу;
    1.  группировка населения, занятого в народном хозяйстве по отраслям;
    2.  группировка капитальных вложений на строительство объектов производственного и непроизводственного назначения;
    3.  группировка предприятий общественного питания по формам собственности?

Задание 5. Пользуясь формулой Стерджесса, определите интервал группировки сотрудников фирмы по уровню доходов, если общая численность сотрудников составляет 20 чел, а минимальный и максимальный доход соответственно равен 5000 и 30 000 руб.

Задание 6. Известны следующие данные о численности населения Центрального федерального округа РФ на 01.01.2002 г. в разрезе областей (млн. чел.):

1,5

1,2

2,2

1,6

1,9

1,1

0,9

1,8

1,6

0,8

1,3

2,1

2,4

1,3

1,1

1,2

Задание 7. Используя эти данные, постройте интервальный вариационный ряд распределения областей Центрального федерального округа РФ, выделив три группы областей с равными открытыми интервалами. По какому признаку построен ряд распределения: качественному или количественному?

Задание 8. Имеются следующие данные об успеваемости 20 студентов группы по теории статистики в летнюю сессию 2003 г.: 5, 4, 3, 3, 5, 4, 4, 4, 3, 4, 4, 5, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3.
Постройте:

  1.  ряд распределения студентов по оценкам, полученным в сессию, и изобразите его графически;
    1.  ряд распределения студентов по уровню успеваемости, выделив в нем две группы студентов: неуспевающих (2 балла), успевающих (3 балла и выше);
    2.  укажите, каким видом ряда распределения (вариационным или атрибутивным) является каждый из этих двух рядов.

Задание 9. Постройте группировку численности безработных двух регионов по полу и возрасту с целью приведения их к сопоставимому виду. Сделайте сравнительный анализ результатов.

Регион 1

Регион 2

группы безработных, лет

всего

в том числе

группы безработных, лет

всего

в том числе

женщин

мужчин

женщин

мужчин

15 - 19
20 - 24
25 - 29
30 - 49
50 - 54
55 - 59
60 и старше

15 - 19
20 - 24
25 - 29
30 - 49
50 - 54
55 - 59
60 и старше

14,2
15,2
10,9
48,1
5,3
4,2
2,1

9,5
17,2
11,8
48,8
5,0
5,5
2,2

до 20
20-30
30 - 40
40-50
50 и более

12,0
35,5
26,2
14,0
12,3

13,7
37,2
24,5
14,6
10,0

10,2
39,7
24,6
15,5
10,0

Итого

100,0

100,0

100,0

Итого

100,0

100,0


Задание 10. Имеются следующие данные о распределении промышленных предприятий двух регионов по численности занятого на них промышленно-производственного персонала (ППП):

Регион 1

Регион 2

группы предприятий по численности работающих, чел.

число предприятий, %

численность промышленно-производственного персонала

группы предприятий по численности работающих, чел.

число предприятий, %

численность промышленно-производственного персонала

До 100
101 - 500
501 - 1000
1001 - 2000
2001 - 5000
5001 и более

32
38
17
9
3
1

1
4
10
15
32
38

До 300
301 - 600
601 - 1000
1001 - 2000
2001 - 4000
4001 и более

34
28
20
13
4
1

1
6
10
15
43
25

Итого

100

100

Итого

100

100

Постройте вторичную группировку данных о распределении промышленных предприятий, пересчитав данные:

региона 2 в соответствии с группировкой региона 1;

региона 1 в соответствии с группировкой региона 2;

регионов 1 и 2, образовав следующие группы промышленных предприятий по численности ППП: до 500, 500 - 1000, 1000 - 2000, 2000 - 3000, 3000 - 4000, 4000 - 5000, 5000 и более.


PAGE  15




1. ]. Понятие производства и производственной функции
2. Документарный аккредитив
3. РЕФЕРАТ дисертації на здобуття вченого ступеня кандидата філософських наук Одеса 2000 Дисе
4. М Шестерина Психология журналистики Учебное пособие Воронеж 2010 УД
5. Spredsheet c английского языка означает расстеленный лист бумаги
6. Любовь стихи животворит
7. ФНЧ4 Далее через коммутационное устройство КУ сигнал поступает на аналогоцифровой преобразователь АЦП
8. Жаль что размеры этого мира твоя маленькая квартира
9. Информатизация и компьютеризация судов
10. Электролитная обработка полосы
11. Психика и реальность
12. Тема- Літні канікули Підтема- Домашні справи
13. 22
14. Учет в банках специальность 0604 Банковское дело а также для дополнительного профессионального образова
15. Тема 4. Концепция временной стоимости денег Кредит выдается на полгода по простой учетной ставке 40
16. Корпускулярно-волновой дуализм в современной физике.html
17. тема Вл Соловьева Владимир Сергеевич Соловьев 13531900} выдающийся истинно гениальный мыслитель России по
18. Предварительное следствие одна из трех форм предварительного досудебного расследования преступлений
19. Открытие центра психологического консультирования
20. Тема- Предприятие -фирма- в современной экономике.html