Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

Подписываем
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Предоплата всего
Подписываем
Статистика
Статистика
Статистика
Навчальна дисципліна «Статистика» вивчається студентами у четвертому семестрі. До структури курсу входять лекції, практичні заняття, індивідуальна та самостійна робота студентів.
Студенти денної форми навчання виконують індивідуальну розрахункову роботу з курсу «Статистика», яка вміщує 6 завдань. Для виконання кожного завдання необхідно вивчити не тільки відповідний розділ із теорії статистики, але засвоїти всі попередні теми.
Слово "статистика” виникло від латинського "статус", що означає стан (становище речей), держава. Статистик - знавець держави, статистика - державознавство.
В широкому значенні слово статистика - вид суспільної діяльності, спрямованої на отримання, обробку та аналіз інформації, яка характеризує кількісні закономірності життя суспільства у нерозривному зв’язку з й якіснім змістом. В більш вузькому значенні слова статистика - сукупність даних про будь-яке явище або процес.
Статистика займається виявленням статистичних закономірностей, тобто таких закономірностей, у яких необхідність пов’язана у кожному конкретному випадку з випадковістю, але у множині явищ виявляє себе як закономірність.
Для вивчення свого предмету статистика, розробляє і використовує різні методи, сукупність яких утворює статистичну методологію.
Статистика вивчає суспільство за допомогою статистичних сукупностей.
Статистична сукупність – множина одноякісних хоча б по якому одному признаку варіаційних явищ, існування яких обмежено простором та часом.
Статистична сукупність складається з одиниць сукупності. Одиниця сукупності - це окремий елемент статистичної сукупності, при якому зберігаються всі властивості процесу, який вивчається. Вирішення питання про одиницю та границю сукупності, що вивчається, залежать від її цілі та глибини дослідження.
Одиниці сукупності мають певні властивості. Вони називаються ознаками. Наприклад, ознаки людини: зріст, вага, вік, освіта і т.і; ознаки підприємства: форма власності, галузь, кількість робітників, статутний фонд і т.і.
За формою вираження ознаки діляться на:
Статистичне дослідження складається з 3 стадій:
Статистичне спостереження – масовий, планомірний, науково-організований збір даних про соціально–економічні явища. Підготовка спостереження починається із складання плану спостереження — сукупності програмно-методологічних та організаційних питань. Програмно-методологічні питання плану — це перелік пунктів, які відповідатимуть на питання: для чого проводиться обстеження (мета обстеження); що обстежується (об'єкт обстеження); складові частини об'єкта (одиниця сукупності); джерело інформації (одиниця спостереження); на які питання планується одержати відповіді (програма спостереження).Об’єкт спостереження це статистична сукупність в якій виникають досліджувані явища та процеси. Одиниця спостереження — це первинна одиниця, від якої одержують інформацію. Ціллю спостереження є отримання достовірної інформації для виявлення закономірностей розвитку явищ та процесів. Достовірність - відповідність даних тому, що є насправді.
Зібрані дані повинні бути порівнянними, повними. Порівнянність - можливість порівнювати, зіставляти. Повнота - достатність для висновків.
Статистичні спостереження за часом реєстрації фактів розподіляються на:
1) безперервні;
2) періодичні;
3) одноразові
Безперервні статистичні спостереження ведуться систематично (реєстрація в ЗАДРі народження, смерті, шлюбу), періодичні - проводять через певні, в основному рівні проміжки часу (облік успішності студентів за результатами екзаменаційних сесій), одноразові - проводять один раз для вирішення якоїсь задачі або повторюються через невизначені проміжки часу (перепис населення).
За охопленням одиниць сукупності статистичні спостереження розподіляються на суцільні та несуцільні.
Суцільним спостереженням охоплені всі одиниці сукупності.
Несуцільні спостереження охоплюють частину сукупності, висновки переносяться на всю сукупність. Несуцільне спостереження проводиться способом основного масиву, вибірковим методом або монографічним.
За способом основного масиву вивчається та частина сукупності, яка вносить більший внесок у процес. Вибіркове спостереження виконується за відібраною в певному порядку частиною сукупності. При цьому відбір м.б. випадковим або за якоюсь схемою. За монографічним спостереженням описуються окремі одиниці сукупності Головну увагу надають якості, наприклад, етнографічне дослідження, коли вивчають спосіб життя однієї або кількох сімей.
Джерелом отримання первинних даних можуть бути:
1) безпосередні спостереження;
2) документи;
3) опитування.
У безпосередньому спостереженні одиниці, які вивчаються, оглядають, роблять заміри, зважують і т.і Наприклад перепис вагонів - огляд кожного вагону, метеорологічні дослідження - виміри температури, величини снігового покрову, суми опадів і т.і.
Дані можуть поступати в статистичні органи у вигляді документів звітності Звіти бувають річні, поточні, оперативні Спосіб подачі звітів - телефонний, телеграфний, поштовий.
Перше і друге джерела забезпечують найбільшу достовірність даних. При опитуванні відомості надходять від осіб, яких опитують. Розрізняють три форми опитування:
1) експедиційний;
2) кореспондентський;
3) самореєстраційний.
Експедиційний полягає в тому, що спеціально підготовлені реєстратори на основі опитування особисто заповнюють переписні листи, одночасно здійснюючи контроль правильності відповідей. Спосіб дорогий (дорого коштує), але забезпечує достовірність даних.
У кореспондентському спеціально розроблені бланки і інструкції, які заповнюють, розсилаються організаціям і спеціально підібраним особам, які погодилися брати участь в опитуванні. Заповнені бланки періодично надсилають в органи статистики. Перевага цього способу - дешевизна, недолік - мала достовірність.
Самореєстраційні листи роздає і збирає статистик, він виходить на місце знаходження одиниць спостереження (організація, де проводиться опитування). Статистик тільки пояснює, як заповнити лист і перевіряє його заповнення.
Помилки статистичного спостереження.
Зібрані дані повинні бути перевірені. Помилка спостереження – розбіжність між розрахунковим та дійсним значеннями величин що вивчаються. Помилки статистичного спостереження діляться на випадкові і систематичні.
Випадкові або ненавмисні не мають ніякої направленості. Це - обмовки (помилки у слові), описки, помилки показників вимірювальних приладів, технічні помилки реєстратора. Узагальнюючи масовий матеріал, помилки, як правило, виправляються, тому не можуть спотворити результати аналізу.
Систематичні помилки - навмисні. Наприклад, применшування прибутків (як для людей, так і для підприємств) з метою применшити податок на прибуток. Такі помилки спотворюють результат, тому їх треба віднаходити і виправляти.
Для виправлення використовують лічильний і логічний контроль даних. Лічильний контроль - перевірка арифметичними діями бланків звітності. Логічний базується на логічному взаємозв'язку між ознаками.
Виявивши помилки, статистик або перевіряє спостереження, або вимагає від особи, яка несе відповідальність за інформацію подати її правильно.
Перевірка зібраних даних завершує перший етап статистичного дослідження.
Додаткова література:
1. Теорія статистики, А.М.Єріна. – Київ, «Знання», 2001р., с. 9-18
2. Статистика: Навчальний посібник /Р.В.Фещур, А.Ф.Барківський, В.П. Кічор. 2-е вид. оновлене і доповнене. –Львів: «Інтелект-Захід», 2003р., с. 7-8
3. Теория статистики, под ред. Р.А.Шмойловой. – Москва, «Финансы и статистика», 2007р., с. 7-64
Питання до перевірки знань
З цією темою пов'язані перші два завдання типового варіанта. При його виконанні студент повинен засвоїти питання сутності, цілі і видів статистичних групувань. Пам'ятати, що аналітичне угруповання дозволяє виявляти наявність причинно-наслідкових зв'язків між явищами.
Зведення.
Другий етап статистичного дослідження - первинна обробка, зведення та групування результатів спостереження.
Зведення є комплекс послідовних операцій по узагальненню конкретних одиничних фактів, утворюючих сукупність, для виявлення типових ріс та закономірностей, властивих досліджуваному явищу у цілому. В результаті зведення здійснюється перехід від даних, які характеризують окреме явище, до даних, які характеризують їх сукупність.
Зведення може бути централізованим, коли весь матеріал спостережень відразу поступає у відділи статистики, і децентралізований, коли матеріали зводяться в межах підприємств, об'єднань та ін., а потім пересилаються в центр.
За глибиною обробки матеріалу зведення буває просте та складне. Просте зведення є операція підрахунку загальних підсумків по сукупності одиниць спостереження. Складне зведення є комплекс операцій, що включають групування одиниць спостереження, підрахунок підсумків по кожної групі і по всьому об’єкту та представлення групування і зведення у вигляді статистичних таблиць.
Групування.
Групування даних - розподіл чи об’єднання одиниць сукупності у групи за певними істотними для них ознаками. Групування - це один з методів зведення, який забезпечує узагальнення даних, подання їх у компактному, узагальненому вигляді, метод, який створює основу для наступного зведення і аналізу даних.
Для проведення групування необхідно:
1) визначити типи явищ, які повинні бути виділені та зіставити з видом групування;
2) вибрати ознаки групування, які формують опис типів;
3) встановити границі інтервалів зміни ознак;
4) оформити групування у вигляді таблиці.
Групування бувають:
Типологічне групування – це розподіл досліджуваної якісно різнорідної сукупності на класи, соціально – економічні типи у відповідності з правилами наукового групування.
Приклад 1: Розподіл підприємств за формами власності.
№ |
Групи підприємств за формами власності |
Кількість підприємств |
|
всього, од. |
у % до підсумку |
||
1 |
Державна власність |
26 326 |
93,6% |
2 |
Приватна власність |
1 366 |
4,9% |
3 |
Колективна власність |
331 |
1,2% |
4 |
Змішана власність |
89 |
0,3% |
Всього |
28 112 |
100% |
Структурне групування - це розподіл однорідної сукупності на групи, що характеризують її структуру за якої-небудь ознакою.
Приклад 2: Групування по розміру доходу на душу населення.
№ |
Розмір грошового доходу, грн. у місяць |
Чисельність населення |
|
всього, тис. чол. |
в % до підсумку |
||
1 |
До 100 |
2,4 |
1,6 |
2 |
100-170 |
23,4 |
15,8 |
3 |
170-240 |
34,8 |
23,5 |
4 |
240-310 |
29,4 |
19,8 |
5 |
310-380 |
20,7 |
13,9 |
6 |
380-450 |
13,5 |
9,1 |
7 |
450-520 |
8,7 |
5,9 |
8 |
520 і більше |
15,5 |
10,4 |
Всього |
148,4 |
100 |
Аналітичне групування є групування яке виявляє взаємозв'язки між досліджуваними явищами та їх ознаками.
Ознаки групувань бувають:
Чинникові є ознаки під впливом яких змінюються інші ознаки які і утворять групу результативних ознак. Аналітичне групування служить для дослідження взаємозв’язку між факторними та результативною ознаками.
Приклад 3: Розподіл банків на групи за сумами активів балансу та зв'язок з кількістю занятих.
|
Сума активів балансу, млн. Грн. |
Кількість банків, од |
У середньому на один банк |
|
Чисельність зайнятих, чол |
Балансовий прибуток, млн.грн |
|||
1 |
До 20 |
19 |
184 |
22,5 |
2 |
20-30 |
8 |
313 |
31,6 |
3 |
30-40 |
7 |
374 |
36,0 |
4 |
40-50 |
9 |
468 |
69,2 |
5 |
50 і більше |
7 |
516 |
205,6 |
Всього |
50 |
328,8 |
60,0 |
Якщо в основі групування лежить кількісна ознака, то виділення груп пов’язано із створенням інтервалів зміни ознаки. Якщо ознака описова, то кількість груп дорівнює кількості типів.
Інтервал - величина окремої групи. Кількість інтервалів дорівнює кількості груп. Інтервали бувають відкриті і закриті У відкритих виділена одна межа, верхня або нижня (наприклад, «До30» або «50 і більше»), у закритих – обидві (наприклад, «30-50»). Закриті можуть бути рівними і нерівними.
Якщо варіація значення ознаки значна, то використовуються нерівні інтервали, інакше - рівні
Якщо ознака дискретна, то верхня межа попереднього інтервалу відрізняється на 1 від нижньої межі наступного (наприклад, 30-49, 50-69, 70-89 і т.д.).
Якщо ознака безперервна, то нижня межа наступного інтервалу рівна верхній межі попереднього (наприклад, 30-50, 50-70, 70-90 і т.д.). У такому випадку, нижня межа формується включно, а верхня - виключно. Значить, значення ознаки рівне 50 потрапляє у другий інтервал, а не в перший.
Кількість інтервалів залежить від коливання ознак: чим більше коливання, тим більше інтервалів. Виділені інтервали повинні бути достатньо заповнені. Якщо є незаповнені інтервали, їх кількість треба зменшити. При малій кількості інтервалів можуть виявитися невиявлені властивості сукупності.
Число утворених груп можна встановити аналітично за формулою Стерджеса: ,
де N – число груп (інтервалів);
K – число одиниць сукупності
Число інтервалів, яке відповідає обсягу сукупності K і розраховано за формулою Стерджеса, наведено в таблиці:
Обсяг сукупності, K |
15-24 |
25-44 |
45-89 |
90-179 |
180-359 |
360-719 |
Число інтервалів, N |
5 |
6 |
7 |
8 |
9 |
10 |
Якщо вирішене питання про число інтервалів, то довжина одного інтервалу визначається так:
де N - кількість інтервалів,
- максимальне і мінімальне значення ознак, R - розмах.
Можна також здійснювати комбіноване групування на основі об’єднання різних видів групувань.
Додаткова література:
1. Теорія статистики, А.М.Єріна. – Київ, «Знання», 2001р., с. 26-36
2. Статистика: Навчальний посібник /Р.В.Фещур, А.Ф.Барківський, В.П. Кічор. 2-е вид. оновлене і доповнене. –Львів: «Інтелект-Захід», 2003р., с. 20-22
3. Теория статистики, под ред. Р.А.Шмойловой. – Москва, «Финансы и статистика», 1998р., с. 65-101
Питання до перевірки знань
Ефективна, форма подачі даних - статистична таблиця. Статистична таблиця - система рядків і стовпчиків, у якій у певній послідовності і зв’язку висвітлена статистична інформація про соціально-економічні явища. Статистична таблиця має підмет і присудок. Підмет – об’єкт, який характеризують, присудок - характеристика підмета, як завжди в кількісній формі Якщо таблиця - результат групування, то підмет - це ознака або ознаки, які покладені в основу групування, а присудок - це інші ознаки.
Статистичні таблиці за характером підмету поділяються на
У простій таблиці підмет не поділяється на групи, дається перелік одиниць сукупності чи зазначається цілісно. Такі таблиці хороші для невеликого числа одиниць, носять інформаційний характер. Груповими є таблиці, підмет у яких містить групування одиниць сукупності по одному кількісному або атрибутивному признаку. Комбінаційними є статистичні таблиці, підмет у яких містить групування одиниць сукупності одночасно по двом та більш признакам: кожна група, побудована по одному признаку, поділяється на підгрупи по якому-небудь іншому признаку і т.і.
Групові й комбіновані таблиці служать науково-пізнавальним цілям.
Залежно від структури присудка розрізняють таблиці:
Кожна таблиця повинна мати заголовок із зазначенням його основного змісту і обмеженням об’єкта у часі і просторі У заголовках граф позначаються одиниці виміру і розмірність показників.
Загальна схема статистичної таблиці:
Графіки.
Статистичний графік – це умовне зображення кількісних характеристик та їх співвідношень за допомогою геометричних образів (ліній, фігур) чи географічних картосхем. Графіки наглядно подають структуру, динаміку і взаємозв'язок явищ.
Основні елементи графіка – поле, графічний образ, просторові та масштабні орієнтири, експлікація.
За способом побудови графіки поділяються на:
1) діаграми;
2) картодіаграми;
3) картограми.
Діаграми розподіляються на лінійні, точкові, площинні, об’ємні, фігурні, радіальні. Вигляд їх залежить від форми подачі даних і задачі побудови графіка. Картограми і картодіаграми застосовують для зображення географічної характеристики явищ: розташування явища, його інтенсивність на певній території
Для побудові діаграми у програмі Microsoft Excel слід виконати наступні дії:
Додаткова література:
1. Статистика: Навчальний посібник /Р.В.Фещур, А.Ф.Барківський, В.П. Кічор. 2-е вид. оновлене і доповнене. –Львів: «Інтелект-Захід», 2003р., с. 14-18
2. Теория статистики, под ред. Р.А.Шмойловой. – Москва, «Финансы и статистика», 1998р., с. 122-154
Питання до перевірки знань
Рішення типових задач.
Завдання 1. Агентство нерухомості пропонує продаж наступні двокімнатні квартири.
Застосовуючи метод групувань, проаналізуйте структуру пропозиції по районам міста.
Розв'язання:
У відповідності с умовою задачі в основу групування покладемо признак «Район». Оскільки ознака групування описова, тоді кількість груп співпадає з кількістю районів міста. Далі необхідно відібрати показники, котрі характеризують групи, і визначити їх розміри по кожної групі. У якості показників, що характеризують структуру, розрахуємо кількість та середню ціну квартир у кожному районі та питому вагу району у спільної пропозиції квартир.
Показники, що характеризують пропозицію квартир по районам, рознесемо до шістьох зазначених груп та підрахуємо групові підсумки.
Для розрахунку скористаємося функціями програми Microsoft Excel:
=СЧЁТЕСЛИ, котра підраховує кількість непустих комірок у діапазоні, задовольняючі заданої умові;
=СУММЕСЛИ, котра підсумовує комірки, задовольняючі заданої умові.
=СУММ, визначає суму діапазону комірок.
Хід виконання завдання у програмі Excel:
У комірці С27 підрахуйте кількість квартир по Дзержинському району. Для цього помістить у комірку С27 функцію СЧЁТЕСЛИ:
Скопіюйте отриману формулу з комірці С27 у комірці С28:С32. Для цього виділіть комірку С27, підведіть курсор миші у лівий нижній кут, курсор миші прийме від тоненького хрестику, у цій момент натисніть ліву кнопку миші та не відпускаючи її протягніть до комірці С32. У комірках С28:С32 з’являться числа, а у рядку формул відповідні вирази.
У комірці С33 розрахуйте загальну кількість квартир. Для цього:
Увага, якщо змійка що біжить буде виділяти інший діапазон, тоді самі виділіть діапазон С27:С32.
У комірці D27 розрахуйте питому вагу Дзержинського району. Для цього:
Скопіюйте формулу з комірці D27 у комірці D28: D32. Для цього виділіть комірку D27, підведіть курсор миші у лівий нижній кут, курсор миші прийме від тоненького хрестику, у цій момент натисніть ліву кнопку миші та не відпускаючи її протягніть до комірці D32. У комірках D28: D32 з’являться числа, а у рядку формул відповідні вирази.
У комірці D33 розрахуйте загальну питому вагу. Для цього:
У комірці Е27 розрахуйте середню ціну квартир по Дзержинському району.
Для цього:
Скопіюйте формулу з комірці Е27 у комірці Е28: Е32.
У комірці Е33 розрахуйте середню ціну усіх квартир. Для цього
Розрахункова таблиця буде виглядати наступним образом:
Після вводу та копіювання формул отримаємо результат:
Завдання 2. Виїзна група фірми “Кияни” за день роботи на обслуговуванні продала чоловічі чоботи таких розмірів:
Побудуйте дискретний ряд розподілу взуття. Зазначити його елементи. Зобразити його графічно. Зробити висновки.
Розв'язання: Визначимо найменший та найбільший розмір проданого взуття. Для цього у клітинку В12 та В13 введіть відповідні формули: =МИН(A1:E10) та =МАКС(A1:E10), отримуємо результат:
У клітинки А15:А22 введіть числа від 38 (найменший розмір проданого взуття) до 45 (найбільший розмір проданого взуття) з кроком 1.
Для підрахунку кількості пар проданого взуття розміру 38 у клітинку В15 введіть формулу: =СЧЁТЕСЛИ($A$1:$E$10;A15)
Для підрахунку кількості пар проданого взуття інших розмірів скопіюйте формулу з клітинки В15 до клітинок В16:В22. Ви отримали дискретний ряд розподілу.
Для графічного зображення ряду розподілу використайте Майстра діаграм :
Висновок: найбільш продано взуття 42 розміру, взуття 38 та 45 розмірів попит найменший.
Завдання 3. Розподілите райони Кіровоградської області за розміром товарообігу. Число груп задайте рівним 5.
Розв'язання: Число груп визначено та дорівнює 5, якщо інтервали задані рівні, тоді
Мінімальне та максимальне значення розміру товарообігу можна знайти за допомогою функцій Excel МИН та МАКС.
Кількість районів у групі розрахуємо за допомогою функції СЧЕТЕСЛИ.
Примітка. Функція СЧЕТЕСЛИ не може порахувати кількість комірок у діапазоні, тому слід використати цю функцію двічі: порахував кількість комірок менш або рівні верхній межі та відняти кількість комірок менш ніжній межі. При наборе на ПК перша частина виразу =СЧЕТЕСЛИ($C$2:$C$22$;”<=”&C30) складається з кроків описаних у попередньому завданні. Після того у рядку формул ставиться знак мінус «–» та знову викликається функція СЧЕТЕСЛИ, для цього достатньо клацнути мишею по кнопці з аналогічною назвою спочатку рядку формул. Зверніть увагу на те що знаки менш та дорівнює <= слід заключити у лапки та використати знак зчеплення & для об’єднання знаків порівняння за значення яке знаходиться у відповідної комірці.
Середній розмір товарообігу по групі розрахуємо увівши у комірку F30 формулу:
=(СУММЕСЛИ($C$2:$C$22;"<="&C30;$C$2:$C$22)-СУММЕСЛИ($C$2:$C$22;"<"&B30;$C$2:$C$22))/D30
та скопіювавши її у комірки F31: F34. При набори цього виразу на ПК слід скористатися рекомендаціями попереднього завдання та приміткою попереднього кроку.
У комірку F35 введемо формулу =СУММ(C2:C22)/D35
Отримаємо наступний результат:
Завдання 4.
В холодильнику зберігалося 20 партій сиру Українського. Протягом збереження якість сиру погіршувалась.
Побудувати дискретні варіаційні ряди розподілу партій сиру, згруповані дані представити у вигляді:
а) групової таблиці простої структури за строками збереження;
б) комбінаційної таблиці простої структури за строками збереження та балами зниження якості сиру;
в) групової таблиці складної структури за строками збереження (у підметі) та балом зниження якості сиру (у присудку), утворивши за цією ознакою такі групи: від 0 до 1 бала; 2—3 бали; 4—6 балів.
Для вивчення залежності якості сиру від строку збереження здійснити аналітичне групування. Зробити висновки.
Номер партії |
Строк збереження, міс |
Зниження якості, балів |
Номер партії |
Строк збереження, міс |
Зниження якості, балів |
1 |
2 |
2 |
11 |
3 |
4 |
2 |
4 |
4 |
12 |
4 |
2 |
3 |
3 |
4 |
13 |
3 |
4 |
4 |
3 |
3 |
14 |
1 |
0 |
5 |
3 |
5 |
15 |
4 |
6 |
6 |
2 |
2 |
16 |
2 |
1 |
7 |
2 |
1 |
17 |
3 |
2 |
8 |
2 |
3 |
18 |
1 |
1 |
9 |
4 |
3 |
19 |
3 |
3 |
10 |
4 |
5 |
20 |
1 |
0 |
Розв'язання. а). Строк збереження сиру - дискретна ознака. Щоб побудувати ряд розподілу, слід підрахувати число партій для кожного її значення. Побудуємо групову таблицю в її підметі наведемо групування Строку збереження, а присудок зробимо простий. Розрахуємо середній бал як часткове від ділення Загальної суми балів на Кількість партій.
При виконанні на ПК слід вхідні данні увести у комірки А2:С21 та використувати функції Excel
Отримаємо результат:
Строк збереження, міс |
Кількість партій |
% до підсумку |
Загальна сума, балів |
Середній бал |
1 |
3 |
15 |
1 |
0,3 |
2 |
5 |
25 |
9 |
1,8 |
3 |
7 |
35 |
25 |
3,6 |
4 |
5 |
25 |
20 |
4,0 |
Разом |
20 |
100 |
55 |
2,75 |
Висновок: Більш як половина партій, тобто 60 %, зберігались в холодильнику по 3—4 міс.
б). Побудуємо комбінаційну таблицю за строком збереження та балом зниження якості сиру. У цій парі ознак групувальною є факторна ознака, тобто строк збереження, а результативною - бал зниження якості сиру. Для того щоб побудувати цю таблицю, слід вхідні дані відсортувати по строку збереження потім підрахувати бали зниження якості сиру за кожний місяць.
При виконанні цього пункту на ПК треба відсортувати вхідні данні за Строком збереження (меню Данные - Сортировка) потім використовуючи меню Данные – Итоги зробить підрахунки при зміні Строку збереження за позицією Зниження загальної оцінки.
в). Побудуємо групову таблицю складної структури за строками збереження (у підметі) та балом зниження якості сиру (у присудку), утворивши за цією ознакою такі групи: від 0 до 1 бала; 2—3 бали; 4—6 балів Побудуємо цю таблицю, аналізуючи отриману комбінаційну таблицю за зниженням якості
Строк збереження, міс |
Зниження якості, балів |
Разом |
||
0—1 |
2—3 |
4—6 |
||
1 |
3 |
_ |
_ |
3 |
2 |
2 |
3 |
— |
5 |
3 |
— |
3 |
4 |
7 |
4 |
— |
2 |
3 |
5 |
Разом |
5 |
8 |
7 |
20 |
Частоти цього розподілу розмістилися по головній діагоналі таблиці зверху вниз, зліва направо. Це свідчить про те, що між ознаками спостерігається прямий зв'язок: чим довше зберігається в холодильнику сир, тим вищий бал зниження його якості.
Студент повинен засвоїти види статистичних величин, сутність абсолютних і відносних.
Статистичні показники вираховують за зведенням даних. Статистичний показник служить узагальнюючою кількісною характеристикою властивостей сукупності загалом чи її частин зокрема.
Атрибути статистичного показника:
1) якісний бік (о6’єкт, його властивості, категорія);
2) кількісний бік (число і одиниці виміру);
3) територіальні, галузеві та інші межі об’єкта;
4) інтервал або момент часу.
Статистичні показники поділяються
Абсолютні відображають сумарні властивості об’єкта, характеризують суму значень первинних ознак об’єкта. Абсолютні показники отримують за результатами зведення первинних даних. Вони є продуктом вимірів. Одиниці виміру натуральні (м, га, ц, і т.і., тобто міри довжини, площі, маси, температури і т.і), умовно-натуральні (пог.м, люд-день, люд.-час і ін.), вартісні (гри, тис. грн., долари, марки і ін.).
Відносні показники отримують шляхом співставлення абсолютних в просторі і часі, а також порівнянням показників різних властивостей об’єкта. Відносні показники, як правило, неіменовані.
Середні величини - узагальнююче значення ознаки, яке замінює велику кількість індивідуальних значень.
Основні принципи побудови відносних показників такі:
1) порівнювальні показники повинні бути пов’язані в реальному житті об’єктивно;
2) вони повинні розрізнятися одним атрибутом (видом ознаки за однаковим часом і місцем; територій за однаковою ознакою і часом, або ж часом, за однаковою ознакою і територією).
Основна функція статистичних показників пізнавальна, наступна оцінювально-стимулююча, як оцінка діяльності підприємства і пропагандистська, як показник переваги того чи іншого економічного ладу. Оскільки відносний показник - кількісна характеристика співвідношення двох вихідних статистичних величин, він виражає собою простий дріб. Чисельник дробу - порівнювальна величина, знаменник - база порівняння. Форма вираження відносних величин - коефіцієнт процент, проміле(проміле). Відносні показники це показники динаміки, виконання плану, структури, порівняння, координації, інтенсивності розвитку.
Розрахована таким чином величина показує, в кількі разів поточний рівень перевищує попередній (базисний) або яку долю від останнього становить. Якщо даний показник виражений кратним відношенням, він називається коефіцієнтом росту, при множенні цього коефіцієнта на 100% отримують темп росту.
Приклад 1: Чисельність зайнятих у народному господарстві України в 1995 році становила 23,7 млн. осіб, а у 2000 році – 21,3 млн. осіб. Відносний показник динаміки дорівнюватиме - (21,3:23,7)х100%=89,9%
Приклад 2: Відомі такі дані про виробництво валової продукції на промисловому підприємстві (тис. грн.)
Місяць |
План |
Фактично |
Липень |
90 |
100 |
Серпень |
106 |
110 |
Відносна величина планового завдання дорівнюватиме – (106:100)х100%=106%
Приклад:3 План виробництва заготовок за зміну становив 120штук. Фактично за зміну вироблено 138 штук. Коефіцієнт виконання плану дорівнюватиме 138:120=1.15, або 115%
Між відносними показниками планового завдання, виконання плану та динаміки є зв’язок: ВПД=ВППЗ ВПВП
Приклад 4: Планом передбачено зростання товарообігу магазина на 7,1%. Фактичний товарообіг у звітному періоді у порівнянні з базисним зріс на 8,3%. Процент виконання плану товарообігу у звітному періоді визначається за виразом:
Приклад 5: Вартість основних засобів України на кінець 2000 року становила 826 878 млн. грн., з них приватної форми власності – 33 115 млн. грн., колективної – 342 179 млн. грн., державної – 270 470 млн. грн., комунальної власності – 181 114 млн. грн. Відносні показники структури основних засобів за формами власності становитимуть:
державна - (270 470:826 878) 100%=32,7%
комунальна - (181 144:826 878) 100%=21,9%
приватна - (33 115:826 878) 100%=4,0%
колективна - (342 179:826 878) 100%=41,4
Приклад 6: За даними попереднього прикладу вартість основних фондів, які перебувають у приватній власності, становить 12,2% від вартості державних основних засобів – (33 115:270 470) 100%=12,2%
Приклад 7: Рівень народжуваності, що виміряється у проміле, розраховується число народжених на 1000 чоловік населення; для визначення щільності населення розраховується число людей на 1 км2 території.
Приклад 8: Кількість народжених в Україні у 2001 році становила 376,478 тис. осіб, а кількість померлих – 745,952 тис. осіб, тобто в 1,98 разів більше.
Додаткова література:
Рішення типових задач.
Завдання 1. Згідно з договорами молокозаводу з приміськими господарствами, які спеціалізуються на виробництві молока, в жовтні мало надійти 4000 ц молока жирністю 3,2%, але фактично здача була такою
Господарство |
Здано молока, ц |
Жирність молока, % |
«Лугове» «Зелений гай» «Квітневий» |
2000 600 1400 |
3,0 2,8 3,4 |
Визначити загальну кількість молока, яке надійшло на молокозавод в перерахунку на умовне за жирністю 3,2 %, а також ступінь виконання договорів.
Розв'язування. Перерахунок молока в умовне здійснюють за коефіцієнтами співвідношення фактичної і умовної жирності
Господарство |
Коефіцієнт перерахунку в умовне молоко |
Обсяг зданого молока за жирністю 3,2 % |
Перше Друге Третє Разом |
3,0 : 3,2 = 0,9375 2,8 : 3,2 = 0,8750 3,4:3,2= 1,0625 X |
2000х0,9375= 1875,0 600х0,8750= 525,0 1400х1,0625 = 1485,5 3887,5 |
Ступінь виконання договорів щодо здачі молока обчислюють як відношення обсягу фактично зданого умовного молока до обсягу, передбаченого договором:
КВ.Д.=3887,5 : 4000,0 = 0,972.
Отже, недодано молока 4000,0 — 3887,5=112,5 ц, що становить 2,8 %.
У програмі Excel це завдання буде виконуватися за наступними формулами:
Завдання 2 Дані про віковий склад населення регіону, тис. чол., наведені в таблиці
Вікова група, років |
1970 |
1992 |
0—14 |
192,4 |
211,6 |
15—59 |
469,9 |
586,8 |
60 і старше |
77,7 |
163,6 |
Разом |
740 |
962 |
Обчислити відносні величини, які б характеризували:
1) динаміку чисельності населення;
2) його структуру за віком у кожному році і структурні зрушення;
3) співвідношення працездатного населення з чисельністю допрацездатного і старшого від працездатного віку.
Розв'язування. 1. Відносну величину динаміки обчислюють як відношення рівня показника в поточному році до базового. Так, загальна чисельність населення регіону в 1992 р. збільшилась порівняно з 1970 р. на 30%:
962:740=1,3, або 130%.
За окремими віковими групами відносні величини динаміки наведено в таблиці.
2. Відносна величина структури — це співвідношення частини і цілого, наприклад, частка населення допрацездатного віку в 1970 р. становила 26 % (192,4 : 740 = = 0,26), а в 1992 р.—22 % (211,6 : 962 = 0,22).
Отже, частка населення допрацездатного віку зменшилась на чотири пункти. Результати розрахунків за іншими віковими групами наведено в таблиці.
3. Співвідношення чисельності населення окремих вікових груп називають відносною величиною координації. В 1970 р. на 100 чол. працездатного віку припадало 40,9 чол. допрацездатного, в 1992 р.—36,1, тобто навантаження населення працездатного віку дітьми зменшилось, а пенсіонерами, навпаки, збільшилось з 16,5 до 27,9.
У програмі Excel це завдання буде виконуватися за наступними формулами:
Отримаємо результат:
Завдання 3. За даними про територію, чисельність населення і валовий внутрішній продукт двох країн обчислити відносні величини:
.Країна |
Територія, тис.км2 |
Чисельність населення, тис. чол. |
ВВП, млн. дол. |
А |
912 |
16390 |
32483 |
В |
1285 |
18710 |
16866 |
Розв'язування. 1. Відносну величину інтенсивності обчислюють як співвідношення двох різнойменних показників, тобто:
Результати розрахунків наведено в таблиці
Країна |
Густота населення, чол./км2 |
ВВП на душу населення, дол. |
А |
18,0 |
1982 |
В |
14,6 |
901 |
2. Відносну величину порівняння визначають як співвідношення рівнів певного показника за двома об'єктами. Так, в країні А порівняно з В густота населення більша в 1,2 рази (18,0 : 14,6), а виробництво ВВП на душу населення — в 2,2 рази (1982:901). Вибір бази порівняння довільний.
У програмі Excel це завдання буде виконуватися за наступними формулами:
Увага!!! При розрахунках не забувайте приводити до єдиної одиниці виміру
Середні величини.
Найпоширенішою формою статистичних показників, використовуваної в соціально-економічних дослідженнях, є середня величина, що представляє собою узагальнену кількісну характеристику ознаки в статистичній сукупності в конкретних умовах місця й часу. Показник у формі середньої величини виражає типові риси й дає узагальнену характеристику однотипних явищ по одному з варіаційних ознак. Він відображає рівень цієї ознаки, віднесений до одиниці сукупності. Широке застосування середніх порозумівається тим, що вони мають ряд позитивних властивостей, що роблять їх незамінними в аналізі явищ і процесів громадського життя.
Приклад. Одним із завдань органів державної статистики є характеристика рівня життя населення в цілому й, зокрема, рівня його доходів у розрізі різних соціальних груп. Очевидно, що даний об'єкт включає настільки велику кількість одиниць, що порівняння індивідуальних доходів кожної родини службовця, підприємця, студента й т.д. є абсолютно неможливим. Не представляє особливого інтересу й порівняння сумарних доходів окремих соціальних груп, тому що ці групи істотно розрізняються по чисельності. У цьому випадку ми можемо використати лише середні показники, а саме середню величину доходів розраховуючи на одну людину або на одну родину по кожній соціальній групі.
Найважливіша властивість середньої величини укладається в тім, що вона відображає те загальне властиве всім одиницям досліджуваної сукупності. Значення ознаки окремих одиниць сукупності можуть коливатися в ту або іншу сторону під впливом безлічі факторів, серед яких можуть бути як основні, так і випадкові. Наприклад, доходи такої соціальної групи, як студенти державних вузів, у цілому визначаються діючим положенням про нарахування стипендії. У той же час доходи окремо взятого студента можуть бути й дуже більшими (припустимо, внаслідок заняття яким-небудь бізнесом), і зовсім бути відсутніми (наприклад, при знаходженні в академічній відпустці). Сутність середньої в тім й укладається, що в ній взаємно погашаються відхилення значень ознаки окремих одиниць сукупності, обумовлені дією випадкових факторів, і враховуються зміни, викликані дією основних факторів. Це дозволяє середньої відображати типовий рівень ознаки й абстрагуватися від індивідуальних особливостей, властивим окремим одиницям. Можливо, що жоден студент у границях досліджуваної сукупності не має з точністю до гривні такого доходу, який отриманий на основі розрахунку середньої. Однак ця середня відображає той типовий рівень доходів, що характеризує студентство як соціальну групу.
Типовість середньої безпосереднім образом пов'язана з однорідністю статистичної сукупності. Середня величина тільки тоді буде відображати типовий рівень ознаки, коли вона розрахована по якісно однорідній сукупності. Так, у наведеному прикладі, якщо ми розрахуємо середній рівень доходів службовців, то одержимо фіктивну середню. Це порозумівається тим, що використовувана для розрахунку середньої сукупність, що включає службовців державних, спільних, орендних, акціонерних підприємств, а також органів державного керування, сфери науки, культури, утворення й т.п., є вкрай неоднорідною. У цьому й подібному випадках метод середніх використовується в сполученні з методом угруповань: якщо сукупність неоднорідна - загальні середні повинні бути замінені або доповнені груповими середніми, тобто середніми, розрахованими по якісно однорідних групах.
Середня арифметична.
Найпоширенішим видом середніх величин є середня арифметична, котра, залежно від характеру наявних даних, може бути простій або зваженої.
Середня арифметична проста (незважена). Ця форма середньої використовується в тих випадках, коли розрахунок здійснюється по не згрупованим даним.
Приклад: Припустимо, сім членів бригади мають наступний стаж роботи:
Табельний номер робітника 1 2 3 4 5 6 7
Стаж роботи (років) 10 3 5 12 11 7 9
Для того щоб визначити середній стаж роботи, необхідно скористатися наступним вихідним співвідношенням:
Використовуючи умовні позначки, запишемо формулу даної середньої:
З урахуванням наявних даних одержимо:
У цьому випадку ми використали формулу середньої арифметичної простий (незваженої).
Середня арифметична зважена. При розрахунку середніх величин окремі значення ознаки можуть повторюватися, зустрічатися по кілька разів. У подібних випадках розрахунок середньої проводиться за згрупованими даними або варіаційними рядами, які можуть бути дискретними або інтервальними.
Приклад: Продаж акцій АТ "Дока-хліб" на торгах фондової секції МБ "Гермес"
Угода |
Кількість проданих акцій, шт. |
Курс продажу, грн. |
1 |
500 |
1080 |
2 |
300 |
1050 |
3 |
1 100 |
1145 |
Визначимо по даному дискретному варіаційному ряду середній курс продажу акції, використовуючи наступне вихідне співвідношення:
Щоб одержати загальну суму угод, необхідно по кожній угоді курс продажу помножити на кількість проданих акцій й отримані добутки скласти. В остаточному підсумку результат наступний:
Розрахунок середнього курсу продажу зроблений по формулі середній арифметичної зваженої:
В окремих випадках ваги можуть бути представлені не абсолютними величинами, а відносними (у відсотках або частках одиниці). Так, у наведеному вище прикладі кількість проданих у ході кожної угоди акцій відповідно становить 26,3% (0,263), 15,8% (0,158) і 57,9% (0,579) від їхнього загального числа. Тоді з урахуванням нескладного перетворення формули одержимо:
або = 1080×0,263 + 1050×0,158 + 1145×0,579 = 1112,9 грн.
На практиці помилка, що найбільш зустрічається при розрахунку середніх, є ігнорування ваг у тих випадках, коли ці ваги в дійсності необхідні. Припустимо, є наступні дані.
Заробітна плата працівників підприємства за травень 2008 р.
Цех |
Середня заробітна плата, грн. |
1 |
1430 |
2 |
1410 |
Чи можна за наявним даними визначити середню заробітну плату по підприємству в цілому? Можна, але тільки в тому випадку, коли чисельність працівників в 1-м й 2-м цехах збігається. Тоді середня заробітна плата по підприємству в цілому складе 420 тис. руб.. Однак у цеху 1 може бути зайнято, приміром, 10 чоловік, а в цеху 2-100. Тому для розрахунку середньої заробітної плати буде потрібно середня арифметична зважена:
Загальний висновок укладається в наступному: використати середню арифметичну незважену можна тільки тоді, коли точно встановлена відсутність ваг або їхня рівність.
При розрахунку середньої по інтервальному варіаційному ряду для виконання необхідних обчислень від інтервалів переходять до їхніх середин. Розглянемо наступний приклад.
Розподіл працівників підприємства за віком
Вік, років |
Число працівників, людина |
До 25 |
7 |
25-30 |
13 |
30-40 |
38 |
40-50 |
42 |
50-60 |
16 |
60 м більше |
5 |
Разом |
121 |
Для визначення середнього віку працівника знайдемо середини вікових інтервалів. При цьому величини відкритих інтервалів (перш й останнього) умовно прирівнюються до величин інтервалів, що примикають до них (другого й передостаннього). Відповідно до вищевикладеного, середини інтервалів будуть наступними:
22,5 27,5 35,0 45,0 55,0 65,0.
Використовуючи середню арифметичну зважену, визначимо середній вік працівника даного підприємства:
Середня гармонійна
Середня гармонійна зважена. Розглянемо варіант, коли відомий чисельник вихідного співвідношення середньої, але невідомий його знаменник.
Валовий збір і врожайність соняшника
(у господарствах всіх категорій)
Область |
Валовий збір, тис. т |
Урожайність ц/га |
Кіровоградська |
97,0 |
16,1 |
Чернігівська |
204,0 |
9,5 |
Миколаївська |
0,5 |
4,8 |
Одеська |
16,0 |
10,9 |
Черкаська |
69,0 |
7,0 |
Середня урожайність будь-якої сільськогосподарської культури по декількох територіях, агрофірмам, селянським господарствам і т.п. може бути визначена тільки на основі наступного вихідного співвідношення:
Загальний валовий збір ми одержимо простим підсумовуванням валового збору по областях. Дані ж про посівну площу в таблиці відсутні, але їх можна одержати, розділивши валовий збір по кожній області на врожайність. З обліком цього визначимо шукану середню, попередньо перевівши для порівнянності тонни в центнери:
Таким чином, загальна посівна площа соняшника склала 389,3 тис. га, а середня урожайність - 9,9 ц з 1 га.
У цьому випадку розрахунок зроблений по формулі середній гармонійної зваженої:
Середня гармонійна незважена. Ця форма середньої, використовувана значно рідше, має такий вигляд:
Приклад: Бригада пакувальників цеха упаковки шоколадної фабрики з трьох працівників повинна зібрати 1040 коробок цукерок «Асорті». Перший пакувальник укладає одну коробку за 4 хвилини, другий за 3 хвилини та третій за 2 хвилини.
Визначте скільки часу потрібно бригаді на виконання завдання.
Розв’язання: Загальні затрати часу на виконання завдання визначимо як: ,
де - середня трудомісткість формування однієї коробки цукерок;
- об'їм завдання
Середню трудомісткість розрахуємо по формулі середньої гармонійної простої:
Маємо, n=3, t1=4, t2=3, t3=2. Відповідно отримуємо:
Тоді:
Кожний член бригади відпрацює по 48:3=16год.
Підіб'ємо підсумок: середня гармонійна незважена може використовуватися замість зваженої в тих випадках, коли значення fi для одиниць сукупності рівні.
Приклад: Автомобіль із вантажем від підприємства до складу їхав із швидкістю 40км/год, а назад порожній - 60км/год. Яка середня швидкість автомобіля за обидві поїздки?
Розв’язання. Величина шляху не має значення.
Час поїздок , .
Тоді швидкість дорівнює
скоротимо на S, отримаємо:
Середня геометрична
Ще однією формулою, по якій може здійснюватися розрахунок середнього показника, є середня геометрична:
• незважена:
• зважена:
Найбільш широке застосування цей вид середньої одержав в аналізі динаміки для визначення середнього темпу росту тому її також називають динамічною середньою.
Приклад: Розрахувати середній темп обсягу реалізованої продукції
Розподіл обсягу реалізації продукції по кварталах
Квартал |
Обсяг реалізації продукції, тис. грн. |
Темп зміни обсягу реалізованої продукції, у % до попереднього кварталу |
1 |
2560,3 |
- |
2 |
1978,6 |
77,3 |
3 |
2380,4 |
120,3 |
4 |
2876,3 |
120,8 |
разом |
9795,6 |
х |
Середній темп зміни обсягу реалізованої продукції розраховують за формулою середньої геометричної:
Приклад: Максимальний розмір виграшу в лотерею 10 000грн., мінімальний - 1грн. Який середній ?
Середній виграш дорівнює 100грн.
Середня квадратична
В основі обчислень ряду зведених розрахункових показників лежить середня квадратична:
• незважена: • зважена:
Найбільше широко цей вид середньої використається при розрахунку показників варіації.
Середня гармонічна, арифметична, квадратична - поодинокі (окремі) випадки середньої степеневої:
При k=-1, отримаємо середню гармонічну, k=1 - середня арифметична, k=2 - квадратична.
Чим вищий ступінь k, тим більше значення х, якщо є варіація ознаки. Правило мажорантності середніх:
Додаткова література:
1. Теорія статистики, А.М.Єріна. – Київ, «Знання», 2001р., с. 55-65
2. Статистика: Навчальний посібник /Р.В.Фещур, А.Ф.Барківський, В.П. Кічор. 2-е вид. оновлене і доповнене. –Львів: «Інтелект-Захід», 2003р., с. 31-39
3. Теория статистики, под ред. Р.А.Шмойловой. – Москва, «Финансы и статистика», 1998р., с. 164-177
Питання до перевірки знань
Рішення типових задач.
Завдання 1. Визначити середній час очікування тролейбусів за даними результатів одноразового вибіркового опитування робітників і службовців одного з обласних центрів:
Середній час очікування, хв |
До 4 |
5—9 |
10-14 |
15—19 |
20 і більше |
Разом |
Чисельність опитаних, % до підсумку |
10 |
30 |
25 |
20 |
15 |
100 |
Розв'язання. При визначенні середньої з інтервального ряду насамперед слід обчислити середину інтервалу кожної з груп як напівсуму нижньої і верхньої меж інтервалу. Якщо ряд розподілу має відкриті інтервали, то їх розмір приймається умовно рівним інтервалу тієї групи, що розташована поруч. Так, для першої групи це буде інтервал наступної, тобто другої, групи, а для останньої - інтервал передостанньої групи. Слід зауважити, що за даними ряду розподілу середня обчислюється як арифметична зважена. Роль ваги при визначенні середньої в наведеному прикладі відіграють частки опитаних:
Отже, середній час очікування тролейбусів становить 12 хв.
У програмі Excel це завдання буде виконуватися за наступною формулою:
Для розрахунку арифметичної зваженої використано функцію Excel =СУММПРОИЗВ. Для того щоб вставити позначену функцію виконайте наступні дії.
Виділіть комірку В5, скориставшись кнопкою на панелі інструментів fx (мастер функций) або пункт меню Вставка - Функции, викличте Майстра функцій. З категорії Математические виберіть функцію СУММПРОИЗВ. Відтягніть зас допомогою мишки вікно що з'явилося так, щоб були видні вхідні данні. Виділіть діапазон комірок В2:F2 і він відобразиться у полі Массив1. Натисніть клавішу Tab або клацніть мишею у полі Массив2. Виділіть діапазон комірок В3:F3 та він відобразиться у полі Массив2. ОК, у комірці В5 буде 1200. Клацніть на кінці рядку формул, введіть з клавіатури знак ділення та клацніть на комірці G2, натисніть Enter, значення у комірці В5 поділіться на 100.
Завдання 2. Використовуючи дані таблиці, що характеризують чисельність студентів, прийнятих до навчальних закладів країни, і тих, які були прийняті на денне відділення, визначити середню частку студентів, прийнятих на денне відділення в 1985/86 і 1990/91 навчальних роках.
Навчальні заклади |
1985/86 |
1990/91 |
||
всього прийнято студентів, тис. чол. |
частка прийнятих на денне відділення, % |
прийнято студентів на денне відділення, тис. чол. |
частка прийнятих на денне відділення , % |
|
Вищі Системи підготовки молодших фахівців |
181,7 264,6 |
58,8 62,8 |
113,4 157,4 |
65,3 66,3 |
При визначенні середньої частки х слід насамперед усвідомити економічний зміст осереднюваного показника, тобто
Знаменник цього співвідношення відіграє роль ваги при визначенні середньої. Що стосується 1985/86 навчального року, то цей показник відомий. Чисельник же наведеного вище співвідношення легко обчислити, помноживши частку студентів, прийнятих на денне відділення, на загальну чисельність прийнятих студентів. Отже, в цьому випадку слід використати формулу середньої арифметичної зваженої:
Середня частка студентів, прийнятих на денне від. ділення в 1985/86 навчальному році, становила 61,2 %.
Даних про загальну чисельність прийнятих студентів у 1990/91 році немає, але цей показник можна визначити, поділивши чисельність студентів, зарахованих на денне відділення, на частку їх у загальній кількості прийнятих. Виходячи з цього, для обчислення середньої частки студентів денного відділення треба використати формулу середньої гармонійної зваженої, тобто:
Студент повинен засвоїти поняття варіант, частота, нагромаджена частота. Навчитися розраховувати моду, медіану та показники варіації.
Класифікація рядів розподілу
Ряд статистичних даних, який отримано в результаті їх зведення і групування за певною зміною кількісною чи якісною ознакою в статиці, називається рядом розподілу.
Ряд розподілу характеризується двома величинами:
Варіант – це окреме значення групувальної ознаки.
Частота – число, яке характеризує, як часто варіант зустрічається в ряді.
Частота, виражена у відносних величинах, називається відносною частотою.
Розрізняють атрибутивні та варіаційні ряди розподілу.
Атрибутивні ряди – ряди утворені за змінними якісними ознаками.
Приклад: Розподіл підприємств і обсягу промислової продукції за формами власності
Форма власності підприємства |
Кількість підприємств, од. |
Обсяг продукції, % |
1. Державна |
1367 |
18,3 |
2. Комунальна |
2093 |
2,2 |
3. Приватна |
11170 |
1,5 |
4. Колективна |
32498 |
77,1 |
5. Міжнародних організацій та юридичних осіб інших держав |
220 |
0,9 |
Всього |
47348 |
100 |
Варіаційні ряди – ряди утворені за кількісними ознаками, які поділяються на дискретні та інтервальні.
Приклад: Дискретний (варіаційний) ряд розподілу робітників за рівнем кваліфікації
Значення ознаки, х |
Частота , f |
Відносна частота, d |
Нагромаджена частота, Sf чол. |
Нагромаджена відносна частота, Sd %. |
Кваліфікацій ний розряд |
Кількість робітників, чол. |
Питома вага робітників, % |
||
1 |
3 |
5,2 |
3 |
5,2 |
2 |
6 |
10,4 |
9 |
15,6 |
3 |
8 |
13,8 |
17 |
29,4 |
4 |
13 |
22,4 |
30 |
51,8 |
5 |
22 |
37,9 |
52 |
89,7 |
6 |
6 |
10,3 |
58 |
100,0 |
Разом |
58 |
100,0 |
х |
х |
Інтервальні поділяються на ряди з рівними та нерівними інтервалами. Для рядів з нерівними інтервалами використовують таку додаткову характеристику, як густота розподілу (частота, яка припадає на одиницю довжини інтервалу).
Нагромаджена частота показує, для скількох одиниць сукупності значення ознаки не перевищує відносного варіанта (для дискретного ряду) або верхньої межі відповідного інтервалу (для інтервального ряду).
Позначимо: х – значення ознаки; - частота; - густота; - відносна частота;
- нагромаджена частота; - нагромаджена відносна частота.
З урахуванням цих позначень отримаємо:
,
де - довжина інтервалу;
- порядковий номер варіанта (інтервалу).
Приклад: Розподіл підприємств за рівнем рентабельності
Значення ознаки, х |
Частота, f |
Відносна частота, |
Нагромаджена частота, од. |
Нагромаджена відносна частота, , % |
Густина, , од. / % |
Рентабель- ність, % |
Кількість підприємств, од. |
Питома вага підприємств, % |
|||
До 5 |
2 |
6,2 |
2 |
6,2 |
0,4 |
5-20 |
21 |
65,6 |
23 |
71,8 |
1,4 |
20-30 |
9 |
28,2 |
32 |
100,0 |
0,9 |
Разом |
32 |
100 |
х |
х |
х |
Для графічного зображення рядів розподілу використовують:
гістограма |
полігон |
кумулята частот |
Мода та медіана варіаційного ряду.
Вивчаючи варіації, застосовуються мода і медіана. Моду вираховують поряд із середньою величиною для характеристики значень варіантів, які найчастіше зустрічаються у сукупності, за допомогою моди запроваджують, наприклад, ходовий розмір взуття і одягу, плануючи масовий випуск. Коли вивчають товарообіг ринку, береться модальна ціна, за якою продається максимальна кількість товару. Вибираючи оптимальні варіанти, наприклад, будівництво пунктів масового обслуговування, контролюючи якість продукції і інших економічних розрахунків, замість середніх арифметичних використовують медіану - значення варіанта, розташованого в середині варіаційного ряду.
Мода - це величина ознаки, яка частіше всього зустрічається у варіаційному ряді, варіант з більшою частотою. Якщо два варіанти мають найбільшу частоту, то розподіл називається бімодальним, якщо більше двох, то мультимодальним.
Медіана - це величина ознаки, яка має варіанти, вона ділить сукупність на дві рівні частини - із значенням ознаки більшими медіани і із значеннями меншими медіани, медіана - середина варіаційного ряду.
Обчислення моди і медіани залежить від того, якого типу варіаційний ряд.
У ранжируваному ряді моди немає, а медіана - середина ряду.
Для визначення моди і медіани в інтервальному ряді застосовують такі формули:
М0 - мода, х0-нижня межа модального інтервалу, і довжина модального інтервалу, - частота модального інтервалу,
- частота інтервалу, попереднього модальному,
- частота інтервалу, який іде за модальним.
Ме - медіана, і-довжина медіанного інтервалу, x0 - нижня межа медіанного інтервалу, - накопичена частота інтервалу, який передував медіанному, - частота медіанного інтервалу. Якщо не є ціле число, округлюємо його до наступного за ним цілого.
Рішення типових задач.
Завдання 1.Задан дискретний ряд - ряд розподілу сімей за кількістю дітей.
Групи сімей за кількістю, дітей |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
Число сімей |
10 |
30 |
75 |
45 |
20 |
15 |
6 |
Мода значення 2, так як цьому значенню відповідає найбільша частота 75.
Медіанний інтервал визначається так, /2=(10+30+75+45+20+15+6)/2=201/2=100,5
Якщо поділивши, отримуємо неціле число, то округлюємо до наступного за ним цілого: 101.
Частота накопичення f’ 10 40 115 160 180 195 201
Знаходимо варіант з номером 101, йому відповідає значення ознаки, яке дорівнює 2
Висновок: Мо=Ме=2.
Завдання 2.Приклад інтервального ряду Розподіл господарств області за урожайністю зернових культур.
Визначити моду, медіану та середню арифметичну урожайності.
Групи господарств за урожайністю xj |
Число господарств fj |
Частота накопичення |
Середина інтервалу x’j |
x’j fj |
10-15 15-20 20-25 25-30 30-35 35-40 40-45 45-50 50-55 Всього |
6 9 20 41 26 21 14 5 1 143 |
6 15 35 79 102 123 137 142 143 |
12,5 17.5 22,5 27,5 32,5 37,5 42.5 47,5 52.5 |
75 1575 450 1127,5 845 787,5 595 237,5 525 4327,5 |
Модальний інтервал - четвертий, частота в цьому інтервалі найбільша -41
тобто найбільш поширена урожайність є близько 28 ц/га.
Медіанний інтервал визначається так, /2 =143/2=71,572
Варіант з номером 72 знаходиться у четвертому інтервалі, значить він медіанний.
Середня арифметична урожайності
Половина господарств області зібрала урожай менш 30,3ц/га, а інша — більш 30,3ц/га.
Завдання 3. Визначити модальний та медіанний вік чоловіків-одинаків за даними перепису населення України 1989 р.
Вік х, років До 20 20-29 30-39 40-49 50-59 60-69 70 і старше Разом
Частка вікової групи, % 4,9 20,1 15,5 15,2 17,0 13,0 14,3 100,0
Розв'язування. Модальний віковий інтервал становить від 20 до 29 років, бо йому відповідає найбільша частота (fm=20,l), сусідні значення відповідно 4,9 та 15,5. Довжина інтервалу дорівнює 9, х0=20.
тобто найбільш поширеним віком серед чоловіків-одинаків є вік близько 27 років.
Порядковий номер центральної варіанти відповідає частці 100/2=50.
Вік х, років До 20 20—29 30—39 40—49 50—59 60—69 70 і старше
Частота накопичення f’ 4,9 25 40,5 55,7 72,7 85,7 100
У графі накопичених частот варіанта 50 знаходиться в групі 40—49 років.
Отже,
Висновки: Половина чоловіків-одинаків перебуває у віці до 45,6 року, а інша — старші 45,6 року.
Показники варіації є доповненням до аналізу суспільних явищ, який здійснюють методом середніх величин. Середні показники дають узагальнюючу характеристику одним числом, а показники варіації визначають на скільки даний середній показник є типовим для сукупності.
Розглянемо 5 показників варіації:
1. Показник розмаху (амплітуди) варіації
2. Середнє лінійне відхилення.
3. Середнє квадратичне відхилення.
4. Дисперсія.
5. Коефіцієнти варіації.
Характеристика за допомогою цього показника недосконала і залежить від випадкових коливань тільки у двох точках.
для простого ряду
для згрупованого ряду
Для завдання 2 з попередньої теми середня арифметична урожайності 30,3ц/га
для простого ряду
або для згрупованого ряду
Для того ж прикладу:
Середнє квадратичне і середнє лінійне відхилення найменовані одиниці. Завжди в реальному житті . Для нормального розподілу
Чим більше співвідношення , тим більше в сукупності відхилень, які чітко виділяються.
, або
На дисперсії базуються практично всі методи математичної статистики.
5. Коефіцієнти варіації -
Вони використовуються для оцінки інтенсивності варіації, для порівняння її в різних сукупностях, для порівняння варіацій різних ознак.
Рішення типових задач.
Завдання 1. Обчислення показників варіації в інтервальному варіаційному ряду.
Групи робітників за місячною виробкою, х млн. грн. |
Чоловік, f |
x’ млн. грн. |
x’f |
||||
2,0-2,4 |
12 |
2,2 |
26,4 |
0,88 |
10,56 |
0,77 |
9,24 |
2,4-2,8 |
15 |
2,6 |
39 |
0,48 |
7,2 |
0,23 |
3,45 |
2,8-3,2 |
30 |
3,0 |
90 |
0,08 |
2,4 |
0,01 |
0,3 |
3,2-3,6 |
22 |
3,4 |
74,8 |
0,32 |
7,04 |
0,1 |
2,2 |
3,6-4,0 |
18 |
3,8 |
68,4 |
0,72 |
12,96 |
0,52 |
9,36 |
Всього |
97 |
298,6 |
40,16 |
24,55 |
Варіація виробки 16,33 % може бути оцінена як середня.
Приблизно менше 10 % - слабка, 10 % < V < 25 % - середня, більше 25 % - сильна. Однак, якщо ми досліджуємо варіацію зросту в сукупності дорослих чоловіків і вона 7 %, то можна вважати їй сильною. У нас варіація від 2 до 4, тобто абсолютна різниця складає 2, у відсотках - 100 %. Відхилення в зрості у півтора рази - це вже багато. Тому поділ варіації на типи умовний і залежить від змісту задачі.
У великих масивах даних для обчислення дисперсії застосовується спрощена формула
Завдання 3.За результатами вибіркового обстеження визначити нормований середній бал, що узагальнює ставлення населення до приватизації. Зробити висновки.
Ставлення до приватизації |
Частка відповідей, % |
Ранг, |
Розрахункова величина |
Повністю підгримують |
32 |
3 |
96 |
Частково підтримують |
47 |
2 |
94 |
Не підтримують |
21 |
1 |
21 |
Разом |
100 |
X |
211 |
Розв'язування. Нормований середній бал застосовують для ознак рангової шкали. Тому спочатку слід ранжирувати значення ознаки в порядку зростання якості. Оскільки ознака «ставлення до приватизації» має три градації, то найвищого рангу надають відповіді «повністю підтримують», а найнижчого — «не підтримують».
Нормований середній бал обчислюють за формулою
де
Отже,
Нормований середній бал
Отже, рівень підтримки приватизації житла з боку населення становить в середньому 55 %.
Додаткова література:
1. Теорія статистики, О.І.Кулинич. – Київ, «Вища школа», 1992р., с. 42-52
2. Статистика: Навчальний посібник /Р.В.Фещур, А.Ф.Барківський, В.П. Кічор. 2-е вид. оновлене і доповнене. –Львів: «Інтелект-Захід», 2003р., с. 29-67
3. Теория статистики, под ред. Р.А.Шмойловой. – Москва, «Финансы и статистика», 1998р., с. 181-229
Питання до перевірки знань
Процес розвитку, руху соціально – економічних явищ у часі у статистиці прийнято називати динамікою. Для відображення динаміки будують ряди динаміки (хронологічні, часові). Складовими ряду динаміки є показники рівнів ряду і періоди часу (роки, квартали, місяці, доби) або моменти часу (дати).
В залежності від способу вираження рівнів ряди динаміки поділяють на абсолютних, відносних та середніх величин.
Приклад1: Чисельність побудованих квартир та їх середній розмір
1980 |
1985 |
1992 |
1998 |
2002 |
|
Чисельність квартир, тис |
1190 |
1151 |
682 |
682 |
602 |
Середній розмір квартир, м2 загальної площі |
49,9 |
54,4 |
60,8 |
61,3 |
68,2 |
Питома вага жилої площі у загальної площі квартир, % |
62,7 |
60,7 |
60,0 |
60,1 |
60,1 |
У таблиці рядом динаміки абсолютних величин є дані першого рядка; рядом середніх величин – другий рядок; рядом відносних величин – третій.
Якщо маємо стан явища НА якійсь момент часу ряд називається моментним.
Якщо маємо стан явища ЗА якійсь термін часу ряд називається інтервальним.
Приклад2: Ряд динаміки, що відображає суму вкладів населення у банки України (на кінець року, млн. грн.):
1990 |
1991 |
1992 |
1993 |
1994 |
1995 |
41,3 |
47,0 |
67,2 |
50,2 |
50,3 |
50,4 |
Прикладом інтервального ряду динаміки є дані прикладу 1.
Рівні інтервального ряду можна додавати, моментного безглуздо, оскільки містять елементи повторного рахунку.
Ряди динаміки наступних друг за другом періодів або через певні проміжки дат називаються рівновіддаленими (приклад2). Якщо у рядах динаміки даються переривчасті періоди або нерівномірні проміжки між датами, тоді ряди називаються нерівновіддаленими (приклад 1).
Ряди динаміки повинні відповідати таким вимогам:
Наприклад, якщо у якійсь роки середню урожайність рахували з засіяної площі, а в другій – з прибраної, тоді ці рівні непорівнянні. Не можна також порівнювати та аналізувати цифри про випуск тканей, якщо за одні роки дані у погонних метрах, а за другі – у квадратних. Не можна порівнювати квартальну продукцію з продукцією за рік. Кількість народжених з випуском сталі.
Показники зміни динамічного ряду
Відносні
Абсолютні
базисний
ланцюговий
Абсолютний приріст
базисний
ланцюговий
Коефіцієнт зміни
Абсолютне значення 1% приросту
Темп зміни
базисний
ланцюговий
Коефіцієнт приросту
Темп приросту
Наведемо формули для розрахунку показників зміни динамічного ряду, де - значення і-го моментного або інтервального рівня.
Розрахунок ряду динаміки можна розділити на дві категорії:
Можливі два варіанти зіставлення поточних рівнів ряду динаміки:
|
|
Середній рівень інтервального ряду |
|
Середній рівень моментного ряду з рівними проміжками часу |
|
Середній рівень моментного ряду з різними проміжками часу |
t –проміжок часу між датами |
Середній абсолютний приріст (обчислюють як середню арифметичну ланцюгових приростів) |
|
Середній темп зміни (розраховують за допомогою середньої геометричної) |
|
Середній темп приросту |
Приклад 3: Обсяг продукції, реалізованої фірмою з 1997р. по 2002р., характеризується такими даними, тис. Грн.:
1997 |
1998 |
1999 |
2000 |
2001 |
2002 |
570 |
530 |
550 |
590 |
610 |
630 |
Розрахуємо абсолютні та відносні показники динаміки:
Для розрахунку скористаємось формулами:
Середній абсолютний приріст:
Середній темп зміни:
Середній темп приросту:
Додаткова література:
1. Теорія статистики, О.І.Кулинич. – Київ, «Вища школа», 1992р., с. 80-95
2. Статистика: Навчальний посібник /Р.В.Фещур, А.Ф.Барківський, В.П. Кічор. 2-е вид. оновлене і доповнене. –Львів: «Інтелект-Захід», 2003р., с. 107-126
3. Теория статистики, под ред. Р.А.Шмойловой. – Москва, «Финансы и статистика», 1998р., с. 344-399
Питання до перевірки знань
Індекс у статистиці – узагальнюючий відносний показник, який характеризує співвідношення в часі чи просторі соціально-економічних явищ і процесів.
Індекси використовуються для порівняльної характеристики сукупності в часі, для порівняння фактичного випуску з планом, для порівняння рівнів виробництва продукції, цін, продуктивності праці в різних регіонах, на різних підприємствах, для різних товарів.
Розраховуючи індекси, будемо використовувати такі стандартні позначення:
0 – індекс базового періоду;
1 - індекс звітного періоду;
q – кількість виробництва (реалізації, продажу) продукції;
p – ціна одиниці продукції;
z – собівартість одиниці продукції;
t – витрати часу (трудомісткість) на виробництво (продаж) одиниці продукції;
w –виробіток в грошових одиницях на одного працівника (на одиницю затраченого часу);
v – виробіток в натуральних одиницях на одного працівника (на одиницю затраченого часу);
Q – обсяг виробництва (реалізації, продажу) продукції, Q = p q ;
Z – загальні витрати на виробництво і реалізацію продукції в грошових одиницях, Z = z q ;
T – загальні витрати часу на виробництво (продаж) продукції, T = t q
N – середньоспискова чисельність персоналу підприємства;
i – індивідуальний індекс;
I – зведений індекс.
До найбільш уживаних в економічному аналізі належать такі індекси:
Індивідуальний індекс – це відносна величина, яка характеризує зміну в часі окремих елементів складного явища без урахування його структури.
Індивідуальний індекс |
|
Назва |
Розрахункова формула |
1. індекс ціни |
|
2. індекс кількості продажу (виробництва) продукції |
|
3. індекс товарообігу |
|
4. індекс собівартості продукції |
|
5. індекс продуктивності праці |
Історично індекси виникли і розвивалися як метод дослідження динаміки цін на сукупність неоднорідних товарів. Для розрахунку зведених індексів використовують зважену середню.
Зведені індекси |
||||
Вид індексу |
Форма зображення |
|||
Агрегатна |
Середня зважена |
|||
1. індекс цін, Ір |
||||
2. індекс фізичного обсягу, Іq |
||||
3. індекс собівартості , Iz |
||||
4. індекс продуктивності праці, Iv |
||||
5. індекс продуктивності праці, Iw |
||||
6. індекс продуктивності праці, It |
Приклад 1: За даними таблиці дослідити зміну цін, кількості виробництва та собівартості одиниці продукції, зведені індекси цін, фізичного обсягу продукції та собівартості.
Вид продукції |
Базовий період |
Звітний період |
||||
Ціна, грн. |
Кількість виробництва шт. |
Собівартість один.прод., грн. |
Ціна, грн. |
Кількість виробництва, шт. |
Собівартість один.прод., грн. |
|
1. АК1 |
65,0 |
120 |
57,0 |
69,0 |
112 |
59,4 |
2. АС2 |
72,0 |
85 |
64,6 |
78,0 |
96 |
66,2 |
3. АМ1 |
69,5 |
44 |
58,2 |
66,0 |
57 |
56,1 |
Разом |
х |
249 |
х |
х |
265 |
х |
Індивідуальні індекси цін для кожного виду продукції дорівнюватимуть:
Ціна продукції АК1 у звітному періоді збільшилася на 6,2%, продукції АС2 – збільшилася на 8,3%, продукції АМ1 – зменшилася на 5%.
Індивідуальні індекси кількості виробництва продукції становитимуть:
Кількість виробництва продукції АК1 у звітному періоді порівняно з базовим зменшилася на 6,7%, продукції АС2 – збільшилася на 12,9%, продукції АМ1 – збільшилася на 29,5%.
Індивідуальні індекси собівартості продукції будуть дорівнювати:
Це означає, що собівартість одиниці продукції АК1 у звітному періоді зросла на 4,2%, продукції АС2 - зросла на 2,5% продукції АМ1 – зменшилася на 3,6%.
Індивідуальні індекси обсягу виробництва продукції розрахуємо за допомогою індексу ціни та індексу кількості:
Це означає, що обсяг виробництва продукції АК1 у звітному періоді зменшився на 0,9%, продукції АС2 – зріс на 22,3%, продукції АМ1 – зріс на 23,0%.
Аналогічно можна обчислити індивідуальні індекси загальних витрат на виробництво продукції:
Отже, загальні витрати на виробництво продукції АК1 у звітному періоді зменшилося на 2,8%, продукції АС2 – збільшилися на 15,7%, продукції АМ1 – збільшилися на 24,8%.
Зведені індекси цін, фізичного обсягу продукції та собівартості дорівнюватимуть:
Ціни на продукцію трьох видів збільшилися у середньому на (1,045-1)100%=4,5%
Загальна кількість продукції збільшилися у середньому на (1,069-1)100%=6,9%
Собівартість одиниці продукції в середньому збільшилася на 1,9% = (1,019-1)100%.
Обсяг виробництва продукції у звітному періоді збільшився на 11,78%
Додаткова література:
1. Теорія статистики, О.І.Кулинич. – Київ, «Вища школа», 1992р., с. 95-105
2. Статистика: Навчальний посібник /Р.В.Фещур, А.Ф.Барківський, В.П. Кічор. 2-е вид. оновлене і доповнене. –Львів: «Інтелект-Захід», 2003р., с. 151-170
3. Теория статистики, под ред. Р.А.Шмойловой. – Москва, «Финансы и статистика», 1998р., с. 344-399
Питання до перевірки знань
Паврпав
Вибірковий метод
Основні поняття та категорії
Вибірковий метод — це система наукових принципів випадкового відбору певної частини сукупності, яка представляла б усю сукупність і характеристики якої слугували б надійною основою статистичного висновку.
Сукупність, з якої відбираються елементи для обстеження, називають генеральною, а сукупність, яку безпосередньо обстежують, — вибірковою. Статистичні характеристики вибіркової сукупності розглядаються як оцінки відповідних характеристик генеральної сукупності. Оскільки вибіркова сукупність не точно відтворює структуру генеральної, то вибіркові оцінки також не збігаються з характеристиками генеральної сукупності. Розбіжності між ними називають похибками репрезентативності. За причинами виникнення ці похибки поділяються на систематичні (тенденційні) та випадкові. Систематичні похибки виникають за умови, що під час формування вибіркової сукупності порушується принцип випадковості відбору (упереджений відбір елементів, недосконала основа вибірки тощо). Випадкові похибки — це наслідок випадковості відбору елементів сукупності для обстеження.
При організації вибіркового обстеження важливо запобігти виникненню систематичних похибок. Що стосується випадкових похибок, то уникнути їх неможливо, проте на основі теорії вибіркового методу можна визначити розмір і по можливості регулювати.
У практиці вибіркових спостережень використовують два типи вибіркових оцінок — точкові та інтервальні. Точкова оцінка — це значення параметра за даними вибірки: вибіркова середня х або вибіркова частка р. Інтервальна оцінка — це інтервал значень параметра, розрахований за даними вибірки для певної імовірності, тобто довірчий інтервал. Межі його визначаються на основі точкової оцінки та граничної похибки вибірки :
для середньої ;
для частки ,
де μ — середня, або стандартна похибка вибірки; t — квантиль розподілу ймовірностей (довірче число); та — середня та частка генеральної сукупності.
Стандартна похибка вибірки є середнім квадратичним відхиленням вибіркових оцінок від значень параметра генеральної сукупності:
при повторному відборі ,
при безповторному ,
де σ2 — вибіркова дисперсія; п та N — відповідно обсяг вибіркової та генеральної сукупностей.
При практичному використанні наведених формул слід враховувати, що:
1) дисперсія частки є добутком часток
2) у великих за обсягом сукупностях (30 і більше одиниць) поправка не вносить істотних змін у розрахунки, а тому враховується лише у малочисельних (малих) вибірках;
3) коригуючий множник для безповторної вибірки при малих величинах наближається до 1, а тому при 1—5% - вій вибірці розрахунок μ ведеться за формулою для повторної вибірки.
Простий випадковий відбір проводиться жеребкуванням або на основі таблиць випадкових чисел. Це класичний спосіб формування вибіркової сукупності і саме на ньому ґрунтується теорія вибіркового методу.
При механічному відборі основою вибірки є упорядкована чисельність елементів генеральної сукупності. Відбір елементів здійснюється через однакові інтервали, крок інтервалу залежить від частки вибірки. Так, при =0,05 крок інтервалу становить . Похибка механічної вибірки обчислюється за формулою безповторної вибірки. Для моментних спостережень, суть яких зводиться до фіксації стану безперервного процесу на певні моменти часу, використовують формулу похибки повторної вибірки. Розшарований (районований) відбір передбачає попередню структуризацію генеральної сукупності та незалежний відбір елементів у кожній складовій частині. Обсяг розшарованої вибірки — це сума частинних вибірок пj, тобто , де т — число складових частин (груп, типових районів тощо). При обчисленні похибки розшарованої вибірки використовують середню з групових дисперсій
Як правило, , отже, похибка розшарованої вибірки менша, ніж механічної чи простої випадкової. Найчастіше використовують відбір, пропорційний чисельності складових сукупності, тобто частка вибірки для всіх складових однакова.
При серійному відборі основа вибірки складається з серій елементів сукупності, зв'язаних територіально (райони, селища), організаційно (фірми, акціонерні товариства) тощо. Серії відбираються за схемою механічної або простої випадкової вибірки, обстеженню підлягають всі елементи серії. При обчисленні похибки вибірки враховується міжсерійна варіація:
де та — відповідно обсяг і середня k-ї серії.
Проектуючи вибіркові спостереження, визначають мінімально достатній обсяг вибірки, за якого вибіркові оцінки репрезентували б основні властивості генеральної сукупності:
для повторного відбору для безповторного
Для визначення обсягу вибірки п використовують оцінки дисперсій σ2 аналогічних пробних обстежень. Якщо такі обстеження відсутні, можна скористатися співвідношенням а для частки взяти найбільше значення дисперсії σ2=0,25.
Приклад 1: З метою визначення врожаю нового сорту пшениці була проведена 5% механічна вибірка, де обстежено 100 однакових за розміром дільниць, табл.26.
Розподіл дільниць за рівнем врожайності:
Врожайність, ц/га |
До 42 |
42-44 |
44-46 |
46-48 |
48-50 |
Більше 50 |
Посівна площа, га |
5 |
10 |
20 |
30 |
25 |
10 |
Визначте: 1) використовуючи спосіб моментів: а) середню врожайність пшениці; б) дисперсію та середнє квадратичне відхилення;
2) коефіцієнт варіації;
3) з імовірністю 0,954 граничну помилку вибірки та межі, в яких можливо чекати середню врожайність пшениці. Зробіть висновки.
Рішення:
Врожайність, ц/га |
До 42 |
42-44 |
44-46 |
46-48 |
48-50 |
> 50 |
Сума |
Посівна площа, га |
5 |
10 |
20 |
30 |
25 |
10 |
100 |
Середина інтервалу |
41 |
43 |
45 |
47 |
49 |
51 |
|
33,64 |
14,44 |
3,24 |
0,04 |
4,84 |
17,64 |
||
168,2 |
144,4 |
64,8 |
1,2 |
121 |
176,4 |
676 |
а) середня врожайність пшениці;
б) дисперсія та середнє квадратичне відхилення .
2) коефіцієнт варіації
3) Інтервальна оцінка — це інтервал значень параметра, розрахований за даними вибірки для певної імовірності, тобто довірчий інтервал. Межі його визначаються на основі точкової оцінки та граничної похибки вибірки для середньої
.
Стандартна похибка вибірки є середнім квадратичним відхиленням вибіркових оцінок від значень параметра генеральної сукупності. Для моментних спостережень, суть яких зводиться до фіксації стану безперервного процесу на певні моменти часу, використовують формулу похибки повторної вибірки:
.
Для імовірності 0,954 по таблиці t-розподілу Стьюдента t=2.
Висновки.
З імовірністю 0,954 можна стверджувати, що середня врожайність не менше 46,34 і не більше 47,26 ц/га.
Додаткова література:
1. Теорія статистики, О.І.Кулинич. – Київ, «Вища школа», 1992р., с. 95-105
2. Статистика: Навчальний посібник /Р.В.Фещур, А.Ф.Барківський, В.П. Кічор. 2-е вид. оновлене і доповнене. –Львів: «Інтелект-Захід», 2003р., с. 151-170
3. Теория статистики, под ред. Р.А.Шмойловой. – Москва, «Финансы и статистика», 1998р., с. 344-399
Бажаю успіхів!
Вступ 1
Методологічні засади статистики 1
Статистичне спостереження. 2
Зведення й групування статистичних даних. 4
Подання статистичних даних: таблиці, графіки, карти. 7
Узагальнюючі статистичні показники. 18
Аналіз рядів розподілу 32
Аналіз концентрації, диференціації та подібності розподілів 37
Аналіз інтенсивності динаміки 40
Індексний метод 44
Вибірковий метод…………………………………………………………………..47