Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
СТАТИСТИЧЕСКАЯ ГРУППИРОВКА И РАСЧЕТ ЧИСЛОВЫХ ХАРАКТЕРИСТИК В MS EXCEL
Пример 2.3. При изменении диаметра валика после шлифовки была получена следующая выборка (объемом ):
20.3 |
15.4 |
17.2 |
19.2 |
23.3 |
18.1 |
21.9 |
15.3 |
16.8 |
13.2 |
20.4 |
16.5 |
19.7 |
20.5 |
14.3 |
20.1 |
16.8 |
14.7 |
20.8 |
19.5 |
15.3 |
19.3 |
17.8 |
16.2 |
15.7 |
22.8 |
21.9 |
12.5 |
10.1 |
21.1 |
18.3 |
14.7 |
14.5 |
18.1 |
18.4 |
13.9 |
19.8 |
18.5 |
20.2 |
23.8 |
16.7 |
20.4 |
19.5 |
17.2 |
19.6 |
17.8 |
21.3 |
17.5 |
19.4 |
17.8 |
13.5 |
17.8 |
11.8 |
18.6 |
19.1 |
Необходимо построить интервальный вариационный ряд, состоящий из семи интервалов.
Вычисление выборочных среднего и дисперсии. Для вычисления выборочного среднего используется функция СРЗНАЧ, обращение к которой имеет вид:
=СРЗНАЧ(арг1; арг2; …; арг30),
где арг1; арг2; …; арг30 числа или адреса ячеек, содержащих числовые данные. Если ячейка содержит текстовые, логические значения или ячейка пуста, то такие ячейки игнорируются при подсчете среднего значения по формуле
.
Здесь и в дальнейшем запись арг1; арг2; …; арг30 означает наличие от 1 до 30 аргументов функции Excel.
Для вычисления выборочной дисперсии (2.14) используется функция ДИСПР, обращение к которой имеет вид:
=ДИСПР(арг1; арг2; …; арг30),
где арг1; арг2; …; арг30 числа или адреса ячеек, содержащих числовые данные. Ячейки, содержащие текстовые, логические данные или пустые, при вычислении выборочной дисперсии игнорируются.
♦ Пример 2.11. По выборке примера 2.3 вычислить выборочное среднее и выборочную дисперсию двумя способами:
Способ 1. Программируя в ячейках Excel необходимые вычисления.
Способ 2. Используя функции Excel СРЗНАЧ, ДИСПР.
Решение. Первоначально, начиная с ячейки А3, введем в столбец А 55 элементов выборки (диапазон А3:А57). Запрограммируем выражения (2.10), (2.14), используя функцию СУММ, аргументами, указанными на рис. 2.7 для подсчета дисперсии создадим еще один столбец в который будем записывать выражение (xi-xср)^2. Затем подсчитаем сумму квадратов и разделим ее на 55. Затем вычислим характеристики (2.10), (2.14) с использованием статистических функций СРЗНАЧ, ДИСПР (см. рис. 2.7). Как и следовало ожидать, результаты вычислений двумя способами совпали. ☻
Рис. 2.7. Вычисление выборочных среднего и дисперсии
Кроме приведенных функций при вычислении выборочных характеристик могут быть полезными следующие функции:
Функция СТАНДОТКЛОН вычисляет стандартное отклонение по выборке. Стандартное отклонение это мера того, насколько широко разбросаны точки данных относительно их среднего. Обращение к ней имеет вид:
=СТАНДОТКЛОН(арг1; арг2; …; арг30),
где арг1; арг2; …; арг30 числовые константы или адреса ячеек, содержащих числовые данные.
Функция МАКС вычисляет максимальное значение из заданных аргументов. Обращение к ней имеет вид:
=МАКС(арг1; арг2; …; арг30),
где арг1; арг2; …; арг30 числовые константы или адреса ячеек, содержащих числовые величины.
Функция МИН вычисляет минимальное значение из заданных аргументов. Обращение к ней имеет вид:
=МИН(арг1; арг2; …; арг30),
где арг1; арг2; …; арг30 числовые константы или адреса ячеек, содержащих числовые величины.
Функция МОДА вычисляет значение моды множества данных. (Мода - наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных). Обращение к функции имеет вид:
=МОДА(арг1; арг2; …; арг30),
где арг1; арг2; …; арг30 числовые константы или адреса ячеек, содержащих числовые величины.
Функция МЕДИАНА вычисляет значение медианы множества данных. (Медиана это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана.). Обращение к функции имеет вид:
=МЕДИАНА(арг1; арг2; …; арг30),
где арг1; арг2; …; арг30 числовые константы или адреса ячеек, содержащих числовые величины.
Функция ЭКСЦЕСС вычисляет значение эксцесса множества данных. (Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение. Отрицательный эксцесс обозначает относительно сглаженное распределение.). Обращение к функции имеет вид:
= ЭКСЦЕСС (арг1; арг2; …; арг30),
где арг1; арг2; …; арг30 числовые константы или адреса ячеек, содержащих числовые величины.
Функция СКОС вычисляет асимметрию распределения. (Асимметрия характеризует степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значений. Для симметричной плотности распределения ассиметрия равна 0.)
Обращение к функции имеет вид:
=СКОС(арг1; арг2; …; арг30),
где арг1; арг2; …; арг30 числовые константы или адреса ячеек, содержащих числовые данные.
Вычисление описательных статистик. Описательные статистики можно разделить на следующие группы:
Основные характеристики положения, разброса и асимметрии можно вычислить, используя режим Описательная статистика команды Пакет анализа.
Для вызова режима Описательная статистика необходимо обратиться к пункту Сервис, команде Пакет анализа, выбрать в списке режимов Описательная статистика и щелкнуть на кнопке ОК. В появившемся диалоговом окне Описательная статистика задать следующие параметры (рис. 3.6):
Входной интервал: адреса ячеек, содержащих элементы выборки.
Группирование: задает способ расположения (по столбцам или по строкам) элементов выборки.
Метки в первой строке включается, если первая строка (столбец) во входном интервале содержит заголовки.
Рис. 3.6. Параметры режима Описательная статистика
Выходной интервал: / Новый рабочий лист: / Новая рабочая книга определяет место вывода результатов вычислений. При включении Выходной интервал: в поле вводится адрес ячейки, начиная с которой будут выводиться результаты.
Итоговая статистика: включается, если необходимо вывести по одному полю для каждой из вычисленных характеристик.
Уровень надежности: включается, если необходимо вычислить доверительный интервал для математического ожидания с задаваемым () уровнем надежности .
К-й наименьший: включается, если необходимо вычислить к-й наименьший (начиная с ) элемент выборки. При к = 1 вычисляется наименьшее значение.
К-й наибольший: включается, если необходимо вычислить к-й наибольший (начиная с ) элемент выборки. При к = 1 вычисляется наибольшее значение.
Пример задания параметров приведен на рис. 3.6.
Результаты работы режима Описательная статистика выводятся в виде таблицы, в левом столбце которой приводится название вычисленной характеристики (рис. 3.7), позволяющее однозначно трактовать характеристику. Тем не менее, поясним следующие названия характеристик:
,
где выборочное среднее (подробнее см. п. 4.3).
♦ Пример 3.8. По выборке примера 2.3 вычислить описательные статистики, используя режим Описательная статистика.
Решение. Первоначально, начиная с ячейки А3, введем в столбец А 55 элементов выборки. После этого обратимся к пункту Сервис, команде Пакет анализа. В списке режимов выберем Описательная статистика. В появившемся диалоговом окне включим параметры, показанные на рис. 3.6, и щелкнем ОК. Вычисленные характеристики приведены на рис. 3.7. ☻
Рис. 3.7. Результаты работы Описательная статистика
Задание 3.2. Сравните значения характеристик (см. рис. 3.7) со значениями аналогичных характеристик, вычисленных в предыдущих примерах. ♥
РАСЧЕТ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА ДЛЯ ГЕНЕРАЛЬНОЙ СРЕДНЕЙ
Интервальная оценка надежности для неизвестной генеральной средней а при случайной выборке имеет границы
.
Выразим границы интервала через исправленную дисперсию . Так как , то .
Значит, границы доверительного интервала можно записать как
, (4.14)
а точность интервальной оценки определить соотношением
. (4.15)
Пример 4.2. По выборке объема п = 9 из нормально распределенной генеральной совокупности найдены значения и . Построить интервальную оценку для математического ожидания с надежностью .
Решение. Пользуясь таблицей критических значений Стьюдента, находим величину.. Тогда точность определяется соотношением (см. (4.15)): , а интервальная оценка имеет границы , которые зависят от двух случайных величин: и S. Подставляя вместо S ее вычисленное значение s = 2 и вместо случайной величины ее конкретное значение , получаем конкретное значение границ (0, 3). ☻
Примечание. Вычисление величины , входящей в доверительный интервал
,
осуществляют с использованием функции СТЬЮДРАСПОБР, обращение к которой имеет вид:
,
где , n-2 число степеней свободы.