Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Точечные статистические характеристики
Выборочными характеристиками называются характеристики, рассчитанные по данным выборки из изучаемой генеральной совокупности. Характеристики называются точечными, если они определяются одним числом.
§2.1. Основные точечные статистические характеристики
Средние
Выборочной средней называется среднее арифметическое значений измеряемой величины:
, (2.1)
где xi, варианты, ni их частоты, n объем выборки.
Если данные не сгруппированы, то выборочная средняя является обычной средней арифметических всех наблюдений:
(2.2)
Выборочная средняя служит для оценки генеральной средней. Генеральной средней называется среднее арифметическое всех значений данной величины в генеральной совокупности.
Дисперсии. Стандартное отклонение
Выборочной дисперсией называется среднее арифметическое квадратов отклонений значений измеряемой величины от выборочной средней:
. (2.3)
В этой формуле и во всех последующих формулах данного параграфа предполагается, что данные уже сгруппированы.
Формулу (2.3) можно привести к более удобному для вычислений виду:
, (2.4)
где среднее арифметическое квадратов отклонений:
. (2.5)
Дисперсия, вычисляемая по значениям изучаемой величины генеральной совокупности, называется генеральной дисперсией и обозначается .
Исправленной дисперсией называется величина
, (2.6)
где n объем выборки. Различие между величинами s2 и ощутимо при n<30, поэтому на практике при n>30 достаточно использовать .
Выборочным стандартным (или средним квадратическим) отклонением называется корень квадратный из выборочной дисперсии:
. (2.7)
Генеральным стандартным (или средним квадратическим) отклонением называется корень квадратный из генеральной дисперсии.
Исправленным стандартным отклонением s называется корень квадратный из исправленной дисперсии:
. (2.8)
Мода. Медиана. Размах варьирования
В некоторых случаях возникает необходимость вычисления дополнительных точечных характеристик выборки, таких как мода, медиана, размах варьирования.
Модой Мо называется значение измеряемой величины, которое чаще других встречается в совокупности данных, то есть мода это варианта с наибольшей частотой.
Медианой Ме называется значение измеряемой величины, которое разделяет совокупность на две равные по числу элементов части. Если количество k различных вариант в выборке нечетное, то медиана равна Ме=хm, где m=(k+1)/2, а k число вариант. Если количество k различных вариант в выборке четное, то медиана равна Ме=(хm+хm+1)/2, где m=k/2, а k число вариант.
Размах варьирования R это разность между наибольшим xmax и наименьшим xmin значениями измеряемой величины совокупности (генеральной или выборочной): R=xmaxxmin.
Асимметрия и эксцесс эмпирического распределения
Для оценки отклонения распределения данных эксперимента от нормального распределения (о нормальном распределении подробнее см. в следующей главе 3.) используются такие характеристики как асимметрия А и эксцесс Е. Для нормального распределения А=0 и Е=0.
Асимметрия показывает, на сколько распределение данных несимметрично относительно нормального распределения: если А>0, то большая часть данных имеет значения, превышающие среднее ; если А<0, то большая часть данных имеет значения, меньшие среднего .
Эксцесс оценивает крутость, т.е. величину большего или меньшего подъема максимума распределения экспериментальных данных по сравнению с максимумом нормального распределения. Если Е>0, то максимум экспериментального распределения выше нормального; если Е<0, то максимум экспериментального распределения ниже нормального.
На практике считают, что если значения асимметрии и эксцесса эмпирического распределения отличаются от нуля в пределах ±0,5, то такое отличие может быть отнесено за счет случайности выборочного метода.
§2.2. Стандартные статистические функции Excel
Вызов статистических функции Excel
Для вызова любой стандартной статистической функции Excel можно воспользоваться Мастером функций, загрузка которого осуществляется нажатием на кнопку Вызов функции на Панели инструментов.
После нажатия на эту кнопку появляется диалоговое окно Мастера функций:
При использовании Мастера функций сначала в группе Категория следует выбрать Статистические, а затем найти в списке функций нужную и нажать ОК. Дальнейшие действия такие же как и при работе с любой функцией из других категорий.
Поскольку каждая функция имеет свои параметры, то целесообразно воспользоваться помощью. Для ее вызова достаточно выделить необходимую функцию и нажать на кнопку с вопросительным знаком в этом же диалоговом окне. В версии Excel 2000 появляется Помощник, в котором следует нажать на Справка по этой теме, а затем на Справка по выделенной функции.
Вычисление средних в Excel
В Excel возможно вычислить среднее значение с помощью стандартной функции в том случае, если данные несгруппированы.
Функция СРЗНАЧ (или AVERAGE) вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности по формуле (2.2). Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201). Данная функция, как и все последующие, находится в категории функций статистические.
Если исходные данные уже сгруппированы, то вычисление среднего значения следует производить по формуле (2.1), используя функцию суммирования.
Вычисление дисперсий в Excel
В Excel имеются функции, отдельно вычисляющие исправленную дисперсию s2 по формуле (2.6) и исправленное стандартное отклонение s по формуле (2.8), генеральные и выборочные дисперсию Dг и по формуле (2.6) и стандартное отклонение г и в по формуле (2.7). Поэтому, прежде чем вычислять дисперсию и стандартное отклонение, следует четко определиться, являются ли ваши данные генеральной совокупностью или выборочной, а также какую дисперсию необходимо вычислить: исправленную или обычную.
Использование стандартных функций Excel возможно только при обработке несгруппированных данных. Если исходные данные уже сгруппированы, то вычисление дисперсий и стандартных отклонений следует производить по указанным выше формулам, используя функции суммирования и извлечения корня.
Для вычисления исправленной дисперсии s2 по формуле (2.6) и исправленного стандартного отклонения s по формуле (2.8) имеются функции ДИСП (или VAR) и СТАНДОТКЛОН (или STDEV). Аргументом этих функций является набор чисел, как правило, заданный диапазоном ячеек, например, =ДИСП(В1:В48), если данные содержатся в интервале ячеек от В1 до В48.
Для вычисления выборочной (или генеральной) дисперсии по формуле (2.3) и стандартного отклонения по формуле (2.7) имеются функции ДИСПР (или VARP) и СТАНДОТКЛОНП (или STDEVP), соответственно.
Аргументы этих функций такие же как и для исправленной дисперсии.
Вычисление числа наблюдений, моды, медианы, максимального и минимального значений выборки в Excel
Функция СЧЕТ (или COUNT) определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ(С2:С16).
Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3. Ее аргументом является интервал ячеек.
Мода вычисляется функцией МОДА (или MODE). Ее аргументом является интервал ячеек с данными.
Медиана вычисляется функцией МЕДИАНА (или MEDIAN). Ее аргументом является интервал ячеек.
Для нахождения наибольшего значения среди статистических данных xmax имеется функция МАКС (или MAX), а для наименьшего xmin функция МИН (или MIN). Их аргументом является интервал ячеек.
Для того, чтобы вычислить размах варьирования данных в интервале ячеек, например, от А1 до А100, следует ввести формулу:
=МАКС(А1:А100)МИН(А1:А100).
Вычисление асимметрии и эксцесса эмпирического распределения в Excel
Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС(А1:А100), если данные содержатся в интервале ячеек от А1 до А100.
Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС(А1:А100).
§2.3. Инструмент анализа Описательная статистика
В Excel имеется возможность вычислить сразу все точечные характеристики выборки с помощью инструмента анализа Описательная статистика, который содержится в Пакете анализа.
Описательная статистика создает таблицу основных статистических характеристик для совокупности данных. В этой таблице будут содержаться следующие характеристики: среднее, стандартная ошибка, дисперсия, стандартное отклонение, мода, медиана, размах варьирования интервала, максимальное и минимальное значения, асимметрия, эксцесс, объем совокупности, сумма всех элементов совокупности, доверительный интервал (уровень надежности). Инструмент Описательная статистика существенно упрощает статистический анализ тем, что отпадает необходимость вызывать каждую функцию для расчета статистических характеристик отдельно.
Для того чтобы вызвать Описательную статистику, следует:
В окне Описательная статистика необходимо:
В результате появится таблица с вычисленными значениями указанных выше статистических характеристик. Сразу, не сбрасывая выделения этой таблицы, выполните команду ФорматСтолбецАвтоподбор ширины.
Вид диалогового окна Описательная статистика:
2.1. Вычисление основных точечных статистических характеристик с помощью стандартных функции Excel
Одним и тем же вольтметром было измерено 25 раз напряжение на участке цепи. В результате опытов получены следующие значения напряжения в вольтах:
32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35,
34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.
Найти среднюю, выборочные и исправленные дисперсию, стандартное отклонение, размах варьирования, моду, медиану. Проверить отклонение от нормального распределения, вычислив асимметрию и эксцесс.
Для выполнения этого задания проделайте следующие пункты.
2.2. Использование инструмента анализа
Описательная статистика
В результате наблюдений получены следующие данные:
10 |
13 |
10 |
9 |
9 |
12 |
12 |
6 |
7 |
9 |
8 |
9 |
11 |
9 |
14 |
13 |
9 |
8 |
10 |
7 |
10 |
10 |
11 |
11 |
11 |
12 |
8 |
7 |
9 |
10 |
14 |
13 |
8 |
8 |
9 |
10 |
11 |
11 |
12 |
12 |
Найти с помощью инструмента Описательная статистика основные статистические характеристики выборки, получить распределение частот и построить его гистограмму.
Для выполнения этого задания проделайте следующие пункты.
В результате получились все числа, входящие в выборку. Осталось найти их частоты.
PAGE 11