Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Лабораторная работа 9 Точечные статистические характеристики Выборочными характеристиками называют.

Работа добавлена на сайт samzan.net:


Лабораторная работа № 9

Точечные статистические характеристики

Выборочными характеристиками называются характеристики, рассчитанные по данным выборки из изучаемой генеральной совокупности. Характеристики называются точечными, если они определяются одним числом.

§2.1. Основные точечные статистические характеристики

Средние

Выборочной средней  называется среднее арифметическое значений измеряемой величины:

,    (2.1)

где xi, – варианты, ni – их частоты, n – объем выборки.

Если данные не сгруппированы, то выборочная средняя является обычной средней арифметических всех наблюдений:

   (2.2)

Выборочная средняя служит для оценки генеральной средней. Генеральной средней  называется среднее арифметическое всех значений данной величины в генеральной совокупности.

Дисперсии. Стандартное отклонение

Выборочной дисперсией  называется среднее арифметическое квадратов отклонений значений измеряемой величины от выборочной средней:

. (2.3)

В этой формуле и во всех последующих формулах данного параграфа предполагается, что данные уже сгруппированы.

Формулу (2.3) можно привести к более удобному для вычислений виду:

,     (2.4)

где среднее арифметическое квадратов отклонений:

.   (2.5)

Дисперсия, вычисляемая по значениям изучаемой величины генеральной совокупности, называется генеральной дисперсией и обозначается .

Исправленной дисперсией называется величина

,     (2.6)

где n – объем выборки. Различие между величинами s2 и  ощутимо при n<30, поэтому на практике при n>30 достаточно использовать .

Выборочным стандартным (или средним квадратическим) отклонением называется корень квадратный из выборочной дисперсии:

.     (2.7)

Генеральным стандартным (или средним квадратическим) отклонением называется корень квадратный из генеральной дисперсии.

Исправленным стандартным отклонением s называется корень квадратный из исправленной дисперсии:

.   (2.8)

Мода. Медиана. Размах варьирования

В некоторых случаях возникает необходимость вычисления дополнительных точечных характеристик выборки, таких как мода, медиана, размах варьирования.

Модой Мо называется значение измеряемой величины, которое чаще других встречается в совокупности данных, то есть мода – это варианта с наибольшей частотой.

Медианой Ме называется значение измеряемой величины, которое разделяет совокупность на две равные по числу элементов части. Если количество k различных вариант в выборке – нечетное, то медиана равна Ме=хm, где m=(k+1)/2, а k – число вариант. Если количество k различных вариант в выборке – четное, то медиана равна Ме=(хm+хm+1)/2, где m=k/2, а k – число вариант.

Размах варьирования R – это разность между наибольшим xmax и наименьшим xmin значениями измеряемой величины совокупности (генеральной или выборочной): R=xmaxxmin.

Асимметрия и эксцесс эмпирического распределения

Для оценки отклонения распределения данных эксперимента от нормального распределения (о нормальном распределении подробнее см. в следующей главе 3.) используются такие характеристики как асимметрия А и эксцесс Е. Для нормального распределения А=0 и Е=0.

Асимметрия показывает, на сколько распределение данных несимметрично относительно нормального распределения: если А>0, то большая часть данных имеет значения, превышающие среднее ; если А<0, то большая часть данных имеет значения, меньшие среднего .

Эксцесс оценивает крутость, т.е. величину большего или меньшего подъема максимума распределения экспериментальных данных по сравнению с максимумом нормального распределения. Если Е>0, то максимум экспериментального распределения выше нормального; если Е<0, то максимум экспериментального распределения ниже нормального.

На практике считают, что если значения асимметрии и эксцесса эмпирического распределения отличаются от нуля в пределах ±0,5, то такое отличие может быть отнесено за счет случайности выборочного метода.

§2.2. Стандартные статистические функции Excel 

Вызов статистических функции Excel

Для вызова любой стандартной статистической функции Excel можно воспользоваться Мастером функций, загрузка которого осуществляется нажатием на кнопку Вызов функции на Панели инструментов.

После нажатия на эту кнопку появляется диалоговое окно Мастера функций:

При использовании Мастера функций сначала в группе Категория следует выбрать Статистические, а затем найти в списке функций нужную и нажать ОК. Дальнейшие действия такие же как и при работе с любой функцией из других категорий.

Поскольку каждая функция имеет свои параметры, то целесообразно воспользоваться помощью. Для ее вызова достаточно выделить необходимую функцию и нажать на кнопку с вопросительным знаком в этом же диалоговом окне. В версии Excel 2000 появляется Помощник, в котором следует нажать на Справка по этой теме, а затем на Справка по выделенной функции.

Вычисление средних в Excel

В Excel возможно вычислить среднее значение с помощью стандартной функции в том случае, если данные несгруппированы.

Функция СРЗНАЧ (или AVERAGE) вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности по формуле (2.2). Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201). Данная функция, как и все последующие, находится в категории функций статистические.

Если исходные данные уже сгруппированы, то вычисление среднего значения следует производить по формуле (2.1), используя функцию суммирования.

Вычисление дисперсий в Excel

В Excel имеются функции, отдельно вычисляющие исправленную дисперсию s2 по формуле (2.6) и исправленное стандартное отклонение s по формуле (2.8), генеральные и выборочные дисперсию Dг и  по формуле (2.6) и стандартное отклонение г и в по формуле (2.7). Поэтому, прежде чем вычислять дисперсию и стандартное отклонение, следует четко определиться, являются ли ваши данные генеральной совокупностью или выборочной, а также какую дисперсию необходимо вычислить: исправленную или обычную.

Использование стандартных функций Excel возможно только при обработке несгруппированных данных. Если исходные данные уже сгруппированы, то вычисление дисперсий и стандартных отклонений следует производить по указанным выше формулам, используя функции суммирования и извлечения корня.

Для вычисления исправленной дисперсии s2 по формуле (2.6) и исправленного стандартного отклонения s по формуле (2.8) имеются функции ДИСП (или VAR) и СТАНДОТКЛОН (или STDEV). Аргументом этих функций является набор чисел, как правило, заданный диапазоном ячеек, например, =ДИСП(В1:В48), если данные содержатся в интервале ячеек от В1 до В48.

Для вычисления выборочной (или генеральной) дисперсии по формуле (2.3) и стандартного отклонения по формуле (2.7) имеются функции ДИСПР (или VARP) и СТАНДОТКЛОНП (или STDEVP), соответственно.

Аргументы этих функций такие же как и для исправленной дисперсии.

Вычисление числа наблюдений, моды, медианы, максимального и минимального значений выборки в Excel

Функция СЧЕТ (или COUNT) определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ(С2:С16).

Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3. Ее аргументом является интервал ячеек.

Мода вычисляется функцией МОДА (или MODE). Ее аргументом является интервал ячеек с данными.

Медиана вычисляется функцией МЕДИАНА (или MEDIAN). Ее аргументом является интервал ячеек.

Для нахождения наибольшего значения среди статистических данных xmax имеется функция МАКС (или MAX), а для наименьшего xmin – функция МИН (или MIN). Их аргументом является интервал ячеек.

Для того, чтобы вычислить размах варьирования данных в интервале ячеек, например, от А1 до А100, следует ввести формулу:
=МАКС(А1:А100)
МИН(А1:А100).

Вычисление асимметрии и эксцесса эмпирического распределения в Excel

Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС(А1:А100), если данные содержатся в интервале ячеек от А1 до А100.

Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС(А1:А100).

§2.3. Инструмент анализа Описательная статистика

В Excel имеется возможность вычислить сразу все точечные характеристики выборки с помощью инструмента анализа Описательная статистика, который содержится в Пакете анализа.

Описательная статистика создает таблицу основных статистических характеристик для совокупности данных. В этой таблице будут содержаться следующие характеристики: среднее, стандартная ошибка, дисперсия, стандартное отклонение, мода, медиана, размах варьирования интервала, максимальное и минимальное значения, асимметрия, эксцесс, объем совокупности, сумма всех элементов совокупности, доверительный интервал (уровень надежности). Инструмент Описательная статистика существенно упрощает статистический анализ тем, что отпадает необходимость вызывать каждую функцию для расчета статистических характеристик отдельно.

Для того чтобы вызвать Описательную статистику, следует:

  1.  в меню Сервис выбрать команду Анализ данных;
  2.  в списке Инструменты анализа диалогового окна Анализ данных выбрать инструмент Описательная статистика и нажать ОК.

В окне Описательная статистика необходимо:

  •  в группе Входные данные в поле Входной интервал указать интервал ячеек, содержащих данные;
  •  если первая строка во входном диапазоне содержит заголовок столбца, то в поле Метки в первой строке следует поставить галочку;
  •  в группе Параметры вывода активизировать переключатель (поставить галочку) Итоговая статистика, если нужен полный список характеристик;
  •  активизировать переключатель Уровень надежности и указать надежность в %, если необходимо вычислить доверительный интервал (по умолчанию надежность равна 95%). Нажать ОК.

В результате появится таблица с вычисленными значениями указанных выше статистических характеристик. Сразу, не сбрасывая выделения этой таблицы, выполните команду ФорматСтолбецАвтоподбор ширины.

Вид диалогового окна Описательная статистика:

Практические задания

2.1. Вычисление основных точечных статистических характеристик с помощью стандартных функции Excel

Одним и тем же вольтметром было измерено 25 раз напряжение на участке цепи. В результате опытов получены следующие значения напряжения в вольтах:

32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35,

34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30. 

Найти среднюю, выборочные и исправленные дисперсию, стандартное отклонение, размах варьирования, моду, медиану. Проверить отклонение от нормального распределения, вычислив асимметрию и эксцесс.

Для выполнения этого задания проделайте следующие пункты.

  1.  Наберите результаты эксперимента в столбец А.
  2.  В ячейку В1 наберите «Среднее», в В2 – «Выборочная дисперсия», в В3 – «Стандартное отклонение», в В4 – «Исправленная дисперсия», в В5 – «Исправленное стандартное отклонение», в В6 – «Максимум», в В7 – «Минимум», в В8 – «Размах варьирования», в В9 – «Мода», в В10 – «Медиана», в В11 – «Асимметрия», в В12 – «Эксцесс».
  3.  Выровняйте ширину этого столбца с помощью Автоподбора ширины.
  4.  Выделите ячейку С1 и нажмите на кнопку со знаком «=» в строке формул. С помощью Мастера функций в категории Статистические найдите функцию СРЗНАЧ, затем выделите интервал ячеек с данными и нажмите ОК.
  5.  Выделите ячейку С2 и нажмите на знак  =  в строке формул. С помощью Мастера функций в категории Статистические найдите функцию ДИСПР, затем выделите интервал ячеек с данными и нажмите ОК.
  6.  Проделайте самостоятельно аналогичные действия для вычисления остальных характеристик.
  7.  Для вычисления размаха варьирования в ячейку С8 следует ввести формулу: =C6-C7.
  8.  Добавьте перед вашей таблицей одну строку, в которую наберите заголовки соответствующих столбцов: «Наименование характеристик» и «Численные значения».
  9.  В результате выполнения всего задания вы должны получить следующую таблицу:

2.2. Использование инструмента анализа

Описательная статистика

В результате наблюдений получены следующие данные:

10

13

10

9

9

12

12

6

7

9

8

9

11

9

14

13

9

8

10

7

10

10

11

11

11

12

8

7

9

10

14

13

8

8

9

10

11

11

12

12

Найти с помощью инструмента Описательная статистика основные статистические характеристики выборки, получить распределение частот и построить его гистограмму.

Для выполнения этого задания проделайте следующие пункты.

  1.  Перейдите на следующий рабочий лист.
  2.  Наберите исходные данные в столбец А, тогда они займут диапазон ячеек А1:А40.
  3.  Выполните команду СервисАнализ данных, и в появившемся диалоговом окне выберите нужный инструмент анализа Описательная статистика, и нажмите ОК.
  4.  В появившемся диалоговом окне:
    •  в группе Входной интервал наберите адрес диапазона ячеек с данными А1:А40;
    •  активизируйте переключатель Выходной интервал и в ставшее активным (белым) поле поместите курсор, а затем щелкните мышью по ячейке В1;
    •  отметьте галочкой переключатель Итоговая статистика и нажмите ОК. 
  5.  В результате появится таблица с заголовком Столбец1.
    Сразу, не сбрасывая с нее выделения, выполните команду
    ФорматСтолбецАвтоподбор ширины. Полученная таблица должна иметь следующий вид:

  1.  Теперь нужно получить распределение частот и построить его гистограмму. Для этого наберите в ячейку D1 минимальное значение выборки (в данном случае оно равно 6). Затем выполните команду ПравкаЗаполнитьПрогрессия. В появившемся диалоговом окне Прогрессия:
    •  в группе Расположение активизируйте переключатель по столбцам;
    •  в поле Шаг оставьте 1;
    •  в поле Предельное значение  наберите максимальное значение выборки (в данном случае оно оказалось равным 14);
    •  нажмите ОК.

В результате получились все числа, входящие в выборку. Осталось найти их частоты.

  1.  Частоты вычисляются инструментом Гистограмма. Вычислите их и постройте гистограмму полученного распределения так, как это было проделано при выполнении заданий в предыдущей лабораторной работе № 9 (часть 1).
  2.  В результате должна получиться гистограмма.

PAGE  11




1. ва или жидкости в растворителе
2. Проект и реализация системы автоматизации работы сотрудников бухгалтерии ХК АкБарс
3. Школа здоровья 384 Привилегии и иммунитеты консульских должностных лиц
4. Структурні та функціональні особливості розмовного стилю англійської мови
5. Тема. Прокурорский надзор за исполнением законов органами осуществляющими ОРД Вопрос 1
6. тема принципов воспитания
7. Особенности использования духовного потенциала религии в воспитании военнослужащих Вооруженных сил Российской Федерации
8. ЛЕКЦІЯ 7. ВИНИКНЕННЯ СОЦІАЛЬНОЇ ПЕДАГОГІКИ ЯК ОКРЕМОЇ ГАЛУЗІ ЗНАНЬ
9. правовой науке была проделана большая работа по исследованию права жалобы гражданина
10. Статья Ребята Бросайте курить
11. Что есть человек спрашивает библейский Псалмопевец что Ты помнишь его и сын человеческий что Ты посеща
12. тема организационных мероприятий и средств обеспечивающих защиту людей от вредного и опасного воздействия
13. Тема ИНДЗ 1 Летники.
14. й на категории Классификация представляет собой распределение обширной разнообразной группы объектов
15. Фернан Бродель
16. Этническая картина мира
17. Создание проекта Cpture и настройка его конфигурации
18. ГЕОРГІЇВСЬКОМУ СОБОРІ П О Н Е Д І Л О К
19. Лабораторная работа 5 СУБД MS ccess- основы работы Цель работы- изучение основных принципов работы и способ
20. Хабрахабре храбры кратки хороши