Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Статистический анализ данных

Работа добавлена на сайт samzan.net:


PAGE  1

Электронные таблицы Excel в среде Windows.

Лабораторная работа № 7:

Статистический анализ данных.

Цель работы: научиться обрабатывать статистические данные с помощью встроенных функций; изучить возможности Пакета анализа и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика.  

Порядок выполнения работы:

  1.  Основные статистические характеристики.
  2.  Инструменты статистического анализа.

 

1. Основные статистические характеристики.

Электронные таблицы Excel имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встроены в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительную подпрограмму, называемую пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа. Мы ограничимся изучением нескольких основных встроенных статистических функций и наиболее полезных инструментов анализа из пакета.

Среднее значение. 

Функция СРЗНАЧ (или AVERAGE) вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ  является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).

Дисперсия и среднее квадратическое отклонение.

Для оценки разброса данных используются такие статистические характеристики, как дисперсия  D и среднее квадратическое  (или стандартное) отклонение  . Стандартное отклонение есть квадратный корень из дисперсии: . Большое стандартное отклонение указывает на то, что значения измерения сильно разбросаны относительно среднего, а малое – на то, что значения сосредоточены около среднего.

В Excel имеются функции, отдельно вычисляющие выборочную дисперсию Dв и стандартное отклонение  в  и генеральные дисперсию Dг и стандартное отклонение г. Поэтому, прежде чем вычислять дисперсию и стандартное отклонение, следует четко определиться, являются ли ваши данные генеральной совокупностью или выборочной. В зависимости от этого нужно использовать для расчета  Dг и г ,  Dв и в.

Для вычисления выборочной дисперсии Dв и выборочного стандартного отклонения в имеются функции ДИСП (или VAR) и СТАНДОТКЛОН (или STDEV). Аргументом этих функций является набор чисел, как правило, заданный диапазоном ячеек, например, =ДИСП (В1:В48).

Для вычисления генеральной дисперсии Dг и генерального стандартного отклонения г имеются функции ДИСПР (или VARP) и СТАНДОТКЛОНП (или STDEVP), соответственно.

Аргументы этих функций такие же как и для выборочной дисперсии.

Объем совокупности.

Объем совокупности выборочной или  генеральной – это число элементов совокупности. Функция СЧЕТ (или COUNT) определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ (С2:С16).

Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3. Ее аргументом является интервал ячеек.

Мода и медиана.

Мода – это значение признака, которое чаще других встречается в совокупности данных. Она вычисляется функцией МОДА (или MODE). Ее аргументом является интервал ячеек с данными.

Медиана – это значение признака, которое разделяет совокупность на две равные по числу элементов части. Она вычисляется функцией МЕДИАНА (или MEDIAN). Ее аргументом является интервал ячеек.

Размах варьирования. Наибольшее и наименьшее значения.

Размах варьирования R – это разность между наибольшим xmax и  наименьшим xmin значениями признака совокупности (генеральной или выборочной): R=xmaxxmin. Для нахождения наибольшего значения xmax  имеется функция МАКС (или MAX), а для наименьшего xmin – функция МИН (или MIN). Их  аргументом является интервал ячеек. Для того, чтобы вычислить размах варьирования данных в интервале ячеек, например, от А1 до А100, следует ввести формулу: =МАКС (А1:А100)-МИН (А1:А100).

Отклонение случайного распределения от нормального.

Нормально распределенные случайные величины широко распространены на практике, например, результаты измерения любой физической величины подчиняются нормальному закону распределения. Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью

,

где  дисперсия,  - среднее значение случайной величины .

Для оценки отклонения распределения данных эксперимента от нормального распределения используются такие характеристики как асимметрия А и эксцесс Е. Для нормального распределения А=0 и Е=0.

Асимметрия показывает, на сколько распределение данных несимметрично относительно нормального распределения: если А>0, то большая часть данных имеет значения, превышающие среднее ; если А<0, то большая часть данных имеет значения, меньшие среднего . Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС (А1:А100).

Эксцесс оценивает «крутость», т.е. величину большего или меньшего подъема максимума распределения экспериментальных данных по сравнению с максимумом нормального распределения. Если Е>0, то максимум экспериментального распределения выше нормального; если Е<0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100).

Задание 1.

Одним и тем же вольтметром было измерено 25 раз напряжение на участке цепи. В результате опытов получены следующие значения напряжения в вольтах: 32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35, 34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30. Найдите выборочные среднюю, дисперсию, стандартное отклонение, размах варьирования, моду, медиану. Проверить отклонение от нормального распределения, вычислив асимметрию и эксцесс.

  1.  Наберите результаты эксперимента в столбец А.
  2.  В ячейку В1 наберите «Среднее», в В2 – «ыборвочная дисперсия», в В3 – «стандартное отклонение», в В4 – «Максимум», в В5 – «Минимум», в В6 – « Размах варьирования», в В7 – «Мода», в В8 – «Медиана», в В9 – «Асимметрия», в В10 – «Эксцесс». Выровняйте ширину этого столбца с помощью Автоподбора ширины.
  3.  Выделите ячейку С1 и нажмите на знак «=» в строке формул. С помощью Мастера функций в категории Статистические найдите функцию СРЗНАЧ, затем выделите интервал ячеек с данными и нажмите Enter.
  4.  Выделите ячейку С2 и нажмите на знак «=» в строке формул. С помощью помощью Мастера функций в категории Статистические найдите функцию ДИСП, затем выделите интервал ячеек с данными и нажмите Enter.
  5.  Проделайте самостоятельно аналогичные действия для вычисления стандартного отклонения, максимума, минимума, моды, медианы, асимметрии и эксцесса.
  6.  Для вычисления размаха варьирования в ячейку С6 следует ввести формулу: =МАКС (А1:А25)-МИН(А1:А25).

2. Инструменты статистического анализа: Генерация случайных чисел, Гистограмма, Описательная статистика.

Загрузка Пакета анализа.

Пакет анализа без дополнительных установок автоматически не загружается при запуске Excel. Он входит в так называемую Надстройку – набор дополнительных подпрограмм, к которым относятся, например, уже известные вам Мастер диаграмм и Мастер функций. Для загрузки Пакет анализа необходимо:

  1.  в Основном меню выбрать пункт Сервис;
  2.  выбрать пункт Надстройки;
  3.  в появившемся списке Надстроек активизировать переключатель AnalysisToolPak-VBA и нажать ОК.

После этого в меню Сервис добавится пункт Анализ данных. К этому пункту следует обращаться для вызова Пакета анализа.

Инструмент: Генерация случайных чисел.

В Excel имеется встроенная функция СЛЧИСЛ (или RAND) для генерации равномерно распределенных случайных чисел в интервале [0,1].

Пакет анализа позволяет генерировать случайные числа с различными типами распределений: равномерное, нормальное, Бернулли, биномиальное, Пуассона и дискретное (определенное пользователем). Для генерации случайных чисел следует:

  1.  в меню Сервис выбрать команду Анализ данных;
  2.  в появившемся диалоговом окне Анализ данных в группе Инструменты анализа выбрать пункт Генерация случайных величин  и нажать ОК;
  3.  в появившемся диалоговом окне Генерация случайных чисел следует заполнить поля ввода:
  •  в полях Число переменных и Число случайных чисел указать нужное количество столбцов и сколько чисел вы хотите получить в каждом столбце;
  •  в поле Распределение следует выбрать один из имеющихся типов распределения случайных чисел;
  •  в группе Параметры следует указать диапазон чисел, т.е. min и max числа распределения для Равномерного распределения; или среднее значение и стандартное отклонение для Нормального распределения и т.д.
  •  поле Случайное рассеивание заполняется только в том случае, если вам необходимо несколько раз воспроизводить одну и туже последовательность случайных чисел;
  •  в поле Выходной интервал указывается место, куда следует поместить последовательность чисел, как правило, это интервал ячеек (или столбец целиком).

Инструмент: Гистограмма.

Графическое представление результатов обработки статистических данных обычно оформляется в виде гистограммы. Совокупность данных разбивается на частичные интервалы, называемые нормальными. Интервалы разбиения могут быть любой ширины, но обязательно они должны следовать в порядке возрастания. Интервалы разбиения откладываются по оси абсцисс гистограммы. На оси ординат гистограммы откладывается число значений, попавших в интервал разбиения. Это число значений признака совокупности называется частотой.

Для построения гистограммы:

  1.  в начале следует задать частичные интервалы разбиения;
  2.  затем в меню Сервис выбрать команду Анализ данных и указать инструмент анализа –Гистограмма и нажать ОК;
  3.  в диалоговом окне Гистограмма следует указать:
  •  в группе Входные данные в поле Входной интервал – интервал ячеек с данными, а в поле Интервал карманов – интервал ячеек с частичными интервалами разбиения;
  •  в группе Параметры вывода указывается интервал ячеек для вывода частот и отмечается галочкой переключатель Вывод графика.

После нажатия ОК инструмент Гистограмма выводит два столбца: карман и частота. Сама гистограмма выводится правее столбца частот. Форматирование гистограммы производится так же, как и любой диаграммы в Excel (см. лабораторную работу №6).

Инструмент: Описательная статистика.

      В пакете анализа Excel содержится инструмент Описательная статистика, который создает таблицу основных статистических характеристик для совокупности данных. В этой таблице будут содержаться следующие характеристики: среднее, стандартная ошибка, дисперсия, стандартное отклонение, мода, медиана, размах варьирования интервала, максимальное и минимальное значения, асимметрия, эксцесс, объем совокупности, сумму всех элементов совокупности, доверительный интервал (уровень надежности). Инструмент Описательная статистика существенно упрощает статистический анализ тем, что нет необходимости вызывать каждую функцию для расчета статистических характеристик отдельно.

      Для того, чтобы вызвать Описательную статистику, следует:

  1.  в меню Сервис выбрать команду Анализ данных;
  2.  в списке Инструменты анализа диалогового окна Анализ данных выбрать инструмент 

Описательная статистика и нажать ОК;

  1.  в появившемся диалоговом окне Описательная статистика необходимо:
  •  в группе Входные данные в поле Входной интервал указать интервал ячеек, содержащих данные;
  •  если первая строка во входном диапазоне содержит заголовок столбца, то в поле Метки в первой строке следует поставить галочку;
  •  активизировать переключатель (поставить галочку) Итоговая статистика, если нужен полный список характеристик;
  •  активизировать переключатель Уровень надежности и указать надежность в %, если необходимо вычислить доверительный интервал.

Задание 2.

Сгенерировать 500 случайных чисел, распределенных нормально. Построить гистограмму и полный список статистических характеристик с помощью инструмента Описательная статистика.

1. Выполните команду СервисАнализ данныхГенерация случайных чисел;

2..В диалоговом окне Генерация случайных чисел введите в поле число переменных: 1; в поле Число случайных чисел 500; выберите Распределение Нормальное; задайте любое среднее значение (желательно около 100) и небольшое стандартное отклонение (не больше 10); в поле Выходной интервал укажите абсолютный адрес столбца $A$2. Нажмите ОК.

  1.  Теперь постройте гистограмму по совокупности случайных чисел. Сначала нужно задать интервалы решения. Пусть длины интервалов будут одинаковыми и равны 3. Для автоматического составления интервалов разбиения наберите в ячейку В2 начальное число, например, 75 для наших случайных чисел. Затем выполните команду ПравкаЗаполнитьПрогрессия. В появившемся диалоговом окне заполните данные:
  •  в группе переключателей поле Расположение установите по столбцам;
  •  в поле Шаг наберите 3;  
  •  в поле Предельное значение наберите 125;
  •  в группе переключателей Тип установите арифметическая и нажмите ОК.

В результате столбец В будет содержать интервалы разбиения (карманы).

  1.  Выполните команду СервисАнализ данныхГистограмма. В появившемся диалоговом окне Гистограмма заполните:
  •  входной интервал появится, если щелкнуть мышью по столбцу А;
  •  интервал карманов появится, если щелкнуть мышью по столбцу В;
  •  поставьте галочку в поле метки;
  •  укажите столбец С в поле Выходной интервал;
  •  активизируйте переключатель Вывод графика; если это поле не содержит галочки, нажмите ОК.
  1.  Построение гистограммы займет от 5 до 10 минут. За это время письменно ответьте на контрольные вопросы. В результате вычисления получатся столбец под названием Карман, который дублирует ваш столбец интервалов разбиения, и столбец под название Частота с рассчитанными частотами. После того, как появилась гистограмма, измените ее размеры с помощью мыши так, чтобы хорошо были видны все столбцы и подписи.
  2.  Теперь осталось получить таблицу статистических характеристик с помощью Описательной статистики. Выполните команду СервисАнализ данныхОписательная статистика. В появившемся диалоговом окне Описательная статистика укажите:
  •  в поле Входной интервал появится адрес, если выделить мышью интервал сданными или с клавиатуры набрать адрес $A$2: $A$501;
  •  в поле Группирование активизировать переключатель по столбцам;
  •  активизировать переключатель Метки в первой строке;
  •  в группе Параметры вывода укажите Выходной интервал, щелкнув мышью по какой-либо пустой ячейке ниже столбца частот, например, по С 25;
  •  активизируйте переключатель Итоговая статистика (если в этом поле нет галочки);
  •  активизируйте переключатель Уровня надежности и установите 95%;
  •  снимите галочки с полей наименьший и наибольший и нажмите ОК.

Результаты покажите преподавателю.

Контрольные вопросы.

  1.  Для чего предназначена функция СРЗНАЧ?
  2.  С помощью каких характеристик оценивают разброс статистических данных? Какие функции в Excel их вычисляют? В чем отличие функции оценки разброса данных для генеральной и выборочной совокупности?
  3.  В чем отличие функций СЧЕТ и СЧЕТЗ?
  4.  Что такое мода и какая функция ее вычисляет?
  5.  Что такое медиана и какая функция ее вычисляет?
  6.  Как вычислить размах варьирования?
  7.  С помощью каких характеристик оценивают отклонение случайного распределения от нормального? Какой смысл этих характеристик и какие функции в Excel их вычисляют?
  8.  Что такое Инструменты Анализа? Как загрузить Пакет Анализа?
  9.  Опишите последовательность действий, которые необходимо совершить для генерации случайных чисел распределенных нормально.
  10.  Как построить гистограмму?
  11.  Для чего предназначен инструмент Описательная статистика?




1. тематика Числові ряди
2. Искусство века Просвещения
3. на тему- Методика аудиторской проверки учета расчетов по оплате труда и соблюдения трудового законодат
4. В сражающемся Китае
5. М Лисенка на тиждень від 2 грудня до 7 грудня 2013 р
6. Криминалистическое значение следов пальцев рук
7. Реферат- Расчет электрического привода механизма подъема башенного крана
8. 3й Національний конкурс краси МІС СЛАВ~ ЯНКА 2012 В1
9. тематичності та активності роботи студентів протягом семестру Максимальна оцінка ~ 30 балів Блок 3
10. Об обществах с ограниченной ответственностью.html
11. Вариант к повторению В1 и А13 1
12. Этапы образования государства Киевская Русь
13. Korov шевеля mozgoi насчет того куда бы убить вечер ~ подлый такой холодный и сумрачный зимний вечер хотя и сух
14. П ПО ДЕЛУ О ПРОВЕРКЕ КОНСТИТУЦИОННОСТИ ОТДЕЛЬНЫХ ПОЛОЖЕНИЙ ПУНКТА 2 ЧАСТИ ПЕРВОЙ СТАТЬИ 27 ЧАСТЕЙ ПЕРВ
15. Особенности ответственности за хулиганство
16. Маркетинг Львів ~4 Методичні вказівки з проходження практики за темою бакалавр
17. тематичних наук Харків 1999 Дисертація є рукописом
18. Реферат Расчет режимов резания при фрезеровании (Методические рекомендации)
19. варианты равновесия
20. Варианты ответа- 1 2 3 4 г