Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Министерство образования Российской Федерации
Московский государственный университет печати
Факультет полиграфической техники и технологии
Дисциплина «Высшая математика»
Курсовая работа по теме
Статистические методы обработки экспериментальных данных
Выполнил: студент Кривенкова А.И.
курс 2
группа ДТпупБ-2-1
форма обучения дневная
Номер зачетной книжки 21615/12
Вариант № 15
Допущено к защите
Дата защиты
Результат защиты
Подпись преподавателя
Москва, 2013
Задание к курсовой работе
Исходные данные к курсовой работе
Вариант 15
Интервалы |
1.5;3.5 |
3.5;5.5 |
5.5;7.5 |
7.5;9.5 |
9.5;11.5 |
11.5;13.5 |
Частоты, |
3 |
6 |
9 |
12 |
15 |
21 |
13.5;15.5 |
15.5;17.5 |
17.5;19.5 |
19.5;21.5 |
21.5;23.5 |
14 |
10 |
8 |
7 |
5 |
Построение интервального и точечного статистических распределений результатов наблюдений. Построение полигона и гистограммы относительных частот
Статистические распределения, а также используемые при построении гистограммы плотности относительных частот приведены в таблице 1. В этой таблице использованы следующие обозначения:
i порядковый номер;
Ii интервал разбиения;
xi середина интервала Ii;
ni частота (количество результатов наблюдений, принадлежащих данному интервалу Ii);
относительная частота ( объём выборки);
плотность относительной частоты (h шаг разбиения, то есть длина интервала Ii).
i |
I i |
x i |
n i |
W i |
H i |
1 |
1.5;3.5 |
2.5 |
3 |
0.03 |
0.02 |
2 |
3.5;5.5 |
4.5 |
6 |
0.05 |
0.03 |
3 |
5.5;7.5 |
6.5 |
9 |
0.08 |
0.04 |
4 |
7.5;9.5 |
8.5 |
12 |
0.11 |
0.06 |
5 |
9.5;11.5 |
10.5 |
15 |
0.14 |
0.07 |
6 |
11.5;13.5 |
12.5 |
21 |
0.19 |
0.1 |
7 |
13.5;15.5 |
14.5 |
14 |
0.13 |
0.07 |
8 |
15.5;17.5 |
16.5 |
10 |
0.09 |
0.05 |
9 |
17.5;19.5 |
18.5 |
8 |
0.07 |
0.04 |
10 |
19.5;21.5 |
20.5 |
7 |
0.06 |
0.03 |
11 |
21.5;23.5 |
22.5 |
5 |
0.05 |
0.03 |
∑: 110 1.00
Объём выборки
=110,
;
контроль: wi=1.
Длина интервала разбиения (шаг)
h=2,
Статистическим распределением называется соответствие между результатами наблюдений (измерений) и их частотами и относительными частотами. Интервальное распределение это наборы троек (Ii; ni; wi) для всех номеров i, а точечное наборы троек (xi; ni; wi). Таким образом, в таблице 1 имеются оба и интервальное, и точечное статистических распределения.
Далее, строим полигон и гистограмму относительных частот; они приведены на рис. 1-2. Полигоном относительных частот называется ломаная, отрезки которой последовательно, в порядке возрастания xi, соединяют точки (xi; wi). Гистограммой относительных частот называется фигура, которая строится следующим образом: на каждом интервале Ii, как на основании, строится прямоугольник, площадь которого равна относительной частоте wi; отсюда следует, что высота этого прямоугольника равна Hi=wi/h плотности относительной частоты. Полигон и гистограмма являются формами графического изображения статистического распределения.
Рис. 1. Полигон относительных частот
Рис. 2. Гистограмма относительных частот
Нахождение точечных оценок математического ожидания и дисперсии
В качестве точечных оценок числовых характеристик изучаемой случайной величины используются:
для математического ожидания
(выборочная средняя),
для дисперсии
(исправленная выборочная дисперсия),
где n объём выборки, ni частота значения xi.
Таким образом, в статистических расчетах используют приближенные равенства
, .
Нахождение точечных оценок математического ожидания и дисперсии осуществим с помощью расчётной таблицы 2.
Таблица 2
xi |
ni |
xini |
(xi -) n |
2.5 |
3 |
7.5 |
306.64 |
4.5 |
6 |
27 |
394.63 |
6.5 |
9 |
58.5 |
335.99 |
8.5 |
12 |
102 |
202.71 |
10.5 |
15 |
157.5 |
66.78 |
12.5 |
21 |
262.5 |
0.25 |
14.5 |
14 |
203 |
50.01 |
16.5 |
10 |
165 |
151.32 |
18.5 |
8 |
148 |
277.54 |
20.5 |
7 |
143.5 |
435.76 |
22.5 |
5 |
112.5 |
489.06 |
12.609
=24.643
s=4.964
Выдвижение гипотезы о распределении случайной величины
При выдвижении гипотезы о законе распределения изучаемой случайной величины мы будем опираться лишь на внешний вид статистического распределения. А именно, будем руководствоваться тем, что профиль графика плотности теоретического распределения должен соответствовать профилю гистограммы: если середины верхних сторон прямоугольников, образующих гистограмму, соединить плавной кривой, то эта линия представляет в первом приближении график плотности распределении вероятностей.
Итак, изобразим графики и выпишем формулы плотностей трёх основных распределений нормального, показательного и равномерного.
1. Нормальное (или гауссовское) распределение с параметрами a и , где -<a<+, >0:
(здесь e=2,71828…=, =3,14159…)
2. Показательное (или экспоненциальное) распределение с параметрами и x0, где >0, -<x0<+:
3. Равномерное распределение на отрезке [A; B], где -<A<B<+:
Сравнение построенной гистограммы и графиков плотностей основных распределений приводит к заключению о том, что предполагаемым законом распределения является показательное распределение.
Построение графика теоретической плотности распределения
Чтобы выписать плотность теоретического распределения, нужно определить значения параметров (a и для нормального, и x0 для экспоненциального, А и В для равномерного) и подставить их в соответствующую формулу.
Все параметры распределений тесно связаны с числовыми характеристиками случайной величины. Соответствующие формулы приведены в следующей таблице:
Распределение случайной величины Х |
||
нормальное |
показательное |
равномерное |
МХ=а DX=2 |
МХ= DX= |
МХ= DX= |
Поскольку значения математического ожидания и дисперсии неизвестны, их заменяют соответствующими точечными оценками, то есть используют приближенные равенства , , что позволяет найти значения параметров распределения.
По исходным данным была выдвинута гипотеза о нормальном распределении изучаемой случайной величины. Найдём параметры этого распределения:
Необходимо вычислить значения теоретической плотности f(x) при x=x0 (то есть значение в «параметре сдвига») и при x=xi, где xi>x0 (то есть значения в серединах интервалов, больших x0). Для этого воспользуемся следующей схемой (ниже xj=x0 или xj=xi, где xi>x0). Схема вычисления f(xj) приведена в таблице 3:
Таблица 3
) |
|||
2.5 |
- 2.03 |
0.0508 |
0.102 |
4.5 |
- 1.63 |
0.1057 |
0.021 |
6.5 |
- 1.22 |
0.1895 |
0.037 |
8.5 |
- 0.82 |
0.2850 |
0.057 |
10.5 |
- 0.42 |
0.3653 |
0.073 |
12.5 |
-0.02 |
0.3989 |
0.079 |
14.5 |
0.38 |
0.3712 |
0.074 |
16.5 |
0.78 |
0.2943 |
0.059 |
18.5 |
1.18 |
0.1989 |
0.039 |
20.5 |
1.58 |
0.1145 |
0.023 |
22.5 |
1.98 |
0.0562 |
0.011 |
Далее на одном чертеже строим гистограмму и график теоретической плотности распределения. Для получения графика плотности наносим точки с координатами (xj; f(xj)) и соединяем их плавной кривой.
Рис. 3. Гистограмма и график теоретической плотности распределения
Проверка гипотезы о распределении с помощью критерия согласия Пирсона
Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограммы) и предполагаемого теоретического (графика плотности) показывает наличие некоторых расхождений между ними (см. рис.3). Объяснить возникновение несовпадений можно двумя разными способами:
Для выбора первого или второго варианта ответа служат так называемые критерии согласия. Существует несколько различных критериев согласия: К. Пирсона, А. Н. Колмогорова, Н. В. Смирнова и другие. Мы рассмотрим лишь критерий Пирсона, называемый также критерием 2 («хи-квадрат»).
Критерий Пирсона выгодно отличается от остальных, во-первых, применимостью к любым (дискретным, непрерывным) распределениям и, во-вторых, простотой вычислительного алгоритма.
5.1. Группировка исходных данных
Критерий Пирсона применяется к сгруппированным данным. Предположим, что было произведено n независимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим через i количество результатов измерений (значений случайной величины), попавших
в i-й промежуток. Очевидно, что .
Отметим, что критерий 2 будет давать удовлетворительный для практических приложений результат, если:
Пусть концами построенного разбиения являются точки zi, где z1<z2<…<zl-1, то есть само разбиение имеет вид
Произведем группировку для данного варианта. Объединим последние три промежутка разбиения, заменим самую левую границу разбиения на , а самую правую на и придём к следующему интервальному распределению, пригодному для непосредственного применения критерия Пирсона:
; |
;5.5 |
5.5;7.5 |
7.5;9.5 |
9.5;11.5 |
11.5;13.5 |
13.5;15.5 |
9 |
9 |
12 |
15 |
21 |
14 |
15.5;17.5 |
17.5;19.5 |
19.5;21.5 |
21.5; + |
10 |
8 |
7 |
5 |
Вычисление теоретических частот
Критерий Пирсона основан на сравнении эмпирических частот с теоретическими. Эмпирические частоты i определяются по фактическим результатам наблюдений. Теоретические частоты, обозначаемые далее через , находят с помощью равенства
,
где n количество испытаний, а теоретическая вероятность попадания значений случайной величины в i-й промежуток (). Теоретические вероятности вычисляются в условиях выдвинутой гипотезы о законах распределения изучаемой случайной величины.
В данном варианте принята гипотеза о нормальном распределении случайной величины. В этом случае теоретическая вероятность pi при любом i вычисляется по одной из следующих трёх формул (в зависимости от взаимного расположения i-го промежутка и числа x0):
i |
Концы промежутков |
Аргументы функции |
Значения функции |
|||||
1 |
5.5 |
- 1.42 |
- 0.5000 |
- 0.4222 |
0.0778 |
8.558 |
||
2 |
5.5 |
7.5 |
- 1.42 |
- 1.02 |
- 0.4222 |
- 0.3461 |
0.0761 |
8.371 |
3 |
7.5 |
9.5 |
- 1.02 |
- 0.62 |
- 0.3461 |
- 0.2324 |
0.1137 |
12.507 |
4 |
9.5 |
11.5 |
- 0.62 |
- 0.22 |
- 0.2324 |
- 0.0871 |
0.1453 |
15.983 |
5 |
11.5 |
13.5 |
- 0.22 |
0.18 |
- 0.0871 |
0.0714 |
0.1585 |
17.435 |
6 |
13.5 |
15.5 |
0.18 |
0.58 |
0.0714 |
0.2190 |
0.1476 |
16.236 |
7 |
15.5 |
17.5 |
0.58 |
0.98 |
0.2190 |
0.3365 |
0.1175 |
12.925 |
8 |
17.5 |
19.5 |
0.98 |
1.38 |
0.3365 |
0.4162 |
0.0797 |
8.767 |
9 |
19.5 |
21.5 |
1.38 |
1.78 |
0.4162 |
0.4625 |
0.0463 |
5.093 |
10 |
21.5 |
1.78 |
0.4625 |
0.5000 |
0.0375 |
4.125 |
1,0000 110.00
Статистика 2 и вычисление её значения по опытным данным
Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая (специальным образом подбираемая) величина, характеризующая степень расхождения теоретического (предполагаемого) и статистического распределений.
В критерии Пирсона в качестве такой меры расхождения используется величина
,
называемая статистикой 2 или статистикой Пирсона (вообще, статистикой называют любую функцию от результатов наблюдений). Ясно, что всегда , причём 2=0 тогда и только тогда, когда при каждом i, то есть когда все соответствующие эмпирические и теоретические частоты совпадают. Во всех остальных случаях 20; при этом значение 2 тем больше, чем больше различаются эмпирические и теоретические частоты.
Вычислим значение статистики 2 для данного варианта в таблице 5.
i |
|||
1 |
9 |
8.558 |
0.023 |
2 |
9 |
8.371 |
0.047 |
3 |
12 |
12.507 |
0.021 |
4 |
15 |
15.983 |
0.060 |
5 |
21 |
17.435 |
0.729 |
6 |
14 |
16.236 |
0.308 |
7 |
10 |
12.925 |
0.662 |
8 |
8 |
8.767 |
0.067 |
9 |
7 |
5.093 |
0.714 |
10 |
5 |
4.125 |
0.186 |
110 110 2.813
Вывод о соответствии выдвинутой гипотезы и опытных данных
Уровень значимости
Количество промежутков разбиения
Число степеней свободы
(по таблице)
Вывод:
Гипотеза принимается т.к.