Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

Подписываем
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Предоплата всего
Подписываем
ГЛАВА 13. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА.
§1. Выборка, способы её записи, графическое представление и числовые характеристики.
Выборкой объёма из генеральной совокупности называется совокупность наблюдаемых значений случайной величины , соответствующих независимым повторениям случайного эксперимента с которым связана величина . В математической статистике генеральную совокупность отождествляют со случайной величиной, совокупность всех возможных значений которой и называют генеральной совокупностью.
Выборка может быть записана в виде вариационного и статистического (дискретного или интервального) рядов. Выборку, записанную в виде статистического ряда, называют группированной.
Вариационным рядом выборки называется такой способ её записи, при котором элементы выборки упорядочиваются по величине, т.е. записываются в виде последовательности , где . Разность называется размахом выборки. Всюду в дальнейшем выборочные характеристики будем, как правило, обозначать символом с «» наверху.
Различные значения , (), называются вариантами. Число повторений варианты в выборке называется её частотой, а отношение называется её относительной частотой. Очевидно, что , .
Дискретным статистическим рядом называется упорядоченная в порядке возрастания значений вариант последовательность пар , . Обычно его записывают в виде таблицы, первая стока которой содержит варианты , а вторая их частоты.
Полигоном частот называется ломаная с вершинами в точках , построенных в прямоугольной системе координат.
Эмпирической функцией распределения называется скалярная функция , определённая для всех формулой:, где суммирование ведётся по всем значениям индекса , для которых . Очевидно, что при , при .
На промежутке представляет собой неубывающую кусочно-постоянную функцию, испытывающую в точках скачки на величину .
Интервальным статистическим рядом называется последовательность пар , , где - непересекающиеся интервалы как правило равной длины, объединением которых является отрезок , содержащий все выборочные значения; - частота интервала , равная числу элементов выборки, значения которых попали в данный интервал. Обычно его записывают в виде таблицы, первая строка которой содержит границы интервалов или их середины , а вторая – частоты интервалов.
Гистограммой частот называется ступенчатая фигура, составленная из прямоугольников, построенных на интервалах группировки так, что площадь каждого прямоугольника равна частоте , . Если длины всех интервалов одинаковы и равны , то высоты прямоугольников равны .
Кумулятой (полигоном относительных накопленных частот) называется ломаная с вершинами в точках , , где - накопленная относительная частота интервала , при этом первое звено ломаной соединяет с точкой начало первого интервала .
Для выборки, представленной интервальным статистическим рядом, эмпирическая функция распределения определяется соотношением , , где суммирование ведётся по всем значениям индекса , для которых , - середина интервала , а её графиком является кусочно-постоянная функция со скачками в точках .
В задачах 13.1-13.4 указанную выборку записать в виде вариационного и дискретного статистического рядов, определить её объём и размах.
13.1 3, 8, 1, 3, 6, 5, 2, 2, 7.
13.2 7, 5, 7, 7, 7, 2, 5, 7, 7, 5.
13.3 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4.
13.4 7, 8, 6, 6, 7, 8, 9, 7, 5, 7, 9, 8, 6, 6, 8, 8.
В задачах 13.5-13.8 выборку записать в виде интервального статистического ряда (границы первого интервала указываются), определить её объём и размах.
13.5 17, 15, 14, 10, 13, 18, 22, 20, 17, 12,
13, 21, 12, 8, 14, 11, 19, 18, 15, 19.
Первый интервал: .
13.6 19, 31, 13, 8, 32, 11, 29, 27, 27, 40, 17, 32, 9
8, 31, 12, 26, 19, 23, 32, 41, 13, 24, 44, 25.
Первый интервал: .
13.7 17, 19, 23, 18, 21, 15, 16, 13, 20, 18, 15, 20, 14, 20, 16,
14, 20, 19, 15, 19, 16, 19, 15, 22, 21, 12, 10, 21, 18, 14,
14, 17, 16, 13, 19, 18, 20, 24, 16, 20, 19, 17, 18, 18, 21,
17, 19, 17, 13, 17, 11, 18, 19, 19, 17.
Первый интервал: .
13.8 38, 60, 41, 51, 33, 42, 45, 21, 53, 60, 68, 52, 47, 46, 49,
49, 14, 57, 54, 59, 77, 47, 28, 48, 58, 32, 42, 58, 61, 30,
61, 35, 47, 72, 41, 45, 44, 55, 30, 40, 67, 65, 39, 48, 43,
60, 54, 42, 59, 50.
Первый интервал: .
В задачах 13.9-13.12 для выборок, представленных дискретными статистическими рядами построить: а) полигон частот; б) график эмпирической функции распределения.
13.9 13.10
13.11 13.12
В задачах 13.13-13.16 для выборок, представленных интервальными статистическими рядами построить: а) гистограмму частот; б) график эмпирической функции распределения.
13.13
13.14
13.15
13.16
В задачах 13.17-13.20 для указанных выборок определить среднее , моду , медиану и дисперсию.
13.17 а) 1, 1, 2, 3, 4, 5, 6, 8; б) ;
в) .
13.18 а) 1, 2, 3, 4, 5, 5, 9; б);
в).
13.19 а) 0,1,2,,,1,4; б);
в).
13.20 а) 7,3,3,6,4,5,1,2,1,3; б);
в) .
13.21 Определить, как изменятся среднее , мода и медиана выборки:, если каждый член выборки: а) увеличить (уменьшить) на число ; б) увеличить (уменьшить) в раз.
13.22 Определить, как изменится дисперсия выборки: , если каждый член выборки: а) увеличить (уменьшить) на число ; б) увеличить (уменьшить) в раз.
Основные числовые характеристики выборки.
Негруппированная выборка |
Группированная выборка |
1.Среднее арифметическое выборки (несмещённая состоятельная оценка математического ожидания генеральной совокупности) |
|
2.Дисперсия выборки (смещённая состоятельная оценка дисперсии генеральной совокупности): |
|
3.Исправленная дисперсия выборки (несмещённая состоятельная оценка дисперсии генеральной совокупности): |
|
4. Размах выборки: |
|
5.Мода выборки: а) , где -элемент выборки, встречающийся с наибольшей частотой ; б), где -нижняя граница модального интервала (интервала с наибольшей частотой); - частота модального интервала; , - частоты соседних интервалов; - длина интервала группировки. |
|
6.Медиана выборки: а) , если - нечётное число и , если - чётное число;-объём выборки; -элемент вариационного ряда выборки с номером . б) , где -длина интервала группировки;-нижняя граница медианного интервала, для которого начинает выполняться условие ; -частота медианного интервала; - число элементов выборки в интервалах, лежащих слева от медианного; -объём выборки. |
В задачах 13.23-13.24 для приведённых выборок вычислить среднее и дисперсию : а) негруппированной выборки, используя заданные значения; б) группированной выборки, предварительно проведя группировку с заданной длиной интервала . Сравнить результаты вычислений.
13.23 Положительные отклонения от номинального размера у партии деталей (в мм):
17, 21, 8, 20, 23, 18, 22, 20, 17, 12, 20, 11, 9, 19, 20,
9, 19, 17, 21, 13, 17, 22, 22, 10, 20, 20, 15, 19, 20, 20,
13, 21, 21, 9, 14, 11, 19, 18, 23, 19.
.
13.24 Время химической реакции (в секундах):
8.5, 7.1, 6.7, 6.2, 2.9, 4.4, 6.0, 5.8, 5.4, 8.2, 6.9, 6.5,
6.1, 3.8, 6.0, 6.0, 5.6, 5.3, 7.7, 6.8, 6.5, 6.1, 4.2, 4.7,
5.6, 5.4, 5.3, 7.4, 6.7, 6.4, 6.1, 4.5, 6.0, 5.8, 5.6, 5.1.
.
В задачах 13.25-13.28 для приведённых выборок:
а) построить гистограмму частот и кумуляту; б) вычислить среднее , моду , медиану , дисперсию и коэффициент вариации ().
13.25 Выполнение норм выработки 350 рабочих предприятия (в%):
13.26 Результаты измерений роста 100 студентов (в см):
13.27 Распределение предела прочности образцов сварного шва (в ):
13. 28 Распределение скорости автомобилей на одном из участков шоссе (в ):
§2. Статистические оценки параметров распределения.
2.1 Точечные оценки.
Одной из основных задач математической статистики является оценка неизвестных параметров, характеризующих распределение генеральной совокупности . Совокупность независимых случайных величин , каждая из которых имеет то же распределение, что и случайная величина называют случайной выборкой объёма из генеральной совокупности и обозначают . Любую функцию случайной выборки называют статистикой.
Если функция распределения генеральной совокупности известна с точностью до параметра , то его точечной оценкой называют статистику , значение которой на данной выборке принимают за приближённое значение неизвестного параметра : .
Чтобы точечные оценки давали «хорошее» приближение оцениваемых параметров, они должны удовлетворять определённым требованиям. «Хорошей» считается оценка, обладающая свойствами состоятельности, несмещённости и эффективности.
Оценка называется: 1) состоятельной оценкой параметра , если при неограниченном увеличении объёма выборки она сходится по вероятности к оцениваемому параметру, т.е.; 2) несмещённой (оценкой без систематических ошибок), если её математическое ожидание при любом равно оцениваемому параметру, т.е.; 3) эффективной (в некотором классе несмещённых оценок), если она имеет минимальную дисперсию в этом классе.
Пусть распределение генеральной совокупности известно с точностью до вектора параметров и требуется найти значение его оценки по выборке .
Оценкой метода моментов вектора параметров называют статистику значение которой для любой выборки удовлетворяет системе уравнений:
, ,
где - теоретические начальные моменты -го порядка случайной величины , - эмпирические начальные моменты -го порядка выборки . В систему уравнений метода моментов могут входить и уравнения вида , где - теоретические центральные моменты -го порядка случайной величины , эмпирические центральные моменты -го порядка выборки . Часто для нахождения значения оценки одного параметра используют первый начальный момент, а для нахождения значений оценок двух параметров – первый начальный и второй центральный моменты.
Оценкой метода максимального правдоподобия вектора параметров называют статистику значение которой для любой выборки удовлетворяет условию: , где - функция правдоподобия выборки , - множество всех возможных значений вектора параметров .
Функция правдоподобия имеет вид:
1) - для дискретной случайной величины ;
2) - для непрерывной случайной величины .
Если функция дифференцируема как функция аргумента для любой выборки и максимум достигается во внутренней точке , то значение точечной оценки максимального правдоподобия находят, решая систему уравнений максимального правдоподобия: , . Нахождение упрощается, если максимизировать не саму функцию правдоподобия, а её логарифм , так как при логарифмировании точки экстремума остаются теми же, а уравнения, как правило, упрощаются и записываются в виде: , .
13.29 По выборке объёма из генеральной совокупности найдено значение смещённой оценки генеральной дисперсии . Найти значение несмещённой оценки дисперсии генеральной совокупности, если: а) ; б) .
В задачах 13.30-13.34 по выборке объёма найти значения точечных оценок параметров указанных распределений: а)методом моментов; б)методом максимального правдоподобия.
13.30 Биномиальное распределение с параметром (вероятность появления некоторого события в одном испытании):
,
где - число появлений события в -ом опыте, - количество испытаний в одном опыте, - число опытов.
13.31 Распределение Пуассона с параметром :
,
где - число появлений события в -ом опыте, - количество испытаний в одном опыте, - число опытов.
13.32 Геометрическое распределение с параметром (вероятность появления некоторого события в одном испытании):
,
где - число испытаний до появления события .
13.33 Показательное распределение с параметром , функция плотности которого .
13.34 Нормальное распределение с параметрами с функцией плотности .
13.35 Найти методом моментов по выборке объёма значения оценок параметров и равномерного распределения, плотность которого: ().
13.36 Найти методом максимального правдоподобия по выборке объёма значение оценки параметра распределения «хи-квадрат», функция плотности которого
.
13.37 Найти методом максимального правдоподобия по выборке объёма значение оценки параметра гамма-распределения ( известно), функция плотности которого
.
2.2 Интервальные оценки. Необходимый объём выборки.
Если функция распределения генеральной совокупности известна с точностью до параметра , то его интервальной оценкой или доверительным интервалом называется случайный интервал , который накрывает неизвестное значение параметра с заданной вероятностью , т.е. . Число называется доверительной вероятностью, а число - уровнем значимости. Обычно используются значения , равные ,,.
Точность интервальной оценки характеризуется длиной доверительного интервала и зависит от объёма выборки и доверительной вероятности . Очевидно, что, чем меньше длина доверительного интервала, тем точнее оценка. Доверительный интервал, симметричный относительно точечной оценки , определяется формулой и имеет вид , где характеризует отклонение выборочного значения параметра от его истинного значения и называется предельной ошибкой выборки. Доверительные интервалы часто строятся в предположении, что выборка получена из генеральной совокупности, имеющей нормальное распределение.
Доверительные интервалы для параметров и нормально распределённой генеральной совокупности.
Параметр |
Точечная оценка |
Доверительный интервал |
(неизвестна) |
, где , |
|
(неизвестно) |
, где , , . |
Доверительный интервал для параметра биномиального распределения.
Параметр |
Точечная оценка |
Доверительный интервал |
(,, ) |
, где |
Здесь: - корень уравнения (приложение 6.2); -критическая точка распределения Стьюдента (приложение 6.4); , - критические точки распределения (приложение 6.3); - число элементов в выборке, обладающих данным свойством.
Необходимый объём выборки обеспечивающий заданное значение при оценивании параметров и определяется, соответственно, соотношениями: и (- целое число) .
13.38 Предполагая, что распределение генеральных совокупностей является нормальным, найти 90%-ные доверительные интервалы для математического ожидания (среднего) и дисперсии следующих характеристик: а) ёмкость конденсатора, если , , ; б) время безотказной работы электролампы, если , , ; в) диаметр вала, если , , ; г) содержание углерода в ед. продукта, если ,,.
13.39 Измерения диаметров (в см) случайно отобранных из большой партии 250 валов дали следующие результаты:
[7.8,8.0) |
[8.0,8.2) |
[8.2,8.4) |
[8.4,8.6) |
[8.6,8.8) |
[8.8,9.0] |
|
5 |
20 |
80 |
95 |
40 |
10 |
Найти 95%-ный доверительный интервал для среднего диаметра вала во всей партии.
13.40 Получены следующие данные о годовом товарообороте (в млн. руб.) 100 продовольственных магазинов города:
[100,120) |
[120,140) |
[140,160) |
[160,180) |
[180,200] |
|
17 |
40 |
32 |
8 |
3 |
Найти 95%-ный доверительный интервал для среднего товарооборота продовольственного магазина в городе.
13.41 Измерения твёрдости 16 образцов легированной стали (в условных единицах) дали следующие результаты:
13.1, 12.8, 11.9, 12.4, 13.5, 13.7, 12.0, 13.8,
10.6, 12.4, 13.5, 11.7, 13.9, 11.5, 12.5, 11.9.
В предположении, что выборка измерений получена из нормально распределённой генеральной совокупности, найти 95%-ные доверительные интервалы для математического ожидания и дисперсии генеральной совокупности.
13.42 Результаты 10 измерений ёмкости конденсатора дали следующие отклонения от номинального значения (пкФ):
.
Найти 90%-ный доверительный интервал для дисперсии и среднего квадратичного отклонения, предполагая, что генеральная совокупность имеет нормальное распределение.
13.43 Из большой партии транзисторов одного типа были случайным образом отобраны и проверены 100 штук. У 36 транзисторов коэффициент усиления оказался меньше 10. Найти 95%-ный доверительный интервал для доли таких транзисторов во всей партии.
13.44 При осмотре 60 ящиков обнаружено 10 повреждённых. Найти 90%-ный доверительный интервал для доли повреждённых ящиков во всей партии.
13.45 Для оценки уровня безработицы в городе были отобраны случайным образом 100 человек рабочих специальностей. Из них 6 человек оказались безработными. Найти 90%-ный доверительный интервал для доли безработных рабочих в городе.
13.46 При проверке 100 деталей из большой партии обнаружено 10 бракованных деталей. Найти 95%-ный доверительный интервал для доли бракованных деталей во всей партии.
13.47 С автоматической линии, производящей подшипники, было отобрано 400 штук, причём 10 оказались бракованными. Найти 90%-ный доверительный интервал для вероятности появления бракованного подшипника. Сколько подшипников надо проверить, чтобы с вероятностью можно было утверждать, что вероятность появления бракованного подшипника отличается от относительной частоты его появления не более чем на 5%?
13.48 В 10000 сеансах игры с автоматом выигрыш появился 4000 раз. Найти 95%-ный доверительный интервал для вероятности выигрыша. Сколько сеансов игры следует провести, чтобы с вероятностью можно было утверждать, что вероятность выигрыша отличается от его относительной частоты не более чем на 1%?
13.49 По результатам социологического исследования при опросе 1500 респондентов рейтинг президента (т.е. процент опрошенных, одобряющих его деятельность) составил 70%. Найти границы, в которых с доверительной вероятностью заключён рейтинг президента (при опросе всех жителей страны). Сколько респондентов надо опросить, чтобы с вероятностью гарантировать предельную ошибку, допускаемую при определении рейтинга в результате социологического исследования, не превышающую 1%?
13.50 Высота самолёта определяется с помощью высотомера, средняя квадратичная ошибка которого . Считая, что ошибки измерения высоты самолёта распределены по нормальному закону, определить, сколько надо иметь таких приборов на самолёте, чтобы с вероятностью предельная ошибка измерения средней высоты самолёта была не более .
13.51 Оценка величины сопротивления для большой партии однотипных резисторов, определённая по результатам измерений 100 случайно отобранных экземпляров, равна . Считая, что среднее квадратичное отклонение измерения известно: , найти вероятность того, что для резисторов всей партии величина сопротивления лежит в пределах . Сколько измерений нужно произвести, чтобы с вероятностью утверждать, что для всей партии резисторов величина сопротивления лежит в пределах ?
§3. Проверка статистических гипотез.
Статистической гипотезой называют любое предположение относительно параметров или вида распределения генеральной совокупности (случайной величины) . Гипотезы относительно неизвестного значения параметра распределения генеральной совокупности (случайной величины) называются параметрическими и непараметрическими в иных случаях. Статистическая гипотеза называется простой, если она однозначно определяет распределение , в противном случае она называется сложной. Проверяемая гипотеза называется основной и обозначается . Наряду с гипотезой рассматривают одну из альтернативных гипотез , противоречащих основной. Например, если проверяется гипотеза о равенстве параметра распределения некоторому заданному значению , т.е. , то в качестве альтернативной гипотезы, как правило, рассматривается одна из следующих гипотез: , , . Выбор альтернативы определяется конкретной постановкой задачи.
Правило, по которому принимается решение принять или отклонить основную гипотезу , называется критерием проверки гипотезы. Критерий задают с помощью критического множества , где - выборочное пространство (множество всех возможных значений случайной выборки ). Решение принимают на основе выборки наблюдаемых значений случайной величины , используя для этого подходящую статистику , называемую статистикой критерия . При проверке параметрической гипотезы в качестве статистики критерия выбирают ту же статистику, что и при оценивании параметра .
Решение принимают следующим образом: 1) если выборка , то принимают основную гипотезу ; 2) если выборка , то основную гипотезу отклоняют и принимают альтернативную гипотезу .
При использовании любого критерия возможны ошибки двух видов:
1) отклонить верную основную гипотезу - ошибка первого рода;
2) принять неверную основную гипотезу - ошибка второго рода.
Вероятности совершения ошибок первого и второго рода обозначают и : , , где - вероятность события при условии, что справедлива гипотеза ,. Вероятность совершения ошибки первого рода называют также уровнем значимости критерия , а величину , равную вероятности отклонить основную гипотезу , когда она неверна, называют мощностью критерия. Уровень значимости определяет «размер» критического множества. Обычно используются значения , равные ,,.
Проверка статистической гипотезы основывается на принципе, в соответствии с которым маловероятные события считаются невозможными, т.е. если выборка попадает в критическое множество с исключительно малой вероятностью, то естественно предположить, что утверждение, которое привело к этому маловероятному событию, не соответствует истине и отклонить его. Поступая так, мы будем отклонять в действительности верную основную гипотезу крайне редко – не более чем в случаев. Поэтому за основную гипотезу естественно принять утверждение, отклонение которого, когда оно в действительности является верным, приводит к более тяжёлым последствиям, чем его принятие при справедливости альтернативы.
Общая схема проверки параметрической гипотезы состоит в следующем: 1) формулируется альтернативная гипотеза ; 2) задаётся уровень значимости ; 3) выбирается статистика критерия проверки гипотезы ; 4) определяется выборочное распределение статистики при условии, что гипотеза является верной; 5) по заданным значениям и определяется критическое множество критерия в зависимости от формулировки альтернативной гипотезы ;
6) по выборке вычисляется наблюдаемое значение статистики критерия; 7) принимается статистическое решение: если , то основная гипотеза отклоняется как не согласующаяся с данными выборки; если , то принимается, т.е. считается, что гипотеза не противоречит данным выборки.
3.1 Проверка гипотез о параметрах нормально распределённой генеральной совокупности.
Проверка гипотез о средних нормального распределения.
Гипотеза |
Статистика критерия |
Критическое множество |
(-извес-тно) |
||
(-неиз-вестно) |
, где |
|
(,-известны) |
||
(,-неизвестны, но равны) |
где |
|
Здесь: - корень уравнения (приложение 6.2); - корень уравнения (приложение 6.2); , -критические точки распределения Стьюдента для двусторонней и односторонней критической области, соответственно (приложение 6.4).
Проверка гипотез о дисперсиях нормального распределения.
Гипотеза |
Статистика критерия |
Критическое множество |
(-неиз-вестно) |
, где |
|
(,неизвестны) |
, где |
, где , |
, где , |
Здесь: , ,,- критические точки распределения (приложение 6.3); , -критические точки распределения Фишера (приложение 6.5а,б).
13.52 В соответствии с техническими условиями (ТУ) среднее время безотказной работы для приборов из большой партии должно составлять не менее 1000 часов. Для случайно отобранных 25 приборов выборочное среднее времени безотказной работы часов, а выборочное среднее квадратичное отклонение часов. Можно ли считать, что вся партия приборов не удовлетворяет ТУ? Принять .
13.53 Из большой партии резисторов одного типа и номинала случайным образом отобраны 36 штук. При этом оказалось, что выборочное среднее величины сопротивления кОм, а выборочное среднее квадратичное отклонение кОм. На уровне значимости проверить гипотезу о том, что выборка взята из партии с номиналом 10кОм.
13.54. По техническим условиям (ТУ) средняя прочность на разрыв троса составляет не менее 2000 кг. В результате испытаний 20 кусков троса было установлено, что средняя прочность на разрыв кг при выборочном среднем квадратичном отклонении кг. На уровне значимости выяснить удовлетворяет ли ТУ образец троса?
13.55 Установлено, что средний вес таблетки лекарства (номинал) должен быть равен . Выборочная проверка 101 таблетки полученной партии лекарства показала, что средний вес таблетки при среднем квадратичном отклонении . На уровне значимости выяснить, можно ли принять данную партию лекарства?
13.56 Ожидается, что добавление специальных веществ уменьшает жёсткость воды. Оценки жёсткости воды до и после добавления специальных веществ по 40 и 50 пробам соответственно показали средние значения жёсткости (в градусах жёсткости), равные и . Дисперсия измерений в обоих случаях предполагается известной и равной 2. Подтверждают ли эти результаты ожидаемый эффект? Принять .
13.57 Два штурмана определили пеленг маяка по нескольким замерам, используя различные пеленгаторы. Результаты замеров: при и при . Проверить при гипотезу о том, что различие результатов вызвано только случайными ошибками, если среднее квадратичное отклонение для обоих пеленгаторов известны и равны
и .
13.58 На двух станках производят одну и туже продукцию, контролируемую по внутреннему диаметру изделия. Из продукции первого станка была взята выборка из изделий, а из продукции второго станка – выборка из изделий. Выборочные оценки средних и дисперсий контролируемых размеров: , , , . Считая, что генеральные дисперсии и неизвестны, но равны, проверить гипотезу о равенстве математических ожиданий контролируемых размеров в продукции обоих станков. Принять а) ; б) .
13.59 Точность наладки станка-автомата, производящего некоторые детали, характеризуется дисперсией длины деталей. Если эта величина будет больше мкм2, станок останавливается для наладки. Выборочная дисперсия длины 15 случайно отобранных деталей из продукции станка оказалась равной . Требуется ли производить наладку станка, если уровень значимости: а) б) ?
13.60 Два станка-автомата изготовляют детали по одному чертежу. Из продукции первого станка было отобрано деталей, а из продукции второго деталей. Выборочные дисперсии контрольного размера оказались равными: и . Проверить гипотезу о равенстве дисперсий при , если альтернативная гипотеза утверждает, что дисперсия размера для второго станка больше, чем для первого.
3.2 Проверка гипотез о параметре биномиального распределения.
Гипотеза |
Статистика критерия |
Критическое множество |
, где (,) |
||
где (,, ,) |
||
Здесь: - корень уравнения (приложение 6.2); - корень уравнения (приложение 6.2); , - число элементов в выборках объёма , , соответственно, обладающих данным свойством.
13.61 Предполагается, что большая партия деталей содержит 15% брака. Для проверки из партии случайным образом отобрано 100 деталей, среди которых оказалось 10 бракованных. Считая, что число бракованных деталей в партии имеет биномиальное распределение, на уровне значимости проверить предположение о том, что в партии содержится 15% бракованных деталей.
13.62 Партия изделий принимается в том случае, если вероятность того, что изделие окажется соответствующим стандарту, составляет не менее . Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости принять партию изделий?
13.63 Фирма рассылает рекламные каталоги возможным заказчикам. Как показывает опыт, вероятность того, что организация, получившая каталог, закажет рекламируемое изделие, равна . Фирма разослала 1000 каталогов новой улучшенной формы и получила 100 заказов. Выяснить на уровне значимости можно ли считать, что новая форма рекламы существенно лучше прежней?
13.64 Количество бракованных деталей в партии не должно превышать 5%. В результате контроля 100 деталей из этой партии обнаружено шесть бракованных. Можно ли на уровне значимости считать, что процент брака превосходит допустимый?
3.3 Проверка гипотезы о виде распределения генеральной совокупности.
Критерии, используемые для проверки гипотезы о виде распределения случайной величины (генеральной совокупности) называют критериями согласия (с основной гипотезой), при этом альтернатива , как правило, не формулируется, подразумевая под ней «всё остальное». Одним из наиболее широко применяемых на практике критериев согласия, является критерий согласия («хи-квадрат»).
Критерий «хи-квадрат» в качестве меры расхождения эмпирического и теоретического законов распределения случайной величины использует значения статистики , где - объём выборки; -число непересекающихся множеств на которые разбита область возможных значений случайной величины ; -эмпирическая частота попадания в ; -вероятность попадания в , вычисленная для теоретического закона распределения . Закон распределения статистики при независимо от вида закона распределения случайной величины стремится к закону -распределения с степенями свободы ( -число параметров теоретического закона распределения , вычисляемых по выборке). Для его применения практически достаточно, чтобы .
Общая схема проверки непараметрической гипотезы , утверждающей, что случайная величина имеет теоретический закон распределения состоит в следующем.
1) Задают уровень значимости .
2) По выборке находят значения оценок неизвестных параметров предполагаемого закона распределения .
3) Область возможных значений случайной величины разбивают на непересекающихся множеств : интервалов, если - непрерывная величина или групп отдельных значений, если - дискретная величина и подсчитывают их частоты , . Очевидно, что .
4) Используя предполагаемый закон распределения вычисляют вероятности , - вероятности того, что наблюдаемое значение принадлежит множеству . Очевидно, что . Замечание. Критерий «хи-квадрат» использует тот факт, что случайные величины , , имеют распределения, близкие к нормальному . Чтобы это утверждение было достаточно точным, необходимо, чтобы для всех выполнялось условие . Если для некоторых это условие не выполняется, то их объединяют с соседними.
5) По заданным значениям и определяют критическое множество критерия «хи-квадрат»: , , где - критическая точка -распределения (приложение 6.3). Замечание. Если проводилось объединение , то - число множеств , оставшихся после их объединения.
6) По выборке вычисляют наблюдаемое значение статистики критерия «хи-квадрат».
7) Принимают статистическое решение: если , то основная гипотеза отклоняется как не согласующаяся с данными выборки; если , то принимается, т.е. считается, что гипотеза не противоречит данным выборки.
13.65 Опыт, состоящий в одновременном подбрасывании четырёх монет, повторили 100 раз. Эмпирическое распределение дискретной случайной величины - числа выпадений «гербов» - оказалось следующим:
Число «гербов» |
0 |
1 |
2 |
3 |
4 |
Число подбрасываний |
8 |
20 |
42 |
22 |
8 |
Используя критерий , на уровне значимости проверить гипотезу о том, что случайная величина имеет биномиальное распределение. (Указание. Принять вероятность выпадения «герба» ).
13.66 ОТК предприятия проверил 200 партий изделий по 5 изделий в каждой партии и получил следующее эмпирическое распределение дискретной случайной величины - числа нестандартных изделий:
Число нестандартных изделий в одной партии |
0 |
1 |
2 |
3 |
4 |
5 |
Число партий |
72 |
77 |
34 |
14 |
2 |
1 |
Используя критерий , на уровне значимости проверить гипотезу о том, что случайная величина имеет биномиальное распределение. (Указание. Принять в качестве значения оценки вероятности - вероятности того, что наудачу взятое изделие окажется нестандартным - относительную частоту появления нестандартных изделий).
13.67 При испытании радиоэлектронной аппаратуры фиксировалось число отказов. Результаты 600 испытаний приводятся ниже:
Число отказов |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
Число испытаний |
400 |
167 |
29 |
3 |
0 |
0 |
1 |
Используя критерий , проверить гипотезу о том, что число отказов имеет распределение Пуассона. Принять .
13.68 В цехе с 10 станками ежедневно регистрировалось число вышедших из строя станков. Всего было проведено 200 наблюдений, результаты которых приведены ниже:
Число выбывших станков |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Число зарегистри-рованных случаев |
41 |
62 |
45 |
22 |
16 |
8 |
4 |
2 |
0 |
0 |
0 |
Используя критерий , проверить гипотезу о том, что число выбывших из строя станков имеет распределение Пуассона. Принять .
13.69 В течение 10 часов регистрировали прибытие автомашин к АЗС и получили следующее эмпирическое распределение непрерывной случайной величины - времени прибытия автомашин к АЗС (в часах):
[8, 9) |
[9, 10) |
[10, 11) |
[11, 12) |
[12, 13) |
|
12 |
40 |
22 |
16 |
28 |
|
[13, 14) |
[14, 15 |
[15, 16) |
[16, 17) |
[17, 18] |
|
6 |
11 |
33 |
18 |
14 |
Используя критерий , на уровне значимости проверить гипотезу о том, что случайная величина имеет равномерное распределение.
13.70 В результате взвешивания 800 стальных шариков получено следующее эмпирическое распределение непрерывной случайной величины - веса шариков (в граммах):
[20.0,20.5) |
[20.5,21.0) |
[21.0,21.5) |
[21.5,22.0) |
[22.0,22.5) |
|
91 |
76 |
75 |
74 |
92 |
|
[22.5,23.0) |
[23.0,23.5) |
[23.5,24.0) |
[24.0,24.5) |
[24.5,25.0] |
|
83 |
79 |
73 |
80 |
77 |
Используя критерий , на уровне значимости проверить гипотезу о том, что случайная величина имеет равномерное распределение.
13.71 В результате испытания 200 элементов на длительность работы получено следующее эмпирическое распределение непрерывной случайной величины - времени работы элементов (в часах):
[0,5) |
[5,10) |
[10,15) |
[15,20) |
[20,25) |
[25,30] |
|
133 |
45 |
15 |
4 |
2 |
1 |
Используя критерий , на уровне значимости проверить гипотезу о том, что случайная величина имеет показательное распределение.
13.72 В результате испытания 450 электроламп получено следующее эмпирическое распределение непрерывной случайной величины - времени горения электроламп (в часах):
[0,400) |
[400,800) |
[800,1200) |
[1200,1600) |
|
121 |
95 |
76 |
56 |
|
[1600,2000) |
[2000,2400) |
[2400,2800] |
||
45 |
36 |
21 |
Используя критерий , на уровне значимости проверить гипотезу о том, что случайная величина имеет показательное распределение.
В задачах 13.73-13.77 для приведённых группированных выборок, приняв 5%-ный уровень значимости, проверить, используя критерий , гипотезу о том, что они получены из нормально распределённой генеральной совокупности.
13.73 Результаты измерений величины контрольного размера 68 деталей, изготовленных на одном станке (мм):
[2.9,3.9) |
[3.9,4.9) |
[4.9,5.9) |
[5.9,6.9) |
[6.9,7.9] |
|
5 |
15 |
23 |
19 |
6 |
13.74 Результаты измерений входного сопротивления 130 электронных ламп (Ом):
[3.0,3.6) |
[3.6,4.2) |
[4.2,4.8) |
[4.8,5.4) |
[5.4,6.0) |
|
2 |
8 |
35 |
43 |
22 |
|
[6.0,6.6) |
[6.6,7.2] |
||||
15 |
5 |
13.75 Данные о товарообороте 150 продовольственных магазинов города (млн. руб.):
[24.5,27.5) |
[27.5,30.5) |
[30.5,33.5) |
[33.5,36.5) |
[36.5,39.5) |
|
1 |
4 |
13 |
23 |
22 |
|
[39.5,42.5) |
[42.5,45.5) |
[45.5,48.5) |
[48.5,51.5) |
[51.5,54.5] |
|
29 |
29 |
16 |
11 |
2 |
13.76 Результаты наблюдений за среднесуточной температурой воздуха () в течение 300 суток:
[,) |
[, 0) |
[0, 10) |
[10, 20) |
[20, 30) |
|
20 |
47 |
80 |
89 |
40 |
|
[30, 40) |
[40, 50] |
||||
16 |
8 |
13.77 Результаты исследований прочности на сжатие 200 образцов бетона ():
[190, 200) |
[200, 210) |
[210, 220) |
[220, 230) |
|
10 |
26 |
56 |
64 |
|
[230,240) |
[240, 250] |
|||
30 |
14 |
13.78 На экзамене по некоторому предмету студент отвечает только на один вопрос по одной из четырёх частей курса. Из 100 студентов 26 получили вопрос из первой, 32 – из второй, 17 – из третьей и 25 – из четвёртой части курса. Используя критерий , выяснить, можно ли считать, что студент, идущий на экзамен, с равной вероятностью получит вопрос по любой из четырёх частей курса? Принять .
13.79 Ниже приводятся данные о фактическом объёмах сбыта предприятием продукции (в условных единицах) в пяти районах города:
Район |
1 |
2 |
3 |
4 |
5 |
Фактический объём сбыта |
110 |
130 |
70 |
90 |
100 |
Используя критерий , выяснить, согласуются ли эти результаты с предположением о том, что сбыт продукции в этих районах должен быть одинаковым? Принять .
§4. Корреляционно-регрессионный анализ.
На практике часто бывает важно знать, существует ли зависимость между некоторыми наблюдаемыми величинами, насколько тесно они связаны между собой, можно ли по значению одной величины сделать какие-либо выводы о предполагаемом значении другой величины и т.д. Для решения задач такого рода и применяется корреляционно-регрессионный анализ.
Пусть - выборка из двумерной генеральной совокупности . Предварительное представление о зависимости между случайными величинами и можно получить изобразив в прямоугольной системе координат на плоскости точки . Такое графическое представление двумерной выборки называют диаграммой рассеивания (корреляционным полем).
Количественной характеристикой степени линейной зависимости между величинами и является коэффициент корреляции . Состоятельной оценкой коэффициента корреляции служит статистика , где , , , , .
Если , то все выборочные точки , лежат на одной прямой. При выборочные данные только имеют тенденцию сосредотачиваться около прямых:
, ,
называемых (теоретическими) прямыми регрессии на и на, соответственно. Здесь , . Первое уравнение даёт наилучший в среднем квадратичном прогноз ожидаемых значений по наблюдениям , второе – прогноз значений по наблюдениям .
Прямые , называются эмпирическими прямыми регрессии на и на, соответственно. Здесь , , , , - найденные по выборке , , значения статистик , , , , , являющихся состоятельными оценками параметров , , , , двумерной генеральной совокупности. Если выборка представлена корреляционной таблицей , , , , где , - или отдельные различные выборочные значения и или середины интервалов группировки выборочных значений и , - частота с которой в выборке встречается пара , то значения статистик вычисляются по формулам:
, , , ,
,,
В задачах 13.80-13.81 для указанных выборок вычислить коэффициенты корреляции и построить диаграммы рассеивания.
13.80 13.81
В задачах 13.82-13.83 для указанных выборок вычислить коэффициенты корреляции, определить и нанести на диаграмму рассеивания прямые регрессии и .
13.82
13.83
, , , ,
В задачах 13.84-13.85 вычислить коэффициент корреляции и найти уравнения прямых регрессии и по данным в следующих корреляционных таблицах:
13.84
13.85
В случае выбора из двумерной нормально распределённой генеральной совокупности равенство влечёт независимость случайных величин и . Проверка параметрической гипотезы основана на статистике , которая имеет распределение Стьюдента с степенями свободы.
Проверка гипотезы о значимости выборочного коэффициента
корреляции .
Гипотеза |
Статистика критерия |
Критическое множество |
, где |
Здесь: -критическая точка распределения Стьюдента (приложение 6.4), .- объём выборки.
Доверительный интервал для коэффициента корреляции.
Здесь: - корень уравнения (приложение.6.2); -выборочный коэффициент корреляции; - объём выборки. Значения гиперболического тангенса вычисляются по таблице приложения 6.6.
В задачах 13.86-13.89 построить доверительные интервалы для коэффициентов корреляции двумерной нормально распределённой генеральной совокупности по следующим данным:
13.86 13.87
13.88 13.89
В задачах 13.90-13.93, предполагая, что выборки получены из двумерных нормально распределённых генеральных совокупностей, проверить гипотезу при альтернативной гипотезе по следующим данным:
13.90 13.91
13.92 13.93
Количественной характеристикой степени нелинейной зависимости между величинами и является корреляционное отношение , . Равенство влечёт независимость случайных величин и , а равенство имеет место тогда и только тогда, когда и связаны функциональной зависимостью . Состоятельной оценкой корреляционного отношения служит статистика , значение которой , в предположении, что выборка получена из двумерной генеральной совокупности (,) и представлена в виде корреляционной таблицы , ,, вычисляется по формулам: , ,,, .
Проверка гипотезы о значимости выборочного значения корреляционного отношения .
Гипотеза |
Статистика критерия |
Критическое множество |
, где , , |
Здесь: - критическая точка распределения Фишера (приложение 6.5а,б).
В задачах 13.94-13.95 вычислить эмпирическое корреляционное отношение и проверить гипотезу при альтернативной гипотезе на уровне значимости по следующим данным:
13.94
13.95
В задачах 13.96-13.97 требуется: а) вычислить эмпирическое корреляционное отношение и проверить его значимость на уровне ; б) найти выборочное уравнение нелинейной регрессии , считая, что регрессионная зависимость между величинами и имеет вид . (Указание. Эмпирические коэффициенты ,, регрессионной зависимости находят как решение системы уравнений метода наименьших квадратов , где ).
13.96 13.97
333