У вас вопросы?
У нас ответы:) SamZan.net

тематика Н

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 28.12.2024

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение высшего
профессионального образования

Академия

сервиса и экономики

Кафедра «Высшая математика»

Н.Ю. Кропачева

Г.А. Петросян

Элементы математической статистики

Учебное пособие

по изучению курса высшей математики

Санкт-Петербург

2004


Одобрено на заседании кафедры «Высшая математика», протокол №2 от 05.10.2003 г.

Утверждены Методическим советом ИЭУПС, протокол №3 от 03.11.2003 г.

Кропачева Н.Ю., Петросян Г.А. Элементы математической статистики. Учебное пособие по изучению курса высшей математики. – СПб.: Изд-во СПбГАСЭ, 2004. – 79 с.

Учебное пособие охватывает основные разделы курса математической статистики, который читается студентам Академии Сервиса и Экономики. Данное пособие соответствует требованиям Государственного образовательного стандарта к профессиональным образовательным программам по всем специальностям дневной и заочной форм обучения Академии. В учебном пособии излагаются основные понятия и методы, необходимые для анализа данных; на отдельных примерах рассматриваются постановки задач и их решение. Учебное пособие может  быть использовано для первого знакомства с методами математической статистики, оно дает представление об основных статистических методах, их возможностях и границах применения.

Внимательное ознакомление с данным учебным пособием поможет при самостоятельной работе по изучению данного курса, а также при выполнении контрольных заданий по математической статистике. Разнообразные примеры решения задач, иллюстрирующие теоретический материал, аналогичны задачам контрольных работ. В конце пособия представлены задания для контрольной работы, многие из которых имеют содержательное описание. В приложении к пособию приведен ряд таблиц, необходимых для выполнения контрольных работ.

Составители: канд. физ.-мат. наук, доц. Н.Ю. Кропачева;

                       ст. преп. Г.А. Петросян

Рецензенты: д-р экон. наук, проф. В.А. Черненко;

                     канд. физ.-мат. наук В.Г. Сережина

Редакционно-издательский отдел

Санкт-Петербургская государственная академия сервиса и экономики

2004 г.


Содержание

§

[0.0.1] Кафедра «Высшая математика»

[1] Содержание

[2] §1. Предмет математической статистики

[2.0.0.1] Теория вероятностей

[3]
§2. Выборочная совокупность
и ее характеристики

[4] §3. Законы распределения выборочных характеристик

[5] §4. Статистическое оценивание числовых характеристик случайной величины и
закона распределения

[6] §5. Статистические гипотезы

[7] §6. Методы регрессионного и
корреляционного анализа

[8]
Контрольные задания

[8.0.1] Вариант 1

[8.0.2]
Вариант 2

[8.0.3] Вариант 3

[8.0.4] Вариант 4

[8.0.5] Вариант 5

[8.0.6] Вариант 6

[8.0.7] Вариант 7

[8.0.8] Вариант 8

[8.0.9] Вариант 9

[8.0.10] Вариант 10

[8.0.11] Вариант 11

[8.0.12] Вариант 12

[8.0.13] Вариант 13

[8.0.14] Вариант 14

[8.0.15] Вариант 15

[8.0.16] Вариант 16

[8.0.17] Вариант 17

[8.0.18] Вариант 18

[8.0.19] Вариант 19

[8.0.20] Вариант 21

[8.0.21] Вариант 22

[8.0.22] Вариант 23

[8.0.23] Вариант 24

[8.0.24] Вариант 25

[8.0.25] Вариант 26

[8.0.26] Вариант 27

[8.0.27] Вариант 28

[8.0.28] Вариант 29

[8.0.29] Вариант 30

[9] Рекомендуемая литература


«Совокупное действие большого числа случайных факторов приводит при некоторых общих условиях к результату почти независящему от случая».

А.Н. Колмогоров (1903-1987)

§1. Предмет математической статистики

Для решения задач, связанных с анализом информации при наличии фактора случайности, разработана совокупность методов, которая носит название математической статистики. Математическая статистика – это раздел математики, занимающийся разработкой методов сбора, регистрации, систематизации результатов многократных наблюдений с целью познания массовых явлений и процессов. Методы математической статистики позволяют анализировать результаты опытов (наблюдений) и на основе анализа строить оптимальные математико-статистические модели изучаемых явлений и процессов. Исследование математико-статистических моделей позволяет делать обоснованные выводы и прогнозы, решать задачи прогнозирования в различных сферах человеческой деятельности.

Математическая статистика возникла в 17 веке и развивалась параллельно с теорией вероятностей. Между основными понятиями в математической статистике и теории вероятностей существует тесная взаимосвязь, которая обосновывает практическую ценность теории вероятностей и подтверждает теоретическую основу математической статистики.

Общим для статистических и вероятностных характеристик является техника их вычислений. Главное различие между ними состоит в том, что статистические характеристики относятся к эмпирическим, а вероятностные к теоретическим понятиям. Статистические характеристики - это величины, которые при соблюдении определенных условий стремятся к вероятностным. Вероятностные характеристики можно рассматривать как предельные значения сопоставимых им характеристик математической статистики при возрастании числа наблюдений или опытов.

Закономерность, проявившаяся лишь в большой массе явлений через преодоление свойственной ее единичным элементам случайности, называется статистической закономерностью.

Первая теорема, установившая связь между теорией (теория вероятностей) и ее практической стороной (математическая статистика), была доказана в конце 17 века Якобом Бернулли (При соединении большого числа случайных явлений в общих характеристиках всей массы случайность исчезает в тем большей мере, чем больше соединено единичных явлений). Эта теорема дала начало развитию предельных теорем. Несмотря на колебания отдельных результатов наблюдений при повторных измерениях проявляется определенная закономерность (устойчивость). Она состоит в том, что средний результат при большом числе наблюдений не зависит от отдельных наблюдений.

Основные понятия теории вероятностей и математической статистики тождественны, но не равны в смысле их количественного выражения. Их можно сопоставить следующим образом:

Теория вероятностей

Математическая статистика

Генеральная совокупность

Выборочная совокупность

Вероятность

Частость

Математическое ожидание

Средняя арифметическая
(простая и взвешенная)

Закон распределения и
теоретическая функция

Вариационный ряд распределения

Задачи математической статистики можно разбить на три типа:

  •  определение неизвестного закона распределения случайной величины;
  •  определение параметров распределения и их оценка;
  •  проверка правдоподобия гипотез о распределении статистических параметров.

Математическая статистика указывает, как наилучшим способом использовать имеющуюся информацию для получения по возможности более точных характеристик массового явления. Методы статистического анализа являются универсальными и могут применяться в самых различных областях человеческой деятельности.


§2. Выборочная совокупность
и ее характеристики

Перед построением и анализом модели, описывающей исследуемое массовое явление или некоторый процесс, необходим сбор опытных данных результатов обследования объектов, отображающих массовое явление. Пусть произведено n независимых испытаний, в результате которых получены некоторые значения X1, X2, X3,………Xn. Совокупность, состоящая из всех возможных в данных условиях наблюдений, обладающих качественной общностью и подлежащих исследованию, называется генеральной совокупностью. Генеральная совокупность содержит достаточно большое количество элементов, поэтому обычно производится анализ некоторого ограниченного количества элементов взятых из генеральной совокупности. На основе анализа делаются выводы о генеральной совокупности или, другими словами, о всей вероятной ситуации. Таким образом, задачи математической статистики практически сводятся к обоснованному суждению об объективных свойствах генеральной совокупности по результатам случайной выборки.

Выборочной совокупностью (выборкой) называется множество наблюдений, отобранных из генеральной совокупности. 

Выборка должна правильно отражать пропорции генеральной совокупности (быть репрезентативной), то есть все объекты генеральной совокупности должны иметь одинаковую вероятность попасть в выборку. Репрезентативность выборки обеспечивается случайностью отбора объектов. Принципиально, что при отборе объектов в выборочную совокупность возможны два варианта.

  1.  Объект возвращается в генеральную совокупность. Выборочная совокупность, полученная таким образом, называется случайной выборкой с возвратом (или повторной выборкой).
  2.  Объект, включенный в выборку, не возвращается назад в генеральную совокупность. Такая выборка называется случайной выборкой без возврата (или бесповторной выборкой).

Очевидно, что в повторной выборке возможна ситуация, когда один и тот же объект будет обследован несколько раз. Если объем генеральной совокупности велик, то различие между повторной и бесповторной выборками (которые составляют небольшую часть генеральной совокупности) незначительно, что практически не сказывается на результатах. В таких случаях, как правило, используют выборку без возврата. Если генеральная совокупность имеет не очень большой объем, то различие между указанными выборками будет существенным.

Отдельные значения генеральной совокупности X1, X2, X3, ………Xn называются вариантами признака. Если  – функция распределения генеральной совокупности X, то у каждой случайной величины Xi функция распределения также равна . Понятно, что получить  значений случайной величины X все равно, что получить одно значение -мерной случайной величины (X1, X2, X3,………Xn). Поэтому каждую выборку x1, x2, x3,………xn объема  мы можем рассматривать как одно значение -мерной случайной величины (X1, X2, X3,………Xn).

Числа, показывающие сколько раз наблюдается определенная варианта, называют частотами (m1, m2……..mn). Расположив варианты в возрастающем или убывающем порядке (ранжирование ряда) и поставив в соответствии с этими вариантами их частоты, получим упорядоченный ряд. Такой ряд называется вариационным рядом.

Все возможные значения признака, принимающие изолированные значения, отличающиеся на некоторую конечную величину, называются дискретными. Значения признака, принимаемые в некотором числовом интервале, называют непрерывными. Помимо частоты в статистике используется понятие накопленной  частоты, показывающей, сколько наблюдалось элементов со значением признака меньшим или равным Xi. . Отношение частоты (накопленной частоты) к общему числу наблюдений называется частостью (накопленной частостью) и обозначается , , т.е.

.

Накопленные частоты выражаются в относительных числах или в процентах. В дискретном вариационном ряду накопленные частоты и частости являются результатом последовательного суммирования частот и частостей, начиная от первой варианты.

Пример 2.1. [2] На телефонной станции проводились исследование качества ее работы. Для исследования измеряли число неправильных соединений в минуту. В течение часа были получены следующие 60 значений наблюдаемого признака:

3

1

3

1

4

2

2

4

0

3

0

2

2

0

2

1

4

3

3

1

4

2

2

1

1

2

1

0

3

4

1

3

2

7

2

0

0

1

3

3

1

2

4

2

0

2

3

1

2

5

1

2

4

2

0

2

3

1

2

5


Очевидно, что
X является дискретной случайной величиной, и полученные данные являются значениями этой случайной величины.

В результате группировки получено семь значений случайной величины (варианты): 0; 1; 2; 3; 4; 5; 7. При этом значение 0 в этой группе встречается 8 раз, значение 1 – 17 раз, значение 2 – 16 раз, значение 3 – 10 раз, значение 4 – 6 раз, значение 5 – 2 раза, значение
7 – 1 раз. Вычисленные значения частот и частостей приведены в табл. 2.1.

Таблица 2.1

Индекс

1, 2, 3, 4, 5, 6, 7

Варианта

0, 1, 2, 3, 4, 5, 7

Частота

8, 17, 16, 10, 6, 2, 1

Частость

Полученный дискретный ряд представлен в таблице 2.2.

Таблица 2.2

0

1

2

3

4

5

7

8

17

16

10

6

2

1

где во второй строке указаны соответствующие частоты. В отличие от исходных данных этот ряд позволяет делать некоторые выводы о статистических закономерностях.

Если число возможных значений дискретной случайной величины достаточно велико или наблюдаемая случайная величина является непрерывной, то строят интервальный вариационный ряд. Под интервальным вариационным рядом понимают упорядоченную совокупность интервалов варьирования значений случайной величины и соответствующие частоты или частости попаданий в каждый интервал значений случайной величины.

Как правило, частичные интервалы, на которые разбивается весь интервал варьирования, имеют одинаковую длину и представимы в виде

,

где L  число интервалов, hдлина интервала.

Длину h следует выбирать так, чтобы построенный ряд не был громоздким, но в то же время позволял выявлять характерные изменения случайной величины. Рекомендуется для h использовать формулу Стерджеса:

,

где  – наибольшее и наименьшее значения случайной величины. Величина ()- называется размахом ряда. Если при вычислении h необходимо округлить результат, следует помнить, что последний интервал группирования будет меньше ширины h при округлении в большую сторону и больше h при округлении в меньшую сторону. При этом необходимо выполнение условий:

.

После нахождения частичных интервалов определяется сколько значений случайной величины попадает в каждый конкретный интервал. При этом в интервал включают значения большие или равные нижней границе и меньшие верхней границы.

Одной из основных характеристик выборки является выборочная (эмпирическая) функция распределения:

,

где  – количество элементов выборки меньших . Другими словами,  есть относительная частота появления события  в  независимых испытаниях. По теореме Бернулли относительная частота появления события  в  независимых испытаниях сходится при увеличении  к вероятности  этого события. Следовательно, при больших объемах выборки выборочная функция распределения  близка к теоретической функции . Главное различие между  и  состоит в том, что  определяет вероятность события , а выборочная функция распределения  – относительную частоту этого события.

Из определения следует, что функция  обладает следующими свойствами:

1. ;

2. – неубывающая функция;

3.

Как известно, аналогичными свойствами обладает и функция распределения .

Для приближенного представления теоретической функции распределения  случайной величины X, которую наблюдаем в эксперименте, целесообразно использовать эмпирическую функцию распределения выборки .

Пример 2.2. Используя дискретный вариационный ряд, полученный в примере 2.1, вычислим значения . Результаты представлены в таблице 2.2.

Таблица 2.2.

Значения x

Накопленная частость

x  0

0

0 < x  1

1 < x  2

2 < x  3

3 < x  4

4 < x  5

5 < x  7

x > 7

Графическое изображение вариационных рядов дает наглядное представление о распределении.

По данным таблицы 2.2 построим график выборочной функции распределения (рис. 2.1).

Рис. 2.1. График выборочной функции распределения
(накопленных частот).

Характер изменения значений частот (частостей) наглядно представляется в виде графического изображения вариационных рядов. Наиболее простым способом графического изображения вариационных рядов является точечная диаграмма. Кроме точечной диаграммы применяются следующие формы: полигон, гистограмма, кумулята, огива.

Полигон - графическое изображение вариационного ряда в виде многоугольника, при этом по горизонтальной оси откладываются значения признака, а по вертикальной - частота встречаемости соответствующего значения признака.

Гистограмма - ряд прямоугольников, основания которых равны ширине интервала, а высоты частоте или частости. Гистограмма позволяет "зрительно" определить нормальность эмпирического распределения. Гистограмма позволяет качественно оценить различные характеристики распределения. Например, на ней можно увидеть, что распределение бимодально (имеет 2 пика). Это может быть вызвано, например, тем, что выборка неоднородна, возможно, извлечена из двух разных генеральных совокупностей, каждая из которых более или менее нормальна.

Кумулята – графическое изображение вариационного ряда с накопленными частотами.

Огива – графическое изображение вариационного ряда с накопленными частотами, но в отличие от кумуляты по вертикальной оси откладываются значения признака, а по горизонтальной накопленные частоты (частости).

Пример 2.3. [8]. Распределение предприятий по издержкам обращения (млн руб.), полученным в отчетном периоде, представлено в ранжированном виде интервалами объема издержек обращения xj и количеством nj предприятий, издержки которых попадают в j интервал.

Таблица 2.3.

xj -xj+1

2-6

6-10

10-14

nj

3

10

7

nx

3

13

20

3/20 = 0.15

13/20 = 0.65

20/20 = 1

Общее количество предприятий .

По данным таблицы 2.3 построим график выборочной функции распределения или график накопленных частот (рис. 2.2) и полигон частот (рис. 2.3).

Рис. 2.2. График выборочной функции распределения
(накопленных частот).

Рис. 2.3. Полигон частот случайной величины.

Также для данных примера 2.3

xj-xj+1

2-6

6-10

10-14

ωi

¾=0,75

10/4=2,5

7/4=1,75

построим гистограмму частот (рис. 2.4).

Рис. 2.4. Гистограмма частот случайной величины.

Рассмотренная выборочная функция распределения и гистограмма позволяют делать выводы о закономерностях исследуемого массового явления, но при анализе данных возникает вопрос об описании их положения, разброса, характере разброса. Для этого используются числовые характеристики выборочной совокупности, из которых сначала рассмотрим выборочное среднее и выборочную дисперсию.

Выборочным средним  называется случайная величина, определяемая формулой

.

Выборочное среднее называют также выборочным математическим ожиданием. Оно характеризует положение распределения случайной величины на оси x.

Если данные представлены в виде вариационного ряда, то целесообразно для вычисления выборочного среднего использовать одно из следующих соотношений:

  •  для дискретного вариационного ряда

;

  •  для интервального вариационного ряда

,

где – частость (относительная частота), соответствующая i-й варианте или i-му частичному интервалу; – середина i-го частичного интервала, т.е.

Пример 2.4. Вычислим значение выборочного среднего  по выборке примера 2.1 (табл. 2.1).

.

К другим характеристикам положения распределения случайной величины относятся медиана Ме и мода Мo.

Медиана (Ме) - среднее (серединное) значение вариационного ряда.

  •  при четном числе вариант -  
  •  при нечетном числе вариант  - ,  

где    и   средние значения.

Медиана делит совокупность на две равные части. Ее приближенное значение можно получить по графику распределения.

Мода (Мo) - наиболее часто встречающееся значение наблюдения. Мода имеет большое практическое значение. Она находит отражение при планировании производства товаров, при их распределении, при определении часов пик на станциях для оптимального планирования работы транспорта и т.д.

В вариационных рядах близких к нормальному закону распределения медиана (Мe), мода (Мо), математическое ожидание М(х) (среднее арифметическое) практически совпадают по своим численным значениям.

Рис. 2.5. Соотношение характеристик медиана Ме и мода Мo
на графике плотности распределения вероятностей.

Для характеристики совокупности признака по необходимости применяют ряд других характеристик: квартили, децили, перцентили. Квартили – значение изучаемой величины, полученное при делении совокупности на четыре части, децили - на десять, перцентили - на сто частей.

Дисперсия и среднеквадратическое отклонение являются характеристиками рассеяния или разброса распределения случайной величины, и чем больше разброс, тем сильнее варьируются значения случайной величины:

.

Число  полученное для отдельной выборки является одним из значений случайной величины

,

которая называется выборочной дисперсией.

Если данные представлены в виде вариационного ряда, то целесообразно для вычислений  использовать одно из следующих соотношений:

  •  для дискретного вариационного ряда

;

  •  для интервального вариационного ряда

,

где – те же, что и в предыдущих формулах.

Рис. 2.6. Графики плотности распределения вероятностей с различными значениями дисперсии и одинаковыми
математическими ожиданиями.

Выборочная дисперсия обладает одним существенным недостатком: если среднее арифметическое выражается в тех же единицах, что и значения случайной величины, то, как следует из формул, задающих дисперсию, последняя выражается уже в квадратных единицах. Этого недостатка можно избежать, взяв в качестве меры рассеивания арифметический квадратный корень из дисперсии. Выборочным средним квадратическим отклонением называется арифметический квадратный корень из выборочной дисперсии (σв).

Пример 2.5. Используя выборку примера 2.1. вычислить значение выборочной дисперсии.

Используя дискретный вариационный ряд (табл. 2.1), получим

.

Так как значение  было вычислено в примере 2.4 (), то по формуле для вычисления дисперсии получим

.

В качестве характеристики формы распределения, отражающей его асимметрию, служит коэффициент асимметрии Аs (иногда обозначается βi), который рассчитывается по формуле:

.

Коэффициент асимметрии Аs изменяется в пределах (). Для симметричного распределения Аs равен 0. Например, для модели нормального распределения Аs = 0. При Аs < 0 распределение имеет левостороннюю асимметрию, при Аs  > 0  - правостороннюю. Например, правосторонняя асимметрия характеризуется тем, что середина ряда сдвинута влево от вершины распределения, т.е. частоты сначала быстро возрастают, а достигнув наибольшего значения, в дальнейшем убывают значительно медленнее. Аналогично определяется левосторонняя асимметрия.

Рис. 2.7. Зависимость формы плотности распределения вероятности
от коэффициента асимметрии (
Аs i).

Неприведенный коэффициент эксцесса Ех также является характеристикой формы распределения, а именно его островершинности, и определяется из выражения:

.

Неприведенный коэффициент эксцесса Ех изменяется в пределах . Для нормального распределения Ех=0. Величина γ = Ех -3 называется приведенным коэффициентом эксцесса. На рисунке 2.8. приводятся графики плотности распределения в зависимости от различных значений γ.

Рис. 2.8. Зависимость формы плотности распределений
вероятности от приведенного коэффициента эксцесса
.

§3. Законы распределения выборочных характеристик

После получения вариационного ряда как выборочного распределения возникает первая задача – найти на основе этого распределения общий закон распределения для данного признака. На основе всестороннего анализа имеющегося распределения и изучения рассматриваемого признака выбирают из известных распределений определенный закон распределения в качестве предполагаемого теоретического закона распределения для рассматриваемого признака в генеральной совокупности.

Рассмотрим несколько распределений, которые имеют важные статистические приложения:

  •  нормальное распределение,
  •  2-распределение (распределение Пирсона),
  •  t-распределение (распределение Стьюдента),
  •  F-распределение (распределение Фишера).

а) Нормальный закон распределения случайной величины. Нормальное распределение рассмотрено впервые А. Муавром в I733 г., а в I809 г. открыто независимо от исследований А. Муавра К. Гауссом. Распределение Муавра - Лапласа - Гаусса занимает ведущее место в теории и практике вероятностно-статистических исследований, в частности, в экономике, социологии, технике, медицине, биологии и пр.

Как известно, нормальным называется распределение, имеющее вид:

.

По этой формуле при различных значениях среднего арифметического () и среднеквадратичного отклонения () получается семейство нормальных кривых. Нормальное распределение симметрично относительно  и имеет следующие числовые характеристики: математическое ожидание a=, дисперсия , коэффициент асимметрии Аs=0, неприведенный коэффициент эксцесса Ех = 3, приведенный коэффициент эксцесса γ = 0.

Для нормального распределения значения моды, медианы и среднего арифметического равны между собой.

При решении статистических задач во многих случаях применяется стандартное нормальное распределение (единичное, нормальное). Оно получается при условии, что  и , т.е. имеет параметры (0,1). Использование стандартного нормального распределения позволяет анализировать любое нормальное распределение на основе характеристик единичного нормального распределения.

б) Распределение  (распределение К. Пирсона). Пусть   независимые нормально распределенные случайные величины с параметрами (0,1). Распределение случайной величины

называется распределением хи-квадрат с п степенями свободы, а сама величина  случайной величиной хи-квадрат с п степенями свободы.

Заметим, что количество степеней свободы п является единственным параметром хи-квадрат распределения и значения  неотрицательны, т.е. .

При больших значениях п распределение случайной величины  близко к нормальному распределению с параметрами . Однако при малых значениях п функция плотности случайной величины  значительно отличается от кривой нормального распределения.

На рис. 3.1 показаны плотности распределения  случайной величины  при  и . Видно, что при увеличении  плотность  «приближается» к плотности нормального распределения.

Рис. 3.1. Плотность распределения хи-квадрат.

Сумма независимых случайных величин  также распределена по закону хи-квадрат с  степенями свободы.

в) Распределение Стьюдента (t-распределение). Если случайная величина z – нормально распределена с параметрами , а величина ω имеет распределение с к степенями свободы, то величина

распределена по закону Стьюдента с k степенями свободы и называется t-распределением. Это распределение впервые в 1908 году было использовано английским математиком В.Госсетом, который подписывал свои работы псевдонимом Стьюдент (Студент).

Распределение Стьюдента симметрично относительно нуля (рис. 3.2.), и значения t табулированы в зависимости от степеней свободы k и вероятности α.

Рис. 3.2. Плотность распределения Стьюдента.

При больших значениях k кривая плотности близка к кривой нормального распределения . Поэтому в практических расчетах при k>30 часто считают, что

.

г) Распределение Фишера (-распределение). Пусть  и  независимые случайные величины, имеющие хи-квадрат распределения с п и m степенями свободы, соответственно. Распределение случайной величины

называется F-распределением или распределением Фишера с п и m степенями свободы. Так как случайные величины  и  то .

Дальнейшие рассуждения будут базироваться на теореме о распределении выборочных характеристик  и  доказанную Р.Фишером.

Теорема (о распределении выборочных характеристик). 

Если генеральная совокупность Х распределена по нормальному закону с параметрами  и , то:

а) случайная величина распределена нормально с параметрами ;

б) случайная величина  имеет распределение ;

в) случайные величины  и  независимы.

Пусть из генеральной совокупности Х, имеющей нормальный закон распределения с математическим ожиданием  и дисперсией , взята случайная выборка объемом n, тогда выборочные характеристики (статистики) будут представлены следующим образом:

1)  - имеет нормированный нормальный закон распределения N(0,1) с математическим ожиданием, равным нулю, и дисперсией, равной единице, где  - выборочная средняя арифметическая,  - среднее квадратическое отклонение;

2)  - имеет распределение Стьюдента (t - распределение) с n-1 степенями свободы, где S - выборочное среднее квадратическое отклонение, равное ;

3)  - имеет нормированное нормальное распределение N(0,1);

4)  - имеет распределение Стьюдента
(
t-распределение) с n-1 степенями свободы;

5)  - имеет распределение  (хи-квадрат) с n-1 степенями свободы;

6) В случае двух независимых выборок их нормальных генеральных совокупностей Х и Y c одинаковыми математическими ожиданиями μху и дисперсиями статистика

- имеет распределение Стьюдента (t - распределение) с nх + nу -2 степенями свободы, где  - выборочные средние двух независимых выборок х и у из генеральных совокупностей с одинаковыми, но неизвестными параметрами a и σ,  - выборочные дисперсии соответственно первой и второй выборок.

После получения распределения выборки приходим к необходимости рассмотрения двух вопросов:

1) выбрать вид теоретического распределения в качестве предполагаемого для рассматриваемого признака, а затем найти его параметры;

2) доказать правильность сделанного выбора, проверить согласованность имеющегося эмпирического материала с предполагаемым теоретическим распределением признака в генеральной совокупности.

§4. Статистическое оценивание числовых характеристик случайной величины и
закона распределения
 

В связи с тем, что состав выборки может быть различным, выводы, сделанные относительно генеральной совокупности по выборочным значениям могут быть различными, а иногда и ложными. Решение этой проблемы приводит к рассмотрению критериев согласия, анализ которых позволяет сделать вывод:

  •  имеющиеся опытные данные и избранный вид теоретического распределения не противоречат друг другу;
  •  избранное распределение в качестве предполагаемого теоретического для исследуемого признака отклоняется.

Статистической оценкой неизвестного параметра генеральной совокупности называется любая функция вариант выборки, которая дает представление о значении неизвестного параметра. Основной задачей статистического оценивания является получение значений неизвестных параметров на основе выборки из генеральной совокупности. Так, например, если случайная величина распределена по нормальному закону, то по выборке необходимо оценить математическое ожидание и среднеквадратическое отклонение.

Выборочная характеристика, используемая в качестве приближенного значения неизвестной генеральной характеристики, называется ее точечной статистической оценкой. Она определяется одним числом. Ранее были рассмотрены выборочные среднее  и дисперсия , которые интерпретировались как приближенные значения неизвестных математического ожидания и дисперсии изучаемой случайной величины , т.е. являлись точечными оценками этих неизвестных характеристик.

Обозначим через  некоторый неизвестный параметр генеральной совокупности, а через – точечную оценку этого параметра. Оценка  есть функция  от  независимых элементов  генеральной совокупности, где  – объем выборки. Поэтому оценка , как функция случайных величин, также является случайной и свойства  можно исследовать с использованием понятий теории вероятностей.

В общем случае точечная оценка  не связана с оцениваемым параметром . Поэтому естественно потребовать, чтобы  была близка к . Это требование формируется в терминах несмещенности, состоятельности и эффективности.

Статистическая оценка  неизвестного параметра называется несмещенной, если математическое ожидание равно самому параметру:

.

Статистическая оценка  неизвестного параметра называется эффективной, если она имеет минимальную дисперсию среди остальных оценок параметра .

Статистическая оценка  называется состоятельной, если для нее соблюдается условие:

  для любого .

Это означает, что чем больше число наблюдений , тем больше уверенность (вероятность стремится к 1) в незначительном отклонении  от неизвестного параметра  . Очевидно, что «хорошая оценка» должна быть состоятельной, иначе эта оценка не имеет практического смысла, так как увеличение объема исходной информации не будет приближать оценку к «истинному» значению .

Теорема 4.1. Выборочное среднее  есть состоятельная и несмещенная оценка генеральной средней .

Теорема 4.2. Выборочное среднее является эффективной несмещенной оценкой для , если случайная величина  имеет нормальное распределение , где – математическое ожидание, – дисперсия случайной величины .

Теорема 4.3. Выборочная дисперсия  является состоятельной, но смещенной оценкой генеральной дисперсии .

Таким образом, если в качестве оценки генеральной дисперсии принимать выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам. В результате значение генеральной дисперсии будет занижаться. Легко «исправить» выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Для этого достаточно умножить  на дробь
п/(п—1). Сделав это, получим «исправленную» дисперсию, которую обычно обозначают через  :

.

Теорема 4.4. Исправленная дисперсия  является состоятельной и несмещенной оценкой для дисперсии генеральной .

Замечание: На практике пользуются исправленной дисперсией, если примерно п < 30.

Теорема 4.5. Относительная частота  появления события  в  испытаниях является состоятельной оценкой вероятности .

Одним из первых приемов оценивания параметров является метод моментов, разработанный Пирсоном (подробно см. работу №4). На практике этот метод сравнительно прост в вычислениях, но иногда приводит к малоэффективным оценкам.

Исследуя свойства оценок, получаемых с помощью метода моментов, английский математик Р. Фишер предложил более надежный метод оценивания параметров распределения по данным выборки случайной величины X — метод максимального правдоподобия. Метод максимального правдоподобия приводит к более сложным вычислениям, но оценки, получаемые с его помощью, как правило, оказываются более надежными. Этот метод наиболее полно использует данные выборки об оцениваемом параметре, поэтому он особенно эффективен в случае малых выборок.

Пусть X — случайная величина, которая в результате n испытаний приняла значения х1,x2,…, хn c распределением, зависящим от параметра θ. Требуется найти его точечную оценку.

Функцией правдоподобия случайной величины X называют функцию аргумента θ:

а) ,

если X — непрерывная случайная величина с плотностью распределения ,

б)

если X — дискретная случайная величина,  - вероятность того, что в результате испытания величина X примет значение xi .

В качестве точечной оценки параметра θ принимают такое его значение θ*=θ*(х1,x2,…, хn), при котором функция правдоподобия достигает максимума. Оценку θ* называют оценкой наибольшего правдоподобия. Функции L и LnL достигают максимума при одном и том же значении θ, поэтому вместо максимума функции L целесообразно находить максимум функции LnL, которую называют логарифмической функцией правдоподобия. Точку максимума функции LnL, аргумента θ можно найти, например, следующим образом:

  1.  найти производную: ;
  2.  приравнять производную нулю и найти критическую точку — корень полученного уравнения (уравнение правдоподобия);

3) найти вторую производную:  ; при этом если вторая производная при θ=θ*  отрицательна, то θ* является точкой максимума.

Найденную точку максимума θ* принимают в качестве оценки наибольшего правдоподобия параметра θ.

Пример 4.1. Найти оценку максимального правдоподобия для параметра  распределения Пуассона.

Распределение Пуассона имеет вид

,

где  принимает любые целые неотрицательные значения.

Пусть  – выборка из генеральной совокупности . Тогда

.

Преобразовав произведение, получим

.

Поэтому логарифмическая функция максимального правдоподобия имеет вид

.

Находим критическую точку, решая уравнение

.

Получим

Отсюда

.

Так как

при , то найденная критическая точка есть точка максимума. Поэтому оценкой максимального правдоподобия для параметра  является случайная величина

т.е. .

Для выборок малого объема точечные оценки могут значительно отличаться от оцениваемого параметра, и вопрос о точности получаемых оценок становится очень важным. В математической статистике он решается введением интервальных оценок. Общая теория построения интервальных оценок заключается в определении случайной величины, зависящей от оцениваемого параметра. Зная распределение этой случайной величины, находят соответствующие доверительные границы и сам доверительный интервал с требуемой точностью.

Интервальной оценкой для параметра θ называется такой интервал со случайными границами, что .

Вероятность  называется надежностью интервальной оценки или доверительной вероятностью, случайные величины доверительными границами, а сам интервал  называют доверительным интервалом. Центром этого интервала является значение точечной оценки .

Надежность  принято выбирать равной 0.95, 0.99, в этом случае событие, состоящее в том, что интервал покроет параметр , будет практически достоверным.

Например, для оценки математического ожидания генеральной совокупности нормально распределенного признака по выборочной средней и известном среднем квадратическом отклонении  генеральной совокупности применяется формула:

.


Таблица 4.1.

Таблица доверительных интервалов для параметров
нормального распределения

Параметр

Доверительный интервал

Статистическая
оценка

Математическое ожидание

а) при известном σ

, где - точность оценки

n  объем выборки

t - значение аргумента функции Лапласа Ф(t)

а - математическое ожидание

σ-среднеквадратическое отклонение

Математическое ожидание

б) при неизвестном σ

- выборочная средняя

S - исправленное средне-квадратическое отклонение

n -объем выборки

распределение Стьюдента, степень свободы k = n - 1

Дисперсия (среднеквадратическое отклонение)

границы (), соответствующие надежности γ находят по таблице:

(распределение Пирсона) из условия

,

где- случайна величина имеющая распределение Пирсона.

имеет распределение

-хи-квадрат с

n-1 степенями свободы.

При этом t определяется по таблицам функции Лапласа  из соотношения

,

где - среднеквадратическое отклонение; n - объем выборки.

Замечание 1. Оценку  называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:

  1.  при возрастании объема выборки п число  убывает и, следовательно, точность оценки увеличивается;
  2.  увеличение надежности оценки γ=2Ф(t) приводит к увеличению t (Ф(t) — возрастающая функция), следовательно, и к возрастанию ; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.

Замечание 2. Если требуется оценить математическое ожидание с наперед заданной точностью  и надежностью γ, то минимальный объем выборки, который обеспечит эту точность, находят по формуле

(следствие равенства ).

Пример 4.2. Найти доверительный интервал для оценки математического ожидания нормального распределения с надежностью 0,95, зная выборочную среднюю , объем выборки n=100 и среднеквадратическое отклонение .

Решение:

Воспользуемся данными из таблицы приложения 2. Для этого из выражения  где Ф - функция Лапласа, n = 100, σ = 4, δ - точность оценки, γ=0,95, найдем t. Получаем     t=1,96, тогда . доверительный интервал будет равен .

Пример 4.3.

На контрольных испытаниях n=15 ламп была определена средняя продолжительность горения лампы, =3000ч. Считая, что срок службы лампы распределен нормально с =16ч, определить доверительную вероятность того, что точность средней равна 10ч.

Решение:

Подставляя числовые данные в формулу .

По таблице приложения 2 найдем вероятность Ф(2,4)=0,9836; это и есть доверительная вероятность γ.

Пример 4.4.

На контрольных испытаниях 16 осветительных ламп были определены: средняя продолжительность работы лампы =3000ч и исправленное среднее квадратическое отклонение .S=20ч. Считая, что срок службы каждой лампы является нормально распределенной случайной величиной, определить с надежностью 0,9 доверительный интервал для математического ожидания.

Решение:

Так как γ=0,9, k=16-1 в соответствии с формулой  находим =1,753 .

Таким образом, с вероятностью 0,9 можно быть уверенным в том, что доверительный интервал (2991,235; 3008,765) покроет неизвестное математическое ожидание, а среднее =3000ч определяет значение математического ожидания с точностью 8,765.

Пример 4.5.

По результатам измерения диаметра 25 корпусов электродвигателей было получено, что =100мм, S=16 мм. Предполагая нормальное распределение результата измерения, найти вероятность того, что (0,9;1,1) накроет математическое ожидание.

Решение:

Приравнивая нижнюю границу, равную 0,9, нижней границе , получаем 0,9=. Отсюда . Такой же результат имеем, если приравнять 1,1 верхней границе, равной .

Подставляем числовые данные в формулу

Зная  и число степеней свободы k=n1==24, по таблице приложения 3 находим, что γ = 0,99. Таким образом, вероятность Р(0,9<МХ<1,1) = 0,99.

§5. Статистические гипотезы

При статистическом анализе в технике, экономике, социологии для выявления какого-либо факта часто прибегают к выдвижению гипотез (умозаключений) и последующей их проверке.

Статистическими гипотезами называют предположения относительно вида распределения случайной величины или его отдельных параметров. Так, например, гипотеза о нормальном законе распределения производительности труда рабочих, гипотеза о равенстве средних размеров деталей, производимых на одинаковых по техническим свойствам станках и т.д.

Сопоставление выдвигаемой гипотезы относительно генеральной совокупности, осуществляемое на основании анализа выборки, называется проверкой статистической гипотезы.

Статистические гипотезы можно классифицировать как гипотезы о законах распределения и гипотезы о параметрах распределения.

Виды задач, решаемых с помощью гипотез, делятся на 4 группы:

  •  способы проверки случайности, независимости и однородности результатов измерений;
  •  задачи по проверке средних значений и дисперсий для одной или двух нормально распределенных случайных величин;
  •  задачи по проверке гипотез о наличии линейной и множественной корреляции и регрессии;
  •  задачи по проверке законов распределения, определения резко выделяющихся результатов, определения вероятности для нахождения генеральных совокупностей

На рис. 5.1 приведена классификация гипотез отличающихся по характеру решаемых задач.

Любая статистическая гипотеза проверяется на основе статистического критерия - формулы (правила) с помощью которого определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой. В результате этой проверки выдвигаемая гипотеза либо отвергается, либо принимается.

Статистических гипотез всегда две и они взаимоисключающие. Выдвигаемую на проверку гипотезу называют нулевой (Н0), противоположную ей гипотезу называют конкурирующей, альтернативной (Н1).

Пусть проводится исследование игральной кости – “проверяется” ее симметричность. Ясно, что в качестве нулевой гипотезы надо считать предположение о полной симметрии кости. Ведь если Н0 верна, то вероятности выпадения всех шести цифр на гранях будут одинаковы – по 1/6. А вот выдвижение в качестве нулевой гипотезы предположения об асимметрии кости ничего бы не дало – в этом случае ничего нельзя сказать о вероятностях выпадения цифр.

Выбор критерия для проверки статистических гипотез производят на основании различных принципов. В основном используется принцип отношения правдоподобия. Суть его сводится к выбору такого критерия (К), чтобы при заданном уровне значимости α, можно было найти критическую точку Ккр, которая разделила бы область значений на 2 части на более или менее правдоподобные в отношении нулевой гипотезы Н0. К сожалению, не существует единого, универсального критерия значимости – их приходится разрабатывать в теории и использовать на практике применительно к особенностям конкретных задач. В результате применения критерия возможны 4 случая:

  •  гипотеза Н0 верна и она принимается согласно критерию;
  •  гипотеза Н0 не верна и она отвергается согласно критерию;
  •  гипотеза Н0 верна, но отвергается (ошибка первого рода);
  •  гипотеза Н0 не верна, но она принимается (ошибка второго рода).


Рис.5.1.  Классификация гипотез.

С процедурами проверки статистических гипотез связано понятие уровня значимости результатов наблюдений. Уровнем значимости α называется вероятность совершить ошибку I-го рода, т.е. отвергнуть верную гипотезу. Вероятность совершить ошибку II-го рода - обозначается β. С уменьшением α возрастает вероятность ошибки β.

Мощностью критерия называется выражение (1-β) - вероятность того, что нулевая гипотеза (Н0) будет отвергнута, если верна конкурирующая (Н1), т.е. вероятность не допустить ошибку II-го рода. При расчетах принято задавать вероятность ошибки I-го рода (уровень значимости α). Для этого используют следующие значения: 0,1;     0,05;     0,025;     0,01;     0,001;     0,005.

Множество значений критерия К разбивается на 2 части, при этом одна из них содержит значения при которых нулевая гипотеза отвергается, а другая - принимается.

Критической называется область значений, при которых нулевая гипотеза отвергается. Областью принятия гипотезы является совокупность значений критерия при которых нулевая гипотеза принимается.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области (т.е. области, где нулевая гипотеза отвергается). Правосторонней называется критическая область (нулевая гипотеза отвергается), если К > Ккр, где Ккр > 0. Левосторонней называется критическая область, если К < Ккр, где Ккр < 0. Двусторонней называется критическая область, которая определяется следующими неравенствами: К < К1кр; К > К2кр.. Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку.

Пример 5.1.

Предположим, что если верна гипотеза , то критерий  распределен по нормальному закону N(5,3)(т.е. математическое ожидание , дисперсия ), а если верна конкурирующая гипотеза , то критерий распределен по закону N(15,3). Требуется вычислить мощность критерия, когда в качестве критической рассматривается область больших значений, и мощность, когда в качестве критической рассматривается область больших по модулю значений. Уровень значимости  возьмем 0.05.

Решение:

В первом случае границу правосторонней критической области найдем из условия

,

поэтому

Значит, . По таблицам значений функции  находим, что

.

Поэтому границы правосторонней критической области . Чтобы вычислить ошибку второго рода , нужно найти вероятность попадания в область допустимых значений  при условии, что гипотеза  неверна. В этом случае считается справедливой гипотеза , а критерий будет распределен по закону N(15,3). Значит,

и мощность критерия .

Во втором случае правая граница критической области  вычисляется из условия

Поэтому

.

Значит, . Левая граница критической области симметрична с точкой  относительно точки , т.е. левая граница . Тогда вероятность ошибки составит 

Поэтому мощность критерия во втором случае равна . Значит, односторонняя критическая область больших значений является предпочтительной.

На основе вышеизложенного сформулируем основные этапы проверки статистической гипотезы:

  1.  Выдвигается нулевая гипотеза Н0 (т.е. предположение нуждающееся в проверке) и альтернативная гипотеза Н1.
  2.  Задается величина уровня значимости α.
  3.  Задается некоторая функция от результатов наблюдения - (критическая статистика, которая сама является случайной величиной). В предложении о справедливости гипотезы Н0 эта функция подчиняется некоторому хорошо изученному закону распределения и обычно задается в форме таблицы.
  4.  Из таблицы находят  и  точки, которые делят всю область на 3 части:
  •  область неправдоподобно малых значений
  •  область вероятностных значений
  •  неправдоподобно больших значений

Рассмотрим более подробно задачу проверки гипотез о законе распределения, так как во многих практических задачах возникает необходимость определения закона распределения исследуемой случайной величины, проверка согласованности теоретических и эмпирических функций распределения.

В этом случае прежде всего ставится нулевая гипотеза H0 о том, что случайная величина подчиняется конкретному теоретическому закону распределения F(х). Выдвинутая для проверки гипотеза проверяется по выборке из генеральной совокупности. Предварительно по выборке строится эмпирическая функция распределения исследуемой величины. Затем производится сравнение эмпирического и теоретического распределения с помощью специально подобранных, так называемых, критериев согласия. Различают несколько критериев согласия: χ 2 Пирсона, Колмогорова, Смирнова и др. Наиболее часто употребляется критерий согласия χ2 Пирсона (хи квадрат).

Критерий χ 2 (хи квадрат - критерий К.Пирсона).

Правило применения критерия χ 2 сводится к следующему алгоритму:

  1.  рассчитывается значение χ2;
  2.  выбирается уровень значимости критерия ;
  3.  по таблице распределения функции Лапласа определяется χ2(k,) если , то гипотеза отвергается, если , то гипотеза принимается.

Согласно критерию χ 2

, где .

Распределение χ 2 зависит от числа степеней свободы. При применении критерия Пирсона оно равно: - где r - число параметров предлагаемого теоретического закона, использованных для вычисления теоретических частот.

Критерий имеет ряд ограничений: он применим для рядов: имеющих большой объем выборки, достаточную величину частот в крайних интервалах, количество интервалов должно быть не менее пяти.

Критерий Колмогорова.

В качестве меры расхождения между теоретическим и статистическим распределением рассматривается максимальное значение модуля разности между статистической и соответствующей ей теоретической функцией распределения. В качества критерия берется следующее выражение

Алгоритм критерия Колмогорова применяется следующим образом:

  1.  Строится статистическая функция распределения F*(х) и предполагаемая теоретическая функция распределения F(x);
  2.  Определяется максимальная величина Dn модуля разности между этими распределениями;
  3.  Определяется величина  и находится вероятность  Функция табулирована, см. приложение 7.  - вероятность того, что за счет чисто случайных причин максимальное расхождение между F(x) и F*(x) будет не меньше, чем фактически наблюдаемое. Если эта вероятность мала, то гипотезу Н0 следует отвергнуть как неправдоподобную, при больших , ее можно считать совместной с данными. Критерий Колмогорова по сравнению с другими очень прост. Недостаток его в том, что критерий можно применять, когда функция распределена F(х) известна полностью.

Рассуждая аналогичным образом, можно получить статистики и для других задач проверки гипотез (см. таблицу 5.1).

Пример 5.2.

По результатам п = 9 замеров установлено, что среднее время изготовления детали . Предполагая, что время изготовления подчиняется нормальному распределению с дисперсией  на уровне значимости , решить:

а) можно ли принять 50с в качестве нормативного времени (математического ожидания) изготовления детали;

б) можно ли принять за норматив 49с?

Решение: (Эта задача о проверке гипотезы о числовом значении математического ожидания при известной дисперсии)

а) по условию задачи нулевая гипотеза с. Так как , то в качестве альтернативной возьмем гипотезу , т.е. имеем случай 2 при . По изложенной схеме получаем . Подставив исходные данные , получаем . Так как число –2 попадает в критическую область , то гипотеза с отвергается и принимается ;

б) здесь нулевая гипотеза с, альтернативная . Снова имеет место случай 2 при . Так как не попадает в критическую область, то гипотеза с не отвергается и в качестве норматива времени изготавления детали берем 49 с.


Таблица 5.1.

Статистики для задач проверки гипотез

Гипотеза

Статистика

Границы

Критерий

Гипотеза о значении генеральной средней нормальной совокупности:

а) при известной генеральной дисперсии:

tнабл=

при  - правосторонняя  критическая область

при  - левосторонняя  критическая область

при -двусторонняя критическая область

(нормированный закон распределения)

границы находят из условий

              Ф(tкр)=1-2α

               Ф(tкр)=1-α

если

tнабл│> tкр

то гипотеза отвергается

если

tнабл│≤ tкр

гипотеза не противоречит опытным данным

б) при неизвестной генеральной дисперсии:

tнабл=

при  - правосторонняя

при  - левосторонняя

при  - двусторонняя

                              критическая область

(распределение Стюдента)

определяются по таблице t - распре-деления (уровень значимости = α;

число степеней свободы  n - 1

при односторонней области      St = 2α

при двухсторонней            

                     St=

t│> tкр

Гипотеза о равенстве генеральных средних двух нормальных совокупностей:

а) при известных генеральных дисперсиях:  

tнабл= (распределение Стюдента)

границ находятся по таблице Ф(t)

б) при неизвестных генеральных дисперсиях:

tнабл= (распр.Стюдента)

имеет распределение Стюдента

(степень свободы)

Если │tнабл│> tкр

то гипотеза отвергается,

При │tнабл│≤ tкр

гипотеза не противоречит опытным данным      

Гипотеза о значении дисперсии генеральной совокупности (значения признака распределены по нормальному закону)

Н1:

распределение xu-квадрат

(n-1) степень свободы

если , то нулевая гипотеза H0:  отвергается

Гипотеза о равенстве дисперсий двух генеральных совокупностей

, гдеисправление дисперсии

(распределение Фишнра-Снедекора(F - распределение))

границы (

определяют по таблице F

если , то гипотеза не противоречит опытным данным;

если ,             то гипотезу отвергают.

Гипотеза

об однородности ряда дисперсий.

здесь

               

- число степеней

            свободы i - той выборки

,

l - кол-во нормальных генеральных совокупностей из которых извлечены выборки. При выполнении нулевой гипотезы и при  имеет распределение с  степенью свободы.

имеет распределение G с  и lстепенями свободы, где - наибольшая из исправленных выборочных дисперсий.

Границы определяют по таблице распределения х2 для уровня значимости  и числа степеней свободы .

При выполнении  и при , х2 имеет вид распределения с  степенью свободы.

Применяется, когда объемы выборок извлеченных из генеральных совокупностей равны.

Критерий Батлета:

Критерий Кохрана,

если ,

то гипотезу отвергают,

если ,

то считают, что гипотеза не противоречит опытным значениям.


Пример 5.3.

Хронометраж затрат времени на сборку узла машины п=21 слесарей показал, что мин, а мин2. В предложении о нормальности распределения решить вопрос: можно ли на уровне значимости  считать мин нормативом (математическим ожиданием) трудоемкости.

Решение: (Эта задача о проверке гипотезы о числовом значении математического ожидания при неизвестной дисперсии) 

В качестве основной гипотезы принимается мин, в качестве альтернативной мин, при этом . Используя таблицу приложения 5 при , находим

;

.

Вычисляем . Так как число  попадает в критическую область (конкретно в интервал , то гипотеза мин отвергается.

Пример 5.4.

По результатам n=4 измерений в печи найдено =254C. Предполагается, что ошибка измерения есть нормальная случайная величина с = 6C. На уровне значимости =0.05 проверить гипотезу H0: =250C против гипотезы H1: =260C. В ответе записать разность между абсолютными величинами табличного и фактического значений выборочной характеристики.

Решение:

1>0  выберем правостороннюю критическую область.

Так как используем правостороннюю критическую область, и tкр>tнабл, то на данном уровне значимости нулевая гипотеза не отвергается (|tкр|-|tнабл|=0,98).

Пример 5.5.

На основание n=5  измерений найдено, что средняя высота сальниковой камеры равна мм, а S=1,2мм. В предположение о нормальном распределение вычислить на уровне значимости =0,01 мощность критерия при гипотезе H0 :50 и H1 : 53.

Решение:

Вычислим мощность критерия по формуле:

где .

Пример 5.6.

На основании n = 15 измерений найдено, что средняя высота сальниковой камеры равна =70мм и S=3. Допустив, что ошибка изготовления есть нормальная случайная величина на уровне значимости =0.1 проверить гипотезу H0:  мм2 при конкурирующей гипотезе . В ответе записать разность между абсолютными величинами табличного и фактического значений выборочной характеристики.

Решение:

построим левостороннюю критическую область.

Вывод:  на данном уровне значимости нулевая гипотеза не отвергается ().

§6. Методы регрессионного и
корреляционного анализа

Основной целью изучения причинно-следственной зависимости является выявление связей, закономерностей и тенденций развития. Причинно-следственная зависимость выражает соотношение между функцией (следствием) и аргументом (причиной).

Различают две основные формы причинных зависимостей: статистическую и функциональную. При функциональной зависимости каждому возможному значению аргумента поставлено в однозначное соответствие определенное значение функции, т.е. Y = f(X).

Но такого рода однозначные (функциональные) связи между переменными величинами встречаются не всегда. Известно, например, что между ростом (длиной тела) и массой человека существует положительная связь: более высокие индивиды имеют обычно и большую массу, чем индивиды низкого роста. То же наблюдается и в отношении качественных признаков: блондины, как правило, имеют голубые, а брюнеты — карие глаза. Однако из этого правила имеются исключения, когда сравнительно низкорослые индивиды оказываются тяжелее высокорослых, и среди населения хотя и нечасто, но встречаются кареглазые блондины и голубоглазые брюнеты. Причина таких “исключений” в том, что каждый биологический признак, выражаясь математическим языком, является функцией многих переменных; на его величине сказывается влияние и генетических и средовых факторов, в том числе и случайных, что вызывает варьирование признаков, т.е. в реальности на производимые наблюдения (признаки) действуют многочисленные факторы. В этом случае связи теряют свою однозначность и речь при этом идет о статистических связях. Отсюда зависимость между признаками приобретает не функциональный, а статистический характер. Статистическая связь состоит в том, что одна случайная переменная реагирует на изменение другой изменением своего закона распределения. Такого рода зависимость между переменными величинами называется корреляционной или корреляцией (термин “корреляция” происходит от лат. correlatio — соотношение, связь).

Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Корреляционный анализ, как и другие статистические методы, основан на использовании вероятностных моделей, описывающих поведение исследуемых признаков в некоторой генеральной совокупности, из которой получены экспериментальные значения xi и yi. Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение результативного признака обуславливается влиянием одного или нескольких факторных признаков, а множество всех прочих факторов применяется за постоянные (или усредненные) величины.

Основная задача корреляционного анализа - выявление связи между случайными переменными путем точечной и интервальных оценок. Метод корреляции применяется для того, чтобы при сложном взаимодействии посторонних влияний выяснить какой должна была быть зависимость между величинами, если бы посторонние факторы не изменялись и своим изменением не искажали основную зависимость.

Теория корреляции решает три основные задачи:

  •  определение корреляционных уравнений связи между двумя и более случайными величинами;
  •  определение тесноты связи и вероятности получаемых характеристик;
  •  обоснование методики проведения исследований по выявлению корреляционных связей.

Показателем тесноты между двумя случайными наблюдениями х и y являются коэффициент корреляции:

N - количество независимых наблюдений. Коэффициент корреляции не изменяется при изменении начала отсчета и масштаба измерения величин х и y. Он удовлетворяет неравенству   Если r = ±1, то между величинами существует тесная линейная связь, если r=0, нет линейной корреляционной зависимости (но может быть нелинейная).

Таблица 6.1.

Количественные критерии оценки тесноты связи
(
шкала Чеддока)

Для оценки значимости r применяется t-критерий Стьюдента. При этом определяется фактическое значение критерия tr:

.

Исчисленное tr сравнивается с критерием tк, которое берется из таблицы значений t-Стьюдента с учетом заданного уровня значения и числа степеней свободы k (см. прил. 5). Если tr>tк, то величина коэффициента корреляции признается существенной.

К уравнениям регрессионного анализа относятся прямая, гипербола, парабола, экспонента, логарифмическая функция и др.

Применение метода наименьших квадратов позволяет получить достаточно точные теоретические значения линии однофакторной регрессии и, соответственно, ее графическое изображение. Подобранной считается та модель расчетов теоретической линии, для которой квадрат отклонений эмпирических данных у от теоретической линии регрессии  минимальный, т.е. . Для определения параметров уравнения на основе требований метода наименьших квадратов составляется система нормальных уравнений:

.

Решая систему линейных уравнений получим:

,

.

Множественные уравнения регрессии позволяют вычислить теоретические значения результативного признака в зависимости от всех включенных в множественное уравнение факторов (без графического его изображения одной теоретической линией).

Различный подход к истолкованию результатов регрессионного анализа исходит из разного понимания смысла параметров уравнений регрессии, полученных методом наименьших квадратов. Например считается, что в уравнении однофакторной линейной регрессии , параметр b означает среднее изменение величины результативного признака у, в зависимости от изменения значений факторного признака х, если все остальные факторы, влияющие на результативный признак у и не связанные с факторным, рассматриваются как неизменные (т.е. этот параметр показывает, насколько в среднем величина одного признака (Y) изменяется при изменении на единицу меры другого корреляционно связанного с Y признака X). При исследованиях это требование трудно учесть. Параметр а (свободный член) отражает усредненное влияние всех неучтенных факторов. Если первое требование трудно учесть, то второе - истолковать, особенно в тех случаях, когда он имеет отрицательное значение.

Критерием правильного применения регрессионного и корреляционного анализа при изучении взаимосвязей между наблюдениями является наличие нормального распределения совокупности, которое наблюдается только в том случае, если на эту взаимосвязь действует множество случайных, независимых или же слабо зависимых факторов и отсутствуют факторы, играющие в общем итоге преобладающую роль.

При исследовании корреляции между количественными признаками, значения которых можно точно измерить в единицах метрических шкал (рубли, секунды, килограммы и т.д.) очень часто принимается модель двумерной нормально распределенной генеральной совокупности. Такая модель графически отображает зависимость между переменными величинами xi и yi в системе прямоугольных координат. Эту графическую зависимость называют также диаграммой рассеивания или корреляционным полем.

Пример 6.1. [10]

В результате комбинационной группировки 100 рабочих по общему стажу работы и месячной заработной плате получена следующая корреляционная таблица:

Группы рабочих по общему стажу работы (лет)

Группы рабочих по размеру заработной платы (руб.)

100-120

120-140

140-160

160-180

180-200

200-220

220-240

Итого

0-5

5

6

14

7

32

5-10

3

4

7

10

2

26

10—15

1

2

6

5

4

18

15-20

4

1

6

1

12

20—25

1

3

1

3

8

25—30

1

2

1

4

Итого

5

10

20

25

20

15

5

100

Для характеристики связи между рассматриваемыми показателями необходимо вычислить:

1) уравнение прямой регрессии между заработной платой и трудовым стажем рабочих;

2) коэффициент корреляции;

3) среднюю ошибку коэффициента корреляции.

Решение.

Обозначим общий производственный стаж рабочих через х, а их месячную заработную плату — через у. Тогда уравнение прямой регрессии между заработной платой и стажем рабочих будет:

.
Для нахождения параметров этого уравнения необходимо решение следующей системы линейных уравнений:

Для выполнения вычислений составим расчетную таблицу:

y\x

110

130

150

170

190

210

230

Итого

2,5

275

1375

5

325

1950

6

375

5250

14

425

2975

7

11550

32

7,5

975

2925

3

1125

4500

4

1275

8925

7

1425 14250

10

1575 3150

2

33750

26

12,5

1625

1

1875

3750

2

2125

12750

6

2375

11875

5

2625

10500

4

40500

18

17,5

2975

11900

4

3325

1

3675

22050

6

4025

1

41300

12

22,5

3825

1

4275

12825

3

4725

1

5175

15525

3

36900

8

27,5

5225

1

5775

11550

2

6325

1

23100

4

Итого

1375

5

6500

10

13500

20

40375

25

47500

20

51975

15

25875

5

187100

100

Замечание. В левом верхнем углу каждой клеточки таблицы показано произведение ху, в нижнем правом углу m — частота такого сочетания, в середине — произведение ху на частоту т (при значении частоты, равном единице, произведение ху=тху, и поэтому произведение тху не показывается).

Из этой таблицы определяется величина тху, равная 187100. Для получения остальных величин, входящих в систему нормальных уравнений, составим расчетные таблицы, введя в них одновременно и величины, необходимые для расчета коэффициента корреляции. Произведем расчет вспомогательных величин по факторному признаку.

x

2,5

7,5

12,5

17,5

22,5

27,5

Итого

тх

32

26

18

12

8

4

100

тх x

80

195

225

210

180

110

1000

тхх2

200

1462,5

2812,5

3675

4050

3025

15225

Затем рассчитаем вспомогательные величины по результативному признаку:

y

110

130

150

170

190

210

230

Итого

ту

5

10

20

25

20

15

5

100

ту y

550

1310

3000

4250

3800

3150

1150

17200

ту y2

60500

169000

450000

722500

722000

661500

264500

3050000

Подставим найденные значения в систему уравнений и получим:

100а0+1000a1=17200;

1000а0+15225а1=187100.

В результате совместного решения уравнений находим: a0=143,1 и a1=2,89. Искомое уравнение прямой регрессии примет вид

.

Это уравнение показывает, что между общим производственным стажем и заработной платой рабочих имеется прямая связь: с увеличением стажа на один год размер месячной заработной платы возрастает в среднем на 2р. 89к. (а1).

Коэффициент корреляции исчисляется по формуле:

Для нахождения значения знаменателя в формуле коэффициента корреляции вычислим среднее квадратическое отклонение величин факторного признака по формуле:

 где ,

а результативного — соответственно по формуле:

 где .

Подставим найденные величины в формулу коэффициента корреляции и получим:

 

Полученное значение коэффициента корреляции указывает на наличие достаточно тесной линейной связи между общим производственным стажем и заработной платой рабочих.

Если имеются равные интервалы отдельно по факторному и по результативному признакам, как, например, в данной задаче, нахождение коэффициента корреляции целесообразно производить с помощью следующей формулы:

,

где   и  условные варианты признаков при равных интервалах;

тх, ту, и тхучастоты групп и подгрупп по х и у.

Так, для рассматриваемой задачи: х0=12,5, hх=5, y0=170 и hv = 20. Тогда корреляционная таблица будет иметь следующий вид:

-3

-2

-1

0

+1

+2

+3

mx

mx x’

mx (x’)2

mxyx’y’

-2

6

30

5

4

24

6

2

28

14

7

32

-64

128

82

-1

2

6

3

1

4

7

-1

10

-2

-4

2

26

-26

26

-4

0

1

2

6

5

4

18

0

0

0

+1

4

1

1

2

12

6

3

1

12

12

12

16

+2

2

6

3

4

1

6

18

3

8

16

32

28

+3

3

1

6

12

2

9

1

4

12

36

24

my

5

10

20

25

20

15

5

100

-50

234

146

туу'

-15

-20

-20

0

20

30

15

10

my(y’)2

45

40

20

0

20

60

45

230


Искомый коэффициент корреляции составит:

Средняя ошибка коэффициента корреляции определяется по формуле:

где  r — коэффициент корреляции;

n — объем совокупности.

Подставим в эту формулу полученные данные:

Отношение коэффициента корреляции к его погрешности равно 13 (0,69:0,052), следовательно, можно считать, что полученный коэффициент корреляции достаточно точно выражает степень связи рассматриваемых показателей.

Коэффициент корреляции, уменьшенный на трехкратную величину погрешности, дает гарантийный минимум, а увеличенный на трехкратную величину погрешности — соответственно гарантийный максимум. Так, в данной задаче гарантийный минимум составляет 0,534-(0,69—3x0,052), а гарантийный максимум равен 0,846 (0,69+Зx0.052). Это означает, что для рассматриваемого примера можно ожидать, что не меньше 28,5% (0,534x0,534x100) вариации месячной заработной платы рабочих вызвано вариацией величины общего производственного стажа.


Контрольные задания

Вариант 1

  1.  По штатному расписанию заработная плата в рублях у 50 сотрудников государственного учреждения составила:

789

965

700

879

986

704

1667

897

700

999

742

1300

1401

825

1500

1600

1800

948

900

1000

1201

1403

750

810

735

901

897

867

900

700

786

1999

2000

925

706

754

1200

1567

876

908

908

1786

1487

790

798

8061

697

1390

909

809

Составить вариационный ряд, определить статистические характеристики ряда, построить полигон, гистограмму, огиву, кумуляту ряда. Дать объяснения характеристикам.

  1.  На контрольных испытаниях 20-ти электрических ламп найдено, что средний срок службы равен 980 часам. Определить с надежностью 0,97 границы доверительного интервала для генеральной средней в предположении, что срок службы ламп распределен по нормальному закону с σ = 18 часов.
  2.  Проверить гипотезу о нормальном распределении ряда по условиям задачи № 1.
  3.  По результатам 8 замеров установлено, что среднее время изготовления детали  = 48 сек. Считая, что время изготовления детали есть нормальная случайная величина, для которого σ=4 сек., проверить на уровне значимости =0,001 гипотезу Н0: =50 сек. против конкурирующей Н1: = 45 сек.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      у

х

0,5

0,7

0,9

1,1

1,3

1,5

mxi

0,2

2

3

5

0,5

3

8

2

13

0,8

9

13

22

1,1

15

13

28

1,4

9

10

19

1,7

3

6

1

10

2

2

1

3

myi

5

20

42

29

3

1

N=100


Вариант 2

  1.  С целью выявления возможностей оплаты дорожных расходов на работу, администрация опросила 50 сотрудников о транспортных затратах. Результаты оказались следующие (руб.):

5

10

12

0

25

10

20

35

4

10

4

15

15

20

24

40

30

20

16

30

5

5

0

0

9

18

15

15

20

25

10

5

9

36

8

30

25

20

10

15

25

25

10

35

9

25

20

40

15

25

Составить вариационный ряд. Определить статистические характеристики ряда. Построить полигон, гистограмму, кумуляту, огиву. Дать объяснение полученным характеристикам.

  1.  Произведено 30 измерений диаметров металлических колец выпускаемых заводом и используемых при сборке автомобилей. Средний диаметр колец равен 96 мм. Предположив, что ошибка измерения распределяется по нормальному закону, найти вероятность того, что неизвестный параметр длин будет находиться в интервале (0,999 X; 1,0001 X ) при σ равной 0,5 мм.
  2.  Проверить гипотезу о нормальном распределении, используя различные критерии ряда представленного в задаче 1.
  3.  По результатам двух независимых выборок, для которых n1 = 9 и n2 = 15, извлеченных из нормальных генеральных совокупностей определены исправленные дисперсии:  и . Известны также для этих выработок  и . Проверить гипотезу о равенстве дисперсий генеральных совокупностей, т.е.  при конкурирующей гипотезе .
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

2

4

6

8

10

ny

10

9

10

19

20

8

3

11

30

10

11

18

39

40

5

8

8

21

50

6

4

2

12

nx

9

18

18

25

28

2

100

Вариант 3

  1.  Подекадная температура воздуха в некотором районе за 2 года составила следующий ряд (в градусах):

6

1

25

30

31

14

22

2

8

21

12

16

17

32

5

9

23

29

11

10

12

8

7

22

24

35

31

11

4

3

27

29

19

20

20

1

1

31

34

12

14

17

5

21

4

13

14

19

20

7

8

27

29

19

34

18

8

2

16

15

32

33

12

Составить вариационный ряд. Определить статистические характеристики ряда. Построить полигон, гистограмму, кумуляту, огиву. Дать объяснение полученным характеристикам.

  1.  При обслуживании 200 автомашин в авторемонтной мастерской стоимость разных услуг в среднем составляет 800 рублей. Каких размеров может быть стоимость услуг с вероятностью 0,88% при среднеквадратическом отклонении 500 рублей (считать распределение нормальным).
  2.  Проверить гипотезу о нормальном распределении ряда из задачи 1.
  3.  Машина по данным 15 поездок на дорогу из города в пригород едет в среднем 80 мин. Предположив, что время поездок нормальная случайная величина проверить гипотезу мин против конкурирующей гипотезы .
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

20

25

30

35

40

45

ny

14

5

15

20

24

8

12

20

34

5

8

3

16

44

18

2

6

26

54

8

8

2

18

nx

5

23

35

18

17

2

100

Вариант 4

  1.  Для проведения градостроительных работ, вся территория изучаемого района была разделена на 50 сравнительно одинаковых районов и подсчитано количество жителей, проживающих в этих районах. Результаты опроса приведены ниже.

100

788

973

146

851

746

589

379

907

675

346

791

596

392

189

567

498

200

380

679

189

496

598

381

981

863

816

953

367

547

682

109

987

538

861

549

520

482

479

1000

927

486

952

927

912

827

765

549

290

1002

Составить вариационный ряд. Определить статистические характеристики ряда. Построить полигон, гистограмму, кумуляту, огиву ряда. Дать объяснение полученным характеристикам.

  1.  Для 1000 организаций работающих в одной отрасли составлена случайная выборка из 20 организаций. При анализе оказалось, что в них в среднем работают 77 человек при среднеквадратическом отклонении S=25 человек. При 95%-ом доверительном интервале, нужно оценить среднее число работающих в организациях по всей отрасли и общее число работающих в отрасли. Количество работников в фирмах имеет нормальное распределение.
  2.  Проверить гипотезу о нормальном распределении, используя критерии согласия для ряда из задачи № 1.
  3.  Два станка выпускают однотипную деталь. Из изготовленной продукции взято по 10 и 12 деталей. По результатам этих выборок найдено, что средняя длинна этих деталей см,  деталей   и . Считая, что длинна детали распределена по нормальному закону требуется на уровне значимости  проверить гипотезу  при конкурирующей
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

20

25

30

35

40

45

hy

16

3

6

9

26

12

13

25

36

28

10

8

46

46

3

5

4

12

56

6

1

1

8

hx

3

18

44

21

13

1

100

Вариант 5

  1.  Затраты времени на сборку какого-то узла автомобиля у 50-ти слесарей на автомобильном заводе составило (в мин.):

111

106

109

79

88

89

82

88

102

98

87

99

80

75

89

55

68

80

86

95

56

61

61

56

59

92

125

71

81

72

82

93

65

72

81

94

94

83

75

66

79

65

78

85

79

85

95

92

92

95

Составить вариационный ряд. Определить статистические характеристики ряда. Построить полигон, гистограмму, кумуляту, огиву ряда. Дать объяснение полученным характеристикам.

  1.  Фирма, торгующая косметикой, изучает спрос у населения. С этой целью проведенный опрос у 500 человек, показал, что 35 человек предпочитает покупать производство фирмы "Ромашка". Оценить истинное их количество при 95%-ой доверительности.
  2.  Проверить гипотезу о нормальном распределении ряда приведенного в задаче № 1.
  3.  При обработке сведений о максимальных скоростях спортивных катеров получены следующие результаты: 38, 49, 42, 45, 45, 42, 40, 39. Полагая, что максимальная скорость имеет нормальное распределение проверить гипотезу Но: μ= 45 км/час, при μ =40 км/час
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

3

6

9

12

15

13

ny

10

4

7

11

15

9

11

20

20

30

10

2

42

25

2

4

5

11

30

9

5

2

16

nx

4

16

43

23

11

2

100

Вариант 6

  1.  При 30 независимых измерениях одним прибором температуры в хлебопекарной печи получены следующие значения температур (в градусах):

222

220

251

230

240

242

220

224

228

220

220

231

243

230

230

223

223

221

235

225

226

228

228

244

240

228

228

200

230

221

Составить вариационный ряд. Определить статистические характеристики ряда. Построить полигон, гистограмму, кумуляту, огиву ряда. Дать объяснение полученным характеристикам.

  1.  При обслуживании 200 автомашин в авторемонтной мастерской стоимость разных услуг в среднем составило 800 рублей. В каких размерах может быть стоимость услуг с вероятностью 0,98% при среднеквадратическом отклонении 500 рублей.
  2.   В условиях задачи № 1 проверить гипотезу о нормальном распределении, ряда.
  3.  Норма предусматривает 30 минут для изготовления детали. Однако рабочий тратит на выполнение больше времени. Проверка работы у 15 рабочих определила среднее время изготовления 35 минут. На уровне значимости  α = 0,01 определить, можно ли утверждать, что среднее время соответствует норме, если исправленное выборочное отклонение s = 3,2 минуты.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.


      x

y

15

20

25

30

35

40

ny

25

3

4

7

35

6

3

9

45

6

35

2

43

55

12

8

6

26

65

4

7

4

15

nx

3

10

21

47

15

4

100

Вариант 7

  1.  Дано количество бракованных деталей в 50-ти выборках обработанных на автоматическом станке.

1

2

5

6

3

7

4

2

2

7

0

2

3

2

4

0

0

9

3

1

2

4

1

1

1

10

9

7

2

1

8

7

7

4

3

8

0

1

2

3

2

2

3

4

1

1

0

0

3

10

Составить вариационный ряд. Определить статистические характеристики ряда. Построить кумуляту, огиву. Дать объяснение полученным характеристикам.

  1.  При обслуживании 200 автомашин в авторемонтной мастерской стоимость различных услуг в среднем составило 800 рублей. В каких размерах может быть стоимость услуг с вероятностью 0,98 % при среднеквадратическом отклонении 500 рублей.
  2.  В условиях задачи № 1 проверить гипотезу о нормальном распределении ряда.
  3.  Средняя длина  изготовляемой какой-то детали для автомашин равна 20 мм для I станка, для II станка по выборке 50 штук найден средний размер детали изготовляемой вторым станком. Генеральные дисперсии равные Д(I)=1,85 мм2 и Д(II)=1,48 мм2. Требуется при уровне значимости 0,05 проверить нулевую гипотезу Но о равенстве генеральных средних при конкурирующей гипотезе о том, что они не равны.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

15

20

25

30

35

40

ny

20

8

5

13

30

10

32

42

40

6

4

6

1

17

50

3

1

2

6

60

12

19

1

22

nx

8

15

41

17

17

2

100

Вариант 8

  1.  Отдел технического контроля на заводе при проверке диаметров изготовляемой детали получил следующие результаты:

561

561

548

580

564

580

563

540

573

571

564

570

564

570

564

548

569

568

561

550

550

571

570

548

551

560

574

569

555

559

Составить вариационный ряд. Определить статистические характеристики. Построить полигон, гистограмму, кумуляту, огиву ряда. Дать объяснение полученным характеристикам.

  1.  При взвешивании некоторого груза получены следующие результаты (в граммах): 120; 125; 130; 121; 122; 120; 128

Определить среднеквадратическую ошибку и построить для нее доверительный интервал с надежностью 0,9.

  1.  В условиях задачи № 1 проверить гипотезу о нормальном распределении ряда.
  2.  Лекарство, изготовленное  на заводе, испытывалось на пациентах для выяснения побочных эффектов. В эксперименте принимали участие 1000 мужчин и 3000 женщин. Побочные эффекты обнаружились у 70 мужчин и 120 женщин. При уровне значимости  α = 0,05 можно ли утверждать при окончании эксперимента, что побочные эффекты у женщин проявляются больше, чем у мужчин.
  3.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

3

6

9

12

15

18

ny

10

8

8

20

5

1

6

30

7

38

5

50

40

10

7

17

50

4

8

7

19

nx

8

5

8

52

20

7

100

Вариант 9

  1.  В течении двух месяцев (60 дней) на одной автомобильной стоянке численность иномарок по ежедневным подсчетам составило:

20

34

24

67

86

45

44

22

65

90

26

76

45

67

32

92

94

43

21

76

34

56

73

28

97

56

48

67

39

35

21

67

90

90

35

34

56

73

28

97

56

48

67

39

35

21

34

56

73

28

97

56

56

73

28

97

56

48

67

67

Построить вариационный ряд, гистограмму, диаграмму, огиву, найти характеристики ряда и дать объяснение полученным результатам.

  1.  Банк изучая возможности предоставления кредитов сделал опрос населения с целью определения среднего размера кредита. Было опрошено500 человек из 4000. Среднее значение суммы составило 3000 рублей с отклонением 800 рублей. Найти границы 95%-го доверительного интервала для оценки неизвестного среднего размера кредита.
  2.  В условиях задачи № 1 проверить гипотезу о нормальном распределении ряда.
  3.  Экономический анализ производительности труда позволил поставить гипотезу о наличии 2-х типов предприятий с различной средней величиной показателя производительности труда. Выборка 50 предприятий первого типа дала результат, средняя производительность равна 120 деталей из 60 предприятий II типа средняя производительность 111 деталей. Генеральные дисперсии известны Д(I)=126, Д(II)=130. На уровне значимости 0,05 проверить случайно ли полученное различие; т.е. (Но: равенство генеральных средних; Н1:неравенство генеральных средних).
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

     X

y

10

15

20

25

30

35

ny

6

4

2

6

12

6

2

8

18

5

40

5

50

24

2

8

7

17

30

4

7

8

19

nx

4

8

9

52

19

8

100

Вариант 10

  1.  Через каждый час измерялось напряжение тока в электрической сети: результаты измерений приводятся ниже:

227

219

215

230

223

218

219

218

220

226

222

221

214

220

224

220

220

219

222

227

216

220

216

221

225

219

230

224

223

228

Составить вариационный ряд. Определить статистические характеристики. Построить гистограмму, полигон, кумуляту, огиву. Дать объяснение полученным характеристикам.

  1.  Найти доверительный интервал с вероятностью 0,95 для оценки среднего стажа работы, на каком то большом предприятии, если он подчиняется нормальному закону; Стандартное отклонение σ = 4,7 года, если погрешность ошибки не превышает 0,5 года.
  2.  В условии задачи № 1 проверить гипотезу о нормальном распределении.
  3.  Вес одной конфеты в упаковке должен быть 10 грамм. Выборочная проверка 120 конфет показала, что средний вес равен хср = 12,5. Требуется при уровне значимости α = 0,01 проверить гипотезу Н0  при конкурирующей .
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

4

9

14

19

24

29

ny

30

3

3

6

40

5

4

9

50

40

2

8

50

60

5

10

6

21

70

-

4

7

3

14

nx

3

8

49

16

21

3

100

Вариант 11

  1.  При выяснении темп роста курса акций по сравнению с предыдущим месяцем, были опрошены 50 представителей различных фирм. Результаты опроса приведены в процентах:

104

103,1

102

98

99

94

119

95,8

104,9

103,1

92

97,1

95,2

91,7

104

104,5

92,8

114,8

109,5

77,5

93,1

94,9

99,5

99,7

103

109

122,5

102

96

92

111

83

87,2

80,5

84,1

89

85,1

90,1

95,1

90,1

96

100,3

103

105,1

106,5

110,6

116,1

94,5

98,1

101,9

Составить вариационный ряд. Определить статистические характеристики. Построить гистограмму, полигон, кумуляту, огиву. Дать объяснение полученным характеристикам.

  1.  Агентство недвижимости занималось подбором квартир для расселения жильцов многоквартирного дома. Оказалось, что в среднем для 50 семей необходимая затрата составит 29000 у.е. Определить доверительный интервал стоимости квартир с надежностью 95% при неизвестном среднеквадратическом отклонении и при условии, что распределение нормальное.
  2.  Проверить гипотезу о нормальном распределении по условию задачи №1.
  3.  На контрольных испытаниях n = 16 ламп определено  часов. Считая, что срок службы ламп распределен нормально с  часов, проверить на уровне значимости гипотезу о Н0  часов против конкурирующей  часов.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

5

10

15

20

25

30

ny

20

1

5

6

30

5

3

8

40

9

40

2

51

50

4

11

6

21

60

4

7

3

14

nx

1

10

16

55

15

3

100

Вариант 12

  1.  На определенном участке шоссе по подсчетам ГИБДД в течение года произошло 50 дорожно-транспортных происшествий. Количество пострадавших в них составило:

1

2

4

4

4

0

0

1

4

3

2

1

0

3

3

3

2

1

5

2

1

2

3

3

3

5

4

1

2

2

1

1

4

2

3

3

3

3

1

1

7

6

1

1

1

2

3

2

5

0

Построить вариационный ряд, гистограмму, полигон, огиву кумуляту. Найти характеристики ряда. Дать объяснение полученным результатам.

  1.  Опрос общественных организаций числом в 120 в некотором городе дал сведения, что только 75 из них занимаются благотворительной деятельностью направленной на осуществление программы "Здоровый образ жизни". Построить доверительный интервал с 95% оценивающий среднее количество организаций, чьи интересы направлены на молодежную политику при S = 80.
  2.  В условиях задачи № 1 проверить гипотезу о нормальном распределении.
  3.  Главный бухгалтер большой компании объединяющей несколько маленьких фирм при обследовании обнаружил неправильно оформленные счета. Из 1500 выбранных 35  оказалось неверными. Год спустя при проверке в порядке случайного отбора он проверил 2000 счетов, и 30 из них оказались неверными. Можно ли утверждать, что число неверных счетов уменьшилось. Принять уровень значимости .
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

5

10

15

20

25

30

ny

30

2

6

-

-

8

40

-

5

3

-

8

50

-

-

7

40

2

-

49

60

-

-

4

9

6

-

19

70

-

-

-

4

7

5

16

nx

2

11

14

58

15

5

100

Вариант 13

  1.  На грандиозном фестивале, на острове Ибица собралось 50 ди-джеев из разных стран. Количество пластинок привезенных ими на фестиваль составило ряд:

100

208

300

109

110

150

264

187

286

116

287

278

185

293

187

287

175

300

103

288

154

267

275

165

300

234

287

198

104

145

245

213

300

143

190

276

185

258

189

100

275

154

109

176

123

200

256

107

199

299

Построить вариационный ряд, гистограмму, полигон, огиву кумуляту. Определить статистические характеристики ряда. Дать объяснение полученным результатам.

  1.  На контрольных испытаниях 20-ти электроламп найдено, что средний срок службы равен 980 часов. Определить с надежностью 0,97 границы доверительного интервала для генеральной средней в предположении, что срок службы ламп распределен по нормальному закону с σ =18 час.
  2.  В условиях задачи № 1 проверить гипотезу о нормальном распределении.
  3.  Из продукции двух автоматических линий, обрабатывающих однотипно детали, взяли выборки объемом n1 = 14 и n2 = 9. По результатам выборочных наблюдений мм, мм. Установлено, что погрешности изготовления нормальные случайные величины с дисперсиями  и . Требуется при уровне значимости  проверить гипотезу о  при конкурирующей .
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

5

10

15

20

25

ny

10

4

6

10

20

14

16

30

30

15

5

4

1

25

40

15

5

3

2

25

50x

6

2

2

10

nx

4

20

46

16

19

5

100

Вариант 14

  1.  При покупке компьютера организация провела тендер. Были получены следующие данные о стоимости компьютеров (в долларах):

1000

800

950

780

1200

1300

1400

1000

820

900

950

1200

1100

1000

9604

920

800

760

780

820

900

770

780

900

800

1000

800

960.

Составить вариационный ряд. Определить статистические характеристики. Построить полигон, гистограмму, кумуляту, огиву. Дать объяснение полученным результатам.

  1.  С целью изучения размеров дневной выручки торговых ларьков, было опрошено 100 владельцев. В результате опроса выяснилось, что средняя выручка составила 300 д.е. В каких пределах с вероятностью 0,95 может оказаться дневная выручка, если среднеквадратическое отклонение составило 100 д.е.
  2.  В условиях задачи № 1 проверить гипотезу о нормальном распределении.
  3.  По результатам 10 измерений диаметра поршня одним и тем же прибором полученомм и S = 0,08 мм. Предположив, что ошибки измерения имеют нормальное распределение проверить при уровне значимости  гипотезу  при конкурирующей .
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

5

10

15

20

25

30

ny

40

2

4

6

50

3

7

10

60

5

30

10

45

70

7

10

8

25

80

5

6

3

14

nx

2

7

19

45

24

3

100

Вариант 15

  1.  Результаты измерения давления у больного записывались ежедневно в журнале.

227

219

215

230

223

218

219

218

220

226

222

221

214

220

224

220

220

219

222

227

216

220

216

221

225

219

230

224

223

228

Составить вариационный ряд. Определить статистические характеристики. Построить гистограмму, полигон, кумуляту, огиву. Дать объяснение полученным характеристикам.

  1.  Служба контроля по использованию воды с целью установки счетчиков, провела выборочную проверку в одном многоквартирном доме. Было отобрано 10 квартир. Расход воды составил (кубм3):

1,25

0,70

0,45

0,50

0,12

0,13

1,65

1,7

1,48

1,32

С вероятностью 0, 95 определить доверительный интервал для оценки среднего расхода воды на 1 квартиру при условии, что в доме 120 квартир.

  1.  В условиях задачи № 1 проверить гипотезу о нормальном распределении.
  2.  По данным 12 рейсов установлено, что в среднем машина затрачивает на поездки от завода до хлебоприемного пункта 73 минуты. Допустив, что время поездки нормальная случайная величина проверить гипотезу  мин. при конкурирующей , если выборочное среднеквадратическое отклонение равно S = 4 мин.
  3.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

10

15

20

25

30

35

ny

40

2

4

6

50

3

7

10

60

5

30

10

45

70

7

10

8

25

80

5

6

3

14

nx

2

7

19

45

24

3

100

Вариант 16

  1.  Число туристов посетивших за 30 дней некий туристический объект составило:

120

100

200

120

98

120

100

125

80

90

111

90

80

78

77

90

60

50

30

20

90

130

121

126

116

110

131

127

119

130

Составить вариационный ряд. Определить статистические характеристики. Построить полигон, гистограмму, кумуляту, огиву. Дать объяснение полученным результатам.

  1.  У 100 обезьян в среднем содержание кальция в организме оказалось при проверке 11,94 мг при среднеквадратическом отклонении 1,26. Установить доверительный интервал в котором с вероятностью р=0,095 должна находиться генеральная средняя.
  2.  Проверить гипотезу о нормальном распределении по условиям задачи № .
  3.  Фирма торгующая товаром утверждает, что покупатели охотно покупают их товар. Случайная выборка показала из 200 человек только 30 человек предпочитают этот товар. Другая фирма конкурент также утверждает, что их товар лучше покупается. Она отобрала группу из 300 человек и только 25 из них покупают этот товар. Приняв уровень значимости  проверить утверждение I фирмы.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

10

15

20

25

30

ny

5

10

15

25

10

5

5

10

7

8

12

27

3

7

13

23

10

4

1

15

nx

10

20

15

25

29

1

100

Вариант 17

  1.  Число туристов обратившихся в турбюро и желающих посетить какую-то страну регистрировалось в течение месяца. Результаты оказались следующими:

50

12

15

5

4

40

42

39

14

12

30

14

12

2

5

20

45

40

12

14

10

11

10

3

6

30

44

38

13

11

Составить вариационный ряд. Определить статистические характеристики. Построить полигон, гистограмму, кумуляту, огиву. Дать пояснение полученным результатам.

  1.  При поступлении в институт, где для оценивания знаний принята новая система баллов, протестированы 30 студентов. Получены следующие результаты в баллах:   

105

100

90

91

110

74

120

83

100

90

60

95

90

85

50

100

90

40

30

45

65

60

89

75

70

110

96

60

111

40

По этим данным найти 95%-ый доверительный интервал для оценки среднего балла тестируемых.

  1.  В условиях задачи № 1 проверить гипотезу о нормальном распределении.
  2.  Произведен стандартный тест для выяснения неких способностей. В изданном тексте утверждается, что принятая средняя  и стандартное отклонение . Полученная выборочная средняя . При уровне значимости 0,05 определить насколько выборка из 62 человек соответствует всей генеральной совокупности.
  3.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

5

10

15

20

25

30

ny

17

3

2

5

27

16

1

17

37

29

5

4

38

47

17

13

1

31

57

6

2

1

9

nx

3

47

23

23

3

1

100

Вариант 18

  1.  Кредиты центрального банка предприятиям за 12 месяцев характеризуются следующими данными (в рублях):

918

2100

2800

3000

1500

1600

2650

2200

1390

1020

2100

1400

Составить вариационный ряд, определить статистические характеристики. Построить кумуляту, огиву. Охарактеризовать полученные результаты.

  1.  На заводе произведено 30 измерений диаметров выпускаемых по результатам колец  используемых в ремонте автомашин. При этом их средняя величина составила 96 мм. Предположив, что ошибка измерения распределяется по нормальному закону, найти вероятность того, что неизвестный параметр будет находиться в интервале (0,999X; 1,001X) при σ = 0,5 мм.
  2.  В условиях задачи № 1 проверить гипотезу о нормальном распределении.
  3.  Температура некоторой смеси на заводе регистрируется через ровные промежутки времени. Для проведения некоторого эксперимента потребовалось поддерживать заданную температуру. Температура регистрировалась в течение 2-х дней в случайные моменты времени. В I-ый день было зафиксировано 16 значений температуры со средним квадратическим отклонением равным 15,6, во II день 21 значение со среднеквадратическим отклонением 9,8. Можно ли утверждать, что наблюдения относятся к одной совокупности.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

2

4

6

8

10

ny

11

5

10

15

13

11

6

17

15

21

8

7

36

17

3

7

2

12

19

16

2

2

20

nx

5

21

30

31

11

2

100

Вариант 19

  1.  Имеются данные о числе тонн грузов перевозимых по железной дороге в каком-то направлении:

340

450

452

587

390

344

455

505

396

580

344

455

451

441

396

633

580

606

344

350

344

340

450

499

580

613

600

641

Составить вариационный ряд. Определить статистические характеристики вариационного ряда. Построить полигон, гистограмму, кумуляту, огиву. Дать пояснение к полученным результатам.

  1.  Страховой компании выданы результаты оформления больничных листов 800 больных. Средний стаж работы больных составил 8,5 года, среднеквадратическое отклонение 2,7 года. Считая стаж работы, как величину нормально распределенную, определить с вероятностью 0.95 доверительный интервал, в котором окажется средний стаж работы.
  2.  В условиях задачи № 1 проверить, используя критерии согласия, гипотезу о нормальном распределении.
  3.  Фабрика, выпускающая новый вид продукции провела проверку покупки новой продукции. При случайной выборке из 200 человек 38 предпочтение дали новому товару. Следует проверить Н0 уровне значимости  гипотезу о том, что по крайней мере 52% покупатели предпочитают новый вид товара.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

5

10

15

20

25

20

ny

3

5

5

6

8

3

2

13

9

20

7

15

42

12

9

10

19

15

3

3

15

21

nx

13

3

31

20

18

15

N=100

Вариант 20

  1.  Продолжительность горения электролампы (в часах) была следующей:

750

750

751

762

751

762

762

751

730

735

742

742

743

737

740

756

756

864

756

739

748

748

758

760

758

748

741

751

799

851

750

750

766

738

751

747

752

759

757

746

752

752

757

747

752

754

747

754

753

748

Составить вариационный ряд. Определить статистические характеристики вариационного ряда. Построить полигон, гистограмму, кумуляту, огиву. Дать пояснение к полученным результатам.

  1.  При выборочном опросе 120 студентов, оказалось, что 45 из них регулярно несколько часов в день проводят перед компьютером. Построить 99%-ый доверительный интервал, оценивающий количество всех студентов предпочитающих работать на компьютере.
  2.  Поверить гипотезу о нормальном распределении на основе данных ,приведенных в задаче № 1, используя различные критерии согласия.
  3.  При обработке результатов 8 испытаний самолета были получены следующие значения максимальной скорости: 425, 430, 432, 439, 440, 420, 426 423. Проверить гипотезу о том, что  м/с на уровне значимости .
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

0,2

0,4

0,6

0,8

1,0

1,2

ny

0,5

2

3

5

1

4

8

9

21

1,5

10

12

15

8

45

2

9

10

7

26

2,5

3

3

nx

6

21

30

2,5

15

3

N=100

Вариант 21

  1.  С целью определения густоты речной сети, были произведены измерения по карте определенного масштаба длинны рек больше одного сантиметра в каком-то регионе. Всего были измерены длинны 50 рек. Они составили (см):

2

5

8

6

9

4

11

12

22

3

23

2

15

8

7

5

23

24

9

25

5

4

5

9

8

8

9

21

21

17

8

6

9

17

18

19

23

8

4

25

14

8

17

19

20

22

1

1

2

4

Построить вариационный ряд, гистограмму, полигон, кумуляту, огиву. Найти характеристики ряда и проверить гипотезу о нормальном распределении ряда.

  1.  Для оценки количества работающих было опрошено 500 человек, среди них оказалось 350 человек работающих. Нужно с 95%-ой доверительностью указать интервал, в котором могут быть истинные размеры числа работающих.
  2.  Поверить гипотезу о нормальном распределении на основе данных ,приведенных в задаче № 1, используя различные критерии согласия.
  3.  По выборке объема n=30 найден средний вес изделий, изготовленных на первом станке; по выборке объема т=40 найден средний вес  изделий, изготовленных на втором станке. Генеральные дисперсии известны: D(X) = 60r2, D(Y)=80r2. Требуется, при уровне значимости 0,05, проверить нулевую гипотезу H0: М(Х)=М(Y) при конкурирующей гипотезе М(Х)≠М(Y). Предполагается, что случайные величины X и Y распределены нормально и выборки независимы.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      у

х

0,5

0,7

0,9

1,1

1,3

1,5

mxi

0,2

2

3

5

0,5

3

8

2

13

0,8

9

13

22

1,1

15

13

28

1,4

9

10

19

1,7

3

6

1

10

2

2

1

3

myi

5

20

42

29

3

1

N=100

Вариант 22

  1.  У 50-ти преподавателей, работающих в школе средняя за месяц зарплата составила (в рублях):

789

965

700

879

986

704

1667

897

700

999

742

1300

1401

825

1500

1600

1800

948

900

1000

1201

1403

750

810

735

901

897

867

900

700

786

1999

2000

925

706

754

1200

1567

876

908

908

1786

1487

790

798

806

1697

1390

909

809

Построить вариационный ряд, гистограмму, полигон, кумуляту, огиву. Найти характеристики ряда и проверить гипотезу о нормальном распределении ряда.

  1.  У 100 обезьян в среднем содержание кальция в организме оказалось при проверке 11,94 мг при среднеквадратическом отклонении 1,26. Установить доверительный интервал в котором с вероятностью р=0,095 должна находиться генеральная средняя.
  2.  Поверить гипотезу о нормальном распределении на основе данных ,приведенных в задаче № 1, используя различные критерии согласия. 
  3.  Установлено, что средний вес таблетки лекарства сильного действия должен быть равен α0= 0,50мг. Выборочная проверка 121 таблетки полученной партии лекарства показала, что средний вес таблетки этой партии = 0,53мг. Требуется при уровне значимости 0,01 проверить нулевую гипотезу Н0: α= α0= 0,50 при конкурирующей гипотезе Н1: а>0,50. Многократными предварительными опытами по взвешиванию таблеток, поставляемых фармацевтическим заводом, было установлено, что вес таблеток распределен нормально со средним квадратическим отклонением α=0,11мг.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

0,5

0,9

1,3

1,7

2,1

mx

0,2

2

3

5

0,8

3

8

2

13

1,4

9

14

23

2

15

12

27

2,6

9

10

19

3,2

3

6

1

10

3,8

1

2

3

my

5

20

43

29

3

N=100

Вариант 23

  1.  С 1240 по 1480 годы Русь переживала тяжелейшие годы татаро-монгольского нашествия. Количество разорительных набегов татаро-монгольских войск на города и села государства за первые 50 лет существования на Руси ига Золотой Орды составило:

10

8

15

13

9

14

12

11

16

18

7

5

9

14

11

15

14

17

20

22

15

14

16

17

8

13

10

14

11

12

17

19

20

25

18

13

11

12

10

9

7

12

14

15

18

10

7

9

6

4

Построить вариационный ряд, гистограмму, полигон, кумуляту, огиву. Найти характеристики ряда и проверить гипотезу о нормальном распределении ряда.

  1.  В лаборатории  проводились исследования по изучению распределения кальция в сыворотке. У 100 обезьян в среднем кальция оказалось 11,94 м2 при среднеквадратичном отклонении 1,26. Установить доверительный интервал в котором с вероятностью p = 0,95 должна находиться генеральная средняя.
  2.  Поверить гипотезу о нормальном распределении на основе данных, приведенных в задаче № 1, используя различные критерии согласия.
  3.  Для сравнения точности двух станков-автоматов взяты две пробы (выборки), объемы которых n1 =10 и n2 = 8. В результате измерения контролируемого размера отобранных изделий получены следующие результаты:

xt

1,08

1,10

1,12

1,14

1,15

1,25

1,36

1,38

1,40

1,42

у,

1,11

1.12

1,18

1,22

1,33

1,35

1,36

1,38

1,39

1,40

Можно ли считать, что станки обладают одинаковой точностью [H0: D(X) = D(Y)], если принять уровень значимости α = 0,1 и в качестве конкурирующей гипотезы Н1: D(Х)D(Y)?

Указание. Для упрощения вычислений перейти
к условным вариантам  

  1.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

2

7

12

17

22

27

ny

10

2

4

6

20

6

2

8

30

3

50

2

55

40

1

10

6

17

50

4

7

3

14

nx

2

10

6

64

15

3

N=100

Вариант 24

  1.  Подекадная температура воздуха в некотором районе за 2 года составила:

1

25

30

31

14

22

21

3

8

21

12

16

17

32

5

9

23

29

11

10

12

7

22

24

35

31

11

19

4

3

27

29

19

20

20

Построить вариационный ряд, гистограмму, полигон, кумуляту, огиву. Найти характеристики ряда и проверить гипотезу о нормальном распределении ряда.

  1.  Для оценки количества работающих были опрошены 500 человек. Среди них оказалось 350 человек работающих. Нужно с 95% доверительностью указать интервал в котором могут быть истинные размеры работающих.
  2.  Поверить гипотезу о нормальном распределении на основе данных ,приведенных в задаче № 1, используя различные критерии согласия.
  3.  В результате длительного хронометража времени сборки узла различными сборщиками установлено, что дисперсия этого времени =2мин2. Результаты 20 наблюдений за работой новичка таковы:


время сборки одного

узла в минутах

хi

56   

58        

60

62

64

частота

ni

1

4

10  

3

2

Можно ли при уровне значимости 0,05 считать, что новичок работает ритмично (в том смысле,  что дисперсия затрачиваемого им времени существенно не отличается от дисперсии времени остальных сборщиков)?

Указание. Нулевая гипотеза H0: == 2; конкурирующая гипотеза H1: ≠. Принять   и вычислить .

  1.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

2

4

6

8

10

12

ny

10

2

3

5

20

5

6

9

20

30

4

10

15

16

45

40

8

9

5

22

50

1

7

8

nx

7

13

27

24

22

7

N=100

Вариант 25

  1.  Даны результаты регистрации числа неправильных соединений в минуту на АТС в течение часа:

2

1

1

0

2

1

1

1

3

1

1

1

4

2

2

2

2

1

2

3

5

2

2

2

7

8

9

1

1

2

0

0

5

4

4

1

5

6

0

2

2

2

1

1

3

3

4

0

2

2

2

1

3

1

3

2

6

Построить вариационный ряд, гистограмму, диаграмму, огиву, найти характеристики ряда и проверить гипотезу о законе распределения Пуассона.

  1.  При обслуживании 200 автомашин в авторемонтной мастерской стоимость различных услуг в среднем составило 800 рублей. В каких размерах может быть стоимость услуг с вероятностью 0,98 % при среднеквадратическом отклонении 500 рублей.
  2.  Поверить гипотезу о нормальном распределении на основе данных, приведенных в задаче № 1, используя различные критерии согласия. 
  3.  По выборке объема n=50 найден средний размер  диаметра валиков, изготовленных автоматом №1; по выборке объема т=50 найден средний размер  диаметра валиков, изготовленных автоматом №2. Генеральные дисперсии известны: D (X) = 1,750 мм2, D(Y) = 1,375 мм2. Требуется, при уровне значимости 0,05, проверить нулевую гипотезу H0: М(Х)=М(Y) при конкурирующей гипотезе М(Х)≠М(Y). Предполагается, что случайные величины X и Y распределены нормально и выборки независимы.
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      y

x

2

4

6

8

10

12

nx

1

3

3

6

4

3

9

8

20

7

10

20

15

45

10

20

2

1

23

13

4

2

6

ny

6

22

28

35

6

3

N=100

Вариант 26

  1.  Для проведения градостроительных работ, вся территория изучаемого района была разделена на 50 сравнительно одинаковых районов и подсчитано количество жителей, проживающих в этих районах. Результаты опроса приведены ниже.

100

788

973

146

851

746

589

379

907

675

346

791

596

392

189

567

498

200

380

679

189

496

598

381

981

863

816

953

367

547

682

109

987

538

861

549

520

482

479

1000

927

486

952

927

912

827

765

549

290

1002

Построить вариационный ряд, гистограмму, полигон, кумуляту, огиву. Найти характеристики ряда и проверить гипотезу о нормальном распределении ряда.

  1.  При взвешивании некоторого груза получены следующие результаты (в граммах): 120; 125; 130; 121; 122; 120; 128.  Определить среднеквадратическую ошибку и построить для нее доверительный интервал с надежностью 0,9.
  2.  Поверить гипотезу о нормальном распределении на основе данных ,приведенных в задаче № 1, используя различные критерии согласия.
  3.  Партия изделий принимается, если дисперсия контролируемого размера значимо не превышает 0,2. Исправленная выборочная дисперсия, найденная по выборке объема n = 121, оказалась равной =0,3. Можно ли принять партию при уровне значимости 0,05?
  4.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      x

y

10

15

20

25

30

ny

3

4

12

16

9

10

4

14

15

32

6

12

50

21

14

1

1

1

17

27

2

1

3

nx

4

22

50

9

14

1

N=100

Вариант 27

  1.  Хронометраж затрат времени на сборку узла машин у 50-ти слесарей дал следующие распределения (в мин.):

111

106

109

76

88

89

82

88

102

98

87

99

80

75

89

55

68

80

86

95

56

61

61

56

59

92

125

71

81

72

82

93

65

72

81

94

94

83

75

66

79

65

78

85

79

85

85

95

92

96

Построить вариационный ряд, гистограмму, полигон, кумуляту, огиву. Найти характеристики ряда и проверить гипотезу о нормальном распределении ряда.

  1.  При измерении углов транспортиром, точность которого имеет среднеквадратическую ошибку σ = 30/ получены следующие результаты:

200 30/

200 40/

200 42/

200 41/

200 43/

200 42/

200 40/

200 44/

200 42/

200 39/

Найти приближенное значение измеряемого угла и оценить точность угла.

  1.  Поверить гипотезу о нормальном распределении на основе данных, приведенных в задаче № 1, используя различные критерии согласия.
  2.  На двух аналитических весах, в одном и том же порядке, взвешены 10 проб химического вещества и получены следующие результаты взвешиваний (в мг):

Хi

25

30

28

50

20

40

32

36

42

38

Уi

28

31

26

52

24

36

33

35

45

40

При уровне значимости 0,01 установить, значимо или незначимо различаются результаты взвешиваний, в предположении, что они распределены нормально.
  1.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      y

5

10

15

20

25

30

2

2

3

1

4

10

4

8

1

2

1

3

15

6

10

8

1

7

9

35

8

5

3

4

12

10

9

7

6

6

28

24

15

11

6

18

26

100

Вариант 28

  1.  При сборе урожая, на 60-ти грядках было подсчитано количество выросших кочанов капусты на каждой грядке.

15

13

14

14

13

15

13

13

15

14

15

13

14

12

14

11

16

14

13

12

14

14

14

14

12

15

15

13

14

15

14

12

14

12

15

11

15

12

14

15

13

13

14

15

11

15

13

13

13

16

14

13

15

14

15

13

14

14

13

13

Построить вариационный ряд, гистограмму, полигон, огиву кумуляту. Найти характеристики ряда и проверить гипотезу о нормальном распределении.

  1.  При опросе 1200 молодых людей, оказалось, что только 400 из них смотрят телевизионные передачи посвященные социальной тематике. Построить доверительный интервал оценивающий среднюю величину молодых телезрителей, которых интересует социальная тематика.
  2.  Поверить гипотезу о нормальном распределении на основе данных ,приведенных в задаче № 1, используя различные критерии согласия.
  3.  Физическая подготовка 9 спортсменов была проверена при поступлении в спортивную школу, а затем после недели тренировок. Итоги проверки в баллах оказались следующими (в первой строке указано число баллов, полученных каждым спортсменом при поступлении в школу; во второй строке — после обучения):

Хi

76

71

57

49

70

69

26

65

59

Уi

81

85

52

52

70

63

33

83

62

Требуется при уровне значимости 0,05 установить, значимо или незначимо улучшилась физическая подготовка спортсменов, в предположении, что число баллов распределено нормально.

  1.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      xi

yi

5

10

15

20

25

30

nxi

14

3

3

11

17

17

10

11

21

20

3

10

13

23

2

20

8

30

26

1

3

6

10

29

3

6

9

nyi

6

15

10

23

16

30

N=100

Вариант 29

  1.  Темп роста курса акций 50-ти фирм по сравнению с предыдущим месяцем составил (%):

104

103,1

102

98

99

94

119

95,8

104,9

103,1

92

97,1

95,2

91,7

104

104,5

92,8

114,8

109,5

77,5

93,1

94,9

99,5

99,7

103

109

122,5

102

96

92

111

83

87,2

80,5

84,1

89

85,1

90,1

95,1

90,1

96

100,3

103

105,1

106,5

110,6

116,1

94,5

98,1

101,9

Построить вариационный ряд, гистограмму, полигон, кумуляту, огиву. Найти характеристики ряда и проверить гипотезу о нормальном распределении ряда.

  1.  На контрольных испытаниях 20-ти электроламп найдено, что средний срок службы равен 980 часов. Определить с надежностью 0,97 границы доверительного интервала для генеральной средней в предположении, что срок службы ламп распределен по нормальному закону с σ =18 час.
  2.  Поверить гипотезу о нормальном распределении на основе данных ,приведенных в задаче № 1, используя различные критерии согласия.
  3.  Химическая лаборатория произвела в одном и том же порядке анализ 8 проб двумя методами. Получены следующие результаты (в первой строке указано содержание некоторого вещества в процентах в каждой пробе, определенное первым методом; во второй строке — вторым методом):

Хi

15

20

16

22

24

14

18

20

Уi

15

22

14

25

29

16

20

24

Требуется при уровне значимости 0,05 установить, значимо или незначимо различаются средние результаты анализов, в предположении, что они распределены нормально.

  1.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.

      y

x

2

4

6

8

10

12

nx

1

3

3

6

4

3

9

8

20

7

10

20

15

45

10

20

2

1

23

13

4

2

6

ny

6

22

28

35

6

3

N=100

Вариант 30

  1.  Один писатель, любитель нецензурных выражений, издал очередную книжку. Цензура отметила, что количество нецензурных слов в выборке 50 страниц составило:

1

4

3

2

6

7

8

9

4

0

7

7

8

8

8

3

3

2

1

0

0

0

0

1

1

6

4

6

6

9

1

1

0

4

3

7

8

9

4

3

4

4

3

6

8

1

1

0

9

4

Построить вариационный ряд, гистограмму, диаграмму, огиву, найти характеристики ряда и проверить гипотезу о нормальном распределении.

  1.  На заводе произведено 30 измерений диаметров выпускаемых колец, используемых при ремонте автомашин. При этом их средняя величина составила 96мм. Предположив, что ошибка измерения распределена по нормальному закону, найти вероятность того, что, неизвестный параметр будет находиться в интервале (0,999 X; 1,001X) при σ =0,5мм.
  2.  Поверить гипотезу о нормальном распределении на основе данных ,приведенных в задаче № 1, используя различные критерии согласия.
  3.  Две лаборатории одним и тем же методом, в одном и том же порядке, определяли содержание углерода в 13 пробах нелегированной стали. Получены следующие результаты анализов (в первой строке указано содержание углерода в процентах в каждой пробе, полученное первой лабораторией; во второй строке — второй лабораторией):
  4.  

Хi

0,18

0,12

0,12

0,08

0,08

0,12

0,19

0,32

0,27

0,22

0,34

0,14

0,46

Уi

0,16

0,09

0,08

0,05

0,13

0,10

0,14

0,30

0,31

0,24

0,28

0,11

0,42

Требуется при уровне значимости 0,05 установить, значимо или незначимо различаются средние результаты анализа в предложении, что они распределены нормально.

  1.  Построить корреляционное поле связи между (Y) и (X). Сделать предварительный вывод о характере связи. Определить параметры уравнения парной регрессии и коэффициент корреляции.
  2.  

     x

y

2

6

10

14

18

ny

10

5

7

12

15

10

8

18

20

30

3

9

42

25

5

10

7

22

30

2

4

6

nx

5

17

43

15

20

N=100


Рекомендуемая литература

  1.  Бочаров П.П., Печинкин А.В. Теория вероятностей. Математическая статистика. – М.: «Гардарика»., 1998.
  2.  Воскобойников Ю.Е., Тимошенко Е.И. Математическая статистика. – Новосибирск, 2000.
  3.  Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: В.Ш.,2002.
  4.  Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: В.Ш., 1998.
  5.  Данко П.Е., Попов А.Г., Кожевникова Т.Я. Высшая математика в упражнениях и задачах. Ч. II. – М., 1969-1997.
  6.  Калинина В.Н., Панкин В.Ф. Математическая статистика. – М.: В.Ш., 1994. 
  7.  Карасев А.И. Теория вероятностей и математическая статистика. – М.: Статистика, 1970.
  8.  Никитина В.Ш. Математическая статистика для экономистов. – М.: «ИНФРА-М», 2001.
  9.  Лихолетов И.И., Мацкевич И.П. Руководство к решению задач по высшей математике, теории вероятностей и математической статистике. – Минск, 1976.
  10.  Сборник задач по общей теории статистики. – М.: Статистика, 1973.


Приложение 1

Таблица функции  (кривая вероятностей)

x

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0,0 

0,3989 

0,3989 

0,3989 

0,3988 

0,3986 

0,3984 

0,3982 

0,3980 

0,3977 

0,3973 

0,1

0,3970 

0,3965 

0,3961 

0,3956 

0,3951 

0,3945 

0,3939 

0,3932 

0,3925 

0,3918 

0,2 

0,3910 

0,3902 

0,3894 

0,3885 

0,3876 

0,3867 

0,3857 

0,3847 

0,3836 

0,3825 

0,3 

0,3814 

0,3802 

0,3790 

0,3778 

0,3765 

0,3752 

0,3739 

0,3725 

0,3712 

0,3697 

0,4 

0,3683 

0,3668 

0,3653 

0,3637 

0,3621 

0,3605 

0,3589 

0,3572 

0,3555 

0,3538 

0,5 

0,3521 

0,3503 

0,3485 

0,3467 

0,3448 

0,3429 

0,3410 

0,3391 

0,3372 

0,3352 

0,6 

0,3332 

0,3312 

0,3292 

0,3271 

0,3251 

0,3230 

0,3209 

0,3187 

0,3166 

0,3144 

0,7 

0,3123 

0,3101 

0,3079 

0,3056 

0,3034 

0,3011 

0,2989 

0,2966 

0,2943 

0,2920 

0,8 

0,2897 

0,2874 

0,2850 

0,2827 

0,2803 

0,2780 

0,2756 

0,2732 

0,2709 

0,2685 

0,9 

0,2661 

0,2637 

0,2613 

0,2589 

0,2565 

0,2541 

0,2516 

0,2492 

0,2468 

0,2444 

1,0 

0,2420 

0,2396 

0,2371 

0,2347 

0,2323 

0,2299 

0,2275 

0,2251 

0,2227 

0,2203 

1,1 

0,2179 

0,2155 

0,2131 

0,2107 

0,2083 

0,2059 

0,2036 

0,2012 

0,1989 

0,1965 

1,2 

0,1942 

0,1919 

0,1895 

0,1872 

0,1849 

0,1826 

0,1804 

0,1781 

0,1758 

0,1736 

1,3 

0,1714 

0,1691 

0,1669 

0,1647 

0,1626 

0,1604 

0,1582 

0,1561 

0,1539 

0,1518 

1,4 

0,1497 

0,1476 

0,1456 

0,1435 

0,1415 

0,1394 

0,1374 

0,1354 

0,1334 

0,1315 

1,5 

0,1295 

0,1276 

0,1257 

0,1238 

0,1219 

0,1200 

0,1182 

0,1163 

0,1145 

0,1127 

1,6 

0,1109 

0,1092 

0,1074 

0,1057 

0,1040 

0,1023 

0,1006 

0,0989 

0,0973 

0,0957 

1,7 

0,0940 

0,0925 

0,0909 

0,0893 

0,0878 

0,0863 

0,0848 

0,0833 

0,0818 

0,0804 

1,8 

0,0790 

0,0775 

0,0761 

0,0748 

0,0734 

0,0721 

0,0707 

0,0694 

0,0681 

0,0669 

1,9 

0,0656 

0,0644 

0,0632 

0,0620 

0,0608 

0,0596 

0,0584 

0,0573 

0,0562 

0,0551 

2,0 

0,0540 

0,0529 

0,0519 

0,0508 

0,0498 

0,0488 

0,0478 

0,0468 

0,0459 

0,0449 

2,1 

0,0440 

0,0431 

0,0422 

0,0413 

0,0404 

0,0396 

0,0387 

0,0379 

0,0371 

0,0363 

2,2 

0,0355 

0,0347 

0,0339 

0,0332 

0,0325 

0,0317 

0,0310 

0,0303 

0,0297 

0,0290 

2,3 

0,0283 

0,0277 

0,0270 

0,0264 

0,0258 

0,0252 

0,0246 

0,0241 

0,0235 

0,0229 

2,4 

0,0224 

0,0219 

0,0213 

0,0208 

0,0203 

0,0198 

0,0194 

0,0189 

0,0184 

0,0180 

2,5 

0,0175 

0,0171 

0,0167 

0,0163 

0,0158 

0,0154 

0,0151 

0,0147 

0,0143 

0,0139 

2,6 

0,0136 

0,0132 

0,0129 

0,0126 

0,0122 

0,0119 

0,0116 

0,0113 

0,0110 

0,0107 

2,7 

0,0104 

0,0101 

0,0099 

0,0096 

0,0093 

0,0091 

0,0088 

0,0086 

0,0084 

0,0081 

2,8 

0,0079 

0,0077 

0,0075 

0,0073 

0,0071 

0,0069 

0,0067 

0,0065 

0,0063 

0,0061 

2,9 

0,0060 

0,0058 

0,0056 

0,0055 

0,0053 

0,0051 

0,0050 

0,0048 

0,0047 

0,0046 

3,0 

0,0044 

0,0043 

0,0042 

0,0040 

0,0039 

0,0038 

0,0037 

0,0036 

0,0035 

0,0034 

3,1  

0,0033 

0,0032 

0,0031 

0,0030 

0,0029 

0,0028 

0,0027 

0,0026 

0,0025 

0,0025 

3,2 

0,0024 

0,0023 

0,0022 

0,0022 

0,0021 

0,0020 

0,0020 

0,0019 

0,0018 

0,0018 

3,3 

0,0017 

0,0017 

0,0016 

0,0016 

0,0015 

0,0015 

0,0014 

0,0014 

0,0013 

0,0013 

3,4 

0,0012 

0,0012 

0,0012 

0,0011 

0,0011 

0,0010 

0,0010 

0,0010 

0,0009 

0,0009 

3,5 

0,0009 

0,0008 

0,0008 

0,0008 

0,0008 

0,0007 

0,0007 

0,0007 

0,0007 

0,0006 

3,6 

0,0006 

0,0006 

0,0006 

0,0005 

0,0005 

0,0005 

0,0005 

0,0005 

0,0005 

0,0004 

3,7 

0,0004 

0,0004 

0,0004 

0,0004 

0,0004 

0,0004 

0,0003 

0,0003 

0,0003 

0,0003 

3,8 

0,0003 

0,0003 

0,0003 

0,0003 

0,0003 

0,0002 

0,0002 

0,0002 

0,0002 

0,0002 

3,9 

0,0002 

0,0002 

0,0002 

0,0002 

0,0002 

0,0002 

0,0002 

0,0002 

0,0001 

0,0001 

4,0 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

4,1 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

4,2 

0,0001 

0,0001 

0,0001 

0,0001 

0,0000 

0,0000 

0,0000 

0,0000 

0,0000 

0,0000 


Приложение 2

Таблица функции  (функция Лапласа)

x

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0,0 

0,00000 

0,00399 

0,00798 

0,01197 

0,01595 

0,01994 

0,02392 

0,02790 

0,03188 

0,03586 

0,1 

0,03983 

0,04380 

0,04776 

0,05172 

0,05567 

0,05962 

0,06356 

0,06749 

0,07142 

0,07535 

0,2 

0,07926 

0,08317 

0,08706 

0,09095 

0,09483 

0,09871 

0,10257 

0,10642 

0,11026 

0,11409 

0,3 

0,11791 

0,12172 

0,12552 

0,12930 

0,13307 

0,13683 

0,14058 

0,14431 

0,14803 

0,15173 

0,4 

0,15542 

0,15910 

0,16276 

0,16640 

0,17003 

0,17364 

0,17724 

0,18082 

0,18439 

0,18793 

0,5 

0,19146 

0,19497 

0,19847 

0,20194 

0,20540 

0,20884 

0,21226 

0,21566 

0,21904 

0,22240 

0,6 

0,22575 

0,22907 

0,23237 

0,23565 

0,23891 

0,24215 

0,24537 

0,24857 

0,25175 

0,25490 

0,7 

0,25804 

0,26115 

0,26424 

0,26730 

0,27035 

0,27337 

0,27637 

0,27935 

0,28230 

0,28524 

0,8 

0,28814 

0,29103 

0,29389 

0,29673 

0,29955 

0,30234 

0,30511 

0,30785 

0,31057 

0,31327 

0,9 

0,31594 

0,31859 

0,32121 

0,32381 

0,32639 

0,32894 

0,33147 

0,33398 

0,33646 

0,33891 

1,0 

0,34134 

0,34375 

0,34614 

0,34849 

0,35083 

0,35314 

0,35543 

0,35769 

0,35993 

0,36214 

1,0 

0,36433 

0,36650 

0,36864 

0,37076 

0,37286 

0,37493 

0,37698 

0,37900 

0,38100 

0,38298 

1,2 

0,38493 

0,38686 

0,38877 

0,39065 

0,39251 

0,39435 

0,39617 

0,39796 

0,39973 

0,40147 

1,3 

0,40320 

0,40490 

0,40658 

0,40824 

0,40988 

0,41149 

0,41308 

0,41466 

0,41621 

0,41774 

1,4 

0,41924 

0,42073 

0,42220 

0,42364 

0,42507 

0,42647 

0,42785 

0,42922 

0,43056 

0,43189 

1,5 

0,43319 

0,43448 

0,43574 

0,43699 

0,43822 

0,43943 

0,44062 

0,44179 

0,44295 

0,44408 

1,6 

0,44520 

0,44630 

0,44738 

0,44845 

0,44950 

0,45053 

0,45154 

0,45254 

0,45352 

0,45449 

1,7 

0,45543 

0,45637 

0,45728 

0,45818 

0,45907 

0,45994 

0,46080 

0,46164 

0,46246 

0,46327 

1,8 

0,46407 

0,46485 

0,46562 

0,46638 

0,46712 

0,46784 

0,46856 

0,46926 

0,46995 

0,47062 

1,9 

0,47128 

0,47193 

0,47257 

0,47320 

0,47381 

0,47441 

0,47500 

0,47558 

0,47615 

0,47670 

2,0 

0,47725 

0,47778 

0,47831 

0,47882 

0,47932 

0,47982 

0,48030 

0,48077 

0,48124 

0,48169 

2,1 

0,48214 

0,48257 

0,48300 

0,48341 

0,48382 

0,48422 

0,48461 

0,48500 

0,48537 

0,48574 

2,2 

0,48610 

0,48645 

0,48679 

0,48713 

0,48745 

0,48778 

0,48809 

0,48840 

0,48870 

0,48899 

2,3 

0,48928 

0,48956 

0,48983 

0,49010 

0,49036 

0,49061 

0,49086 

0,49111 

0,49134 

0,49158 

2,4 

0,49180 

0,49202 

0,49224 

0,49245 

0,49266 

0,49286 

0,49305 

0,49324 

0,49343 

0,49361 

2,5 

0,49379 

0,49396 

0,49413 

0,49430 

0,49446 

0,49461 

0,49477 

0,49492 

0,49506 

0,49520 

2,6 

0,49534 

0,49547 

0,49560 

0,49573 

0,49585 

0,49598 

0,49609 

0,49621 

0,49632 

0,49643 

2,7 

0,49653 

0,49664 

0,49674 

0,49683 

0,49693 

0,49702 

0,49711 

0,49720 

0,49728 

0,49736 

2,8 

0,49744 

0,49752 

0,49760 

0,49767 

0,49774 

0,49781 

0,49788 

0,49795 

0,49801 

0,49807 

2,9 

0,49813 

0,49819 

0,49825 

0,49831 

0,49836 

0,49841 

0,49846 

0,49851 

0,49856 

0,49861 

3,0 

0,49865 

0,49869 

0,49874 

0,49878 

0,49882 

0,49886 

0,49889 

0,49893 

0,49896 

0,49900 

3,1 

0,49903 

0,49906 

0,49910 

0,49913 

0,49916 

0,49918 

0,49921 

0,49924 

0,49926 

0,49929 

3,2 

0,49931 

0,49934 

0,49936 

0,49938 

0,49940 

0,49942 

0,49944 

0,49946 

0,49948 

0,49950 

3,3 

0,49952 

0,49953 

0,49955 

0,49957 

0,49958 

0,49960 

0,49961 

0,49962 

0,49964 

0,49965 

3,4 

0,49966 

0,49968 

0,49969 

0,49970 

0,49971 

0,49972 

0,49973 

0,49974 

0,49975 

0,49976 

3,5 

0,49977 

0,49978 

0,49978 

0,49979 

0,49980 

0,49981 

0,49981 

0,49982 

0,49983 

0,49983 

3,6 

0,49984 

0,49985 

0,49985 

0,49986 

0,49986 

0,49987 

0,49987 

0,49988 

0,49988 

0,49989 

3,7 

0,49989 

0,49990 

0,49990 

0,49990 

0,49991 

0,49991 

0,49992 

0,49992 

0,49992 

0,49992 

3,8 

0,49993 

0,49993 

0,49993 

0,49994 

0,49994 

0,49994 

0,49994 

0,49995 

0,49995 

0,49995 

3,9 

0,49995 

0,49995 

0,49996 

0,49996 

0,49996 

0,49996 

0,49996 

0,49996 

0,49997 

0,49997 

4,0 

0,499968 

4,5 

0,49997 

5,0 

0,4999997 


Приложение 3

Таблица значений функции Пуассона:

m 

λ

0,1 

0,2 

0,3 

0,4 

0,5 

0,6 

0,7 

0,8 

0,9 

0 

0,9048 

0,8187 

0,7408 

0,6703 

0,6065 

0,5488 

0,4966 

0,4493 

0,4066 

1 

0,0905 

0,1638 

0,2222 

0,2681 

0,3033 

0,3293 

0,3476 

0,3596 

0,3696 

2 

0,0045 

0,0164 

0,0333 

0,0536 

0,0758 

0,0988 

0,1217 

0,1438 

0,1647 

3 

0,0002 

0,0011 

0,0033 

0,0072 

0,0126 

0,0198 

0,0284 

0,0383 

0,0494 

4 

0,0000

0,0000

0,0002 

0,0007 

0,0016 

0,0030 

0,0050 

0,0077 

0,0111 

5 

0,0000

0,0000

0,0000

0,0001 

0,0002 

0,0004 

0,0007 

0,0012 

0,0020 

6 

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001 

0,0002 

0,0003 

m 

λ

1,0

2,0 

3,0 

4,0 

5,0 

6,0 

7,0 

8,0 

9,0 

0 

0,3679 

0,1353 

0,0498 

0,0183 

0,0067 

0,0025 

0,0009 

0,0003 

0,0001 

1 

0,3679 

0,2707 

0,1494 

0,0733 

0,0337 

0,0149 

0,0064 

0,0027 

0,0011 

2 

0,1839 

0,2707 

0,2240 

0,1465 

0,0842 

0,0446 

0,0223 

0,0107 

0,0055 

3 

0,0613 

0,1804 

0,2240 

0,1954 

0,1404 

0,0892 

0,0521 

0,0286 

0,0150 

4 

0,0153 

0,0902 

0,1680 

0,1954 

0,1755 

0,1339 

0,0912 

0,0572 

0,0337 

5 

0,0081 

0,0361 

0,1008 

0,1563 

0,1755 

0,1606 

0,1277 

0,0916 

0,0607 

m

λ

1,0 

2,0 

3,0 

4,0 

5,0 

6,0 

7,0 

8,0 

9,0 

6 

0,0005 

0,0120 

0,0504 

0,1042 

0,1462 

0,1606 

0,1490 

0,1221 

0,0911 

7 

0,0001 

0,0034 

0,0216 

0,0595 

0,1044 

0,1377 

0,1490 

0,1396 

0,1318 

8 

0,0000

0,0009 

0,0081 

0,0298 

0,0655 

0,1033 

0,1304 

0,1396 

0,1318 

9 

0,0000

0,0002 

0,0027 

0,0132 

0,0363 

0,0688 

0,1014 

0,1241 

0,0318 

10 

0,0000

0,0000

0,0008 

0,0053 

0,0181 

0,0413 

0,0710 

0,0993 

0,1180 

11 

0,0000

0,0000

0,0002 

0,0019 

0,0082 

0,0225 

0,0452 

0,0722 

0,0970 

12 

0,0000

0,0000

0,0001 

0,0006 

0,0034 

0,0113 

0,0264 

0,0481 

0,0728 

13 

0,0000

0,0000

0,0000

0,0002 

0,0013 

0,0052 

0,0142 

0,0296 

0,0504 

14 

0,0000

0,0000

0,0000

0,0001 

0,0005 

0,0022 

0,0071 

0,0169 

0,0324 

15 

0,0000

0,0000

0,0000

0,0000

0,0002 

0,0009 

0,0033 

0,0090 

0,0194 

16 

0,0000

0,0000

0,0000

0,0000

0,0000. 

0,0003 

0,0014 

0,0045 

0,0109 

17 

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001 

0,0006 

0,0021 

0,0058 

18 

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0002 

0,0009 

0,0029 

19 

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001 

0,0004 

0,0014 

20 

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0002 

0,0006 

21 

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001 

0,0003 

22 

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0001 


Приложение 4

Критические точки распределения 2

Число степеней свободы k 

Уровень значимости α

0,01 

0,025 

0,05 

0,95 

0,975 

0,99 

1 

6,6 

5,0 

3,8 

0,0039 

0,00098 

0,00016 

2 

9,2 

7,4 

6,0 

0,103 

0,051 

0,020 

3 

11,3 

9,4 

7,8 

0,352 

0,216 

0,115 

4 

13,3 

11,1 

9,5 

0,711 

0,484 

0,297 

5 

15,1 

12,8 

11,1 

1,15 

0,831 

0,554 

6 

16,8 

14,4 

12,6 

1,64 

1,24 

0,872 

7 

18,5 

16,0 

14,1 

2,17 

1,69 

1,24 

S 

20,1 

17,5 

15,5 

2,73 

2,18 

1,65 

fl 

21,7 

19,0 

16,9 

3,33 

2, 70 

2,09 

10 

23,2 

20,5 

18,3 

3,94 

3,25 

2,56 

11 

24,7 

21,9 

19,7 

4,57 

3,82 

3,05 

12 

26,2 

23,3 

21,0 

5,23 

4,40 

3,57 

13 

27,7 

24,7 

22,4 

5,89 

5,01 

4,11 

14 

29,1 

26,1 

23,7 

6,57 

5,63 

4,66 

15 

30,6 

27,5 

25,0 

7,26 

6,26 

5,23 

16 

32,0 

28,8 

26,3 

7,96 

6,91 

5,81 

17 

33,4 

30,2 

27,6 

8,67 

7,56 

6,41 

18 

34,8 

31,5 

28,9 

9,39 

8,23 

7,01 

19 

36,2 

32,9 

30,1 

10,1 

8,91 

7,63 

20 

37,6 

34,2 

31,4 

10,9 

9,59 

8,26 

21 

38,9 

35,5 

32,7 

11,6 

10,3 

8,90 

22 

40,3 

36,8 

33,9 

12,3 

11,0 

9,54 

23 

41,6 

38,1 

35,2 

13,1 

11,7 

10,2 

24 

43,0 

39,4 

36,4 

13,8 

12,4 

10,9 

25 

44,3 

40,6 

37,7 

14,6 

13,1 

11,5 

26 

45,6 

41,9 

38,9 

15,4 

13,8 

12,2 

27 

47,0 

43,2 

40,1 

16,2 

14,6 

12,9 

28 

48,3 

44,5 

41,3 

16,9 

15,3 

13,6 

29 

49,6 

45,7 

42,6 

17,7 

16,0 

14,3 

30 

50,9 

47,0 

43,8 

18,5 

16,8 

15,0 


Приложение 5

Критические точки распределения Стьюдента

Число степеней свободы k

Уровень значимости α
(двусторонняя критическая область)

0,10

0,05

0,02

0,01

0,002

0,001

1 

6,31

12,7

31,82

63,7

318,3

637,0

2 

2,92

4,30

6,97

9,92

22,33

31,6

3 

2,35

3,18

4,54

5,84

10,22

12,9

4 

2,13

2,78

3,75

4,00

7,17

8,61

5 

2,01

2,57

3,37

4,03

5,89

6,86

6 

1,94

2,45

3,14

3,71

5,21

5,96

7 

1,89

2,36

3,00

3,50

4,79

5,40

8 

1,86

2,31

2,90

3,36

4,50

5,04

9 

1,83

2,26

2,82

3,25

4,30

4,70

10 

1,81

2,23

2,76

3,17

4,14

4,59

11 

1,80

2,28

2,72

3,11

4,03

4,44

12 

1,78

2,18

2,68

3,05

3,93

4,32

13 

1,77

2,16

2,65

3,01

3,85

4,22

14 

1,76

2,14

2,62

2,98

3,79

4,14

15 

1,75

2,13

2,60

2,95

3,73

4,07

16 

1,75

2,12

2,58

2,92

3,69

4,01

17 

1,74

2,11

2,57

2,90

3,65

3,96

18 

1,73

2,10

2,55

2,88

3,61

3,92

19 

1,73

2,09

2,54

2,86

3,58

3,88

20 

1,73

2,09

2,53

2,85

3,55

3,85

21 

1,72

2,08

2,52

2,83

3,53

3,82

22 

1,72

2,07

2,51

2,82

3,51

3,79

23 

1,71

2,07

2,50

2,81

3,49

3,77

24 

1,71

2,06

2,49

2,80

3,47

3,74

25 

1,71

2,06

2,49

2,79

3,45

3,72

26 

1,71

2,06

2,48

2,78

3,44

3,71

27 

1,71

2,05

2,47

2,77

3,42

3,69

28 

1,70

2,05

2,46

2,76

3,40

3,66

29 

1,70

2,05

2,46

2,76

3,40

3,66

30 

1,70

2,04

2,46

2,75

3,39

3,65

40 

1,68

2,02

2,42

2,70

3,31

3,55

60 

1,07

2,00

2,39

2,66

3,23

3,46

120 

1,66

1,98

2,36

2,62

3,17

3,37


Приложение 6

Критические точки распределения Фишера-Снедекора

(k1 — число степеней свободы большей дисперсии,

k2 — число степеней свободы меньшей дисперсии)

Уровень значимости α= 0,01 

k 1

k 2 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

1 

4052 

4999 

5403 

5625 

5764 

5889 

5928 

5981 

6022 

6056 

6082 

6106 

2 

98,49 

99,01 

90,17 

99,25 

99,33 

99,30 

99,34 

99,36 

99,36 

99,40 

99,41 

99,42 

3 

34,12 

38,81 

29,46 

28,71 

28,24 

27,91 

27,67 

27,49 

27,34 

27,23 

27,13 

27,05 

4 

21,20 

18,00 

16,69 

15,98 

15,52 

15,21 

14,96 

14,80 

14,66 

14,54 

14,45 

14,37 

5 

16,26 

13,27 

12,06 

11,39 

10,97 

10,67 

10,45 

10,27 

10,15 

10,05 

9,96 

9,89 

6 

13,74 

10,92 

9,78 

9,15 

8,75 

8,47 

8,26 

8,10 

7,98 

7,87 

7,79 

7,72 

7 

12,25 

9,55 

8,45 

7,85 

7,46 

7,19 

7,00 

6,84 

6,71 

6,62 

6,54 

6,47 

8 

11,26 

8,65 

7,59 

7,01 

6,63 

6,37 

6,19 

6,03 

5,91 

5,82 

5,74 

5,67 

9 

10,56 

8,02 

6,99 

6,42 

6,06 

5,80 

5,62 

5,47 

5,35 

5,26 

5,18 

5,11 

10 

10,04 

7,56 

6,55 

5,99 

5,64 

5,39 

5,21 

5,06 

4,95 

4,85 

4,78 

4,71 

11 

9,86 

7,20 

6,22 

5,67 

5,32 

5,07 

4,88 

4,72 

4,63 

4,54 

4,46 

4,40 

12 

9,33 

6,93 

5,95 

5,41 

5,06 

4,82 

4,65 

4,50 

4,39 

4,30 

4,22 

4,16 

13 

9,07 

6,70 

5,74 

5,20 

4,86 

4,62 

4,44 

4,30 

4,19 

4,10 

4,02 

3,96 

14 

8,86 

6,51 

5,56 

5,03 

4,69 

4,46 

4,28 

4,14 

4,03 

3,94 

3,86 

3,80 

15 

8,68 

6,36 

5,42 

4,89 

4,56 

4,32 

4,14 

4,00 

3,89 

3,80 

3,73 

3,67 

16 

8,53 

6,23 

5,29 

4,77 

4,44 

4,20 

4,03 

3,89 

3,78 

3,69 

3,61 

3,55 

17 

8,40 

6,11 

5,18 

4,67 

4,44 

4,10 

3,93 

3,79 

3,68 

3,59 

3,52 

3,45 

Уровень значимости α = 0,05 

k 1

k 2  

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

1 

161 

200 

216 

225 

230 

234 

237 

239 

241 

242 

243 

244 

2 

18,51 

19,00 

19,16 

19,25 

19,30 

19,33 

19,36 

19,37 

19,38 

19,39 

19,40 

19,41 

3 

10,13 

9,55 

9,28 

9,12 

9,01 

8,94 

8,88 

8,84 

8,81 

8,78 

8,76 

8,74 

4 

7,71 

6,94 

6,59 

6,39 

6,26 

6,16 

6,09 

6,04 

6,00 

5,96 

5,93 

5,91 

5 

6,61 

5,79 

5,41 

5,19 

5,05 

4,95 

4,88 

4,82 

4,78 

4,74 

4,70 

4,68 

6 

5,99 

5,14 

4,76 

4,53 

4,39 

4,28 

4,21 

4,15 

4,10 

4,06 

4,03 

4,00 

7 

5,59 

4,74 

4,35 

4,12 

3,97 

3,87 

3,79 

3,73 

3,68 

3,63 

3,60 

3,57 

8 

5,32 

4,46 

4,07 

3,84 

3,69 

3,58 

3,50 

3,44 

3,39 

3,34 

3,31 

3,28 

9 

5,12 

4,26 

3,86 

3,63 

3,48 

3,37 

3,29 

3,23 

3,18 

3,13 

3,10 

3,07 

10 

4,96 

4,10 

3,71 

3,48 

3,33 

3,22 

3,14 

3,07 

3,02 

2,97 

2,94 

2,91 

11 

4,84 

3,98 

3,59 

3,36 

3,20 

3,09 

3,01 

2,95 

2,90 

2,86 

2,82 

2,79 

12 

4,75 

3,88 

3,49 

3,26 

3,11 

3,00 

2,92 

2,85 

2,80 

2,76 

2,72 

2,69 

13 

4,67 

3,80 

3,41 

3,18 

3,02 

2,92 

2,84 

2,77 

2,72 

2,67 

2,63 

2,60 

14 

4,60 

3,74 

3,34 

3,11 

2,96 

2,85 

2,77 

2,70 

2,65 

2,60 

2,56 

2,53 

15 

4,54 

3,68 

3,29 

3,06 

2,90 

2,79 

2,70 

2,64 

2,59 

2,55 

2,51 

2,48 

16 

4,49 

3,63 

3,24 

3,01 

2,85 

2,74 

2,66 

2,59 

2,54 

2,49 

2,45 

2,42 

17 

4,45 

3,59 

3,20 

2,96 

2,81 

2,70 

2,62 

2,55 

2,50 

2,45 

2,41 

2,38 


Кропачева Наталия Юрьевна

Петросян Гаянэ Артаковна

Элементы математической статистики

Учебное пособие по изучению курса высшей математики

Подп. к печати

Формат 6084  1/16

Физ. п.л.  

Уч. изд. л.  5,0

Тираж 100 экз.

Изд. №  001

РИО СПбГАСЭ, лицензия ЛР № 040849

Член Издательско-полиграфической Ассоциации ВУЗов СПб

СПб государственная академия сервиса и экономики

192171, г. Санкт-Петербург, ул. Седова, 55/1


4

8

12

3

7

X

ni

6

10

0

0,15

0,65

x

F(x)

1

10

14

2

6

10

0,75

1,7

x

ωi

2,5




1. Задание- выбрать верныеДоплаты бонусы и льготы относятся к
2. Задание 30 Предметная область ПО- Сбыт готовой продукции некоторые функции выполняемые со
3. тема фонетических звуки лексических слова синтаксических знаки препинания единиц средство общения люд
4. РЕКЛАМА И СВЯЗИ С ОБЩЕСТВЕННОСТЬЮ В ГОСУДАРСТВЕННЫХ ИНСТИТУТАХ И СТРУКТУРАХ 1
5. КОНТРОЛЬНАЯ РАБОТА 3 сдать в деканат 23 декабря Вариант 1 1
6. В.П.Аксёнов и прототипы его прозы 18
7. а Обязательства возникающие вследствие причинения вреда
8. прогресса ' когда и на каком этапе Россия догоняла Европу
9. серверное приложение для нахождения корней квадратного уравнения x^2 bx c 0 Приложение состоит из кл
10. Задание- Помочь детям развивать в себе привычку к здоровому и творческому образу жизни; Выработать умен
11.  Французский язык
12. 1 Организации и индивидуальные предприниматели применяющие упрощенную систему налогообложения далее на
13. тема уголовных наказаний
14. вариант Только тогда станешь человеком когда научишься видеть человека в другом А
15. Лабораторная работа 2 IDEF0 Создание функциональной модели продолжение
16. а материальных ценностей в организации для хранения
17. Столыпинская реформа
18. Контрольная работа- Інформаційні системи в маркетингу.html
19. госный банковский смешанный товарный Функции кредита- перераспределение д-с из 1 отрасли в дру
20. Востание древлян 964972 года Походы Святослава 988 год Массовое крещение киевлян