Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Проверка согласованности теоретического и статистического законов распределения с помощью критерия Пирсо

Работа добавлена на сайт samzan.net:


лаб 2. РЕШЕНИЕ СТАТИСТИЧЕСКИХ ЗАДАЧ СРЕДСТВАМИ MS EXCEL

2.1. Проверка согласованности теоретического и статистического законов распределения с помощью критерия Пирсона.

Произведено 500 измерений боковой ошибки наводки при стрельбе с самолета по наземной цели. Результаты измерений (в тысячных долях радиана) сведены в статистический ряд:

-4;-3

-3;-2

-2;-1

-1;0

0;1

1;2

2;3

3;4

6

25

72

133

120

88

46

10

Требуется:

  1.  Вычислить относительные частоты боковой ошибки .
  2.  Выровнять это распределение с помощью нормального закона
  3.  Построить сравнительные диаграммы для функций теоретического и экспериментального распределений .
  4.  Построить сравнительные диаграммы для функций теоретического и экспериментального распределений .
  5.  Проверить согласованность теоретического и статистического законов распределения по критерию Пирсона.

Указания:

Нормальный закон зависит от двух параметров . Подберем эти параметры так, чтобы сохранить первые два момента (математическое ожидание и дисперсию статистического распределения).

  1.  Вычислим сначала относительные частоты боковой ошибки по формуле.
  2.  Вычислим приближенно статистическое среднее  ошибки наводки, причем за представителя каждого разряда примем его середину.
  3.  Для определения дисперсии вычислим сначала второй начальный момент по формуле .
  4.  Вычислим приближенно дисперсию по формуле и среднеквадратичное отклонение по формуле .

Результаты расчетов сведем в таблицу.

Число опытов

500

Начало разряда

-4

-3

-2

-1

0

1

2

3

Конец разряда

-3

-2

-1

0

1

2

3

4

6

25

72

133

120

88

46

10

0,012

0,050

0,144

0,266

0,240

0,176

0,092

0,020

-3,500

-2,500

-1,500

-0,500

0,500

1,500

2,500

3,500

-0,042

-0,125

-0,216

-0,133

0,120

0,264

0,230

0,070

12,250

6,250

2,250

0,250

0,250

2,250

6,250

12,250

0,147

0,313

0,324

0,067

0,060

0,396

0,575

0,245

0,168

2,126

2,098

1,448

Выберем параметры  нормального закона так, чтобы выполнялись условия . Таким образом .

Построим теперь сравнительные диаграммы функций распределения и . Для этого вычислим значения законов теоретических  и экспериментальных распределений в границах разрядов и построим таблицу:

-4

-3

-2

-1

0

1

2

3

4

f*(x)

0,012

0,050

0,144

0,266

0,240

0,176

0,092

0,020

0,000

F*(x)

0,012

0,062

0,206

0,472

0,712

0,888

0,980

1,000

1,000

f(x)

0,004

0,025

0,090

0,199

0,274

0,234

0,124

0,041

0,008

F(x)

0,002

0,014

0,067

0,210

0,454

0,717

0,897

0,975

0,996

Для вычисления значений функции следует использовать встроенную функцию Excel НОРМРАСП(x;0,168;1,448;ИСТИНА), а для вычисления значений функции НОРМРАСП(x;0,168;1,448;ЛОЖЬ).

В качестве значений функции следует выбирать частоты , так как все длины разрядов равны единице. Значения функции  вычисляются по формуле .

Диаграммы с графиками этих функций должна иметь вид:


Проверим теперь правдоподобие гипотезы о виде закона распределения по критерию согласия Пирсона. Заданное статистическое распределение аппроксимировано теоретической кривой. 

Между нею и статистическим распределением всегда есть определенные расхождения. Эти расхождения являются следствием либо ограниченного числа наблюдений, либо неудачным выбором вида теоретической кривой.

Для оценки согласованности теоретического и статистического распределений вводят некоторую положительную величину , характеризующую степень расхождения теории и эксперимента.

Предполагается, что закон распределения известен, а в результате серии опытов выяснилось, что  приняла некоторое значение u. Очевидно чем меньше величина, u тем вероятнее гипотеза о согласованности и наоборот.

Поэтому количественной оценкой правдоподобия гипотезы служит вероятность события , а именно:

  •  если эта вероятность мала – , то гипотезу следует отвергнуть как мало правдоподобную (в этом случае вероятность события велика и расхождение u слишком велико);
  •  если эта вероятность – , следует признать, что экспериментальные данные не противоречат гипотезе (в этом случае вероятность события мала и расхождение u достаточно мало);
  •  если же эта вероятность значительна – , следует признать, что экспериментальные данные очень сильно согласуются с гипотезой и следует проверить, нет ли подтасовки данных.

Пирсон показал, что мера расхождения имеет вид или . Распределение  зависит от параметра r – числа степеней свободы распределения.

Число , где s число независимых условий (связей), наложенных на частоты . В нашем случае их три

Таким образом схема применения критерия Пирсона  имеет вид:

1) Определяется мера расхождения .

2) Определяется число степеней свободы r = ks

3) По r и  определяется вероятность .

Если эта вероятность мала, гипотеза отбрасывается как неправдоподобная. Если эта вероятность относительно велика, гипотезу можно признать не противоречащей опытным данным.

Проверим согласованность теоретического и статистического законов распределения:

  1.  Находим вероятности попадания в разряды по формуле
  2.  

  1.  Составляем сравнительную таблицу чисел попаданий в разряды  и соответствующих значений .
  2.  Вычисляем значение меры расхождения .
  3.  Определяем число степеней свободы: .
  4.  Результаты вычислений вносим в таблицу.

Число опытов

500

Начало разряда

-4

-3

-2

-1

0

1

2

3

Конец разряда

-3

-2

-1

0

1

2

3

4

Число попаданий

6

25

72

133

120

88

46

10

0,012

0,053

0,143

0,244

0,263

0,180

0,078

0,021

6,171

26,413

71,387

121,939

131,698

89,942

38,828

10,588

0,005

0,076

0,005

1,003

1,039

0,042

1,325

0,033

3,527

Вероятность

0,619

Гипотеза правдоподобна

Примечания: 

  1.  Функция – встроена в Excel под именем НОРМСТРАСП.
  2.  Для определения искомой вероятности следует воспользоваться встроенной функцией Excel ХИ2РАСП(; r).

Расчет вероятности по таблице дает  = 0,619. Эта вероятность малой не является; поэтому гипотезу о том, что величина  распределена по нормальному закону, можно считать правдоподобной.

2.2. Проверка согласованности теоретического и статистического законов распределения числа дорожно-транспортных происшествий.

Число дорожно-транспортных происшествий в городе на конец каждого месяца приведено в таблице

Месяц

июль

август

сентябрь

октябрь

ноябрь

декабрь

январь

февраль

март

апрель

май

июнь

ДТП

5

10

20

40

80

90

100

90

70

50

25

7

Требуется:

  1.  Вычислить относительные частоты .
  2.  Выровнять это распределение с помощью нормального закона

  1.  Построить сравнительные диаграммы для функций теоретического и экспериментального распределений .
  2.  Построить сравнительные диаграммы для функций теоретического и экспериментального распределений .
  3.  Проверить согласованность теоретического и статистического законов распределения по критерию Пирсона.

2.3. Построение математической модели штатного расписания.

Юридической конторе необходимо составить штатное расписание, определяющее, сколько сотрудников, на каких должностях и с каким окладом нужно принять на работу. Общий месячный фонд зарплаты составляет $10000.

Для нормальной работы фирмы нужно 5 – 7 секретарей, 10 – 12 помощников адвокатов, 8 – 10 адвокатов, 3 бухгалтера, 1 гл. бухгалтер, 1 администратор, 1 зам. директора, 1 директор. За основу берется оклад секретаря, а все остальные вычисляются исходя из него. Помощник адвоката получает в 2,5 раза больше секретаря. Адвокат получает в 5 раз больше секретаря. Бухгалтер получает на $30 больше чем помощник адвоката. Гл. бухгалтер получает в 4 раза больше секретаря. Администратор получает на $40 больше чем гл. бухгалтер. Зам. директора получает в 6 раз больше секретаря. Директор получает на $50 больше чем зам. директора.

  1.  Составьте таблицу и вычислите общий месячный фонд зарплаты при зарплате секретаря $100.
  2.  Подберите вручную зарплату секретаря или число сотрудников, чтобы общий месячный фонд зарплаты составлял $10000.
  3.  Для автоматизированного решения задачи воспользуйтесь стандартной программой-надстройкой Подбор параметра.
  4.  Составьте несколько вариантов штатного расписания (минимальное число сотрудников, максимальное число сотрудников, среднее число сотрудников).
  5.  Решите эти же варианты задачи с помощью программы-надстройки Поиск решения, которая позволяет изменять содержимое сразу нескольких ячеек. Выясните, можно ли решить задачу варьируя только число сотрудников и оставляя неизменным зарплату секретаря $100.


Образец таблицы

Штатное расписание юридической конторы

Должность

Оклад

Число
сотрудников

Сумма

1

Секретарь

100,00

6

600,00

2

Помощник адвоката

250,00

11

2 750,00

3

Адвокат

500,00

9

4 500,00

4

Бухгалтер

280,00

3

840,00

5

Главный бухгалтер

400,00

1

400,00

6

Администратор

440,00

1

440,00

7

Заместитель директора

600,00

1

600,00

8

Директор

650,00

1

650,00

 

Итого:

 

 

10 780,00

2.4. Прогнозирование роста числа правонарушений.

Статистические данные роста тяжких преступлений по России приведены в таблице:

Год

1970

1980

1990

1991

1992

1993

1994

1995

1996

1997

1998

ЧП

130789

139456

148321

148987

148951

148351

148311

147987

147564

147147

147787

Средствами Excel по этим экспериментальным значениям построить теоретическую функцию роста тяжких преступлений и вычислить прогнозируемую численность тяжких преступлений в России в начале 2004 года. Результаты расчета и сравнения теории и эксперимента представить в виде диаграммы Excel.

Указания:

Для решения задачи необходимо выбрать функцию, выражающую зависимость роста тяжких преступлений от времени. Вид этой функции зависит от многих факторов (экономики, политической обстановки, морали, права и т.д.), поэтому очевидно, что чем больше неопределенных параметров будет иметь математическая модель, , тем точнее будет соответствующий прогноз.

Ограничимся сначала случаем всего двух параметров и зададим вид этой функции формулой экспоненциальной регрессии . Коэффициенты регрессии  определяются на основе статистического анализа следующим образом:

  1.  В любых двух свободных ячейках (например, A1, B1) заносятся произвольные допустимые значения параметров .
  2.  К столбцу с экспериментальными значениями таблицы добавляется столбец вычисляемых по формуле  теоретических значений.
  3.  Составляется столбец отклонений теории от эксперимента.
  4.  Составляется столбец квадратов этих отклонений.
  5.  Квадраты отклонений суммируются в свободную нижнюю ячейку, в которой образуется величина, зависящая от .
  6.  Решение задачи выполняется с помощью программы-надстройки Поиск решения (В качестве целевой ячейки указывается ячейка с суммой квадратов отклонений, в качестве изменяемых ячеек – ячейки содержащие параметры , режим решения – минимальное значение).

Эта программа находит значения , при которых сумма квадратов отклонений будет наименьшей и вычисляет число тяжких правонарушений в 2004 году.

Примечание: В исходной таблице размещаются достаточно большие числа (годы и численность преступлений). Для того чтобы не оперировать большими числами следует добавить в таблицу столбец, в котором значения (Год) уменьшены в 100 раз, и столбцы, в которых значения (ЧП Эксперимент) и (ЧП Теория) уменьшены в 1000 раз. Пункты статистического анализа 2 – 6 следует проводить именно для этих столбцов и по ним же следует строить диаграмму. Диаграмму следует строить по столбцам (ЧП Эксперимент) и (ЧП Теория), а в качестве подписи оси абсцисс использовать столбец (Год).

Образец таблицы

a

b

10,765

0,478

Год

Год

100

ЧП
Данные

ЧП
Теория

ЧП
Данные

1000

ЧП
Теория

1000

Квадраты
отклонений

1970

19,70

130789

131739

130,789

131,739

0,903

1985

19,85

139456

141527

139,456

141,527

4,289

1990

19,90

148321

144949

148,321

144,949

11,372

1991

19,91

148987

145643

148,987

145,643

11,183

1992

19,92

148951

146340

148,951

146,340

6,815

1993

19,93

148351

147041

148,351

147,041

1,715

1994

19,94

148311

147746

148,311

147,746

0,320

1995

19,95

147987

148453

147,987

148,453

0,217

1996

19,96

147564

149164

147,564

149,164

2,560

1997

19,97

147147

149878

147,147

149,878

7,461

1998

19,98

147787

150596

147,787

150,596

7,892

2004

20,04

154976

154,976

Сумма

54,728

Сравнительная диаграмма теории и эксперимента должна иметь вид:

Кроме рассмотренной экспоненциальной регрессии удобно пользовать регрессией в виде многочлена. Решите самостоятельно Задание 2.11, используя при этом многочлен третьей степени вида: . Сравните на диаграмме результаты прогноза по двум регрессиям с экспериментом.

ЛИТЕРАТУРА

  1.  Информатика: Базовый курс / С.В. Симонович и др. - СПб.: Питер, 2001. – 640 с.: ил.
  2.  Информатика: Учебник / Под ред. Проф. Н.В. Макаровой. – М.: ФиС, 1997, 768 с.
  3.  Шафрин Ю. Информационные технологии. – М.: Лаборатория базовых знаний, 1999, Т. 1,2.
  4.  Андрияшин Х.А., Казанцев С.Я. и др. Информатика и математика для юристов// М. ЮНИТИ, 2002.
  5.  Гельман В.Я. Решение математических задач средствами Excel/ М:, Питер, 2003.

Роганов Е.А. Инфыорматик




1. I Финансовые показатели 1994 1995 1996 1997 Выручка от
2. правовом смысле и субъектом МП например колониальные страны
3. противоэпидемических мероприятий
4. Виробництво лікарських препаратів, що знаходяться під тиском
5. Состав и движение рабочей силы и эффективности использования рабочего времени Технико-экономический анализ
6. тема стратегічного забезпечення життєдіяльності держав призначена для виконання завдань спрямованих на за
7. Некоторые вопросы семейного права
8. Анализ производственно-хозяйственной деятельности ПРУП Транзистор
9. аутсорсинг означает получение услуг от сторонних организаций
10. . Хворий М 25р. доставлений в операційну для виконання операції з приводу варикозного розширення вен нижніх к
11. Личностные качества руководителя
12. Утверждаю Согласовано
13. Електронні видання
14. дача. Звучит так как будто это какоето шикарное место куда ездят отдыхать а на самом деле клочок земли п
15. Инструктажи по охране труда- виды сроки проведения
16.  Она формируется как следствие способности тел терять свою прочность при увеличении длительности действия н
17. Анализ деятельности ОАО АвтоВАЗ
18. Воспаление- причины, условия возникновения и проявления
19. КУРСОВОЙ ПРОЕКТ Формирование массива комплексной функции Пояснительная записка Выполни
20. Издательство Медицина 2006