У вас вопросы?
У нас ответы:) SamZan.net

Тюменский государственный нефтегазовый университет В

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 25.12.2024

В. И. Губин, В. Н. Осташков

Статистические методы

решения инженерных задач

Учебное пособие

Тюмень 2006

Министерство образования российской федерации

Государственное образовательное учреждение высшего профессионального образования

«Тюменский государственный нефтегазовый университет»

В. И. Губин, В. Н. Осташков

Статистические методы

решения инженерных задач

Учебное пособие

Рекомендовано

Учебно-Методическим Объединением высших

Учебных заведений Российской Федерации

УДК

ББК

В. И. Губин, В. Н. Осташков. Статистические методы решения инженерных задач. Учебн. Пособие для студентов всех форм обучения технических вузов. – Тюмень: ТюмГНГУ. – 2006. – стр.

Учебное пособие состоит из трех частей: теоретической, методической и практической. В первой части содержится теоретический материал справочного характера по разделу «Математическая статистика» курса математики. Во второй части приведены образцы примеров выполнения лабораторных работ по первичной обработке результатов экспериментальных данных из различных сфер производственной деятельности, проверке статистических гипотез, построению однофакторных и многофакторных моделей. Третья часть включает варианты заданий для выполнения шести лабораторных работ.

По содержанию данное пособие соответствует требованиям ГОС ВПО для специальностей технических вузов. Может быть использовано преподавателями при организации и проведении лабораторных занятий по математической статистике во всех формах обучения.

Рецензенты:

© В. И. Губин, В. Н. Осташков, 2006

© Тюменский государственный нефтегазовый университет, 2006

ПРЕДИСЛОВИЕ

При составлении пособия «Статистические методы решения инженерных задач» приняты во внимание рекомендации, изложенные в документе «Стандарты и Процедуры аккредитации инженерных программ, разработанные в рамках проекта EURACE», предусматривающие двухуровневую подготовку специалистов, формирование у студентов знаний инженерных дисциплин, математики, навыков анализа производственных процессов, выборке решений и способности применения их в практической деятельности. Целью проекта EURACE является содействие созданию Европейской Зоны Высшего образования (Болонский процесс), в котором участвует и Россия.

Пособие составлено на основе:

  1.  реализации в учебном процессе межпредметных связей математики с инженерными дисциплинами;
  2.  применения математического моделирования для анализа производственных процессов и их прогнозирования;
  3.  формирования знаний основных сведений математической статистики и умение использовать статистические методы реальных процессов для решения инженерных задач различной степени сложности.

Пособие содержит практикум по следующим разделам математической статистики:

  1.  построение вариационных рядов статистических распределений и расчет числовых характеристик;
  2.  построение эмпирических, теоретических кривых распределений и проверка согласованности эмпирического распределения с нормальным теоретическим, применяя различные критерии согласия;
  3.  построение однофакторных математических моделей линейной и нелинейной регрессии;
  4.  построение многофакторных линейных регрессионных моделей.

Материал пособия изложен в доступной форме. Сущность доступности заключается в том, что по каждому разделу приводится описание теоретического материала, показывается его практическое применение в лабораторных работах и формируются навыки в самостоятельном решении приведенных в пособии задач.

Пособие рекомендуется для студентов всех форм обучения технических вузов.

§1. Первичная обработка результатов наблюдений

В первичной обработке результатов наблюдений при анализе показателей работы разных отраслей производственной сферы (добыча нефти и газа, ремонт скважин, машиностроение, строительная индустрия и т.д.) и их прогнозировании используют методы математической статистики, которые позволяют установить закономерности производственных результатов с требуемой точностью, надежностью и минимальных материальных, трудовых затратах и оценить их основные свойства.

Решение этих вопросов методами математической статистики осуществляют следующим образом.

Пусть Х — некоторый производственный показатель (признак), а , , . . .,  — результаты независимых наблюдений над ними. Если количество наблюдений n невелико, наблюдения либо ранжируют, либо сводит в табл. 1, где каждому значению  ставят в соответствие частоту  появления этого значения в данной выборке.

Таблица 1

Варианты, 

. . .

частоты, 

. . .

Здесь , где n объем выборки.

Если количество наблюдений n достаточно большое (), то результаты наблюдений сводят в интервальный вариационный ряд, который формируется следующим образом.

Вычисляют размах варьирования R признака Х, как разность между наибольшим  и наименьшим  значениями признака, то есть . Размах R варьирования признака Х делится на k разных частей и таким образом определяется число столбцов (интервалов) в таблице. Величину k частичного интервала выбирают, пользуясь следующими правилами:

,   ,   .

При небольшом объеме n выборки число интервалов принимают равным от 6 до 10. Длина h каждого частичного интервала определяется по формуле

.

Величину h обычно округляют до некоторого значения d. Например, если результаты  признака Х — целые числа, то h округляют до целого значения, если  содержат десятичные знаки, то h округляют до значения d, содержащего такое же число десятичных знаков. Затем подсчитывается частота , с которой попадают значения  признака Х в i-ый интервал. Значение , которое попадает на границу интервала относятся к какому-либо определенному концу, например, к левому. За начало  первого интервала рекомендуется брать величину . Конец  последнего интервала находят по формуле . Сформированный интервальный вариационный ряд записывают в виде табл. 2.

Таблица 2

Варианты-интервалы,

(; )

(; )

(; )

 . . .

(; )

частоты,

. . .

Интервальный вариационный ряд изображают геометрически в виде гистограммы частот  или гистограммы относительных частот .

Гистограммой называется ступенчатая фигура, для построения которой по оси  откладывают отрезки, изображающие частичные интервалы (; ) варьирования признака Х, и на этих отрезках, как на основаниях, строят прямоугольники с высотами, равными частотам или частостям соответствующих интервалов.

Для расчета статистик (выборочной средней, выборочной дисперсии, асимметрии и эксцесса) переходят от интервального вариационного ряда к дискретному. В качестве вариантов  этого ряда берут середины интервалов (; ). Дискретный вариационный ряд записывается в виде табл. 3 или табл. 4.

Таблица 3

Варианты, хi

х1

х2

. . .

хk

частоты, mi

m1

m2

. . .

mk

Здесь , где n — объем  выборки.

Таблица 4

Варианты, 

. . .

относительные частоты, 

. . .

Здесь .

Графически дискретный вариационный ряд изображают в виде полигона частот или относительных частот. В системе координат 0ху строят точки с координатами (; ) или (; ), где  — значение i-го варианта, а  () — соответствующие частоты (частости). Ломаную линию, соединяющую построенные точки, называют полигоном.

Вариационные ряды графически можно изобразить в виде кумулятивной кривой (кривой сумм — кумуляты). При построении кумуляты дискретного вариационного ряда на оси абсцисс откладывают варианты , а по оси ординат соответствующие им накопленные частоты . Соединяя точки с координатами (; ) отрезками прямых, получаем ломаную (кривую), которую называют кумулятой. Для получения накопительных частот и дальнейшего построения точек (; ) составляется расчетная табл. 5.

Таблица 5

Варианты, 

. . .

относительные частоты, 

. . .

накопительные

относительные

частоты,

. . .

При построении кумуляты интервального вариационного ряда левому концу первого интервала соответствует частота, равная нулю, а правому — вся частота этого интервала. Правому концу второго интервала соответствует накопительная частота первых двух интервалов, то есть сумма частот этих интервалов и т. д. Правая граница последнего интервала равна сумме всех частот, то есть объему n выборки.

Для характеристики свойств статистического распределения в математической статистике вводится понятие эмпирической функции распределения.

Эмпирической функцией распределения или функцией распределения называется функция , определяемая равенством

,            (1)

где n — объем выборки,  — число вариантов , меньших х. Аналогом этой функции в теории вероятностей является интегральная функция распределения . Функция  отличается от функции  тем, что вместо вероятности P() берется относительная частота .

Чтобы найти значение функции  приданном значении x, надо подсчитать число вариантов, которые принял признак Х меньше, чем х и разделить на объем выборки.

Эмпирическая функция  служит для оценки теоретической функции распределения генеральной совокупности. При больших объемах n выборки согласно знака больших чисел функции  сходится по вероятности к теоретической функции  признака Х.

Значения эмпирической функции  принадлежат промежутку . Графиком функции  служит кусочно-постоянная кривая (рис. 1).

Эта кривая имеет скачки в точках, которые соответствуют вариантам . При обработке результатов эксперимента, например, результатов механических испытаний, целесообразно вместо ступенчатой кривой вычерчивать плавную кривую (на рис. 1 это штриховая линия), которая проходит через точки, расположенные посередине вертикальных частей ступенчатой кривой. Абсциссами этих точек служат значения механической характеристики , а ординатами — эмпирическая функция , характеризующая оценку вероятности события .

§2. Расчет выборочных характеристик статистического

распределения

Рассмотрим выборку объема n со значениями признака Х: , , . . ., . Для характеристики важнейших свойств статистического распределения используют средние показатели, называемые выборочными числовыми характеристиками. Если значения  признака Х не сгруппированы в вариационные ряды (табл. 2, 3, 4) и объем выборки n небольшой, то несмещенные оценки для неизвестных математического ожидания а и дисперсии  находят по формулам:

          (2)

для математического ожидания и

       (3)

для дисперсии.

Если результаты наблюдений сгруппированы в дискретный вариационный ряд (табл. 3), то те же оценки находятся по формулам:

, ,            4)

,        (5)

По формуле (5) вычисляют  в случае, если объем выборки . Если же , то вычисляют исправленную дисперсию  по формуле:

       (6)

для простой выборки или

         (7)

для взвешенной выборки.

Выборочное среднее квадратичное отклонение находят по формулам

или           (8)

при различных объемах выборки.

Для анализа вариационных рядов вычисляют такие статистики, как моду и медиану.

Модой  называют варианту, которая имеет наибольшую частоту. Например, для вариационного ряда

xi

4

9

14

19

mi

3

7

2

5

    =9.

Медианой  называют варианту, которая делит вариационный ряд на равные части.

При нечетном объеме выборки  (нечетном числе столбцов в дискретном вариационном ряде) медиана равна серединному члену вариационного ряда. Например, для вариационного ряда

xi

3

5

8

12

15

mi

6

2

4

5

8

   =8.

При четном объеме выборки  (четном числе столбцов в дискретном вариационном ряде) медиана находится по формуле

    (9)

Здесь  — варианта, которая находится слева от середины вариационного ряда, а  — слева от нее. Например, для вариационного ряда

xi

2

5

7

10

12

14

mi

3

4

8

2

3

6

.

Для вычисления выборочной средней (), выборочной дисперсии (), асимметрии () и эксцесса () при достаточно большом объеме выборки () применяют метод произведений. Вводят условные варианты ui, которые вычисляют по формуле

,          (*)

где , h — шаг (длина интервала).

Составляется расчетная табл. 6.

Таблица 6

контрольный

столбец

строка

сумм:

Контроль вычислений ведут по формуле

.   (10)

Пользуясь табл. 6, вычисляют условные начальные моменты по формулам

          (11)

          (12)

          (13)

          (14)

Тогда выборочную среднюю находят по формуле

         (15)

Выборочную дисперсию находят по формуле

   (16)

Выборочное среднее квадратическое отклонение находят по формуле

    (17)

Асимметрию и эксцесс находят по формулам

      (18)

, где          (19)

—      (20)

условный центральный момент третьего порядка, а

—   (21)

условный центральный момент четвертого порядка.

Для характеристики колеблемости признака Х используют относительный показатель — коэффициент вариации V, который вычисляют по формуле

      (22)

§3. Интервальные (доверительные) оценки параметров

распределения

Выборочные характеристики   и  являюстя надежными количественными оценками генеральных характеристик  и  только при большом объеме выборки. При ограниченных объемах выборки возникает необходимость указать степень точности и надежности оценок генеральных характеристик.

При решении практических задач, связанных со статистическим анализом характеристик изучаемого признака Х, например, механических свойств конструкционных материалов, несущей способности элементов конструкций, пропускной способности нефтегазопроводов, себестоимости единицы производимой продукции и т. д., как правило, значения генеральной дисперсии и  математического ожидания неизвестны.

Для оценки генеральной средней, то есть  и генерального среднеквадратического отклонения σ по выборочной средней  и выборочному среднеквадратическому отклонению S находят доверительные интервалы по формулам

,         (23)

где  находят по таблице распределения Стьюдента по заданным n и γ (γ – уровень доверия или надежность, которая задается заранее).

Для генерального среднеквадратического отклонения доверительные интервалы находят по формулам

, при ()       (24)

или

, при ()    (25)

величину q находят по таблице значений  (приложение 4 учебника по теории вероятностей и математической статистике) по заданным n и γ.

Контрольные вопросы.

  1.  Дать определение статистической совокупности.
  2.  Что понимается под генеральной совокупностью?
  3.  Дать определение выборочной совокупности.
  4.  Дать определение вариационного ряда.
  5.  Сформулировать алгоритм построения непрерывного вариационного ряда.
  6.  Рассказать о графическом изображении дискретного и непрерывного вариационных рядов.
  7.  Дать определение эмпирической функции распределения, сформулировать ее свойства и рассказать о ее назначении.
  8.  По каким формулам находятся выборочные средние статистического распределения?
  9.  Дать определение выборочной дисперсии и рассказать о ее назначении.
  10.  Записать формулы для вычисления дисперсии для простой и взвешенной выборки.
  11.  Записать формулы для вычисления исправленной дисперсии и рассказать для чего она вводится.
  12.  Что называется модой, медианой вариационного ряда?
  13.  Рассказать о нахождении медианы при различном объеме выборки.
  14.  Сформулировать алгоритм вычисления  и  по методу произведений.
  15.  Дать определения асимметрии и эксцесса статистического распределения и рассказать о их назначении.
  16.  Записать доверительные интервалы для оценки генеральных математического ожидания и среднего квадратического отклонения.

Лабораторная работа №1

Построение вариационных рядов.

Расчет числовых характеристик.

Цель работы: овладение студентом способами построения рядов распределения и методами расчета числовых характеристик.

Содержание работы: на основе совокупности данных опыта выполнить следующее:

  1.  Построить ряды распределения (интервальный и дискретный вариационные ряды). Изобразить их графики.
  2.  Построить график накопительных частот — кумуляту.
  3.  Составить эмпирическую функцию распределения и изобразить ее графически.
  4.  Вычислить моду, медиану, выборочную среднюю, выборочную дисперсию, выборочное среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс.
  5.  Построить доверительные интервалы для истинного значения измеряемой величины и среднего квадратического отклонения генеральной совокупности.
  6.  Раскрыть смысловую сторону каждой характеристики.

Методические указания по выполнению работы.

  1.    Построить интервальный вариационный ряд. Для этого найти:

а) Размах варьирования признака по формуле , где  — наименьшая варианта,  — наибольшая варианта в данной выборочной совокупности;

б) число интервалов вариационного ряда, пользуясь одним из приведенных ниже соотношений:

, , , где n — объем выборки;

в) длину частичных интервалов по формуле  и по необходимости округлить это значение до некоторого числа.

Записать полученный вариационный ряд, заполнив табл. 1:

Варианты-интервалы,

(; )

(; )

(; )

 . . .

(; )

частоты,

. . .

  1.  Построить дискретный вариационный ряд, взяв в качестве вариантов середины вариантов-интервалов непрерывного вариационного ряда, а в качестве частот частоты непрерывного вариационного ряда.
  2.  Изобразить графически интервальный и дискретный вариационные ряды (построить гистограмму и полигон частот).
  3.  Построить график накопленных частот — кумуляту. Кумулята — это ломаная линия, проходящая через точки с координатами  и соответствующими накопленными частотами. Предварительно составить табл. 2:

Таблица 2

Варианты, 

. . .

относительные частоты, 

. . .

накопительные

относительные

частоты,

. . .

  1.  Найти эмпирическую функцию распределения и изобразить ее графически.
  2.  Найти моду  и медиану .
  3.  Для вычисления остальных статистик воспользоваться методом произведений. Ввести условные варианты , где , h — шаг (длина интервала). Составить расчетную табл. 3:

Таблица 3

контрольный

столбец

строка

сумм:

Контроль вычислений произвести по формуле

.

  1.  Пользуясь табл. 3, вычислить начальные моменты по формулам: , , , .
  2.  Найти выборочную среднюю по формуле .
  3.  Найти выборочную дисперсию по формуле .
  4.  Найти выборочное среднее квадратическое отклонение по формуле .
  5.  Найти коэффициент вариации по формуле .
  6.  Вычислить асимметрию эксцесс по формулам

, .

Предварительно найти центральные моменты по формулам

, .

  1.  Доверительные интервалы для «а» и «σ» найти по формулам

, где .

найти по приложению № 3 учебника по теории вероятностей и математической статистике.

, где  и

, при .

q найти по приложению № 4 учебника.

  1.  Раскрыть смысловую сторону каждой характеристики.

Выполнение лабораторной работы № 1 рассмотрено на задаче, в основу которой положен компетентностный подход по формированию общих и профессиональных навыков у студентов.

Задача.

Имеются данные об обводненности нефти из насосных скважин (в ):

61,2

61,4

60,2

61,2

61,3

60,4

61,4

60,8

61,2

60,6

61,6

60,2

61,3

60,3

60,7

60,9

61,2

60,5

61,0

61,4

61,1

60,9

61,5

61,4

60,6

61,2

60,1

61,3

61,1

61,3

60,3

61,3

60,6

61,7

60,6

61,2

60,8

61,3

61,0

61,2

60,5

61,4

60,7

61,3

60,9

61,2

61,1

61,3

60,9

61,4

60,7

61,2

60,3

61,1

61,0

61,5

61,3

61,9

61,4

61,3

61,6

61,0

61,7

61,1

60,9

61,5

61,6

61,4

61,5

61,2

61,6

61,3

61,8

61,1

61,7

60,9

62,2

61,1

62,1

61,0

61,5

61,7

62,3

62,3

61,7

62,9

62,5

62,8

62,6

61,5

62,1

62,6

61,6

62,5

62,4

62,3

62,1

62,3

62,2

62,1

Выполнение работы

Обозначим через Х обводненность нефти из рассматриваемых насосных скважин.

1. По данным выборки строим интервальный вариационный ряд. Находим размах варьирования признака Х по формуле  . Просматривая исходные данные, находим , . Тогда . Определяем число интервалов (число столбцов в таблице) вариационного ряда. Пусть . Длину каждого частичного интервала определяем по формуле . Так как исходные данные мало отличаются друг от друга и содержат один десятичный знак, то величину h округляем до одного десятичного знака, то есть берем .

Подсчитываем число вариантов, попадающих в каждый интервал, по данным выборки. Значение , попадающее на границу интервала, относим к левому концу. За начало  первого интервала берем величину . Конец  последнего интервала находим по формуле . Сформированный интервальный вариационный ряд записываем в виде табл. 1.

Таблица 7

Варианты-

интервалы

60- 60,3

60,3- 60,6

60,6- 60,9

60,9- 61,2

61,2- 61,5

61,5- 61,8

61,8- 62,1

62,1- 62,4

62,4- 62,7

62,7- 63,0

Частоты, 

3

6

9

18

29

16

2

11

5

1

Контроль:  и объем выборки .

Записываем дискретный вариационный ряд (табл. 2). В качестве вариантов  берем середины интервалов интервального вариационного ряда.

Таблица 8

варианты,  

60,15

60,45

60,75

61,05

61,35

61,65

61,95

62,25

62,55

62,85

частоты,

3

6

9

18

29

16

2

11

5

1

Изображаем интервальный и дискретный вариационные ряды графически (строим гистограмму и полигон частот в одной системе координат).

Строим график накопленных частот — кумуляту (рис. 3). Предварительно составляем расчетную табл. 3.

Таблица 9

Варианты,

60,15

60,45

60,75

61,05

61,35

61,65

61,95

62,25

62,55

62,85

относительные частоты, 

0,602

0,604

0,608

0,611

0,614

0,617

0,620

0,623

0,626

0,629

накопительные

относительные

частоты,

0,6

1,204

1,812

2,423

3,037

3,654

4,274

4,897

5,523

6,152

Находим эмпирическую функцию распределения. Воспользуемся формулой

, где n — объем выборки,  — накопленные частоты.

При   — по свойству эмпирической функции распределения.

При  .

При  .

При  .

При  .

При  .

При  .

При  .

При  .

При  .

При   — по свойству эмпирической функции распределения.

Записываем полученную эмпирическую функцию в виде:

График функции  имеет вид (рис.4):

Соединив середины вертикальных частей ступенчатой кусочно-постоянной кривой, являющейся графиком функции , получаем плавную кривую (на рис. 4 это штриховая линия). Абсциссами точек этой кривой служат значения обводненности нефти, добываемой насосным способом из скважин, а ординатами — значения эмпирической функции распределения, характеризующей оценку вероятности события , то есть вероятности попадания возможных значений обводненности нефти на промежуток .

Для нахождения числовых характеристик признака Х — обводненности нефти (несмещенных оценок для , , а также , , , ) воспользуемся табл. 8.

Так как варианта  в табл. 8 встречается с наибольшей частотой , то , то есть это значение обводнености нефти, встречающееся в данной выборке с наибольшей частотой.

Находим . Так как табл. 8 содержит четное число столбцов, то . Это значение обводненности нефти, которое делит данные выборки признака Х на равные части.

Для нахождения остальных статистик, характеризующих обводненность нефти, воспользуемся методом произведений. Введем условные варианты .

У нас , .

Составим расчетную табл. 10.

Таблица 10

контрольный

столбец

60,15

3

-4

-12

48

-192

768

27

60,45

6

-3

-18

54

-162

486

24

60,75

9

-2

-18

36

-72

144

9

61,05

18

-1

-18

18

-18

18

0

61,35

29

0

0

0

0

0

29

61,65

16

1

16

16

16

16

64

61,95

2

2

4

8

16

32

18

62,25

11

3

33

99

297

891

176

62,55

5

4

20

80

320

1280

125

62,85

1

5

5

25

125

625

36

100

12

384

330

4260

508

Контроль вычислений проводим по формуле

.

У нас , .

Следовательно, вычисления проведены верно.

Пользуясь результатами последней строки табл. 10, находим условные начальные моменты.

.

.

.

.

Находим выборочную среднюю

.

характеризует среднюю обводненность нефти из насосных скважин в данной выборке, составляющую 61,38%.

Находим выборочную дисперсию

.

Выборочное среднее квадратическое отклонение .

Величина  характеризует степень рассеяния значений обводненности нефти относительно средней обводненности. Для определения колеблемости значений обводненности нефти в процентном отношении вычисляем коэффициент вариации:

.

Величина коэффициента вариации мала (составляет 1%), что означает тесную сгруппированность значений обводненности нефти около центра рассеяния, то есть около средней обводненности нефти.

Для предварительной оценки отклонения значений обводненности нефти от нормального распределения вычисляем асимметрию и эксцесс. Сначала находим центральные моменты третьего и четвертого порядков по формулам:

.

.

Тогда

.

.

Значения  и  мало отличаются от нуля. Поэтому можно предположить близость данной выборки, характеризующей обводненность нефти, к нормальному распределению. Эта гипотеза будет проверяться в лабораторной работе №2.

Произведем оценку генеральной средней  и генерального среднеквадратического отклонения  по выборочным статистикам  и , используя теорию доверительных интервалов для нормального распределения.

Доверительный интервал для истинного значения обводненности нефти находим с надежностью  по формуле

.

По таблице приложения № при  и  находим . Записываем доверительный интервал

или .

Таким образом, средняя обводненность нефти из насосных станций (в %) по данным выборки должна находиться в промежутке .

Запишем доверительный интервал для генерального среднеквадратического отклонения . При заданных  и  по таблице приложения № находим . Так как , то доверительный интервал записываем в виде

или

или

следовательно, отклонения истинных значений обводненности нефти из насосных станций не должны выходить за пределы промежутка .

Варианты заданий по лабораторной работе № 1

Вариант №1

Имеются данные о производительности труда (количество деталей в смену):

73

77

78

88

76

78

86

76

77

75

90

89

84

79

87

83

78

73

84

86

85

74

78

74

87

82

88

86

75

79

71

88

83

76

76

80

73

89

79

90

75

75

91

83

82

81

77

91

93

92

85

84

87

81

83

80

82

76

81

90

78

91

95

77

Вариант №2

Имеются данные о пропускной способности 50 участков нефтепровода (м3/сут.):

19,5

19,5

19,6

18,8

20,0

20,0

20,4

19,6

19,9

19,9

20,0

20,3

20,2

19,6

20,1

20,3

20,5

20,4

19,8

19,7

19,8

20,0

20,1

19,7

20,3

20,2

20,1

20,3

20,1

20,2

20,4

20,5

20,3

20,5

20,2

20,5

20,7

21,0

20,4

20,3

20,2

20,4

20,6

21,0

20,6

20,7

20,8

20,7

20,8

21,1

Вариант №3

Имеются данные о суточной добыче нефти в одном из районов страны (в тоннах):

85

76

80

84

88

89

91

88

84

85

75

82

86

89

88

84

90

89

85

91

87

81

78

85

91

89

87

74

81

87

90

88

86

76

84

88

77

82

83

84

74

80

84

91

93

90

88

87

77

83

89

89

91

92

88

94

90

88

81

83

89

94

96

88

95

99

86

78

81

86

90

92

93

90

83

79

86

90

79

82

87

85

91

97

88

85

87

90

89

95

89

90

98

93

84

88

96

92

88

95

Вариант №4

Имеются данные о вводе в эксплуатацию новых газовых скважин за год по различным газодобывающим районам страны:

52

33

10

22

28

34

39

29

21

27

31

12

28

40

46

51

44

32

16

11

29

31

38

44

31

24

9

17

32

41

47

31

42

15

21

29

50

55

37

19

57

32

7

28

23

20

45

18

29

25

Вариант №5

Имеются энергетические затраты на 1 метр проходки при эксплуатационном бурении нефтяных скважин в различных нефтеносных районах страны (руб.):

14

13

18

15

12

13

14

12

13

16

16

15

12

13

13

14

16

18

13

15

14

15

14

13

15

12

13

12

14

16

12

13

15

15

15

13

14

15

18

15

12

15

13

13

15

15

15

17

17

Вариант №6

Имеются данные о суточном дебите газа в наблюдаемой скважине (м3/сут.):

30

19

21

28

27

29

31

24

25

28

28

32

34

26

24

19

23

27

30

29

25

18

18

24

28

31

33

18

21

26

30

32

34

29

26

23

25

27

32

23

20

21

26

22

20

27

Вариант №7

Имеются данные о себестоимости 1 тонны нефти и нефтяного попутного газа (тыс. руб.):

0,3

0,4

0,8

1,2

1,4

1,9

0,7

1,3

1,0

0,5

0,9

1,2

1,0

1,3

0,6

1,0

1,0

1,1

0,5

1,2

1,0

1,4

1,6

0,5

1,1

1,1

1,8

0,3

0,6

1,1

0,8

1,2

0,9

1,4

1,3

1,6

2,7

1,5

0,8

0,7

0,9

1,5

1,3

1,1

1,2

1,8

1,1

1,0

1,2

0,9

1,5

1,3

1,1

1,2

1,3

Вариант №8

Имеются данные о числе рабочих дней без простоя для пятидесяти буровых бригад одного из районов страны:

261

260

258

263

257

260

259

264

261

260

264

261

265

261

260

263

260

260

259

260

258

265

259

265

261

258

259

259

258

262

264

258

259

263

266

259

261

266

262

259

262

261

266

262

259

262

261

259

262

262

261

266

259

262

Вариант №9

Приведено количество деталей, выработанных за смену различными рабочими:

78

90

76

81

77

83

85

75

81

73

75

83

73

84

85

83

88

76

79

85

81

89

83

76

77

84

83

88

87

77

82

85

74

79

82

87

71

78

85

84

81

83

88

82

83

88

80

79

82

86

74

75

78

76

84

81

76

74

81

93

84

92

75

82

77

Вариант №10

Имеются данные о рабочих дебитах газовой скважины (тыс. м3/сут.):

550

550

551

550

551

562

550

562

561

530

542

535

542

539

537

543

540

556

546

556

556

534

548

533

558

560

558

548

540

541

551

549

551

550

552

568

538

551

547

552

559

557

546

552

550

557

547

552

554

547

554

567

558

563

562

569

552

554

549

545

560

539

549

539

Вариант №11

Имеются данные о коэффициенте эксплуатации насосных скважин в различных нефтеносных районах страны:

0,90

0,79

0,84

0,86

0,88

0,90

0,89

0,85

0,91

0,98

0,91

0,80

0,87

0,89

0,88

0,78

0,81

0,85

0,88

0,94

0,86

0,80

0,86

0,91

0,78

0,86

0,91

0,95

0,97

0,88

0,79

0,82

0,84

0,90

0,81

0,87

0,91

0,90

0,82

0,85

0,90

0,82

0,85

0,90

0,96

0,98

0,89

0,87

0,99

0,85

Вариант №12

50 сверл были подвергнуты испытанию на твердость. При этом фиксировалась твердость лапки. Результаты испытания следующие:

14,5

14,6

15,1

15,5

16,3

16,8

17,9

16,3

14,5

14,9

13,6

15,4

16,9

15,4

14,3

15,5

11,3

15,5

17,1

16,8

12,2

15,2

15,7

11,6

16,9

15,7

17,7

16,6

16,2

15,5

12,8

14,2

15,5

16,1

14,3

16,5

14,5

17,9

17,8

16,9

11,7

13,2

14,9

19,8

16,6

17,9

14,9

15,2

17,3

16,9

Вариант №13

Даны значения обследуемого признака Х — себестоимости единицы продукции (в руб.):

73

77

78

88

76

78

86

77

75

90

88

84

79

87

83

79

73

84

86

85

74

77

74

88

81

87

85

76

79

71

88

83

76

76

82

73

89

79

90

76

75

91

83

82

84

85

78

85

85

79

92

86

84

77

92

93

91

85

84

87

81

83

80

82

76

81

90

78

81

95

77

91

84

96

84

79

79

83

88

84

83

93

73

79

92

89

75

83

87

89

71

75

83

87

92

80

88

91

95

82

Вариант №14

Имеются данные о суточном дебите газа в наблюдаемой скважине:

39

19

21

28

26

27

29

28

28

27

23

26

32

34

26

24

22

19

23

27

30

29

25

18

18,5

20

22

24

28

31

33

25

18

21

26

30

32

34

29

26

21

20

23

25

27

30

32

29

27

23

Вариант №15

Даны замеры толщины резца (в мм):

24,5

26,8

23,6

25,5

22,2

26,9

25,3

24,1

28,5

25,3

24,1

28,5

25,3

24,6

27,9

25,4

21,3

25,2

27,7

23,6

25,2

26,8

25,9

25,1

26,3

25,4

21,3

25,2

25,5

25,7

26,6

28,2

25,4

23,2

26,6

25,7

24,3

26,8

25,8

27,1

26,2

25,9

21,6

25,3

25,1

24,8

26,3

24,9

24,3

26,8

Вариант №16

Имеются данные о расходах, связанных с  монтажом и демонтажом оборудования на предприятии (в тыс. руб.)

4,7

7,2

6,2

6,7

7,2

5,7

7,7

8,2

6,2

5,2

7,2

5,7

6,2

5,7

8,2

5,7

6,7

6,2

5,7

6,2

6,7

5,2

7,7

6,2

7,2

7,7

6,7

7,2

8,2

6,2

5,7

6,2

7,7

6,7

7,2

5,7

6,7

8,2

7,7

8,2

4,7

8,7

4,2

8,7

6,2

6,7

6,2

7,2

4,9

5,5

Вариант №17

Даны значения обследуемого признака Х — себестоимости одной детали (в руб.):

82

83

73

76

79

89

95

92

93

84

88

76

88

81

78

86

84

84

86

85

87

84

74

83

87

73

76

73

78

76

76

74

88

82

73

85

79

77

79

97

84

80

75

81

73

78

83

75

90

83

77

84

85

90

92

91

85

71

85

87

82

94

92

76

93

90

73

92

84

93

88

84

81

93

81

91

78

85

84

95

79

79

83

96

89

82

79

77

83

88

81

88

82

77

92

76

84

83

87

89

Вариант №18

Даны значения диаметров шестерен, обрабатываемых на станке:

21

29

27

29

27

29

31

29

31

29

29

23

39

31

29

31

29

31

29

31

33

31

31

31

27

23

27

33

29

25

29

19

29

31

23

31

29

27

33

29

31

29

31

23

35

27

29

29

27

29

29

21

29

27

29

29

29

33

29

25

25

27

31

29

29

27

33

29

31

29

29

29

35

27

29

35

29

33

29

27

31

31

27

29

35

27

33

29

27

29

25

27

31

37

25

31

27

27

29

25

Вариант №19

Даны значения израсходованных долот на 100 скважин при механической скорости проходки 18 м/сек.:

28

30

28

27

28

29

29

29

31

28

26

25

33

35

27

31

31

30

28

33

23

30

31

33

31

27

30

28

30

29

30

26

25

31

33

26

27

33

29

30

30

36

26

25

28

30

29

27

32

29

31

30

31

26

25

29

31

33

27

32

30

31

34

28

26

38

29

31

29

27

31

30

28

34

30

26

30

32

30

29

30

28

32

30

29

34

32

35

29

27

28

30

30

29

32

29

34

30

32

24

Вариант №20

Даны значения внутреннего диаметра гайки (в мм):

4,25

4,38

4,48

4,53

4,54

4,41

4,52

4,39

4,16

4,27

4,59

4,48

4,56

4,13

4,51

4,31

4,27

4,87

4,32

4,49

4,74

4,17

4,66

4,92

4,48

4,68

4,45

4,12

4,69

4,28

4,74

4,55

4,28

4,54

4,51

4,77

4,71

4,78

4,13

4,51

4,42

4,36

4,45

4,32

4,17

4,79

4,13

4,52

4,73

4,95

Вариант №21

Даны значения ширины пера круглой плашки (в мм):

3,59

3,47

3,50

3,66

3,59

3,53

3,49

3,52

3,31

3,68

3,86

3,57

3,69

3,77

3,13

3,59

3,52

3,43

3,46

3,61

3,33

3,66

3,52

3,96

3,92

3,49

3,60

3,65

3,47

3,75

3,74

3,52

3,49

3,78

3,65

3,48

3,49

3,32

3,27

3,63

3,43

3,78

3,45

3,64

3,43

3,62

3,55

3,42

3,73

3,48

Вариант №22

Имеются данные об энергетических затратах на 1 м проходки при разведочном бурении нефтяных скважин в различных нефтяных районах страны (в тыс. руб.):

48

29

6

18

24

30

35

25

17

24

36

42

47

40

28

12

7

25

23

33

28

19

14

8

40

27

20

27

15

6

16

25

34

17

25

46

6

51

13

28

37

43

27

38

53

24

41

21

11

26

Вариант №23

Имеются данные о пластовом давлении (в атм) при насосном способе эксплуатации 100 скважин:

95

57

15

26

35

46

52

55

59

47

42

48

58

55

102

96

45

54

56

60

10

16

20

49

48

43

12

19

51

103

62

61

38

29

10

39

40

18

14

41

58

63

59

60

63

68

70

71

75

82

87

92

99

65

68

78

91

94

77

65

79

67

74

80

89

69

81

83

100

90

36

64

97

50

76

72

31

55

28

57

85

69

13

53

11

61

90

76

17

37

Вариант №24

Имеются данные о продолжительности (в мес.) 50 фонтанирующих скважин:

19,2

18,1

18,4

18,2

18,6

18,9

19,0

18,4

18,5

19,3

18,3

18,7

18,8

19,1

18,9

19,3

18,4

19,2

18,2

18,7

19,5

18,7

19,1

18,7

19,1

19,6

18,6

18,8

19,3

18,8

19,0

19,5

18,9

19,0

19,8

19,7

19,4

19,3

19,1

19,8

18,9

19,7

18,5

19,0

19,9

19,2

19,1

18,6

19,5

19,6

Вариант №25

Имеются данные замеров температуры масла двигателя автомобиля ГАЗ-53А:

21

30

26

29

27

28

31

28

29

24

38

32

32

30

31

29

30

28

28

24

27

33

29

26

29

26

34

28

31

29

30

23

36

27

28

29

36

30

28

33

30

25

26

27

31

29

30

28

29

27

28

36

29

34

28

28

31

32

34

29

29

28

27

33

36

31

20

30

29

26

29

29

29

32

34

30

31

21

28

29

34

24

28

29

28

31

32

27

28

29

Вариант №26

Результаты измерения температуры раздела фракции бензин-авиакеросин на установке первичной переработке нефти (в ).

133

133

142

135

145

144

145

147

146

134

130

134

138

144

141

141

134

141

136

140

143

139

141

137

140

145

145

141

144

138

139

143

141

141

146

143

140

139

143

143

139

140

139

138

138

135

141

141

140

138

145

135

148

136

139

142

143

143

137

138

138

139

138

144

143

138

142

138

140

140

137

139

140

139

137

136

136

135

135

141

142

136

140

136

137

138

138

137

139

139

140

139

140

140

139

139

139

140

140

146

Вариант №27

Имеются данные о суточном дебите нефти наблюдаемой скважины (в т/сут.):

16

13

11

15

18

19

21

18

17

15

13

16

18

17

19

15

13

12

14

16

17

20

17

17

20

19

18

22

24

1

15

14

10

12

16

18

18

19

21

23

20

22

24

17

16

14

15

18

15

11

16

17

15

13

16

17

18

14

15

19

17

18

16

13

15

17

21

23

26

19

22

24

25

20

21

24

19

22

23

20

25

21

20

22

26

19

22

25

28

23

20

21

27

19

15

22

23

18

22

22

Вариант №28

Имеются результаты испытания — твердости лапки сверла:

36,8

32,0

39,4

36,3

35,4

37,3

34,7

39,0

28,3

41,3

36,1

37,3

32,2

38,5

34,2

37,2

30,6

37,3

35,2

36,9

34,3

35,2

30,8

36,0

39,3

32,7

34,6

36,8

39,1

29,5

30,4

35,2

36,5

38,2

40,2

36,8

39,3

32,7

37,1

29,3

28,4

40,2

34,8

37,2

32,6

41,0

40,4

28,3

34,8

39,2

Вариант №29

Имеются данные о расходах, связанных с подготовительными работами, на 1 м проходки при разведочном бурении нефтяных скважин в различных нефтеносных районах страны (в тыс. руб.):

11

15

20

25

29

34

19

25

16

21

29

20

21

22

23

26

28

30

18

13

17

22

29

26

39

14

16

24

27

25

31

32

23

37

23

27

37

36

42

32

34

39

38

44

28

33

23

35

36

34

Вариант №30

Даны значения овальности валика (в мк):

25

29

33

21

29

25

29

28

31

23

31

27

29

27

27

29

31

27

29

29

29

31

25

29

29

27

29

31

29

27

25

28

27

31

31

29

27

27

33

29

33

31

33

25

27

35

37

35

27

27

29

27

29

31

29

27

29

31

29

21

23

29

37

29

31

29

31

29

31

29

39

29

39

39

27

31

37

29

31

29

27

23

29

27

31

29

29

31

29

35

29

19

29

27

29

29

31

33

29

25

§4. Построение кривой нормального распределения

по опытным данным

Проверку соответствия опытных данных предполагаемому закону распределения в первом приближении можно осуществить графическим методом. Опытные данные наносят на вероятностную бумагу и сравнивают с графиком принятой функции распределения, которая на вероятностной сетке изображается прямой линией. Если экспериментальные точки ложатся вблизи прямой со случайными отклонениями вправо или влево, то опытные данные соответствуют рассматриваемому закону распределения. Систематическое и значительное отклонения экспериментальных точек от аппроксимирующей прямой свидетельствует о несоответствии данной выборки предполагаемому закону распределения.

Возможен другой вариант применения графического метода для проверки соответствия опытных данных предполагаемому закону распределения. Пусть требуется определить соответствие опытных данных нормальному закону распределения. С этой целью за основу берут дискретный вариационный ряд и в системе координат строят  эмпирическую кривую распределения — полигон частот. Затем в этой же системе координат строят точки с координатами (; ), через которые проводят теоретическую кривую нормального распределения. Для нахождения теоретических частот  составляется табл. 11.

Таблица 11

В табл. 11 обозначено:

 — варианты дискретного вариационного ряда,

частоты вариантов ,

— выборочная средняя,

— выборочное среднее квадратическое отклонение,

— шаг (разность между соседними вариантами),

— функция, значения которой находят по приложению 1,

— выровненные частоты (ординаты) теоретической кривой,

— округленные до ближайшего целого числа ординаты .

§5. Проверка статистических гипотез

При изучении той или иной генеральной совокупности нам неизвестен либо закон ее распределения, либо параметры распределения. В таких случаях в математической статистике выдвигается некоторое предположение относительно свойств генеральной совокупности. Такое предположение носит название статистической гипотезы.

Статистическая гипотеза может быть проверена на основании результатов случайной выборки.

Правило, устанавливающее условия, при которых проверяемая гипотеза принимается или отвергается, называется статистическим критерием.

Обработка экспериментальных данных с помощью любого критерия осуществляется по следующей схеме:

  1.  Берется один или два ряда наблюдений (одна или две выборки) и по элементам этих рядов по определенным формулам (для каждого критерия свои формулы) вычисляют статистики. Получают определенное число.
    1.  По заданному условию значимости  и числу степеней свободы  находят по таблицам (для каждого критерия свои таблицы), приводимым в приложении учебника по теории вероятностей и математической статистике, граничные значения для чисел, полученных в п.1. Если полученное в п.1 число не выходит за пределы найденных границ, то принимается следующее утверждение: нет достаточных оснований отвергнуть выдвинутую гипотезу.

В математической статистике наиболее употребительными являются следующие критерии (или распределения): Стьюдента, Фишера (эти критерии исходят из предположения о нормальном законе распределения обследуемых признаков),  Пирсона, Колмогорова, Смирнова, Романовского, Ястремского и другие (эти критерии применяют для проверки наличия нормального и других распределений признака Х и когда не используются конкретные значения параметров этих распределений).

Критерий согласия Пирсона ()

Критерий согласия Пирсона () применяют для проверки гипотезы о соответствии эмпирического распределения предполагаемому теоретическому распределению при большом объеме выборки () и больших частотах () вариантов .

За меру  расхождения эмпирического и теоретического распределений английский математик Пирсон принял величину  (хи квадрат)

,       (26)

где  — эмпирические частоты,  — теоретические частоты.

Применение критерия  к проверке гипотезы о нормальном распределении генеральной совокупности значений признака Х осуществляется по следующему правилу.

Правило применения критерия .

  1.  По имеющейся выборке сделать предположение о нормальном законе распределения признака Х генеральной совокупности. Затем найти оценки параметров этого закона, т.е. найти  и .
  2.  Вычислить теоретические частоты  по формуле

,            (27)

где n — объем выборки, h — шаг, S – выборочное среднее квадратическое отклонение, ,  находится по таблице приложения №1.

Для вычисления теоретических частот  составить табл. 12.

Таблица 12

Полученные частоты  округлить до целых.

  1.  Вычислить величину  по формуле (26) и обозначить ее через . Расчет вести, пользуясь табл. 13.

Таблица 13

  1.  Найти число степеней свободы k (параметр распределения Пирсона) по формуле

,       (27)

где S число интервалов вариационного ряда, r — сумма числа параметров теоретического закона распределения. Для нормального распределения признака Х  (учитываются параметры нормального распределения a и , а также объем выборки n).

  1.  Выбрать уровень значимости .
  2.  По найденному числу степеней свободы k и уровню значимости  по таблице №  распределения  Пирсона определить критическое значение .

Если , то гипотеза о нормальном распределении признака Х принимается. Если , то гипотеза о нормальном распределении признака Х отвергается.

Критерий Пирсона можно применять для проверки гипотезы о том, что данная выборка взята из генеральной совокупности, распределенной по биномиальному закону, по закону Пуассона, по экспоненциальному закону.

Рассмотрим гипотезу  о распределении генеральной совокупности по закону Пуассона:

: ,          (28)

где  — параметр распределения Пуассона. Для применения критерия  надо рассчитать теоретические частоты , а также получить по значениям выборки оценку параметра . Методом максимального правдоподобия доказывается, что выборочная средняя  является пригодной оценкой для , то есть . Теоретические частоты  вычисляются по формуле

      (29)

Вероятности  вычисляются по формуле

       (30)

Так как при расчете теоретических частот  используется один параметр , то число степеней свободы k находят по формуле

        (31)

Затем вычисляют величину  по формуле 26, обозначают ее через .По заданному уровню значимости  и найденному числу степеней свободы   по таблице распределения  Пирсона находят . Если , то гипотеза  принимается, то есть делаем вывод, что признак Х распределен по закону Пуассона. Если , то гипотеза  отвергается.

Критерий Романовского.

Для оценки близости эмпирического распределения признака Х к нормальному теоретическому Романовский предложил вычислять отношение:

,         (32)

где  — статистика критерия Пирсона, вычисленная по формуле (26), используя опытные данные, k — число степеней свободы, найденное по формуле (27). Если указанное отношение по модулю меньше трех, то расхождение между теоретическим и эмпирическим распределениями считается несущественным, то есть можно принять за закон данного эмпирического распределения нормальное распределение. Если отношение (32) больше трех, то делаем вывод о том, что эмпирическое распределение признака Х не подчиняется нормальному закону распределения.

Критерий Колмогорова.

Критерий Колмогорова в своем классическом виде является более мощным, чем критерий Пирсона и может быть использован для проверки гипотезы о соответствии эмпирического распределения любому теоретическому непрерывному распределению  с заранее известными параметрами. Однако параметры функции распределения , как правило, нам неизвестны и их оценка производится по данным самой выборки. Это обстоятельство накладывает ограничения на возможность широкого практического применения критерия, а может быть использовано только для проверки соответствия опытных данных лишь некоторым конкретным функциям распределения.

Для проверки соответствия эмпирического распределения теоретическому нормальному распределению критерий Колмогорова применяют следующим образом

Вычисляется статистика критерия Колмогорова  по формуле

,        (33)

где  — максимум абсолютного значения разности между накопленными эмпирическими частотами М и накопленными теоретическими частотами  , n — объем выборки.

По вычисленному  находят вероятность  — вероятность того, что  достигает данной величины. Вероятность  находят, пользуясь табл. 14.

Таблица 14

0,30

1,0000

1,10

0,1777

0,35

0,9997

1,20

1122

0,40

9972

1,30

0681

0,45

9874

1,40

0,397

0,50

9639

1,50

0,222

0,55

9228

1,60

0,120

0,60

8643

1,70

0,052

0,70

7112

1,90

0,015

0,75

6272

2,00

0007

0,80

5441

2,10

0003

0,85

4653

2,20

0001

0,90

3927

2,30

0001

0,95

3275

2,40

0000

1,00

2700

2,50

0000

Если найденному значению  соответствует очень малая вероятность, то есть , то расхождение между эмпирическим и теоретическим распределениями нельзя считать случайным. Следовательно, рассматриваемая выборка не подчиняется нормальному закону распределения. Если вероятность , то расхождение между частотами может быть случайным и распределения хорошо соответствуют одно другому.

Если проверяют гипотезу по критерию Колмогорова о соответствии выборки экспоненциальному распределению, параметры которого оценивают по опытным данным, то сначала вычисляют статистики [ ]

   (34)

   (35)

   (36)

Затем составляют неравенство

   (37)

Критические значения  для этого случая: ,  и . Если неравенство (37) при выбранном  выполняется, то это означает, что опытные данные не противоречат предположению о соответствии их экспоненциальному распределению.

Критерий Б.С. Ястремского.

Для проверки соответствия данной нормальному распределению составляется неравенство

,     (38)

где

;

;

— эмпирические частоты;

— теоретические частоты;

— число вариантов дискретного вариационного ряда;

; ; n — объем выборки. Если , то .

Если вычисленное значение  меньше , то за закон эмпирического распределения признака Х можно принять теоретический закон нормального распределения. При значениях  больших  расхождения между эмпирическим и теоретическим распределениями существенно. В этом случае данные выборки не будут подчиняться нормальному закону распределения.

Для вычисления величины  составляется табл. 15.

Таблица 15

Приближенные критерии нормальности распределения.

Для приближенной проверки гипотезы о нормальном распределении выборочной совокупности используют выборочные статистики: асимметрию и эксцесс. В этом случае названные статистики вычисляют по формулам (18) и (19). Затем вычисляют их средние квадратические отклонения по формулам

         (39)

         (40)

Если  и , то выборочная совокупность подчиняется нормальному закону распределения. Если  и  заметно больше своих средних квадратических отклонений, то выборочная совокупность не будет распределена по нормальному закону.

Проверку выборочной совокупности на нормальное распределение можно производить, используя статистики ,  и . Сначала вычисляют статистику  по формуле

     (41)

Затем при заданном уровне значимости  и числе степеней свободы  (используют в расчетах две статистики  и ) по табл. № приложения для распределения  Пирсона находят . Если выполняется неравенство , то гипотезу о нормальном распределении выборочной совокупности принимают. В противном случае, то есть когда , гипотезу о нормальном распределении выборки отвергают.

Покажем применение рассмотренной теории на примере выполнения лабораторной работы №2, являющейся продолжением лабораторной работы №1.

Контрольные вопросы.

  1.  Рассказать о возможных вариантах построения кривой нормального распределения по опытным данным.
  2.  Дать определение статистической гипотезы.
  3.  Что называется статистическим критерием?
  4.  Сформулировать алгоритм применения любого статистического критерия для обработки экспериментальных данных.
  5.  Сформулировать правило применения критерия согласия Пирсона () для проверки гипотезы согласованности эмпирического распределения с теоретическим нормальным.
  6.  Рассказать о применении критерия согласия Романовского для оценки близости эмпирического распределения к теоретическому нормальному.
  7.  Сформулировать алгоритм применения критерия Колмогорова для проверки соответствия эмпирического распределения нормальному теоретическому распределению.
  8.  Рассказать о применении критерия Б.С. Ястремского для проверки соответствия данной выборочной совокупности нормальному распределению.
  9.  Рассказать о приближенных критериях, применяемых для проверки гипотезы о нормальном распределении выборочной совокупности.

Лабораторная работа №2

Построение кривой нормального распределения по опытным

данным. Проверка гипотезы о нормальном распределении выборки.

Цель работы: овладение студентом способами построения эмпирической и теоретической (нормальной) кривой распределения; выработка умения и навыков применения критериев согласия для проверки выдвинутой статистической гипотезы.

Содержание работы: на основе дискретного вариационного ряда, полученного в лабораторной работе №1, выполнить следующее:

  1.  Построить эмпирическую (полигон) и теоретическую (нормальную) кривую распределения.
  2.  Проверить согласованность эмпирического распределения с теоретическим нормальным, применяя три критерия:

а) критерий Пирсона;

б) один из критериев: Колмагорова, Романовского или Ястремского;

в) приближенный критерий.

Методика выполнения работы.

Продолжим вероятностно-статистическую обработку результатов эксперимента, предложенных в лабораторной работе №1, то есть обводненности нефти из насосных скважин. За основу берем дискретный вариационный ряд (табл. 8):

варианты,

60,15

60,45

60,75

61,05

61,35

61,65

61,95

62,25

62,55

62,85

частоты,

3

6

9

18

29

16

2

11

5

1

а так же значения  и .

Эмпирическая кривая распределения представляет собой полигон частот (смотри лабораторную работу №1). Для построения теоретической (нормальной) кривой найдем координаты точек , для чего рассчитаем теоретические частоты  (табл. 16).

Таблица 16.

60,15

3

-1,23

-2,08

0,0459

2,3

2

60,45

6

-0,93

-1,58

0,1145

5,8

6

60,75

9

-0,63

-1,07

0,2251

11,4

11

61,05

18

-0,33

-0,56

0,3410

17,3

17

61,35

29

-0,03

-0,05

0,3984

20,3

20

61,65

16

0,27

0,46

0,3589

18,2

18

61,95

2

0,57

0,97

0,2492

12,7

13

62,25

11

0,87

1,47

0,1354

6,9

7

62,55

5

1,17

1,98

0,0562

2,9

3

62,85

1

1,47

2,49

0,0180

0,9

1

Строим эмпирическую и теоретическую кривые (рис. 5).

Проверим  согласованность эмпирического распределения (обводненности нефти из насосных скважин) с теоретическим нормальным по критерию Пирсона. Вычислим величину  по формуле (26):

.

Для нахождения суммы составляем расчетную табл. 17.

Таблица 17

3

2

1

1

0,5

6

6

0

0

0

9

11

-2

4

0,363636

18

17

1

1

0,058824

29

20

9

81

4,05

16

18

-2

4

0,222222

2

13

-11

121

9,307692

11

7

4

16

2,285714

5

3

2

4

1,333333

1

1

0

0

0

Находим число степеней свободы . Выбираем уровень значимости . По таблице критических точек распределения  (приложение ) находим . Так как  , то делаем вывод, что данные выборки, характеризующие обводненность нефти из насосных скважин не подчиняются нормальному закону распределения.

Проведём проверку близости эмпирического распределения k нормальному по критерию Романовского. Вычислим величину

.

У нас, , . Тогда , то есть расхождение между эмпирическим и теоретическим распределением несущественно, что позволяет утверждать, что данные выборки, характеризующие обводненность нефти из насосных скважин по критерию Романовского подчиняются нормальному закону распределения. К такому же выводу мы приходим, применяя критерий Колмогорова (проверить самостоятельно).

И, наконец, проведём проверку близости рассматриваемой выборки к нормальному распределению по приближенному критерию, используя выборочные статистики асимметрию, эксцесс и их средние квадратические отклонения. В лабораторной работе №1 были найдены  . Средние квадратические отклонения для асимметрии и эксцесса находим по формуле (39) и (40):

Так как  и , то делаем вывод, что данные выборки, характеризующие обводненность нефти из насосных скважин подчиняются нормальному закону распределения.

Итак, для проверки согласованности эмпирического распределения с теоретическим нормальным применили 4 критерия, три из них подтвердили близость выборочной совокупности к нормальному распределению. Поэтому окончательно заключаем, что за закон распределения признака Х — обводненности нефти из насосных скважин  можно принять нормальное распределение.

Замечание.

В качестве вариантов заданий для выполнения лабораторной работы №2 следует брать дискретные вариационные ряды из лабораторной работы №1, а так же значения статистик , , , .

§8. Понятие корреляционной зависимости.

Задачи теории корреляции

В новых условиях хозяйственной деятельности предприятий возрастает роль экономико-математических методов для управления производством. Управление производством — это сложный динамический процесс. Поэтому при выработке оптимального решения по управлению производственно-хозяйственной деятельностью предприятия необходимо не только учитывать изменения параметров и характеристик, описывающих эту деятельность, но и уметь их прогнозировать, основываясь на экономических законах, которые наиболее полно отражают взаимосвязи основных показателей предприятия и его подразделений. Математическая формализация этих связей создает условия для экономического обоснования целесообразных объемов производимой продукции, определения ее качественных показателей и условий эффективного использования ресурсов.

Для решения этих задач применяют методы корреляционного анализа. При анализе зависимостей между производственными показателями методом корреляционного анализа выделяют два основных типа переменных количественных признаков: независимые переменные (факторные признаки) и зависимые переменные (результативные признаки).

При изучении взаимосвязей между переменными признаками надо, прежде всего, установить, к какому типу зависимостей относится эта связь.

Зависимость между признаками  и  называется корреляционной, если каждому возможному значению  признака  сопоставляется условная средняя соответствующего распределения признака .

Среднее арифметическое значение признака , вычисленное при условии, что признак  принимает фиксированное значение , называется условным средним, обозначается через  и вычисляется по формуле

    (42)

где  — частоты, показывающие сколько раз повторяются парные значения ,  в данной выборке,  — частота появления признака .

Теория корреляции изучает такую зависимость между признаками  и , при которой с изменением одного признака меняется распределение другого. Она применяется для того, чтобы при сложном взаимодействии посторонних факторов выяснить, какова должна быть зависимость между признаками  и , если бы посторонние факторы не изменялись и своим изменением не искажали истинную статистическую зависимость.

В теории корреляции решаются две задачи. Первая задача состоит в выявлении на основе опытных данных характера корреляционной зависимости между признаками  и . При парной корреляции для ее решения применяют графический метод. В системе координат  состоят корреляционное поле. Если точки  хорошо ложатся на прямую, то связь между признаками  и  носит линейный характер. Если точки в корреляционном поле хорошо ложатся на кривую, то связь будет криволинейной. Исходя из геометрических соображений, выбирают уравнение линии, которые называют уравнением регрессии, и находят неизвестные параметры, входящие в уравнение. Вторая задача состоит в определении тесноты связи между признаками, включенными в модель, путем вычисления коэффициента корреляции  в случае линейной корреляции или корреляционных отношений  в случае криволинейной корреляции. Здесь же решается вопрос об адекватности, построенной корреляционной модели (проверяется соответствие полученного уравнения регрессии опытным данным).

§9. Парная линейная корреляция

Предположим, что на основе геометрических или других соображений установлено, что между двумя количественными признаками  и  существует линейная корреляционная зависимость. Если признаки подчиняются нормальному закону распределения, то уравнение линии регрессии записывают в виде

    (43)

Пусть опытные данные не сгруппированы в корреляционную таблицу, то есть заданы в виде табл. 18.

Таблица 18

В этом случае значения  и , являющиеся оценками истинных величин уравнения регрессии, находят по методу наименьших квадратов, решая систему нормальных уравнений

,         (44)

где , , , .

Для нахождения сумм, входящих в систему (44) составляется табл. 19.

Таблица 19

Если опытные данные сгруппированы в корреляционную таблицу, то значения  и  уравнения регрессии (43) находят по методу наименьших квадратов, решая систему нормальных уравнений

,    (45)

где  и  — частоты признаков  и ,  — частота совместного появления признаков  и .

Для нахождения сумм, входящих в систему (45) составляется табл. 20.

Таблица 20

       x

 y  

Суммы , ,   в табл. 20 находятся по строкам, а сумма   находится по последнему столбцу табл. 20.

В уравнении регрессии (43) параметр  характеризуют усредненное влияние на результативный признак  неучтенных (не выявленных для исследования) факторных признаков . Параметр  показывает, на сколько изменяется в среднем значение результативного признака  при увеличении факторного признака на единицу.

Используя параметр , вычисляют коэффициент эластичности  по формуле

         (46)

Коэффициент эластичности  показывает на сколько изменяется в процентах результативный признак  при изменении факторного признака  на 1 %.

В случае линейной корреляционной зависимости между признаками  и , если нет уверенности в том, что эти признаки подчиняются нормальному закону распределения, уравнения линий регрессий находят по формулам:

,       (47)

,       (48)

где ,  — выборочные средние признаков   и ; ,  — выборочные средние квадратические отклонения признаков  и , вычисляемые по формулам:

, где ,   (49)

, где .   (50)

При   и  находят по формулам:

, где ,        (51)

, где .        (52)

Коэффициент линейной корреляции  находят по формуле

,           (53)

где  — средняя произведения значений признаков  и , ,  — средние значения признаков  и , ,  — выборочные средние квадратические отклонения признаков  и , вычисленные по формулам (49) и (50), если  или по формулам (51) и (52), если .

Уравнение (47) называют уравнением регрессии  на , а уравнение (48) — уравнением регрессии  на .

Если данные выборки для признаков  и  заданы в виде корреляционной таблицы и объем выборки , то для нахождения величин, входящих в уравнения линий регрессий (47) и (48), переходят к вспомогательному распределению с условными вариантами  и , вычисляемых по формулам:

,           (54)

,            (55)

где , ,  и  — шаги значений признаков  и .

Выборочный коэффициент линейной корреляции  в этом случае находят по формуле

,     (56)

где

,         (57)

Для нахождения суммы  составляется расчетная табл. 21.

Таблица 21

   

Статистики , , ,  находят по формулам:

, , , .  (58)

§10. Коэффициент корреляции, его свойства и значимость

После выбора функции как формы корреляционной зависимости между признаками  и  решается задача, состоящая в определении тесноты связи между ними, в оценке рассеяния относительно линии регрессии значений одного признака для различных значений другого. Для этого используют выборочный коэффициент корреляции , который вычисляют по формуле (53). Линейный коэффициент корреляции изменяется на множестве , то есть . Если , то корреляционная зависимость становится функциональной. При  эта зависимость прямая (рис. 6), при  связь обратная (рис. 7).

Если , то линейная связь между признаками  и  отсутствует, но может существовать криволинейная корреляционная связь или нелинейная функциональная.

Оценку тесноты линейной корреляционной связи определяют, пользуясь табл. 22.

Таблица 22

Теснота связи

Величина

Прямая связь

Обратная связь

Линейной

связи нет

Слабая

Средняя

Сильная

Функциональная

Значимость выборочного коэффициента корреляции проверяют по критерию Стьюдента. По опытным данным находят статистику , пользуясь формулой

          (59)

Затем по таблице критических точек распределения Стьюдента (приложение) по заданному уровню значимости  и числу степеней свободы  находят табличное значение  двусторонней критической области. Если , то  незначимый (мало отличается от нуля) и признаки  и  некоррелированы. Если , то приходят к выводу о наличии линейной корреляционной связи.

§11. Определение надежности (доверительного интервала)

коэффициента корреляции

Коэффициент корреляции, как правило, рассчитывается по данным выборки. Чтобы полученный результат распространить на генеральную совокупность, приходится допустить некоторую ошибку, которую оценивают с помощью средней квадратической ошибки . С помощью  производят оценку надежности коэффициента корреляции, построив доверительные интервалы для различных объемов выборки. Пусть число наблюдений пар чисел  меньше 50 . В этом случае средняя квадратическая ошибка  вычисляется по формуле

,          (60)

где  — коэффициент парной линейной корреляции,  — объем выборки. Доверительный интервал для оценки  находят по формуле

        (61)

где  находят по таблице значений функции Лапласа  (приложение).

Если задать надежность , то  и .

Если объем выборки , то погрешность  для коэффициента корреляции  находят также по формуле (60). Затем вычисляют отношение . Если это отношение больше 3, то можно считать, что найденный коэффициент корреляции  отражает истинную зависимость между признаками  и . Величина  является гарантийным минимумом, а величина  гарантийным максимумом коэффициента корреляции  и доверительный интервал для оценки  запишется в виде

       (62)

§12. Коэффициент корреляции

Линейный коэффициент корреляции оценивает тесноту взаимосвязи между признаками и показывает, является ли эта связь прямой или обратной. Однако понятия тесноты взаимосвязи бывает недостаточно при содержательном анализе взаимосвязей. В частности коэффициент корреляции не показывает степень воздействия факторного признака  на результативный . Таким показателем является коэффициент детерминации.

Пусть по опытным данным для признаков  и  получены уравнения регрессий  и . Величину  называют коэффициентом детерминации. Этот коэффициент детерминации можно находить и по формуле

,         (63)

где  — опытные значения признака ,  — значения , найденные по уравнению регрессии,  — средняя признака . Формулой (63) пользуется тогда, когда общее число значений  равно числу значений  признака .

Коэффициент детерминации используется, во-первых, для контроля вычислений, проводимых при получении уравнений регрессий  и, во-вторых, он показывает, какую часть рассеяния результативного признака  можно объяснить принятой регрессионной моделью.

§13. Проверка адекватности модели

Для проверки  соответствия уравнения регрессии  опытным данным применяют критерий Фишера-Снедекора. Вычисляют статистику  по формуле

,     (64)

где  — коэффициент детерминации,  — объем выборки. Чем ближе значение  к единице, тем лучше модель согласуется с опытными данными. Затем при заданном уровне значимости  и числах степеней свободы ,  находят по таблице критических точек распределения Фишера-Снедекора (приложение) . Если окажется, что , то полученное уравнение линейной регрессии согласуется с опытными данными. Если , то модель регрессии не согласуется с данными опыта. Формулой (64) пользуются тогда, когда исходные данные заданы не в виде корреляционной таблицы. Если опытные данные заданы в виде корреляционной таблицы, то проверку модели на адекватность можно выполнить тогда, когда общее число значений  больше числа значений . В этом случае находят остаточную сумму квадратов , характеризующую влияние неучтенных в модели факторов, по формуле

,            (65)

где  — сумма квадратов отклонений значений  от средней ,  — сумма квадратов отклонений условных средних  от средней . Затем вычисляется статистика  по формуле

.             (66)

По таблице критических точек распределения Фишера-Снедекора при заданном уровне значимости  и числах степеней свободы ,  находят . Если , то модельное уравнение регрессии значимо описывает опытные данные, в противном случае  нет.

§14. Оценка величины погрешности

линейного однофакторного уравнения

После проверки модельного уравнения линейной регрессии на адекватность находят относительную погрешность уравнения по формуле

,             (67)

где ,  — стандартная ошибка уравнения регрессии,

— остаточная дисперсия,

,  — опытные значения ,  — значения , полученные по уравнению регрессии,  — среднее значение ,  — объем выборки.

Если величина  мала, то прогнозные качества оценочного регрессивного уравнения высоки.

Одновременно производят оценку коэффициентов уравнения регрессии . Пусть  и  — средние квадратические (или стандартные) ошибки соответственно коэффициентов  и  уравнения регрессии. Их вычисление производят по формулам:

     (68)

    (69)

Коэффициенты  и  считаются значимыми, если

и .

Если коэффициенты  и  незначимы, то ситуацию можно поправить путем увеличения объема выборки , увеличения числа факторов, включаемых в модель или изменения формы уравнения связи.

Применения теории §§ 8-14 демонстрируется на примере выполнения лабораторных работ № 3 и № 4.

Контрольные вопросы

  1.  Дать определение корреляционной зависимости между двумя признаками  и .
  2.  Дать определение условной средней признака  и записать формулу для ее нахождения.
  3.  Сформулировать задачи, решаемые в теории корреляции.
  4.  Записать систему нормальных уравнений для нахождения параметров  и  уравнения линейной регрессии  в случае, когда опытные данные не сгруппированы в корреляционную таблицу.
  5.  Записать уравнения линий регрессий  на  и  на , используя коэффициент линейной корреляции .
  6.   Дать определение коэффициента линейной корреляции, сформулировать его свойства.
  7.  Рассказать о том, как определяется теснота линейной корреляционной связи между двумя признаками с помощью коэффициента линейной корреляции.
  8.  Как определяется значимость коэффициента линейной корреляции?
  9.  Записать доверительные интервалы для оценки коэффициента линейной корреляции при различных объемах выборки.
  10.  Записать формулу для нахождения коэффициента детерминации в случае парной линейной корреляции и рассказать о его назначении.
  11.   Рассказать о проверке адекватности уравнения линейной регрессии  на  для случая несгруппированных опытных данных.
  12.   Рассказать о нахождении относительной погрешности линейного уравнения регрессии .
  13.   Как производится оценка коэффициента  и  уравнения линейной регрессии ?

§15. Лабораторная работа № 3

Построение модели линейной регрессии

для несгруппированных данных

Цель работы: овладение способами построения моделей линейной регрессии для несгруппированных данных, выработка умения и навыков оценки надежности коэффициента корреляции, уравнения регрессии и его коэффициентов.

Содержание работы: на основании опытных данных требуется:

  1.  Построить корреляционное поле. По характеру расположения точек в корреляционном поле выбрать общий вид функции регрессии.
  2.  Вычислить числовые характеристики , , , , , .
  3.  Определить значимость коэффициента корреляции  и найти для него доверительный интервал с надежностью .
  4.  Написать эмпирические уравнения линий регрессий  на  и  на .
  5.  Вычислить коэффициент детерминации  и объяснить его смысловое значение.
  6.  Проверить адекватность уравнения регрессии  на .
  7.  Провести оценку величины погрешности уравнения регрессии  на  и его коэффициентов.
  8.  Построить уравнение регрессии  на  в первоначальной системе координат.

Выполнение лабораторной работы покажем, решая следующую задачу.

Задача. Результаты наблюдений изменения средней заработной платы (тыс. руб.) и производительности труда (тыс. руб.) по цеху технологической связи ТПЭУС № 1 по кварталам приведены в табл. 23.

Таблица 23

Производительность труда, (тыс. руб.)

24,3

24,9

28,1

30,5

31,5

39,3

40,2

43,5

45,4

45,9

Средняя зарплата, (тыс. руб.)

8,2

8,6

8,7

8,9

9,1

10,6

11,3

11,8

12,9

13,1

Выполнение работы

Для решения поставленной задачи методами корреляционного анализа определим, какой из указанных в условии показателей выбрать за факторный признак, а какой за результативный. На основании экономического анализа производственной деятельности и взаимосвязи производительности трудаи средней заработной платы следует, что за факторный признак  следует принять производительность труда, а среднюю зарплату за результативный признак .

Для определения формулы связи между признаками  и  в системе координат  строим точки , пользуясь табл. 23.

Рис. 8

Около построенных точек проводим линию трэнда (пунктирная линия). По расположению точек около этой линии делаем вывод о том, что связь между производительностью труда и средней зарплатой может носить линейный характер. произведем расчет статистик , , , , , которые войдут в уравнения линий регрессий. Составим расчетную табл. 24

Таблица 24

24,3

-11,06

122,3236

8,2

-2,12

4,4944

590,49

199,26

24,9

-10,46

109,4116

8,6

-1,72

2,9584

620,01

214,14

28,1

-7,26

52,7076

8,7

-1,62

2,6244

789,61

244,47

30,5

-4,86

23,6196

8,9

-1,42

2,0164

930,25

271,45

31,5

-3,86

14,8996

9,1

-1,22

1,4884

992,25

286,65

39,3

3,94

15,5236

10,6

0,28

0,0784

1544,49

416,58

40,2

4,84

23,4256

11,3

0,98

0,9604

1616,04

454,26

43,5

8,14

66,2596

11,8

1,48

2,1904

1892,25

513,3

45,4

10,04

100,8016

12,9

2,58

6,6564

2061,16

585,66

45,9

10,54

11,0916

13,1

2,78

7,7284

2106,81

601,29

353,6

640,064

103,2

31,196

13143,36

3787,06

 Пользуясь результатами последней строки табл. 24, находим:

— средняя производительность труда.

— средняя зарплата сотрудников цеха технологический связи.

, ,

, ,

,

.

Проверяем ”значимость” коэффициента корреляции. Вычислим статистику  по формуле (59):

.

По таблице критических точек распределения Стьюдента (приложение  ) по уровню значимости  и числу степеней свободы  находим . Так как , то выборочный коэффициент корреляции значимо отличается от нуля. Следовательно, можно предположить, что средняя зарплата  и производительность труда  рабочих связаны линейной регрессионной зависимостью. Подтверждением может служить рис. 8.

Находим доверительный интервал для выборочного коэффициента корреляции  с надежностью . Так как объем выборки , то доверительный интервал находим по формуле (61):

.

Так как по условию надежность (доверительная вероятность) , то по таблице функции Лапласа (приложение) находим . Вычисляем среднюю квадратическую ошибку  по формуле (60):

.

Записываем доверительный интервал:  или . Следовательно, с вероятностью 0,95 линейный коэффициент корреляции генеральной совокупности находится в пределах от 0,71 до 1. Применительно к решаемой задаче полученный результат означает, что по имеющейся выборке следует ожидать влияние производительности труда на рост средней зарплаты работников цеха технологической связи не менее чем на 71 %.

Найдем эмпирические линейные уравнения регрессии  на  и  на , которые являются приближенными уравнениями для истинных уравнений регрессий.

Уравнение регрессии  на :

или .

Уравнение регрессии  на :

или .

Контроль вычислений: .

. Так как выполняется условие , то вычисления проведены верно.

Из уравнения  следует, что при увеличении производительности труда на 1 тыс. руб. средняя зарплата работников цеха технологической связи возрастает на 192,989 рублей. Этот результат следует учесть на предприятии при разработке мероприятий по стимулированию производственной деятельности работников цеха в условиях рыночных отношений.

Подставляя в уравнения регрессий  и , получаем точки, координаты которых совпадают с координатами центра распределения . Cледовательно, линии регрессий пересекаются в точке .

Находим коэффициент детерминации. Для линейной регрессии при вычисленном коэффициенте  он равен . У нас . Это означает, что 76 % рассеивания средней зарплаты работников технологического цеха связи объясняется линейной регрессионной зависимостью между средней зарплатой и производительностью труда, и только 24 % рассеивания средней зарплаты работников технологического цеха остались необъяснимыми. Такое положение могло произойти из-за того, что в модель не включены другие факторы, влияющие на изменение средней зарплаты работников технологического цеха связи, либо опытных данных в данной выборке не достаточно, чтобы построить более надежное уравнение регрессии.

Проверим адекватность уравнения линейной регрессии  на  по критерию Фишера-Снедекора. Вычислим статистики  по формуле (64):

, где .

Для нахождения суммы  составляем табл. 25.

Таблица 25

8,2

8,18

0,02

0,0004

8,6

8,3

0,3

0,09

8,7

8,9

–0,2

0,04

8,9

9,4

–0,5

0,25

9,1

9,6

–0,5

0,25

10,6

11,1

–0,5

0,25

11,3

11,25

0,05

0,0025

11,8

11,9

–0,1

0,01

12,9

12,2

0,7

0,49

13,1

12,4

0,7

0,49

1,8729

Из табл. 24 и 25 находим: , . Тогда

, .

При уровне значимости  и числах степеней свободы ,  по таблице критических точек распределения Фишера-Снедекора (приложение) находим . Так как , то заключаем, что есть уравнение линейной регрессии  статистически значимо описывает результаты эксперимента.

Проведем оценку величины погрешности уравнения регрессии . Найдем относительную погрешность  уравнения по формуле (67):

, где , , .

Так как , то . Для нахождения суммы  составляем табл. 26.

Таблица 26

0,02

–0,17

0,0289

0,03

–0,16

0,0256

–0,2

–0,39

0,1521

–0,5

–0,69

0,4761

–0,5

–0,69

0,4761

–0,5

–0,69

0,4761

0,05

–0,14

0,0196

–0,1

–0,29

0,0841

0,7

0,51

0,2601

0,7

0,51

0,2601

2,2588

Тогда , .

Так как величина  мала, то уравнение линейной регрессии  хорошо описывает опытные данные.

Оценим коэффициенты уравнения регрессии. У нас , . Для нахождения отношений  и   вычислим средние квадратические ошибки коэффициентов по формулам (68) и (69):

, , .

По табл. 24 находим: , . Учитывая, что ,  и , находим:

,

,

.

Так как  и , то коэффициенты  и  уравнения регрессии  на  значимы. Графики найденных линейных уравнений регрессий построены на рис. 8.

Таким образом, уравнение регрессии , описывающее зависимость средней зарплаты работников цеха технологической связи от производительности труда, значимо описывает опытные данные и может быть принято для практического руководства.

Варианты заданий к лабораторной работе №3.

Вариант № 1

При исследовании зависимости между средней заработной платой на одного работника  (тыс. руб.) и выпуском продукции на одного работника  (тыс. руб.) по заводу Пластмасс получены следующие данные:

21,07

23,07

28,69

22,42

21,41

18,49

21,64

39,19

51,96

42,36

51,80

50,45

30,2

47,0

29,6

39,5

43,9

47,6

46,6

28,7

10,8

16,97

20,1

23,80

Вариант №2

Данные о производстве дистоплива  (тыс. руб.) и себестоимости единицы продукции  (тыс. руб.) по “Уренгойгазпром” приведены в таблице:

5

6

8

13

34

72

95

113

127

90

143

125

87

45

33

27

16

25

24

27

Вариант №3

Компанию по прокату автомобилей интересует зависимость между пробегом автомобилей () и стоимостью ежемесячного технического обслуживания (). Для выяснения характера этой связи было отбрано 15 автомобилей. Данные приведены в таблице:

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

13

16

15

20

19

21

26

24

30

32

30

35

34

40

39

Вариант №4

Данные зависимости мощности на долоте  (кВт) осевой статической нагрузки на забой  (ТС) при бурении пород Подольского горизонта Туймазинского месторождения приведены в таблице:

1

3

5

7

9

11

13

15

17

12,5

17,8

37

41,9

45

47

39

32

23

Вариант №5

Зависимость скорости отскока инструмента  (м/с) при ударно-вращательном бурении от коэффициента пластичности долот  задана таблицей:

1,5

2,5

3,5

4,5

5,5

6,5

1,2

0,6

0,21

0,9

0,8

0,75

Вариант №6

Данные о количестве выпускаемых деталей  (тыс. руб.) и полных затратах на их изготовление  (сотни руб.) на однотипных предприятиях приведены в таблице:

1

2

4

9

13

18

20

26

22

19

12

9

8

6

Вариант №7

При исследовании зависимости времени на обработку одной детали  (мин.) от стажа работы  (в годах) на Тюменском моторостроительном объединении в цехе резиново – технических и пластмассовых изделий на слесарном участке получены следующие данные:

1

2

3

4

5

6

7

5

3,33

2,9

2,2

2,1

2

2

Вариант №8

Зависимость удельного момента на долоте  (кгс·м/тс) от осевой статической нагрузки на забой  (тс) при бурении пород задана таблицей:

 

1

3

5

7

9

11

13

15

22,5

11,5

6

5,5

2,6

2,4

2,1

2

Вариант №9

Результаты измерений зависимости фазовой проницаемости воды  от нефтенасыщенности  породы приведены в таблице:

0,25

0,35

0,45

0,55

0,65

0,75

0,85

0,65

0,45

0,25

0,15

0,10

0,05

0,07

Вариант №10

В результате исследований установлено, что между овальностью колец после их обработки  и термической обработки , существует связь, которая задана таблицей:

5

10

15

20

25

21

29,3

36

38

39,2

 

Вариант №11

При исследовании зависимости между выпуском готовой продукции  (тыс. руб.) и коэффициентом использования техники  (%) получены следующие данные:

73

75

79

82

83

86

80

85

95

93

97

77

14

21

29

30

315

35

34

41

38

39

46

27

Вариант №12

Давление  (кг) воздуха на парашют возрастает при увеличении скорости  (м/сек.) падения следующим образом:

2,23

3,28

4,65

6,5

8,1

0,3

0,6

1,2

2,4

4,2

Вариант №13

Прочность бетона  (кг/см2) при испытании цилиндрических образцов в зависимости от отношения  высоты к диаметру  оказалась равной:

0,5

1,0

2,0

3,0

4,0

5,0

6,0

290

250

216

206

200

195

190

Вариант №14

Зависимость между размером предприятия по стоимости основных средств   (млн. руб.) и себестоимостью единицы продукции  (руб.) характеризуется следующими данными:

0,5

1,5

2,5

3,5

4,5

5,5

7,5

15

11

12

10,8

10

9

8

Вариант №15

Зависимость между ростом производительности труда на одного работающего  (тыс. руб.) и выпуском товарной продукции  (тыс. руб.) ремонтного цеха машиностроительного завода характеризуется следующими данными:

1,5

2,9

3,0

3,1

3,2

3,4

3,5

3,6

4,2

580

618

658

670

662

699

717

775

786

Вариант №16

Зависимость себестоимости продукции  (тыс. руб.) от затрат на единицу продукции  (тыс. руб.) по объединению «Сибкомплектмонтаж» характеризуется следующими данными:

0,1

0,4

1

4

6

10

20

26

2248

1950

1500

1020

906

290

175

121

Вариант №17

Компрессорную скважину исследовали на приток нефти  (т/сут.) при различных режимах работы с замером забойных давлений  (атм) глубинным манометром. Результаты исследований приведены в таблице:

5

15

25

35

45

55

1,25

1,3

5,25

11,25

17,25

21,25

Вариант №18

Зависимость между стоимостью основных средств предприятия  (млн. руб.) и выработкой продукции  (тыс. руб.) на одного работника характеризуется следующими данными:

1

1,5

2,5

3,5

4,5

5,5

6,5

4

6

6,8

7,9

8,7

9

9,5

Вариант №19

Ниже приводятся данные удельного момента на долото  (кг·м/тс) и осевой статистической нагрузки на забой  (тс) при бурении пород на одном из месторождений Тюменской области:

1

3

5

7

9

11

13

15

17

25

15

12

8

10

5

4,5

3

2,8

Вариант №20

Зависимость между мощностью предприятия  (млн. ед. продукции в год) и фактическими капитальными вложениями  (млн. руб.) характеризуется следующими данными:

1

2

3

4

5

6

1,2

2,6

3,8

4,6

4,9

5,4

Вариант №21

Результаты изучения зависимости между среднемесячной производительностью труда рабочего  (руб) и себестоимостью одной тонны продукции  (руб.) приведены в следующей таблице:

21

24

30

34

35

36

39

40

20

13

12

13

11

10

11

10

 

Вариант 22

Энерговооруженность труда на одного рабочего  (тыс. кВт-час) и производительность труда одного рабочего  (тыс. штук) изделий на ряде предприятий характеризуется следующими данными:

3

3,05

3,6

4,25

4,45

4,55

1

1,5

1,8

2,5

3

4

Вариант 23

Зависимость между стоимостью основных средств предприятий и месячным выпуском продукции характеризуется следующими данными:

Стоимость основных средств, , (млн. руб.)

1

2

3

4

5

6

7

Месячный выпуск продукции, , (тыс. руб.)

10

12

28

40

42

52

54

Вариант 24

Зависимость между капитальными вложениями  (млн. руб.) и мощностью предприятий данного типа  (млн. тонн) продукции задана таблицей:

1

2

3

4

5

6

0,9

2,59

3,67

4,45

4,95

5,20

Вариант 25

Распределение однотипных предприятий по объему произведенной за день продукции  и себестоимости единицы продукции  в условных единицах приведено в таблице:

50

100

150

200

250

300

140

120

118

110

115

100

Вариант 26

Результаты исследования зависимости объема зоны разрушения  з. р. (см3) от предела текучести  (кг/мм2) известняков приведены в таблице:

12,5

37,5

62,5

87,5

112,5

137,5

187,5

 з. р.

0,19

0,13

0,11

0,10

0,08

0,07

0,06

Вариант 27

Зависимость перепада давления  (кг/см2) (разность между гидростатическим и пластовым давлением) от времени  сек. при бурении в песчанике задана таблицей:

0,025

0,074

0,125

0,175

0,225

0,275

0,325

95

73

52

45

35

33

31

 

Вариант 28

Зависимость среднемесячной заработной платы рабочих  (тыс. руб.) нефтеперерабатывающего завода от них квалификации  (разряд) характеризуется следующими данными:

1

2

3

4

5

6

7

0,8

1,2

1,8

2,9

4,2

5,9

12,5

 

Вариант 29

Зависимость между размером предприятия по стоимости основных средств  (млн. руб.) и себестоимостью единицы продукции  (тыс. руб.) характеризуется следующими данными:

0,5

1,5

2,5

3,5

4,5

6,0

9

10

14

11

10

8

6,5

5

4,5

4

Вариант 30

Зависимость между фазовой проницаемостью нефти  и насыщенностью породы нефтью  характеризуется следующими данными:

0,35

0,45

0,55

0,65

0,75

0,85

0,05

0,1

0,15

0,45

0,55

0,75

§16. Лабораторная работа №4

Построение модельного уравнения линейной

регрессии для сгруппированных данных.

Цель работы: овладение способами построения моделей линейной регрессии для сгруппированных данных по методу наименьших квадратов и с использованием коэффициента линейной корреляции, выработка умения и навыков оценки надежности уравнения регрессии и его коэффициентов.

Содержание работы: по опытным данным требуется:

  1.  Построить корреляционное поле. По характеру расположения точек в корреляционном поле выбрать общий вид функции регрессии.
  2.  Написать уравнение линейной регрессии  на  по методу наименьших квадратов и с использованием коэффициента корреляции . Сравнить полученные уравнения и сделать вывод о выборке одного из них.
  3.  Оценить тесную связь между признаками  и  с помощью выборочного коэффициента корреляции  и его значимость.
  4.  Проверить адекватность модельного уравнения регрессии  на , записанного через коэффициент корреляции .
  5.  Проверить надежность уравнения регрессии  на , записанного через коэффициент корреляции  и его коэффициентов.
  6.  Построить уравнения регрессий в первоначальной системе координат.

Задача. Валики при черновой обработке на станке №1 передаются последовательно на станок №2 для чистовой обработки. Экспериментатор, изучающий зависимость между отклонениями размеров валиков от номинала при черновой обработке (мкм), от номинала при чистовой обработке (мкм) произвел измерения отклонений у 50 случайно отобранных валиков. Результаты измерений сведены в табл. 27.

Таблица 27

              

-30

-20

-10

0

-8

1

1

-4

4

1

5

0

1

15

1

17

4

2

13

15

8

2

1

3

12

9

9

6

18

16

10

50

Выполнение работы.

Пусть признак  характеризует отклонение размеров валиков от номинала при черновой обработке, а признак  отклонение размеров валиков от номинала при чистовой обработке. Используя данные табл. 27, строим корреляционное поле (рис. 9).

Проведя линию трэнда (пунктирная линия), видим, что число точек, расположенных над и под ней, практически одинаково, причем расстояния этих точек до линии трэнда одинаковые. Это дает основание предположить наличие линейной зависимости между признаками  и . Для подтверждения этой гипотезы перейдем от денного распределения к новому, найдя для каждого значения признак  условное среднее признака  по формуле (42):

.

При , .

При , .

При , .

При , .

Строим точки с координатами  (рис. 10).

Из рис. 10 видно, что отклонения точек от построенной прямой незначительны. Следовательно, связь между признаками  и  может носить линейный характер. Составим уравнения линий регрессий  на  по методу наименьших квадратов и через коэффициент линейной корреляции .

Применим метод наименьших квадратов к нахождению коэффициентов  и  уравнения линейной регрессии . Решаем систему нормальных уравнений (45):

.

Для нахождения сумм, входящих в систему составляем табл. 28.

Таблица 28

            

-30

-20

-10

0

-8

1

1

-8

-4

4

1

5

-20

0

1

15

1

17

0

4

2

13

15

60

8

2

1

3

24

12

9

9

108

6

18

16

10

50

164

-180

-360

-160

0

-700

5400

7200

1600

0

14200

720

-80

-680

0

-40

Пользуясь табл. 28, записываем и решаем систему уравнений:

, ,

Тогда уравнение линейной регрессии запишется в виде

      (70)

Найдем уравнение линейной регрессии  на  по формуле (47), используя коэффициент линейной корреляции:

.

Так как данные выборки для признаков  и  заданы в виде корреляционной таблицы и объем выборки , то для нахождения величин, входящих в уравнение регрессии, переходим к вспомогательному распределению с условными вариантами  и . По корреляционной табл. 27 находим наибольшую частоту совместного появления признаков  и : . Тогда , , , . Составляем корреляционную табл. 29 в условных вариантах.

Таблица 29

                 

-1

0

1

2

-2

1

1

-1

4

1

5

0

1

15

1

17

1

2

13

15

2

2

1

3

3

9

9

6

18

16

10

50

По табл. 29 находим:

,

,

,

Тогда

.

Для нахождения суммы  составляем табл. 30.

Таблица 30

                

-1

0

1

2

-2

1                   2

2

-1

4                    1

4

0

1

13                  1

13

2

2                   2

1                   4

8

3

9                   6

54

6

17

58

81

Тогда:

,

,

,

, .

Записываем уравнение линий регрессий:

или

—  на .

или

—  на .

Проверяем тесноту связи между признаками  и . Воспользуемся критерием Стьюдента. Вычисляем статистику

.

При уровне значимости  и числе степеней свободы  находим по таблице распределения Стьюдента . Так как , то выборочный коэффициент линейной корреляции  значимо отличается от нуля. Следовательно, можно считать, что отклонение размеров валиков от номинала при черновой обработке на станке №1 и отклонение размеров валиков от номинала при чистовой обработке на станке №2 связаны линейной корреляционной зависимостью. Дадим интерпретацию, например, уравнению регрессии  на . Из уравнения регрессии видно, что при отклонении от нормальных размеров валиков при черновой обработке (), например, на 10 мкм на станке №1 отклонение от нормального размера валиков при последующей чистовой обработке на станке №2 составит  мкм. Это результат воздействия отклонений при черновой обработке валиков на станке №1. Фактически отклонение может составить  мкм, что является результатом воздействия неучтенных в модели факторов, не зависящих от отклонений при черновой обработке. Уравнения линий регрессий построены на рис. 9.

Проверим полученное уравнение регрессии  на  на адекватность по критерию Фишера-Снедекора. Вычислим статистику

.

Составим расчетные табл. 2.10 и 2.11.

Таблица 2.10

-8

-11,2

125,44

-4

-7,2

51,84

0

-3,2

10,24

4

0,8

0,64

8

4,8

23,04

12

8,8

77,44

Таблица 2.11

-4

-7,2

51,84

0,2

-3

9

4,3

1,1

1,21

11,6

8,4

70,56

Находим . По условию , . Тогда

.

При уровне значимости  и числах степеней свободы ,  по таблице критических точек распределения Фишера-Снедекора находим . Так как , то модель линейной регрессии  согласуется с опытными данными.

Итак, мы получили два уравнения линейной регрессии  на , описывающих зависимость между признаками  и . При подстановке в каждое из них опытных значений признака  убеждаемся в том, что уравнение (70), полученное по методу наименьших квадратов без использования коэффициента линейной корреляции , дает лучшие значения признака , чем уравнение (71). Однако практика решения инженерных задач, связанных с построением однофакторных моделей линейной регрессии показывает, что не всегда уравнения, полученные без применения коэффициента корреляции , лучше уравнений с его применением. Поэтому, проводя моделирование в случае сгруппированных экспериментальных данных, следует строить обе модели линейной регрессии и выбирать лучшую из них.

§17. Нелинейная корреляционная зависимость

Между изучаемыми признаками  и  может существовать нелинейная корреляционная зависимости. Различают следующие виды нелинейной корреляции: параболическую, гиперболическую, экспоненциальную и другие.

Путь зависимость между признаками   и  задана в виде корреляционной таблицы. Для определения типа нелинейной в системе координат на плоскости строят точки . Если точки в корреляционном поле располагаются вблизи некоторой параболы, то уравнение регрессии записывают в виде

.         (72)

Оценка , ,  для неизвестных параметров истинного уравнения регрессии находят по методу наименьших квадратов. Если опытные данные не сгруппированы в корреляционную, то оценки находят, решая систему нормальных уравнений

      (73)

Для сгруппированных значений признаков  и  оценки , ,  находят, решая систему, нормальных уравнений

  (74)

Зависимость между  и  может быть близкой к гиперболической. В этом случае уравнение регрессии ищут в виде

         (75)

Оценки  и  неизвестных параметров истинного уравнения регрессии находят по методу наименьших квадратов, решая систему нормальных уравнений

     (76)

где  — сумма величин, обратных значениям ,  сумма их квадратов,  — сумма величин ,  — сумма отношений значений  к .

Если гиперболическая зависимость между признаками  и  имеет вид

          (77)

то оценки  и  находят, решая систему нормальных уравнений

      (78)

Если зависимость между признаками имеет экспоненциальный характер, то уравнение регрессии ищут в виде

         (79)

Для определения оценок  и  входящих в уравнение регрессии решают систему нормальных уравнений

           (80)

Если в корреляционном поле около построенных точек предполагается проведение разных по типу линий (параболы, гиперболы, экспоненты, логарифмики), то для выбора одной из них, характеризующей наилучшим образом зависимость между признаками  и , применяют либо метод конечных разностей, либо производят проверку необходимых условий.

Проверка необходимых условий

Проверку необходимых условий для выбора одной из предполагаемых нелинейных зависимостей проводят, пользуясь табл. 33.

Таблица 33

Необходимые условия

Вид формулы

Способ выравнивания

(приведения к линейной зависимости)

,,

, ,

, ,

, ,

, ,

, ,

, ,

Если выполняется одно из условий первого столбца таблицы, то выбирают в качестве предполагаемой формулы соответствующую формулу, стоящую во втором столбце таблицы рассматриваемой строки. В третьем столбце указывается способ выравнивания, то есть приведения изучаемой зависимости к линейной. Если выравненные точки  хорошо ложатся на прямую, то указанную во втором столбец таблицы зависимость принимаем в качестве предполагаемой.

Если значения функции, вычисленные в первом столбце таблицы при выбранных значениях аргумента отсутствуют в таблице опытных данных, то их находят линейным интерполированием по формуле

,       (81)

где  и  — два рядом стоящих значения признака  в таблице опытных данных, между которыми находится значение , вычисленное по табл. 33 первого столбца.

Для всех предполагаемых формул по результатам первого столбца табл. 33 вычисляют отклонения  правой части от левой необходимого условия. Вычисленные отклонения  сравнивают и по наименьшему из них выбирают окончательно одну из формул.

Метод конечных разностей.

Пусть в корреляционном поле могут быть проведены линии, описываемые уравнениями , , , , . Все эти формулы содержат по два параметра и могут быть приведены к формуле , пользуясь таблицей 33. Так как все зависимости, приведенные в таблице 33, сводятся к линейной, то для обоснования выбора формулы   вычисляют отношения ,  и  — конечные разности первого порядка. Аналитическим критерием выбора формулы по этому методу служит тот факт, что отношения  мало отличаются друг от друга для выбранной формулы.

Если предполагаемая формула имеет вид , то критерием выбора этой формулы являются незначительные отклонения по модулю конечных разностей второго порядка  от среднего значения этих разностей . Конечные разности находят, пользуясь табл. 34.

Таблица 33

Таблица конечных разностей

§18. Определение силы криволинейной связи

Для определения тесноты связи между признаками  и  при нелинейной корреляции используют корреляционные отношения и индекс корреляции.

Корреляционным отношением  называется величина, определяемая равенством

         (82)

где  — объем выборки,  — частота значения  признака ,  — частота значения у признака ,  — общая средняя признака ,  — условная средняя признака .

Аналогично определяется выборочное корреляционное отношение

          (83)

Корреляционные отношения обладают следующими свойствами (сформулируем свойства для , так как для , они аналогичны).

  1.  Корреляционное отношение заключено между 0 и 1, то есть

.

  1.  Если корреляционная связь между признаками  и  отсутствует, то  и обратно.
  2.  Если , то между признаками  и  существует обычная функциональная связь.
  3.  Чем ближе значение  к 1, тем сильнее корреляционная связь между признаками   и , а чем ближе  к 0, тем слабее эта зависимость.
  4.  Если  регрессия  на  является линейной.
  5.  Коэффициент линейной корреляции  не превосходит по модулю   то есть .

По коэффициенту корреляции  можно судить о наличии и тесноте линейной корреляционной связи между признаками  и . По корреляционным отношениям можно судить только о наличии и силе корреляционной связи между признаками  и , но не о форме связи, которая устанавливается из геометрических соображений.

Теснота связи между признаками  и  при любой форме корреляции может быть измерена с помощью индекса корреляции . Если опытные данные не сгруппированы в корреляционную таблицу, то индекс корреляции находят по формуле

          (84)

где  — средний квадрат отклонений фактических значений  от значений , вычисленных по уравнению регрессии;  — средний квадрат отклонений фактических значений  от их средней арифметической. Если опытные данные сгруппированы в корреляционную таблицу, то индекс корреляции находят по формуле

             (85)

        (86)

где , , ,

, .

Индекс корреляции по величине изменяется от 0 до 1. По индексу корреляции можно определять, как правило, тесноту связи между признаками  и , но не обязательно форму криволинейной связи.

§19. Проверка адекватности модели

Проверить адекватность модели — это значит установить, соответствует ли построенное уравнение регрессии опытным данным и достаточно ли включенных в уравнение факторных признаков  для описания результативного признака. Оценка значимости уравнения регрессии производится на основе дисперсионного анализа. В случае однофакторной нелинейной регрессии находят статистику  по формуле

            (87)

Оценке подвергаются не два, а  параметров уравнения регрессии, то находят статистику

            (88)

Затем при заданном уровне значимости  и числах степеней свободы ,  по таблице критических точек распределения Фишера-Снедекора находят . Если , то модель регрессии согласуется с опытными данными, в противном случае нет.

Контрольные вопросы

  1.  Записать систему нормальных уравнений для нахождения коэффициентов , ,  уравнения регрессии  в случае не сгруппированных опытных данных.
  2.  Записать система нормальных уравнений для нахождения коэффициентов , ,  уравнения регрессии  в случае сгруппированных опытных данных.
  3.  Записать системы нормальных уравнений для нахождения коэффициентов  и  уравнений регрессий  и .
  4.  Рассказать о применении необходимых условий выбора одной из предполагаемых нелинейных зависимостей.
  5.  Записать формулу нахождения значения  методом линейного интерполирования для значения , отсутствующего в таблице опытных данных.
  6.  Рассказать о применении метода конечных разностей для выбора одной из предполагаемых нелинейных зависимостей.  
  7.  Рассказать об установлении тесноты связи между признаками в случае нелинейной зависимости с помощью корреляционного отношения и индекса корреляции.
  8.  Как осуществляется проверка адекватности нелинейной регрессионной модели?

Варианты заданий по лабораторной работе №4

Вариант №1

Зависимость объема разрушенной породы  (см3) от глубины внедрения зуба  (мм) пр постоянном давлении приведены в корреляционной таблице:

0,5

1,5

2,5

3,5

4,5

0,05

5

3

8

0,15

5

3

8

0,25

8

1

9

0,35

4

8

12

0,45

9

1

10

0,55

7

7

0,65

3

3

6

5

8

15

28

4

60

Вариант №2

Распределение предприятий по объему продукции  (тыс. руб.) и по ее себестоимости  (руб.) приведено в корреляционной таблице:

1

2

3

4

5

2

1

6

7

2,5

4

6

3

13

3

3

6

4

13

3,5

2

6

3

1

12

4

3

2

5

11

13

12

9

N=50

Вариант №3

Результаты исследования зависимости среднегодового перевыполнения нормы  (%) от стажа работы  (в годах) приведены в корреляционной таблице:

2

3

4

5

6

7

5

1

1

1

3

6

2

4

1

7

7

3

10

3

16

8

3

9

2

14

9

2

5

1

8

10

1

1

2

3

8

15

14

8

2

50

Вариант №4

Фонтанную скважину исследовали на приток нефти . При различных режимах работы с замерами забойных давлений  глубинным манометром. Данные замеров приведены в корреляционной таблице:

125

135

145

155

165

175

185

195

205

11

2

2

1

5

12

2

5

4

2

1

14

13

1

3

8

6

5

2

25

14

1

5

13

10

5

1

35

15

1

9

20

8

3

1

42

16

3

9

14

5

1

32

17

1

4

7

9

3

1

25

18

2

3

4

6

2

17

19

1

2

1

3

7

5

11

19

34

51

40

24

12

6

202

Вариант №5

Зависимость коэффициента обрабатываемости  от ударной вязкости  (кг/мм2) инструментальных быстродействующих сталей задана корреляционной таблицей:

0,7

0,9

1,1

1,3

1,5

0,5

3

2

5

0,6

6

14

3

1

24

0,7

1

6

27

12

2

48

0,8

5

4

8

17

0,9

2

4

6

10

22

35

19

14

100

Вариант №6

Результаты исследования зависимости между среднемесячной выработкой продукции на одного рабочего  (тыс. руб.) и стоимостью основных производственных средств  (млн. руб.) приведены в корреляционной таблице:

0,8

0,9

1,0

1,1

1,2

1,3

9,9

2

2

10

2

2

1

5

10,1

2

1

3

10,2

1

3

2

6

10,3

2

1

1

4

10,4

2

3

5

4

5

6

3

3

3

25

Вариант №7

Распределение цилиндрических болванок по длине  (см) и по весу  (кг) приведено в корреляционной таблице:

1,05

1,15

1,25

1,35

1,45

1,55

1,65

19,5

3

2

5

22,5

1

4

4

1

10

25,5

3

3

1

7

28,5

1

3

2

6

31,5

1

2

1

1

5

34,5

1

2

3

6

37,5

2

5

7

4

6

8

6

8

8

6

46

Вариант №8

Результаты замера температуры  (˚С) смазочного масла в двигателе и температуры  (˚С) масла в коробке передач автомобиля приведены в корреляционной таблице:

6

10

14

18

22

26

15

6

1

7

21

1

5

1

7

27

2

5

7

33

6

1

7

39

5

1

6

45

2

9

11

7

8

12

6

3

9

45

Вариант №9

Результаты измерений сверл по твердости  (HRC) и по стойкости  (час) приведены в корреляционной таблице:

21,5

26,5

31,5

36,5

41,5

46,5

27

3

2

5

35

1

7

8

43

2

4

6

51

1

1

4

6

59

4

9

1

14

67

3

8

11

4

9

3

9

16

9

50

Вариант №10

Результаты измерений времени непрерывной работы  (час) и количества  (шт.) полностью обработанных деталей приведены в корреляционной таблице:

5

9

13

17

21

25

0,95

5

5

2

12

1,85

2

2

4

2,75

1

3

1

6

3,65

1

6

1

8

4,55

5

5

5

4

4

9

2

35

Вариант №11

Результаты измерений температуры смазочного масла  (˚С) в коробке передач и скорости  (км/час) автомобиля приведены в корреляционной таблице:

35,5

46,5

57,5

68,5

79,5

90,5

15,5

5

5

22,5

4

3

7

29,5

2

5

3

10

36,5

8

5

13

43,5

1

3

4

8

50,5

2

2

9

5

5

12

8

6

45

Вариант №12

Найти зависимость между средней скоростью прохождения пути  (км/час) и температурой смазочного в коробке передач у 100 автомобилей:

15

20

25

30

35

40

30

3

3

6

40

5

4

9

50

8

40

2

50

60

5

10

6

21

70

4

7

3

14

3

8

17

54

15

3

100

Вариант №13

Распределение заводов по основным фондам  (млн. руб.) и по готовой продукции  (млн. руб.) приведено в корреляционной таблице:

15

25

35

45

55

20

7

5

12

30

10

3

13

40

5

7

2

14

50

2

11

20

8

41

60

8

12

20

17

15

18

30

20

100

Вариант №14

Распределение цехов по изменению средней заработной платы  (руб.) в зависимости от изменения производительности труда  (руб.) по кварталам приведено в корреляционной таблице:

2772

2846

2920

3068

3142

3216

3500

4642

1

3

2

6

5154

2

5

2

9

5666

1

3

1

2

7

6178

1

3

3

7

6690

2

5

1

8

7202

4

4

7714

1

3

4

1

6

10

4

7

13

4

45

Вариант №15

Найти зависимость скорости бурения в твердых породах  (м/час) от нагрузки на долото  (атм.):

0

0,5

1,0

1,5

2,0

2,5

3,0

3,5

10

1

1

1

3

10,5

1

1

2

4

11

1

3

1

2

7

11,5

2

3

7

2

2

16

12

3

2

8

13

12,5

2

1

1

4

13

1

1

13,5

1

1

2

4

7

7

18

4

6

3

1

50

Вариант №16

Результаты исследования зависимости длительности  (час) непрерывной работы двигателей и расхода топлива  (литров) заданы корреляционной таблицей:

 

30

80

130

180

230

280

330

50

10

10

100

4

12

16

150

1

4

6

11

200

20

6

26

250

4

17

21

300

1

1

2

350

3

8

11

400

1

2

3

15

16

26

11

21

9

2

100

Вариант №17

Результаты измерений диаметра  (мм) трубы скважины и производительности  (м3/час) скважины приведены в корреляционной таблицы:

19

21

23

25

27

29

102,5

6

6

12

107,5

1

2

1

1

1

6

112,5

1

2

5

2

10

117,5

1

1

1

3

2

8

122,5

4

1

5

127,5

1

3

4

7

9

5

13

7

4

45

Вариант №18

Имеются данные мощности на долоте (кВт) и осевой статистической нагрузки на забое  (тс), полученные при бурении пород на одном из месторождений Тюменской области:

 

1

3

5

7

9

11

13

15

17

12,5

3

3

6

17,5

7

1

4

12

22,5

4

7

1

12

27,5

4

9

13

32,5

1

7

5

6

7

26

37,5

1

2

1

2

6

3

14

13

21

6

8

7

1

2

75

Вариант №19

Найти зависимость между средней скоростью прохождения пути  (км/ч) и температурой смазочного масла в коробке передач у 100 автомобилей.

15

20

25

30

35

40

30

3

3

6

40

5

4

9

50

8

40

2

50

60

5

10

6

21

70

4

7

3

14

3

8

17

54

15

3

100

Вариант №20

Распределение 50 рабочих по выполнению сменного задания  и по повышению производительности труда  (%) дается следующей таблицей:

24

27

30

33

36

120

1

3

4

125

2

6

1

9

130

1

5

5

11

135

1

6

7

2

16

140

1

4

2

7

145

1

1

2

1

7

18

18

6

50

Вариант №21

Результаты исследования зависимости между средней месячной выработкой продукции  (тыс.руб.) на одного рабочего и стоимостью основных производственных средств   (млн. руб.) приведены в корреляционной таблице:

0,8

0,9

1,0

1,1

1,2

1,3

9,9

2

2

10

2

2

1

5

10,1

2

10

12

10,2

1

3

2

6

10,3

2

2

1

5

10,4

2

3

5

4

5

16

4

3

3

35

Вариант №22

Результаты исследования зависимости относительной проницаемости нефти

от насыщенности пород нефтью  приведены в корреляционной таблице:

0,05

0,15

0,25

0,35

0,45

0,55

0,65

0,25

1

1

0,35

5

3

8

0,45

3

2

1

6

0,55

5

3

4

12

0,65

6

5

11

0,75

2

3

5

0,85

3

4

7

9

10

4

10

7

6

4

50

Вариант №23

Зависимость скорости отскока инструмента  (м/сек) при ударно-вращательном бурении от коэффициента пластичности долот  заданы в корреляционной таблице:

1,5

2,5

3,5

4,5

5,5

6,5

0,2

4

6

3

13

0,4

9

2

2

4

17

0,6

2

7

9

2

20

0,8

3

6

9

1,0

3

2

5

8

24

11

8

10

3

64

Вариант №24

Результаты исследования зависимости выпуска валовой продукции  (%) в отчетном году и выработкой на одного рабочего  (%) приведены в корреляционной таблице:

85

95

105

115

125

135

95

5

4

9

105

2

5

22

29

115

2

6

13

21

125

1

2

5

8

135

15

2

17

145

2

12

2

16

7

11

29

32

19

2

100

Вариант №25

Распределение предприятий по основным фондам  (млн. руб.) и себестоимости единицы продукции  (тыс. руб.) приведено в корреляционной таблице:

1,25

1,5

1,75

2

2,25

8

1

2

3

6

13

1

4

3

8

18

4

7

1

12

23

2

7

5

14

28

6

4

10

8

15

14

7

6

50

Вариант №26

Распределение 100 автомобилей по температуре смазочного масла в двигателе  и по температуре масла в коробке передач  даны в корреляционной таблице:

5

10

15

20

25

30

15

2

4

6

25

6

2

8

35

3

50

2

55

45

1

10

6

17

55

4

7

3

14

2

10

6

64

15

3

100

Вариант №27

Результаты исследования зависимости среднегодового перевыполнения нормы  (%) от стажа работы  (в годах) приведены в корреляционной таблице:

2

3

4

5

6

7

5

1

1

1

3

6

2

4

1

7

7

3

10

3

16

8

3

9

2

14

9

2

5

1

8

10

1

1

2

3

8

15

14

8

2

50

Вариант №28

Фонтанная скважина исследована на приток изменением диаметра штуцера с замером глубинных давлений регистрирующим манометром. Результаты зависимости изменения дебита  (т/сут.) скважины от изменения давления  (атм.) приведены в корреляционной таблице:

150

200

250

300

350

400

450

500

550

5

2

1

3

10

2

3

1

6

15

1

2

4

3

10

20

1

5

7

6

19

25

3

4

9

6

22

30

2

2

4

5

3

16

35

4

4

2

1

11

40

1

4

3

2

10

45

1

2

3

5

7

15

20

24

17

7

3

2

100

Вариант №29

Имеют данные распределения 100 автомобилей по температуре смазочного масла в двигателе  и по скорости движения (км/час) :

10

15

20

25

30

35

20

1

5

6

30

6

4

10

40

7

40

3

50

50

2

10

8

20

60

5

6

3

14

1

11

13

55

17

3

100

Вариант №30

Результаты зависимости между дебитом  (м3/час) скважины и диаметром штуцера  (мм) приведены в корреляционной таблице:

18

21

24

27

30

33

36

100

6

3

9

105

1

5

4

10

110

7

6

2

15

115

1

5

3

9

120

4

9

2

1

16

125

4

3

7

130

2

1

1

4

7

16

19

18

7

2

1

70

§20. Лабораторная работа № 5

Цель работы: овладение способами выбора модельного уравнения нелинейной регрессии, выработка умения и навыков расчета параметров уравнения, проверка его надежности.

Содержание работы: На основании опытных данных требуется:

  1.  Построить корреляционное поле. По характеру расположения точек в корреляционном поле подобрать вид функции регрессии.
  2.  Написать уравнение функции регрессии.
  3.  Определить тесноту корреляционной связи между рассматриваемыми признаками.
  4.  Проверить адекватность модели.
  5.  Построить кривую регрессии в системе координат.

Задача. При обработке металлов резанием устанавливается зависимость резания металла от различных характеристик резца и стружки. Зависимость скорости резания  (м/мин.) и площади поперечного сечения  стружки  (мм2) при обработке хромоникелевой стали задана табл. 35.

Таблица 35

1,1

1,4

1,7

2,1

2,6

4,7

6,1

7,0

10

12,8

25

22,7

22,1

19,8

17

12,3

10,7

10

8,2

6,7

Выполнение работы

В системе координат   строим корреляционное поле (рис. 11).

Рис. 11

По расположению точек в корреляционном поле видно, что около них можно провести ветвь гиперболы. Следовательно, уравнение функции регрессии будем искать в виде (75) или (77). Для выбора одного из этих уравнений применим необходимые условия. Для формулы по табл. 33 проверяем выполнение равенства .

.

Значение  находим линейным интерполированием по формуле (81):

.

.

Вычисляем отклонение : . Для формулы  проверяем выполнение равенства .

.

Значение  находим линейным интерполированием:

.

Вычисляем отклонение : . Так как , то по методу необходимых условий выбираем формулу .

Произведем выбор одной из выше рассматриваемых формул по методу конечных разностей. Пусть . Сводим эту зависимость к линейной , где ,  (смотри таблицу). Вычисляем отношения . Составляем расчетную таблицу 36.

Таблица 36

1,1

1,4

1,7

2,1

2,6

4,7

6,1

7,0

10

12,8

25

22,7

22,1

19,8

17

12,3

10,7

10

8,2

6,7

27,5

31,78

37,57

41,58

44,2

57,81

65,27

70

82

85,76

4,28

5,79

4,01

2,62

13,61

7,46

4,73

12

3,76

0,3

0,3

0,4

0,5

2,1

1,4

0,9

3

2,8

14,27

19,3

10,02

5,24

6,48

5,33

5,26

4

1,34

Рассмотрим зависимость . Пользуясь таблицей 33, сводим нелинейную зависимость к линейной , где , .Для нахождения отношений  составляем расчетную таблицу 37.

Таблица 37

1,1

1,4

1,7

2,1

2,6

4,7

6,1

7,0

10

12,8

25

22,7

22,1

19,8

17

12,3

10,7

10

8,2

6,7

0,04

0,044

0,045

0,05

0,059

0,081

0,093

0,1

0,12

0,15

0,004

0,001

0,005

0,009

0,022

0,012

0,007

0,02

0,03

0,3

0,3

0,4

0,5

2,1

1,4

0,9

3

2,8

0,013

0,003

0,012

0,018

0,01

0,008

0,008

0,007

0,011

Отношения , полученные для формулы мало отличаются друг от друга, чем для формулы . Поэтому по методу конечных разностей в качестве лучшей выбираем формулу . К такому же выводу мы пришли, применяя метод необходимых условий. Итак, зависимость скорости резания от площади поперечного сечения стружки при обработке хромоникелевой стали выражается формулой . Оценки  и  неизвестных параметров истинного уравнения регрессии находим, решая систему нормальных уравнений (78):

Для начисления сумм, входящих в систему, составляем расчетную табл. 38.

Таблица 38

1,1

25

0,04

0,044

1,21

1,4

22,7

0,044053

0,061674

1,96

1,7

22,1

0,045549

0,076923

2,89

2,1

19,8

0,050505

0,106061

4,41

2,6

17

0,058824

0,152941

6,76

4,7

12,3

0,081301

0,382114

22,09

6,1

10,7

0,093458

0,570093

37,21

7,0

10

0,1

0,7

49

10

8,2

0,121951

1,21951

100

12,8

6,7

0,149254

1,910448

163,84

39,6

0,784595

5,223764

389,37

Решаем систему уравнений:

, , .

Уравнение регрессии примет вид:

.

Оценим силу корреляционной связи между скоростью резания и площадью поперечного сечения стружки хромоникелевой стали. Вычислим индекс корреляции по формуле (84):

, где ,  (так как ). Для нахождения  и  составляем расчетную табл. 39.

Таблица 39

1,1

25

19

36

91,2025

1,4

22,7

18

22,09

52,5625

1,7

22,1

17,2

24,01

44,2225

2,1

19,8

16,2

12,96

18,9225

2,6

17

15,1

3,61

2,4025

4,7

12,3

11,7

0,36

9,9225

6,1

10,7

10,2

0,25

22,5625

7,0

10

9,4

0,36

29,7025

10

8,2

7,5

0,49

52,5625

12,8

6,7

6,3

0,16

76,5625

100,29

Тогда .

Связь между скоростью резания и площадью поперечного сечения стружки хромоникелевой стали сильная.

Проверяем адекватность полученного уравнения регрессии по критерию Фишера-Снедекора. Находим статистику

.

При уровне значимости  и числах степеней свободы ,  по таблице критических точек распределения Фишера-Снедекора находим . Так как , то модель адекватна. Следовательно, зависимость скорости резания от площади поперечного сечения стружки при обработке хромоникелевой стали по данным выборки описывается уравнением .

Варианты заданий по лабораторной работе №5

Вариант №1

При исследовании зависимости между средней заработной платой на одного работника  (тыс. руб.) и выпуском продукции на одного работника  (тыс. руб.) по заводу Пластмасс получены следующие данные:

21,07

23,07

28,69

22,42

21,41

18,49

21,64

39,19

51,96

42,36

51,80

50,45

30,2

47,0

29,6

39,5

43,9

47,6

46,6

28,7

10,8

16,97

20,10

23,80

Вариант №2

Данные о производстве дизтоплива  (тыс. руб.) и себестоимости единицы продукции   (тыс. руб.) по ПО «Уренгойгазпром» приведены в таблице:

5

6

8

13

34

72

95

113

127

90

143

125

87

45

33

27

16

25

24

27

Вариант №3

При обработке металлов резанием устанавливается зависимость скорости резания металла от различных характеристик резца и стружки. Зависимость скорости резания  (м/мин.) и площади поперечного сечения стружки  (мм2) пр обработке хромоникелевой стали заданы таблицей:

1,1

1,4

1,7

2,1

2,6

4,7

6,1

7

10

12,8

25

22,7

22,1

19,8

17

12,3

10,7

10

8,2

6,7

Вариант №4

Данные зависимости мощности на долоте  (кВт) от осевой статистической нагрузки на забой  (тс) при бурении пород Подольского горизонта Туймазинского месторождения приведены в таблице:

1

3

5

7

9

11

13

15

17

12,5

17,8

37

41,9

45

47

39

32

23

Вариант №5

Зависимость скорости отскока инструмента  (м/с) при ударно-вращательном бурении от коэффициента пластичности долот  задана таблицей:  

1,5

2,5

3,5

4,5

5,5

6,5

1,2

0,6

0,21

0,9

0,8

0,75

Вариант №6

Данные о количестве выпускаемых деталей  (тыс. руб.) и полных затратах на их изготовление  (сотни руб.) на однотипных предприятиях приведены в таблице:

1

2

4

9

13

18

20

26

22

19

12

9

8

6

Вариант №7

При исследовании зависимости времени на обработку одной детали  (мин.) от стажа работы  (в годах) на Тюменском моторостроительном объединении в цехе резиново-технических и пластмассовых изделий на слесарном участке получены следующие данные:

1

2

3

4

5

6

7

5

3,33

2,9

2,2

2,1

2

2

Вариант №8

Зависимость удельного момента на долоте  (кгс·м/тс) от осевой статистической нагрузки на забой  (тс) при бурении пород задана таблицей:

1

3

5

7

9

11

13

15

22,5

11,5

6

5,5

2,6

2,4

2,1

2

Вариант №9

Результаты измерений зависимости фазовой проницаемости воды  от нефтенасыщенности  породы приведены в таблице:

0,25

0,35

0,45

0,55

0,65

0,75

0,85

0,65

0,45

0,25

0,15

0,10

0,05

0,07

Вариант №10

В результате исследований установлено, что между овальностью колец после их обработки  и термической обработки , существует связь, которая задана таблицей:

5

10

15

20

25

21

29,3

36

38

39,2

Вариант №11

При исследовании зависимости между выпуском готовой продукции  (тыс. руб.) и коэффициентом использования техники  (%) получены следующие данные:

73

75

79

82

83

86

80

85

95

93

97

77

14

21

29

30

315

35

34

41

38

39

46

27

Вариант №12

Давление  (кг) воздуха парашют возрастает при увеличении скорости  (м/сек.) падения следующим образом:

2,23

3,28

4,65

6,5

8,1

0,3

0,6

1,2

2,4

4,2

Вариант №13

Прочность бетона  (кг/см2) при испытании цилиндрических образцов в зависимости от отношения  высоты к диаметру  оказалась равной:

0,5

1,0

2,0

3,0

4,0

5,0

6,0

290

250

216

206

200

195

190

Вариант №14

Зависимость между размером предприятия по стоимости основных средств  (млн. руб.) и себестоимостью единицы продукции  (руб.) характеризуется следующими данными:

0,5

1,5

2,5

3,5

4,5

5,5

7,5

15

11

12

10,8

10

9

8

Вариант №15

Зависимость между ростом производительности труда на одного работающего  (тыс. руб.) и выпуском товарной продукции   (тыс. руб.) ремонтного цеха машиностроительного завода характеризуется следующими данными:

 

1,5

2,9

3,0

3,1

3,2

3,4

3,5

3,6

4,2

580

618

658

670

662

699

717

775

786

Вариант №16

Зависимость себестоимости продукции  (тыс. руб.) от затрат на единицу продукции  (тыс. руб.) по объединению «Сибкомплектмонтаж» характеризуется следующими данными:

0,1

0,4

1

4

6

10

20

25

2248

1950

1500

1020

906

290

175

121

Вариант №17

Компрессорную скважину исследовали на приток нефти  (т/сут.) при различных режимах работы с замером забойных давлений  (атм) глубинным манометром. Результаты исследований приведены в таблице:

 

5

15

25

35

45

55

1,25

1,3

5,25

11,25

17,25

21,25

Вариант №18

Зависимость между стоимостью основных средств предприятия  (млн. руб.) и выработкой продукции  (тыс. руб.) на одного работника характеризуется следующими данными:

1

1,5

2,5

3,5

4,5

5,5

6,5

4

6

6,8

7,9

8,7

9

9,5

Вариант №19

Ниже приводятся данные удельного момента на долото   (кг·м/тс) и осевой статистической нагрузки на забой  (тс) при бурении пород на одном из месторождений Тюменской области:

 

1

3

5

7

9

11

13

15

17

25

15

12

8

10

5

4,5

3

2,8

Вариант №20

Зависимость между мощностью предприятия  (млн. ед. продукции в год) и фактическими капитальными вложениями  (млн. руб.) характеризуется следующими данными:

1

2

3

4

5

6

1,2

2,6

3,8

4,6

4,9

5,4

Вариант №21

Результаты изучения зависимости между среднемесячной производительностью  труда рабочего   (руб.) и себестоимостью одной тонны продукции  (руб.) приведены в следующей таблице:

21

24

30

34

35

36

39

40

20

13

12

13

11

10

11

10

Вариант №22

Энерговооруженность труда на одного рабочего  (тыс. кВт-час) и производительность труда одного рабочего  (тыс. штук) изделий на ряде предприятий характеризуется следующими данными:

3

3,05

3,6

4,25

4,45

4,55

1

1,5

1,8

2,5

3

4

Вариант №23

Зависимость между стоимостью основных средств предприятий и месячным выпуском продукции характеризуется следующими данными:

Стоимость основных средств,  (млн. руб.)

1

2

3

4

5

6

7

Месячный выпуск продукции, , (тыс. руб)

10

12

28

40

42

52

54

Вариант №24

Зависимость между капитальными вложениями  (млн. руб.) и мощностью предприятий данного типа  (млн. тонн) продукции задана таблицей:

1

2

3

4

5

6

0,9

2,59

3,67

4,45

4,95

5,20

Вариант №25

Распределение однотипных предприятий по объему произведенной за день продукции  и себестоимости единицы продукции  в условных единицах приведено в таблице:

 

50

100

150

200

250

300

140

120

118

110

115

100

Вариант №26

Результаты исследования зависимости объема зоны разрушения  (см3) от предела текучести  (кг/мм2) известняков приведены в таблице в таблице:

12,5

37,5

62,5

87,5

112,5

137,5

187,5

0,19

0,13

0,11

0,10

0,08

0,07

0,06

Вариант №27

Зависимость перепада давления  (кг/см2) (разность между  гидростатическим и пластовым давлением) от времени  сек. при бурении в песчанике задана таблицей:

 

0,025

0,074

0,125

0,175

0,225

0,275

0,325

95

73

52

45

35

33

31

Вариант №28

Зависимость среднемесячной заработной платы рабочих  (тыс. руб.) нефтеперерабатывающего завода от их квалификации  (разряд) характеризуется следующими данными:

1

2

3

4

5

6

7

0,8

1,2

1,8

2,9

4,2

5,9

12,5

Вариант №29

Зависимость между размером предприятия по стоимости основных средств  (млн. руб.) и себестоимостью единицы продукции  (тыс. руб.) характеризуется следующими данными:

0,5

1,5

2,5

3,5

4,5

6,0

9

10

14

11

10

8

605

5

4,5

4

Вариант №30

Зависимость между фазовой проницаемостью нефти  и насыщенностью породы нефтью  характеризуется следующими данными:

0,35

0,45

0,55

0,65

0,75

0,85

0,05

0,1

0,15

0,45

0,55

0,75

§21. Множественная регрессия

Производственные взаимосвязи, как правило, определяются большим числом одновременно и совокупно действующих факторов. Например, овальность после чистового шлифования зависит от припуска на чистовое шлифование и от овальности после предварительного шлифования. Себестоимость продукции зависит от стоимости материала, основной зарплаты рабочих, премиальных, расходов на содержание оборудования, отчислений на соцстрахование. В связи с этим возникает задача исследования зависимости между факторными признаками (называемыми также регрессорами или предикторами) , , . . .,  и результативным признаком . Для этого используется множественный регрессионный анализ.

Построение многофакторной регрессионной модели начинается с установления формы связи, используя графический метод для пространства  и метод перебора различных уравнений. От правильности выбора вида уравнения зависит, насколько построенная модель будет адекватна не только имеющимся экспериментальным данным, но и истинной зависимости между изучаемыми показателями. При прочих равных условиях предпочтение отдается модели, зависящей от меньшего числа параметров, так как для их оценки требуется меньшее количество эмпирических  данных.

После выбора формы многофакторной регрессионной модели проводят отбор факторных признаков и включение их в модель. Принято считать, что в уравнение множественной регрессии можно включать только независимые друг от друга факторные признаки . Практически факторные признаки зависят либо слабо, либо сильно. Поэтому вопрос о включении факторных признаков в уравнение регрессии решает следующим образом. Пусть, например, имеется три факторных признака , , , влияющих на результативный признак  и модель является линейной. Чтобы выяснить, какие факторные признаки включить в модель, находят коэффициенты парной корреляции , , . Если их значения меньше , то их можно включить в модель. Если же их значение больше , то следует какие-то из этих факторов исключить из модели. Пусть, например, . Ясно, что какой-то из признаков  или  надо исключить из модели. Для этого находят парные коэффициенты корреляции между каждым из факторов  и  и результативным признаком , то есть вычисляют  и . Затем сравнивают  и . Пусть оказалось, что . Это означает, что факторный признак  сильнее связан с результативным признаком , чем признак . Поэтому фактор  следует включить в модель, а  исключить из нее. Этот вывод подтверждаем путем вычисления коэффициентов частной корреляции  и . При исключении факторов из модели можно руководствоваться правилом. Если , где

,      (89)

то один из факторов, либо , либо  следует исключить.

Рассмотрим случай построения многофакторной модели, когда результативный признак  зависит от двух факторных признаков  и . Если зависимость между ними носит линейный характер, то уравнение регрессии записывают в виде

.              (90)

Коэффициенты уравнения регрессии (90) , ,  находят по методу наименьших квадратов, решая систему нормальных уравнений

.      (91)

Коэффициенты , ,  можно находить по формулам

,       (92)

,       (93)

.             (94)

Здесь , ,  — коэффициенты парной корреляции между признаками  и ,  и ,  и ; , ,  — средние квадратические отклонения; , ,  — средние признаков , , .

Если уравнение линейной регрессии имеет вид

  (95)

то коэффициенты , , , . . .,  находят решая систему нормальных уравнений

      (96)

В матричной форме система (96) примет вид

       (97)

где  — матрица значений факторных признаков или матрица плана размерности ;  — транспортированная матрица ;  — матрица коэффициентов системы нормальных уравнений (96) размерности ;  — матрица-столбец значений результативного признака  размерности ;  — матрица-столбец свободных членов системы (97) размерности . Для оценки надежности коэффициентов , , , . . .,  находят средние квадратические ошибки этих коэффициентов, то есть находят  . Пусть  — матрица коэффициентов при переменных  системы (97), обратная матрице . Тогда средние квадрвтические ошибки коэффициентов  вычисляют по формуле

       (98)

где

,  — диагональный элемент матрицы , соответствующий факторному признаку .

Пример.

По опытным данным найдены

,

и уравнение регрессии . Вычислить средние квадратические ошибки коэффициентов уравнения регрессии.

Воспользуемся формулой (98). Учитывая условие задачи, находим , , , . Тогда

, ,

, .

Записываем уравнение регрессии и под коэффициентами их полученные ошибки:

   (25,826) (0,871)    (0,436)    (0,533)

§22. Измерение тесноты связи множественной линейной регрессии

За меру тесноты линейной связи между факторными и результативным признаками в совокупности принимают множественный или совокупный коэффициент корреляции , который вычисляют по формуле:

    (99)

где

— остаточная дисперсия;

— общая дисперсия результативного признака.

Множественный коэффициент корреляции можно рассчитать, используя парные коэффициенты корреляции. Так, например, для линейной множественной регрессии между , ,  коэффициент  вычисляют по формуле

.  (100)

Множественный коэффициент корреляции можно получить на основе вычисления определителей, составленных из парных коэффициентов корреляции:

, ,   (101)

Множественный коэффициент корреляции обладает следующими свойствами:

  1.  Коэффициент множественной корреляции заключен в пределах .
  2.  Если , то линейная корреляционная связь между признаками  и  отсутствует, но другая зависимость (функциональная или нелинейная корреляционная) между ними может существовать.
  3.  Если , то между факторами  и  существует функциональная линейная зависимость.

Величину множественного коэффициента корреляции корректируют, т.к. при малом числе наблюдений значение  получается завышенным. Корректировку осуществляют по формуле

,          (102)

где  — скорректированное значение ,  — число наблюдений,  — число факторных признаков. Корректировка  не производится при условии, если . Для коэффициента множественной корреляции определяют среднеквадратическую ошибку по формуле:

       (103)

Если выполняется неравенство , то с вероятностью  можно считать  значимым

Наряду с определением показателя, отражающего тесноту связи результативного признака  с факторными, вместе взятыми, определяют степень влияния каждого фактора в отдельности на изменение результативного фактора с помощью коэффициентов частной корреляции. Если уравнение множественной линейной регрессии между факторами ,  и  имеет вид (90), то коэффициенты частной корреляции рассчитывают по формулам:

,           (104)

,           (105)

Если линейная регрессия имеет вид

,    (106)

то частные коэффициенты корреляции находят по формуле:

,        (107)

где . Для общего случая

       (108)

Если в корреляционную модель включено  факторных признаков, воздействующих на результативный признак , то коэффициент частной корреляции, например, для первого фактора можно определить по формуле

,      (190)

где

— средний квадрат отклонений фактических значений признака  от значений, по формуле с учетом всех факторных признаков;

— средний квадрат отклонений фактических значений признака  от значений, вычисленных по формуле, включающей все факторы кроме первого.

Коэффициенты частной корреляции изменяются от 0 до 1 и обладают всеми свойствами парного коэффициента корреляции. Коэффициенту частной корреляции приписывается тот же знак, который имеет в уравнении множественной линейной регрессии коэффициент регрессии  при соответствующем факторном признаке  

§23. Проверка адекватности модели

множественной регрессии

Адекватность модели означает не только количественное, но, прежде всего, качественное соответствие описания объекта. Для проверки соответствия полученного уравнения множественной линейной регрессии опытным данным используют коэффициент множественной регрессии . Если , то модель полностью не адекватна. Если , то модель в общем и в целом воспроизводит свойства моделируемого объекта. Количественным показателем адекватности модели служит коэффициент детерминации , который показывает долю дисперсии, объясняемой данной моделью в общей дисперсии. Адекватность построенной модели может быть проверена по критерию Фишера-Снедекора. Для этого вычисляют статистику  по формуле

            (110)

где  — объем выборки;  — число факторных признаков, включенных в модель. Затем находят при заданном уровне значимости  и числах степеней свободы ,  по таблице критических точек распределения Фишера . Если , то модель регрессии согласуется с опытными данными, если же , то модель регрессии не согласуется с данными эксперимента.

Адекватность модели множественной регрессии можно определять по средней ошибке аппроксимации

       (111)

§24. Экономическая интерпретация уравнения регрессии

Заключительным этапом, завершающим построение регрессионной модели, является интерпретация полученного уравнения регрессии, то есть перевод его с языка статики и математики на язык экономиста. Интерпретация начинается с выяснения, как каждый факторный признак, входящий в модель, влияет на величину результативного признака. Чем больше величина коэффициента  регрессии, тем сильнее фактор  влияет на результативный признак . Знаки коэффициентов регрессии  говорят о характере влияния на результативный признак. Если коэффициент  имеет знак (+), то с увеличением данного фактора  результативный фактор  возрастает. Если коэффициент  имеет знак (-), то с увеличением данного фактора  результативный признак уменьшается. Интерпретация знаков зависит от экономической сущности результативного признака. Если величина результативного признака должна изменяться в сторону увеличения (объем реализованной продукции, фондоотдача, производительность труда и т.д.), то плюсовые знаки коэффициентов  свидетельствуют о положительном влиянии соответствующих факторов. Если величина результативного признака изменяется в сторону снижения (себестоимость продукции, материалоемкость, простои оборудования и т.д.), то в этом случае положительное влияние на результативный признак будут оказывать факторы, коэффициенты, которых отрицательны.

Если экономический анализ подсказывает, что факторный признак должен влиять положительно, а коэффициент при нем имеет знак (-), то необходимо проверить расчеты. Так получается за счет допущенных ошибок при решении и в силу наличия взаимосвязей между факторными признаками, включенными в модель, влияющих в совокупности на результативный признак.

 При построении регрессионной модели можно рекомендовать следующий алгоритм выполнения операций (рис.12):

Контрольные вопросы.

1. Рассказать о механизме включения факторных признаков в модель множественной линейной регрессии.

2. Как найти коэффициенты , ,  уравнения регрессии ?

3. Записать модельное уравнение множественной линейной регрессии для  случая, когда в модель включено четыре фактора.

4. Записать систему нормальных уравнений для уравнения  .

5. Как определяется надежность коэффициентов уравнения множественной линейной регрессии?

6. Как решается вопрос об измерении тесноты связи между факторными и результативными признаками в случае множественной линейной регрессии?

7. Как осуществляется корректировка множественного коэффициента корреляции?

8. Как определить степень влияния каждого факторного признака в отдельности, включенного в модельное уравнение множественной линейной регрессии, на изменение результативного признака?

9. Рассказать, как осуществляется проверка адекватности модели множественной линейной регрессии.

10. Рассказать об экономической интерпретации уравнения множественной линейной регрессии.

Лабораторная работа №6.

Построение модели множественной

линейной регрессии.

Цель работы: овладение способами построения модели множественной линейной регрессии, выработка умений и навыков нахождения параметров уравнения, оценки надежности уравнения регрессии и его параметров, проведения экономической интерпретации полученных результатов.

Содержание работы: на основании опытных данных требуется:

  1.  Определить форму связи между факторными и результативными признаками, построив корреляционные поля на плоскости для каждой пары факторов. Записать уравнение модели множественной регрессии.
  2.  Произвести отбор факторов, включаемых в модель.
  3.  Определить тесноту связи между факторами, включенными в модель множественной линейной регрессии.
  4.  Найти оценки уравнения регрессии по методу наименьших квадратов.
  5.  Проверить адекватность полученного модельного уравнения регрессии тремя способами:

– с помощью коэффициента детерминации ;

– по критерию Фишера;

– с помощью средней ошибки аппроксимации.

  1.  Определить воздействие неучтенных в модели факторов.
  2.  Дать экономическую интерпретацию найденных оценок уравнения регрессии.

Задачи. Исходные данные для признаков , , ,  приведены в табл. 40:

Таблица 40

Признаки

Значение признаков на различных НГДУ

0,92

0,93

0,89

0,90

0,90

0,89

0,92

0,91

0,93

0,89

45

47

42

46

43

45

48

46

48

44

69

71

64

66

65

63

68

66

69

65

35

36

31

33

34

32

38

34

37

33

В таблице обозначено:  — коэффициент эксплуатации скважин;  — дебит скважин (тн/сут.);   — уровень автоматизации труда (%);  — производительность труда (тн/чел.).

Определим форму связи. Для чего строим корреляционные поля (рис. 13-18).

Рис. 13

Рис. 14

Рис. 15

Рис. 16

Рис. 17

Рис. 18

По построенным корреляционным полям можно предположить, что зависимость между факторными признаками , ,  и результативным признаком  может носить прямолинейный характер. Решим вопрос о включении факторных признаков , ,  в уравнение линейной регрессии. Найдем коэффициенты парной корреляции по формуле (53). Предварительно составим расчетную таблицу 41. Пользуясь таблицей 41 и формулами (49) — (50), находим:

, .

, .

, .

, .

.

Табл.

По найденным коэффициентам парной корреляции видно, что сильно коррелируют между собой факторы  или .Для решения вопроса о том, какой из факторов  или  следует исключить из модели множественной линейной регрессии, вычислим коэффициенты парной корреляции и :

Так как ,то между признаками  и  связь сильнее, чем между  и .Этот факт подтверждается путем вычисления коэффициентов частной корреляции и  по формуле (104):

Поэтому из модели множественной линейной регрессии исключаем фактор . Тогда в модель будут включены факторы  и  и уравнение регрессии запишется в виде

.

Включение фактора  в модель обосновано значимостью коэффициента парной корреляции :

Для выяснения вопроса о силе линейной связи между факторами, включенными в модель, вычисляем множественный коэффициент корреляции R по формуле (100):

Так как в нашем примере объем выборки небольшой (), то произведем корректировку R по формуле (102):

Проверяем значимость  по критерию Стьюдента. Вычисляем среднеквадратическую ошибку  по формуле (103):

Вычисляем статику

По таблице критических точек распределения Стьюдента  при уровне значимости  с числом степеней свободы  находим  Так как , то делаем вывод, что  значим.

Для нахождения оценок , ,  уравнения регрессии  решаем систему нормальных уравнений по формуле (91):

        (112)

Решив эту систему, получаем ,,.

Тогда уравнение регрессии, устанавливающее зависимость производительности труда  от коэффициента эксплуатации  и дебита скважин  запишется в виде .

Проверяем адекватность уравнения регрессии. Используем коэффициент детерминации , полагая . Для полученной модели . Это означает, что полученная модель приблизительно на 66% объясняет изменение производительности труда в зависимости от изменения включенных в модель факторов  и , что является не плохим показателем.

Проведем проверку модели на адекватность по критерию Фишера-Снедекора. Найдем статистику  по формуле (110), полагая в ней :

. По таблице критических точек распределения Фишера-Снедекора при уровне значимости  и числах степеней свободы ,  (p — число факторов , включенных в модель, nобъем выборки) находим . Так как , то найденное уравнение регрессии, устанавливающее зависимость производительности труда на десяти нефтегазодобывающих управлениях (НГДУ) от коэффициента эксплуатации скважин  и дебита скважин , значимо описывает опытные данные и может быть принято для руководства.

Оценим адекватность уравнения регрессии по средней ошибке аппроксимации , которую вычислим по формуле (111):

.

Для нахождения суммы, входящей в формулу, составляем расчетную табл. 42.

Таблица 42

35

35,2

0,2

0,000114

36

36,8

0,8

0,017778

31

31,5

0,5

0,005952

33

33,8

0,8

0,019394

34

32,7

1,3

0,049706

32

32,6

0,6

0,008

38

36,3

1,7

0,076053

34

34,7

0,7

0,014412

37

37,1

0,1

0,00027

33

32,2

0,8

0,019394

0,211073

По табл. 42 находим:

. Среднеквадратическая ошибка небольшая, что дает основание считать, что построенная модель адекватно описывает опытные данные.

Итак, все три метода проверки модели на адекватность подтвердили гипотезу о том, что уравнение регрессии  в целом статистически значимо и хорошо соответствует данным наблюдений.

Дадим экономическую интерпретацию найденных коэффициентов уравнения регрессии. Значение свободного члена  характеризует влияние неучтенных в модели факторов, в частности фактора  (уровень автоматизации труда ). Знак минус говорит о том, что отсутствие этого фактора в модели отрицательно сказывается на повышении производительности труда. Величина коэффициента  показывает, что при увеличении коэффициента эксплуатации на 0,01 производительность труда увеличивается в среднем на 86,3271 тн/чел. Коэффициент  показывает, что при увеличении дебита скважин на одну тонну производительность труда увеличивается в среднем на 0,360611 тн/чел.

Варианты заданий к лабораторной работе № 6.

Варианты №1-№10

Данные экспериментального определения производительности труда () в зависимости от коэффициента эксплуатации скважин (), дебита скважин (), уровня автоматизации труда () приведены в табл. 43. Пользуясь данными табл. 43, выполнить задание (по образцу приведенного выше примера) по вариантам, номера предприятий (НГДУ) для которых указаны в табл. 44.

Таблица 43

Факторы

Значения факторов на различных НГДУ

Номера НГДУ

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

0,93

0,95

0,94

0,89

0,91

0,90

0,92

0,93

0,89

0,90

0,90

0,89

0,92

0,91

0,9

0,89

51

40

46

40

49

43

45

44

42

46

40

49

50

46

48

51

71

74

72

65

68

67

69

72

65

68

65

66

71

67

70

65

35

32

30

31

33

30

34

35

31

33

32

32

31

34

35

30

Здесь:  – коэффициент эксплуатации скважин (в долях),

– дебит скважин (тн/сут.),

– уровень автоматизации труда (%),

– производительность труда (тн/чел.).

Таблица 44

Варианты

Номера предприятий

Варианты

Номера предприятий

1

1-3, 7-12, 16

6

4-6, 10-16

2

1-3, 7-9, 13-16

7

1-6, 13-16

3

1-6, 10-12, 16

8

7-16

4

1-3, 10-16

9

4-9, 13-16

5

4-12, 16

10

1-9, 16

Вариант №11.

Прогнозные показатели разработки по нефти на одном из месторождений Тюменской области, характеризующие зависимость среднего дебита действующих скважин по нефти (), от фонда действующих нагнетательных скважин на конец года (), средней приемистости нагнетательных скважин () и фонда механизированных скважин на конец года () приведены в табл. 45.

Таблица 45

(т/сут.)

(шт.)

3/сут.)

(шт.)

3,5

3

31

26

3,5

5

30

27

3,6

6

29

26

3,6

6

24

26

3,5

7

23

25

3,5

7

20

25

3,4

7

20

25

3,3

8

20

24

3,4

8

17

24

3,3

8

17

24

3,2

8

17

23

3,2

8

17

23

3,1

7

16

22

3,2

7

19

22

3,1

8

18

21

3,1

8

16

21

3,0

8

16

20

3,1

8

16

20

3,0

8

15

19

3,0

8

15

19

Вариант №12.

Прогнозные показатели разработки по нефти на одном из месторождений Тюменской области, характеризующие зависимость добычи жидкости с начала разработки (), от годовой добычи жидкости из перешедших скважин (), среднегодовой обводненности () и от среднего дебита действующих скважин по жидкости () приведены в табл. 46.

Таблица 46

(тыс. т)

(тыс. т)

(%)

(т/сут.)

107

34,5

2,8

3,9

142

34,4

2,8

4

176

34,3

2,7

4

210

34,2

2,6

4,1

244

34,1

2,5

4,1

278

34

2,4

4,1

312

33,8

2,4

4,3

346

33,7

2,3

4,3

379

33,6

2,2

4,2

413

33,4

2,2

4,4

446

33,2

2,1

4,4

479

33,1

2,0

4,6

512

32,9

2,0

4,5

545

32,7

1,9

4,7

577

32,5

1,8

4,7

Вариант №13

Прогнозные показатели разработки по нефти на одном из месторождений Тюменской области, характеризующие зависимость добычи нефти с начала разработки (), от суммарной добычи нефти из скважин предыдущего года (), падение добычи нефти () и фонда добывающих скважин на конец года () приведены в табл. 47.

Таблица 47

(тыс.т)

(тыс.т)

(тыс.т)

(шт.)

100,5

30,4

-0,5

27

102

33

-0,9

26

133,1

32,1

-1

26

163,1

31,1

-0,9

25

192,6

30,2

-0,9

25

220,9

29,3

-0,9

25

248,5

28,4

-0,9

24

275,1

27,5

-0,8

24

301

26,7

-0,8

23

326,1

25,9

-0,8

23

350,4

25,1

-0,7

22

374

24,3

-0,7

21

379,5

23,6

-0,6

20

Вариант №14

Прогнозные показатели разработки по нефти на одном из месторождений Тюменской области, характеризующие зависимость добычи нефти с начала разработки (), от суммарной добычи нефти из скважин предыдущего года (), падение добычи нефти () и коэффициента нефтеизвлечения () приведены в табл. 48.

Таблица 48

(тыс.т)

(тыс. т)

(тыс.т)

(%)

286

22

-0,7

0,9

360

22,7

-0,9

1,2

86,9

31,7

-0,9

1,9

117,3

31,2

-0,8

2,5

147,1

30,5

-0,8

3,2

176,1

29,7

-0,8

3,8

204,5

29

-0,7

4,4

232,2

28,4

-0,7

5,0

259,2

27,7

-0,6

5,6

285,6

26,4

-0,6

6,2

311,4

25,8

-0,6

6,7

336,6

25,2

-0,5

7,3

361,2

24,6

-0,5

7,8

385,3

24

-0,5

8,3

408,7

23,5

-0,5

8,8

Вариант №15

Прогнозные показатели разработки по нефти на одном из месторождений Тюменской области, характеризующие зависимость добычи жидкости с начала разработки (), от годовой добычи жидкости из перешедших скважин (), среднегодовой обводненности () и от среднего дебита действующих скважин по жидкости () приведены в табл. 49.

Таблица 49

(тыс.т)

(тыс. т)

(%)

(т/сут.)

90

32,7

4,8

2,7

123

32,7

6,8

2,8

155

32,6

8,8

2,8

188

32,5

10,7

2,8

220

32,4

12,6

2,9

253

32,5

14,4

2,9

285

32,3

16,2

3,0

317

32,2

17,9

3,0

349

32,1

19,5

2,9

381

32

21,2

3,0

413

31,8

22,8

3,0

445

31,7

24,3

3,1

476

31,6

25,8

3,1

508

31,5

27,2

3,2

539

31,4

28,7

3,2

Вариант №16.

Прогнозные показатели разработки по нефти на одном из месторождений Тюменской области, характеризующие зависимость среднего дебита действующих скважин по нефти (), от фонда действующих нагнетательных скважин на конец года (), средней приемистости нагнетательных скважин () и темпа отбора от начальных извлекаемых запасов () приведены в табл. 50.

Таблица 50

 (т/сут.)

(шт.)

(м3/сут.)

(%)

3

1

50

2,5

2,7

2

43

2

2,6

3

31

2,3

2,7

5

27

2,2

2,6

6

22

2,1

2,6

6

22

2,2

2,5

6

22

2,1

2,5

7

19

2

2,5

7

19

2,1

2,5

8

16

1,9

2,4

8

16

1,9

2,4

8

16

1,8

2,4

7

15

1,8

2,3

8

15

1,7

2,3

7

18

1,7

2,3

7

18

1,9

2,2

8

16

2,3

2,3

7

15

1,9

2,3

8

15

2,1

2,2

8

15

2

Вариант №17

Прогнозные показатели разработки по нефти на одном из месторождений Тюменской области, характеризующие зависимость добычи нефти с начала разработки (), от коэффициента нефтеизвлечения (), темпа отбора от начальных извлекаемых запасов () и среднего дебита действующих скважин по нефти () приведены в табл. 51.

Таблица 51

(тыс.т)

(%)

(%)

(т/сут.)

102

1,5

2,8

3,6

133,1

1,9

2,8

3,6

163,3

2,4

2,7

3,5

192,6

2,8

2,6

3,5

220,9

3,2

2,5

3,4

275,1

4

2,4

3,4

301

4,4

2,4

3,3

326,1

4,8

2,3

3,2

350,4

5,1

2,2

3,2

374

5,5

2,2

3,1

396,9

5,8

2,1

3,2

419,9

6,1

2

3,1

440,6

6,4

2

3,1

461,5

6,7

1,9

3

481,7

7

1,8

3,1

Вариант №18

Прогнозные показатели разработки по нефти на одном из месторождений Тюменской области, характеризующие зависимость добычи жидкости сначала разработки (), от закачки агента за год (), закачки агента с начала разработки () и среднего дебита действующих скважин по жидкости () приведены в табл. 52.

Таблица 52

(тыс. т)

(тыс. т/год)

(тыс. т)

(т/сут.)

123

44,5

161

2,8

155

44,3

205

2,8

188

44

249

2,8

220

43,7

293

2,9

253

43,4

336

2,9

285

43,1

380

3

317

42,8

422

3

349

42,5

465

2,9

381

42,3

507

3

413

42

549

3

445

41,7

591

3,1

476

41,4

632

3,1

508

41,4

673

3,2

539

40,8

714

3,2

570

40,5

755

3,3

Вариант №19

Прогнозные показатели разработки по нефти на одном из месторождений Тюменской области, характеризующие зависимость суммарной добычи нефти из скважин предыдущего года (), от падения добычи нефти (), процента падения добычи нефти () и фонда добывающих скважин на конец года () приведены в табл. 53.

Таблица 53

(тыс. т)

(тыс. т)

(%)

(шт.)

35

-1,1

-2,4

27

33

-0,9

-2,6

26

32,1

-1

-2,6

26

31,1

-0,9

-2,6

25

29,3

-0,9

-2,7

25

28,4

-0,9

-2,7

24

27,5

-0,8

-2,7

24

25,9

-0,8

-2,8

23

24,3

-0,7

-2,8

22

22,9

-0,7

-2,8

21

21,5

-0,7

-2,9

20

20,2

-0,6

-2,9

19

20

-0,5

-3,1

18

Вариант №20

Исходные данные по цеху акционерного объединения машиностроительного профиля за 10 месяцев, характеризующие зависимость между себестоимостью произведенной продукции (), стоимостью материалов (), основной зарплатой () и расходами по содержанию и эксплуатации оборудования () представлены в табл. 54.

Таблица 54

(тыс. руб.)

(тыс. руб.)

(тыс. руб.)

(тыс. руб.)

82,3

36,4

11,5

14,2

83,8

36,6

11,5

13,9

81,5

37,9

11,6

15,2

83,1

38,2

11,8

16,5

84,3

39,4

12

16,7

82,6

39,8

12,2

17,2

85,4

40,1

12,5

18,3

84,6

41,5

12,6

18,6

86,8

42,6

12,8

19,4

88,3

45,7

13,2

20,7

Вариант №21

Исходные данные по цеху акционерного объединения машиностроительного профиля за 10 месяцев, характеризующие зависимость между себестоимостью произведённой продукции (), стоимостью материалов , основной зарплатой () и цеховыми расходами () предоставлены в табл. 55.

Таблица 55

(тыс. руб.)

(тыс. руб.)

(тыс. руб.)

(тыс. руб.)

81,5

37,9

11,6

9,5

82,3

36,5

11,5

10,6

83,8

36,6

11,5

7,8

83,1

38,2

11,8

9,1

84,3

39,4

12

13,6

82,6

39,8

12,2

14,1

85,4

40,1

12,5

14,6

84,6

41,5

12,6

15,1

86,8

42,6

12,8

16

88,3

45,7

13,2

17,2

Вариант №22

Имеются данные, характеризующие зависимость нормы расхода моторного масла () на угар и замену марки  от максимальной мощности двигателя (), максимального крутящего момента (), линейной нормы расхода топлива (), и скорости автомобиля () (табл. 56).

Таблица 56

 (л/100 л. т)

 (л. с)

(     )

 (л)

 (км/ч)

1,3

39

7,4

12

40

1,3

42

7,6

8

75

0,8

53

8,2

8

90

1,3

53

8,2

11

70

2,2

70

20,5

21,5

40

2,2

72

17

17

80

1,8

73,5

10,8

10

90

2,2

75

17

16

30

2

75

21

22,8

60

2,1

75

17

15

40

2,2

90

17,5

16

70

2,3

90

17

17

60

1,8

98

18,4

15

60

2,8

110

35

39

35

2,2

115

29

27

70

2,1

115

29

29

60

2,1

120

29

35

50

2

150

41

36

45

2

180

47,3

44

40

1,8

175

48

54

40

Вариант №23

Имеются данные, характеризующие зависимость нормы расхода моторного масла () на угар и замену марки  от максимальной мощности двигателя (), линейной нормы расхода топлива (), скорости двигателя () и контрольного расхода топлива при данной скорости () (табл. 57).

Таблица 57

(л/100 л. т.)

(л. с.)

(л)

(км/ч)

(л)

1,3

39

12

40

10

1,3

42

8

75

8

0,8

53

8

90

9,45

1,3

53

11

70

8,85

2,2

70

21,5

40

21

2,2

72

17

80

13

1,8

73,5

10

90

9,3

2,2

75

16

30

10,6

2

75

22,8

60

22

2,1

75

15

40

12

2,2

90

16

70

13,1

2,3

90

17

60

10,6

1,8

98

15

60

11,8

2,8

110

39

35

38,5

2,2

115

27

70

23

2,1

115

29

60

20

2,1

120

35

50

35

2

150

36

45

35,9

2

180

44

40

41

1,8

175

54

40

39

Вариант №24

Имеются данные, характеризующие зависимость нормы расхода моторного масла  на угар и замену марки  от максимальной мощности двигателя (), диаметра цилиндра (), линейной нормы расхода топлива () и скорости () (табл. 58).

Таблица 58

(л/100 л. т.)

(л. с.)

(мм)

(л)

(км/ч)

1,3

39

76

12

40

1,3

42

76

8

75

0,8

53

72

8

90

1,3

53

76

11

70

2,2

70

82

21,5

40

2,2

72

92

17

80

1,8

73,5

82

10

90

2,2

75

92

16

30

2

75

82

22,8

60

2,1

75

92

15

40

2,2

90

92

16

70

2,3

90

92

17

60

1,8

98

92

15

60

2,8

110

101,6

39

35

2,2

115

92

27

70

2,1

115

92

29

60

2,1

120

92

35

50

2

150

100

36

45

2

180

108

44

40

1,8

175

108

54

40

Вариант №25

Имеются данные, характеризующие зависимость нормы расхода моторного масла  на угар и замену марки  от максимальной мощности двигателя (), оборотов при максимальной мощности (), линейной нормы расхода топлива () и скорости () (табл. 59).

Таблица 59

(л/100 л. т.)

(л. с.)

(об/мин)

(л)

(км/ч)

1,3

39

4200

12

40

1,3

42

4400

8

75

0,8

53

5400

8

90

1,3

53

5400

11

70

2,2

70

2800

21,5

40

2,2

72

4000

17

80

1,8

73,5

5800

10

90

2,2

75

2600

16

30

2

75

2600

22,8

60

2,1

75

2600

15

40

2,2

90

4000

16

70

2,3

90

4000

17

60

1,8

98

4500

15

60

2,8

110

2800

39

35

2,2

115

3200

27

70

2,1

115

3200

29

60

2,1

120

3300

35

50

2

150

3200

36

45

2

180

3200

44

40

1,8

175

3200

54

40

Приложение 1

Таблица значений функции

x

0

1

2

3

4

5

6

7

8

9

0,0

0,3989

3989

3989

3988

39986

3984

3982

3980

3977

3973

0,1

0,3970

3965

3961

3956

3951

3945

3939

3932

3925

3918

0,2

0,3910

3902

3894

3885

3876

3867

3857

3847

3836

3825

0,3

0,3814

3802

3790

3778

3765

3752

3739

3726

3712

3697

0,4

0,3683

3668

3653

3637

3621

3605

3589

3572

3555

3538

0,5

0,3521

3503

3485

3467

3448

3429

3410

3391

3372

3352

0,6

0,3332

3312

3292

3271

3251

3230

3209

3187

3166

3144

0,7

0,3123

3101

3079

3056

3034

3011

2989

2966

2943

2920

0,8

0,2897

2874

2850

2827

2803

2780

2756

2732

2709

2685

0,9

0,2661

2637

2613

2589

2565

2541

2516

2492

2468

2444

1,0

0,2420

2396

2371

2347

2323

2299

2275

2251

2227

2203

1,1

0,2179

2155

2131

2107

2083

2059

2036

2012

1989

1965

1,2

0,1942

1919

1895

1872

1849

1826

1804

1781

1758

1736

1,3

0,1714

1691

1669

1647

1626

1604

1582

1561

1539

1518

1,4

0,1497

1476

1456

1435

1415

1394

1374

1354

1334

1315

1,5

0,1295

1276

1257

1238

1219

1200

1182

1163

1145

1127

1,6

0,1109

1092

1074

1057

1040

1023

1006

0989

0973

0957

1,7

0,0940

0925

0909

0893

0878

0863

0848

0833

0818

0804

1,8

0,0790

0775

0761

0748

0734

0721

0707

0694

0681

0669

1,9

0,0656

0644

0632

0620

0608

0596

0584

0573

0562

0551

2,0

0,0540

0529

0519

0508

0498

0488

0478

0468

0459

0449

2,1

0,0440

0431

0422

0413

0404

0396

0387

0379

0371

0363

2,2

0,0355

0347

0339

0332

0325

0317

0310

0303

0297

0290

2,3

0,0283

0277

0270

0264

0258

0252

0246

0241

0235

0229

2,4

0,0224

0219

0213

0208

0203

0198

0194

0189

0184

0180

2,5

0,0175

0171

0167

0163

0158

0154

0151

0147

0143

0139

2,6

0,0136

0132

0129

0126

0122

0119

0116

0113

0110

0107

2,7

0,0104

0101

0099

0096

0093

0091

0088

0086

0084

0081

2,8

0,0079

0077

0075

0073

0071

0069

0067

0065

0063

0061

2,9

0,0060

0058

0056

0055

0053

0051

0050

0048

0047

0046

3,0

0,0044

0043

0042

0040

0039

0038

0037

0036

0035

0034

3,1

0,0033

0032

0031

0030

0029

0028

0027

0026

0025

0025

3,2

0,0024

0023

0022

0022

0021

0020

0020

0019

0018

0018

3,3

0,0017

0017

0016

0016

0015

0015

0014

0014

0013

0013

3,4

0,0012

0012

0012

0011

0011

0010

0010

0010

0009

0009

3,5

0,0009

0008

0008

0008

0008

0007

0007

0007

0007

0006

3,6

0,0006

0006

0006

0005

0005

0005

0005

0005

0005

0004

3,7

0,0004

0004

0004

0004

0004

0004

0003

0003

0003

0003

3,8

0,0003

0003

0003

0003

0003

0002

0002

0002

0002

0002

3,9

0,0002

0002

0002

0002

0002

0002

0002

0002

0001

0001

Приложение 2

Значения функции

х

х

х

х

х

0,00

00000

0,52

0,1985

1,04

0,3508

1,56

0,4406

2,16

0,4846

0,01

0,0040

0,53

0,2019

1,05

0,3531

1,57

0,4418

2,18

04854

0,02

0,0080

0,54

0,2054

1,06

0,3554

1,58

0,4429

2,20

0,4861

0,03

0,0120

0,55

0,2088

1,07

0,3577

1,59

0,4441

2,22

0,4868

0,04

0,0160

0,56

0,2123

1,08

0,3599

1,60

0,4452

2,24

0,4875

0,05

0,0199

0,57

0,2157

1,09

0,3621

1,61

0,4463

2,26

0,4881

0,06

0,0239

0,58

0,2190

1,10

0,3643

1,62

0,4474

2,28

0,4887

0,07

0,0279

0,59

0,2224

1,11

0,3665

1,63

0,4484

2,30

0,4893

0,08

0,0319

0,60

0,2257

1,12

0,3686

1,64

0,4495

2,32

0,4898

0,09

0,0359

0,61

0,2291

1,13

0,3708

1,65

0,4505

2,34

0,4904

0,10

0,0398

0,62

0,2324

1,14

0,3729

1,66

0,4515

2.36

0,4908

0,11

0,0438

0,63

0,2357

1,15

0,3749

1,67

0,4525

2,38

0,4913

0,12

0,0478

0,64

0,2389

1,16

0,3770

1,68

0,4535

2,40

0,4918

0,13

0,0517

0,65

0,2422

1,17

0,3790

1,69

0,4545

2,42

0,4922

0,14

0,0557

0,66

0,2454

1,18

0,3810

1,70

0,4554

2,44

0,4927

0,15

0,0596

0,67

0,2486

1,19

0,3830

1,71

0,4564

2,46

0,4931

0,16

0,0636

0,68

0,2517

1,20

0,3849

1,72

0,4573

2,48

0,4934

0,17

0,0675

0,69

0,2549

1,21

0,3869

1,73

0,4582

2,50

0,4938

0,18

0,0714

0,70

0,2580

1,22

0,3888

1,74

0,4591

2,52

0,4941

0,19

0,0753

0,71

0,2611

1,23

0,3907

1,75

0,4599

2,54

0,4945

0,20

0,0793

0,72

0,2642

1,24

0,3925

1,76

0,4608

2,56

0,4948

0,21

0,0832

0,73

0,2673

1,25

0,3914

1,77

0,4616

2,58

0,4951

0,22

0,0871

0,74

0.2703

1,26

0,3962

1,78

0,4625

2,60

0,4953

0,23

0,0910

0,75

0,2734

1,27

0,3980

1,79

0,4633

2,62

0,4956

0,24

0,0948

0,76

0,2764

1,28

0,3997

1,80

0,4641

2,64

0,4959

0,25

0,0987

0,77

0,2794

1,29

0,4015

1,81

0,4649

2,66

0,4961

0,26

0,1026

0,78

0,2823

1,30

0,4032

1,82

0,4656

2,68

0,4963

0,27

0,1064

0,79

0,2852

1,31

0,4049

1,83

0,4664

2,70

0,4965

0,28

0,1103

0,80

0,2881

1,32

0,4066

1,84

0,4671

2,72

0,4967

0,29

0,1141

0,81

0,2910

1,33

0,4082

1,85

0,4678

2,74

0,4969

0,30

0,1179

0,82

0,2939

1,34

0,4099

1,86

0,4686

2,76

0,4971

0,31

0,1217

0,83

0,2967

1,35

0,4115

1,87

0,4693

2,78

0,4973

0,32

0,1255

0.84

0,2995

1,36

0,4131

1,88

0,4699

2,80

0,4974

0,33

0,1293

0,85

0,3023

1,37

0,4147

1,89

0,4706

2,82

0,4976

0,34

0,1331

0,86

0,3051

1,38

0,4162

1,90

0,4713

2,84

0,4977

0,35

0,1368

0,87

0,3078

1,39

0,4177

1,91

0,4719

2,86

0,4979

0,36

0,1406

0,88

0,3106

1,40

0,4192

1,92

0,4726

2,88

0,4980

0,37

0,1443

0,89

0,3133

1,41

0,4207

1,93

0,4732

2,90

0,4981

0,38

0,1480

0,90

0,3159

1,42

0,4222

1,94

0,4738

2,92

0,4982

0,39

0,1517

0,91

0,3186

1,43

0,4236

1,95

0,4744

2,94

0,4984

0,40

0,1554

0,92

0,3112

1,44

0,4251

1,96

0,4750

2,96

0,4985

0,41

0,1591

0,93

0,3238

1,45

0,4265

1,97

0,4756

2,98

0,4986

0,42

0,1628

0,94

0,3264

1,46

0,4279

1,98

0,4761

3,00

0,49865

0,43

0,1664

0,95

0,3289

1,47

0,4292

1,99

0,4767

3,20

0,49931

0,44

0,1700

0,96

0,3315

1,48

0,4306

2,00

0,4772

3,40

0,49966

0,45

0,1736

0,97

0,3340

1,49

0,4319

2,02

0,4783

3,60

0,499841

0,46

0,1772

0,98

0,3365

1,50

0,4332

2,04

0,4793

3,80

0,499928

0,47

0,1808

0,99

0,3389

1,51

0,4345

2,06

0,4803

4,00

0,499968

0,48

0,1844

1,00

0,3413

1,52

0,4357

2,08

0,4812

4,50

0,499997

0,49

0,1879

1,01

0,3438

1,53

0,4370

2,10

0,4821

5,00

0,49999997

0,50

0,1915

1,02

0,3461

1,54

0,4382

2,12

0,4830

0,51

0,1950

1,03

0,3485

1,55

0,4394

2,14

0,4838

Приложение 3

Таблица значений

           

0,95

0,99

0,999

           

0,95

0,99

0,999

5

2,78

4,60

8,61

20

2,093

2,361

3,883

6

2,57

4,03

6,86

25

2,064

2,797

3,745

7

2,45

3,71

5,96

30

2,045

2,756

3,659

8

2,37

3,50

5,41

35

2,032

2,720

3,600

9

2,31

3,36

5.04

40

2,023

2,708

3,558

10

2,26

3,25

4,78

45

2,016

2,692

3,527

11

2,23

3,17

4,59

50

2,009

2,679

3,502

12

2,20

3,11

4,44

60

2,001

2,662

3,464

13

2,18

3,06

4,32

70

1,996

2,649

3,439

14

2,16

3,01

4,22

80

1,001

2,640

3,418

15

2,15

2,98

4,14

90

1,987

2,633

3,403

16

2,13

2,95

4,07

100

1,984

2,627

3,392

17

2,12

2,92

4,02

120

1,980

2,617

3,374

18

2,11

2,90

3,97

1,960

2,576

3,291

19

2,10

2,88

3,92

Приложение 4

Таблица значений

           

0,95

0,99

0,999

           

0,95

0,99

0,999

5

1,37

2,67

5,64

20

0,37

0,58

0,88

6

1,09

2,01

3,88

25

0,32

0,49

0,73

7

0,92

1,62

2,98

30

0,28

0,43

0,63

8

0,80

1,38

2,42

35

0,26

0,38

0,56

9

0,71

1,20

2,06

40

0,24

0,35

0,50

10

0,65

1,08

1,80

45

0,22

0,32

0,46

11

0,59

0,98

1,60

50

0,21

0,30

0,43

12

0,55

0,90

1,45

60

0,188

0,269

0,38

13

0,52

0,83

1,33

70

0,174

0,245

0,34

14

0,48

0,78

1,23

80

0,161

0,226

0,31

15

0,46

0,73

1,15

90

0,151

0,211

0,29

16

0,44

0,70

1,07

100

0,143

0,198

0,27

17

0,42

0,66

1,01

150

0,115

0,160

0,211

18

0,40

0,63

0,96

200

0,099

0,136

0,185

19

0,39

0,60

0,92

250

0,089

0,120

0,162

Приложение 5

Критические точки распределения

Число

степеней

свободы

Уровень значимости

0,01

0,025

0,05

0,95

0,975

0,98

1

6,6

5,024

3,841

0,0039

0,00098

0,00016

2

9,2

7,378

5,991

0,103

0,051

0,020

3

11,3

9,348

7,815

0,352

0,216

0,115

4

13,3

11,143

9,488

0,711

0,484

0,297

5

15,1

12,832

11,070

1,15

0,831

0,554

6

16,8

14,449

12,592

1,64

1,24

0,872

7

18,5

16,013

14,067

2,17

1,69

1,24

8

20,1

17,535

15,507

2,73

2,18

1,65

9

21,7

19,023

16,919

3,33

2,70

2,09

10

23,2

20,483

18,307

3,94

3,25

2,56

11

24,7

21,920

19,676

4,57

3,82

3,05

12

26,2

23,336

21,026

5,23

4,40

3,57

13

27,7

24,736

22,362

5,89

5,01

4,11

14

29,1

26,129

23,685

6,57

5,63

4,66

15

30,6

27,488

24,996

7,26

6,26

5,23

16

32,0

28,845

26,296

7,96

6,91

5,81

17

33,4

30,191

27,587

8,67

7,56

6,41

18

34,8

31,536

28,869

9,39

8,23

7,01

19

36,2

32,852

30,144

10,1

8,91

7,63

20

37,6

34,170

31,410

10,9

9,59

8,26

21

38,9

35,479

32,671

11,6

10,3

8,90

22

40,3

36,781

33,924

12,3

11,0

9,54

23

41,6

38,076

35,172

13,1

11,7

10,2

24

43,0

39,364

36,415

13,8

12,4

10,9

25

44,3

40,646

37,652

14,6

13,1

11,5

26

45,6

41,923

38,885

15,4

13,8

12,2

27

47,0

43,194

40,113

16,2

14,6

12,9

28

48,3

44,461

41,337

16,9

15,3

13,6

29

49,6

45,722

42,557

17,7

16,0

14,3

30

50,9

46,979

43,773

18,5

16,8

15,0

Приложение 6

Критические точки распределения Стьюдента

Число степеней свободы k

Уровень значимости  (двусторонняя критическая область)

0,10

0,05

0,02

0,01

0,002

0,001

1

6,3138

12,7062

31,82

63,7

318,3

637,0

2

2,9200

4,3037

6,97

9,92

22,33

31,6

3

2,3534

3,1824

4,54

5,84

10,22

12,9

4

2,1318

2,7764

3,75

4,60

7,17

8,61

5

2,0150

2,5706

3,37

4,03

5,89

6,86

6

1,9432

2,4469

3,14

3,71

5,21

5,96

7

1,8946

2,3646

3,00

3,50

4,79

5,40

8

1,8595

2,3060

2,90

3,36

4,50

5,04

9

1,8331

2,2622

2,82

3,25

4,30

4,78

10

1,8125

2,2281

2,76

3,17

4,14

4,59

11

1,7959

2,2010

2,72

3,11

4,03

4,44

12

1,7823

2,1788

2,68

3,05

3,93

4,32

13

1,7709

2,1604

2,65

3,01

3,85

4,22

14

1,7613

2,1448

2,62

2,98

3,79

4,14

15

1,7530

2,1314

2,60

2,95

3,73

4,07

16

1,7459

2,1190

2,58

2,92

3,69

4,01

17

1,7396

2,1098

2,57

2,90

3,65

3,96

18

1,7341

2,1009

2,55

2,88

3,61

3,92

19

1,7291

2,0930

2,54

2,86

3,58

3,88

20

1,7247

2,0860

2,53

2,85

3,55

3,85

21

1,7207

2,0796

2,52

2,83

3,53

3,82

22

1,7171

2,0739

2,51

2,82

3,51

3,79

23

1,7139

2,0687

2,50

2,81

3,49

3,77

24

1,7109

2,0639

2,49

2,80

3,47

3,74

25

1,7081

2,0595

2,49

2,79

3,45

3,72

26

1,7056

2,0555

2,48

2,78

3,44

3,71

27

1,7033

2,0518

2,47

2,77

3,42

3,69

28

1,7011

2,0484

2,46

2,76

3,40

3,66

29

1,6991

2,0452

2,46

2,76

3,40

3,66

30

1,6973

2,0423

2,46

2,75

3,39

3,65

40

1,6839

2,0211

2,42

2,70

3,31

3,55

60

1,6706

2,0003

2,39

2,66

3,23

3,46

120

1,6577

1,9840

2,36

2,62

3,17

3,37

1,6479

1,9647

2,33

2,58

3,09

3,29

0,05

0,025

0,01

0,005

0,001

0,0005

Уровень значимости  (односторонняя критическая область)

Приложение 7

Критические точки распределения  Фишера-Снедекора

( – число степеней свободы большей дисперсии,

– число степеней свободы меньшей дисперсии)

Уровень значимости

       

1

2

3

4

5

6

7

8

9

10

11

12

1

4052

4999

5403

5625

5764

5889

5928

5981

6022

6056

6082

6106

2

98,49

99,01

90,17

99,25

99,33

99,30

99,34

99,36

99,36

99,40

99,41

99,42

3

34,12

30,81

29,46

28,71

28,24

27,91

27,67

27,49

27,34

27,23

27,13

27,05

4

21,20

18,00

16,69

15,98

15,52

15,21

14,98

14,80

14,66

14,54

14,45

14,37

5

16,26

13,27

12,06

11,39

10,97

10,67

10,45

10,27

10,15

10,05

9,96

9,89

6

13,74

10,92

9,78

9,15

8,75

8,47

8,26

8,10

7,98

7,87

7,79

7,72

7

12,25

9,55

8,45

7,85

7,46

7,19

7,00

6,84

6,71

6,62

6,54

6,47

8

11,26

8,65

7,59

7,01

6,63

6,37

6,19

6,03

5,91

5,82

5,74

5,67

9

10,56

8,02

6,99

6,42

6,06

5,80

5,62

5,47

5,35

5,26

5,18

5,11

10

10,04

7,56

6,55

5,99

5,64

5,39

5,21

5,06

4,95

4,85

4,78

4,71

11

9,86

7,20

6,22

5,67

5,32

5,07

4,88

4,74

4,63

4,54

4,46

4,40

12

9,33

6,93

5,95

5,41

5,06

4,82

4,65

4,50

4,39

4,30

4,22

4,16

13

9,07

6,70

5,74

5,20

4,86

4,62

4,44

4,30

4,19

4,10

4,02

3,96

14

8,86

6,51

5,56

5,03

4,69

4,46

4,28

4,14

4,03

3,94

3,86

3,80

15

8,68

6,36

5,42

4,89

4,56

4,32

4,14

4,00

3,89

3,80

3,73

3,67

16

8,53

6,23

5,29

4,77

4,44

4,20

4,03

3,89

3,78

3,69

3,61

3,55

17

8,40

6,11

5,18

4,67

4,34

4,10

3,93

3,79

3,68

3,59

3,52

3,45

Уровень значимости

  

1

2

3

4

5

6

7

8

9

10

11

12

1

161

200

216

225

230

234

237

239

241

242

243

244

2

18,51

19,00

19,16

19,25

19,30

19,33

19,36

19,37

19,38

19,39

19,40

19,41

3

10,13

9,55

9,28

9,12

9,01

8,94

8,88

8,84

8,81

8,78

8,76

8,74

4

7,71

6,94

6,59

6,39

6,26

6,16

6,09

6,04

6,00

5,96

5,93

5,91

5

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,78

4,74

4,70

4,68

6

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

4,06

4,03

4,00

7

5,59

4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,68

3,63

3,60

3,57

8

5,32

4,46

4,07

3,84

3,69

3,58

3,50

3,44

3,39

3,34

3,31

3,28

9

5,12

4,26

3,86

3,63

3,48

3,37

3,29

3,23

3,18

3,13

3,10

3,07

10

4,96

4,10

3,71

3,48

3,33

3,22

3,14

3,07

3,02

2,97

2,94

2,91

11

4,84

3,98

3,59

3,36

3,20

3,09

3,01

2,95

2,90

2,86

2,82

2,79

12

4,75

3,88

3,49

3,26

3,11

3,00

2,92

2,85

2,80

2,76

2,72

2,69

13

4,67

3,80

3,41

3,18

3,02

2,92

2,84

2,77

2,72

2,67

2,63

2,60

14

4,60

3,74

3,34

3,11

2,96

2,85

2,77

2,70

2,65

2,60

2,56

2,53

15

4,54

3,68

3,29

3,06

2,90

2,79

2,70

2,64

2,59

2,55

2,51

2,48

16

4,49

3,63

3,24

3,01

2,85

2,74

2,66

2,59

2,54

2,49

2,45

2,42

17

4,45

3,59

3,20

2,96

2,81

2,70

2,62

2,55

2,50

2,45

2,41

2,38

Оглавление

Введение

§1. Первичная обработка результатов наблюдений

§2. Расчет выборочных характеристик статистического распределения

§3. Интервальные (доверительные) оценки параметров распределения

§4. Лабораторная работа №1

§5. Построение кривой нормального распределения по опытным данным

§6. Проверка статистических гипотез

§7. Лабораторная работа №2

§8. Понятие корреляционной зависимости. Задачи теории корреляции

§9. Парная линейная корреляция

§10. Коэффициент корреляции, его свойство и значимость

§11. Определение надежности (доверительного интервала) коэффициента корреляции

§12. Коэффициент корреляции

§13. Проверка адекватности модели

§14. Оценка величины погрешности линейного однофакторного уравнения

§15. Лабораторная работа №3

§16. Лабораторная работа №4

§17. Нелинейная корреляционная зависимость

§18. Определение силы криволинейной связи

§19. Проверка адекватности модели

§20. Лабораторная работа №5

§21. Множественная прогрессия

§22. Измерение тесноты связи множественной линейной регрессии

§23. Проверка адекватности модели множественной линейной регрессии

§24. Экономическая интерпретация уравнения регрессии

§25. Лабораторная работа №6

Литература

Приложения

Литература.

  1.  В.Е. Гмурман. Теория вероятностей и математическая статистика: Учебное пособие для вузов. – М.: Высшая школа, 1997.
  2.  В.Н. Калинина, В.Ф. Панкин. Математическая статистика: Учебник для студ. сред. спец. учеб. заведений.- М. – Высш. шк., 2001.
  3.  В.А. Колемаев, В.Н. Калинина. Теория вероятностей и математическая статистика. – М.: “ Инфра – М “,1997.
  4.  Ферстер Э., Рёнц Б. Методы корреляционного и регрессивного анализа. – М.: «Статистика», 1987.
  5.  Карасев А.И., Аксютина З.М., Савельева Т.И. Курс высшей математики для экономических вузов. Ч.2: учеб. пособие для студентов вузов.- М.: Высшая школа, 1982.
  6.  В.И. Губин. Лекции по высшей математике Ч.2: Учебное пособие для студентов дневной и заочной форм обучения.- Тюмень, 1996.
  7.  М.Н. Степнов. Статистические методы обработки результатов механических испытаний: Справочник.- М.: Машиностроения, 1985.
  8.  А.Р. Янпольский. Лабораторный вычислительный практикум.- М.: Издание ВИА, 1968.
  9.  Е.З. Климова, А.П. Миллионщикова, Н.О. Фастовец. Задачи по математической статистике. Москва, МИНХ И ГП им. И.М. Губкина, 1976.
  10.  Л.Г. Орлова. Задания для лабораторных работ по математической статистике и методические указания по их выполнению. Тюмень, ТИИ, 1983.


°

°

°

0

x

 60,15  60,45  60,75   61,05   61,35    61,65    61,95    62,25     62,55     62,85

Рис. 2

0

11

16

15

18

 9

 6

 5

 3

 2

 1

29

x

  60    60,3  60,6  60,9  61,2  61,5  61,8  62,1  62,4  62,7   63

гистограмма

олигон

Рис. 4

Fв(x)

  1

x

                                                                   

0

°

°

°

°

°

°

°

W

6,152

5,523

4,897

4,274

3,654

3,037

2,423

1,812

1,204

   0,6

Рис. 3

0

60,15    60,45     60,75     61,05     61,35    61,65     61,95    62,25     62,55     62,85    

x

  1

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

Fв(x)

Рис. 4

x

эмпирическая

кривая

теоретическая

кривая

29

 3

 2

 1

 6

 5

 9

18

16

15

11

0

Рис. 5

 60,15   60,45   60,75  61,05  61,35  61,65   61,95  62,25  62,55  62,85

x

y

0

y

0

x

Рис. 6

Рис. 7

0

8

9

10

11

12

13

14

24

26

28

30

32

34

36

38

40

42

44

46

x

y

х

-2

-4

-6

0

2

4

6

8

10

-10

-20

-30

°

°

°

°

°

°

°

°

°

Рис. 9

x

y

2

4

6

8

10

0

-2

-4

-6

-10

-20

-30

°

°

°

°

Рис. 10

10

0

5

10

15

10

25

10

20

Математическая формулировка задачи. Выбор результативного и факторных признаков

Предварительное планирование эксперимента.

Постановка эксперимента или сбор информации

Выбор вероятностной регрессионной модели

Оценка параметров уравнения регрессии

Оценка согласованности принятой регрессионной модели с эмпирическими данными

Цель достигнута?

Нет

Да

Регрессионный анализ: построение доверительных интервалов для , , проверка гипотез относительно параметров регрессионной модели

Практическое применение полученного уравнения регрессии для управления производством или для предсказания

50

49

48

47

46

45

44

43

42

0,89

0,90

0,91

0,92

0,93

0

72

71

70

69

68

67

66

65

64

0,89

0,90

0,91

0,92

0,93

0

63

50

49

48

47

46

45

44

43

42

63

64

0

65

66

67

68

69

70

71

72

38

37

36

35

34

33

32

31

0,89

0,90

0,91

0,92

0,93

0

38

37

36

35

34

33

32

31

0

43

42

44

45

46

47

49

48

50

38

37

36

35

34

33

32

31

63

64

0

65

66

67

68

69

70

71

72




1. Пожарная сигнализация
2. The Iron Ldy ws losing support in the country nd in the Conservtive Prty
3. Рассмотрение способов активизации познавательной деятельности младших школьников
4. Методика расследования вымогательства
5. Правовые проблемы регулирования деятелности хозяйственных обществ
6. 26 января Призовой фонд 95000 норвежских крон
7. Tide gy From now on our troubles will be miles wy
8. Молодий театр з 1922 p
9. 660993 КУРСК 2000 СОГЛАСОВАНА
10. Курсовая работа на тему- Средства развития познавательных процессов учащихся в учебном процессе
11.  вашему истинному духовному Я
12. н ул.Центральная 1-2п 52кв.
13.  экономических иерархиях во многом но не полностью определявшимися партийнономенклатурными уложениями
14. Лекция 15 Исследование движения машинного агрегата
15. Граф за походженням він нагадував кремезного і трохи вайлуватого французького селянина під два метри а т
16. .ru-types-sponsorstvo- Спонсор ~ это физическое или юридическое лицо финансирующее организацию или проведение к.
17. В Ќиысыќ сызыќтын кґленкесін координаттыќ жазыќтыќтарына тўрєызу керек
18. I Сегодня мой соседстудент наконецто плотно пообедал- Суп борщ с клёцками ~ 2 тарелки
19. Беларуская Аўтакефальная Праваслаўная Царква пасьля Ўсебеларускага Царкоўнага Сабору
20. Созданное в 1991 г