Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
ЛЕКЦИЯ №
СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ
ДАННЫХ
Введение
Довольно часто в практике исследовательской работы встречаются ситуации, когда при изучении тех или иных случайных величин и обработке статистического материала, полученного в результате эксперимента, характер закона распределения изучаемых случайных величин известен до опыта, исходя из теоретических или физических соображений, связанных с существом решаемой задачи. Например, часто можно заранее утверждать, что случайная величина подчинена нормальному закону распределения. Тогда возникает задача определения некоторых параметров распределения на основе опытных данных.
Очевидно, что при небольшом числе опытов задача более или менее точного определения параметров распределения не может быть решена, так как в этих случаях экспериментальный материал содержит в себе значительный элемент случайности, а, следовательно, и все параметры, вычисленные на его основе, так же будут случайными. При наличии небольшого числа экспериментальных данных может быть поставлена только задача об определении так называемых «оценок» или «подходящих значений» для искомых параметров, т.е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошибкам, чем другие.
Существуют различные методы решения задачи оценивания параметров распределения, но на практике наиболее широко применяются два основных метода метод наименьших квадратов и метод максимального правдоподобия.
Вопрос 1. Обработка результатов наблюдений по методу наименьших
квадратов
Метод наименьших квадратов, разработанный знаменитыми математиками К. Гауссом и А. Лежандром, берет свое начало от задач геодезии и астрономии.
Пусть на основании эксперимента требуется установить зависимость некоторой физической величины от физической величины . Например, зависимость пути, пройденного телом, от времени; начальной скорости снаряда от температуры снаряда и т.п. Допустим, что имеются результаты независимых опытов, представленные в виде статистической таблицы:
... |
||||
... |
Изобразим экспериментальные точки на координатной плоскости (рисунок 1).
Пусть из теоретических или физических соображений, связанных с существом явления или просто с внешним видом наблюдаемой зависимости, выбран общий вид функции , зависящий от нескольких числовых параметров
Требуется так выбрать параметры , чтобы кривая наилучшим образом изображала зависимость, полученную в опыте.
Данная задача может быть решена с использованием метода наименьших квадратов, при котором требование наилучшего согласования кривой и экспериментальных точек сводится к тому, чтобы сумма квадратов отклонений экспериментальных точек от «сглаживающей» кривой обращалась в минимум.
Назовем погрешностью или ошибкой го измерения величину отклонения наблюдаемого значения от теоретического значения , т.е.
,
где .
Тогда согласно методу наименьших квадратов функция выбирается таким образом, чтобы сумма квадратов погрешностей была минимальной, т.е.
.
Определим параметры , от которых зависит функция , исходя из метода наименьших квадратов. Для этого запишем функцию как функцию не только аргумента , но и параметров :
.
Требуется выбрать так, чтобы выполнялось условие:
. (1)
Из формулы (1) следует, что сумма квадратов погрешностей зависит от параметров , т.е.
, (2)
причем .
В равенстве (2): и заданные числа (экспериментальные данные), а параметры неизвестные числа, подлежащие определению, исходя из условия минимума , т.е. сумму квадратов погрешностей можно рассматривать как функцию переменных и исследовать ее на экстремум.
Таким образом, задача свелась к нахождению значений , при которых функция имеет минимум.
Продифференцируем функцию , задаваемую равенством (2), по переменным и приравняем полученные производные к нулю:
(3)
Система уравнений (3) содержит столько же уравнений, сколько неизвестных , но решить систему (3) в общем виде нельзя, т.е. необходимо задать конкретный вид функции .
Рассмотрим часто встречающийся на практике случай, когда функция линейна.
Подбор параметров линейной функции методом наименьших квадратов
Постановка задачи.
Пусть в результате эксперимента получена совокупность значений , . Требуется подобрать по методу наименьших квадратов параметры и линейной функции , изображающей данную экспериментальную зависимость.
Решение задачи.
В данном случае
. (4)
Тогда ;
Найдем частные производные функции по и :
Приравнивая частные производные и к нулю, получим систему двух уравнений с двумя неизвестными и :
или
(5)
Система (5) называется нормальной системой метода наименьших квадратов. Из этой системы находим и , а затем, подставляя их в уравнение (4), получим уравнение искомой линейной зависимости.
Покажем, что функция в найденной точке имеет минимум. Для этого используем достаточное условие существования экстремума функции двух переменных. Найдем частные производные второго порядка функции :
;
;
.
Тогда
Отсюда следует, что . Так как , то в точке функция имеет минимум.
Пример 1. Результаты измерений величин и даны в таблице:
-2 |
0 |
1 |
2 |
4 |
|
0,5 |
1 |
1,5 |
2 |
3 |
Предполагая, что между и существует линейная зависимость , способом наименьших квадратов определить коэффициенты и .
Решение
В нашем случае (число измерений). Для того, чтобы найти параметры и , необходимо составить нормальную систему (5).
Предварительно вычислим
; ; ; .
Тогда система (5) примет вид:
Решая эту систему, получим и . Следовательно, искомая линейная зависимость имеет вид .
Метод наименьших квадратов получил самое широкое распространение в практике статистических исследований, так как, вопервых, не требует знания закона распределения выборочных данных; вовторых, достаточно хорошо разработан в плане вычислительной реализации; втретьих, допускает довольно веское теоретическое обоснование с вероятностной точки зрения.
Кроме метода наименьших квадратов, существуют и другие методы оценивания параметров распределения. К их числу относится метод максимального правдоподобия, предложенный Р. Фишером.
Вопрос 2. Принцип максимального правдоподобия
Метод максимального правдоподобия точечной оценки неизвестных параметров распределения основан на принципе максимального правдоподобия и сводится к отысканию максимума функции одного или нескольких оцениваемых параметров.
Дискретные случайные величины
Пусть дискретная случайна величина, которая в результате испытаний приняла значения . Допустим, что вид закона распределения величины задан, но неизвестен параметр , которым определяется этот закон. Требуется найти точечную оценку параметра .
Обозначим вероятность того, что в результате испытания величина примет значение через .
О.2.1. Функцией правдоподобия дискретной случайной величины называется функция аргумента , имеющая вид
где фиксированные числа.
Согласно принципу максимального правдоподобия в качестве точечной оценки параметра принимается такое его значение , при котором функция правдоподобия достигает максимума. Оценка в этом случае называется оценкой максимального правдоподобия.
Замечание
Функция правдоподобия функция от аргумента , а оценка максимального правдоподобия функция от независимых аргументов .
О.2.2. Функция называется логарифмической функцией правдоподобия.
Функции и являются функциями аргумента и достигают максимума при одном и том же значении . На практике удобнее вместо отыскания максимума функции находить максимум функции .
Точку максимума функции находят с помощью следующего алгоритма:
. (6)
Уравнение (6) называется уравнением правдоподобия.
Найденную точку максимума принимают в качестве оценки максимального правдоподобия.
Непрерывные случайные величины
Пусть непрерывная случайная величина, которая в результате испытаний приняла значение . Допустим, что вид плотности распределения функции задан, но неизвестен параметр , которым определяется эта функция.
О.2.3. Функцией правдоподобия непрерывной случайной величины называется функция аргумента , имеющая вид:
,
где фиксированные числа.
Оценку максимального правдоподобия неизвестного параметра распределения непрерывной случайной величины ищут так же, как в случае дискретной случайной величины.
Пример 2. Найти методом максимального правдоподобия оценку параметра показательного распределения , если в результате испытаний случайная величина , распределенная по показательному закону, приняла значения .
Решение
Составим функцию правдоподобия , учитывая, что :
Отсюда
.
Найдем логарифмическую функцию правдоподобия:
.
Таким образом,
Найдем точку максимума функции .
1. Найдем первую производную по :
.
2. Составим уравнение правдоподобия:
.
Найдем критическую точку, решив уравнение правдоподобия относительно :
.
Таким образом, критическая точка.
3. Найдем вторую производную по :
.
Очевидно, что при вторая производная :
.
Следовательно, точка максимума и, значит, в качестве оценки максимального правдоподобия параметра показательного распределения надо принять величину, обратную выборочной средней: .
Замечание
Если плотность распределения непрерывной случайной величины определяется двумя неизвестными параметрами и , то функция правдоподобия является функцией двух независимых аргументов и , т.е.
где наблюдавшиеся значения величины .
Далее находят логарифмическую функцию правдоподобия и для отыскания ее максимума составляют и решают систему:
Метод максимального правдоподобия имеет ряд достоинств:
1. Оценки максимального правдоподобия, вообще говоря, состоятельны (но они могут быть смещенными), распределены асимптотически нормально (при больших значениях и приближенно нормальны) и имеют наименьшую дисперсию по сравнению с другими асимптотически нормальными оценками.
2. Если для оцениваемого параметра существует эффективная оценка , то уравнение правдоподобия имеет единственное решение .
3. Этот метод наиболее полно использует данные выборки об оцениваемом параметре, поэтому он особенно полезен в случае малых выборок.
Основным недостатком метода максимального правдоподобия является трудность вычисления оценок, связанных с решением уравнений правдоподобия, чаще всего нелинейных. Существенно так же и то, что для построения оценок максимального правдоподобия и обеспечения их «хороших» свойств необходимо точное значение типа анализируемого закона распределения, что во многих случаях оказывается практически нереальным.
PAGE 2
EMBED Equation.3
EMBED Equation.3