Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Лекция 26 Статистические оценки параметров распределения.
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Естественно возникает задача оценки параметров, которыми определяется это распределение.
Обычно в распоряжении исследователя имеются лишь данные выборки, например, значения количественного признака , полученные в результате наблюдений. Через эти данные и выражают оцениваемый параметр. Рассматривая как независимые случайные величины , можно сказать, что найти статистическую оценку неизвестного параметра распределения это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра.
§ 26.1 Несмещенные, эффективные и состоятельные оценки.
Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Укажем эти требования.
Пусть наблюдаемые значения СВ . Обозначим через статистическую оценку неизвестного параметра , вычисленного на основе данного статистического материала.
Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру при любом объеме выборки, т.е.
.
Эффективной называют статистическую оценку, которая при заданном объеме выборки имеет наименьшую дисперсию.
Состоятельной называют статистическую оценку, которая при стремится по вероятности к оцениваемому параметру, т.е. для любого при .
Отметим, что смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.
§26.2 Числовые характеристики вариационных рядов.
П.1 Выборочная средняя.
Пусть для изучения генеральной совокупности относительно количественного признака извлечена выборка объема .
Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.
Если все значения признака выборки объема различны, то
. (26.1)
Если же значения признака имеют соответственно частоты , причем , то
или . (26.2)
П.2 Выборочная дисперсия и выборочное среднее квадратическое отклонение.
Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения , вводят такую характеристику как выборочная дисперсия.
Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения .
Если все значения признака выборки объема различны, то
. (26.3)
Если же значения признака имеют соответственно частоты , причем , то
. (26.4)
Пример 26.1 Выборочная совокупность задана таблицей распределения:
1 |
2 |
3 |
4 |
|
20 |
15 |
10 |
5 |
Найти выборочную дисперсию.
Решение.
Найдем выборочную среднюю по формуле (26.2): .
Найдем выборочную дисперсию:
.
Кроме дисперсии, для характеристики рассеяния значений признака выборочной совокупности вокруг своего среднего значения пользуются средним квадратическим отклонением.
Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из выборочной дисперсии: .
Замечание. Вычисление дисперсии можно упростить, используя следующую формулу: . (26.5)
П.3 Исправленная выборочная дисперсия.
Выборочная дисперсия является смещенной оценкой генеральной дисперсии, поэтому в статистике применяют также исправленную выборочную дисперсию, которая является несмещенной оценкой генеральной дисперсии и обозначается .
Исправленная выборочная дисперсия находится по формуле:
. (26.6)
Для оценки среднего квадратического отклонения генеральной совокупности используют «исправленное» среднее квадратическое отклонение, которое равно квадратному корню из исправленной дисперсии:
. (26.7)
Отметим, что не является несмещенной оценкой.
Замечание. Сравнивая формулы (26.4) и (26.6), видим, что они отличаются только знаменателями. Очевидно, что при больших значениях объема выборки выборочная и исправленная дисперсии отличаются мало. На практике пользуются исправленной дисперсией, если примерно .
§26.3 Обычные, начальные и центральные эмпирические моменты.
Для вычисления характеристик выборки удобно пользоваться эмпирическими моментами, определения которых аналогичны определениям соответствующих теоретических моментов. В отличие от теоретических эмпирические моменты вычисляют по данным наблюдений.
Обычным эмпирическим моментом порядка называют среднее значение -х степеней разностей :
,
где наблюдаемая варианта, частота варианты, объем выборки, произвольное постоянное число (ложный нуль).
Начальным эмпирическим моментом порядка называют обычный момент порядка при : .
В частности, .
Центральным эмпирическим моментом порядка называют обычный момент порядка при : .
В частности, .
§26.4 Точность оценки. Метод моментов.
Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше, точечные.
Можно доказать, что начальные и центральные эмпирические моменты являются состоятельными оценками соответственно начальных и центральных теоретических моментов того же порядка. На этом основан метод моментов, предложенный К. Пирсоном.
Метод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов рассматриваемого распределения соответствующим эмпирическим моментам того же порядка.
Если распределение определяется одним параметром, то для его отыскания приравнивают один теоретический момент одному эмпирическому моменту того же порядка. Например, можно приравнять начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка: . Учитывая, что и , получим: . (*)
Математическое ожидание является функцией от неизвестного параметра заданного распределения, поэтому, решив уравнение (*) относительно неизвестного параметра, тем самым получим его точечную оценку.
Если распределение определяется двумя параметрами, то приравнивают два теоретических момента двум соответствующим эмпирическим моментам того же порядка. Например, можно приравнять начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка и центральный теоретический момент второго порядка центральному эмпирическому моменту второго порядка: , .
Учитывая, что , , , , имеем:
(**)
Левые части этих равенств являются функциями от неизвестных параметров, поэтому, решив систему (**) относительно неизвестных параметров, тем самым получим их точечные оценки.
Разумеется, для вычисления выборочной средней и выборочной дисперсии надо располагать выборкой .
§ 26.5 Интервальные оценки. Доверительная вероятность (надежность). Доверительный интервал.
При выборке малого объема точечная оценка может приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная по данным выборки статистическая характеристика служит оценкой неизвестного параметра . Будем считать постоянным числом ( может быть и случайной величиной). Понятно, что тем точнее определяет параметр , чем меньше абсолютная величина разности . Другими словами, если и , то чем меньше , тем оценка точнее. Таким образом, положительное число характеризует точность оценки.
Однако статистические методы не позволяют категорически утверждать, что оценка удовлетворяет неравенству ; можно лишь говорить о вероятности , с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки по называют вероятность , с которой осуществляется неравенство . Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.
Пусть вероятность того, , равна .
Далее имеем: или .
Тогда вероятность того, что интервал заключает в себе (покрывает) неизвестный параметр , равна , т.е. .
Доверительным называют интервал , который покрывает неизвестный параметр с заданной надежностью .
Замечание. Интервал имеет случайные концы (их называют доверительными границами). Поэтому доверительные границы сами являются случайными величинами функциями от .
§26.6 Интервальные оценки для математического ожидания и среднего квадратического отклонения СВ, имеющей нормальное распределение.
Пусть количественный признак генеральной совокупности распределен нормально, причем среднее квадратическое отклонение этого распределения может быть известно или неизвестно. Требуется оценить неизвестное математическое ожидание по выборочной средней .
Интервальной оценкой (с надежностью ) математического ожидания нормально распределенного количественного признака по выборочной средней при известном среднем квадратическом отклонении генеральной совокупности служит доверительный интервал
, (26.8)
где точность оценки, объем выборки, значение аргумента функции Лапласа Ф, при котором Ф=; при неизвестном (и объеме выборки )
, (26.9)
где «исправленное» выборочное среднее квадратическое отклонение, находят по таблице приложений по заданным и .
Пусть количественный признак генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение по «исправленному» выборочному среднему квадратическому отклонению .
Интервальной оценкой (с надежностью ) среднего квадратического отклонения нормально распределенного количественного признака по «исправленному» выборочному среднему квадратическому отклонению служит доверительный интервал (для )
(при );
(при ), (26.10)
где находят по таблице приложений по заданным и .
Пример 26.2 Найти доверительный интервал для оценки с надежностью 0,95 неизвестного математического ожидания нормально распределенного признака генеральной совокупности, если генеральное среднее квадратическое отклонение , выборочная средняя , объем выборки .
Решение. Найдем доверительный интервал по формуле (26.8). Все величины, кроме , известны. Найдем из соотношения Ф. По таблице приложений находим . Следовательно, искомый доверительный интервал:
.
PAGE 5