Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Медицинская физика
Лечебный факультет
1 курс
1 семестр
1 поток
Лекция № 2
«Элементы математической статистики»
Составил: Бабенко Н.И.
2010 г.
1. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ,
ЕГО ФОРМУЛА, ГРАФИК, ОСОБЕННОСТИ.
Нормальное распределение ( по имени авторов - распределение Гаусса-Лапласа ) названо так потому, что оно наиболее часто встречается на практике, и прежде предполагалось, что такое распределение является «нормой» для всех массовых явлений.
Для медицинской практики наиболее важными являются следующие виды нормального распределения:
Эмпирическое нормальное распределение - это распределение, полученное опытным путем на основе статистического исследования.
Особенность этого распределения в том, что объем его совокупности всегда конечен.
Общее ( теоретическое ) нормальное распределение - это абстрактная математическая модель, которую используют в качестве стандарта для сравнения с эмпирическим ( опытным ) распределением по разным статистическим критериям.
Особенность этого распределения в том, что оно построено в предложении, что объем совокупности является бесконечно большим.
Общее нормальное распределение описывается формулой:
Здесь y=f(x) - функция, равная частоте встречаемости вариантов с данным значением признака;
N - объем совокупности;
е и π - математические постоянные, равные 2,71 и 3,14 соответственно;
σ, s стандартные отклонения ( генеральное - σ, выборочное s );
t - показатель, который называется «нормированное отклонение» и вычисляется по формуле , где
- числовое значение конкретной варианты,
или μ - средняя арифметическая выборочной или генеральной совокупности.
График общего ( теоретического ) нормального распределения представляет собой унимодальную ( одновершинную ) симметричную вариационную кривую.
Эту кривую строят в прямоугольной системе координат, где по горизонтали откладывается текущее числовое значение признака xi в порядке возрастания, а по вертикали - значение функции y = f(x), которое соответствует числу объектов ( вариантов) с данным числовым значением признака.
График нормального распределения
Y =Mo=Me
σ
2σ
3σ
X
Особенности нормального распределения:
// находится 68.3% всех наблюдений,
// находится 95.5% всех наблюдений,
// находится 99.7% всех наблюдений,
// находится 99.93% всех наблюдений.
5. Для общего ( теоретического ) нормального распределения средняя арифметическая , мода Mo и медиана Me равны между собой:
=Mo=Me.
Стандартное нормальное распределение -это особая форма распределения, которую можно использовать в качестве стандарта при оценках любых данных, независимо от их размерности. По-другому такое распределение называют нормированным нормальным распределением.
Введение стандартного нормального распределения вызвано тем, что обычная формула общего нормального распределения для практического применения неудобна. По этой формуле положение кривой по горизонтали, ее размер и форма определяются и зависят от объема совокупности, значения средней арифметической и стандартного отклонения.
Чтобы получить вместо большого числа кривых одну унифицированную кривую были проделаны следующие шаги:
При этих условиях функция от x общего теоретического нормального распределения преобразуется в функцию от z с "единичным" объемом совокупности, "единичным" стандартным отклонением и «нулевым» средним арифметическим.
Эта функция называется стандартным нормальным распределением, которой соответствует формула:
В этой формуле: средняя арифметическая равна нулю (, μ = 0 );
стандартное отклонение равно единице ( σ, s = 1 );
объем совокупности равен единице ( N, n= 1 ).
Формуле стандартного распределения соответствует стандартная нормальная кривая, в которой значение средней арифметической совпадает с началом координат, а по горизонтали откладываются единицы стандартной нормальной переменной.
Кривая стандартного нормального распределения
Y
z
-3 -2 -1 0 1 2 3 Z
Для стандартного нормального распределения существуют «зэт-таблицы», которые связывают значения «зэт» с площадью между «нулевой» средней арифметической и конкретными значениями «зэт».
На основе стандартного нормального распределения и «зэт-таблиц» решаются следующие практически важные задачи:
Этим трем задачам соответствуют под кривой площади с /1/, /2/, и /3/ штриховкой.
Z1 Z2
Также как и для общего теоретического нормального распределения, для стандартного распределения:
68,3% площади под кривой соответствует
95,5% площади под кривой соответствует
99,7% площади под кривой соответствует
Алгоритм использования «зэт-таблицы» S=f(Z).
ТАБЛИЦА ЗНАЧЕНИЙ ДОЛИ ПЛОЩАДИ ПОД КРИВОЙ
Z |
S |
Z |
S |
Z |
S |
Z |
S |
Z |
S |
Z |
S |
0,0 |
0,0000 |
0,5 |
0,1915 |
1,0 |
0,3413 |
1,5 |
0,4332 |
2,0 |
0,4772 |
2,5 |
0,4938 |
0,1 |
0,0398 |
0,6 |
0,2257 |
1,1 |
0,3643 |
1,6 |
0,4452 |
2,1 |
0,4821 |
2,6 |
0,4953 |
0,2 |
0,0793 |
0,7 |
0,2580 |
1,2 |
0,3849 |
1,7 |
0,4554 |
2,2 |
0,4861 |
2,7 |
0,4961 |
0,3 |
0,1179 |
0,8 |
0,2881 |
1,3 |
0,4032 |
1,8 |
0,4641 |
2,3 |
0,4893 |
2,8 |
0,4974 |
0,4 |
0,1554 |
0,9 |
0,3159 |
1,4 |
0,4192 |
1,9 |
0,4713 |
2,4 |
0,4918 |
2,9 |
0,4981 |
3,0 |
0,4986 |
3. РАСПРЕДЕЛЕНИЕ И КРИТЕРИЙ СТЬЮДЕНТА И ИХ ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ
Распределение Стьюдента - это нормальное распределение для выборок с объемом меньше 30.
Рассмотрено в 1908 г. математиком В. Госсетом, который взял себе псевдоним «студент» ( англ. Student ).
Распределение Стьюдента по другому называется tst - распределение.
tst - расределение - это критерий поправки ( «тэ-критерий» ), который учитывает небольшой объeм выборки.
Формула критерия:
Здесь: - средняя арифметическая выборки,
μ - средняя арифметическая генеральной совокупности
( генеральная средняя ),
- ошибка репрезентативности средней арифметической
( стандартная ошибка средней арифметической ).
В формуле числитель представляет собой отклонение выборочной средней от генеральной средней μ, а знаменатель является стандартной ошибкой средней арифметической.
График распределения Стьюдента, как и график нормального распределения, представляет унимодальную куполообразную симметричную кривую. Но он более полог и имеет большую площадь под кривой.
1
2
Рис. Графики нормального распределения 1 и распределения Стьюдента 2.
При увеличении объема выборки распределение Стьюдента стремится к нормальному распределению и переходит в него при объеме совокупности, равном бесконечности (). На практике такой переход фактически наблюдается при объемах выборки более 100 вариантов.
Практическое значение распределения Стьюдента состоит в том, что по малым выборкам становится возможным проверять статистические гипотезы относительно параметров генеральной совокупности.
На практике значения критерия Стьюдента tst берут из таблиц tst. В этих таблицах в одном столбце даются значения числа степеней свободы n, а в других - значения критерия для стандартных уровней надежности ( 0,95, 0,99, 0,999 ) или уровней значимости ( 0,05, 0,01, 0,001 ).
Вычислив по данному объему совокупности n значение числа степеней свободы n и выбрав определенное значение уровня надежности 1-α или значимости α, на пересечении строк с соответствующими n и 1-α находят tst.
4. СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ И КРИТЕРИИ ИХ ОЦЕНКИ. Условия надежности и значимости. Определение доверительного интервала по таблице tst.
Статистическая гипотеза - это предположение о свойствах и характеристиках статистического распределения.
Виды гипотез:
Нулевой гипотезой называют предположение о том, что характеристики выборки ( например, средняя арифметическая или стандартное отклонение S ) не отличаются от аналогичных характеристик μ, σ генеральной совокупности, из которой взята выборка.
Фраза «не отличаются» означает, что имеющиеся различия являются случайными.
Альтернативной гипотезой ( контргипотезой ) называется такая гипотеза, которая считает, что различия между характеристиками выборки и такими же характеристиками генеральной совокупности существенны и не случайны.
Для подтверждения или опровержения выдвинутой гипотезы применяют специальные методы статистического оценивания, которые называются критериями оценки.
Наиболее часто в медицинской практике используются параметрические и непараметрические критерии.
Параметрические критерии - это такие критерии, применение которых требует обязательного знания вида распределения.
Если распределение нормальное, то для его оценки можно применять «тау-критерий» τ, «эф-критерий» F, «тэ-критерий» Стьюдента tst. Если распределение не подчиняется нормальному закону, то эти критерии не применяют.
Непараметрические критерии отличаются от параметрических тем, что для их использования нет необходимости знать вид распределения. Такие критерии можно применять для оценки распределений, не подчиняющихся закону нормального распределения. Пример: к непараметрическим критериям относится критерий «хи-квадрат» χ2.
Особенностью непараметрических критериев является то, что они более универсальны, но менее мощны и эффективны.
На практике для статистического оценивания используют два вида оценок:
Точечная оценка - это число, которое характеризует неизвестный параметр генеральной совокупности.
К точечным оценкам относятся значения средней арифметической , дисперсии S2 и стандартного отклонения S выборки.
Интервальная оценка - это такая оценка, при которой неизвестный параметр генеральной совокупности оценивается двум числами а и b. Эти числа являются границами интервала, в котором c заданной надежностью лежит значение параметра генеральной совокупности. Числа а и b называются доверительными границами.
Интервал между доверительными границами называется доверительным интервалом.
Числовое значение этого интервала выбирается с определенной степенью вероятности. Эта вероятность называется доверительной вероятностью или доверительной надежностью.
Доверительная надежность обозначается символами 1-α и выражается в долях единицы или в процентах. На практике применяют стандартные значения доверительной надежности:
0,95 0,99 0,999 ( в долях единицы );
95% 99% 99,9% ( в процентах ).
Доверительная надежность 0,95 означает, что в 95 случаях из 100 оцениваемый параметр генеральной совокупности попадет внутрь интервала с границами а и b.И только в 5 случаях он выйдет за эти границы.
Вероятность того, что оцениваемый неизвестный параметр генеральной совокупности не попадет внутрь доверительного интервала, называется уровнем ненадежности или уровнем значимости. Уровень значимости ( ненадежности ) обозначают символом α.
В сумме уровень надежности ( 1-α ) и уровень значимости ( α ) равны 1 или 100%.
Каждому уровню надежности соответствует свой уровень значимости:
1-α α
0,95 0,05
0,99 0,01
0,999 0,001
Ввиду однозначной связи между собой уровней надежности и значимости, в одних статистических таблицах указывают значения 1-α, а в других - α.
Определение доверительного интервала по таблице tst.
Чтобы найти границы доверительного интервала выполняют действия в следующем порядке:
Интервал можно записать следующим образом:
.
Пример: Имеется выборка объемом 26 вариантов, средняя арифметическая которой равна 10, а стандартное отклонение 2. Необходимо определить доверительный интервал для средней арифметической генеральной совокупности при уровне надежности равном 0,95.
Вывод: с надежностью 0,95 средняя арифметическая генеральной совокупности будет находиться в интервале с границами 9,2-10,8 или 10 ± 0,8.
5. СПОСОБЫ ОПРЕДЕЛЕНИЯ ПРИНАДЛЕЖНОСТИ ВАРИАНТЫ К СОВОКУПНОСТИ И ИХ ХАРАКТЕРИСТИКА
Способы определения принадлежности варианты к совокупности используются тогда, когда в выборках встречаются варианты, которые по своему числовому значению значительно отличаются от остальных. Такие варианты называются «выскакивающими» вариантами. Чтобы решить вопрос об их включении в совокупность применяют специальные статические критерии.
В медицинских исследования наиболее часто используют способ «трех стандартных отклонений» и способ «тэ-критерия».
Способ трех стандартных отклонений.
Сущность способа: Варианта xмакс принадлежит к совокупности, если ее числовое значение отличается от значения средней арифметической не более, чем на три стандартных отклонения. При несоблюдении этого условия варианту считают «выскакивающей». Условия сохранения варианты в выборке: /xмакс - / 3S.
Алгоритм способа:
Способ «тэ-критерия».
Данный способ применяют для выборок с количеством вариантов не более 30и при условии, что распределение подчиняется закону нормального распределения.
Сущность способа состоит в том, что варианту исключают из выборки, если вычисленное значение «тэ-критерия» больше его табличного значения.
Алгоритм способа.