Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Элементы математической статистики.
1.Математическая статистика наука, занимающаяся разработкой методов сбора, регистрации и обработки результатов наблюдений (измерений) с целью познания закономерностей случайных массовых явлений. Результаты наблюдений (измерений) называются статистическими данными.
Если в теории вероятностей считается заданной модель явления и надо произвести расчёты возможного реального течения этого явления, то в мат. статистике исходят из каких-либо известных реализаций некоторых случайных событий ( статистический данных), которые носят обычно числовой характер.
Мат. статистика разрабатывает методы, которые позволяют по этим статистическим данным подобрать подходящую теоретико- вероятностную модель.
Основные задачи математической статистики:
1) приближённое определение неизвестного закона распределения случайной величины;
2) приближённое определение неизвестных параметров распределения (их статистические оценки);
3) проверка правдоподобия гипотез о распределении случайной величины.
2. Выборочный метод сбора статистических данных.
Вся исследуемая совокупность однородных объектов называется генеральной совокупностью.
Множество из “n” объектов, отобранных случайным образом из генеральной совокупности, называется выборочной совокупностью - выборкой. Число “n” объём выборки.
Выборочный метод - метод основанный на том, что по данным обследованиям выборки, выделенной из данной генеральной совокупности, делается заключение о всей генеральной совокупности.
Репрезентативная выборка выборка, в которую каждый объект генеральной совокупности имеет одинаковую возможность попасть.
Если выборка репрезентативна, то результаты её изучения будут близки к результатам, которые могли бы быть получены, если бы исследовалась вся генеральная совокупность.
Способы составления выборки:
1) Повторный способ (серия независимых испытаний) отобранный объект возвращается в генеральную совокупность.
2) Бесповторный способ объект не возвращается в генеральную совокупность и получаем серию зависимых испытаний.
Различают: 1) простой случайный способ составления выборки, когда генеральная совокупность не расчленяется; 2) механистический способ, когда ген. совокупность расчленяется на n групп и из каждой группы выбирают по 1 объекту; 3) типический способ случайный выбор объектов из типической группы 4) серийный - совокупность делится на группы серии и случайным образом выбирается одна целая группа.
3.Статистическое распределение случайной величины.
Пусть Х случайная величина, количественное значение интересующего нас признака.
Составим простой статистический ряд:
N |
1 |
2 |
… |
n |
X |
… |
- номер измерения количественного признака.
- значение признака, полученное в этом измерении.
Возможные различные значения случайной величины Х назовём вариантами. Составим новую таблицу, в первой строке которой расположим варианты в порядке возрастания, во второй строке соответствующие числа - частоты значений признака, показывающие, сколько раз наблюдалось i тое значение признака. Эта таблица статистическое распределение случайной величины Х таблица значений признака, расположенных в порядке возрастания и соответствующих им частот.
Х |
… |
||||
… |
|||||
… |
|||||
0 |
+ |
… |
|||
… |
- вариационный ряд
- ряд частот значений признака
- ряд относительных частот
- ряд накопленных частот
- эмпирическая функция распределения выборки
Причём сумма частот признака равна объёму выборки n, а сумма относительных частот равна 1.
Накопленные частоты вычисляются по формуле =, а эмпирическая функция распределения определяет относительную частоту события: «значение признака Х меньше заданного ». Эмпирическая функция распределения выборки ступенчатая неубывающая функция. .
4. Если пары чисел определяют m точек плоскости, соединённых отрезками, то полученную ломаную линию назовём полигоном частот. Аналогично, по первой и третьей строке таблицы, строится полигон относительных частот.
Интервальное распределение частот упорядоченная последовательность интервалов варьирования значений исследуемого признака с соответствующими частотами или относительными частотами попаданий в каждый из них значений исследуемого признака.
Число интервалов разбиения определяется условиями проведения исследования, может быть вычислено по формулам = или =. Для небольших выборок обычно принимают равным числу от 6 до 15.
Откладывая на оси абсцисс полученные интервалы варьирования признака, а на оси ординат соответствующие им относительные частоты, делённые на ширину интервала (числа , где - ширина интервала ), получим гистограмму непрерывного признака. Кривая, «сглаживающая» гистограмму эмпирическая функция плотности относительной частоты. Площадь соответствующей криволинейной трапеции равна 1.
5. Выборочные характеристики:
1) Выборочная средняя - - среднее значение признака.
2) Выборочная дисперсия или -
3) Средневыборочное отклонение - показатель разброса значений признака относительно его среднего значения.
4) Мода признака - варианта, имеющая наибольшую частоту.
5) Медиана признака - варианта признака, делящая вариационный ряд на две части, с равным числом вариант в каждой. Если число вариант чётно, медиана равна среднему значению для двух вариант середины ряда.
6) Размах варьирования R - разность между максимальной и минимальной вариантой.
7) Начальный эмпирический момент порядка k: . 8) - центральный эмпирический момент порядка k:
6. Точечные и интервальные оценки неизвестных параметров распределения случайной величины
Точечная статистическая оценка неизвестного параметра теоретического распределения это его приближённое значение, зависящее от данных выборки.
3. Статистическая оценка называется эффективной, если при заданном “n” она имеет наименьшую дисперсию.
Выборочная средняя - - является несмещённой и состоятельной оценкой мат. ожидания.
Несмещённая оценка дисперсии исправленная выборочная дисперсия - .
7. Метод моментов для точечной оценки параметров распределения.
Предполагаем, что известен вид функции распределения исследуемой случайной величины (например, равномерное дискретное, или непрерывное экспоненциальное или нормальное и т.д.).
Для определения неизвестных параметров этого известного распределения составляем уравнения, в левой части которых теоретические, а в правых эмпирические моменты одинаковых порядков. Число таких уравнений равно числу неизвестных параметров распределения (для равномерного -2, для показательного 1, для нормального 2 и т. д.)
8. Доверительный интервал случайный интервал, в пределах которого с вероятностью находится неизвестный оцениваемый параметр. - доверительная вероятность, или надёжность оценки.
1.Доверительный интервал для оценки мат ожидания нормально распределённой СВ :
<<+, где
2.Доверительный интервал для оценки среднеквадратического отклонения СВ : ,
где s несмещённое выборочное среднеквадратичное отклонение, q табличная функция, зависящая от объёма выборки n и надёжности оценки .
9. Статистические гипотезы предположения о виде неизвестного распределения или о параметрах известных распределений.
Выдвигаемую гипотезу называют нулевой (основной) гипотезой. Обозначают .
Гипотезу, противоречащую основной называют конкурирующей или альтернативной -
В результате проверки гипотез могут совершаться ошибки первого и второго рода.
Ошибка первого рода отвергается гипотеза , а она правильная - риск.
Ошибка второго рода принимается гипотеза , а она неправильная - риск.
, , ,
Статистический критерий случайная величина, служащая для проверки основной гипотезы.
Критическая область область значений критерия, при которых гипотеза отвергается.
Область принятия гипотезы - область значений критерия, при которых гипотеза принимается.
10. Задачи проверки статистических гипотез:
1. О равенстве дисперсий (распределение Фишера- Снедекора)
2.О равенстве мат.ожиданий (распределение Стьюдента)
3. О равенстве мат.ожидания заданному числу при неизвестной дисперсии (распределние Стьюдента)
4. О равенстве мат.ожидания заданному числу при известной дисперсии (Функция Лапласа)
Критерий Пирсона: Выдвигается гипотеза о виде распределения неизвестной СВ, по данным выборки, находим точечные оценки параметров распределения этой СВ методом моментов. Находим теоретические частоты, вычисляем значение критерия Пирсона и сравниваем его с критическим, взятым из тб. распред , для заданных степеней свободы и уровня значимости.
Элементы теории корреляции
11. Основные задачи теории корреляции определение вида зависимости между случайными величинами и определение силы или тесноты этой зависимости.
Пусть в результате n испытаний (или в выборке объёма n) получены значения признаков X и Y.
Неупорядоченный статистический ряд значений случайных величин X и Y - таблица, первая строка которой номер испытания, вторая значение признака X, полученное в i-том испытании, третья соответствующее значение признака Y.
Если некоторые пары значений признаков повторяются, ряд можно упорядочить и представить в виде корреляционной таблицы, то есть таблицы, содержащей матрицу частот nij , в которой результаты наблюдения обоих признаков записаны в порядке возрастания.
Корреляционная зависимость-
X - функциональная зависимость взаимнооднозначная зависимость
Статистическая зависимость: любому значению признака X соответствует закон распределения соответствующих значений признака Y.
Корреляционная зависимость: частный случай статистической зависимости, при которой каждому значению одной случайной величины ставится в соответствие числовая характеристика соответствующего распределения другой. или точнее
12. Среднее арифметическое значение величины У, вычисленное при условии, что Х принимает фиксированное значение, называется условным средним и обозначается . Аналогично, -условное среднее величины Х, при У = у. Например=
Линия, проходящая через точки с координатами (- это эмпирическая линия регрессии Y на X. Для неё можно выбрать аппроксимирующую функцию, теоретическую линию регрессии.
Уравнения линий линейной регрессии: и
13. Выборочный эмпирический корреляционный момент величина, служащая для оценки тесноты связи между случайными величинами. == Если0 Х и У независимы. Размерность коэффициента корреляции равна произведению размерностей случайных величин Х и У. Для получения безразмерной величины, разделим его на произведение средних квадратичных отклонений. Получим выборочный коэффициент корреляции: =.
Свойства выборочного коэффициента корреляции.
1) Значения коэффициента корреляции изменяются на множестве . , то есть
2) Чем больше , тем теснее связь между изучаемыми количественными признаками.
3) Если=1 связь между случайными величинами становится функциональной.
4) Если=0 корреляционная линейная зависимость между изучаемыми признаками отсутствует. Но это не исключает существования какого-либо другого вида корреляционной зависимости (например показательной).