Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
> x<-scan("F:/test.txt")
Read 50 items
> y<-sort(x)
> y
# вариационный ряд
[1] -0.2982 -0.1884 -0.1875 -0.1862 -0.1435 -0.1389 -0.1375 -0.1266 -0.1122
[10] -0.1008 -0.0870 -0.0741 -0.0514 -0.0387 -0.0289 -0.0271 -0.0181 -0.0124
[19] -0.0101 -0.0089 0.0009 0.0024 0.0071 0.0148 0.0212 0.0262 0.0294
[28] 0.0345 0.0378 0.0380 0.0395 0.0453 0.0509 0.0513 0.0544 0.0596
[37] 0.0636 0.0637 0.0664 0.0744 0.0815 0.0819 0.0878 0.0888 0.1004
[46] 0.1026 0.1114 0.1211 0.1766 0.2008
# Эмпирическая функция распределения
#Гистограмма частот
> hist(x, breaks=50, freq = TRUE, right= TRUE)
#Полигон частот
Математическое ожидание
( > mean<-sum(x)/length(x) )
Дисперсия
(> var<-sum(x^2)/length(x)-mean^2)
Медиана
(> med<-y[as.integer((length(y)/2)+(as.integer(length(y)/2))+1)/2])
Асимметрия
(> asm<-sum((x-mean)^3)/length(x)/var^(3/2))
Эксцесс
(exc<-sum((x-mean)^4)/length(x)/var^2-3)
Вероятность
(> p<-f(x,0.1)-f(x,-0.06))
Найдём оценку методом моментов
Оценка методом моментов совпала с ОМП, смещения посчитаны выше.
Оценка методом моментов совпала с ОМП, смещения посчитаны выше.
d)Построить доверительные интервалы уровня значимости для параметров .
Построим доверительный интервал для а.
Согласно лемме Фишера
где - квантиль распределения Стьюдента уровня
Вычисления в R:
>T<-array(dim=2)
> T[1]<-mean-qt(1-alpha2/2,n-1)*sqrt(var/(n-1)) #левая граница Д.И.
> T[2]<-mean+qt(1-alpha2/2,n-1)*sqrt(var/(n-1)) #правая граница Д.И.
> T
[1] --0.1463675 0.1446795
Получили доверительный интервал для параметра уровня доверия .
Построим доверительный интервал для .
Согласно лемме Фишера
Введём и - квантили распределения уровня и соответственно.
Тогда
Согласно теореме Колмогорова, при справедливости гипотезы
, где К- распределение Колмогорова.
Обозначим
Согласно таблице распределения Колмогорова,
Вычислим величину в R.
> Fy<-ecdf(x);
> Fnorm<-pnorm(y,a0,sig0)
> Diff<-array(dim=50);
> for(i in 1:n){Diff[i]<-abs(Fy(y[i])-Fnorm[i])}
> D<-max(Diff);
> Dn<-D*sqrt(n);
> Dn
[1] 6.527957
- значит гипотезу отвергаем. Наибольший уровень значимости, на котором нет оснований отвергнуть данную гипотезу, согласно распределению Колмогорова, примерно равен .
Простая гипотеза согласия:
Поделим область на r=5 интервалов, введём вектор внутренних границ b, вычислим частоты попадания наблюдения в i-й интервал (с помощью гистограммы), величину .
, где - теоретическая вероятность попадания в интервал с номером i.
Выбрали следующий вектор границ b=(0.0,0.05,0.08,0.14, 0.18.).
Известно, что .
Тогда запишем критерий проверки гипотезы:
Если , то принимаем гипотезу, иначе отвергаем.
- квантиль порядка распределения
Для нахождения наибольшего значения уровня значимости, на котором ещё нет оснований отвергнуть данную гипотезу, вычисляем функцию распределения в точке , и вычитаем полученное значение из единицы.
Вычисления в R.
> r<-6 #количество интервалов
> sig0<-0.1
> a<-0.3
> b<-array(dim=r-1) #вектор границ
> b[1]<- 0; b[2]<- 0.05; b[3]<-0.08; b[4]<-0.14; b[5]<-0.18;
> h<-hist(x,breaks=c(min(x),b,max(x)),plot=FALSE) #построение гистограммы
> p[1]<-pnorm(b[1],a,sig0)
> i<-2
> while(i<=r-1){
+ p[i]<-pnorm(b[i],a,sig0)-pnorm(b[i-1],a,sig0);
+ i<-i+1;
+ }
> p[r]<-1-pnorm(b[r-1],a,sig0) #конец заполнения вектора
> yhu<-h$counts #получение вектора частот
> v1<-(yhu-n*p)^2/(n*p) #вектор слагаемых величины X2
> X2<-sum(v1) #вычисление величины X2
> xa<-qchisq(1-alpha2,4) #вычисление квантиля
> X2<xa
[1] FALSE
> alpha3<-1-pchisq(X2,r-1) #находим наибольший уровень значимости, при
> alpha3
[1] 0 #котором нет оснований отвергнуть гипотезу
[1] 0
g) Построить критерий значимости проверки сложной гипотезы согласия с нормальным распределением. Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором ещё нет основания отвергнуть данную гипотезу.
Сложная гипотеза согласия: , где функция нормального распределения с параметрами ;
Поделим область на r=4 интервалов, задав внутренние границы b=(4.906;5.137;5.396). X2- зависит от , т.к. величины pi не фиксированы. Известно, что в случае регулярности эксперимента статистика сходится по распределению к Далее проведем вычисления в R:
> P<-function(aa,sig){
+ p[1]<-pnorm(b[1],aa,sig)
+ i<-2
+ while(i<=r-1){
+ p[i]<-pnorm(b[i],aa,sig)-pnorm(b[i-1],aa,sig);
+ i<-i+1;
+ }
+ p[r]<-1-pnorm(b[r-1],aa,sig);p;}
> h<-hist(x,c(min(x),b,max(x)),plot=FALSE) #новая гистограмма
> yhu<-h$counts
> X2<-function(a,b){g<-n*P(a,b);f<-(yhu-g)^2/g;sum(f)} #и величина X2 зависит от параметра
> XM<-nlm(X2,mean(x),sqrt(var(x))) #проводим нелинейную минимизацию, отыскивая тем самым
> yb<-qchisq(1-alpha2,r-3) #вычисляем квантиль
> XM$minimum<yb # гипотезу принимаем на заданном уровне знач.
[1] TRUE
> alpha3<-1-pchisq(XM$minimum,r-3) #наибольший уровень значимости, на котором
> alpha3 #нет оснований отвергнуть гипотезу
[1] 0.2273622
h)Построить наиболее мощный критерий проверки простой гипотезы нормальности с параметрами при альтернативе нормальности с параметрами . Проверить гипотезу на уровне значимости . Что получится, если поменять местами основную и альтернативную гипотезы?
Согласно лемме Неймана-Пирсона, наиболее мощный критерий проверки гипотезы при альтернативе имеет вид:
, где
Т.к. по условию задачи , то примет вид:
Значит, критерий можно переписать в виде:
Отыщем А из уравнения:
, следовательно,
Тогда А - квантиль распределения уровня .
Проведём вычисления в R.
> A<-0
> A<-qnorm(alpha2,n*a0,sqrt(n)*sig0)
> sum(y)<A
[1] TRUE
> A
[1] 9.808455 #гипотезу отвергаем на уровне
Критерий построен.
Теперь поменяем местами основную и альтернативную гипотезу.
Согласно лемме Неймана-Пирсона, наиболее мощный критерий проверки гипотезы при альтернативе имеет вид:
, где
Т.к. по условию задачи , то примет вид:
Значит, критерий можно переписать в виде:
Отыщем А из уравнения:
, следовательно,
Тогда А - квантиль распределения уровня .
Проведём вычисления в R.
> a1<-0.00
> A<-0
> A<-qnorm(1-alpha2,n*a1,sqrt(n)*sig0)
> A
[1] 5.191545
> sum(y)<A
[1] TRUE #гипотезу принимаем на уровне
Критерий построен.
c(i) В предположении, что исходные наблюдения являются выборкой из распределения Лапласа, построить оценку максимального правдоподобия параметров, а также оценку по методу моментов.
Найдём оценку максимального правдоподобия:
Найдём оценку методом моментов
d(i) Построить асимптотические доверительные интервалы уровня значимости для параметров на базе оценки максимального правдоподобия.
ОМП параметра
ОМП
Эксперимент регулярен, значит, подстановка ОМП вместо параметра в информацию Фишера не нарушает асимптотической нормальности.
Где , т.е. b - квантиль стандартного нормального распределения.
Вычисления в R:
>T<-array(dim=2)
> T[1]<-med-qnorm(1-alpha2/2)*sum(abs(y-med))/n
> T[2]<-med+qnorm(1-alpha2/2)*sum(abs(y-med))/n
> T
[1] -19.3087 25.3087
> TT<-array(dim=2)
> TT[1]<-((sqrt(2)-qnorm(0.995))*sum(abs(y-med))/n)^2
> TT[2]<-((sqrt(2)+qnorm(0.995))*sum(abs(y-med))/n)^2
> TT
[1] 12.15099 143.36461
Получили асимптотические доверительные интервалы для параметров уровня доверия
Для а
Для
e(i) С использованием теоремы Колмогорова построить критерий значимости проверки простой гипотезы согласия с распределением Лапласа с параметрами . Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором нет оснований отвергнуть данную гипотезу.
Согласно теореме Колмогорова, при справедливости гипотезы
, где К- распределение Колмогорова.
Обозначим
Согласно таблице распределения Колмогорова,
Вычислим величину в R.
> Flapl<-function(x,a,sig){
+ if (x>a) p<-1-exp(-sqrt(2)*(x-a)/sig)/2
+ else p<-exp(sqrt(2)*(x-a)/sig)/2
+ p;}
> Fy<-ecdf(x);
> Flaplvec<-array(dim=50);
> for( i in 1:n){Flaplvec[i]<-Flapl(y[i],5.5,0.5)}
> Diff<-array(dim=50);
> for(i in 1:n){Diff[i]<-abs(Fy(y[i])-Flaplvec[i])}
> D<-max(Diff);
> Dn<-D*sqrt(n);
> Dn
[1] 7.071067
- значит гипотезу отвергаем. Наибольший уровень значимости, на котором нет оснований отвергнуть данную гипотезу, согласно распределению Колмогорова, ничтожно мал (не удалось отыскать).
f(i) Используя гистограмму частот, построить критерий значимости проверки простой гипотезы согласия с распределением Лапласа с параметрами. Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором ещё нет основания отвергнуть данную гипотезу.
Простая гипотеза согласия:
Поделим область на r=5 интервалов, введём вектор внутренних границ b, вычислим частоты попадания наблюдения в i-й интервал (с помощью гистограммы), величину .
, где - теоретическая вероятность попадания в интервал с номером i.
Выбрали следующий вектор границ b=(0.0,0.05,0.08,0.14, 0.18)
Известно, что .
Тогда запишем критерий проверки гипотезы:
Если , то принимаем гипотезу, иначе отвергаем.
- квантиль порядка распределения
Для нахождения наибольшего значения уровня значимости, на котором ещё нет оснований отвергнуть данную гипотезу, вычисляем функцию распределения в точке , и вычитаем полученное значение из единицы.
Вычисления в R.
> h<-hist(y,breaks=c(min(y),b,max(y)),plot=FALSE) #построение гистограммы
> p<-array(dim=5) #вектор теоретических вероятностей
> p[1]<-Flapl(b[1],a,sig0)
> i<-2
> while(i<=r-1){
+ p[i]<-Flapl(b[i],a,sig0)-Flapl(b[i-1],a,sig0);
+ i<-i+1;
+ }
> p[r]<-1-Flapl(b[r-1],a,sig0)
> yhu<-h$counts #получение вектора частот
> v1<-(yhu-n*p)^2/(n*p) #вектор слагаемых величины X2
> X2<-sum(v1) #вычисление величины X2
> xa<-qchisq(1-alpha2,r-1) #вычисление квантиля
> X2<xa #гипотеза опроверглась
[1] FALSE
> alpha3<-1-pchisq(X2,r-1 )#находим наибольший уровень значимости, при
> alpha3 #котором нет оснований отвергнуть гипотезу
[1] 0 #уровень значимости (очень мал)
g(i) Построить критерий значимости проверки сложной гипотезы согласия с распределением Лапласа. Проверить гипотезу на уровне значимости . Вычислить наибольшее значение уровня значимости, на котором ещё нет основания отвергнуть данную гипотезу.
Сложная гипотеза согласия: , где функция распределения Лапласа с параметрами ;
Поделим область на r=4 интервалов, задав внутренние границы b=(0.0,0.05,0.08,0.14, 0.18). X2- зависит от , т.к. величины pi не фиксированы. Известно, что в случае регулярности эксперимента статистика сходится по распределению к Далее проведем вычисления в R:
> P<-function(aa,sig){
+ p[1]<-Flapl(b[1],aa,sig)
+ i<-2
+ while(i<=r-1){
+ p[i]<-Flapl(b[i],aa,sig)-Flapl(b[i-1],aa,sig);
+ i<-i+1;
+ }
+ p[r]<-1-Flapl(b[r-1],aa,sig);p;}
> h<-hist(x,c(min(y),b,max(x)),plot=FALSE) #новая гистограмма
> yhu<-h$counts
> X2<-function(a,b){g<-n*P(a,b);f<-(yhu-g)^2/g;sum(f)} #и величина X2 зависит от параметра
> XM<-nlm(X2,mean(y),sqrt(var(y))) #проводим нелинейную минимизацию, отыскивая тем самым
[1] TRUE
> alpha3<-1-pchisq(XM$minimum,r-3) #наибольший уровень значимости, на котором
> alpha3 #нет оснований отвергнуть гипотезу
[1] 0.3110913