Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Вариант №3
Задача №1
Для 10 различных семей получены следующие статистические данные величин их накоплений Y (в виде банковских вкладов) и величин их совокупных доходов Х (за месяц) в некоторых условных единицах.
Х |
8 |
11 |
17 |
19 |
29 |
30 |
35 |
37 |
41 |
46 |
У |
3 |
15 |
19 |
54 |
90 |
147 |
102 |
107 |
250 |
340 |
А) Найдите величины:
Б) Постройте модель парной линейной регрессии
В) Найдите стандартные оценки Sa, Sb, коэффициент детерминации R2. Оцените достоверность расчетов и их погрешность.
Решение:
Найдем среднее значение X и Y и их среднее произведение:
Теперь проведем расчет средних значений X2 и Y2:
Среднеквадратичное отклонение показывает разброс значений в представленном множестве со средней величиной множества и рассчитывается так:
Коэффициент вариации это мера относительного разброса случайной величины; показывает, какую долю среднего значения этой величины составляет её средний разброс:
Ковариация показывает связь между значениями двух случайных переменных величин.
Так как показатель ковариации положительный, то с ростом значений одной случайной величины, значения второй имеют тенденцию также возрастать.
Коэффициент корреляции это показатель взаимного вероятностного влияния двух случайных величин.
Значение коэффициента корреляции довольно близко к единице, это свидетельствует о сильной связи между величинами.
Б) Постройте модель парной линейной регрессии
Параметры уравнения регрессии находятся методом наименьших квадратов. Для этого составляется система:
Отсюда, коэффициенты a и b определим по формулам:
Подставим данные и получим:
Таким образом, уравнение регрессии имеет вид:
В) Найдем стандартные оценки Sa, Sb:
Для оценки качества параметров регрессии построим расчетную таблицу
Х |
У |
y(x) |
(yi-y(x))2 |
(xi-)2 |
(yi-)2 |
|
1 |
8 |
3 |
-30,19 |
12034,09 |
1101,63 |
372,49 |
2 |
11 |
15 |
-7,98 |
9545,29 |
528,07 |
265,69 |
3 |
17 |
19 |
36,44 |
8779,69 |
304,23 |
106,09 |
4 |
19 |
54 |
51,25 |
3445,69 |
7,57 |
68,89 |
5 |
29 |
90 |
125,29 |
515,29 |
1245,12 |
2,89 |
6 |
30 |
147 |
132,69 |
1176,49 |
204,78 |
7,29 |
7 |
35 |
102 |
169,71 |
114,49 |
4584,41 |
59,29 |
8 |
37 |
107 |
184,52 |
32,49 |
6008,67 |
94,09 |
9 |
41 |
250 |
214,13 |
18851,29 |
1286,63 |
187,69 |
10 |
46 |
340 |
251,15 |
51665,29 |
7894,56 |
349,69 |
Сумма |
273 |
1127 |
1127 |
106160,1 |
23165,68 |
1514,1 |
Sa стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
Подставим данные и получим:
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
т.е. в 78,18 % случаев изменения X приводят к изменению Y. Другими словами точность подбора уравнения регрессии высокая. Остальные 21,82% изменения Y объясняются факторами, не учтенными в модели.
Оценим достоверность расчетов по критерию Стьюдента (уровень значимости примем равным 5%, т.е. =0,05)
Выдвинем гипотезу о случайной природе показателей, т.е. о незначимом их отличии от нуля.:
Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента.
Поскольку 2,16 < 2,306, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.
Поскольку 5,35 > 2,306, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии.
Задача №2
Имеются ежемесячные (номера месяца переменная Х) данные о выпуске продукции на производственном предприятии (количество переменная Y) в некоторых единицах:
Х |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
У |
4 |
26 |
35 |
56 |
79 |
168 |
298 |
405 |
464 |
480 |
390 |
450 |
Найдите значения параметров a,b,c для следующих моделей:
Вычислите коэффициенты детерминации для них. Выберите наиболее подходящую модель и обоснуйте.
Решение:
1. Определим параметры уравнения
X |
Y |
XY |
Х2 |
Y(X) |
(Yi-Y(X))2 |
(Yi-)2 |
|
1 |
4 |
4 |
1 |
-39,89 |
1926,33 |
54717,01 |
|
2 |
26 |
52 |
4 |
10,62 |
236,54 |
44908,671 |
|
3 |
35 |
105 |
9 |
61,13 |
682,78 |
41175,171 |
|
4 |
56 |
224 |
16 |
111,64 |
3095,81 |
33093,671 |
|
5 |
79 |
395 |
25 |
162,15 |
6913,92 |
25254,51 |
|
6 |
168 |
1008 |
36 |
212,66 |
1994,52 |
4888,34 |
|
7 |
298 |
2086 |
49 |
263,17 |
1213,13 |
3610,01 |
|
8 |
405 |
3240 |
64 |
313,68 |
8339,34 |
27916,84 |
|
9 |
464 |
4176 |
81 |
364,19 |
9962,04 |
51113,67 |
|
10 |
480 |
4800 |
100 |
414,7 |
4264,09 |
58604,34 |
|
11 |
390 |
4290 |
121 |
465,21 |
5656,54 |
23129,34 |
|
12 |
450 |
5400 |
144 |
515,72 |
4319,12 |
44979,34 |
|
Среднее |
6,5 |
237,92 |
2148,33 |
54,17 |
237,92 |
4050,35 |
34449,24 |
Сумма |
78 |
2855 |
25780 |
650 |
2854,98 |
48604,12 |
413390,92 |
Как и в предыдущей задаче,:
Теперь приступим к расчету коэффициента детерминации:
Между месяцем и объемом производства есть сильная взаимосвязь. Объем производства на 88% зависит от месяца.
2. Параметры уравнения определим из следующей системы уравнений:
Для удобства расчетов составим вспомогательную таблицу с данными:
X |
Y |
X2 |
X3 |
X4 |
YX2 |
YX |
Y(X) |
(Yi-Y(X))2 |
|
1 |
4 |
1 |
1 |
1 |
4 |
4 |
25,91 |
480,05 |
|
2 |
26 |
4 |
8 |
16 |
52 |
104 |
49,85 |
568,82 |
|
3 |
35 |
9 |
27 |
81 |
105 |
315 |
73,45 |
1478,40 |
|
4 |
56 |
16 |
64 |
256 |
224 |
896 |
96,71 |
1657,30 |
|
5 |
79 |
25 |
125 |
625 |
395 |
1975 |
119,63 |
1650,80 |
|
6 |
168 |
36 |
216 |
1296 |
1008 |
6048 |
142,21 |
665,12 |
|
7 |
298 |
49 |
343 |
2401 |
2086 |
14602 |
164,45 |
17835,60 |
|
8 |
405 |
64 |
512 |
4096 |
3240 |
25920 |
186,35 |
47807,82 |
|
9 |
464 |
81 |
729 |
6561 |
4176 |
37584 |
207,91 |
65582,09 |
|
10 |
480 |
100 |
1000 |
10000 |
4800 |
48000 |
229,13 |
62935,76 |
|
11 |
390 |
121 |
1331 |
14641 |
4290 |
47190 |
250,01 |
19597,20 |
|
12 |
450 |
144 |
1728 |
20736 |
5400 |
64800 |
270,55 |
32202,30 |
|
Среднее |
6,5 |
237,92 |
54,17 |
507,00 |
5059,17 |
2148,33 |
20619,83 |
151,35 |
21038,44 |
Сумма |
78 |
2855 |
650 |
6084 |
60710 |
25780 |
247438 |
1816,16 |
252461,27 |
Заданная система уравнений имеет единственное решение:
Таким образом, уравнение имеет вид:
3. Определим параметры уравнения
Для начала обозначим:
Приведем уравнение к линейной модели:
Тогда:
Вспомогательная таблица будет иметь вид:
X |
Y |
Y(X) |
(Yi-Y(X))2 |
||||
1 |
4 |
0,00 |
0 |
0,00 |
-141,79 |
21254,72 |
|
2 |
26 |
0,69 |
18,02 |
0,48 |
15,81 |
103,82 |
|
3 |
35 |
1,10 |
38,45 |
1,21 |
108,00 |
5329,22 |
|
4 |
56 |
1,39 |
77,63 |
1,92 |
173,41 |
13785,52 |
|
5 |
79 |
1,61 |
127,15 |
2,59 |
224,15 |
21067,91 |
|
6 |
168 |
1,79 |
301,02 |
3,21 |
265,6 |
9526,22 |
|
7 |
298 |
1,95 |
579,88 |
3,79 |
300,65 |
7,03 |
|
8 |
405 |
2,08 |
842,17 |
4,32 |
331,01 |
5474,13 |
|
9 |
464 |
2,20 |
1019,51 |
4,83 |
357,79 |
11279,94 |
|
10 |
480 |
2,30 |
1105,24 |
5,30 |
381,75 |
9653,3 |
|
11 |
390 |
2,40 |
935,18 |
5,75 |
403,42 |
180,08 |
|
12 |
450 |
2,48 |
1118,21 |
6,17 |
423,2 |
718,07 |
|
Среднее |
6,50 |
237,92 |
1,67 |
513,54 |
3,30 |
236,92 |
8198,33 |
Сумма |
78,00 |
2855,00 |
19,99 |
6162,46 |
39,57 |
2843,01 |
98379,96 |
Определим параметры уравнения регрессии:
Коэффициент детерминации будет равен:
4. Параметры уравнения
Для расчетов проведем линеаризацию функции:
Примем следующие замены:
Переводим функцию к линейному виду:
Теперь получим:
Составим таблицу:
Х |
Y |
X2 |
Y(X) |
(Yi-Y(X))2 |
|||
1 |
4 |
1,39 |
1,39 |
1,00 |
14,58 |
112,03 |
|
2 |
26 |
3,26 |
6,52 |
4,00 |
21,54 |
19,89 |
|
3 |
35 |
3,56 |
10,67 |
9,00 |
31,81 |
10,15 |
|
4 |
56 |
4,03 |
16,10 |
16,00 |
46,99 |
81,26 |
|
5 |
79 |
4,37 |
21,85 |
25,00 |
69,39 |
92,27 |
|
6 |
168 |
5,12 |
30,74 |
36,00 |
102,49 |
4291,58 |
|
7 |
298 |
5,70 |
39,88 |
49,00 |
151,37 |
21500,53 |
|
8 |
405 |
6,00 |
48,03 |
64,00 |
223,56 |
32920,23 |
|
9 |
464 |
6,14 |
55,26 |
81,00 |
330,18 |
17907,40 |
|
10 |
480 |
6,17 |
61,74 |
100,00 |
487,65 |
58,55 |
|
11 |
390 |
5,97 |
65,63 |
121,00 |
720,22 |
109047,52 |
|
12 |
450 |
6,11 |
73,31 |
144,00 |
1063,71 |
376643,87 |
|
Среднее |
6,50 |
237,92 |
4,82 |
35,93 |
54,17 |
271,96 |
46890,44 |
Сумма |
78,00 |
2855,00 |
57,81 |
431,11 |
650,00 |
3263,51 |
562685,30 |
Уравнение регрессии будет иметь вид:
D0 данная модель не объясняет эту зависимость.
5. Определим параметры уравнения.
Для расчетов проведем линеаризацию функции:
Примем следующие замены:
Переводим функцию к линейному виду:
Теперь получим:
Составим таблицу:
Х |
Y |
X2 |
Y(X) |
(Yi-Y(X))2 |
|||
1 |
4 |
1,39 |
1,39 |
1 |
14,62 |
112,68 |
|
2 |
26 |
3,26 |
6,52 |
4 |
21,63 |
19,10 |
|
3 |
35 |
3,56 |
10,67 |
9 |
32,01 |
8,92 |
|
4 |
56 |
4,03 |
16,10 |
16 |
47,38 |
74,33 |
|
5 |
79 |
4,37 |
21,85 |
25 |
70,12 |
78,84 |
|
6 |
168 |
5,12 |
30,74 |
36 |
103,78 |
4124,40 |
|
7 |
298 |
5,70 |
39,88 |
49 |
153,59 |
20853,62 |
|
8 |
405 |
6,00 |
48,03 |
64 |
227,32 |
31571,45 |
|
9 |
464 |
6,14 |
55,26 |
81 |
336,43 |
16274,53 |
|
10 |
480 |
6,17 |
61,74 |
100 |
497,91 |
320,91 |
|
11 |
390 |
5,97 |
65,63 |
121 |
736,91 |
120348,34 |
|
12 |
450 |
6,11 |
73,31 |
144 |
1090,63 |
410407,60 |
|
Сумма |
6,50 |
237,92 |
4,82 |
35,93 |
54,17 |
277,69 |
50349,56 |
Среднее |
78,00 |
2855,00 |
57,81 |
431,11 |
650 |
3332,33 |
604194,72 |
Уравнение регрессии будет иметь вид:
D0 данная модель регрессии не объясняет эту зависимость.
6. Определим параметры уравнения .
Проведем линеаризацию функции:
Преобразуем:
Исходя из этого, получим:
X |
Y |
Y(X) |
(Yi-Y(X))2 |
|||||
1 |
15 |
0 |
1,39 |
0 |
0 |
1,43 |
6,60 |
|
2 |
36 |
0,69 |
3,26 |
2,26 |
0,48 |
10,75 |
232,62 |
|
3 |
48 |
1,10 |
3,56 |
3,91 |
1,21 |
34,98 |
0,00 |
|
4 |
89 |
1,39 |
4,03 |
5,58 |
1,92 |
80,78 |
614,30 |
|
5 |
150 |
1,61 |
4,37 |
7,03 |
2,59 |
154,65 |
5722,32 |
|
6 |
270 |
1,79 |
5,12 |
9,18 |
3,21 |
262,88 |
9002,06 |
|
7 |
346 |
1,95 |
5,70 |
11,09 |
3,79 |
411,69 |
12925,64 |
|
8 |
400 |
2,08 |
6,00 |
12,48 |
4,32 |
607,19 |
40882,66 |
|
9 |
420 |
2,20 |
6,14 |
13,49 |
4,83 |
855,42 |
153213,22 |
|
10 |
380 |
2,30 |
6,17 |
14,22 |
5,30 |
1162,35 |
465598,30 |
|
11 |
490 |
2,40 |
5,97 |
14,31 |
5,75 |
1533,87 |
1308440,18 |
|
12 |
430 |
2,48 |
6,11 |
15,18 |
6,17 |
1975,85 |
2328211,17 |
|
Среднее |
78 |
3074 |
1,67 |
4,82 |
9,06 |
3,30 |
590,99 |
360404,09 |
Сумма |
6,5 |
256,17 |
19,99 |
57,81 |
108,72 |
39,57 |
7091,84 |
4324849,06 |
Уравнение регрессии будет иметь вид:
D0 данная модель регрессии не объясняет эту зависимость.
Таким образом, наиболее подходящая модель:
, т.к. для этой модели коэффициент детерминации наиболее близок к единице (D=0,88).
Задача №10
При исследовании выборки из n=24 данных, представляющих собой расходы на электроэнергию Y при различной величине выпуска продукции Х, производственным предприятием получена следующая парная линейная регрессия:
Внизу указаны стандартные ошибки. При этом коэффициент корреляции r=0,55.
Пользуясь критерием Стьюдента, найдите доверительные интервалы для параметров a, b, и проверьте гипотезу r = 0 для следующих уровней значимости: =20%; 10%; 5%; 2,5%; 1%; 0,5%.
Решение:
Формулы доверительных интервалов существования коэффициентов регрессии имеют следующий вид:
Выберем уровень значимости = 5%. Табличное значение t-критерия Стьюдента при и k=n-2=24-2=22 будет равно Tтабл= 2,07.
Определим значения параметров da, db:
Итак, доверительные интервалы для параметров а и b выглядят следующим образом:
Выдвинем гипотезу для проверки значимости коэффициента корреляции:
Рассчитаем величину t-критерия:
Теперь по таблице значений критерия Стьюдента при уровне значимости и числе степеней свободы k=n-2 находим критическое значение Если , то гипотеза Н0 принимается, в противном случае принимается гипотеза Н1.
Таким образом, получим следующие результаты:
1)
, следовательно, гипотеза r=0 отвергается.
2)
, следовательно, гипотеза r=0 отвергается.
3)
, следовательно, гипотеза r=0 отвергается.
4)
, следовательно, гипотеза r=0 отвергается.
5)
, следовательно, гипотеза r=0 отвергается.
Как видно из полученных результатов, во всех пяти заданных случаях гипотеза r=0 отвергается.