Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Для перевірки правдивості статистичної гіпотези : при альтернативній гіпотезі при рівні значущості Побудуємо правобічну критичну область.
Оскільки за статистичний критерій береться випадкова величина
,
яка має t-розподіл (Стьюдента) з ступенями свободи, за таблицею (додаток 6) знаходимо критичну точку Правобічна критична область зображена на рис. 158.
Рис. 158
Оскільки то статистична гіпотеза відхиляється.
Отже, форма звязку між ознаками Х і Y є лінійною.
3. Множинна лінійна регресія
Загальна інформація. На практиці здебільшого залежна змінна повязана з впливом не одного, а кількох аргументів.
У цьому разі регресію називають множинною. При цьому якщо аргументи в функції регресії в першій степені, то множинна регресія називається лінійною, у противному разі множинною нелінійною регресією.
Деякі елементи матричної алгебри:
а) норма вектора. Ортогональні вектори і матриці
Якщо тоді тоді норма вектора буде число, яке дістанемо за формулою
(534)
У разі, коли то вектор називають нормованим. Якщо для квадратної матриці А виконується рівність (E одинична матриця ), то вона називається ортогональною;
б) диференціювання векторів
Нехай задано два вектори тоді
Частинні похідні за від добутку можна записати так:
Тоді
Отже, маємо:
(535)
(536)
Диференціювання добутку і .
Нехай задано
тоді
Отже,
(537)
Частинні похідні від добутку знаходимо так:
(538)
Диференціювання добутку
Отже, маємо:
(539)
Тут використана властивість транспонування добутку матриць, а саме: якщо А і В є матрицями одного й того самого розміру, то .
Для матриць А, В, С маємо і т. д.
Якщо матриця А є симетричною, то
Тоді
(540)
Лінійна множинна регресія.
Визначення статистичних точкових оцінок
Розглянемо лінійну залежність від m аргументів .
Лінійна модель у цьому разі набирає такого вигляду
. (541)
Для вибірки обсягу n матимемо систему лінійних рівнянь
(542)
де випадкова величина, що має нормальний закон розподілу з числовими характеристиками і при цьому У векторно-матричній формі система (542) набирає такого вигляду:
(543)
де
Матрицю Х розміром називають регресійною, а елементи цієї матриці регресорами. Параметри рівняння (541) є величинами сталими, але невідомими. Ці параметри оцінювання статистичними точковими оцінками , які дістають шляхом обробки результатів вибірки, і є величинами випадковими. Таким чином, рівнянню (541) відповідає статистична оцінка
(544)
Статистична оцінка для вектора буде визначатись вектором
(545)
де
Вектор похибок дорівнюватиме
(546)
Для визначення компонентів вектора (статистичних точкових оцінок компонентів вектора ) застосовується метод найменших квадратів.
Знайдемо суму квадратів усіх похибок:
Тут застосовано такі рівності:
Мінімізуючий добуток а саме:
прирівнюючи частинні похідні за елементами вектора до нуля, дістаємо:
(547)
Довірчий інтервал для множинної лінійної регресії
Матриця Х містить m лінійно незалежних векторів-стовпців, а це означає, що ранг її дорівнюватиме m і визначник Отже, матриця має обернену.
Дисперсії статистичних оцінок визначають з допомогою кореляційної матриці для вектора .
Оскільки то, скориставшись (545), (547), дістанемо
(548)
Тоді маємо
(549)
(550)
Скориставшись (549), (550), дістанемо
Таким чином, маємо
. (551)
Оскільки є невідомою величиною, то в (551) замість підставляють його точкову незміщену статистичну оцінку за аналогією з (513).
(552)
де n є кількістю спостережень, а m кількістю оцінюваних параметрів множинної лінійної регресії.
Значення дисперсії для обчислюють за формулою
(553)
де діагональний елемент матриці
Розглянемо рівняння лінійної множинної регресії з параметрами , знайденими за результатами вибірки
де лише одне з можливих значень прогнозної величини для заданих значень .
Ураховуючи те, що є випадковими величинами, то буде також випадковою, а тому матиме дисперсію.
Отже,
Використовуючи властивості дисперсії від суми залежних випадкових величин (випадкові величини є залежними), дістанемо:
оскільки це є квадратична форма, яку можна записати у векторно-матричній формі.
Отже, маємо
. (554)
Тоді, використовуючи (551), дістанемо
. (555)
Оскільки невідома величина, то в (555) використовуємо її точкову незміщену статистичну оцінку
Таким чином, маємо:
(556)
Отже, істинне значення Y перебуватиме в інтервалі:
(557)
який називають довірчим.
є випадковою величиною, що має розподіл Стьюдента з ступенями свободи і обчислюється за таблицею (додаток 7) за заданою надійністю γ та числом ступенів свободи k.
Якщо до значень прогнозне значення додати можливі відхилення ознаки Y від функції регресії, то до дисперсії необхідно додати дисперсію випадкової величини тобто його точкову незміщену статистичну оцінку
У цьому разі
. (558)
І довірчий інтервал тепер дорівнюватиме:
(559)
Коефіцієнт множинної регресії
Тісноту між ознаками Y та X, де , вимірюють з допомогою коефіцієнта множинної кореляції R, що є узагальненням парного коефіцієнта кореляції rij і обчислюється за формулою
. (560)
Чим ближче значення R до ±1, тим краще вибрано функцію регресії
Оскільки , то
оскільки
При цьому а оскільки то остаточно маємо
. (561)
Нормування коефіцієнтів регресії
Множинна лінійна регресія дає змогу порівняти вплив на досліджуваний процес різних чинників. У загальному випадку змінні репрезентують чинники, що мають різні одиниці виміру (кілограми, гривні, метри тощо). Отже, для того щоб порівняти і зясувати відносну вагомість кожного з чинників, використовують так звані нормовані коефіцієнти регресії, які визначають за формулою
(562)
де коефіцієнт регресії після нормування; виправлене середнє квадратичне відхилення змінної виправлене середнє квадратичне відхилення ознаки Y.
Приклад 1. Ознака Y лінійно залежна від , , . Результати спостережень наведено в таблиці:
i |
уі |
хі1 |
хі2 |
хі3 |
1 |
6 |
1 |
1 |
2 |
2 |
8 |
2 |
2 |
1 |
3 |
14 |
1 |
0 |
0 |
4 |
20 |
3 |
2 |
1 |
5 |
26 |
5 |
2 |
2 |
Необхідно:
1) знайти компоненти вектора і побудувати лінійну
функцію регресії
2) обчислити R;
3) побудувати довірчий інтервал із надійністю для множинної лінійної функції регресії та визначити дисперсії для і оцінити ефективність впливу на ознаку Y незалежних змінних , , .
Розвязання. 1. З умови задачі маємо:
Оскільки
Отже, дістали:
Рівнянням регресії буде
2. Знайдемо R. Для цього необхідно визначити
Тоді
Для побудови довірчого інтервалу для множинної лінійної функції регресії необхідно обчислити Оскільки то в цьому разі результати обчислень зручно подати у вигляді таблиці:
i |
|||||||
1 |
6 |
1 |
1 |
2 |
5,38 |
0,62 |
0,3844 |
2 |
8 |
2 |
2 |
1 |
10,52 |
2,52 |
6,3504 |
3 |
14 |
1 |
0 |
0 |
14,32 |
0,32 |
0,1024 |
4 |
20 |
3 |
2 |
1 |
16,86 |
3,14 |
9,8596 |
5 |
26 |
5 |
2 |
2 |
26,96 |
0,96 |
0,9216 |
Таким чином, дістанемо:
Візьмемо і обчислимо
Знайдемо
Для побудови довірчого інтервалу знаходимо
Тоді
І довірчий інтервал дорівнюватиме
Оскільки діагональні елементи матриці відповідно дорівнюють
то відповідно дістанемо
Обчислимо
Визначимо нормовані коефіцієнти регресії:
Отже, для змінної вплив на ознаку Y є найефективнішим порівняно з дією змінних
4. Нелінійна регресія
Якщо в рівняння множинної регресії змінні входять як , то регресія називається нелінійною.
У загальному випадку нелінійна регресія записується в такому вигляді:
(569)
де параметри є сталими невідомими величинами, які підлягають статистичним оцінкам, а випадкова величина, яка має нормальний закон розподілу з числовими характеристиками і при цьому випадкові величини між собою не корельовані. Реалізуючи вибірку обсягом n, згідно з (563), дістанемо систему нелінійних рівнянь виду:
(564)
Систему (564) можна подати у векторно-матричній формі так:
(565)
де
Тут є випадковими величинами, які визначаються шляхом обробки результатів вибірки і є точковими незміщеними статистичними оцінками відповідних параметрів рівняння (563), а саме:
Здійснивши аналогічні перетворення, які були зроблені для лінійної множинної регресії, дістанемо:
. (566)
Тіснота звязку вимірюється з допомогою кореляційного відношення
, (567)
.
Приклад 2. Результати спостережень над ознаками Х і Y наведено у таблиці:
i |
хі |
уі |
1 |
1 |
8 |
2 |
2 |
4 |
3 |
4 |
2 |
4 |
6 |
1 |
5 |
8 |
0 |
6 |
10 |
6 |
7 |
12 |
8 |
8 |
14 |
10 |
Потрібно:
1) визначити точкові незміщені статистичні оцінки для параметрів нелінійної регресії
2) обчислити η.
Розвязання. З результатів вибірки маємо:
Використовуючи (566), дістанемо:
Таким чином, маємо:
Для визначення η застосовуємо табличний запис:
i |
хі |
уі |
||
1 |
1 |
8 |
6,684 |
1,732 |
2 |
2 |
4 |
4,917 |
0,841 |
3 |
4 |
2 |
2,451 |
0,203 |
4 |
6 |
1 |
1,409 |
0,167 |
5 |
8 |
0 |
1,791 |
3,208 |
6 |
10 |
6 |
3,597 |
5,774 |
7 |
12 |
8 |
6,827 |
1,376 |
8 |
14 |
10 |
11,481 |
2,193 |
39 |
15,494 |
Отже, дістали
Оскільки
то
Приклад 3. За результатами спостережень ознак генеральної сукупності Х і Y:
i |
хі |
уі |
1 |
1 |
30 |
2 |
2 |
20 |
3 |
4 |
10 |
4 |
5 |
8 |
5 |
8 |
6 |
6 |
10 |
1 |
Знайти точкові незміщені статистичні оцінки для параметрів рівняння нелінійної регресії
Обчислити η.
Розвязання. За результатами вибірки маємо:
З рівняння (566) знаходимо:
Отже, маємо:
Для обчислення η застосовуємо таблицю:
i |
хі |
уі |
||
1 |
1 |
30 |
31,707 |
2,914 |
2 |
2 |
20 |
16,643 |
11,269 |
3 |
4 |
10 |
9,111 |
0,790 |
4 |
5 |
8 |
7,6046 |
0,156 |
5 |
8 |
6 |
5,345 |
0,429 |
6 |
10 |
1 |
4,5918 |
12,901 |
|
75 |
28,459 |
Таким чином, дістали:
Оскільки то
Отже,
5. Нелінійна модель за параметрами
В економічному аналізі розглядають нелінійну регресію за параметрами, що подається в такому найпростішому вигляді:
. (568)
Такі функції регресії використовують для вимірювання впливу на обсяг виробництва таких чинників, як кількість зайнятих у виробництві робітників, обсяг основних фондів тощо.
У рівнянні є невідомими величинами, але сталими, які оцінюються точковими незміщеними статистичними оцінками котрі визначаються обробкою результатів вибірки.
Для врахування впливу випадкових збудників, які відхиляють теоретично прогнозовану регресію, вводиться випадкова величина Тоді нелінійна модель відносно параметрів набуває такого вигляду:
. (569)
Статистичною оцінкою рівняння (568) буде
. (570)
Для визначення точкових незміщених статистичних оцінок використовуємо, як і в попередніх моделях, метод найменших квадратів, а для цього рівняння (570) подано в такому вигляді:
. (571)
Здійснивши вибірку обсягу n, дістанемо систему рівнянь, яку у векторно-матричній формі можна записати так:
(572)
де
Тоді, за аналогією з попередніми випадками, компоненти вектора визначають із рівняння
Компютерна реалізація прикладу № 1.
(573)
Теоретичні запитання до теми |
? |
Додаток до теми 16
Усі розрахунки в прикладах 13 можна здійснити, застосовуючи табличний процесор Excel. Розглянемо порядок виконання обчислень для прикладу 1. Табличний процесор Excel пропонує функцію, яка знаходить значення оцінок параметрів лінійної залежності за методом найменших квадратів.
1. Нехай вихідні дані містяться в блоках: матриця Х (В2:D6) та вектор (A2:A6). Зауважимо, що в даному разі не потрібно вводити вектор-стовпчик х0, елементами якого є одиниці.
Результат розрахунку, тобто оцінки параметрів будемо знаходити в блоці (А9:D9). Для цього необхідно, установивши курсор у клітині А9, викликати «Вставить функцию», і в категорії «Статистические» обрати функцію «ЛИНЕЙН».
У вікні запиту необхідно вказати: у першому рядку «відомі значення у», в нашому прикладі вони розташовані в блоці (А2:A6), у другому «відомі значення х», це вся матриця Х, що в нашому прикладі міститься в блоці (B2:D6), у третьому рядку «константа» вводиться логічне значення «істина» (відповідає числу 1), що вказує на необхідність розрахунку оцінки параметра . В останньому рядку «статистика» також має бути логічне значення «істина» (число 1) у тому випадку, коли необхідна додаткова статистична інформація (стандартні похибки оцінок параметрів, коефіцієнт детермінації, залишкова сума квадратів відхилень тощо).
Функція ЛИНЕЙН повертає оцінки параметрів, починаючи з останнього, тобто в клітинці А9 міститься значення оцінки параметра . Для того щоб знайти значення всіх параметрів, необхідно, починаючи з клітинки А9, виділити блок розмірності (5 (m + 1)), де m кількість змінних хі. У нашому випадку m = 3, тому необхідно виділити блок розмірності (5 4) (A9:D13).
Після цього натиснути клавіш F2, а далі комбінацію клавішів Ctrl + Shift + Enter.
У результаті у першому рядку блока (А9:D13) отримаємо значення всіх параметрів у зворотному порядку: у клітинці з адресою А9 значення оцінки параметра , в В9 оцінка параметра , в С9 і в D9 оцінка параметра .
За обчисленим значенням оцінок параметрів запишемо рівняння лінійної множинної регресії:
.
Додаткова регресійна статистика в масиві (А9:D13) подана в такому порядку:
Стандартна похибка |
|||
F-критерій |
Ступені свободи (n m 1) |
||
Сума квадратів відхилень, що пояснюється регресією |
Сума квадратів відхилень, що пояснюється похибкою |
2. Знайдемо R.
Оскільки , а значення вказане в наведеній таблиці додаткової статистики за регресією в клітинці А11, то для розрахунку необхідно обчислити . Отримаємо .
3. Для побудови довірчого інтервалу для множинної лінійної функції регресії необхідно обчислити , де сума квадратів відхилення, що пояснюється похибкою . Дане значення вказане в клітинці В13. Тому .
Подальші обчислення за формулою здійснюються з допомогою таких функцій:
категорія Ссылки и массивы:
ТРАНСП повертає транспонований масив;
категорія Математические:
МУМНОЖ повертає добуток двох матриць;
МОБР повертає обернену матрицю.
Дістанемо . Довірчий інтервал перебуває в межах:
.
Значення , , , містяться в таблиці з додатковою статистикою в другому рядку, тобто в масиві (А10:D10). Дістаємо:
= 4,138; = 1,78; = 3,489; = 3,001.
Підставивши відомі значення у формулу , дістанемо:
;
;
.
ЛІТЕРАТУРА
237