У вас вопросы?
У нас ответы:) SamZan.net

а з ступенями свободи за таблицею додаток 6 знаходимо критичну точку Правобічна критична область зобра

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 27.12.2024

Для перевірки правдивості статистичної гіпотези :  при альтернативній гіпотезі   при рівні значущості Побудуємо правобічну критичну область.

Оскільки за статистичний критерій береться випадкова величина

,

яка має t-розподіл (Стьюдента) з  ступенями свободи, за таблицею (додаток 6) знаходимо критичну точку   Правобічна критична область зображена на рис. 158.

Рис. 158

Обчислюємо спостережуване значення критерію

Оскільки  то статистична гіпотеза  відхиляється.

Отже, форма зв’язку між ознаками Х і Y є лінійною.

3. Множинна лінійна регресія

Загальна інформація. На практиці здебільшого залежна змінна  пов’язана з впливом не одного, а кількох аргументів.
У цьому разі регресію називають множинною. При цьому якщо аргументи в функції регресії в першій степені, то множинна регресія називається
лінійною, у противному разі — множинною нелінійною регресією.

Деякі елементи матричної алгебри:

а) норма вектора. Ортогональні вектори і матриці

Якщо  тоді  тоді норма вектора  буде число, яке дістанемо за формулою

 (534)

У разі, коли  то вектор  називають нормованим. Якщо для квадратної матриці А виконується рівність  (— одинична матриця ), то вона називається ортогональною;

б) диференціювання векторів

Нехай задано два вектори   тоді

Частинні похідні за  від добутку  можна записати так:

Тоді

 

Отже, маємо:

  (535)

 (536)

Диференціювання добутку  і .

Нехай задано

 

тоді

Отже,

 (537)

Частинні похідні від добутку  знаходимо так:

 (538)

Диференціювання добутку

Отже, маємо:

 (539)

Тут використана властивість транспонування добутку матриць, а саме: якщо А і В є матрицями одного й того самого розміру, то .

Для матриць А, В, С маємо  і т. д.

Якщо матриця А є симетричною, то

Тоді

 (540)

Лінійна множинна регресія.

Визначення статистичних точкових оцінок

Розглянемо лінійну залежність  від m аргументів .

Лінійна модель у цьому разі набирає такого вигляду

.  (541)

Для вибірки обсягу n матимемо систему лінійних рівнянь

 (542)

де  — випадкова величина, що має нормальний закон розподілу з числовими характеристиками   і при цьому  У векторно-матричній формі система (542) набирає такого вигляду:

 (543)

де

     

Матрицю Х розміром  називають регресійною, а елементи  цієї матриці — регресорами. Параметри рівняння (541) є величинами сталими, але невідомими. Ці параметри оцінювання статистичними точковими оцінками , які дістають шляхом обробки результатів вибірки, і є величинами випадковими. Таким чином, рівнянню (541) відповідає статистична оцінка

 (544)

Статистична оцінка для вектора  буде визначатись вектором

 (545)

де

     

Вектор похибок дорівнюватиме

 (546)

Для визначення компонентів вектора  (статистичних точкових оцінок компонентів вектора ) застосовується метод найменших квадратів.

Знайдемо суму квадратів усіх похибок:

Тут застосовано такі рівності:  

Мінімізуючий добуток  а саме:

прирівнюючи частинні похідні за елементами вектора  до нуля, дістаємо:

 (547)

Довірчий інтервал для множинної лінійної регресії

Матриця Х містить m лінійно незалежних векторів-стовпців, а це означає, що ранг її дорівнюватиме m і визначник  Отже, матриця  має обернену.

Дисперсії статистичних оцінок  визначають з допомогою кореляційної матриці для вектора .

Оскільки  то, скориставшись (545), (547), дістанемо

 (548)

Тоді маємо

 (549)

 (550)

Скориставшись (549), (550), дістанемо

Таким чином, маємо

.  (551)

Оскільки  є невідомою величиною, то в (551) замість  підставляють його точкову незміщену статистичну оцінку за аналогією з (513).

 (552)

де n є кількістю спостережень, а m — кількістю оцінюваних параметрів множинної лінійної регресії.

Значення дисперсії для   обчислюють за формулою

 (553)

де  — діагональний елемент матриці

Розглянемо рівняння лінійної множинної регресії з параметрами  , знайденими за результатами вибірки

де  — лише одне з можливих значень прогнозної величини для заданих значень .

Ураховуючи те, що   є випадковими величинами, то  буде також випадковою, а тому матиме дисперсію.

Отже,

Використовуючи властивості дисперсії від суми залежних випадкових величин (випадкові величини  є залежними), дістанемо:

оскільки це є квадратична форма, яку можна записати у векторно-матричній формі.

Отже, маємо

.  (554)

Тоді, використовуючи (551), дістанемо

.  (555)

Оскільки  — невідома величина, то в (555) використовуємо її точкову незміщену статистичну оцінку

Таким чином, маємо:

 (556)

Отже, істинне значення Y перебуватиме в інтервалі:

 (557)

який називають довірчим.

є випадковою величиною, що має розподіл Стьюдента з  ступенями свободи і обчислюється за таблицею (додаток 7) за заданою надійністю γ та числом ступенів свободи k.

Якщо до значень  — прогнозне значення — додати можливі відхилення ознаки Y від функції регресії, то до дисперсії  необхідно додати дисперсію випадкової величини  —  тобто його точкову незміщену статистичну оцінку

У цьому разі

.  (558)

І довірчий інтервал тепер дорівнюватиме:

 (559)

Коефіцієнт множинної регресії

Тісноту між ознаками Y та X, де , вимірюють з допомогою коефіцієнта множинної кореляції R, що є узагальненням парного коефіцієнта кореляції rij і обчислюється за формулою

.  (560)

Чим ближче значення R до ±1, тим краще вибрано функцію регресії

Оскільки , то

оскільки

При цьому  а оскільки  то остаточно маємо

.  (561)

Нормування коефіцієнтів регресії

Множинна лінійна регресія дає змогу порівняти вплив на досліджуваний процес різних чинників. У загальному випадку змінні  репрезентують чинники, що мають різні одиниці виміру (кілограми, гривні, метри тощо). Отже, для того щоб порівняти і з’ясувати відносну вагомість кожного з чинників, використовують так звані нормовані коефіцієнти регресії, які визначають за формулою

  (562)

де  — коефіцієнт регресії після нормування;  — виправлене середнє квадратичне відхилення змінної   — виправлене середнє квадратичне відхилення ознаки Y.

Приклад 1. Ознака Y — лінійно залежна від , , . Результати спостережень наведено в таблиці:

i

уі

хі1

хі2

хі3

1

6

1

1

2

2

8

2

2

1

3

14

1

0

0

4

20

3

2

1

5

26

5

2

2

Необхідно:

1) знайти компоненти вектора і побудувати лінійну

функцію регресії

2) обчислити R;

3) побудувати довірчий інтервал із надійністю  для множинної лінійної функції регресії та визначити дисперсії для  і оцінити ефективність впливу на ознаку Y незалежних змінних , , .

Розв’язання. 1. З умови задачі маємо:

 

Оскільки

Отже, дістали:   

Рівнянням регресії буде

2. Знайдемо R. Для цього необхідно визначити

 

Тоді

Для побудови довірчого інтервалу для множинної лінійної функції регресії необхідно обчислити  Оскільки  то в цьому разі результати обчислень зручно подати у вигляді таблиці:

i

1

6

1

1

2

5,38

0,62

0,3844

2

8

2

2

1

10,52

–2,52

6,3504

3

14

1

0

0

14,32

–0,32

0,1024

4

20

3

2

1

16,86

3,14

9,8596

5

26

5

2

2

26,96

–0,96

0,9216

Таким чином, дістанемо:

Візьмемо і обчислимо

Знайдемо

Для побудови довірчого інтервалу знаходимо

Тоді

І довірчий інтервал дорівнюватиме

Оскільки діагональні елементи матриці  відповідно дорівнюють

     

то відповідно дістанемо

Обчислимо

Визначимо нормовані коефіцієнти регресії:

Отже, для змінної  вплив на ознаку Y є найефективнішим порівняно з дією змінних

4. Нелінійна регресія

Якщо в рівняння множинної регресії змінні входять як , то регресія називається нелінійною.

У загальному випадку нелінійна регресія записується в такому вигляді:

(569)

де параметри є сталими невідомими величинами, які підлягають статистичним оцінкам, а  — випадкова величина, яка має нормальний закон розподілу з числовими характеристиками   і при цьому випадкові величини  між собою не корельовані. Реалізуючи вибірку обсягом n, згідно з (563), дістанемо систему нелінійних рівнянь виду:

 (564)

Систему (564) можна подати у векторно-матричній формі так:

 (565)

де

 

Тут  є випадковими величинами, які визначаються шляхом обробки результатів вибірки і є точковими незміщеними статистичними оцінками відповідних параметрів рівняння (563), а саме:

Здійснивши аналогічні перетворення, які були зроблені для лінійної множинної регресії, дістанемо:

.  (566)

Тіснота зв’язку вимірюється з допомогою кореляційного відношення

,  (567)

.

Приклад 2. Результати спостережень над ознаками Х і Y наведено у таблиці:

i

хі

уі

1

1

8

2

2

4

3

4

2

4

6

1

5

8

0

6

10

6

7

12

8

8

14

10

Потрібно:

1) визначити точкові незміщені статистичні оцінки для параметрів нелінійної регресії

2) обчислити η.

Розв’язання. З результатів вибірки маємо:

 

Використовуючи (566), дістанемо:

Таким чином, маємо:

Для визначення η застосовуємо табличний запис:

i

хі

уі

1

1

8

6,684

1,732

2

2

4

4,917

0,841

3

4

2

2,451

0,203

4

6

1

1,409

0,167

5

8

0

1,791

3,208

6

10

6

3,597

5,774

7

12

8

6,827

1,376

8

14

10

11,481

2,193

39

15,494

Отже, дістали

Оскільки

то

Приклад 3. За результатами спостережень ознак генеральної сукупності Х і Y:

i

хі

уі

1

1

30

2

2

20

3

4

10

4

5

8

5

8

6

6

10

1

Знайти точкові незміщені статистичні оцінки для параметрів рівняння нелінійної регресії

Обчислити η.

Розв’язання. За результатами вибірки маємо:

З рівняння (566) знаходимо:

Отже, маємо:

Для обчислення η застосовуємо таблицю:

i

хі

уі

1

1

30

31,707

2,914

2

2

20

16,643

11,269

3

4

10

9,111

0,790

4

5

8

7,6046

0,156

5

8

6

5,345

0,429

6

10

1

4,5918

12,901

75

28,459

Таким чином, дістали:

Оскільки   то

Отже,

5. Нелінійна модель за параметрами

В економічному аналізі розглядають нелінійну регресію за параметрами, що подається в такому найпростішому вигляді:

.  (568)

Такі функції регресії використовують для вимірювання впливу на обсяг виробництва таких чинників, як кількість зайнятих у виробництві робітників, обсяг основних фондів тощо.

У рівнянні є невідомими величинами, але сталими, які оцінюються точковими незміщеними статистичними оцінками  котрі визначаються обробкою результатів вибірки.

Для врахування впливу випадкових збудників, які відхиляють теоретично прогнозовану регресію, вводиться випадкова величина Тоді нелінійна модель відносно параметрів набуває такого вигляду:

.  (569)

Статистичною оцінкою рівняння (568) буде

.  (570)

Для визначення точкових незміщених статистичних оцінок  використовуємо, як і в попередніх моделях, метод найменших квадратів, а для цього рівняння (570) подано в такому вигляді:

.  (571)

Здійснивши вибірку обсягу n, дістанемо систему рівнянь, яку у векторно-матричній формі можна записати так:

 (572)

де

 

Тоді, за аналогією з попередніми випадками, компоненти вектора  визначають із рівняння

Комп’ютерна реалізація прикладу № 1.

(573)

Теоретичні запитання до теми

?

  1.  Дати визначення статистичної залежності між ознаками Х та Y.
  2.  Що означає кореляційна залежність між ознаками Х та Y?
  3.  Записати модель парної лінійної регресії?
  4.  Чому дорівнює
  5.  Чому дорівнює
  6.  Які числові характеристики для
  7.  Які числові характеристики для
  8.  Який закон розподілу ймовірностей мають випадкові величини  для парної лінійної регресії?
  9.  Чому дорівнює
  10.  Який закон розподілу ймовірності мають випадкові величини
  11.  Який закон розподілу має випадкова величина ?
  12.  Чому дорівнює
  13.  Чому дорівнює довірчий інтервал для
  14.  Чому дорівнює довірчий інтервал для
  15.  Чому дорівнює довірчий інтервал для
  16.  Чому дорівнює
  17.  Записати у векторно-матричній формі модель лінійної множинної регресії.
  18.  Чому дорівнює інтервал для множинної регресії?
  19.  Чому дорівнює довірчий інтервал для множинної регресії?
  20.  Чому дорівнює довірчий інтервал  для множинної регресії?
  21.  Чому дорівнює  для множинної регресії?
  22.  Чому дорівнює коефіцієнт множинної регресії?
  23.   Що розуміють під нормуванням коефіцієнта регресії?
  24.  Чому дорівнює вектор  для нелінійної множинної регресії?
  25.  Чому дорівнює матриця Х для нелінійної множинної регресії?
  26.  Чому дорівнює нелінійна модель за параметрами
  27.  Чому дорівнює матриця Х для нелінійної за параметрами  регресії?
  28.  Чим вимірюється кореляційний зв’язок для нелінійних моделей регресії?

Додаток до теми 16

Усі розрахунки в прикладах 1—3 можна здійснити, застосовуючи табличний процесор Excel. Розглянемо порядок виконання обчислень для прикладу 1. Табличний процесор Excel пропонує функцію, яка знаходить значення оцінок параметрів лінійної залежності за методом найменших квадратів.

1. Нехай вихідні дані містяться в блоках: матриця Х — (В2:D6) та вектор (A2:A6). Зауважимо, що в даному разі не потрібно вводити вектор-стовпчик х0, елементами якого є одиниці.

Результат розрахунку, тобто оцінки параметрів  будемо знаходити в блоці (А9:D9). Для цього необхідно, установивши курсор у клітині А9, викликати «Вставить функцию», і в категорії «Статистические» обрати функцію «ЛИНЕЙН».

У вікні запиту необхідно вказати: у першому рядку — «відомі значення у», в нашому прикладі вони розташовані в блоці (А2:A6), у другому — «відомі значення х», це вся матриця Х, що в нашому прикладі міститься в блоці (B2:D6), у третьому рядку «константа» вводиться логічне значення «істина» (відповідає числу 1), що вказує на необхідність розрахунку оцінки параметра . В останньому рядку «статистика» також має бути логічне значення «істина» (число 1) у тому випадку, коли необхідна додаткова статистична інформація (стандартні похибки оцінок параметрів, коефіцієнт детермінації, залишкова сума квадратів відхилень тощо).

Функція ЛИНЕЙН повертає оцінки параметрів, починаючи з останнього, тобто в клітинці А9 міститься значення оцінки параметра . Для того щоб знайти значення всіх параметрів, необхідно, починаючи з клітинки А9, виділити блок розмірності (5  (+ 1)), де m — кількість змінних хі. У нашому випадку m = 3, тому необхідно виділити блок розмірності (5  4) — (A9:D13).

Після цього натиснути клавіш F2, а далі комбінацію клавішів Ctrl + Shift + Enter.

У результаті у першому рядку блока (А9:D13) отримаємо значення всіх параметрів у зворотному порядку: у клітинці з адресою А9 — значення оцінки параметра , в В9 — оцінка параметра , в С9 —  і в D9 — оцінка параметра .

За обчисленим значенням оцінок параметрів запишемо рівняння лінійної множинної регресії:

.

Додаткова регресійна статистика в масиві (А9:D13) подана в такому порядку:

Стандартна похибка

F-критерій

Ступені свободи (nm – 1)

Сума квадратів відхилень, що пояснюється регресією

Сума квадратів відхилень, що пояснюється похибкою

2. Знайдемо R.

Оскільки , а значення  вказане в наведеній таблиці додаткової статистики за регресією в клітинці А11, то для розрахунку необхідно обчислити . Отримаємо .

3. Для побудови довірчого інтервалу для множинної лінійної функції регресії необхідно обчислити , де  — сума квадратів відхилення, що пояснюється похибкою . Дане значення вказане в клітинці В13. Тому .

Подальші обчислення за формулою  здійснюються з допомогою таких функцій:

категорія — Ссылки и массивы:

ТРАНСП — повертає транспонований масив;

категорія — Математические:

МУМНОЖ — повертає добуток двох матриць;

МОБР — повертає обернену матрицю.

Дістанемо . Довірчий інтервал перебуває в межах:

.

Значення , , ,  містяться в таблиці з додатковою статистикою в другому рядку, тобто в масиві (А10:D10). Дістаємо:

= 4,138;   = 1,78;   = 3,489;   = 3,001.

Підставивши відомі значення у формулу ,  дістанемо:

;

;

.

ЛІТЕРАТУРА

  1.  Brownlee K. A. Statistical theory and methodology in science and engineering. — New York; London; Sydney, 1977.
  2.  Бондарчук П. І., Скоробагатько В. Я. Гіллясті ланцюгові дроби та їх застосування. — К.: Наук. думка, 1974.
  3.  Ивченко Г. И., Медведев Ю. И. Статистика. — М.: Высш. школа, 1984.
  4.  Searl S. R., Hausman W. H. Matrix algebra for business and economics. — New York; London; Sydney; Toronto, 1970.

237




1. тема категорий и понятий кот
2. биологическим и социальным основам здоровья Вопросы по анатомии физиологии Клеточное строение орга
3. Артефакт http---ndrey
4. инкубатор НИУ ВШЭ.
5. Статистика это род практической деятельности людей цель которой сбор обработка и анализ информации
6. тематические попытки оценить долгосрочные перспективы науки технологий экономики и общества чтобы опреде
7. Рынок международной торговли
8. М.- РГУ нефти и газа им
9. Доклад- Кубик Рубика
10. Новосибирский авиационный технический колледж УТВЕРЖДАЮ Председа
11. і. Тому сьогодні мова піде про незамінних помічників малярів щітках і валиках.html
12. Этнические различия в повседневной жизни молодежи
13. тематики. Он включает в себя вопервых собственно духовные начала человеческого бытия с их антиномиями отчу
14. Тема- составление паспорта крепления однопутевого полевого штрека
15. ИЗ ЖИЗНИ МЕДВЕДЕЙ Иллюстрации в технике оригами выполнила Гайдаенко Юлия дочка
16. Политики фритрейдерства и протекционизма во внешней торговле
17. Тема курсової роботи 1
18. Курсовая работа- Кредитование физических лиц коммерческими банками
19. совокупность людей объединенных исторически обусловленными социальными формами совместной жизни и
20. Контрольная работа для ОЗО по дисциплине Культура речи и деловая риторика