Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

корреляция был введен в науку выдающимся английским естествоиспытателем Френсисо Гальтоном в 1886 г

Работа добавлена на сайт samzan.net: 2016-06-20

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 23.5.2024

1 Коэффициент корреляции Пирсона

Термин «корреляция» был введен в науку выдающимся английским естествоиспытателем Френсисо Гальтоном в 1886 г. Однако точную формулу для подсчета коэффициента корреляции разработал его ученик Карл Пирсон.

Коэффициент характеризует наличие только линейной связи между признаками, обозначаемыми, как правило, символами X и Y. Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. Поэтому он называется также коэффициентом линейной корреляции Пирсона. Если же связь между переменными X и Y не линейна, то Пирсон предложил для оценки тесноты этой связи так называемое корреляционное отношение.

Величина коэффициента линейной корреляции Пирсона не может превышать +1 и быть меньше чем -1. Эти два числа +1 и -1 — являются границами для коэффициента корреляции. Когда при расчете получается величина большая +1 или меньшая -1 — следовательно произошла ошибка в вычислениях.

Знак коэффициента корреляции очень важен для интерпретации полученной связи. Подчеркнем еще раз, что если знак коэффициента линейной корреляции — плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.

Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости.

В общем виде формула для подсчета коэффициента корреляции такова:

                                          (7)

где  хi — значения, принимаемые в выборке X,

yi — значения, принимаемые в выборке Y;

  1.  — средняя по X,   — средняя по Y.

Расчет коэффициента корреляции Пирсона предполагает, что переменные Х и У распределены нормально.

В формуле (7) встречается величина  при делении на n (число значений переменной X или Y) она называется ковариацией. Формула (7) предполагает также, что при расчете коэффициентов корреляции число значений переменной Х равно числу значений переменной Y.

Число степеней свободы  k=n-2.

2  Корреляционная зависимость.

Условимся обозначать через Х независимую переменную. а через У—зависимую переменную  Зависимость величины Y от Х называется функциональной. если каждому значению величины Х соответствует единственное значение величины У.   Обратим внимание на то, что если Х—детерминированная величина (т. е. принимающая вполне определенные значения), то и функционально зависящая от нее величина У тоже является детерминированной; если же X— случайная величина, то и У также случайная величина.однако гораздо чаще в окружающем нас мире имеет место не функциональная, а  стохастическая, или вероятностная, зависимость, когда каждому фиксированному значению независимой переменной Х соответствует не одно, а множество значений переменной У, причем сказать заранее, какое именно значение примет величина У, нельзя.  Более частое появление такой зависимости объясняется действием на результирующую переменную не только контролируемого или контролируемых факторов (в данном случае таким контролируемым фактором является переменная X), а и многочисленных неконтролируемых случайных факторов. В этой ситуации переменная У является случайной величиной. Переменная же Х может быть как детерминированной, так и случайной величиной. Если при изменении одной из величин изменяется среднее значение другой, то стохастическая зависимость называется корреляционной. Приведем пример такой зависимости: пусть У – урожай зерна, Х – количество удобрений. С одинаковых по площади участков при равном количестве внесенных удобрений снимают разный урожай. Т.е. У не является функцией от Х. это объясняется влиянием случайных факторов: осадки, температура и т.п. Но опыт показывает что средний урожай является функцией от количества удобрений, У связан с Х корреляционной зависимостью: изменяя количество вносимых удобрений, изменяется и средний урожай, т.е. математическое ожидание величины У изменяется при изменении значения Х. Такое математическое ожидание называется условным и обозначается М( У/ Х= х) и читается: математическое ожидание СВУ при условии, что Х =х.  Тогда можно считать: корреляционная зависимость имеет место, если при изменении х изменяется условное математическое ожидание  У. Аналогично вводится понятие условного математического ожидания для СВХ.  g(x) =М(У/Х=х) и f(y) = М(Х/У=у) – называются функциями регрессии, а линию на плоскости, соответствующую этому уравнению – линией регрессии соответственно У на Х и Х на У. Эта линия показывает, как в среднем зависит У от Х или Х от У.

3 Уравнение регрессии

Уравнение регрессии выглядит следующим образом: Y=a+b*X  При помощи этого уравнения переменная Y выражается через константу a и угол наклона прямой (или угловой коэффициент) b, умноженный на значение переменной X. Константу a также называют свободным членом, а угловой коэффициент - коэффициентом регрессии или B-коэффициентом.  В большинстве случав (если не всегда) наблюдается определенный разброс наблюдений относительно регрессионной прямой.  Остаток - это отклонение отдельной точки (наблюдения) от линии регрессии (предсказанного значения). Для решения задачи регрессионного анализа в MS Excel выбираем в меню Сервис "Пакет анализа" и инструмент анализа "Регрессия". Задаем входные интервалы X и Y. Входной интервал Y - это диапазон зависимых анализируемых данных, он должен включать один столбец. Входной интервал X - это диапазон независимых данных, которые необходимо проанализировать. Число входных диапазонов должно быть не больше 16. На выходе процедуры в выходном диапазоне получаем отчет, приведенный в таблице 8.3а -8.3в




1. тактична характеристика об~єкта стр
2. Об обороне Настоящий Федеральный закон определяет основы и организацию обороны Российской Федерации по
3. Тема- Двійкові коди що виправляють однократні помилки.html
4. Использование инбридинга в животноводстве
5. Индексы гигиены.html
6. 01 В соответствии со ст
7. Диуретик
8. тема взглядов основана на опыте нашего прошлого из которого мы постоянно исходим в настоящем ожидая что и
9. НА ТЕМУ- студентки гр.html
10. Переходим к токам Учитывая что разме
11. Типы реакций и их классификация в органической химии
12. Положение о федеральной государственной службе Российской Федерации раскрывающее общие понятия и консти
13. О качестве и безопасности пищевых продуктов
14. ПРЕДИСЛОВИЕ. 2
15. правового регулирования трудовых отношений служат акты ООН и Международной Организации Труда МОТ региона
16. 1923 рр 12
17. формулирование мысли и целей анализ прогнозирование разработка стратегии собственно планире контрол
18. Шпаргалка по геометрии за 9 класс
19. 85 Оно зависит от типа ткани и возраста
20. Я хочу стать Айзеком Азимовым когда вырасту