У вас вопросы?
У нас ответы:) SamZan.net

в корреляции. Ковариация зависит от шкал х и у

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 28.12.2024

Корреляция

Корреляция – количественная мера связи. Вычисляется с помощью коэфф-в корреляции.

  1. Ковариация зависит от шкал х и у.
  2. Корреляция – не зависит от Vвыборки, выражена в стандартных отклонениях.

Параметрический критерий Коэффициент Пирсона

обе шкалы количественные

Коэффициент ранговой корреляции Спирмана

порядковая и количественная шкала

Непараметрический критерий для порядковых Тау Кэндела

занижает силу связи

Регрессионный анализ

Включает в себя анализ корреляции и мн. др.

Используется для построения прогнозов.

1 предиктор на 10 кейсов

Результирующая переменная – то, что хотим предсказать.

Регрессионная прямая

Резидии – расстояния каждой точки до регрессионной прямой.

Резидуальная дисперсия – сумма квадратов расстояний до регресс-й прямой.

R2=

R2 – процент объяснённой дисперсии

Общее регрессионное уравнение

У= β0+β11+β22, где

β – нестандартный коэффициент

β0 - интерсепт

βi - угол

Всё это имеет смысл, когда переменные количественные!

Линейный регрессионный анализ

Результирующая количественная

Если качественный предиктор, то создаём Dummy переменные; если дихотомия, то кодируем значения  как 0 и 1.Число Dummy N-1 значений.

Спец. случаи

Мультиколлинеарностьуменьшает R2

Гетероскедастичность – искажает уровень значимости.

Интеракция – повышает R2


Логистический регрессионный анализ

Результирующая качественная

Логит – натуральный логарифм (-∞;∞+).

Шанс – отношение вероятностей, регрессионный коэфф-т для лог. регрессии (0;+).

-Зачем вообще логит, почему не можем обойтись одним шансом?

-диапазон логита, в отличие от диапозона значений шанса симметричен, что сопоставимо с нормальным распределением.

Предикторы:

Факторы – качественные предикторы

Ковариаты –количественные предикторы.

Псевдо R2 – оценивают % того, что объясняет модель, это точность предсказания. Вычисляется иначе, чем R2/

Мультиноминальная логистическая регрессия

Если больше двух значений в результирующей

Биноминальная логистическая регрессия

Если два значения у результирующей.

Факторный анализ

Индекс – теор. сконстр-я абстракция, кот. является обобщением конкретных вещей, каждая из этих вещей влияет на модель, первичнее не индекс, а сами эти вещи (индикаторы). Исп-ся в соц. науках

  1. способности к чему-либо,
  2. символическая насыщенность текста,
  3. проявление страха,
  4. индекс соц. неравенства,
  5. индекс человеческого развития.

Латентная переменная – переменная, которой нет в базе данных, это то, что нельзя напрямую замерить, скрытый абстрактный феномен, который влияет на частные проявления. Вначале данные, а потом замеряем лат. пер-ю. Индикаторы латентной переменной должны быть измеримы. Используется в психологии личности (в опросниках).

  1. понимание текста

Виды факторного анализа:

- Эксплораторный

открытый

не очень надёжный

факторы могут коррелировать др с др.

одна пер-я может принадлежать нескольким факторам

- Конфирматорный

закрытый

сами предполагаем какие факторы, спрашиваем программу: хороша ли модель?

факторы не коррелируют между собой

1 пер-я относится к 1 фактору

показывает вклад кадой переменной в фактор

факторы потом можно использовать как предикторы/результирующие

на входе любые шкалы – на выходе количественные

Экстрация (извлечение)

Извлечение «похожего на другие переменные» из переменной для фактора.

Лучше брать не меньше 0,4

Idem valueто, сколько переменных объединяет фактор (должна быть больше 1).

Кластерный анализ

Используется для группировки кейсов, создания типологий, классификаций.

Делают обычно на нескольких шкалах, на 2 сложно.

Есть несколько вариантов, которые лучше всего видны на графике рассеяния:

1) Нет кластеров и нет корреляции

2) Есть кластеры и корреляция

3)Нет корреляции, есть кластеры

4) Есть корреляция, нет кластеров

Максимальное число адекватных типологий  7±2

Лучше вариант без корреляции, если хотим охватить как можно больше. Как раз поэтому удобно использовать факторы – они слабо коррелируют между собой.

Виды кластерного анализа:

- Кей-кластерный

Указываем количество кластеров

техническое: min сумма расстояний до т. – центра кластера

- Иерархический

не требует, чтобы сразу указывали количество кластеров.

вначале объединяет самые близкие и так, пока не получатся большие кластеры

дендрограмма




1. ВВЕДЕНИЕ4
2. за движений земной коры залеганием слоев
3. Человек в футляре Крыжовник О любви.
4. Отечество Дом Семья Организаторы общественные организации входящие в состав межрегиональной Ассоциа
5. модуль 4 Налоги и налогообложение Вариант 6 Определить НДС подлежащий уплате в бюджет и заполнить нал
6. Курсовая работа- Корпоративная реклама
7. Структура информационной системы может быть представлена как совокупность ее функциональных подсистем а.html
8. ПОЯСНИТЕЛЬНАЯ ЗАПИСКА к курсовой работе вид документа Руководитель И
9.  Цена как экономическая категория
10. ЛИСТ Профессиональные косметические средства ldquo;Klyonrdquo; для комплексного ухода за ногтями и кутикулой
11. Компьютерная графика и основные графические редакторы
12. INTRODUCTION Rection rte is how fst or slow the rection cn go
13. Контрольная работа- Врачебно-педагогический контроль, самоконтроль при занятиях физической культурой и спортом.html
14. рятувальним підрозділом
15. Связи с общественностью Курсовая работа по Теории и практике СМИ
16. ВЕТО; референдумом Латвия ~ референдум 2001 года обязал законодательную власть пересмотреть систему соц
17. Психология успеха
18. Технологія продажу пральних, миючих та дезінфікуючих засобів
19. СОЦІАЛЬНОПСИХОЛ ЕКСПЕРТИЗИ Охарактеризуйте людину я
20. тема ценностей и стандарты поведения 13 1