Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
13. Задачи одномерной статистики (статистики случайных величин) Сравнение математических ожиданий проводят в тех случаях, когда требуется установить соответствие показателей качества изготовленной продукции и эталонного образца. Это задача проверки гипотезы: , где значение, соответствующее эталонному образцу; случайная величина, моделирующая результаты наблюдений. В зависимости от формулировки вероятностной модели ситуации и альтернативной гипотезы сравнение математических ожиданий проводят либо параметрическими, либо непараметрическими методами. Сравнение дисперсий проводят тогда, когда требуется установить отличие рассеивания показателя качества от номинального. Для этого проверяют гипотезу: Проблема исключения промахов[править]При первичной обработке статистических данных важной задачей является исключение результатов наблюдений, полученных в результате грубых погрешностей и промахов. Например, при просмотре данных о весе (в килограммах) новорожденных детей наряду с числами 3,500, 2,750, 4,200 может встретиться число 35,00. Ясно, что это промах, и получено ошибочное число при ошибочной записи запятая сдвинута на один знак, в результате результат наблюдения ошибочно увеличен в 10 раз. Статистические методы исключения резко выделяющихся результатов наблюдений основаны на предположении, что подобные результаты наблюдений имеют распределения, резко отличающиеся от изучаемых, а потому их следует исключить из выборки. Выбросы. По определению, выбросы являются нетипичными, резко выделяющимися наблюдениями. Так как при построении прямой регрессии используется сумма квадратов расстояний наблюдаемых точек до прямой, то выбросы могут существенно повлиять на наклон прямой и, следовательно, на значение коэффициента корреляции Обычно считается, что выбросы представляют собой случайную ошибку, которую следует контролировать. К сожалению, не существует общепринятого метода автоматического удаления выбросов (тем не менее, см. следующий раздел). Чтобы не быть введенными в заблуждение полученными значениями, необходимо проверить на диаграмме рассеяния каждый важный случай значимой корреляции. Очевидно, выбросы могут не только искусственно увеличить значение коэффициента корреляции, но также реально уменьшить существующую корреляцию. НЕОТВЕТЫ На этапе работы с собранными данными проблема «неответов» может быть сформулирована следующим образом: как анализировать ту информацию, которая может быть квалифицирована как «отсутствие ответа». Графическое представление поведения анализируемой переменной
Самый распространенный метод графического представления одномерных распределений это гистограмма, или столбиковая диаграмма. Каждый столбик соответствует интервалу значений переменной, причем его середина совмещается с серединой данного интервала. Высота столбика отражает частоту (абсолютную или относительную) попадания наблюдавшихся значений переменной в определенный интервал. |
14. Корреляционный анализ метод обработки статистических данных, заключающийся в изучении коэффициентов (корреляции). Его применение возможно в случае наличия достаточного количества наблюдений из более чем одной переменной. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков, для установления между ними статистических взаимосвязей. Данный метод обработки статистических данных весьма популярен в социальных науках хотя сфера применения коэффициентов корреляции обширна: контроль качества промышленной продукции, металловедение, агрохимия и проч. Популярность метода обусловлена двумя моментами: коэффициенты корреляции относительно просты в подсчете, их применение не требует специальной математической подготовки. В сочетании с простотой интерпретации (принятие гипотезы о наличии корреляции означает что изменение переменной А, произойдет одновременно с изменением значения Б), простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных. К недостаткам корреляционного анализа относится априорное предположение о линейной зависимости наблюдаемых переменных. |
17. Таблица сопряженности - средство представления совместного распределения двух переменных, предназначенное для исследования связи между ними. Таблица сопряженности 2 x 2 является наиболее универсальным средством изучения статистических связей, так как в ней могут быть представлены переменные с любым уровнем измерения Графическое представление выборки. Полигон частот, гистограмма, эмпирическая функция распределения Рисунки и графики представляют собой удобный и наглядный способ представления выборки. Выборку, извлеченную из дискретной генеральной совокупности, можно представить в видеполигона частот или полигона относительных частот. На плоскости в прямоугольной системе координат строят точки с координатами или соответственно и соединяют эти точки отрезками прямых. Полученная ломаная и называется полигоном частот (если по оси ординат отложены частоты вариант) или полигоном относительных частот (если по оси ординат отложены относительные частоты вариант). Полигон можно построить и для сгруппированной выборки. Но чаще для отображения таких выборок используют гистограммы. Гистограмма это столбчатая диаграмма, изображенная на координатной плоскости. Если отложить по оси абсцисс границы интервалов одинаковой ширины, на которые разбита сгруппированная выборка, а по оси ординат частоты или относительные частоты соответствующих интервалов, то можно построить график в виде прямоугольников, ширина которых равна длине интервала, а высота соответствующей частоте или относительной частоте. Полученная диаграмма называется гистограммой частот или гистограммой относительных частот соответственно. На гистограмме частот сумма всех высот равна , а на гистограмме относительных частот единице. Необходимо подчеркнуть, что гистограммы частот и относительных частот имеют смысл только в том случае, если все интервалы одинаковой ширины |
25. кластерный анализ один из методов многомерного анализа, предназначенный для группировки совокупности элементов, которые характеризуются многими факторами, и получения однородных групп . Разбиение на кластеры происходит с помощью некоторой метрики, например, евклидова расстояния. Задача кластерного анализа состоит в представлении исходной информации об элементах в сжатом виде без ее существенной потери. Его задачи:
Расстояние между кластерами Когда каждый объект представляет собой отдельный кластер, расстояния между этими объектами определяются выбранной мерой. Существуют различные правила, называемые методами объединения или связи для двух кластеров. Метод ближнего соседа или одиночная связь. Здесь расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах. Метод наиболее удаленных соседей или полная связь. Здесь расстояния между кластерами определяются наибольшим расстоянием между любыми двумя объектами в различных кластерах Метод Варда. В качестве расстояния между кластерами берется прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их Метод невзвешенного попарного среднего В качестве расстояния между двумя кластерами берется среднее расстояние между всеми парами объектов в них. Метод взвешенного попарного арифметического среднего Этот метод рекомендуется использовать именно при наличии предположения о кластерах разных размеров. Невзвешенный центроидный метод В качестве расстояния между двумя кластерами в этом методе берется расстояние между их центрами тяжести. Взвешенный центроидный метод Методы кластерного анализа :
Внутренние методы в свою очередь можно разделить на:
Далее, иерархические подразделяются на:
Параллельные процедуры предусматривают одновременный обсчет всех наблюдений на каждом шагу алгоритма. Напр., рассматриваются наблюдения подлежащие разбиению на неизвестное число классов. Для произвольного наблюдения отбираются наблюдения, находящиеся от него на расстоянии, не превышающем пороговое. Находится среднее число наблюдений (центр кластера), попавших в выделенное множество. Снова отбираются наблюдения, отстоящие от центра не далее чем на пороговое значение. Процедура повторяется до тех пор, пока центр не перестанет сдвигаться. Для точек, не вошедших в выделенный кластер, алгоритм повторяется. Если число группируемых наблюдений велико (от нескольких сотен и более), применяют последовательные процедуры. Иерархический алгоритм кластерного анализа - алгоритм «ближайшего соседа»на каждом шаге число кластеров уменьшается на один за счет оптимального, в определенном смысле, объединения двух групп. Критерием объединения является изменение соответствующей функции. В качестве функции такой были использованы значения сумм квадратов отклонений вычисляемые по следующим формулам: (j = 1, 2, …, m), где j - номер кластера, n - число элементов в кластере. rij - коэффициент парной корреляции. К группе итеративных методов принадлежитметод k-средних наиболее популярный метод кластеризации. Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров: где число кластеров, полученные кластеры, и центры масс векторов . Одним из итеративных методов классификации, не требующих задания числа кластеров, является метод поиска сгущений. Метод требует вычисления матрицы расстояний, затем выбирается объект, который является первоначальным центром первого кластера. Выбор такого объекта может быть произвольным, а может основываться на предварительном анализе точек и их окрестностей. Оценка качества классификацииЗаключительным этапом процедуры распознавания должна стать оценка качества полученной классификации и проверка полученных классов на отсутствие артефактов. Оценка качества классификации основана на выявлении закономерностей для каждого класса, которые могут быть определены как подмножества из заданного множества параметров, значения которых одинаковы для большинства объектов анализируемого класса и отличаются от значений параметров других классов. Отсутствие подобных закономерностей свидетельствует о том, что данный класс не представляет собой однородного множества объектов. Качество классификации считается тем выше, чем теснее расположены объекты внутри класса. Для минимизации разброса классифицируемых объектов введем такие качественные градации, как кластер и сгущение, которые позволяют определить, насколько тесно расположены объекты внутри класса по сравнению с расположением объектов внутри всей исходной совокупности. Для признания законченности процедуры распознавания необходимо добиться, во-первых, выполнения условия соответствия полученного разбиения на классы содержательному понятию кластера, и, во-вторых, условию, при котором полученный кластер может называться сгущением. Функционалы качества разбиения на классы и экстремальная постановка задачи кластер-анализа.способ разбиения заданной совокупности элементов на классы это значит определить тот количественный критерий, следуя которому можно было бы предпочесть одно разбиение другому.С этой целью в постановку задачи кластер-анализа часто вводится понятие так называемого функционала качества разбиения , определенного на множестве всех возможных разбиений. Функционалом он называется потому, что чаще всего разбиение S задается, вообще говоря, набором дискриминантных функций . Тогда под наилучшим разбиением S понимается то разбиение, на котором достигается экстремум выбранного функционала качества. Выбор того или иного функционала качества, как правило, осуществляется весьма произвольно и опирается скорее на эмпирические и профессионально-интуитивные соображения, чем на какую-либо строгую формализованную систему. |
21. Факторный анализ многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки Факторный анализ представляет собой ветвь математической статистик. Появление факторного анализа обычно связывают с именем Ч.Спирмена. В последующие 20 лет были достигнуты значительные успехи в разработке как психологических теорий, так и математического обоснования факторного анализа. Основной вклад принадлежит здесь С.Спирмену, С.Барту, К.Пирсону, Г.Томсону, Д.Максвеллу, Д.Гарнету и К.Холзингер ряд исследователей направили свои усилия на поиск методов непосредственного извлечения набора факторов из матрицы корреляций между тестами; результатом этого явилось создание многофакторного анализа, понятие о котором ввел впервые Гарнетт. Задача факторного анализа состоит в замене набора параметров меньшим числом некоторых категорий (“факторов”), являющихся линейной комбинацией исходных параметров. Удовлетворительным решением служит такая система факторов, которая достаточно адекватно передает информацию, имеющуюся в наборе параметров. Таким образом, главная цель факторного анализа сжатие информации, экономное описание. Главными целями факторного анализа являются: (1) сокращение числа переменных (редукция данных) и (2) определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации В качестве недостатков этого метода можно перечислить следующие: 2. Сложность интерпретации переменных - преобразование можно провести бесконечным множеством способов, при этом выяснить физическую суть каждой новой переменной довольно сложно, а часто и невозможно. |
22. (2) Задание с ограниченным ответом: Облические факторы -- Интерпретация это истолкование, разъяснение смысла, значения текста. |
27 . Многомерное шкалирование - метод анализа данных, который позволяет представить восприятия и предпочтения респондентов в пространстве с помощью наглядного изображения. Воспринимаемые взаимосвязи между объектами наблюдений представляют в виде геометрических связей между точками в многомерном пространстве Областями применения многомерного шкалирования являются: маркетинг и реклама оценка восприятия брендов для позиционирования и разработки новых товаров, выявление однородных по восприятию групп потребителей для сегментации рынка, оценка эффективности рекламы, ценовой анализ, оценка каналов сбыта; социология и политология восприятие программ политических партий, имиджей политиков, изучение политического спектра; психиатрия и психология например, оценка восприятия эмоций. Первичная статистическая обработка данных Все методы количественной обработки принято подразделять на первичные и вторичные. Первичная статистическая обработка нацелена на упорядочивание информации об объекте и предмете изучения. На этой стадии «сырые» сведения группируются по тем или иным критериям, заносятся в сводные таблицы. Первично обработанные данные, представленные в удобной форме, дают исследователю в первом приближении понятие о характере всей совокупности данных в целом: об их однородности неоднородности, компактности разбросанности, четкости размытости и т. д. Эта информация хорошо считывается с наглядных форм представления данных и дает сведения об их распределении. В ходе применения первичных методов статистической обработки получаются показатели, непосредственно связанные с производимыми в исследовании измерениями. К основным методам первичной статистической обработки относятся: вычисление мер центральной тенденции и мер разброса (изменчивости) данных. Первичный статистический анализ всей совокупности полученных в исследовании данных дает возможность охарактеризовать ее в предельно сжатом виде и ответить на два главных вопроса: 1) какое значение наиболее характерно для выборки; 2) велик ли разброс данных относительно этого характерного значения, т. е. какова «размытость» данных. Для решения первого вопроса вычисляются меры центральной тенденции, для решения второго меры изменчивости (или разброса). Эти статистические показатели используются в отношении количественных данных, представленных в порядковой, интервальной или пропорциональной шкале |
28)Требования к прикладному исследованию:
3.Структура отчетаОбъем отчета от 15 до 20 стр. Отчет должен включать следующие разделы: 1. Цели и задачи исследования. Изложение целей и задач исследования. Формулировка проблемы. Актуальность проблемы исследования; цель и задачи исследования; объект и предмет исследования; рабочие гипотезы. (Краткий обзор литературы по исследуемому вопросу - требование обязательное, значительно влияющее на общую оценку). 2. Основные идеи программы исследования и концептуальная схема. Определение основных понятий. Их логический анализ (теоретическая интерпретация); эмпирическая и операциональная интерпретация. 3. Сбор данных. Описание основных процедур сбора первичных данных (методики типа выборки). Описание разработанного инструментария (анкет, бланков, планов интервью...); описание техники построения выборочной совокупности и оценку ее репрезентативности; рабочий план исследования. 4. Анализ данных. Изложение и анализ полученных данных по гипотезам (задачам или проблемам). 5. Основные выводы. Теоретические и практические выводы из исследования. 6. Заключение. Постановка вопросов для дальнейшего изучения, выдвижение новых гипотез, которые не могли быть проверены в данном исследовании. 7. Приложения: методики сбора первичных данных, сводные таблицы, основные статистические показатели по ведущим гипотезам ( или задачам). 8. Список использованной литературы. Ошибки презентации… Презентация общественное представление чего-либо нового, недавно появившегося, созданного. Презентация лучше всего иметь классический, деловой, аккуратный внешний вид, После установления первого контакта на этапе начала презентации, необходимо выполнить следующие шаги. чтобы успешно начать презентацию, необходимо выполнить три условия. 26. Одномерное шкалирование. Методы НАДО ли все????? 12. Одномерное развертывание…метод одномерного развертывания предполагает, что исследователя интересует отношение некоторой совокупности респондентов к каким-то объектам. Исходными данными служат результаты ранжирования респондентами рассматриваемых объектов. Соответствующая техника позволяет получать расположение на числовой оси одновременно и респондентов, и объектов….. Метод парных сравнений - это метод построения оценочной шкалы, основанный на парном сравнении всех объектов изучения. Респондент пытается выбрать, что ему более симпатизирует из предложенной пары. Для обработки полученных данных составляется ассиметричная матрица. При чем асимметрия указывает на верность хода мысли респондента и реальность данных.. Шкала ранжирования: результаты измерения установок при ее помощи анализируются в соответствии с правилами, применимыми для ранговых шкал. Наиболее простой прием измерения установок по правилам такой шкалы - ранжирование респондентами тех объектов, отношение к которым с их стороны интересуют исследователя. Когда хотят, чтобы цель выявления установок для респондентов оставалась скрытой, в эту шкалу вводятся "фиктивные объекты". В таких ситуациях среди ранжируемых объектов значимо один или несколько. Более сложным вариантом измерения установок при помощи ранговой шкалы - метод парных сравнений. метод одномерного развертывания предполагает, что исследователя интересует отношение некоторой совокупности респондентов к каким-то объектам. Исходными данными служат результаты ранжирования респондентами рассматриваемых объектов. Соответствующая техника позволяет получать расположение на числовой оси одновременно и респондентов, и объектов Метод равнокажущихся интервалов Опишем этапы построения этой шкалы. До этого момента мы не использовали понятие «этап построения шкалы». Вместе с тем было очевидно, что применение шкалы суммарных оценок требует проверки ее качества в пилотажном исследовании. По сути, речь шла о двух этапах ее формирования: формирование совокупности суждений; проверка качества суждений в пилотажном исследовании. И только после этого можно было переходить к сбору эмпирической информации, т. е. проводить полевой этап социологического исследования. Количество этапов формирования шкал может быть различным. Для шкалы Терстоуна они следующие: 1 этап. Формирование с помощью экспертов совокупности суждений. 2 этап. Деление суждений на группы. Метод последовательных интервалов в принципиальном отношении должен обеспечить тем большую точность, чем мельче выбрать интервалы At. Однако при этом увеличивается количество вычислений, каждое из которых производится с определенной степенью точности. Может оказаться, что ошибки будут наращиваться, так как ошибка, допущенная при вычислении величины в каком-нибудь интервале, отражается на значениях этих величин во, всех последующих интервалах |