Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
47. Надежность психодиагностических методик
В традиционной тестологии термин «надежность» означает относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Как пишет А. Анастази, вряд ли можно с доверием относиться к тесту интеллекта, если по нему в начале недели ребенок имел показатель, равный 110, а к концу 80. Повторное применение надежных методик дает сходные оценки. При этом в определенной мере могут совпадать как сами результаты, так и порядковое место (ранг), занимаемое испытуемым в группе. И в том, и в другом случае при повторении опыта возможны некоторые расхождения, но важно, чтобы они были незначительными, в пределах одной группы. Таким образом, можно сказать, что надежность методики это такой критерий, который говорит о точности психологических измерений, т. е. позволяет судить о том, насколько внушают доверие полученные результаты.
Степень надежности методик зависит от многих причин. Поэтому важной проблемой практической диагностики является выяснение факторов, снижающих точность измерений. Была сделана попытка составить классификацию таких факторов. Среди них наиболее часто называются следующие:
1) нестабильность диагностируемого свойства;
2) несовершенство диагностических методик (небрежно составлена инструкция, задания по своему характеру разнородны, нечетко сформулированы указания, как методику предъявлять испытуемым, и т. д.);
3) меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещенность помещения, наличие или отсутствие посторонних шумов и т. д.);
4) различия в манере поведения экспериментатора (от опыта к опыту по-разному предъявляет инструкции, по-разному стимулирует выполнение заданий и т. д.);
5) колебания в функциональном состоянии испытуемого (в одном эксперименте отмечается хорошее самочувствие, в другом утомление и т. д.);
6) элементы субъективности в способах оценки и интерпретации результатов (когда ведется протоколирование ответов испытуемых, оцениваются ответы по степени полноты, оригинальности и т. п.).
Если все эти факторы иметь в виду и постараться в каждом из них устранить условия, снижающие точность измерений, то можно добиться приемлемого уровня надежности теста. Одним из важнейших средств повышения надежности психодиагностической методики является единообразие процедуры обследования, его строгая регламентация: одинаковые для обследуемой выборки испытуемых обстановка и условия работы, однотипный характер инструкций, одинаковые для всех временные ограничения, способы и особенности контакта с испытуемыми, порядок предъявления заданий и т. д. При такой стандартизации процедуры исследования можно существенно уменьшить влияние посторонних случайных факторов на результаты теста и таким образом повысить их надежность.
Измерительные шкалы (от лат. scala «лестница») форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Наиболее общая классификация измерительных шкал предложена С. Стивенсон . В ее основу положен признак метрической детерминированности. Согласно этому признаку шкалы делятся на метрические (интервальные и шкалы отношений) и неметрические (номинативные, шкалы порядка).
Номинативные шкалы (шкалы наименований) устанавливают соответствие признака тому или иному классу. Объекты объединяют в классы на основании какого-либо общего свойства (классы эквивалентности) либо символа (обозначения). Необязательно, чтобы между выявленными классами существовала внутренняя взаимосвязь. Само название «шкала наименований» указывает на то, что значения по шкале играют роль лишь названий классов. Одним из распространенных видов номинативной шкалы является классификация объектов на две группы по принципу «А не-А» (альтернативные признаки в дихотомической шкале наименований). Конкретными примерами применения такой шкалы являются оценивание ответа испытуемого на пункт опросника в виде утверждения или отрицания, соответствие или несоответствие полученного вида ответа ключу (коду) измеряемого свойства (см. личностные опросники).
Примером оценивания в номинативной шкале могут служить классификация решений тестовой задачи или пункт опросника с задачей закрытого типа.
В строгом смысле номинативная шкала не является шкалой измерения. Она допускает лишь операцию равенства и неравенства и более или менее дифференцированную классификацию признаков. Вместе с тем в психологических исследованиях и психологической диагностике этот вид измерительных шкал имеет достаточно большое значение, особенно при фиксации качественной информации (например, данных проективных методик при сборе психологического анамнеза и т. д.).
Порядковые шкалы (ординальные) предназначены для расчленения совокупности признаков на элементы, связанные отношением «больше меньше», и допускают отнесение переменных к группам, упорядоченным (ранжированным) друг относительно друга и представляющим некое системное единство. Порядковые шкалы дают возможность оценить степень выраженности признака. Они содержат не менее трех классов с установленной последовательностью, не допускающей перестановки. Упорядочивание признаков в ординальной шкале может быть униполярным (при определении классов исходят из степени выраженности измеряемого свойства) и биполярным (в основе разделения лежит ранг степени приближения к одному из противоположных полюсов свойства).
В качестве примера униполярного упорядочивания может быть приведена шкала оценивания качеств внимания: «весьма устойчивое /устойчивое / лабильное / рассеянное». Примером оценивания по биполярному принципу может служить идентификация выраженности свойств между полярными антонимическими характеристиками свойств личностных проявлений:
1) уравновешенный… нестабильный;2) общительный… замкнутый;3) подвижный… медлительный.
Порядковые шкалы относятся к числу распространенных в психологической диагностике
Шкала интервалов относится к метрическим шкалам, в которых элементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе ранжирования признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака.
В шкале интервалов нулевая точка отсчета может устанавливаться произвольно, а величины единиц и направление отсчета могут определяться по избираемым константам.
К разряду шкалы интервалов относятся шкалы стандартного IQ-показателя, Т-баллов, процентилей и другие (см. стандартизация, оценки шкальные). Шкалирование в интервальной шкале составляет основу психометрических измерений.
В шкалах отношений (пропорциональных) числовые значения присваиваются объектам таким образом, чтобы между числами и объектами соблюдалась пропорциональность. Начало отсчета в такой шкале фиксировано. Шкала предусматривает операции равенства / неравенства, больше / меньше, равенства интервалов и равенства отношений.
Примером использования такой шкалы в психологических измерениях может служить шкала порогов абсолютной чувствительности анализатора.
Наряду с делением шкал на метрические и неметрические существует классификация по признаку формы фиксации эмпирических данных, а именно: шкалы вербальные, шкалы числовые и шкалы графические.
Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в стандартную. Эта процедура называется стандартизацией тестового балла.
Выборка, на которой определяются статистические тестовые нормы, называется выборкой стандартизации . Ее численность, как правило, не меньше 200 человек. Столько должны принять участие в психометрическом эксперименте по определению тестовых норм в эксперименте по стандартизации теста.
Корреляция качественных признаков метод анализа связи переменных, измеряемых в порядковых шкалах и шкалах наименований (см. шкалы измерительные). Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов ранговой корреляции, используемых в случаях, когда обе переменные измеряются в шкалах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых переменных в шкалах наименований широко применяются коэффициенты сопряженности, в которых в качестве промежуточной расчетной величины используется критерий согласия Пирсона (см. критерий X2).
Ранговая корреляция метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения. Наиболее часто ранговая корреляция применяется для анализа связи между признаками, измеряемыми в порядковых шкалах (см. шкалы измерительные), а также как один из методов определения корреляции качественных признаков. Достоинством коэффициентов ранговой корреляции является возможность их использования независимо от характера распределения коррелирующих признаков.
В практике наиболее часто применяются такие ранговые меры связи, как коэффициенты ранговой корреляции Спирмена и Кендалла. Первым этапом расчета коэффициентов ранговой корреляции является ранжирование рядов переменных (табл. 2). Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречается несколько равных по значению переменных, им присваивается усредненный ранг.
Таблица 2
Ранжирование распределения показателей теста (n = 18)
В таблице 2 приведены данные для расчета коэффициентов ранговой корреляции. Во второй графе представлены ранжированные показатели по первому из сравниваемых распределений (оценка IQ, в третьей графе соответствующие им данные теста зрительной памяти).
Коэффициент корреляции рангов Спирмена (rs) определяется из уравнения:
где di разности между рангами каждой переменной из пар значений X и Y;
n число сопоставляемых пар.
Используя данные таблицы 2, получаем:
Коэффициент корреляции рангов Кендалла ? определяется следующей формулой:
где Р и Q рассчитываются по таблице 12.
Так, в восьмой графе подсчитывается, начиная с первого объекта X, сколько раз его ранг по Y меньше, чем ранг объектов, расположенных ниже. Соответственно, в девятой графе (S2) фиксируется, сколько раз ранг Y больше, чем ранги, стоящие ниже его в столбце X. Подставляя эти данные в формулу, получаем:
При сопоставлении приведенных коэффициентов оказывается, что коэффициент ? более информативен, чем rs, и рассчитывается проще. Поэтому на практике при расчете рановой корреляции отдают предпочтение коэффициенту ? (табл. 3).
Таблица 3
Распределение IQ-оценок и показателей теста зрительной памяти
50. Этапы стандартизации
Первый этап стандартизации психологического теста состоит в создании единообразной процедуры тестирования. Она включает определение следующих моментов диагностической ситуации:
Второй этап стандартизации психологического теста состоит в создании единообразной оценки выполнения теста: стандартной интерпретации полученных результатов и предварительной стандартной обработки. Этот этап предполагает также сравнение полученных показателей с нормой выполнения этого теста для данного возраста (например, в тестах интеллекта), пола и т.д. (см. ниже).
Третий этап стандартизации психологического теста состоит в определении норм выполнения теста.
Нормы разрабатываются для различных возрастов, профессий, полов и др. Наличие нормативных данных (норм) в стандартизованных методах психодиагностики является их существенной характеристикой.
Нормы необходимы при интерпретации тестовых результатов (первичных показателей) в качестве эталона, с которым сравниваются результаты тестирования.
Определение норм для теста
На этапе создания теста формируется некоторая группа испытуемых, на которой проводится данный тест. Средний результат выполнения этого теста в данной группе принято считать нормой. Средний результат это не единственное число, а диапазон значений. Существуют определенные правила формирования такой группы испытуемых, или, как ее иначе называют, выборки стандартизации.
Правила формирования выборки стандартизации:
Распределение результатов, полученных при тестировании испытуемых выборки стандартизации, можно изобразить с помощью графика кривой нормального распределения.
Производные показатели получаются путем математической обработки первичных показателей.
51. Основные показатели качества стандартизации.
Важнейшими показателями качества психодиагностических методик являются надежность, валидность, стандартизированность, репрезентативность.
Надежность психодиагностических методик свидетельствует о повторяемости, стабильности результатов, об их постоянстве и устойчивости.
Надежность теста показывает независимость его результатов от действия разных случайных факторов.
Другим показателем качества методики является ее валидность. Валидность свидетельствует о том, пригодна ли методика для измерения определенных качеств, особенностей и насколько эффективно она это делает.
Наиболее распространенным способом нахождения теоретической валидности методики является конвергентная валидность, т. е. сопоставление данной методики с авторитетными родственными методиками и доказательство значимых связей с ними. Сопоставление с методиками, имеющими другое теоретическое основание, и констатация отсутствия значимых связей с ними называется дискриминантной валидностью.
Другой вид валидности - прагматическая валидность - проверка методики с точки зрения ее практической значимости, эффективности, полезности.
Стандартизированное™, психодиагностической методики предполагает, с одной стороны, единую стандартную процедуру ее проведения и обработки результатов, а с другой стороны включает перевод «сырых первоначальных результатов теста» в стандартную шкалу тестовых баллов, в результате чего можно сопоставлять результаты у разных испытуемых в разных тестах. Выборка, на которой определяются статистические тестовые нормы, называется «выборкой стандартизации».
Следует учитывать репрезентативность тестовых норм - правомерность применения тестовых норм а большой группе людей. Если тестовые нормы были вычислены на выборке школьников, то эти нормы нельзя автоматически переносить на студентов.
Кроме статистических тестовых норм, часто используют критериальные нормы, т. е. достиг ли человек критического требуемого уровня развития профессионально важного психологического качества. В критериальных тестах учитывают не степень отклонения баллов от центра шкалы, а достижение или не достижение какого-то критического уровня на шкале.
Следует учитывать и достоверность теста - способность теста защищать информацию от мотивационных (сознательных и бессознательных) искажений и социальной желательности ответов (это достигается через введение в тест проверочной шкалы лжи).
52. Адаптация содержания теста.
1) Перевод материалов методики. Знакомство с теоретическими позициями автора (если нет разногласий с автором, можно работать дальше).
Трудности: стоящая за каждым опросником психометрическая проработка оригинала заставляет считать его неприкосновенным.
Два вида перевода (по Кэмпбелл): а Симметричный такой перевод, в котором сохраняются как смысл, так и привычность, разговорность;
б Асимметричный сохранение верности одному из языков, обычно языку оригинала.
Кэмпбелл отмечает обычное для перевода стандартизированных опросников желание сохранить верность оригиналу, что в результате дает «неуклюжую и экзотическую версию теста».
Но с помощью таких «экзотических» опросников могут быть получены данные скорее о степени понимания испытуемым сложных грамматических конструкций, нежели об особенностях его личности.
!! Таким образом, первый этап представляет собой не только перевод оригинального текста опросника, но и приспособление лексики и граматики этого перевода к возрастной и образовательной структуре населения, для которого эта методика предназначена, учет коннотативного значения языковых единиц и категорий.
Сложности: трудно, а порой и невозможно найти эквиваленты слов в другой культуре.
2) Экспертная оценка перевода (стимульного материала, описания теста) с привлечением лингвистов и профессиональных психологов, владеющих языком оригинала. Проводится во избежание разночтений.
3) Адаптация переведенного материала к культуре страны-пользователя (меняем знания, но смысл задания не меняется).
4) Проверка валидности и надежности проверка основных психометрических характеристик методик.
Оцениваем насколько эти характеристики соответствуют тем, которые приводил автор методики.
5) Разработка тестовых норм.
Проводится обследование достаточно больших выборок и указывается вариативность результатов.
Реадаптация когда происходят изменения в рамках одной культуры (адаптация к «современности»).
II. Кроме адаптации содержания теста, необходима адаптация процедуры испытаний.
III. Оценка результатов тестирования результаты должны быть адаптированы к среде, в которой воспитывается человек (пр: деревня, город), должны быть другие нормы.
53. = 49+50+51+52(это все одна и та же херня, я так поняла)