Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Экспериментальная психология 2013.10.28
Тема лекции:
Планирование эксперимента: рассмотрение всех процедур.
Психологами часто проводятся исследования условий, которые влияют на производительность труда. В одном из них изучалась работа штамповщиц телефонных реле. Исследовались разные параметры ситуации, один из них освещенность в цеху. Какой макет процедуры для проведения эксперимента по выявлению оптимума освещения, при котором производительность труда максимальна? Нужно минимум два уровня освещенности: высокий и низкий. В данном случае их недостаточно, поскольку мы предполагаем нелинейную зависимость. В самом удачном случае можно обойтись тремя уровнями освещенности, но желательно больше.
Уровень освещенности независимая переменная. Производительность труда (количество единиц продукции за единицу времени и ее качество / соотношение собранных правильно и неправильно реле) зависимая переменная. Результат: производительность во время исследований неуклонно росла, несмотря на смену уровня освещенности, который иногда был равен лунному свету.
Данное явление получило название «Хоторнский эффект». Эксперимент проводился с 1924 по 1932 год под руководством Элтоном Мэйо. Исторический контекст: в это время в США происходит Великая Депрессия. На попадание в экспериментальную группу существует конкурс, отбираются всего несколько человек. Ситуация меняет социальные нормы: работницы стараются не поменьше работать, чтоб сэкономить усилия, а наоборот, не ударить в грязь лицом и сделать как можно больше. Также в процессе исследования были случаи, когда работниц убирали из группы за нелояльность к руководству. Вывод помимо уровня освещенности на уровень производительности труда влияло большое количество намного более значимых факторов. Можем ли мы сказать, что в этом эксперименте исследователям удалось проверить гипотезу о влиянии освещенности на производительность? Нет. Гипотеза была выдвинута в отношении одних факторов, но в ходе эксперимента не контролировались другие, которые в итоге не позволили исследователям проверить исходную гипотезу. Проведенный эксперимент не валиден.
Данный эксперимент был опубликован Фрицем Ротлисбергером и Уильямом Диксеном в 1939 году. Мэйо сделал далекоидущие выводы из него и в дальнейшем целенаправленно варьировал социальные факторы возникла психология малых групп.
Тема лекции:
Валидность эксперимента
Валидность обоснованность или достоверность; валидность исследования мера соответствия результатов и методики исследования поставленным задачам.
Виды валидности центральная тема всего курса. Основная цель планирования любого эксперимента соблюсти высокую валидность, чтоб методика эксперимента позволила проверить ту гипотезу, которая сформулирована.
Схема из учебника Дружинина 4 вида валидности. Принципиально важны для понимания 2 из них, про которые будет спрашиваться на экзамене.
У исследователя всегда есть представления о реальности, которые могут оставаться для нее / него имплицитными. Теория объясняет некую реальность, соответственно, когда мы проводим эксперимент, мы хотим с помощью него проверить, насколько теория хорошо описывает реальность, для объяснения которой придумана.
Мы придумываем некую идею эксперимента идеальный эксперимент. «Идеальный эксперимент» обозначает идеализацию, заведомо несуществующую вещь, модель реальности, в которой одни свойства сведены к нулю, но другие закреплены за идеальным объектом, поскольку значимы для нашей теории. Идеальный эксперимент такой мысленный образец эксперимента, в котором на зависимую переменную действует только независимая, а иные переменные отсутствуют. Реальный эксперимент конкретный эксперимент, который проводится в конкретной ситуации (здесь и сейчас) с конкретными людьми. То, насколько идеальный эксперимент соответствует реальному, показывает внутреннюю валидность исследования.
Внутренняя валидность мера соответствия реального эксперимента идеальному, при котором на зависимую переменную действует только независимая, а остальные сведены к нулю. Чем больше побочных переменных тем ниже внутренняя валидность.
Реальность, которую мы варьируем внешняя валидность исследования: мера соответствия эксперимента той реальности, которую моделируют. От внешней валидности зависит, на какие ситуации и популяции людей мы можем распространить полученные результаты.
Дональд Кэмпбелл формулирует понятие «конструктная валидность» (от слова «конструкт»). Два исследователя, которые имеют разные мнения об одной и той же реальности, могут по-разному интерпретировать полученные результаты, поскольку будут пользоваться разными исходными данными. Конструктная валидность показывает, насколько хорошо наша теория подходит для описания или объяснения изучаемой реальности. Хорошо подходит интерпретация верна, плохо подходит интерпретация неверна. Эксперимент может быть с высокой внутренней валидностью и низкой внешней, высокой внутренней и низкой конструктной (эффект достоверен, а слова, которыми его описывают полная чушь). Психологи будущего будут пользоваться нашими эмпирическими данными и совершенно по-иному их объяснять. Наука это переход от одних заблуждений к другим в пути к достижению истины, к которой не приблизиться. Конструктная валидность, как правило, не может быть оценена сразу же после проведения эксперимента. Зачастую это выясняется постфактум много лет спустя. Редки случаи двух конкурирующих теорий, когда конструктная валидность определяется сейчас же.
Операциональная валидность (от слова «операционализация») показывает нам, насколько хорошо подходят наши методики для измерения тех явлений, которые мы собираемся измерить. Если в качестве независимой переменной выступает интеллект и для его измерения используется конкретный тест, то возникает вопрос, насколько хорошо эта теория измеряет интеллект. Все психологические методики валидизируются то есть доказывается, что они измеряют то, что должны измерять, и нечувствительны к другим факторам. Тесты интеллекта не должны быть чувствительны к личностным особенностям (интеллект не связан с тем, смелая ты или робкая). Существующие тесты интеллекта чувствительны к личностным особенностям, а значит, не вполне эффективны, то есть нерелевантные.
На экзамене будет вопрос про внутреннюю и внешнюю валидности. Связаны ли они?
Для того, чтобы повысить внутреннюю валидность, надо попытаться приблизить реальный эксперимент к идеальному, то есть отдалиться от реальности и понизить внешнюю валидность. Желательно придумать компромиссную ситуацию, когда будут одновременно высоки и внутренняя, и внешняя валидности. К повышению какой валидности надо стремиться? Внутренняя валидность безусловно важнее, так как именно от нее зависит, можно ли делать содержательные выводы в исследовании. При низкой внутренней валидности (много неконтролируемых факторов) интерпретировать результаты нельзя.
Факторы, угрожающие валидности (прежде всего внутренней)
Дональд Кэмпбелл (1916-1996) составил перечень угроз валидности. Он проанализировал огромное количество социологических и педагогических экспериментов и пришел к неутешительным выводам: основная масса исследований проводится некачественно, соответственно эксперименты не валидны. Кэмпбелл взял на себя труд проанализировать типичные ошибки, которые совершают исследователи. Нужно быть заранее готовыми к тому, что существуют угрозы валидности, которые надо брать во внимание. К основным угрозам добавляются специфические, характерные для конкретно данной ситуации.
Фактор истории. Любой эксперимент проводится в какой-то конкретный период времени в конкретном месте на фоне конкретных исторических событий. Поскольку исследователь и испытуемые находятся внутри ситуации, практически ни в одном исследовании не упоминается фон, на котором происходили события. Поэтому очень важно, чтобы информация о времени и месте проведения исследования сохранялась.
На исследование влияют именно те события, которые связаны с объектом исследования. Можно смотреть в масштабах Земли, страны, города, личности конкретных испытуемых. Считается, что события личной истории испытуемых содействуют разнонаправлено и уравнивают друг друга. В масштабах города, если все испытуемые являются его жителями, есть риск однонаправленного влияния событий на испытуемых, что ставит под угрозу исследование. (например, местная футбольная команда победила в чемпионате, и все горожане ликуют по этому поводу). Лучше узнавать такие факты заранее и откладывать исследование до более стабильных времен.
Фактор естественного развития. Испытуемые имеют свойство меняться с течением времени (например, взрослеют). Если давать испытуемым на протяжении 4 часов сложные интеллектуальные задачи, то с течением времени люди устанут и их производительность будет падать. В медицине этот фактор давно известен. Фонтанная ремиссия выздоровление больного даже при отсутствии лечения. Для исследователей лекарств фактор фонтанной ремиссии становится побочной переменной.
Эффект тестирования. Предполагается, что в момент измерения стола его длина не меняется. Психологическая реальность же во время исследования часто меняется. Например, были ли у вас политические предпочтения до того, как преподаватель о них спросила? Вопрос о них измерил предпочтения, которые были, или сформулировал их? Фехнер использовал три метода для измерения порогов и, используя разные методы, он получал разные величины порогов, что доказывает, что выбор метода влияет на результат. Решение задач на интеллект может измерить не изменение интеллекта, а привыкание испытуемых к конкретным видам заданий при их многократном повторении. Также предварительное тестирование может повлиять на чувствительность испытуемых к следующему воздействию. Вопрос о политике способен подтолкнуть к вечернему просмотру новостей про политику, пробудив интерес к данной теме.
Инструментальная погрешность. Любой измерительный инструмент имеет свою погрешность. Погрешность психологических методик есть, но измерить ее сложно. Соответственно, разность результатов может быть результатом погрешности.
Фактор селекции. Неэквивалентность испытуемых, которых мы подобрали для исследования, вследствие чего может возникать систематическая ошибка в результатах. Например, при исследовании влияния освещенности на производительность труда опытные и неопытные работницы должны попадать в экспериментальные группы в равных пропорциях, иначе разница в производительности труда групп будет обусловлена фактором опыта, а не только исследуемым фактором освещенности. В данной ситуации побочной переменной может выступать также уровень зрения.
Пример действия фактора селекции. Исследователи задались целью изучить, где лучше рожать: в роддоме или дома. Исследователи не могут принуждать испытуемых к выбору одного из вариантов. Анализируется длительность родов (чем короче тем лучше). Женщины, выбравшие роддом, рожали в среднем дольше на 2 часа. Нельзя сделать вывод о преимуществе домашних родов, поскольку исследование колоссально невалидно: имел место фактор селекции. Выбор больничных или домашних родов зависит от многих факторов, испытуемые отличались по исходным данным и мотивации. Первый фактор реальное здоровье: если беременность протекала с осложнениями, человек с большей вероятностью поедет в роддом. Второй фактор какой по очереди ребенок (ввиду физиологических причин вторые роды протекают быстрее, чем первые; второродящие более уверенны в домашних условиях). Подобные дополнительные переменные тотально возникают в исследованиях. Поэтому первый вопрос, который надо задать каким образом подбирались испытуемые.
Отсев. Можно подобрать эквивалентные группы, но не все испытуемые доживают до конца исследования. Кто-то покидает исследование по ходу, чем дольше процедура тем больше покинувших. Отсев должен тревожить в тех ситуациях, когда он неравномерный именно такой очень опасен для валидности (например, в одной группе отсеялось 10%, во второй 50% испытуемых).
Пример. Проводится исследование сравнение, кто из двух преподавателей лучше читает лекции. В один понедельник читает лекцию преподаватель №1, в другой понедельник преподаватель №2, после анкета. Предположим, получены некоторые оценки, которые потом будут сравниваться. Первый случай 4,5 средний балл, второй случай 4,5 средний балл. Значит ли это, что два лектора одинаково интересно читают лекции, если в первом случае до конца лекции досидело 80% испытуемых, во втором 40%? Испытуемые ушли, поскольку им было неинтересно, но из-за своего преждевременного ухода они не оставили отрицательных анкет, что устраняет их влияние на результаты эксперимента.
Отсев может происходить на этапе сбора данных и анализа результатов. Часто не учитывается и не упоминается отсев на самых ранних стадиях исследования, когда людям только предлагается поучаствовать в нем. Если с такой ситуацией исследователь сталкивается постоянно (10 человек из 50 согласилось участвовать), это значит, что что-то в экспериментальной процедуре пугает людей, и это может быть не связано с предметом изучения.
Пример. Исследование «образ будущего ребенка», для которого нужны именно беременные женщины. Конечное задание нарисовать образ будущего ребенка. Испытуемая отказалась, сославшись на занятость, тогда как истинной ее причиной было проявление суеверия. Отказ от участия в исследовании может содержать важную информацию: например, в данном случае присутствие ореола тайны в образе будущего ребенка для испытуемых.
Фактор статистической регрессии. Фактор влияет на результаты только в тех исследованиях, где выборка испытуемых набирается по крайним показателях в группе. Например, исследование детей-дошкольников с задержкой психического развития (не диагноз, а педагогическая запущенность). Для начала нужно придти в обыкновенный детский сад и найти этих детей по тестированию. После тестирования с детьми проводятся развивающие занятия, их результаты улучшаются. Но в выборку могли попасть не только дети с задержкой развития, но и те, которые показали в день тестирования свой худший результат из-за дополнительных факторов голод, сонливость, боязнь, неприязнь к исследователю и так далее. Что произойдет при повторном тестировании? Даже при отсутствии развивающих программ дети с высокой вероятностью покажут результат выше. Вся подгруппа сместится к среднему показателю (статистическая регрессия к среднему), поскольку статистически детей со средними результатами больше, чем с низкими. В обратном случае (одаренные дети) результаты могут ухудшиться из-за той же статистической регрессии к среднему.
Реактивный эффект («Хоторнский эффект») реакция испытуемых на саму процедуру исследования.
Взаимная интерференция экспериментальных воздействий похоже на эффект тестирования между несколькими экспериментальными воздействиями.
nn Horban