Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Мангейм Дж. Б., Рич Р. К. Политология. Методы исследования: Пер. с англ. / Предисл. А.К. Соколова. М.: Издательство “Весь Мир”, 1997. 544 с.
Полная версия
Американские профессора Дж. Б. Мангейм и Р. К. Рич на протяжении многих лет читали студентам и аспирантам курс лекций о методах исследования в политологии. В результате появилась на свет эта книга, выдержавшая на Западе четыре издания и ныне ставшая доступной российскому читателю. Для преподавателей, учащихся, всех, кто хочет овладеть исследовательскими приемами в политологии от постановки задачи до интерпретации результатов, учебник Мангейма и Рича станет настольной книгой, важным подспорьем в учебе и работе.
* * *
“Мангейм и Рич написали замечательную книгу... Авторам удалось просто и доступно изложить сложные вопросы исследовательского процесса, уделив больше внимания изучению методов не столько социальных, сколько политических реалий”.
Daniel E. Ponder,
University of Colorado,
Colorado Springs
СОДЕРЖАНИЕ
Предисловие
Введение
1. Процесс исследования
Формулирование теории
Операционализация теории
Выбор адекватных методов исследования
Наблюдение за поведением
Анализ данных
Интерпретация результатов
Подготовка к исследованию
2. Создание теории: понятия и гипотезы в политологии
Что такое теория?
Логика построения теории
Компоненты теории
Проверка и совершенствование теории
Роль гипотез
Формулирование гипотез
Заключение
3. От абстрактного к конкретному: операционализация и измерение
Операционализация: связь между теорией и наблюдением
Операционные определения
Измерение. Уровни измерения
Рабочая гипотеза
Ошибка измерения
Валидность
Надежность
Заключение
4. Работа по плану: как составить программу исследования
Цель и программа исследования
Учет в программе исследования альтернативных конкурирующих гипотез
Экспериментальные программы исследования
Формирование групп
Полевые эксперименты и неэкспериментальные программы
Квазиэкспериментальные программы
Выбор программы исследования
Факторы, угрожающие валидности
5. Кто, что, где, когда: проблема выборки
Репрезентативная выборка
Процедуры формировании репрезентативной выборки
Установление необходимого объема выборки
Заключение
Методы сбора данных
6. Опрос
Этапы проведения опроса
Концептуализация
Схематизация опроса
Подготовка инструментария
Планирование опроса и построение выборки
Проблемы, связанные с финансированием опроса
Обучение и инструкция персонала
Предварительное тестирование
Проведение опроса
Наблюдение за ходом опроса (мониторинг)
Контрольная проверка
Вторичный анализ данных опроса
7. Интервьюирование
Выборочное интервьюирование
Формулирование вопросов
Отбор интервьюеров
Направленное интервьюирование
Методика направленного интервьюирования
Специализированное интервьюирование
8. Шкалирование
Построение шкалы: две основные проблемы
Шкалирование по Лайкерту
Шкалирование по Гуттману
Шкалирование по Тёрстоуну
Метод семантического дифференциала
9. Контент-анализ
Подготовка к контент-анализу
Проведение содержательного контент-анализа
Проведение структурного контент-анализа
Некоторые проблемы, возникающие в ходе контент-анализа
10. Источники и применение сводных данных
Типы сводных данных
Проблемы, связанные с использованием сводных данных
Источники сводных данных
Сбор сводных данных
Заключение
11. Поверх границ: практика сравнительных исследований
Выявление “кочующих вопросов”
Поиск эквивалентной меры
Отбор стран для изучения
Отбор независимых наблюдений
Отбор материала
Заключение
Обработка данных
12. Подготовка и обработка данных
Кодирование: что все эти цифры значат?
Книга кодов и кодировальный бланк
Как обработать данные
13. Описание данных: построение таблиц, диаграмм, гистограмм
Перечневая таблица
Линейная диаграмма
Секторная диаграмма и гистограмма
Двусторонняя гистограмма
Таблица взаимной сопряженности признаков
Некоторые предостережения
14. Статистика I: анализ одномерных распределений
Измерение средней тенденции и дисперсии
Измерения для номинальных переменных
Измерения для порядковых переменных
Измерения для интервальных переменных
Заключение
15. Статистика II: изучение взаимосвязей между двумя переменными
Измерение связи и статистической значимости
Измерение связи и значимости для номинальных переменных
Измерение связи и значимости для порядковых переменных
Измерение связи и значимости для интервальных переменных
Заключение
16. Статистика III: изучение взаимосвязей между несколькими переменными
Анализ таблиц
Множественная регрессия
Интерпретация результатов множественной регрессии
Решение общих проблем множественной регрессии
Пат-анализ
Анализ временных рядов
Заключение
17. Математическое моделирование
Процесс моделирования
Зачем нужны модели?
Примеры математических моделей политического поведения
Другие типы моделей
Сложности, связанные с моделированием
Заключение
18. Некоторые обобщения
Разработка гипотезы, измерения и программа исследования
Сбор и анализ данных
Контрольный бланк для оценки исследований
Заключение
Приложение А. Статистические таблицы
Приложение В. Этические проблемы в эмпирических исследованиях
Словарь терминов
ПРЕДИСЛОВИЕ
Предисловие в каком-то смысле самый трудный этап работы над книгой. Пишут его обычно в последнюю очередь, когда авторы уже не могут спокойно видеть свою рукопись и мечтают как можно скорее ее завершить. В предисловии, чтобы от него была какая-то польза, авторы должны обозначить главную цель книги, мотивы, лежащие в ее основе, базовые понятия и идеи. Однако к тому моменту, когда перед авторами встают эти задачи, они, как часто бывает, настолько погружены в детали работы, что грандиозная конструкция, много месяцев назад поразившая воображение издателя, или оказывается забытой вовсе, или отходит на второй план. Что касается нас, то мы старались не отступать от основных принципов книги; более того, на протяжении нескольких лет мы постоянно думали о них. После такого испытания на прочность мы уверены, что наш подход к теме заслуживает внимания.
Итак, главная составная часть любого предисловия провозгласить цель книги. Она проистекает из опыта преподавания методов исследования студентам и аспирантам, которые либо по собственному выбору, либо по распоряжению администрации оказались слушателями наших курсов, подробно раскрывающих сущность и задачи исследовательского процесса. Одновременно на протяжении многих лет мы хотели найти такой текст, который читался бы легко, но не был шаблонным, был бы основательным, но не перегруженным излишними деталями, доступным и в то же время практически применимым, лишенным педантизма. Мы искали повсюду, перерыли все книжные полки, можно сказать, перевернули небо и землю, но так и не нашли текста, отвечающего этим требованиям. Все это привело нас к выводу о том, что существует только один выход написать новую книгу.
В результате наших усилий появился труд, в котором, мы надеемся, нам удалось примирить противоречивые требования, предъявляемые к авторам вводного курса. Мы [c.16] считаем, что наша книга четко и последовательно отражает основные этапы процесса исследования от постановки задачи до интерпретации результатов.
Следует добавить, что книга известным образом адаптирована. Мы не пытаемся говорить со студентами свысока, а пишем в расчете на них. Мы стремимся предвосхитить вопросы, возникающие у студентов, и дать на них ответ. Мы вводим термины, усвоение которых необходимо, но при этом избегаем профессионализмов. Термины в тексте при первом упоминании выделяются жирным шрифтом; их значение расшифровывается в словаре в конце книги. По нашему мнению, для понимания основных аспектов процесса исследования вовсе не обязательно знать их все. Иногда мы вдаемся в подробности, но при этом стараемся не упустить из виду прежде всего содержание и сущность процесса исследования.
Наконец, что, может быть, самое важное, в книге дан широкий спектр методов и возможностей их применения для политологического исследования: от выборки до моделирования, от трудностей сравнительного исследования до показа его достоинств. И хотя мы не добиваемся той глубины проникновения в суть той или иной проблемы, которой можно достичь при специальном исследовании, мы тем не менее обеспечиваем понимание принципов действия методов и их возможного применения в степени, достаточной, чтобы удовлетворить начинающего исследователя. Мы надеемся, что читатель этой книги узнает и поймет многое из того, что имеет отношение к процессу исследования (не в последнюю очередь сюда входит и уяснение того, сколь много ему еще предстоит узнать); мы надеемся также, что преподавателям для чтения методического курса не потребуется никаких иных пособий, кроме данной книги.
Несмотря на все перечисленные свойства, книга, конечно, не сможет угодить всем. В такого рода работах всегда встает проблема отбора: что именно следует включить в нее и в каком виде, а любой отбор таит в себе потенциальный источник несогласия. Мы искренне ценим помощь тех анонимных рецензентов, которые помогали в решении нашей задачи и раньше, и при подготовке настоящего, второго, издания нашей книги, вне зависимости от того, соглашались они или нет с нашим отбором (подтверждая [c.17] тем самым мудрость нашего издателя, выбравшего их в качестве рецензентов). В ряде случаев они демонстрировали свои предпочтения и тем самым помогали улучшить окончательный вариант, в других делали это весьма неубедительно и укрепляли нас в правильности занятой нами позиции. Без их участия процесс создания книги мог быть проще, зато результаты оказались бы менее удовлетворительными.
Мы хотим поблагодарить за полезные комментарии принимавших участие в подготовке этого четвертого издания рецензентов:
Terri Susan Fine, University of Central Florida
Raymond E. Owen, University of Pittsburgh
Daniel E. Ponder, University of Colorado
Sharon D. Wright, University of Louisville
Adrian Clark, James Madison University
Philip R. Baumann, Moorhead State University
Kay Knickrehm, James Madison University
Aman Khan, Texas Tech University
Mark Wattier, Murray State University
Jasper M. LiCaIzi, dr., Temple University
Jack Corbett, Lewis & Clark College
Мы также благодарны литературному распорядителю покойного сэра Рональда А. Фишера (Федеральная резервная система), доктору Фрэнку Йэтесу (ФРС) и компании “Лонгмен лтд.”, Лондон, за разрешение перепечатать таблицы IV и VII из их книги “Статистические таблицы для биологических, сельскохозяйственных и медицинских исследований” (6-е издание, 1974).
И наконец, мы хотим выразить признательность нашим семьям, которые, как и прежде, мирились с нашим поведением, которое становилось, несомненно, нестерпимым, по мере того, как мы все больше убеждались в том, что подписание контракта на публикацию и сдача законченной работы это совсем не одно и то же.
Но вот, со всевозможной помощью со всех сторон, мы держим в руках искомую книгу. Мы несем ответственность за ее слабые и сильные стороны. Нам кажется, что это потрясающая книга, и мы надеемся, что вы с нами согласитесь.
Джарол Б. Мангейм,
Ричард К. Рич [c.18]
Никому не дано исключительного права на истину...
Даны только факты, и ничего более.
Э. Говард Хант
ВВЕДЕНИЕ
1. ПРОЦЕСС ИССЛЕДОВАНИЯ
Любопытство и необходимость вот важнейшие мотивы, лежащие в основе человеческого познания. Мы пытаемся понять мир вокруг нас и ради знания и самозащиты, и ради облегчения своей судьбы. В любом случае мы получаем хотя бы потенциально способ исправить существующий порядок вещей. Иными словами, чем больше мы узнаем об окружающем нас мире, тем больше возможностей для управления им мы получаем. В отношении политики это так же справедливо, как и в других областях. Чтобы иметь ключ к ее пониманию и изменению, надо всего лишь больше знать о ней.
Однако эта простая мысль о необходимости знания ставит два совсем не простых вопроса. Как мы получаем знание? Как следует использовать то, что мы знаем? Первый вопрос это вопрос о методе, второй об этике и предпочтении. В первом случае нас интересует приобретение и организация знания; во втором мы имеем дело с неразрывно связанными с этим процессом моральными обязательствами. И в том и другом случае необходимы оценки, основанные на нашем опыте и требующие разных интеллектуальных усилий.
Для решения вопроса о том, как мы получаем знание, следует сформулировать жесткие правила определения политической реальности. Например, мы могли бы определить политическую реальность как результат нашего восприятия исследования политической системы, что представляется достаточно простым. Однако что такое политическая система? О какого рода исследованиях мы говорим? Учли ли мы все возможные политические события или наше определение является неоправданно ограниченным? От чего зависит политическая реальность: от наблюдателя, как следует из нашего определения, или от самой системы? С помощью такого определения разные наблюдатели, имеющие разный опыт и разные точки зрения, [c.19] не только будут иметь разное представление о политической реальности, но и получат его разными способами. В результате может возникнуть совокупность знаний, носящих в высшей степени индивидуальный характер, при отсутствии какого бы то ни было механизма передачи этих знаний другим людям. Таким образом, проблема определения того, как мы получаем знание, это проблема достижения общепринятого способа описания действительности на общепринятом языке исследования, так чтобы каждый, изучивший правила или “владеющий языком”, мог бы на основе единого понимания общаться со всеми теми, кто обучен тому же самому. По крайней мере теоретически, если бы мы все смогли прийти к единому мнению о том, как мы получаем знания, мы в конце концов смогли бы договорить и по гораздо более сложному вопросу о том, что мы знаем.
Принятие решения о том, как следует использовать то, что мы знаем, процесс совсем иного рода. Здесь уже нет необходимости в общепринятом или едином для всех выборе, хотя мы все же нуждаемся в общем языке, дающем возможность общения и обсуждения. В конце концов, решение о лучшем или наиболее желательном приложении знаний носит субъективный, индивидуальный характер. У каждого из нас есть свои желания и потребности, которые могли бы заставить нас оценить некий результат более высоко, чем другой, и нет никакой необходимости (хотя, возможно, это было бы желательно), чтобы мы пришли к какой-то общей оценке. Если снизить налоги, люди среднего достатка стали бы жить лучше, однако расходы на социальное обеспечение, предназначенные в первую очередь для бедных, пожилых и больных, были бы сокращены. Следует ли снижать налоги? Совершенно очевидно, что ответ на этот вопрос зависит не от того, что мы знаем, а от того, как знания связаны с нашей социальной позицией и системой ценностей. Идеология и политическая система предоставляют средства для структурирования и сведения в единое целое предпочтений, сделанных отдельными людьми, однако само решение каждый человек выносит, не обращаясь к какой-либо общей точке зрения.
Для разграничения этих двух сфер политологи используют специальные понятия. В первом случае, когда речь идет о том, как мы получаем знания и что мы знаем, употребляется [c.20] термин “эмпирический анализ”. Во втором случае, когда речь идет о том, как следует использовать наши знания, употребляется термин “нормативный анализ”. Эмпирический анализ это разработка и использование общего для всех, объективного языка для описания политической реальности. Язык может быть количественным, основанным на статистическом сравнении характеристик различных объектов или случаев; или может быть качественным, основанным на понимании тех же самых объектов или случаев исследователем, владеющим информацией1. Нормативный анализ это разработка и изучение субъективных целей, ценностей и этических норм, которыми мы руководствуемся при использовании наших знаний о реальности.
Возможно, разницу между этими двумя понятиями лучше всего иллюстрируют герои оригинального телевизионного сериала “Star Trek”. Мистер Спок, робот-офицер, олицетворял эмпирический менталитет. Спок интересовался лишь тем, что может быть научно изучено или сформулировано, и ни в малейшей степени его не занимало то, что иррационально чувствовали или предпочитали его товарищи, люди. Он отмечал и измерял реальность, но он не имел мнения о ней, не анализировал ее. Доктор Маккой, напротив, являл собой нормативный менталитет. Хотя и воспитанный на научных методах, он неизменно руководствовался более предпочтениями и неким чувством правильности, нежели логикой и ощущением того, что что-то будет действовать и работать. И наконец, Джеймс Керк, капитан звездного корабля, был образцом синтеза альтернатив эмпирического и нормативного мышления. Он пользовался знаниями и талантом делать обоснования Спока, но регулировал его трезвую рассудительность моральным чувством Маккоя. Не будучи приверженцем ни одной из этих полярных точек, он черпал из обеих традиций, а результатом был неизменный успех.
В таком синтезе капитана Керка есть урок и для нас, поскольку нормативный анализ без эмпирической основы может привести к ценным выводам, которые не соприкасаются с реальностью. А эмпирический анализ при отсутствии способности к нормативным заключениям, с другой стороны, может привести к созданию фактической структуры в вакууме. Она будет представлять собой [c.21] коллекцию наблюдений, значение которых мы не в состоянии понять до конца. Возвращаясь к нашему предмету, можно сделать вывод, что политологический запрос есть использование равно обоих типов анализа эмпирического и нормативного путем максимального привлечения не только знаний, но и понимания политической реальности. Таким образом, несмотря на то, что акцент в этой книге делается на политический анализ, нашей целью является, в дополнение к освоению разнообразных гибких аспектов эмпирической техники, развитие понимания более широкой а именно нормативной перспективы, внутри которой наши знания будут интерпретироваться.
В этом контексте мы можем рассматривать научное исследование как (1) создание философии языка запроса и как (2) собственно накопление знаний. Уточним не просто знаний, но таких, которые наиболее эффективно послужат нам для множества различных целей и случаев. Ведь люди могут получать знание из собственного опыта, но не у всех опыт одинаков. Люди могут накапливать информацию, просто глядя на мир открытыми глазами, но нет уверенности, что путем такого бессистемного наблюдения они заметят все или хотя бы наиболее значимые относящиеся к делу события. Некоторые люди могут “узнавать” вещи посредством галлюцинаций, видений или слушая “голоса”, а другие могут рассматривать полученные знания как достоверные, но не все могут овладеть такими фантастическими и непрактичными методами. Каждый из вышеперечисленных способов познавания чего-либо так или иначе используется, но ни один из них не позволяет полностью совместить и непосредственно факты и заключения, и знание того, какими методами эти факты или выводы были получены. Каждый метод позволяет сообщать информацию, но ни один из них не может помочь достигнуть исчерпывающего, полноценного понимания. И только научное исследование позволяет осуществить все это, и даже больше. Под научным исследованием мы понимаем запрос, руководствующийся научными методами. Причина такой действенности в том, что оно не только позволяет познавать реальность и оценивать способы, которыми мы добыли это знание, но - в силу того, что эти способы широко осознаются теми, кто ими [c.22] владеет, оно также дает нам возможность усовершенствовать наши методы запроса. Научное исследование это самокорректирующийся, постоянно развивающийся способ познавания.
Объясняется это тем, что научное исследование обладает свойствами эксплицитности, системности и контролируемости. Эксплицитность научного исследования состоит в том, что все правила для описания и изучения реальности сформулированы в явном виде. Ничто не утаивается, ничто не принимается на веру. Системность заключается в том, что каждый зафиксированный факт связан причинной связью или наблюдается вместе с другими фактами. Не признаются никакие объяснения, пригодные лишь на данный случай, не допускается никаких отступлений от метода. Контролируемость выявляется в том, что анализируемые явления по возможности рассматриваются со всей строгостью, допустимой в данной ситуации. Обобщения делаются только после самой доскональной и тщательной оценки под девизом осторожности, что в более широком смысле означает постоянное внимание к деталям. И все же, несмотря на все свои ограничения, или, вернее, именно благодаря им, научное исследование открывает тому, кто идет этим путем, совершенно новый уровень познания реальности. Именно поэтому научный метод и применяется для изучения политики.
Как дисциплина политология еще не стала “научной”. Самые первые политологи получали не столько философское, сколько социологическое образование. (Правда, последнее тогда не существовало как таковое). Большинство ранних работ эмпирического толка носили характер интерпретации и были относительно мало структурированы, и даже сегодня существует разница во мнениях относительно того, чего современный практик может или должен достигнуть. Тем не менее, начавшись в 40-х годах и набирая темп с конца 50-х, применение научного подхода к описанию и пониманию политических феноменов стало занимать главенствующие позиции, по крайней мере в Соединенных Штатах. И по мере этого все больше и больше политологов убеждалось, что такой подход дает важную возможность проникновения в суть поведения отдельных личностей, политических организаций и правительств. [c.23]
Данные рассуждения позволяют определить научное исследование как “систематическое, контролируемое, эмпирическое и критическое исследование гипотетических утверждений о предполагаемых отношениях между [различными] явлениями”2. Эту фразу не очень-то легко выговорить, однако она довольно точно передает основные положения, которые мы обсуждаем. Научное исследование, в данном случае специальное научное исследование, это метод проверки теорий и гипотез путем применения определенных правил анализа к данным, полученным в результате наблюдений и интерпретации этих наблюдений в строго заданных условиях. Именно эти правила и ограничения мы должны изучить, если перед нами стоит задача приобретения знаний в области политологии.
Вероятно, лучше всего начать изучение этих правил и ограничений, обратившись с вопросом к самому себе. Как осуществляется исследование политики? В соответствии с постановкой вопроса такое исследование лучше считать не множеством наблюдений или теорий, а процессом сбора и интерпретации информации. Этот процесс состоит из шести самостоятельных, но вместе с тем тесно связанных друг с другом этапов: (1) формулирование теории, (2) операционализация теории, (3) выбор адекватных методов исследования, (4) наблюдение за поведением, (5) анализ данных и (6) интерпретация результатов. В соответствии с этими шестью этапами построена большая часть настоящей книги, и поэтому рассмотрим их более подробно. [c.24]
ФОРМУЛИРОВАНИЕ ТЕОРИИ
Первым шагом политологического исследования является выбор проблемы исследования, и сразу становится совершенно очевидной важность объединения нормативного и эмпирического подходов. Каковы те критерии, в соответствии с которыми одна исследовательская проблема считается более интересной, чем другая? И хотя в голову приходит множество таких критериев, начиная отличных интересов исследователя и кончая интересами общества в целом, большинство критериев все же разбивается на два основных типа. Проблема заслуживает изучения либо потому, что она отвечает некоторой конкретной потребности, т. е. ее решение послужит лучшему теоретическому познанию явления, либо потому, что она отвечает [c.24] определенной социальной потребности, т. е. ее решение может помочь нам справиться с тем или иным вопросом, встающим перед обществом.
Хотя эти два типа проблем, часто называемых фундаментальными и прикладными исследованиями, не являются взаимоисключающими (если вы занимаетесь одной проблемой, это не означает, что вы ни в коем случае не можете одновременно заниматься и другой), тем не менее они часто находятся в состоянии конкуренции. Можно, например, исследовать гипотетические факторы, вызывающие агрессию в условиях стресса, в целях разработки сложной прогностической модели человеческого поведения, а можно вместо этого сосредоточиться на причинах возникновения взрывов и способах их предотвращения. Можно детально изучать процессы принятия решений государственными деятелями с целью понимания феномена лидерства, а можно вместо этого сосредоточить внимание на выявлении решений, способных привести к войне, и на возможностях их избежать. Поскольку для изучения всех потенциально интересных или важных исследовательских проблем имеется слишком мало научных ресурсов (финансов, времени и квалифицированных специалистов), нередко возникает конфликт между необходимостью осуществить фундаментальное исследование (практические результаты, сколь бы ни были значительными, почти всегда ощущаются лишь косвенно и в отдаленном будущем) и необходимостью использовать наши научные знания в настоящий момент непосредственно на благо общества, даже если при этом будет задержано или вовсе остановлено развитие науки. Выбор должен сделать конкретный исследователь в соответствии с его (или ее) собственной системой ценностей.
Определив характер проблем, с которыми мы хотим иметь дело, и характер результатов, которых мы хотим достичь, мы должны затем более конкретно сформулировать задачу исследования. Такое решение диктуется рядом соображений. Прежде всего, необходимо выделить тот аспект проблемы, который нас более всего интересует. После того, как радостное возбуждение, сопровождающее начало поисков, несколько угаснет, и до момента, когда впереди начинают маячить ответы на поставленные вопросы, ежедневная рутинная работа может оказаться довольно [c.25] скучной. В такие периоды собственно интерес к проблеме становится важным мотивом исследования, так сказать, интеллектуальной закуской, поддерживающей наши силы до подачи на стол основного блюда. Поскольку решение любой исследовательской проблемы требует изнурительной работы, одна из величайших ошибок, которую мы можем совершить, это выбрать задачу, вызывающую у нас мало интереса.
После того как определена интересующая нас тема исследования, необходимо тщательно проанализировать различные элементы, или компоненты, этой темы и выявить те из них, которые могут иметь значение для нашего исследования. Для установления основных факторов поведения необходимо использовать наше умение наблюдать и делать выводы, а также, в особенности, проведенные ранее исследования по сходной тематике, как наши собственные, так и выполненные другими исследователями. Попробуем пояснить сказанное на примере.
Представим себе расположенный в центре пустыни городок под названием Малая Америка. В нем нет ничего, кроме станций обслуживания и ресторанов, протянувшихся на несколько миль от въезда в город до самого горизонта. Единственное, что можно сделать в Малой Америке, это поесть и заправить машину.
Теперь предположим, что мы захотели исследовать поведение жителей Малой Америки на президентских выборах, чтобы уметь объяснить, почему одни голосуют за кандидата демократов, другие за кандидата республиканцев. В этом упрощенном примере объекты нашего анализа (жители Малой Америки) отличаются друг от друга (помимо способа голосования) по двум параметрам: каждый из них является либо владельцем предприятия, либо рабочим и связан либо со станцией обслуживания, либо с рестораном. Каждый из этих факторов (политологи называют их переменными) представляет собой характеристику отдельного человека. Один житель Малой Америки может быть (1) служащим (2) ресторана, который (3) голосует за демократов, тогда как другой (1) владельцем (2) станции обслуживания, который (3) голосует за республиканцев. Поскольку мы хотим объяснить различия в голосовании, опираясь на различия между избирателями, мы должны сосредоточить свое внимание на всех тех [c.26] факторах, которые могли бы иметь отношение к их выбору. В данном случае в нашем распоряжении имеется только два таких фактора: статус служащего или владельца и отношение к станции обслуживания или к ресторану. Будем называть их соответственно: социально-экономическим статусом (СЭС) (при этом статус владельца выше статуса служащего) и родом занятий. Есть ли какие-либо основания считать, что, зная обе характеристики конкретного избирателя, мы сможем предсказать, кому он (или она) отдаст предпочтение при голосовании?
Чтобы ответить на этот вопрос, необходимо сделать две вещи. Во-первых, необходимо поразмышлять. Следует спросить себя: существуют ли какие-нибудь логические допущения ожидать, что один из этих факторов окажет влияние на голосование? Во-вторых, следует обратиться к литературе по политологии и посмотреть, есть ли в проводившихся ранее исследованиях по данной или смежным проблемам какие-либо эмпирические данные, указывающие, как тот или иной фактор влияет на поведение избирателей. В действительности в данном случае почти нет оснований считать, что на голосовании сколько-нибудь заметно скажется род занятий. Конечно, между теми, кто имеет отношение к станциям обслуживания, и теми, кто имеет отношение к ресторанам, вполне могут существовать различия, однако не похоже, чтобы эти различия имели большое влияние на результат президентских выборов. Не много найдется кандидатов в президенты, которые бы предлагали программу, направленную в защиту станций обслуживания и против ресторанов (или наоборот), так что не похоже, чтобы при прочих равных эта переменная как-то способствовала объяснению поведения на выборах. Совсем иначе обстоит дело со второй переменной социально-экономическим статусом. Поскольку принято считать, что демократическая партия является партией трудящихся, а республиканская партией деловых кругов, и поскольку избиратели с более высоким СЭС скорее будут голосовать за республиканцев, чем избиратели с более низким СЭС, вполне допустимо, что служащие скорее будут голосовать за кандидата демократов, а владельцы предприятий за кандидата республиканцев. И действительно, имеющиеся исследования изобилуют примерами, демонстрирующими именно такое [c.27] соотношение. Таким образом, и теоретические рассуждения, и эмпирические факты говорят об одном и том же. Отсюда проблема нашего исследования может быть сформулирована следующим образом: оказывает ли СЭС избирателя жителя Малой Америки воздействие на то, за кого данный избиратель голосует на президентских выборах?
Конечно, в реальном мире люди отличаются друг от друга столь значительно, что это не может быть описано двумя-тремя признаками, однако проблема, возникающая при постановке задачи исследования, в принципе та же самая. Поскольку мы не имеем возможности измерить все мыслимые переменные, мы должны обдуманно и обоснованно выбрать из многих тысяч характеристик людей (или организаций) те немногие характеристики, которые, как представляется, помогут объяснить интересующие нас аспекты поведения. С помощью логических рассуждений и имеющихся в литературе данных мы должны попытаться предусмотреть и выявить те факторы, которые предположительно связаны с этим поведением. Поступая таким образом, мы не предрешаем результаты исследования, как это может показаться на первый взгляд, а, скорее, вырабатываем более продуктивный подход к проблеме, позволяющий определить пути, способные привести к успешному объяснению. Такой процесс доработки исследовательской проблемы через осуществление обоснованного выбора и носит название формулирования теории. [c.28]
ОПЕРАЦИОНАЛИЗАЦИЯ ТЕОРИИ
Получив в распоряжение одну или несколько исследовательских проблем и теорию, которой следует руководствоваться в процессе поиска ответов, мы должны перейти к следующему этапу этапу операционализации. Под операционализацией понимается преобразование, или переформулировка, наших относительно абстрактных теоретических понятий в конкретные термины, которые позволят нам действительно измерить то, что мы хотим. Операционализация предполагает переход от концептуального уровня (обдумывания проблемы) к операциональному (разработке путей ее решения). Человек при этом учится думать в практических терминах. [c.28]
Возвращаясь к нашему примеру, предположим, что у нас имеется гипотеза (т. е. сформулирован ожидаемый ответ на вопрос, поставленный в исследовании), что на предстоящих президентских выборах жители Малой Америки, имеющие более высокий СЭС (владельцы предприятий), с большей вероятностью будут голосовать за кандидата республиканской партии, чем жители с более низким СЭС (служащие). Это согласуется с результатами бесчисленных исследований по проблеме голосования, и, кроме того, такое предположение представляется вполне обоснованным и для данного случая. Однако как выяснить это наверняка? Нельзя же просто подойти к жителю города и сказать: “Добрый вечер! Какой у вас социально-экономический статус: более высокий или менее высокий?” Начать с того, что человек, которого мы интервьюируем, возможно, просто не поймет, о чем идет речь, поскольку социально-экономический статус очень специальный термин, имеющий множество оттенков значения. И во-вторых, даже если мы получим ответ, мы, возможно, не сможем его интерпретировать. Предположим, что респондент ответил: “У меня более высокий социально-экономический статус”. Более высокий, чем у кого? Насколько высокий? Каким образом этот человек определяет социально-экономический статус? Имеют ли респондент и исследователь в виду одно и то же? Рассуждая об абстрактном понятии, мы должны найти способ более эксплицитно определить, как мы его понимаем; затем мы должны максимально однозначно выразить свое определение в виде вопроса или измерения.
Трудность при этом заключается в том, чтобы осуществить разумный и вместе с тем случайный выбор среди многочисленных оттенков значения. Что мы имеем в виду, используя переменную СЭС: уровень дохода респондентов, их род занятий или, быть может, даже их субъективные представления о том, к какому социальному классу они принадлежат? Любая из этих характеристик могла бы быть компонентом СЭС, однако у каждой из них свое особое значение, и измеряться они должны по-разному:
каким был суммарный доход Вашей семьи в прошлом году? Чем Вы занимаетесь? К какому классу Вы бы себя отнесли: к классу рядовых работников, к среднему классу или к высшему классу? [c.29]
Иными словами, сформулировав некую гипотезу или проблему исследования, мы должны очень внимательно изучить, что же имеется в виду под каждой используемой нами формулировкой, и попытаться более точно определить и перевести ее на язык измеряемых показателей. В сущности, мы пытаемся найти наименьший общий знаменатель для некоторого значения. (Например, хотя не все придадут одно и то же значение термину социально-экономический статус, почти все одинаково воспримут его через годовой доход в долларах.) В ходе этого процесса сужаются используемые нами понятия и исчезают оттенки значения, однако именно поэтому наши рассуждения становятся более точными и существенно возрастают возможности изложить полученные результаты ясно и недвусмысленно. Такой процесс перевода и упрощения, который мы называем операционализацией, единственно верный способ провести осмысленное исследование. [c.30]
ВЫБОР АДЕКВАТНЫХ МЕТОДОВ ИССЛЕДОВАНИЯ
Решив, что мы хотим измерять, мы должны решить, как это делать. Нужно разработать стратегию исследования, план наступления. Основную роль здесь играют два соображения. Во-первых, следует выбрать метод или сочетание методов, которые позволили бы задать те конкретные вопросы (измерить конкретные переменные), которые нас интересуют, и сделать это необходимо в соответствии с процедурой операционализации. Нельзя, например, исследовать позиции отдельных избирателей, анализируя содержание газетных сообщений в данном избирательном округе, поскольку содержание газет может выражать взгляды редактора или тех немногих читателей, чьи письма к редактору были опубликованы, не обязательно отражая при этом взгляды большинства избирателей. Кроме того, анализ содержания новостей или редакционных статей не позволяет провести разграничение между разными типами избирателей, например избирателями с более высоким и более низким СЭС. Таким образом, контент-анализ не дал бы нам возможности решить интересующую нас проблему, т. е. проверить нашу гипотезу; выборочное исследование в этом случае было бы гораздо [c.30] полезнее. С другой стороны, представим себе, что мы хотим оценить, как некая газета освещает политическую кампанию. Мы могли бы просто проанализировать содержание самой газеты, подсчитывая количество упоминаний тех или иных кандидатов; либо мы могли бы обследовать читателей газеты, чтобы определить, что именно из прочитанного о кампании им запомнилось. В первом случае мы располагали бы непосредственным измерением содержания, из которого следует сделать выводы о воздействии прессы, во втором непосредственным измерением воздействия, из которого следует сделать выводы о ее содержании. В зависимости от точной формулировки проблемы исследования полезными могут оказаться та или иная стратегия или их сочетание. Таким образом, приемлемость данного метода исследования в значительной степени определяется тем, какую именно проблему мы взялись изучать.
Однако есть еще и второе соображение, которое можно было бы определить как возможность реализации. В процессе исследования возникает момент, когда мы готовы покинуть нашу “башню из слоновой кости” и обратиться к реальной действительности. Поэтому мы должны быть уверены, что избранный нами метод или прием может быть успешно применен в тех конкретных условиях, с которыми нам предстоит иметь дело. Например, поскольку в нашей Малой Америке нет газеты (а есть, как мы помним, только станции обслуживания и рестораны), мы не можем, даже если бы захотели, воспользоваться контент-анализом. Точно так же самый простой способ измерить уровень отношений между руководством Ирака и Турции провести ряд личных интервью, однако организовать интервью с руководителями этих стран весьма затруднительно, если не сказать больше. В каждом конкретном случае нам приходится подбирать далеко не идеальные способы измерения ключевых переменных. Таким образом, подходящий метод это метод, максимально эффективный в условиях ограничений, накладываемых ситуацией исследования.
В итоге нужно найти способ измерения переменных, которые мы хотим измерять: (1) соответствующий нашим рабочим определениям переменных и (2) практически осуществимый. Мы должны, насколько это возможно, [c.31] соблюдать принятые в науке требования, однако мы можем соблюдать их лишь в той степени, в какой позволяют обстоятельства. [c.32]
НАБЛЮДЕНИЕ ЗА ПОВЕДЕНИЕМ
На четвертом этапе процесса исследования реально осуществляется стратегия исследования, разработанная на третьем этапе. Здесь должны приниматься во внимание многие факторы, однако два из них заслуживают особого упоминания. Во-первых, генерализуемость, во-вторых, реактивность.
Генерализуемость означает возможность с определенной степенью надежности распространять или переносить наши выводы, основанные на наблюдении за поведением людей в нескольких частных случаях, на предполагаемое поведение всей совокупности. Мы должны учитывать это при отборе конкретных объектов (людей, решений, организаций или наций), которые мы собираемся изучать. Проблема, которая здесь возникает, это в основном проблема степени распространения. Если событие повторяется всего 4-5 раз или в группе, которую мы хотим изучать, имеется всего 4-5 объектов, то мы можем рассмотреть каждое из этих событий или каждый из этих объектов индивидуально и сделать относительно них разнообразные обобщающие утверждения, будучи в достаточной степени уверенными, что наши выводы распространяются на все объекты. Однако, что бывает гораздо чаще, если число объектов достигает многих сотен, тысяч или даже миллионов, так что рассмотреть каждый из них непосредственно нет никакой возможности, мы будем намного меньше уверены в том, что исследование относительно небольшого числа объектов (возможно, менее чем одного из тысячи) позволит нам сделать правильные выводы относительно всей группы. В этих условиях мы должны разработать стратегию, часто называемую процедурой формирования выборки, с помощью которой можно решить, каковы те немногие представители огромного множества объектов, изучив которые мы получим выводы, применимые ко всей совокупности. При этом мы должны решить, сколько объектов нужно изучить и как следует их отбирать, а также попытаться оценить репрезентативность этих нескольких объектов. Залогом генерализуемости служит выбор для наблюдения тех объектов, которые, по всей вероятности, наилучшим [c.32] образом представляют генеральную совокупность, являются ее наиболее типичными представителями.
Отобрав объекты для анализа, мы должны проявить максимум внимания при их изучении. Следует избегать таких способов измерения политических явлений или поведения, которые являются реактивными. Реактивность подразумевает одну из двух возможностей: либо тот, кто проводит исследование, либо методы исследования могут каким-то образом воздействовать на тех, за кем ведется наблюдение, и вносить в их действия изменения, обусловленные именно присутствием исследователя. Иными словами, существует опасность, что сама по себе процедура исследования может изменить поведение тех, кто подвергается изучению, так что конечные результаты окажутся ошибочными. По-видимому, в качестве классического примера реактивности можно привести исследование, проводившееся в 1939 г. на одной из фабрик, в ходе которого изучалось влияние изменения условий труда на производительность рабочих. На протяжении более чем одного года для небольшой группы рабочих меняли продолжительность рабочего дня, периодичность перерывов, освещение, способ оплаты. Однако вне зависимости от условий, в которых работала группа, будь то длинный или короткий рабочий день, редкие или частые перерывы и т. п., члены этой группы постоянно превосходили по производительности труда всех других рабочих той же самой фабрики. Оказалось, что наиболее значимым фактором, повлиявшим на производительность труда, был необычайно высокий моральный подъем, связанный с тем, что члены данной группы ощущали себя объектом внимания и участниками эксперимента3. Данный эффект, так называемый эффект Готорна (по названию фабрики, где он впервые был отмечен), означал, что никаких выводов относительно связи между условиями труда и производительностью труда нельзя было делать потому, что процедура наблюдения создавала неестественную обстановку, непохожую на обычные условия работы.
Проводя политологическое исследование, мы иногда сталкиваемся с очевидными примерами реактивности, напоминающими рассмотренный случай. Самоуверенность или недружелюбие интервьюирующего, наводящий вопрос или назойливость наблюдателя могут настолько [c.33] исказить изучаемую ситуацию, что результаты исследования не будут вызывать никакого доверия. Примерно в половине случаев, однако, воздействие таких факторов более скрыто. Например, можно было бы соответствующим образом обучить очень хорошего интервьюера, так чтобы он задал абсолютно безупречный (и тем не менее оказывающийся реактивным) вопрос: “Вы одобряете экономическую политику президента?” Возможно, последует ответ: “Одобряю. Идея представляется мне хорошей”. Однако можем ли мы быть уверены в том, что респондент действительно имел какое-то мнение относительно экономической политики президента до того, как его об этом спросили? Разве не может само интервью послужить катализатором, способствуя формированию мнения респондента и возникновению оценки, которой ранее не существовало. Это тоже реактивность, однако реактивность такого типа гораздо труднее обнаружить и предотвратить.
Совершенно недостаточно просто выйти на поле боя, вооружившись несколькими вопросами, и начать искать ответы на них. Необходимо как следует позаботиться о том, как и где выйти на это поле, как и кого обследовать. Если небрежно провести обследование, можно погубить лучшую теорию и лучший план наступления. [c.34]
АНАЛИЗ ДАННЫХ
Элементы информации о каждом объекте, которые мы собираем в процессе исследования, называются данными, и, как только они получены, перед нами начинает маячить конец работы. Наша цель на этом этапе уяснить, что именно мы получили для решения проблемы исследования. Имеется ли какая-либо связь между поведением, которое мы надеемся объяснить или лучше понять, с одной стороны, и факторами, которые, как мы думаем, помогут нам сделать это, с другой? Предположим, например, что, по нашим расчетам, люди, различающиеся уровнем образования, будут систематически различаться по степени вероятности участия в голосовании. Во многих случаях это можно сделать, ответив на три вопроса. Наш первый вопрос: так ли это? Действительно ли люди, отличающиеся друг от друга по одной из этих переменных, будут последовательно различаться и по другой? Будут ли более образованные люди последовательно отличаться от менее [c.34] образованных большей или меньшей склонностью принимать участие в голосовании? Анализируя полученные данные, мы могли бы, например, выяснить, что менее образованные люд и принимают участие в голосовании почти столь же часто, как и более образованные, что знание уровня образования не дает возможности ни предсказать, ни объяснить, почему вероятность участия в голосовании для данного человека отличается от вероятности участия для кого-то другого. Если это так, то мы заявляем, что уровень образования не оказывает влияния на вероятность голосования или, иначе говоря, что между этими двумя переменными нет никакой связи. Таким образом, анализ не подтверждает наши ожидания. С другой стороны, если мы обнаружим, что в шести или семи случаях из десяти знание уровня образования позволяет точно предсказать, примет ли данный человек участие в голосовании, мы получим данные в поддержку нашего утверждения о связи этих двух переменных. Следовательно, мы выясняем, что, когда речь идет о голосовании, более образованные люди систематически отличаются от менее образованных, и получаем возможность понять поведение при голосовании объектов нашего исследования. Итак, основное, что необходимо выяснить при оценке гипотезы, это наличие между двумя переменными статистической зависимости.
Как только эта связь установлена, необходимо задать не менее важный вопрос: как связаны эти две переменные? Будут ли более образованные люди участвовать в голосовании с большей вероятностью, чем менее образованные? Или же связь между этими переменными носит еще более сложный характер? Если мы продумали нашу гипотезу и в результате можно предполагать, что уровень образования связан с голосованием, мы, вероятно, имеем в виду одну из этих возможностей.
Рис. 1.1. Соотношение между уровнем образования и вероятностью голосования
Например, можно было бы утверждать, что при наличии более высокого уровня образования возрастает вероятность наличия у человека навыков и знаний, необходимых для того, чтобы поддерживать у него интерес к политике. Соответственно, более образованный человек скорее примет участие в голосовании, чем тот, кто обладает меньшими навыками или располагает меньшей информацией. Таким образом, мы вправе ожидать, что участие в голосовании будет более [c.35] частым или более типичным для тех исследуемых нами людей, чей уровень образования выше. Этот тип соотношения иллюстрируется на рис.1.1а (точки на прямой представляют соответствующие значения переменных).
Однако мы могли бы также считать, что, чем образованнее становится человек, тем сильнее он разочаровывается в политической деятельности. В соответствии с этой точкой зрения образованность ведет к разочарованию, что в свою очередь уменьшает желание принимать участие в голосовании. В этом случае мы можем ожидать, что чаще голосовать будут менее образованные из обследуемых нами людей. Этот тип соотношения иллюстрируется на рис.1.1б.
Наконец, мы могли бы даже утверждать, что образование лишь до определенной степени увеличивает возможности для занятий политикой и интерес к ней, тогда как люди с более высоким уровнем образования (например, обучающиеся в колледже) гораздо сильнее разочарованы в политике и потеряли к ней интерес. В этом случае мы можем ожидать, что наиболее часто будут голосовать люди, имеющие средний уровень образования, в то время как на полюсах степень участия в голосовании будет ниже. Это более сложное соотношение иллюстрируется на рис.1.1в.
В каждом из случаев между уровнем образования человека и вероятностью его участия в голосовании имеется определенная зависимость, однако совершенно очевидно, что следствия, вытекающие из этих разных соотношений, совершенно различны. Таким образом, мы можем [c.36] обнаружить сильную взаимозависимость между двумя переменными и тем не менее оказаться не в состоянии подтвердить свою гипотезу.
Нужно задать себе и третий, возможно, менее очевидный вопрос. Насколько вероятно, что то или иное соотношение, обнаруженное нами при исследовании небольшого числа объектов, будет также получено при исследовании всей той совокупности, из которой выбирались эти объекты? Если угодно, это сформулированный в статистической форме вопрос о том, насколько обоснованно наше утверждение, что небольшая выборка репрезентативна, или типична, для генеральной совокупности. Если, выбирая для исследования конкретные объекты, мы принимали правильные решения, можно с уверенностью утверждать, что наши выводы, хотя и основаны на нескольких объектах, применимы ко всем объектам без исключения. Если мы ошибались, степень нашей уверенности может быть теперь не столь высокой. К сожалению, как станет яснее из последующих глав, когда выводы основаны на выборке из совокупности, никогда нельзя доверять им полностью. [c.37]
ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ
Наконец наступает момент, когда мы должны составить из отдельных фрагментов единую картину. Насколько мы преуспели в том, чтобы сформулировать именно ту проблему исследования, которую хотели? Что мы обнаружили? Каково значение наших результатов? Как соотносятся эти результаты с нашими ожиданиями? В сущности, к данному моменту мы свели некоторый аспект политического поведения к множеству цифр, которые могут отражать, а могут и не отражать статистические соотношения. Мы должны понять, каков вклад любых таких соотношений, а также других фактов, которые мы выяснили по ходу дела, в решение нашей проблемы исследования. Но и это еще не все, поскольку нам следует также критически взглянуть на само наше исследование. Не совершили ли мы в процессе исследования какой-нибудь существенной ошибки, которая могла бы обесценить полученные результаты? Удалось ли нам сохранить тесную связь между теорией и исследованием, с одной стороны, и [c.37] реальной политической деятельностью с другой? Не следует ли отнести некоторые очевидные вещи, имеющие отношение к реальному миру, за счет того, что мы сделали (либо не смогли сделать) в процессе исследования, а не за счет реальных событий? На эти вопросы трудно ответить, однако истинный ученый всегда пытается это сделать, поскольку лишь наличие таких ответов позволяет понять, в какой степени можно доверять результатам исследования.
Этот краткий обзор шести этапов исследовательского процесса должен дать хорошее представление о том, что такое научное изучение политики, и о том, чему посвящена настоящая книга. Немало места в книге будет уделено тому, чтобы найти подходы к решению и оценке каждой из этих задач. Мы, конечно, понимаем, что большинство из тех, кто читает эти страницы, никогда не станут учеными-политологами. Но мы также знаем, что навыки, необходимые для проведения исследований высокого уровня, могут с не меньшим успехом применяться для выработки более четкого и более критичного подхода к чтению и оценке работ, выполненных другими, а этим умением должен владеть каждый, кому не чужд интерес к изучению политики. Социологические исследования все более широко используются в качестве основы при определении социальной политики и принятии законодательных решений. Именно поэтому становится все более и более важным, чтобы граждане могли оценивать качество проводимых исследований, с тем чтобы выполнять свои обязанности в демократическом обществе.
Совокупность знаний, которую мы называем политологией, не есть нечто незыблемое, врученное нам в виде каменных скрижалей еще в античные времена. Эти знания постоянно расширяются, изменяются и уточняются. Каждое исследование заключает в себе возможность расширения наших знаний, нашего понимания. Однако эта возможность становится осуществимой лишь тогда, когда само исследование сможет удовлетворять критическим требованиям, лишь тогда, когда оно будет отвечать общепринятым стандартам. Эти стандарты и составляют содержание настоящей книги, и изучение их (как в целях осуществления своих собственных исследований, так и в [c.38] целях критического осмысления прочитанного) даст вам основы для понимания того, что уже сделано в области политологии, и для внесения своего собственного вклада в эту науку. [c.39]
ПОДГОТОВКА К ИССЛЕДОВАНИЮ
2. СОЗДАНИЕ ТЕОРИИ: ПОНЯТИЯ И ГИПОТЕЗЫ В ПОЛИТОЛОГИИ
Политические проблемы всегда сложны. Приведут ли судебные постановления, направленные на расовую десегрегацию муниципальных школ, к установлению расового равенства или усилят расовые различия, поощряя “белое вторжение” в сегрегированные пригороды? Если Конгресс уменьшит федеральный подоходный налог, будет ли при этом получено достаточное количество средств для сокращения безработицы или это приведет лишь к большей инфляции? Мы проводим социологические исследования для понимания окружающего нас сложного мира: либо для того, чтобы удовлетворить нашу потребность в знаниях, либо для того, чтобы быть и состоянии предвидеть будущие события или даже управлять ими.
Таким образом, научное исследование начинается с потребности что-то узнать. Это то, что мы назвали проблемой исследования. Обычно проблема исследования носит очень общий характер. Например, мы могли бы задаться вопросом, почему некоторые люди принимают активное участие в защите окружающей среды, тогда как другие выступают против этого движения или просто не интересуются им. Наиболее эффективный способ найти точный и потому полезный ответ на этот вопрос состоит в том, чтобы применить существующие методы эмпирического исследования отношений, наблюдаемых нами в мире. Прежде чем мы сможем применить научные процедуры, пытаясь найти приемлемое для всех решение нашей проблемы, необходимо свести этот очень общий вопрос к одному или нескольким очень конкретным. Не сделав этого, мы не будем знать, за чем именно следует наблюдать при поиске решения, и не поймем, как связаны наблюдаемые факты с исследуемой проблемой.
Превращение общей проблемы исследования в одну или несколько конкретных требует разработки возможных объяснений наблюдаемых фактов. Например, мы могли бы считать, что позиция людей в отношении защиты окружающей среды определяется характером их работы. Так, для некоторых профессий меры по защите [c.40] окружающей среды оказываются полезными, тогда как другим они наносят ущерб (по крайней мере на первых порах). Можно было бы решить, что на отношении людей к экологии сказывается возраст, поскольку более молодое поколение воспитывалось в то время, когда проблемы загрязнения окружающей среды были уже осознаны, тогда как люди более старшего поколения выросли до того, как эти проблемы были замечены.
Такого рода объяснения позволяют нам уменьшить степень сложности общественных явлений и приступить к научному исследованию. Мы можем использовать уже известную нам логику эмпирических взаимосвязей и имеющуюся информацию о них, для того чтобы продумать до конца ряд положений, которые, как мы ожидаем, будут идентичными. Теперь мы можем задать вопросы типа: правда ли, что более молодые люди чаще выступают в защиту законов об окружающей среде, чем это делают более пожилые? Правда ли, что “белые воротнички” и лица свободных профессий чаще, чем “синие воротнички”, поддерживают мероприятия в защиту окружающей среды? Можно разработать способы наблюдения, которые позволили бы нам ответить на эти вопросы, и, когда достаточно мелкие вопросы будут исследованы, мы сможем в конце концов решить первоначально поставленную проблему.
Пытаясь дать возможные объяснения событиям, мы теоретизируем, или строим теории. Теории создаются при попытке достичь понимания. Они помогают направлять нашу работу и определять, правильно ли наше понимание проблемы. Именно поэтому создание теории является первым шагом исследовательского процесса, и именно поэтому важно понимать взаимоотношения между теорией и самим исследованием.
Неподходящая теория может привести к тому, что наш труд окажется бесполезным для решения заинтересовавшей нас вначале проблемы. Не располагая надежной теорией, мы не сможем объяснить, почему наши результаты дают ответ на поставленный вопрос. Предположим, что мы начинаем исследование, имея в своем распоряжении только тот общий вопрос, который был сформулирован выше. Если должным образом сформированной выборке, состоящей из 1500 американцев, задавать вопросы об их [c.41] отношении к защите окружающей среды вместе с выяснением их характеристик, то полученные результаты можно будет использовать для описания типов людей, поддерживающих законодательную деятельность по охране окружающей среды или выступающих против нее, однако объяснить, почему они поддерживают ее или выступают против, мы не сможем.
С другой стороны, если мы начнем с теории, которая дает объяснение того, почему люди выступают в поддержку или против политики охраны окружающей среды, и зададим наши вопросы с целью проверить правильность ожиданий, логически вытекающих из этой теории, полученные результаты будут способствовать пониманию того, почему люди занимают именно ту позицию, которую они занимают.
Предположим для простоты, что, согласно нашей теории, первая забота всех людей материальное благополучие и что их позиция по вопросам защиты окружающей среды полностью определяется тем, как, по их мнению, предлагаемые законы повлияют на их доходы. Возможное ожидание, или прогноз, логически вытекающий из такого рода рассуждений, состоит в том, что люди, которые думают, что введение законов по охране окружающей среды нанесет им материальный ущерб, будут выступать против этих законов, а те, кто предполагает благоприятное воздействие законов, поддержат их. Если наша теория является адекватным объяснением того, как люди вырабатывают свою позицию по вопросу защиты окружающей среды, то данный прогноз должен быть верным. Можно получить некоторое представление о пользе теории, проверив эмпирическую правильность прогнозов, логически из нее следующих. Например, мы могли бы спросить людей об их позиции по вопросу защиты окружающей среды и о том, как, по их мнению, эти проблемы связаны с их доходами, для того чтобы выяснить, подтверждается ли наш прогноз имеющимися у нас знаниями о реальных отношениях. Вне зависимости от полученного результата наше исследование может сообщить нам некоторые сведения о том, почему люди воспринимают эту проблему так, а не иначе. Если исследование проведено корректно и прогноз подтверждается, мы можем с определенной степенью уверенности считать, что получили надежное объяснение [c.42] обсуждаемых фактов, и искать дополнительные аргументы в пользу пригодности этого объяснения. Если прогноз оказывается неверным, мы по крайней мере можем считать, что данная теория не годится для понимания позиции людей в данном вопросе, и можем обратиться к поиску других возможных объяснений.
Вне зависимости от того, располагаем мы или нет вначале какой-либо теорией, в ходе исследования могут быть получены одни и те же факты. Однако продвинуться в понимании проблемы помогут лишь факты, которые мы в состоянии связать друг с другом посредством теории. Знание того, что “белые воротнички” чаще, чем “синие воротнички”, выступают в защиту окружающей среды, будет служить объяснением того, почему люди занимают ту или иную позицию, лишь тогда, когда мы можем как-то обосновать связь между родом занятий и позицией по проблемам экологии. В противном случае все это может оказаться случайным совпадением, и знание данного факта никак не поможет нам объяснить наличие у человека той или иной позиции. Теории помогают объяснять, почему факты должны быть связаны так, а не иначе, и дают возможность интерпретировать факты в определенных рамках и установить связи между ними.
Цель данной главы показать, как разрабатываются теории и как они влияют на проведение исследований. Мы обсудим специфику теорий в области социальных наук, элементы таких теорий и соотношение теории с остальной частью процесса исследования. Прочитав эту главу, читатель будет в состоянии осмыслить интересующие его политические проблемы в такой степени, чтобы провести систематическое эмпирическое исследование и найти эффективные (если не полные) решения этих проблем. [c.43]
ЧТО ТАКОЕ ТЕОРИЯ?
Теории создаются по двум причинам. Во-первых, мы надеемся с помощью теорий так упростить действительность, чтобы можно было как-то понять ее и тем самым контролировать либо приспосабливаться к ней. Во-вторых, после того как понимание действительности достигнуто, теории могут послужить руководством для проверки его правильности. Теории логически обосновывают ожидания, или прогнозы, относительно реального мира, [c.43] которые посредством соответствующих методов исследования могут сопоставляться с действительностью. Когда прогнозы подтверждаются, получают подтверждение и те рассуждения, которые лежат в их основе, соответственно возрастает наша уверенность, что мы правильно уловили ход событий. Когда наши прогнозы оказываются неверными, мы начинаем сомневаться в своем понимании и ищем способы достичь правильного понимания событий.
Теории представляют собой множества логически связанных символов, отражающих то, что, по нашему мнению, происходит в мире. Теории всего лишь интеллектуальные инструменты. Это очень важно усвоить, поскольку таким образом мы получаем возможность осознать, что теории ни в каком абсолютном смысле не являются ни истинными, ни ложными, а только более или менее полезными. Точно так же, как существует несколько способов изготовить молоток, существует и множество путей разработки теорий, объясняющих политическую жизнь. Таким образом, бессмысленно ожидать, что теорию можно открыть подобно тому, как мореплаватель открывает неизвестный остров. Почему? Да потому, что теории не существуют “во внешнем мире”, так чтобы их можно было открыть. Они создание человеческого воображения, тяжелого труда и иногда счастливого случая.
Если теории столь необходимы для проведения добротного исследования и в то же время их нельзя обнаружить путем простого разглядывания на протяжении многих часов груды распечаток, то как же взяться за построение теории, которая бы вела к пониманию интересующих нас аспектов политической жизни? Какие процессы здесь задействованы? Ответ не совсем ясен и прост, поскольку теории строятся самыми разными способами. Мы не можем предъявить набор процедур для создания конструктивной теории так, как могли бы описать изготовление стереосистемы. Однако мы можем пояснить главные идеи, лежащие в основе процесса создания теорий, и наиболее важные этапы этого процесса. Первый из них концептуализация проблемы. [с.44]
ЛОГИКА ПОСТРОЕНИЯ ТЕОРИИ
Начав с события или поведения, которое мы хотим понять, мы должны прежде всего спросить себя, какие из [с.44] имеющихся знаний о явлении могли бы помочь объяснить его. Понимание достигается на основе собственного опыта, случайного наблюдения или творческого размышления. Еще чаще полезным становится систематическое изучение чужих достижений в данной области. Полезные теории начинают свое существование с досконального изучения тех событий, которые мы хотим объяснить. Без такого рода знаний мы можем оказаться не в состоянии понять, что же следует объяснять, или не будем располагать указаниями о том, где искать реальные отношения, которые можно использовать для объяснения событий.
Массовые волнения, происходившие во многих городах США в конце 60-х годов, дают пример того, что знание фактов очень важно для правильной концептуализации проблемы исследования. Когда волнения только начались, многие официальные лица называли их выступлениями групп бедняков, не имеющих устойчивых связей с обществом. Если бы мы приняли такую интерпретацию и попытались проанализировать эти волнения, стоящую перед нами задачу можно было бы сформулировать следующим образом: почему в американских городах сконцентрировалось так много “отбросов общества” и каким образом были спровоцированы выступления? Многие официальные лица приводили в качестве объяснения присутствие якобы каких-то посторонних агитаторов. Однако, когда социологи провели интервью в городах, где происходили волнения, оказалось, что участниками волнений были не только “отбросы общества”. Фактически состав участников волнений почти не отличался от состава негритянского населения этих городов1. В свете этого факта задача нашего исследования становится в корне отличной от той, которая диктовалась интерпретацией событий как обусловленные участием в них “отбросов общества”. В этом случае мы должны попытаться понять, что побудило обычных граждан негритянского происхождения, имеющих ту или иную работу, семью и другие общественные связи, принять участие в волнениях. Соответствующие объяснения опираются скорее на такие переменные, как реакция негритянского населения на расизм белых, чем присутствие посторонних агитаторов.
В данном примере неадекватные знания о фактах могли направить наши действия по созданию теории в [с.45] совершенно неверном направлении. Вот почему столь важным является поисковое исследование, цель которого установление соответствующих фактов. По этой же причине (если мы хотим строить надежные теории) необходимо искать информацию об исследуемых явлениях в литературе.
И все-таки как именно строится теория, объясняющая наблюдаемые явления, после того как все доступные факты оказываются в нашем распоряжении? Обычно мы начинаем с поиска фактов для тех моделей, которые могут объяснить наблюдаемые события.
Например, мы хотим узнать, каковы были причины политических выступлений в университетских городках. Чтобы ответить на этот вопрос, необходимо объяснить, что заставило студентов участвовать в этих выступлениях. Если бы мы сами были участниками таких выступлений или знали кого-либо из участников, у нас могли бы возникнуть некоторые соображения относительно побудительных мотивов выступлений, однако объяснение того, почему в них участвовали большие массы студентов, потребовало бы информации о гораздо большем числе людей. Чтобы дать такое объяснение, гораздо разумнее было бы собрать данные о характеристиках и мотивах выступлений, общих для всех участвовавших в них студентов. Если среди участников обнаружились общие свойства, отличающие их от остальных студентов, мы можем заключить, что именно они и приводят к участию в демонстрациях. При этом особая роль таких характеристик становится частью объяснения того, почему происходят выступления.
Переход от обобщения того, что мы наблюдаем, к тому, . чего мы не наблюдаем или не можем наблюдать, называется индукцией. Индукция составляет базис научной теории. Теории, построенные на основании наблюдений с помощью индукции, называются эмпирически обоснованными. В процессе индукции, исходя из наших знаний о некоторых ситуациях, мы делаем вывод о том, как могли бы обстоять дела в других, сходных ситуациях. Мы делаем логический скачок от того, что видели, к прогнозу относительно того, чего не видели, базируясь на предположении, что в основе всех событий реального мира лежит некая постоянная глубинная модель. В своей повседневной жизни [с.46] мы все пользуемся индукцией. Если пять раз подряд мы наблюдаем, что после нажатия кнопки на стене дверь лифта открывается, мы быстро сделаем из этого вывод, что нажатие кнопки вызывает открывание двери. Здесь имеет место индуктивное обобщение переход от нескольких случаев, которые мы наблюдали (пятикратное нажатие кнопки), к случаям, которые мы не наблюдали (нажатие кнопки большее число раз и нажатие кнопок лифтов в других зданиях). Процесс индукции изображен на рис.2.1а. На диаграмме изображено, как именно основываются на фактах индуктивно построенные теории.
Однако для создания теории нужна не только индукция, поскольку отсылка к фактам еще не дает объяснения, если только мы не в состоянии показать, почему эти факты приводят к наблюдаемым результатам. Вернемся к примеру со студенческими выступлениями. Предположим, мы обнаруживаем, что их участники, как правило, были в большей степени недовольны государственной политикой, чем те, кто не принимал в них участия, и что они, кроме того, в гораздо меньшей степени верили в эффективность обычных способов достижения политических изменений. Установление этого факта служит объяснением причины выступлений только в том случае, если мы можем показать, почему подобная ситуация должна вести к выступлениям. Чтобы продемонстрировать это, вероятно, понадобится сделать ряд предположений о политическом поведении, а точнее, окажется необходимым сделать прогноз о том, что для изменения политики, с которой люди не согласны, они будут предпринимать определенные действия и что, не видя никаких изменений в политике под воздействием обычных политических методов (голосование, написание писем и т. п.), они перейдут к открытым выступлениям.
В последующем эти предположения (называемые иногда аксиомами или постулатами) входят в состав нашей теории. Они описывают условия, при которых в соответствии с нашими ожиданиями полученные нами предварительные объяснения подтверждаются имеющимися данными. Делая общие утверждения о политическом поведении в определенных условиях, эти положения объясняют, почему мы ожидаем студенческих выступлений, опираясь на то, что мы знаем о студентах университетских [с.47] городков. Теперь мы можем объяснить конкретный способ поведения (выступление), показав, что он логически вытекает из ряда теоретических предположений.
Поступая таким образом, мы совершаем действие, обратное тому, которое совершали при индуктивном рассуждении. Здесь мы движемся от абстрактных утверждений, касающихся общих взаимосвязей, к конкретным утверждениям, касающимся специфических типов поведения. Этот процесс рассуждения от абстрактного и общего к конкретному и специфическому известен под названием дедукции. Мы все пользуемся дедуктивной логикой в повседневной жизни. Если мы предполагаем, что работа лифтов управляется системой настенных кнопок, и оказываемся перед лифтом, мы обычно делаем вывод, что для попадания в лифт необходимо нажать имеющуюся кнопку. От обобщения мы перешли здесь к прогнозу относительно конкретного события с помощью дедукции. Этот процесс изображен на рис.2.1б.
Дедукция -это процесс, позволяющий нам использовать теории для объяснения событий реального мира. Если с помощью процесса дедукции мы в состоянии продемонстрировать, что некоторое наблюдаемое событие может быть логически предсказано на основе ряда предположений, входящих в нашу теорию, то тем самым теория дает объяснение наблюдаемому явлению. Теория помогает понять событие, обосновывая, почему оно именно такое, какое оно есть. Дедукция предназначена для осуществления связи между теорией и нашими наблюдениями.
Однако сама по себе разработка теории еще не делает ее эффективной. Обычно мы подходим к объяснению некоторого события, располагая многими теориями. В таком случае необходимо задать вопрос, какие из этих теорий больше всего помогают нам в понимании действительности. Ответ на этот вопрос требует проверки альтернативных теорий фактами действительности. Прежде чем обсуждать проверку теорий, необходимо понять две вещи. Во-первых, для того чтобы заниматься созданием теорий, надо выяснить, что определяет полезность теории. Во-вторых, нам следует выяснить, как компоненты теории связаны друг с другом и с эмпирическими исследованиями. Чтобы быть полезной для объяснения наблюдений, теория должна отвечать следующим требованиям: [с.49]
1. Теория должна быть верифицируемой. Можно ли, исходя из теории, сделать прогнозы относительно действительности, достаточно конкретные и специфические, так чтобы мы могли провести наблюдения, либо подтверждающие, либо опровергающие их? Может ли теория быть связана с действительностью систематическим образом или она представляет собой всего лишь множество абстракций?
2. Теория должна быть логически непротиворечивой. Является ли теория внутренне последовательной? Являются ли ее предположения совместимыми друг с другом, а входящие в нее термины однозначными?
3.Теория должна быть доступной. Могут ли другие, должным образом обученные люди понять теорию так, чтобы иметь возможность использовать ее для объяснения событий и заниматься проверкой вытекающих из нее гипотез?
4. Теория должна быть общей. Можно ли использовать ее для объяснения разнообразных событий, происходящих в разных местах и в разное время? Можно ли, основываясь на ней, строить прогнозы, которые легко проверить при различных условиях, или она жестко привязана к одному виду наблюдений?
5. Теория должна быть экономичной. Достаточно ли она проста, чтобы быть легко применимой и понятной, или она столь сложна, столь переполнена условиями и исключениями, что эксплицитные ожидания о событиях реальной действительности извлекаются из нее с трудом?
Теории могут обладать этими желательными характеристиками в разной степени, и иногда при разработке конкретной теории нам приходится отдавать предпочтение одним характеристикам в ущерб другим. Мы, например, можем поступиться экономичностью в пользу большей общности или верифицируемости. Чтобы результаты нашего труда действительно приносили пользу, мы должны, формулируя теории, иметь в виду все перечисленные выше требования. [с.50]
КОМПОНЕНТЫ ТЕОРИИ
Теория состоит из множества понятий, связанных утверждениями, логически выведенными из множества предположений. Такова логическая структура теории. Именно эта структура позволяет нам использовать теорию для объяснения событий, поскольку дает [с.50] возможность обосновывать, почему мы вправе логически ожидать именно того положения дел, которое имеет место.
Поиски полезной теории начинаются с решений, которые мы принимаем относительно строительных блоков теорий понятий. Понятие это просто слово или символ, который обозначает некоторое представление. В понятиях нет ничего мистического. Мы пользуемся ими ежедневно, облегчая себе взаимодействие с многоплановой действительностью за счет того, что подводим под некоторую категорию встречающиеся нам объекты в соответствии с некоторыми релевантными для нас их свойствами. Четвероногих, которых мы видим, мы относим к коровам, кошкам, собакам и другим видам животных, и такая классификация сама по себе является основой для возникновения некоторых важных ожиданий (например: от собак не стоит ждать молока). Приписывая наименование тому или иному объекту, мы можем делать относительно него некоторые прогнозы, поскольку наименование представляет собой символ определенного сочетания свойств.
Той же самой цели служат социологические понятия. Они указывают свойства объектов (людей, политических систем, выборов), релевантные для конкретного исследования. Одного исследователя могут интересовать личностные характеристики человека, другого идентификация данным человеком его партийной принадлежности, третьему наиболее интересен уровень политического отчуждения личности. Человек характеризуется всеми этими свойствами: личностными характеристиками, партийной принадлежностью, степенью отчуждения и многими другими, но лишь отдельные из них релевантны для каждого конкретного случая. Все исследователи имеют дело с одной и той же реальной действительностью, они лишь производят отбор, чтобы по-разному организовать свои наблюдения. Понятия помогают решить, какие из многочисленных свойств или признаков существенны для нашего исследования.
Дело в том, что понятия, как и теории, не живут собственной жизнью. Они инструменты, которые мы создаем для определенных целей, и их нельзя назвать истинными или ложными, можно лишь считать их более или менее полезными. [с.51]
Что делает понятие полезным? На этот счет имеется три основных соображения.
Во-первых, постольку мы занимаемся эмпирическим исследованием, понятие, для того чтобы оно приносило пользу, должно относиться к явлениям, по крайней мере потенциально наблюдаемым. В Средние века важную роль при объяснении событий играло понятие Божьей Воли. Однако верифицировать подобные объяснения мы не можем, поскольку не в состоянии наблюдать Божью Волю, чтобы утверждать ее наличие или отсутствие в каждом данном случае. Чтобы иметь хотя бы какую-то научную ценность, понятие должно соотноситься с чем-то, что так или иначе измеряется с помощью наших обычных органов чувств.
Это не означает, что все понятия должны относиться к непосредственно наблюдаемым объектам. Ряд очень существенных для социальные наук понятий относится к свойствам, которые невозможно наблюдать непосредственно. У людей просто нет классового статуса в том смысле, в каком у них есть рыжие волосы, однако, если мы располагаем о них определенными сведениями (например, сведениями об их доходе или их специальности), мы можем сделать вывод о том, каков их классовый статус. Точно так же в государстве не бывает авторитарной или демократической политической системы в том же смысле, в каком его территория характеризуется наличием гор или пустынь, однако можно сделать вывод о степени демократичности данного государства, изучив определенные стороны его политической жизни (например, характер выборов и обеспечение гражданских свобод).
Возникает следующий вопрос: можем ли мы разработать набор процедур, использующих наши органы чувств для сбора информации, которая бы позволила нам определить наличие или отсутствие в реальном мире объекта, к которому относится понятие, или величину этого объекта? Если мы в состоянии сделать это для некоторого понятия, то, собственно говоря, это понятие имеет эмпирические референты: оно относится к тому, что можно прямо или косвенно наблюдать.
Во-вторых, понятия (помимо наличия у них эмпирических референтов) должны быть точными. Они должны относиться к одному, и только к одному, множеству [с.52] свойств некоторого явления. мы должны иметь возможность точно знать, о чем идет речь, когда для описания некоторого объекта используется некоторое понятие. Участвует ли в описании понятия социального класса раса или классовый статус полностью определяется факторами (такими, как доход к образование), к числу которых раса не относится? Учитывается ли степень неравенства в распределении материальных благ, когда политическая система государства характеризуется как демократическая или авторитарная, или же характер политической системы полностью определяется другими факторами? Точность очень важна, поскольку она указывает на то, за чем следует вести наблюдение, чтобы увидеть, как проявляется понятие в каждом конкретном случае. Только в том случае, если мы это увидим, мы сможем использовать понятие в объяснениях, имеющих эмпирические основания.
Точность помогает также идентифицировать эмпирические референты и проводить разграничения среди наблюдаемых явлений. Если степень демократичности определяется лишь наличием или отсутствием всенародных выборов официальных лиц, то демократическим государством являются и бывший Советский Союз, и Соединенные Штаты. Хотим ли мы в нашем исследовании рассматривать эти два государства как примеры одного и того же типа политической системы? Если нет, мы должны усовершенствовать используемое понятие, сделать его более точным, так чтобы в нашем исследовании можно было провести различие между этими двумя государствами.
И наконец, в-третьих, полезные понятия должны быть теоретически значимыми. Понятие теоретически значимо тогда, когда оно связано с достаточно большим числом других понятий данной теории, чтобы играть важную роль в объяснении наблюдаемых событий.
Давая гипотетическое объяснение студенческим выступлениям, мы использовали два понятия: глубину политического недовольства и оценку эффективности влияния обычной политической деятельности на изменения в политике. Эти два понятия были связаны друг с другом посредством предположений, состоящих в том, что люди будут предпринимать какие-то действия для изменения политики, вызывающей у них протест, и что, поняв бесполезность других средств воздействия, они перейдут к [с.53] от крытым выступлениям. Приняв во внимание эти предположения и обнаружив соответствующее сочетание взаимосвязей, о которых мы говорили, мы будем вынуждены ожидать открытых выступлений. Каждое из понятий здесь существенно для объяснения и связано как с теоретическими предположениями, так и со вторым понятием. Каждое понятие теоретически значимо, так как необходимо для объяснения.
Таким образом, становится очевидным, что теория определяет полезность понятий, связывая их друг с другом, так чтобы их можно было использовать в формулировках объяснений. Теория связывает понятия, устанавливая между ними определенные отношения. Эти отношения имеют форму утверждений, выведенных из наших предположений.
Утверждения обычно устанавливают между понятиями отношение одного из двух основных типов: ковариации или каузации. Ковариационные отношения указывают, что два или более понятий имеют тенденцию изменяться одновременно: когда увеличивается (уменьшается) одно, увеличивается (уменьшается) и другое. Ковариационные отношения не несут никакой информации о причинах одновременного изменения отношений. Например, можно предсказать, что в отношении ковариации находятся уровень политической информированности и вероятность участия в голосовании: когда возрастает одно, возрастает и второе. Однако что же при этом происходит? Люди с большей вероятностью будут голосовать, так как они лучше информированы? Или они заняты поисками информации, так как собираются принять участие в голосовании и хотят принять надежное решение? Или же и уровень информации, и вероятность голосования зависят от некоего третьего фактора, например интереса к политике или осознания общественного долга? Такое предположение не содержит никакой информации.
Каузальные (причинные) отношения указывают, что изменения в одном или нескольких понятиях приведут к изменениям в одном или нескольких других понятиях. Например, мы могли бы утверждать, что, чем сильнее у человека развита идентификация партийной принадлежности, тем выше вероятность того, что он (или она) примет участие в голосовании. Осознание того, что ты [с.54] являешься членом партии, может заставить человека принять участие в голосовании, однако высокая вероятность участия в голосовании не формирует идентификации партийной принадлежности.
Мы все в обыденной жизни привыкли рассуждать в терминах причины и следствия, однако, как правило, эти понятия используются нестрого. Часто бывает крайне трудно установить причины или последствия человеческих поступков: чем значительнее событие, тем более трудным может оказаться установление его причин. Что является причиной войны, общественного движения или образования новой политической партии?
Вследствие всех этих сложностей мы должны с осторожностью постулировать каузальные отношения и лишь в тех случаях, когда одновременно выполняются четыре условия. Во-первых, постулированные причина и следствие должны изменяться вместе, т.е. находиться в отношении ковариации. Во-вторых, причина должна предшествовать следствию. В-третьих, мы должны иметь возможность идентифицировать каузальную связь между предполагаемой причиной и следствием. (Это означает, что мы должны иметь возможность идентифицировать процесс, посредством которого изменения А вызывают изменения В.) В-четвертых, ковариация между явлениями причины и следствия не должна возникать из-за их одновременной соотнесенности каким-то третьим фактором.
Это последнее условие напоминает нам о проблеме мнимых отношений. Когда А и В изменяются вместе, поскольку оба они вызваны С, а в отсутствие С они совместно не изменяются, то усматриваемое нами отношение между А и В называется мнимым. Очень важно внимательно следить за предположениями, которые мы выдвигаем, пытаясь выявить возможные мнимые отношения, прежде чем включать их в теорию, посчитав результатом каузального взаимодействия. Классическим примером мнимого отношения служит следующий случай: вначале исследователь обнаруживает, что цена импортного рома и жалованье министров испытывают одновременные колебания, и затем делает вывод, что изменение цен на ром вызывает изменение министерского жалованья. Гораздо вероятнее, что и цены на ром, и жалованье министров изменяются в результате изменения общих экономических условий и общего уровня цен. Отношение между первыми [с.55] двумя переменными это отношение ковариации, а не отношение каузации.
Важно понимать еще две особенности социальной каузации. Во-первых, одно явление может вызывать другое либо прямо, либо косвенно А может вызвать В лишь в том смысле, что будет являться причиной С, которое уже непосредственно будет вызывать В. Чтобы строить по возможности полные теории, необходимо очень внимательно следить за косвенной каузацией. Во-вторых, следует учитывать тот факт, что поведение человека обычно бывает обусловлено более чем одной причиной. При разработке теории необходимо избегать излишнего упрощения и отводить должное место в общественной жизни множественной каузации. Это означает, что любое событие может иметь несколько различных причин и что осуществление некоторого события иногда требует одновременного осуществления многих событий2.
Для того чтобы справиться со всеми этими трудностями, обычно бывает полезно построить каузальную модель теории. Каузальная модель это диаграмма, которая в явном виде задаст все отношения, принятые в теории, и, таким образом , все следствия, вытекающие из наших посылок, становятся более наглядными. На рис.2.2 представлен пример такой модели. Каждая стрелка модели изображает каузальное воздействие, а направление стрелки указывает, какая переменная в нашей теории является зависимой, а какая независимой. В теории, изображенной на рис.2.2, утверждается, что на решение члена палаты представителей голосовать за или против законов о социальном 'обеспечении влияет множество как прямых, так и косвенных факторов. Так, на схеме показано, что такой фактор, как численность бедного населения в избирательном округе данного представителя, влияет на его голосование по вопросам социального обеспечения как прямо (независимо), так и косвенно через избирательную состязательность округа и уровень старшинства представителя.
И ковариационные, и каузальные отношения могут быть как положительными, так и отрицательными. Это означает, что два приятия могут изменяться либо в одном и том же направлении, либо в противоположных. Если они изменяются в одном и том же направлении, отношение считается положительным. Положительное отношение представлено утверждением: чем сильнее относительное неравноправие национальных меньшинств в [c.56] обществе, тем выше вероятность политического насилия. Отрицательное отношение представлено утверждением: чем сильнее степень политического отчуждения, испытываемого человеком, тем ниже вероятность того, что он (или она) будет принимать участие в традиционной политической деятельности. В теории должно быть указано, какое именно отношение между понятиями (положительное [c.57] или отрицательное) нами ожидается. Эта информация может быть добавлена к каузальной диаграмме с помощью знаков плюс (+) или минус (), приписанных каждой стрела к указывающих на то, положительным или отрицательным мыслится данное отношение. [c.58]
ПРОВЕРКА И СОВЕРШЕНСТВОВАНИЕ ТЕОРИИ
К теории никогда не следует относиться как к чему-то завершенному. Ее следует рассматривать в качестве инструмента, время от времени требующего пересмотра и постоянного совершенствования. Начинать нужно с постановки проблемы исследования, которая требует объяснения наблюдаемых событий. Мы выбираем понятия, полезные для объяснения этих событий, мы связываем эти понятия с помощью утверждений, логически выведенных из множества предположений, которые мы выбираем, чтобы обеспечить такое объяснение. Теперь мы как бы приперты к стене. Имеет ли наша конструкция какую-нибудь пользу? На первый взгляд, она объясняет то, что мы хотим понять, но можно ли это проверить? Можем ли мы испытать ее полезность, с тем чтобы не только знать степень нашей уверенности в ней, но и иметь возможность убедить в ее ценности других?
Проверка теории занимает центральное место в процессе исследования. Поскольку наши теории разрабатываются на основе фрагментов знаний о реальных отношениях, проверка теории в основном заключается в том, чтобы, используя теорию, сформулировать определенные прогнозы относительно остальных отношений, которые мы не рассматривали, и затем проверить, согласуются ли действительные наблюдения с тем, что мы ожидали увидеть. Мы не можем опираться на отношения, которые уже рассматривались, поскольку демонстрация того факта, что теория заставляет нас ожидать именно тех отношений, для объяснения которых она построена, вовсе не является проверкой теории.
Возьмем пример с лифтом. Понаблюдав за лифтами в каком-нибудь здании, мы можем быть совершенно уверены, что они в этом здании действуют в соответствии с системой настенных кнопок. Быть может, мы даже захотим обобщить наши наблюдения и придем к выводу, что так работают все лифты. Правильность этого вывода можно [c.58] проверить, лишь испытав другие лифты. Перепроверка лифтов в здании, с которого мы начинали, ничего не даст, поскольку мы уже знаем, что они реагируют на кнопки, а демонстрация того, что это так и есть, не прибавляет нам уверенности, что и с другими лифтами дело обстоит так же. Нам придется пойти в другие здания и посмотреть, как там работают лифты. Мы никогда не сможем окончательно доказать, что наша теория работы лифтов верна, поскольку никогда не сможем обследовать все на свете лифты. По мере того как выявляется все больше и больше лифтов, работающих именно таким образом, а не иначе, наша уверенность в правильности нашего обобщения будет возрастать. Если же мы не обнаружим больше ни одного лифта, приводимого в действие кнопками, мы быстро сделаем вывод, что ошиблись, перенеся свое первое наблюдение на все другие лифты.
Проверка теории в социальных науках подчиняется тем же принципам. Мы должны перейти от того, что мы наблюдали при разработке теории, к тому, чего мы не наблюдали, для того что бы выяснить, дает ли нам теория верное отражение реального мира. Предположим, например, что мы хотим построить теорию, объясняющую поведение на выборах. Мы просматриваем предшествующие исследования на эту тему и обнаруживаем, что в случае жителей США высшее образование положительно связано с участием в голосовании. Чем дольше человек учился, тем выше вероятность такого участия. Основываясь на этом наблюдении, мы включаем в нашу теорию предположение, утверждающее, что более высокий уровень образования способствует более высокой вероятности участия в голосовании. Мы знаем, что в Соединенных Штатах эти факторы взаимосвязаны, а как обстоит дело в других странах? Можно ли без всяких сомнений распространять результаты наблюдений, проведенных в США, на другие страны?, Не могло ли случиться так, что в системе образования США есть нечто особенное, что и порождает эту зависимость? Единственный способ выяснить это провести исследования за рубежом.
Из предположения, что образование повышает вероятность участия в голосовании, мы могли бы сделать вывод, что человек, окончивший колледж, скорее поймет участие в голосовании, чем тот, кто имеет лишь диплом об [c.59] окончании средней школы. Мы можем проверить это предположение, посмотрев, соответствует ли оно данным ряда других стран. Чем чаще мы будем убеждаться, что данные согласуются с выдвинутым предположением, тем сильнее будет наша уверенность в том, что теория адекватно предсказывает поведение людей. Мы никогда не можем быть абсолютно уверены, что теория “верна”, так как она не в состоянии ни учесть все случаи, ни предусмотреть возможные изменения эмпирических взаимосвязей с течением времени. Однако мы можем обрести большую или меньшую уверенность в применимости теории, сравнив выводимые из нее предположения со своими наблюдениями. Если теория позволяет правильно предсказать ранее не наблюдавшиеся явления, она полезна.
Теории, представляющие собой множества понятий, предположений и утверждений, никогда не бывают раз и навсегда доказаны или опровергнуты. Правильнее считать, что мы приобретаем уверенность в полезности теории по мере того, как у нас накапливаются наблюдения, согласующиеся с выводимыми из нее ожиданиями, или гипотезами. Наоборот, по мере того как накапливаются наблюдения, не согласующиеся с гипотезами, следующими из теории, наша уверенность уменьшается. Поэтому то, что мы называем проверкой теории, в действительности сводится к проверке гипотез. Совершенствование теории в значительной степени основано на процессе сравнения условий, предсказываемых Гипотезой, с действительностью и модификации теории на основе полученных результатов, с тем чтобы выводимые из нее гипотезы все более и более соответствовали тому, что мы наблюдаем. В этой связи крайне важно учитывать, как стоящие перед нами проблемы преобразуются в гипотезы, которые берутся на вооружение при эмпирическом исследовании и предоставляют нам сведения, позволяющие установить адекватность теоретических объяснений. [c.60]
РОЛЬ ГИПОТЕЗ
Гипотеза это, в сущности, утверждение о том, как, по нашему мнению, обстоят дела в действительности. Она сообщает о том, что мы ожидаем увидеть в результате правильно организованных наблюдений за событиями, [c.60] происходящими в реальном мире. Гипотезы представляют собой декларативные предположения, описывающие ожидаемые нами взаимосвязи между явлениями, обозначаемыми нашими понятиями. Обычно они формулируются в следующем общем виде:
Чем выше (ниже, значительнее, больше, медленнее и т. п.) _______, тем выше (ниже, значительнее, больше, медленнее и т. п.)______.
Прочерки будут заполнены названиями явлений, которые, как мы ожидаем, изменяются одновременно. Например, исходя из теории, модель которой дана на рис.2.2, мы могли бы предложить следующую гипотезу:
Чем выше в округе процент бедного населения, тем скорее их представитель будет голосовать в поддержку законов о социальном обеспечении.
Это предсказывающая, ковариционная гипотеза. Она не сообщает, как определяются результаты голосования, однако указывает нам нечто, что мы можем наблюдать, пытаясь получить данные о соответствии между теорией и действительностью.
Получение этих данных с помощью эмпирического наблюдения требует перехода от теории, сформулированной в самом общем виде, к более конкретному уровню, на котором можно организовывать наблюдение. Поступая таким образом, мы должны начать рассуждать в терминах переменных. Переменная может быть определена как эмпирически наблюдаемое свойство некоторого явления, которое может принимать более одного значения. Например, такие переменные, как пол и национальность, могут принимать ограниченное число значений, и могут быть “измерены” лишь качественно, путем приписывания им таких характеристик, как “мужской” или “англичанин”. Другие переменные, как, например, возраст и годовой доход, могут иметь гораздо более широкий спектр значений; их можно измерять количественно путем подсчета.
Переменные позволяют переводить утверждения, содержащие лишь абстрактные понятия, в утверждения с более точными эмпирическими определениями, так что эмпирическая правильность утверждений Может быть оценена. У нас нет необходимости использовать различные термины для понятий, имеющих Точные эмпирические определения, таких, как возраст или пол. Однако более абстрактные понятия для проведения исследований могут потребовать представления в виде переменных. Например, [c.61] важное место в политологии занимает понятие плюрализма, однако его эмпирические референты не совсем ясны. Чтобы проверить эмпирическую правильность утверждения, связывающего плюрализм с другими объектами, мы должны представить это понятие в виде переменной или множества переменных, имеющих отчетливые эмпирические определения. В качестве переменной, представляющей в нашем исследовании понятие плюрализма, можно было бы использовать число организованных групп в стране, связанных определенными интересами. Затем мы можем обдумать все, начиная с отношений между переменными, чтобы оценить эмпирическую правильность утверждений об отношениях между понятиями. Если нам захочется считать, что переменная число организованных групп по интересам отражает основное значение понятия плюрализм, мы захотим получить подтверждение, что эта переменная связана с некоторой другой переменной (такой, как уровень правительственных расходов на социальное обеспечение), в доказательство того, что плюрализм также связан с этой второй переменной или понятием, которое она отражает.
Переменные занимают центральное место в процессе исследования по двум причинам. Во-первых, предоставляя более четкие эмпирические определения, они помогают установить, за чем следует наблюдать, чтобы проверить нашу теорию. Во-вторых, зная, какова роль переменных в рамках гипотез, мы можем организовать наше наблюдение. Переменные, которые рассматриваются как меняющие свое значение в ответ на изменение значения других переменных, называются зависимыми переменными. Их значение зависит от значения других переменных. Переменные, которые воздействуют на значение других переменных, меняя свои собственные значения, называются независимыми переменными.
Будет ли переменная зависимой или независимой, определяется отношением, утверждаемым гипотезой, содержащей данную переменную. Одна и та же переменная может быть зависимой в одном исследовании и независимой в другом. Например, некий исследователь, наблюдая за лоббистской борьбой заинтересованных групп, мог бы сделать вывод, что, чем больше в государстве организованных групп, связанных определенными интересами, тем выше будет [c.62] уровень правительственных расходов на программы по социальному обеспечению. В этом случае число групп является независимой переменной (НП), а уровень расходов зависимой переменной (ЗП). Другой исследователь мог бы прийти к выводу, что группы, связанные определенными интересами, возникают в результате осознания людьми возможности получения от правительства определенных благ, и утверждать, что, чем больше средств правительство тратит на социальное обеспечение, тем больше будет число организованных групп, имеющих свои интересы. Здесь правительственные расходы независимая переменная, а количество групп зависимая. Различие между двумя точками зрения на возникающие в этих случаях отношения изображены на рис.2.3.
Все это очень важно, так как цель исследования отчасти определяется той ролью, которая приписана различным переменным. Если мы утверждаем, что рост числа заинтересованных групп ведет к увеличению правительственных расходов, мы не собираемся исследовать увеличение правительственных ассигнований в период между 1970 и 1980 гг., а затем отмечать изменение количества организованных групп в период между 1980 и 1990 гг. Этот рост никак не связан с уровнем предшествовавших ему расходов. Если же мы выдвигаем гипотезу, что увеличение расходов ведет к росту числа групп, то подойдет только что описанная стратегия исследования. Поскольку знания о зависимом или независимом статусе переменных помогают организовать проведение исследования, наши гипотезы должны очень аккуратно фиксировать этот статус. [c.63]
При внимательном рассмотрении рис.2.3 мы обнаруживаем еще один тип переменной, важной для социального анализа. В теории, представленной в виде диаграммы на рис.2.3a, лоббистская деятельность является промежуточной переменной; она возникает между числом организованных групп, связанных общими интересами, и уровнем правительственных ассигнований. Промежуточные переменные осуществляют связь между независимыми и зависимыми переменными. В этом случае заинтересованные группы не могли бы воздействовать на уровень правительственных ассигнований, если бы они не занялись парламентской деятельностью, чтобы получить фонды, предназначенные для этой цели. Если бы организациям было запрещено действовать в кулуарах законодательных органов, появление организаций, представляющих заинтересованные группы, не связывалось бы с уровнем правительственных ассигнований.
На рис.2.3б в качестве промежуточной переменной выступает осознание возможных благ. Переменная организация заинтересованных групп не была бы связана с уровнем общественных ассигнований, если бы члены группы не осознавали выгод организованности. Если бы, например, почти все правительственные ассигнования шли на оборонные проекты и лишь небольшая часть на внутренние программы, многие граждане могли бы не видеть никакой пользы от увеличения правительственных ассигнований и не организовывались бы в группы даже тогда, когда общественные ассигнования быстро возрастали.
Промежуточные переменные регулируют взаимосвязи между другими переменными. Это означает, что значение, принимаемое промежуточными переменными, может воздействовать на силу и направление отношений между другими переменными. Если лоббистская деятельность в ситуации, изображенной на рис.2.3a, незначительна, связь между организацией заинтересованных групп и общественными ассигнованиями будет слабой. Если Деятельность носит активный характер, связь между двумя другими переменными будет сильной.
Поскольку промежуточные переменные определяют отношения между другими переменными, знание роли, которую они играют, будет оказывать влияние на наши ожидания, касающиеся связей между переменными. Если [c.64] мы строим теорию, в соответствии с которой лоббистская деятельность занимает промежуточное положение между организацией групп и увеличением ассигнований, мы можем дать следующие прогнозы:
Организация заинтересованных групп будет положительным образом связана с увеличением правительственных ассигнований в том случае, если лоббистская деятельность носит активный характер.
Организация заинтересованных групп будет лишь незначительно связана с правительственными ассигнованиями в том случае, когда лоббистская деятельность очень ограничена.
При этом недостаточно просто предсказать, что организация заинтересованных групп будет связана с увеличением правительственных ассигнований, так как, по нашему мнению, наличие связи между двумя переменными зависит от значения промежуточной переменной лоббистской деятельности. Поэтому в наших теориях мы должны точно определить порядок отношений и роль, выполняемую каждой переменной.
Последний тип переменной, существенный в этой связи, это антецедентная переменная. В то время как промежуточные переменные занимают место между независимой и зависимой переменными, антецедентные переменные вступают в действие до независимой переменной. Проводившиеся в США исследования поведения на выборах показали, что люди, глубоко осознающие партийную принадлежность, с большей вероятностью принимают участие в голосовании, чем те, у кого такого осознания нет. Мы могли бы сделать из этого вывод, что осознание партийной принадлежности способствует участию в голосовании. Однако что заставляет одних глубоко чувствовать партийную принадлежность, а других нет? Вероятно, важную роль в формировании у человека чувства партийной принадлежности играет глубина чувства партийной принадлежности, свойственного его родителям. Таким образом, партийная принадлежность родителей является антецедентной переменной в каузальной цепи, обусловливающей вероятность голосования.
Использование в наших теориях промежуточных и антецедентных переменных помогает уточнить понятие каузальных цепей, реально действующих и способствующих появлению явлений, которые мы хотим объяснить. Это увеличивает возможности по формированию гипотез, с [c.65] помощью которых мы можем проверить полезность наших теорий, поскольку гипотезы это в значительной степени утверждения об отношениях между переменными. Они создают основу для сбора данных об эмпирической полезности всей нашей теоретической конструкции. Чем больше отношений мы постулируем и чем детальнее эти отношения, тем больше прогнозов об окружающем мире мы можем дать и тем более мощными средствами проверки нашей теории мы располагаем.
Остается открытым вопрос, каким образом мы получаем эти прогнозы, или гипотезы. Как именно мы решаем, какие отношения между переменными использовать при формулировании гипотез, вокруг которых организуются исследовательские проекты? [c.66]
ФОРМУЛИРОВАНИЕ ГИПОТЕЗ
Мы приходим к гипотезам либо путем индуктивного, либо путем дедуктивного рассуждения; это зависит от стадии процесса исследования, на которой мы находимся. Если для построения теории мы пользуемся методом проб и ошибок, гипотезы можно выдвигать с помощью процесса индуктивного обобщения. Например, отметив, что в США уровень участия граждан в политической жизни в разных штатах различен и при этом пропорционален уровню индустриализации, мы могли бы расширить данное наблюдение и утверждать, что это отношение между переменными может быть найдено и при сравнении разных государств. Если найдутся данные, подтверждающие эту гипотезу, у нас будет больше оснований включить индустриализацию в качестве переменной в теорию, предназначенную для объяснения политической активности. Однако до тех пор, пока у нас нет теории, позволяющей ответить на вопрос, почему индустриализация и политическая активность связаны друг с другом, мы не можем использовать факт их связи для объяснения политической активности.
Гипотезы, полученные индуктивным путем, могут играть важную роль в поисковом исследовании, которое полезно при построении теорий, но они оказываются бесполезными для объяснения явлений. Как только мы построили теорию, соединяющую наши переменные в логически связную систему, мы можем выводить из нее гипотезы [c.66] с помощью дедуктивного рассуждения. Так как эти гипотезы являются прогнозами о мире, логически следующими из теории, с которой мы работаем, то выявление фактов, подтверждающих гипотезу, помогает давать объяснение событиям, поскольку обнаружение таких фактов отражает валидность теоретической системы, из которой выведены гипотезы.
Дедуктивное рассуждение очень хорошо разработанная дисциплина, и мы не будем здесь объяснять ее правила3. Однако важно отметить, что дедуктивная логика это процесс, с помощью которого может быть эксплицирована информация, содержащаяся в наборе утверждений. Пользуясь одной лишь дедукцией, мы не в состоянии узнать об отношениях между переменными ничего нового. Мы используем дедукцию, только чтобы извлечь всю возможную информацию из того, что уже известно об этих отношениях. Дедукция используется для уточнения выводов, следующих из наших предположений, и именно это уточнение создает гипотезы.
Дедукция, приведенная на рис.2.1б, демонстрирует следующее. Если сформулированное предположение правильно, т.е. если республиканская партия привлекает только консерваторов, то любое подмножество членов этой партии также будет консервативным, а поскольку республиканцы Мидлтауна являются членами этой партии, они также будут консерваторами. Именно такой способ рассуждения мы имеем в виду, когда говорим, что одно следствие “логически вытекает” из другого. Вывод о том, что все республиканцы в Мидлтауне будут консерваторами, логически следует из предположения, что республиканская партия привлекает одних лишь консерваторов.
Задача построения гипотезы состоит в том, чтобы логическим путем сделать такой вывод, исходя из предположений, входящих в состав наших теорий. Именно потому, что гипотезы выводятся из теорий таким способом, проверка гипотез является косвенной проверкой теорий. Если мы опросим должным образом сформированную выборку из числа республиканцев Мидлтауна и обнаружим, что не все они консервативны, у нас будут все основания усомниться в валидности нашего предположения. Обнаружение среди республиканцев Мидлтауна либералов покажет, что республиканская партия привлекает не одних лишь [c.67] консерваторов. В этом случае нам нужно изменить свое предположение так, чтобы теория более точно соответствовала действительности, например, чтобы оно звучало следующим образом: “Республиканская партия имеет тенденцию привлекать скорее консерваторов, чем либералов”. Из этого предположения мы можем вывести гипотезу: “Среди членов республиканской партии в Мидлтауне будет больше консерваторов, чем либералов”.
Если среди республиканцев Мидлтауна мы обнаружим нескольких либералов и много консерваторов, мы сможем утверждать, что данные согласуются с гипотезой и с тем видоизмененным предположением, из которого она была выведена. И тем не менее мы не можем считать сделанное предположение валидным до тех пор, пока не убедимся, что оно подтверждается данными о консервативном или либеральном характере более обширной выборки из числа членов республиканской партии на общенациональном уровне. В конце концов, Мидлтаун мог быть в каком-то отношении уникальным. Возможно, например, что во всем городе наберется всего лишь десяток либералов, и тот факт, что лишь некоторые из членов республиканской партии являются либералами, оказывается результатом скорее этого, чем относительной привлекательности партии для либералов или консерваторов.
Здесь важно подчеркнуть, что данные, подтверждающие правильность гипотез, являются данными, подтверждающими правильность теории, лишь тогда, когда гипотезы связаны с теорией правилами дедуктивной логики. Только в этом случае мы можем без опасений переходить от данных относительно валидности гипотезы к любому суждению, касающемуся исходной теории. В ходе такого процесса логического вывода гипотез, проверки их фактами действительности и оценки теории в свете полученных результатов теории развиваются, дополняются и совершенствуются.
Особенно важную роль в этом процессе играет один вид гипотез это альтернативные конкурирующие гипотезы. У любого события много возможных объяснений. Некоторые из этих объяснений будут полностью согласованы друг с другом, по крайней мере одно объяснение может быть правильным. Однако в некоторых случая объяснения могут противоречить одно другому: если правильно [c.68] одно, не может быть правильно другое. Если мы формулируем объяснения в виде гипотез, то гипотезы, не согласованные друг с другом, называются альтернативными конкурирующими гипотезами. Они альтернативные, поскольку дают разные способы рассмотрения или понимания объясняемого события. Они конкурирующие, поскольку не могут быть одновременно валидными. Если верна одна из гипотез, другая должна быть неверной. Мы не можем проверять и сопоставлять все возможные альтернативные гипотезы, связанные с любым событием, однако если мы хотим доверять хотя бы одной гипотезе, то должны попытаться проверить основные конкурирующие гипотезы, чтобы убедиться, что наши наблюдения не увели нас в неверном направлении.
Широко распространенная форма альтернативной конкурирующей гипотезы это гипотеза, в которой утверждается, что отношение между любыми двумя переменными является мнимым и что изменения обеих переменных на самом деле обусловлены некоторым третьим фактором. Этот тип альтернативных конкурирующих гипотез особенно полезен при проверке теорий, так как он предлагает способ исследования, дающий твердую основу для оценки того, какая из двух рассматриваемых гипотез более правильная.
Вспомним приводившийся выше пример с установлением причинного отношения между ценами на ром и жалованьем министров, где отношение устанавливалось на том основании, что две эти переменные статистически действительно связаны. Основная альтернативная конкурирующая гипотеза состоит в том, что изменения обеих переменных вызваны изменениями общих экономических условий, представленных в виде уровня цен. Если данная гипотеза правильна, связь между ценами на ром и жалованьем министров исчезнет, как только мы сможем “контролировать”, т.е. поддерживать постоянным, воздействие уровня цен. Существуют статистические методы и исследовательские проекты, позволяющие определить, так ли это. Если мы обнаружим, что при условии контроля за общим уровнем цен статистическая связь между ценами на ром и жалованьем министров исчезает, у нас появится основание отвергнуть первоначальную гипотезу и заменить ее конкурирующей. Если соотношение между [c.69] ценами на ром и жалованьем сохраняется даже после того, как установлен контроль за общим уровнем цен, мы сможем в большей степени доверять гипотезе о том, что эти переменные действительно связаны. [c.70]
ЗАКЛЮЧЕНИЕ
Теории получают признание как полезные интеллектуальные инструменты при выполнении двух условий: при обнаружении данных, согласующихся с предсказаниями теорий, и при исключении конкурирующих гипотез. Однако необходимо помнить, что никакое отдельно взятое исследование не дает достаточных данных для принятия или отклонения какой бы то ни было теории или части теории, которая имеет дело с явлениями, не рассматривавшимися в данном исследовании. Всегда остается вероятность, что в ходе будущих исследований появятся данные, опровергающие валидность теории. Мы всегда должны быть готовы к встрече с противоречащими фактами и охотно обращаться к индукции для включения новых данных в более полезные теории. Построение теории это процесс постоянного взаимодействия между предположениями и данными, между рассуждением и исследованием. Он требует и творческой изобретательности, и практического эмпиризма. Хорошую порцию последнего мы надеемся преподнести вам в следующих главах. [c.70]
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА К ГЛАВЕ 2
Литература по теории социологии часто имеет настолько специальный характер, что может быть понята лишь теми, кто хорошо знаком с терминологией, свойственной такой академической дисциплине, как философия науки. Однако эта усложненность не должна скрывать от [c.70] нас того факта, что в основе процесса построения теории кроется несколько легко формулируемых принципов. В качестве ценных источников для понимания проблемы мы предлагаем книги, в которых содержится доступное изложение предмета.
Одной из наиболее солидных разработок принципов социологического исследования является кн.: Stinchcombе A.L. Constructing Social Theories. Chicago: University of Chicago Press, 1987. Назовем еще две авторитетные книги, в которых рассматриваются вопросы разработки и использования теории в процессе исследования: Hoover К.R. The Elements of Social Scientific Thinking. N.Y.: St. Martin's Press, 1984, 3d еd.; Reynolds P.D. A Primer in Theory Construction. Indianapolis: Bobbs Merrill, 1971.
Кн.: Rosenbеrg M. The Logic of Survey Analysis. N.Y.: Basic Books, 1968, посвящена главным образом методам анализа данных, однако в ней содержится также прекрасное обсуждение природы переменных и отношений между переменными. Небольшая кн.: Сnudde Сh.P. Democracy in the American South. Chicago: Marcham publishing Company, 1971 даст вдумчивую и ясную характеристику этапов концептуализации, построения теории, проверки гипотез. Прочитав ее, вы получите наглядную картину взаимосвязей между теорией и исследованием. [c.71]
3. ОТ АБСТРАКТНОГО К КОНКРЕТНОМУ: ОПЕРАЦИОНАЛИЗАЦИЯ И ИЗМЕРЕНИЕ
Каждое качество проявляет себя в определенном количестве, а без количества не может быть качества. До настоящего времени многие наши товарищи все еще не понимают, что необходимо уделять внимание количественному аспекту вещей основополагающей статистике, основным процентным соотношениям и количественным пределам, определяющим качество вещей. У них в голове нет “цифр”, и в результате они не могут не делать ошибок. Мао Цзэдун |
Эмпирическое исследование это способ получения ответов на вопросы о действительности. Наши вопросы могут быть главным образом практическими либо представлять преимущественно академический интерес. В любом случае они, возможно, будут сформулированы в абстрактной форме. Тем не менее ответы, которые мы хотим получить, обычно носят конкретный и специальный характер. Одна из первых проблем исследования разработать способы перехода от абстрактного уровня вопросов к конкретным наблюдениям, которые позволят нам ответить на них.
Приведем пример не из области политики: предположим, мы хотим разрешить спор, какой из двух профессиональных футбольных защитников является лучшим спортсменом. Очевидно, нам придется каким-то образом сравнивать этих двоих, чтобы выработать свои аргументы. Но на каких основаниях мы будем их сравнивать? Мы хотим определить, у кого из них больше качеств хорошего спортсмена, однако спортивное мастерство абстрактное понятие. Чтобы оценить каждого защитника в терминах этого качества, нам придется количественно определить понятие спортивного мастерства. Мы могли бы подсчитывать число сделанных ими передач во время игр, транслировавшихся по телевидению, поделить это число на число передач, которые они пытались сделать, и считать получающуюся в результате количественную оценку показателем спортивного мастерства. Или, что более вероятно, мы могли бы выполнять несколько таких операций по оценке действий игроков, так чтобы иметь более полную [c.72] картину того, насколько хорошо эти спортсмены выполняют функции защитника, и затем определенным образом их комбинировать. Получив новые количественные отношения, мы сможем сделать конкретные сравнения и разрешить спор.
То, что мы только что описали, это, по существу, процесс, посредством которого в социальном исследовании осуществляется переход от абстрактного понятия к конкретным наблюдениям. Это решающий этап процесса исследования, поскольку лишь в том случае, если он выполнен правильно, собранная нами информация даст сведения о полезности наших теорий или позволит получить ответы на наши вопросы. Процесс сбора наблюдаемых явлений для представления абстрактных понятий известен как операционализация, а уточнение шагов, которые следует предпринять при ведении наблюдений, называется инструментализацией. Результатом ее является измерение, а измерение мы в конце концов используем в качестве свидетельства, принимая решения и отвечая на вопросы.
В настоящей главе мы подробно опишем эти процессы и обсудим проблемы, которые могут возникнуть при попытке операционализации и измерения понятий. Усвоив эту главу, вы сможете сформулировать объяснения, выработанные в результате анализа литературы, в форме, допускающей их проверку посредством реальных наблюдений. Обсуждаемые здесь действия представляют собой тот этап процесса исследования, после которого можно приступать к разработке плана исследования и сбору данных. [c.73]
ОПЕРАЦИОНАЛИЗАЦИЯ: СВЯЗЬ МЕЖДУ ТЕОРИЕЙ И НАБЛЮДЕНИЕМ
В гл. 2 мы подчеркивали важность наличия теории для руководства наблюдением. В самых общих чертах процесс исследования описан как процесс сравнения реальных наблюдений с теоретическими представлениями, для того чтобы мы могли оценить, насколько можно доверять теориям как объяснениям политических явлений. Эти представления формулируются в виде гипотез, предсказывающих наличие взаимосвязей между переменными, которые Представляют понятия теории. Цель настоящей главы описать план проведения наблюдений, которые позволят произвести такие сравнения. Проблема заключается [c.73] в том, каким образом количественно представить наши понятия, так чтобы иметь возможность точно сказать, подтверждаются или нет наблюдениями наши теоретические представления.
Возникающие при этом проблемы в области социальных наук, по существу, не отличаются от проблем в области естественных наук. Простой пример помогает дать кое-какие пояснения на этот счет. Допустим, мы хотим проверить гипотезу о том, что минеральное удобрение, внесенное на одном поле, в большей степени стимулирует рост, чем естественные питательные вещества, обнаруженные на другом поле. Рост это абстрактное понятие. Мы не можем увидеть его непосредственно, необходимо перевести рост в эмпирически наблюдаемую переменную, так чтобы мы могли определить, когда одно растение характеризуется им в большей степени, чем другие.
Можно представить понятие росте с помощью переменной достигнутая высота, поскольку относительная высота эмпирически наблюдаема. Однако стебли кукурузы отметок высоты не имеют; мы должны установить их сами. Но как это сделать? Мы попытаемся оценить с помощью наблюдателя кукурузу на двух полях как высокую или низкую. Однако такая процедура позволяет осуществить лишь грубое сравнение растений; при этом возможны разного рода ошибки, поскольку люди могут оценить переменную высота по-разному. Если мы хотим делать осмысленные сравнения, необходим более точный и надежный способ определения высоты.
Переменную высоты следует представить в виде значений какого-либо измерительного прибора, который может быть использован для получения точных, стандартизированных сведений о степени проявления данной характеристики у отдельных растений. Можно допустить, чтобы высота была представлена показателем, таким, как длина в дюймах, и измерить растения с помощью мерной ленты. Тогда данные, считываемые с мерной ленты, становятся значениями, которые мы приписываем растениям по переменной высота; эти значения и есть то, что мы реально сравниваем, пытаясь определить правильность нашего предсказания относительно величины роста растения на одном поле по сравнению с другим. [c.74]
Итак, мы перешли от абстрактного понятия рост к переменной высота и далее к показателю длина в дюймах. Это преобразование и есть то, что называется операционализацией, поскольку мы свели абстрактное понятие к множеству значений, которые могут быть получены с помощью специальных операций. И наконец, мы производим сравнения, на основании которых сможем оценить правильность нашей гипотезы об относительном росте, воспользовавшись сравнением значений, полученных в результате процесса измерения (в нашем примере показаний, считанных с мерной ленты). Когда мы говорим о наблюдении в исследовании, мы имеем в виду процесс использования измерительного инструмента в целях приписывания значений некоторой характеристики или свойcтва рассматриваемого явления тем объектам, которые подвергаются изучению. Иными словами, наблюдение означает использование инструмента для измерения свойства или поведения.
Это очень важный момент. Он поясняет роль операционализации и измерения в процессе исследования. Мы никогда не можем реально сравнивать понятия, хотя наши теории, а зачастую и проблемы, будут сформулированы в терминах понятий. Мы сравниваем показатели понявший. В приведенном выше примере мы не можем сравнивать рост растений на двух полях. Мы можем сравнивать лишь данные, считанные с мерной ленты измерения, полученные с помощью показателя, который, как мы решили, представляет наше понятие.
Это означает, что наши сравнения могут быть точны лишь в той степени, в которой выбранные показатели отражают понятие, для измерения которого они предназначены. Если мы неправильно операционализировали наши понятия, отношение между показателями может неверно отражать отношение между понятиями, которые они должны представлять. В результате любые выводы, которые мы получаем исходя из понятий или теории, частью которой эти понятия являются, оказываются ошибочными.
Рис. 3.1. Операционализация: отношения между понятием, переменной и измерением
Рис.3.1 иллюстрирует эту ситуацию. Теория устанавливает отношение между двумя абстрактными понятиями. Гипотеза предсказывает наличие отношения между двумя эмпирически наблюдаемыми переменными, которые мы сводим к измеряемым показателям, а наши наблюдения выявляют [c.75] отношение (или отсутствие отношения) между двумя множествами значений этих показателей. Совершенно ясно, что мы можем сделать некоторые выводы о действительности на основе теоретических отношений лишь в том случае, если переменные хорошо соответствуют понятиям и показатели хорошо соответствуют переменным. Операционализация почти неизбежно приводит к некоторому упрощению или частичной утрате смысла, поскольку показатели редко передают все, что мы вкладываем в понятие. И хотя нам почти всегда приходится мириться с частичной утратой смысла, необходимо проводить операционализацию так, чтобы минимизировать этот недостаток. Нужно подыскивать такие показатели, которые передают возможно большую часть содержания понятий или отдельные его аспекты настолько точно, насколько это возможно.
Из всего этого вытекает ряд следствий, которые можно проиллюстрировать в нашем примере из области сельского хозяйства. После того как исследование начато, мы можем осознать, что в понятие “рост” входит нечто большее, чем высота, и что показатель “длина в дюймах” не полностью отражает то, что мы хотим измерить. Например, может оказаться, что два поля существенно различаются с точки зрения роста растений, однако все различия касаются диаметра стебля, ширины листьев и веса початка, а высота растений на обоих полях может различаться не очень существенно. В этом случае если при оценке результатов применения удобрения мы будем учитывать только высоту, то допустим серьезную ошибку, так как связь между понятием (рост) и переменной, которая его представляет (высота), неполноценна. Взятая переменная не полностью операционализирует понятие, которое она [c.76] представляет. Она не улавливает все значение понятия, и ее использование дает неправильное представление о связи, существующей в реальном мире.
Это особенно часто встречающаяся ситуация в социологических науках, так как наиболее важные их понятия многомерны в том смысле, что они имеют более чем один аспект или компонент. Вводимые нами критерии этих понятий должны отражать их многомерность (т.е. многообразие, несходство), если мы хотим, чтобы они были использованы как индикаторы концепции. Например, если критерием понятия “демократия” мы изберем только проведение регулярных выборов, то существует вероятность того, что мы классифицируем как демократические диктаторские режимы, которые также проводят выборы, но только с одним кандидатом на пост и не допускают свободы выражения мнений. В таком случае диктатуру мы будем рассматривать как западноевропейскую демократию. Чтобы получить корректный критерий того, какую нацию считать демократической, мы, несомненно, нуждаемся в индикаторах, отражающих все разнообразие этого понятия.
Этот простой пример поясняет, почему операционализации принадлежит решающая роль в проверке теории и во всем процессе исследования. Гораздо труднее объяснить, как обеспечить должную операционализацию. Это происходит потому, что подбор переменных для передачи понятий и разработка показателей для переменных в значительной степени требуют приложения творческих способностей и не могут быть сведены к множеству стандартизованных действий, которые безошибочно позволят получить необходимые измерения. Единственное, что мы можем сделать, это указать некоторые подводные камни в процессе операционализации, которых следует избегать, и описать способы оценки адекватности операционализации, которые уже сделаны. Об этом мы расскажем в разделах главы, посвященных измерению. [c.77]
ОПЕРАЦИОННЫЕ ОПРЕДЕЛЕНИЯ
Однако, прежде чем перейти к обсуждению проблемы измерения в социальной науке, необходимо рассмотреть, из чего состоит операционализация понятия. Это делается путем уточнения набора процедур, которым надо [c.77] следовать, или операций, которые надо выполнять для получения эмпирического показателя проявления понятия в каждом отдельном случае. Эти процедуры дают операционное определение понятия и соответствующей ему переменной. Процесс операционализации в существенной степени сводится к задаче выбора операционных определений для понятий.
Чтобы приносить пользу (т. е. давать валидные и надежные измерения понятий), операционные определения должны точно и эксплицитно сообщать, что следует делать для определения того, какое количественное значение должно быть приписано переменной в каждом отдельном случае. Операционные определения должны точно задавать все шаги, выполняемые в процессе измерения.
Мы хотим быть точными в этом вопросе по крайней мере по трем причинам. Во-первых, мы стремимся к тому, чтобы точно сообщить другим исследователям, что именно мы сделали для получения наших измерений, так чтобы они могли оценить нашу работу и, быть может, повторить наше исследование для проверки результатов в другой ситуации. Во-вторых, если у нас есть ассистенты, занимающиеся сбором информации, мы захотим сделать наши инструкции достаточно детальными и точными, чтобы все они осуществляли измерения в равных условиях. Если наши инструкции расплывчаты, наши ассистенты при осуществлении измерений будут предпринимать несколько отличные способы действий, их результаты окажутся несопоставимы и мы не сможем сделать на их основании валидные выводы. И наконец, точные и детальные утверждения о том, как операционализировать переменную, помогут нам в оценке полученных результатов и в устранении конкурирующих объяснений для результатов, полученных из-за дефектов процесса измерения. (Мы подробнее поговорим об этом в других разделах данной главы.)
Рассмотрение следующего гипотетического примера поможет вам понять, что требуется при построении операционного определения. Предположим, по заданию университета вы должны провести работу по оценке результатов воздействия сладких безалкогольных напитков на академическую успеваемость студентов. На основании этого исследования должно быть решено, оставлять ли в [c.78] университетском городке торговые автоматы. Эта задача в основном сводится к проверке следующей гипотезы:
Чем большее количество сладких безалкогольных напитков выпивает студент, тем ниже качество его (или ее) академической успеваемости.
Для решения задачи вам придется построить операционные определения для ключевых понятий потребление безалкогольных напитков и академическая успеваемость. Для простоты предположим, что понятие академической успеваемости вы представили в виде переменной средняя оценка, второе ключевое понятие в виде ответов студентов на прямой вопрос о потреблении ими безалкогольных напитков. После выбора колледжей и студентов, которые войдут в исследование, вы должны разработать процедуры для выполнения соответствующих измерений и проинструктировать ассистентов относительно того, как применять эти процедуры. Чтобы обеспечить сведения о зависимости переменной (академическая успеваемость), вам придется точно определить, откуда можно взять оценки, как подсчитать среднюю оценку и как формализовать информацию. Чтобы обеспечить измерение независимой переменной, вам придется дать точную формулировку вопросов, которые будут задаваться, и точно определить, как записывать различные возможные ответы на эти вопросы.
При разработке операционных определений для переменных, используемых в исследовании, вам необходимо дать скрупулезное описание процедур, используемых для осуществления измерений. Каждый шаг должен быть детально расписан. Это не только позволяет сделать описание исследования и обеспечивает стандартность процедур измерения, но и дает возможность продумать весь процесс осуществления измерения для определения возможных ошибок, которые могут сказаться на надежности результатов.
Предположим, мы хотим измерить степень поддержки, которую члены двух основных партий оказывают своей партии в законодательных органах штата. Мы можем операционализировать понятие “партийное единство” путем обращения к поименному голосованию и в дальнейшем использовать процент совпадений голосования среднего члена партии с голосованием большинства его партии как показатель единства при голосовании. Однако, решив [c.79] поступить таким образом, мы столкнемся с многовариантностью при реальной операционализации нашей переменной.
Информация о том, как голосует каждый законодатель, может быть получена из протоколов законодательного органа, однако после этого необходимо решить, какое из многих зафиксированных в протоколе голосований следует включить в наш подсчет. Одни голосования являются единодушными (такие, как голосование о выпуске прокламации в честь какого-нибудь национального героя) и не отражают партийного единства, поскольку не включают партийных проблем. Включение всех голосований снижает степень, в которой наше измерение отражает наше понятие. Мы должны выработать критерии для отбора голосований, подлежащих учету. Например, для того чтобы сосредоточивать внимание только на дискуссионных вопросах, мы могли бы отбирать для исследования только те поименные голосования, в которых принимают участие по крайней мере 2/3 законодателей и в которых побежденная сторона получает не менее 30% голосов.
Необходимо также решить, как разработать процедуру определения результатов голосования большинства членов партии, для того чтобы установить, соответствует ли голосование каждого члена партии позиции большинства. Мы должны решить, как поступать с воздержавшимися: считать ли их поведение за отказ от поддержки своей партии или исключать их из подсчета? Кроме того, нам нужно точно определить процедуру первоначального подсчета и последующего усреднения процентного содержания согласованных голосований для каждого законодателя.
При каждой операционализации мы сталкиваемся с необходимостью принимать сходные решения при определении того, какими процедурами пользоваться для получения соответствующих измерений. Полное операционное определение демонстрирует, как мы решили поступать с такими проблемами, и не оставляет никаких сомнений относительного того, что мы реально делали, производя наши измерения.
В результате построения операционного определения разрабатывается инструмент для выполнения измерений. В естественных науках для получения показателей, характеризующих степень проявления у физических [c.80] объектов некоторого свойства, применяются такие инструменты, как шкалы, экспонометры и микрометры. В социальных науках используются измерительные инструменты совсем иного рода. К числу типичных для социальных наук инструментов относятся: вопросы о форме проведения исследования; инструкции по проведению и описанию наблюдений за определенными событиями, такими, как дебаты на заседаниях ООН; множество характеристик, получаемых из справочника, и правила их объединения для формирования измерения.
Надлежащий инструментарий в социальных науках не менее важен, чем в естественных. Точно так же, как мы не стали бы измерять вес с помощью линейки, мы не захотели бы измерять политическое отчуждение с помощью вопросов, не выявляющих состояния людей, испытывающих отчуждение. Обсуждая в следующем разделе валидность и надежность измерений, мы предложим некоторые способы проверки инструментов, разработанных в процессе операционализации, которые укрепляют нашу уверенность в том, что эти инструменты измеряют то, что мы хотим. [c.81]
ИЗМЕРЕНИЕ
Мы операционализируем переменные, чтобы иметь возможность количественно представлять абстрактные понятия и осуществлять осмысленное сравнение явлений реального мира в терминах свойств, задаваемых этими понятиями. Такое приписывание числовых значений для представления свойств носит название измерения1. В результате измерения в каждом конкретном случае с переменной ассоциируется некоторое значение2. Это означает только то, что мы с большей точностью можем говорить о том, в какой степени данный объект наблюдения (например, человек, город, нация или организация) проявляет свойство, которое представлено измеряемой переменной. Вместо того чтобы говорить, что в городе “плохи дела в связи с преступностью”, мы сможем говорить о конкретных размерах преступности. Вместо того чтобы говорить о ком-то “преданный республиканец”, можно сказать, что он (или она) получил 5 баллов по нашей шкале силы идентификации партийной принадлежности. [c.81]
УРОВНИ ИЗМЕРЕНИЯ
Процедуры измерения предоставляют средство категоризации и упорядочения явлений. Вместе с тем одни процедуры дают возможность выявить более тонкие и детальные различия между событиями, чем другие. Поэтому нам приходится констатировать различные уровни измерения. Говоря о том, что процедура обеспечивает данный уровень измерения, мы квалифицируем ее в соответствии с количеством поставляемой ею информации об измеряемых явлениях и их взаимоотношениях друг с другом. Уровни измерения носят название номинального, порядкового и интервального.
Номинальное измерение представляет минимальную информацию о явлении. Оно дает лишь набор дискретных категорий, позволяющих разграничить разные объекты. Номинальное измерение это простое наименование объектов в соответствии с заранее заданной схемой классификации. Национальность обычно “измеряется” на номинальном уровне посредством классификации людей на англичан, швейцарцев, бразильцев и т. п. Это “измерение” не сообщает, насколько характеристика “национальность” свойственна разным людям, и не позволяет упорядочивать их. Использование номинального измерения всего лишь дает возможность объединить объекты в классы, обозначенные так, как это принято в классификационной схеме.
Чтобы быть полезными, схемы номинального измерения должны основываться на множествах категорий, которые являются взаимоисключающими и исчерпывающими. Это означает, что (1) невозможно отнести один объект к более чем одной категории и (2) категории должны быть такими, чтобы каждый объект мог быть отнесен к той или иной категории. Если мы хотим расклассифицировать всех избирателей Соединенных Штатов с помощью схемы номинального измерения, мы не можем воспользоваться категориями демократ, республиканец, либерал и консерватор, так как они не являются взаимоисключающими. Поскольку американские политические партии обращаются к самым широким массам избирателей, человек вполне может оказаться одновременно демократом и консерватором или либералом, одновременно республиканцем и консерватором или либералом. Эти [c.82] категории не дают возможности провести разграничение между избирателями во всех случаях. Аналогично, если мы попытаемся расклассифицировать избирателей на основании партийной принадлежности, используя только две категории: республиканец и демократ, мы обнаружим, что наши категории не являются исчерпывающими, так как некоторые избиратели считают себя независимыми либо членами других партий.
Для упрощения анализа мы, быть может, захотим заменить категории в схеме номинального измерения числами. Важно понимать, однако, что в данном контексте эти числа не имеют реального значения они всего лишь символы. Исходя из того, что мы решили заменить категорию республиканец цифрой 5, а категорию демократ цифрой 1, мы не можем считать, что у республиканцев в пять раз больше приверженцев, чем у демократов. Любая категория номинального измерения может быть заменена любым числом, при условии, что у каждой категории будет свой индивидуальный номер.
Порядковое измерение предоставляет больше информации, так как дает возможность не только категоризовать, но и упорядочивать, или ранжировать, явления. Порядковое измерение позволяет присваивать каждому объекту число, которое обозначает не только то, что данный объект отличен от одних объектов и сходен с другими с точки зрения измеряемой переменной, это число указывает также, как именно данный объект связан с другими в терминах количества того конкретного свойства, которым он характеризуется. Располагая порядковым измерением, мы можем сказать, какие объекты характеризуются большим (или меньшим) количеством измеряемого свойства по сравнению с какими-то другими объектами; мы можем также расположить объекты по порядку в зависимости от количества того свойства, которое их характеризует. Такое упорядочение дает более детальную и более точную информацию, чем номинальное измерение. Понятие социальный класс обычно измеряется на порядковом уровне: каждому человеку приписывается ранг низшего, среднего или высшего класса.
Интервальное измерение предоставляет еще больше информации. Мы можем не только классифицировать и упорядочивать объекты, после того как они измерены на [c.83] интервальном уровне, но и сказать, насколько большим или меньшим количеством измеряемого свойства по сравнению с другими объектами они характеризуются. Порядковое измерение не основано ни на какой стандартной для данной переменной единице и не позволяет установить, насколько далеко в терминах этой переменной отстоят друг от друга разные объекты. Оно лишь позволяет говорить, что у одних объектов данная переменная имеет большее или меньшее значение, чем у других. Интервальное измерение основано на представлении о существовании некоторой стандартной единицы измеряемого свойства.
В то время как порядковые измерения дают нам лишь огрубленное представление об отношении между объектами с точки зрения данной переменной, интервальные измерения предоставляют информацию о “расстоянии” между ними. Хороший пример такого рода переменная доход. Доход обычно измеряется в денежных единицах (в Соединенных Штатах это доллары и центы). Поскольку при измерении используются стандартные единицы, мы можем утверждать, что между 10000 и 11000 долларов годового дохода разница абсолютно та же, что и между 50000 и 51000 долларов. Мы не в состоянии сделать этого с помощью порядкового измерения. Если измерять доход с помощью порядкового измерения, разделяя людей по их доходу на такие категории, как доход ниже 5000 долларов и доход от 5000 до 9999 долларов, мы сможем сказать, что у одного человека доход выше или ниже, чем у другого, однако мы не сможем сказать точно, насколько эти люди различаются по своим доходам, так как не знаем, где именно находится человек внутри своей категории. Различие в доходе между человеком из категории 1 (до 5000 долларов) и человеком из категории 2 (от 5000 до 9999 долларов) может составлять всего лишь один доллар (5 000 долларов минус 4 999 долларов), а может доходить до 9999 долларов (9999 долларов минус 0 долларов) в зависимости от точной цифры их доходов, однако мы не можем увидать этой разницы, исходя из порядкового измерения.
Помимо того что интервальное измерение дает нам точную информацию об абсолютных различиях между объектами, мы также получаем возможность делать [c.84] точные утверждения об относительных различиях между понятиями. Мы, например, можем согласиться с тем, что население 50000 человек это в два раза больше, чем население 25000 человек, потому что ведь есть такие места, где вообще никто не живет: в истинных интервальных измерениях существует нулевая точка, и по крайней мере теоретически возможно существование объектов, имеющих на таких шкалах нулевую отметку. Так как на порядковой шкале не существует осмысленной нулевой точки, мы не можем говорить, например, что люди высшего класса имеют в два раза большее количество “класса”, чем люди низшего класса, мы не знаем, что означает “не иметь никакого классового статуса”.
На основании всего этого следует сделать одно важное замечание относительно уровня измерения. Когда речь идет о сравнении явлений, измерения номинального уровня наименее полезный тип измерения. Если мы используем его в ситуации, когда возможно использовать “более высокий” (более точный) уровень измерения, мы можем потерять потенциально ценную информацию. Если при изучении поведения на выборах мы приводим классификацию людей на республиканцев, независимых и демократов, в то время как можно задать другой набор вопросов и осуществить их ранговое упорядочение с учетом [c.85] перехода от более сильной к более слабой партийной идентификации, мы, возможно, отказываемся от информации, которая поможет нам понять наблюдаемые отношения. Измерение порядкового уровня полезнее, чем измерение номинального уровня, но у него также есть свои ограничения. Интервальное измерение наиболее желательная форма измерения как в силу того, что оно дает наиболее детальную информацию, так и потому, что оно позволяет осуществлять математическую обработку имеющихся данных. (Подробнее об этом будет говориться в гл. 14,15 и 16.)
Наша задача состоит в том, чтобы там, где это возможно и удобно, стремиться к операционализациям, позволяющим осуществлять измерение интервального уровня. Однако каким образом мы выбираем уровень измерения, подходящий для конкретных понятий, операционализацией которых мы занимаемся? Это проблема как концептуализации, так и технологии измерения.
В процессе исследования на этапе построения теории мы должны прежде всего спросить себя, лежит ли в основе различий, наблюдаемых в отдельных случаях, некий континуум. Если да, то мы можем предложить для данного понятия порядковое или даже интервальное измерение, в противном случае в качестве измерения может выступать лишь номинальная классификация. Поясним важность этого на примере.
Предположим, мы изучаем зависимость между национальностью иммигрантов и степенью поддержки ими политического механизма большого города США начала XX века. Если мы осуществляем операционализацию национальности на номинальном уровне и категоризуем поддержку политического механизма в городских избирательных округах, мы, возможно, получим картину, подобную той, что изображена на рис.3.2а.
Рис. 3.2. Пример воздействия уровня измерения на интерпретацию данных
Здесь не видно никакой отчетливой связи между национальностью и поведением на выборах, так как знание о том, какая национальность преобладает в данном округе, не позволяет ранжировать его относительно других округов. Однако если мы проанализируем ход наших рассуждений, то сможем понять, что наши ожидания относительно связи национальности с поддержкой политического механизма имеют определенные основания: соответствующие страны [c.86] происхождения различны с точки зрения возможности участия в политической жизни, которое они предоставляют своим гражданам. Мы можем сделать вывод, что те, кто имеет небольшой опыт существования в условиях демократии, будут с готовностью передавать свое право на самоуправление политическим лидерам. Если исходить из этого и упорядочить страны в соответствии допускаемой ими степенью участия своих граждан в политике, мы можем построить график, подобный тому, что изображен на рис.3.2б. На этом графике отчетливо видна взаимосвязь национальности с поддержкой политического механизма. Упорядочение категорий по независимой переменной помогает выявить систему в ее отношениях с зависимой переменной.
Рис. 3.2. Пример воздействия уровня измерения на интерпретацию данных
Если у нас хватит смелости, мы можем даже повысить уровень измерения независимой переменной до интервального. Мы, например, могли бы подсчитать количество постановлений, касающихся участия в политической жизни, в законодательствах соответствующих стран на протяжении нескольких лет, непосредственно предшествующих началу широкой иммиграции в США. Полученные цифры можно использовать для ранжирования национальностей на интервальной шкале и осуществить даже более точное сравнение независимой и зависимой переменных.
Сможем ли мы осуществить такое повышение ранга переменных, чтобы перейти от номинального уровня измерения к порядковому или интервальному, зависит как от разработки теоретического обоснования такого перехода, так и от наличия технических возможностей применения операционных процедур, осуществляющих измерения более высокого уровня. Даже если мы сможем в нашем примере выразить понятие национальности в терминах интервального уровня, мы, возможно, не получим в свое распоряжение законодательные акты, необходимые для расположения стран на интервальной шкале. В этом случае наши возможности по получению измерений более высокого уровня ограничивает измерительная техника. Примеры такого рода достаточно многочисленны. Например, при исследовании взаимосвязи между полом и политическим поведением у нас будет возможность утверждать, что мужские черты характера это свойство, [c.87] которым люди обладают в разной степени (те, кто обладает им в наименьшей степени, женщины). Если мы можем выступить с набором вопросов для выяснения того, насколько люди обладают этим свойством (если вообще обладают), мы в принципе можем упорядочить людей на порядковой или интервальной шкале “мужественности”. Однако если мы не располагаем денежными средствами для проведения исследования, в ходе которого люди ответят на эти вопросы, нам придется рассчитывать на номинальную классификацию мужчина/женщина, сведения о которой мы находим в списках членов партии.
Эти ситуационные факты затрудняют установление правил того, как операционализировать понятия с целью достичь определенных уровней измерения. Однако мы полагаем, что можно следовать правилу операционализации У.Ф.Шайвли3. Он советует использовать максимально точные для данного объекта измерения и не терять информацию за счет неточного измерения. Это обычно означает применение более строгих процедур измерения, которые там, где это возможно, осуществляли бы измерение более высоких уровней. Не довольствуйтесь операционализацией, дающей номинальное измерение, когда теоретически оправданно и технически возможно порядковое или интервальное измерение.
Сделав данные замечания, мы должны сказать о некоторых исключениях из основного правила. Существуют случаи, когда слишком большая точность измерения на самом деле нежелательна. Один пример такого рода приводит Шайвли. Из его работы заимствован (с некоторыми изменениями) рис.3.3. На рисунке двумя разными способами изображена зависимость между возрастом и голосованием на президентских выборах 1968 г. На рис.3.3а возраст измеряется в годах. Поскольку в каждой возрастной группе (например, 2122 года, 3536 лет, 50 51 год) оказывается немного людей, на диаграмме не выявляется никакой отчетливой структуры отношений между двумя переменными. На рис.3.3б возраст измеряется менее точно в пятилетиях. Наличие в каждой группе большого числа объектов позволяет увидеть явную структуру отношений: вероятность голосования повышается до 50-летнего возраста, а затем, вообще говоря, снижается. [c.88]
Рис. 3.3. Пример воздействия на интерпретацию группировки данных (взят из кн.: Shively W.Ph. The Craft of Political Research, 2nd ed. Englewood Cliffs (N.J.): Prentice-Hall, 1980, p. 67-68). [c.89]
Пожертвовав некоторой точностью измерения, мы получили выигрыш с точки зрения простоты анализа. Это удачная сделка, пока мы не зашли столь далеко по пути уменьшения точности, чтобы вновь потерять из виду изучаемые соотношения. Если мы используем для измерения возраста 20-летний интервал, мы не увидим больших количественных различий между возрастными группами голосующих и сможем прийти к выводу, что возраст не связан с вероятностью голосования. Поскольку заранее до реального анализа данных мы, как правило, не знаем, какая точность окажется необходимой для выявления соотношений, мы должны следовать правилу, в соответствии с которым осуществляется по возможности максимально точная операционализация понятий. Мы всегда сумеем отказаться от ненужной точности путем “сжатия категорий” (перехода к более крупным различительным единицам), если сочтем это нужным. Однако если не собрать информацию в самом начале, мы не сможем обратиться к ней в дальнейшем. [c.90]
РАБОЧАЯ ГИПОТЕЗА
Измерение приписывает объектам значения в соответствии с данными переменными. Именно эти значения используются для представления понятий при сравнении наших наблюдений. Прежде чем понять, какие выводы в отношении теории следуют из наших наблюдений, мы должны представить гипотезы, касающиеся отношений между переменными в виде рабочих гипотез, которые устанавливают ожидаемые отношения между измерениями или показателями. Предпоследняя строчка на рис.3.1 предлагает форму, в которой выступают рабочие гипотезы. Эти гипотезы требуют от нас установления связи между показателями и переменными, которые, по нашему мнению, следуют из осуществленной операционализации.
Рассмотрим пример из области международных отношений. Предположим, нас интересует теория доминации в сфере международной жизни. Исходя из теоретического допущения: “Чем более сильное влияние испытывает государство, тем более конформистскую политику оно проводит”, мы можем выдвинуть следующую гипотезу: “Когда возрастает экономическая зависимость государства, [c.90] возрастает и степень поддержки, оказываемой им государству-покровителю”. Мы можем операционализировать экономическую зависимость как процент экспортной продукции, идущей государству-покровителю. Процент экспорта становится в нашем случае независимой переменной зависимость. Поддержка может измеряться процентом голосований в Генеральной Ассамблее ООН, в которых зависимое государство голосует иначе, чем государство-покровитель. Процент голосований в ООН становится в нашем случае показателем зависимой переменной поддержка политики государства-покровителя. Теперь мы можем сформулировать рабочую гипотезу, утверждающую наличие между показателями отрицательного отношения: когда процент продукции, экспортируемой государству-покровителю, возрастает, процент голосований в ООН, не согласующихся с позиций государства-покровителя, уменьшается.
Эта рабочая гипотеза сообщает о том, какие наблюдения согласуются с нашей гипотезой и нашей теорией. Она также предлагает возможные отношения между переменными и показателями, которые у нас имеются. Это отношение изображено на рис.3.4.
Рис. 3.4. Уточнение отношений между понятиями, переменными и показателями
Рисунок демонстрирует, насколько важно было додумать до конца соотношение между измерениями и переменными. Отношение, предсказанное утверждением и гипотезой, является положительным. А рабочая гипотеза [c.91] предсказывает отрицательное отношение. Это объясняется тем, что отношение между зависимой переменной и ее показателем является отрицательным. В свою очередь это означает, что вследствие того, как мы провели операционализацию зависимой переменной, именно отрицательное отношение между показателями предоставляет данные в поддержку гипотезы и теоретического утверждения, которое предсказывает положительные отношения между понятиями и переменными. Мы должны осознавать это, если хотим избежать неправильной интерпретации данных и сделать на основании наблюдений правильные выводы относительно полезности нашей теории.
Установление отношений между показателями, переменными и понятиями, которые они представляют, настолько важно, что некоторые исследователи в области социальных наук требуют создания наряду с теориями, касающимися политических феноменов, теории измерений, которая бы объясняла наши представления относительно связей между показателями и понятиями4. Что заставляет нас связывать экономическую зависимость с возрастанием экспорта? Какие особенности в распределении экспорта позволяют ему выступать в качестве отражения того, что мы имеем в виду, говоря о зависимости? На такого рода вопросы помогает ответить хорошо разработанная теория измерений. Положения теории измерений объясняют, почему показатели должны менять значения при изменении степени соответствия реальных объектов понятиям.
Показатели выбираются не случайным образом, а в результате тщательного продумывания связей между объектами реального мира. Сходные процессы осуществляются и при разработке теорий, касающихся политических феноменов: выводы, к которым мы приходим, могут оказаться неправильными, свойства, которые мы имеем в виду, используя некоторые понятия, могут на самом деле оказаться не связанными с показателями, которые мы решили использовать в качестве эмпирических мер этого понятия.
Вернемся к примеру с исследованием, которое должно определить, мешают ли безалкогольные напитки академической успеваемости. Мы решили измерять употребление безалкогольных напитков, просто задавая [c.92] студентам вопрос, сколько газированной воды они выпивают за некоторый период времени, предполагая, что они скажут правду и что те, кто выпивает больше, получат более высокое значение нашего показателя, чем те, кто выпивает меньше. Предположим, однако, что ответы студентов на наши вопросы полностью определяются тем, догадались ли они о цели исследования и хотят ли они обмануть университетское начальство в отношении количества потребляемых ими безалкогольных напитков. При таком повороте дел предполагаемая связь между переменной и показателем не будет зафиксирована и мы не сможем, опираясь на наши исследования, сделать на законных основаниях какие-либо выводы о результатах воздействия безалкогольных напитков, если только мы не предложим какое-либо альтернативное измерение.
Обсуждаемая спорная проблема существует ли какая-либо связь между нашим понятием и переменными, с одной стороны, и нашим индикатором или критерием с другой, стала основной для вопроса о выработке критериев в науке. Вопрос, действительно ли изменения в наших индикаторах есть результат изменений в понятии, которое они представляют, тесно связан с проблемами надежности и достоверности, которые мы обсудим в последующих разделах настоящей главы. Важным моментом здесь является то, что идея теории измерений поможет найти подходы к этим проблемам в нашем исследовании.
Любая операционализация понятия это, в сущности, гипотеза. Когда мы проводим операционализацию и говорим: “Пусть данное понятие обозначается таким-то показателем”, мы выдвигаем гипотезу, что объекты, которые мы имеем в виду, используя данное понятие, действительно отражаются в выбранном показателе. Эта гипотеза может подтверждаться, а может и не подтверждаться наблюдениями. Мы не имеем права просто доверять адекватности наших измерений, мы должны проследить за проведенными наблюдениями, чтобы найти факты, подтверждающие, что измерения действительно отражают то, что мы имеем в виду под понятиями. Поиск валидных и надежных процедур измерения в социальных науках это во многом процесс проверки гипотез. Нужно быть готовым признать ошибки и начать все сначала, если факты говорят о том, что введенные показатели не отражают [c.93] наши понятия. Проверка измерений происходит в первую очередь при попытках оценить валидность и надежность выбираемых показателей. [c.94]
ОШИБКА ИЗМЕРЕНИЯ
В результате измерения разным объектам приписываются различные значения на основе оценок, заданных нашими показателями. Дифференциация в оценках может возникать за счет двух основных источников. Первый источник это величина реального проявления у объектов определенной степени или аспекта интересующего нас свойства. Разные оценки возникают тогда, когда наши измерения действительно улавливают эту дифференциацию. В этом случае измерения отражают реальные различия между понятиями. Другой источник дифференциации значений та величина, которая относится к самому измерению или к условиям его осуществления, что предопределяет наличие разных значений у разных объектов. В этой ситуации наши измерения не демонстрируют реальных различий между объектами, т. е. таких, которые отражают подлинную дифференциацию понятий, которые мы хотим измерять. Наблюдаемые нами в этом случае различия возникают из-за погрешностей в процедуре измерения.
Если бы наши измерения были совершенны, они бы демонстрировали только различия первого рода. Однако наши измерения крайне редко (если вообще когда-либо) бывают безупречными. Дифференциация значений, приписываемых разным объектам, неизбежно отражает не только реальные различия в степени проявления некоторого понятия, но и “искусственные” различия, обусловленные процессом измерения. Любая дифференциация значений, приписанных реальным объектам, обусловленная чем бы то ни было, кроме действительных различий, относится к ошибкам измерения. Они представляют собой не действительные различия между объектами, а различия, зарегистрированные ошибочно, из-за недочетов процесса измерения.
Грань между истинными вариациями оценок и вариациями, обусловленными ошибкой измерения, подобна различиям между объектами, фиксируемыми невооруженным глазом, и различиями, отмечаемыми лишь при [c.94] разглядывании их отражения в зеркале. В той степени, в какой зеркало искажает образы, оно либо скрадывает различия, которые можно было бы увидеть невооруженным глазом, либо создает впечатление существования различий, которые мы в других условиях не заметили бы. В социальных науках у нас крайне редко появляется возможность наблюдать ключевые понятия непосредственно, и мы вынуждены полагаться на отражение этих понятий с помощью измерительных процедур, аналогичных зеркалу. Соответственно, правильность наших представлений зависит от точности, с которой наши измерения отражают действительность.
Каковы хотя бы некоторые из источников искажения образов, обусловленных нашими измерениями? Необходимо знать ответ на этот вопрос, если хотим контролировать ошибки измерения или распознавать их, когда они присутствуют в наших данных. Мы можем перечислить несколько основных источников ошибок измерения, установив наиболее частые источники различий в оценках, относимых к другим, неистинным различиям в характеристиках, которые мы хотим измерить5.
1. Различия в распределении между объектами других, относительно постоянных характеристик, которые были непреднамеренно выявлены нашими измерениями. Например, для понимания вопросов, предназначенных для измерения политической идеологии, и ответа на них может понадобиться определенный уровень интеллекта. Если это так, ответы на вопросы будут отражать не только политико-идеологические, но и интеллектуальные различия между людьми. В окончательном результате влияние интеллекта и влияние политической идеологии будут перемешаны, и мы не сможем определить различия в оценках, обусловленные идеологическими факторами, и отличить их от различий, обусловленных интеллектуальными факторами. Аналогичным образом другие характеристики наших единиц анализа (такие, как региональное расположение городов, культурные особенности нации или источники документов) могут случайно отразиться в наших измерениях и исказить наше восприятие рассматриваемых понятий. Там, где эти “возмущающие” воздействия можно выявить и измерить, необходимо посмотреть, что произойдет, если поддерживать их значения на постоянном [c.95] уровне: исчезнут, уменьшатся или увеличатся различия в оценках, которые получают объекты по нашим измерениям6.
2. Различия в распределении между объектами временных характеристик, которые отражаются в наших измерениях. Характер ответов на вопросы анкеты может определяться настроением или состоянием здоровья отвечающего. Недавние события в политической жизни города (например, раскрытие случаев коррупции среди должностных лиц) могут создавать временные, но систематические различия в том, как жители этих городов отвечают на вопросы исследования. Большое стихийное бедствие может произвести коренные и вместе с тем временные изменения в статистических данных, на которые мы опираемся при выяснении уровня экономического развития. Обнаруживать и контролировать воздействие таких временных “аномалий” труднее, чем воздействие постоянных характеристик объектов. Единственный способ уберечься от воздействий такого рода это внимательно относиться к сигналам, предупреждающим о том, что отдельные объекты находятся под влиянием таких преходящих факторов (например, изучать недавние события в политической жизни городов, входящих в нашу выборку, или советовать интервьюерам не проводить интервью с человеком, который в данный момент тяжело болен), и выполнять процедуры, предназначенные для проверки надежности измерений (такие процедуры описываются в разделе данной главы, посвященном надежности).
3. Различия, проявляющиеся при интерпретации измерительного инструмента разными людьми. Это проблема возникает лишь в том случае, когда люди прямо отвечают на вопросы, а не тогда, когда исследователь осуществляет измерения, наблюдая за поведением. Если вопросы сформулированы неоднозначно, то и респонденты дадут им разные интерпретации, которые могут привести к различиям в оценках по измерениям, составленным на основании этих вопросов. Предположим, например, что, изучая поведение на выборах, мы несколько легкомысленно задали вопрос: “Вы принимали участие в последних выборах?” Если кто-либо из интервьюируемых не знает, что на прошлой неделе проводились муниципальные выборы, он может ответить да, так как думает, что вопрос относится к [c.96] последним общенациональным выборам, хотя он и не принимал участия в выборах, которые подразумевались в наших вопросах. Обезопасить себя от этих непредвиденных различий в оценках наших измерений можно с помощью предварительных вопросов (см. гл. 6) и проверки измерений на надежность.
4. Различия в условиях проведения измерения. Этот источник ошибок измерения также находится главным образом в исследованиях, результаты которых измеряются с помощью ответов на вопросы. Например, в ходе выборочного исследования надежно установлено, что на характер ответов могут оказывать влияние раса, пол и возраст интервьюера. Ответы (а следовательно, и оценки на шкалах) могут варьироваться от интервью к интервью в зависимости от характеристик самого интервьюера. Сходные проблемы могут возникнуть не только в ходе выборочного исследования. Например, мы можем ошибочно осуществить контент-анализ передачи последних известий, предназначенных для внутреннего вещания, и передачи последних известий, предназначенных для зарубежного вещания. Мы в таком случае будем применять один и тот же инструмент в совершенно разных условиях и на основе одного этого факта вправе ожидать появления различий в оценках. Избежать ошибки измерения такого рода можно одним способом прилагать все усилия к тому, чтобы ситуации, в которых осуществляются измерения, были стандартизованы.
5. Различия в процессе применения измерительных инструментов. Приписываемые объектам оценки могут различаться в результате разнообразных ошибок, возникающих при сборе и записи информации. Интервьюеры могут неверно понять инструкции и задавать вопросы не так, как предполагал исследователь. Плохое освещение может оказаться причиной того, что респондент неправильно отметит пункты анкеты. В самый ответственный момент карандаш может сломаться, а в авторучке кончиться чернила, так что наблюдатели не сумеют зафиксировать ключевые для группового взаимодействия события. Из-за усталости кодировщик может изменить или проигнорировать инструкции по кодированию единиц в контент-анализе. Все эти типы отклонений в процессе применения измерительных инструментов приводят к [c.97] различиям в оценках вне зависимости от каких бы то ни было различий в реальных значениях исследуемой переменной. Основной способ борьбы с ошибками измерения (помимо привлечения к работе надежных ассистентов) предварительная проверка инструментов измерения. Пробный прогон поможет вскрыть потенциальные “технические” проблемы, возникающие при применении данного инструмента (такие, как недостаток места в кодовой форме для записи типовых ответов), и человеческие факторы, которые могут сказаться на результатах (например, время, в течение которого наблюдатели могут работать не утомляясь).
6. Различия в обработке и анализе данных. Прежде чем информация может быть проанализирована, она должна подвергнуться тщательной обработке. Часто информация по нескольку раз меняет форму. Например, интервьюеры могут зафиксировать ответы на вопрос, записав каждое слово, сказанное интервьюируемым. Впоследствии, при кодировке ответов, эти письменные фрагменты могут сокращаться, превращаясь в одну-единственную цифру. Эта цифра может быть зафиксирована в битах магнитного диска или магнитной ленты. На каждом из этих этапов анализ данных становится все проще, однако с каждым следующим этапом увеличивается возможность ошибок, в результате которых объекты начинают различаться по некоторой переменной, в то время как на самом деле они не различаются. Возможность таких ошибок приводит к необходимости дважды и трижды проверять данные при каждом преобразовании и сохранять исходную форму для последующей проверки.
7. Различия в характере реакции индивидуумов на форму измерительных инструментов. Эта проблема приобретает важное значение тогда, когда объектами анализа являются люди. Измерительные инструменты могут выступать в самых разнообразных формах это и устные интервью, и анкеты, которые должен заполнить опрашиваемый, и наблюдение подготовленного исследователя. Различные формы предъявляют к людям объектам исследования разные требования. Интервью, к примеру, требует умения свободно говорить, анкета читать и писать. Если люди различаются с точки зрения этих способностей, их оценки могут различаться даже тогда, когда люди [c.98] в действительности сходны по той переменной, которая операционализируется. Лучший способ избежать ошибок измерения такого типа использовать более чем одну форму измерения для операционализации каждого понятия. Мы еще поговорим об этом в разделе данной главы, посвященном валидности.
Все эти факторы могут привести к проникновению в исследование ошибки измерения. Различные ошибки, происходящие из семи перечисленных источников, обычно подразделяются на систематические и случайные. Систематические ошибки это ошибки, которые возникают из-за путаницы переменных в реальном мире (см. п. 1) или из-за особенностей самого инструмента. Они появляются каждый раз, когда используется данный инструмент, и постоянно сопутствуют объектам и исследованиям, в которых используется одно и то же измерение. Постоянные ошибки делают наши результаты невалидными в том смысле, что различия (или сходства), которые, как представляется, выявляют наши измерения, не есть точные отражения различий, которые мы, по нашему мнению, измеряем. Случайные ошибки проявляются по-разному и обусловлены преходящими характеристиками объектов, ситуационными различиями в применении инструмента, ошибками в проведении измерения и обработке данных и другими факторами. Они делают наши измерения невалидными почти так же, как и систематические ошибки. Кроме того, случайные ошибки делают наши измерения ненадежными в том смысле, что проявление случайных ошибок не дает возможности постоянно получать одни и те же результаты при использовании одного и того же измерения.
Как же избежать столь разрушительного воздействия на наши результаты ошибок измерения, которое превращает наше исследование в бесполезное или ошибочное? Чтобы ответить на этот вопрос, необходимо внимательно обсудить проблемы валидности и надежности. [c.99]
ВАЛИДНОСТЬ
Мы не так уж часто имеем возможность непосредственно измерить понятия, используемые в социологических теориях. Такие понятия, как власть, демократия и представительство, не так просто представить количественно, [c.99] как понятия типа длины и веса. Нам приходится пользоваться показателями, лишь косвенно соответствующими понятиям, которые они представляют. А в таком случае всегда существует опасность, что выбранные показатели будут неадекватно отражать понятия, которые мы хотим с их помощью измерять. Для обозначения степени соответствия измерений понятиям, которые эти измерения должны отражать, используется термин валидность. Интересоваться валидностью измерения то же самое, что интересоваться, действительно ли с помощью данного измерения мы измеряем то, что предполагали измерять. Обеспечение валидности часто считается основной проблемой, связанной с измерением в социальных науках.
Чтобы быть валидным, измерение должно быть исчерпывающим и полным. Если, например, мы сравниваем качество коммунальных служб в разных городах, у нас может возникнуть искушение считать показателем качества системы образования количество преподавателей в школах. Это неуместное измерение, поскольку количество работающих в системе школьного образования в значительной степени определяется количеством учащихся и размерами города и может иметь мало общего с качеством образования. Если за показатель качества системы образования принять отношение количества учащихся к количеству учителей, мы получим более уместное измерение, так что различия, вызванные размерами города, уменьшатся или вообще исчезнут. Тем не менее измерение все еще останется недостаточным. Образование это не только преподаватели. Образование это также школьные задания, фильмы, книги, учебные пособия и множество других факторов. Рассмотрение каждого из этих факторов в отрыве от остальных может создать неверное впечатление о качестве системы образования. Система школьного образования может иметь в высшей степени благоприятное соотношение учащихся и преподавателей, однако недостаточное количество средств обучения и учебных материалов. Было бы ошибкой утверждать, что эта система школьного образования не отличается от системы с таким же соотношением учащихся и преподавателей и прекрасными средствами обучения и учебными материалами. Если мы стремимся к валидности, мы должны [c.100] попытаться выбрать такие измерения, которые были бы и уместными и полными.
В этой ситуации возникает два вопроса: как осуществить исчерпывающие, полные и уместные измерения и как убедиться в том, что нам удалось это сделать.
Ответ на первый вопрос начинается с процесса операционализации. Мы можем определить валидность как степень, в которой различия оценок измерения отражают только различия в распределении значений переменной, которую мы собираемся измерять. Так как мы, вероятно, никогда не сможем достичь полной и всеобщей валидности, наша цель должна заключаться в выборе измерений, которые были бы минимально чувствительны к воздействию всех иных различий, кроме различий, обусловленных интересующей нас переменной. Для этого необходимо внимательно рассмотреть все процессы, связанные с нашими измерениями, для обнаружения возможных причин различий в оценках. На этом этапе мы должны быть особенно внимательны, чтобы застраховаться от влияния систематических ошибок.
Рассмотрим такой пример. Возможно, нам понадобится измерить, в какой степени граждане разных государств согласны с политикой своих правительств. Мы решаем использовать в качестве показателя согласия или несогласия ответы на ряд специально подготовленных вопросов. Мы считаем, что единственным источником различий в ответах на вопросы являются различия мнений. Однако минутное размышление наводит на мысль о другом возможном источнике вариаций. Если среди исследуемых нами государств есть государства с авторитарным правительством, прибегающим к услугам секретной полиции для подавления инакомыслия и рассматривающим любую критику своей политики как акт государственной измены, граждане этих государств, вполне возможно, побоятся высказывать в интервью несогласие со своим правительством. В этом случае оценки, полученные для нашего измерения, могут по крайней мере в той же степени определяться отношением правительства данного государства к несогласным, в какой мнением интервьюируемых, Поскольку вероятность ошибки измерения такого рода очень высока, подготовленные вопросы оказываются неподходящей операционализацией. [c.101]
Сходным образом в самом начале процесса исследования мы должны позаботиться о полноте. Если мы хотим измерить относительное влияние различных групп интересов в законодательном собрании штата, можно подумать об использовании в качестве показателя газетных сообщений о выступлениях этих групп перед законодательными комиссиями. Однако следует спросить себя, сводится ли политическое влияние к произнесению клятвенных заверений на публичных заседаниях. Эта деятельность законно считается частью процесса влияния, однако существует так много других средств оказания влияния, что измерение, опирающееся исключительно на произнесение заверений как показатель влияния, оказывается неполным.
Таким образом, получение уместных и относительно полных операционализаций зависит как от хорошего знания объекта нашего исследования, так и от осуществления тщательного логического анализа альтернативных операционализаций. Однако проверить валидность наших измерений для определения того, хороши ли они, можно лишь после того, как собраны данные. Процесс оценки валидности измерений называется валидизацией.
Имеется четыре основных подхода к валидизации. Первый часто называется прагматической валидизацией, поскольку валидность измерения оценивается на основе данных о том, насколько хорошо оно позволяет предсказывать поступки и события. Например, мы разрабатываем измерение для определения пригодности кандидатов на общественную должность, с точки зрения избирателей. Некоторый показатель валидности этого измерения можно получить, применив его ко всем кандидатам в сенат США в данном избирательном году и предсказав их шансы быть выбранными на основе сравнительных оценок по шкале привлекательности для избирателей. Чем более успешно мы предскажем результаты выборов для всех кандидатов, тем сильнее наша уверенность в валидности измерения, в том, что оно точно отражает понятие, которое мы имеем в виду. Принято говорить, что измерения, позволяющие предсказать будущие события, обладают прогностической валидностью,
Прагматическая валидизация требует наличия у переменных некоторого альтернативного показателя, [c.102] который, по нашему убеждению, является их валидным отражением. Мы проверяем наши измерения по этому альтернативному показателю, как могли бы проверять точность сообщения о возрасте по свидетельству о рождении. К сожалению, для понятий, используемых в социологических исследованиях, редко встречаются явно валидные альтернативные показатели. В итоге нам обычно приходится рассчитывать на валидизацию второго типа конструктную валидизацию.
Конструктную валидизацию осуществляют, выводя валидность измерения из данных о степени соответствия реальных соотношений между оценками по различным измерениям ожиданий, следующих из теории, предписывающей нам использовать данный показатель. При этом рассуждение ведется по двум направлениям.
Прежде всего, мы должны сказать себе: “Если понятие Х положительно связано с понятием Y и отрицательно с понятием Z (как и предсказывает наша теория), верно будет также и то, что оценки понятия Х в валидном измерении будут положительно связаны с оценками понятия Y в валидном измерении и отрицательно с оценками понятия Z в валидном измерении”. Мы не можем валидизировать измерение, сравнивая оценки в этом измерении с оценками той же переменной в другом измерении, которое, как мы знаем, является валидным (как в случае свидетельства о рождении). Однако мы можем судить о его валидности по тому, в какой степени использование данного измерения в качестве показателя переменной создает те же типы отношений между данной переменной и другими переменными, которые мы ожидаем в соответствии с нашей теорией.
В качестве примера возьмем изучение международных сообществ. Мы могли бы построить измерение надежности такого союза на основе контент-анализа газетных публикаций соответствующих стран. Является ли валидным показателем надежности сообщества двух стран то. что газеты данного государства пишут о другом государстве? Мы могли бы ответить на этот вопрос, рассуждая следующим образом: “В соответствии с нашей теорией, чем надежнее сообщество государств, тем чаще они будут одинаково голосовать в ООН и тем меньше ограничений на взаимную торговлю они будут накладывать. Поэтому оценки [c.103] надежности сообщества в валидном измерении будут положительно связаны с оценками в измерениях одинакового голосования в ООН и отрицательно связаны с оценками в измерениях количества торговых ограничений. Затем мы переходим к анализу данных, необходимому для установления того, подтверждается ли это ожидание нашими наблюдениями. Если соотношения окажутся такими, как ожидалось, наша уверенность в валидности измерения надежности сообщества будет выше. Если соотношения будут иными, чем мы ожидали, мы зададимся вопросом, надежным ли измерением для этого понятия мы располагаем”.
То, что мы только что описали, часто называют внешней валидизацией При этом осуществляется сравнение оценок в измерении, подвергающемся валидизации, с оценками в измерениях для других переменных. Разумеется, для использования этого метода валидизации нам придется включить в наше исследование измерения других переменных. Это означает, что нем следует обдумывать способы валидизации наших измерений уже на ранних этапах процесса исследования. Безусловно, к тому моменту, когда мы будем готовы разрабатывать план исследования, мы должны знать, как будет проверяться валидность наших измерений, для того чтобы наверняка собрать всю необходимую информацию.
Попытки внешней валидизации дадут убедительные доказательства валидности нашего измерения для одной переменной лишь в том случае, если мы будем убеждены в валидности измерений, используемых для остальных переменных. Так, в последнем примере мы не смогли бы сделать никаких выводов относительно валидности измерения надежности сообщества на основе соотношений оценок в данном измерении и оценок двух других переменных, если бы мы не считали показатели одинакового голосования и торговых ограничений валидными. Поскольку часто бывает трудно обнаружить безусловно валидные показатели для переменных, с которыми должна быть связана ключевая переменная, процедуры внешней валидизации следует применять с осторожностью. Все это очень напоминает процедуру проверки гипотезы. Никакой отдельно взятый результат не гарантирует валидности (или невалидности) измерения. Скорее, по мере накопления случаев успешной валидизации наша уверенность [c.104] в валидности измерения возрастает. По этой причине для использования во внешней валидизации разумно искать как можно больше предсказанных теорией отношений. Чем больше имеется в нашем распоряжении разных способов проверки валидности, тем надежнее наш результат.
Та же самая логика рассуждений применима ко второму типу конструктной валидизации внутренней, или конвергентной, валидизции. Этот тип валидизации включает разработку нескольких измерений для одной и той же переменной и сравнение между собой этих разных измерений. Мы считаем, что, если каждый из показателей дает для рассматриваемого понятия валидное измерение, оценки, получаемые конкретными объектами в этих измерениях, должны быть тесно связаны. Если и А, и В, и С являются валидными измерениями для Х, то оценки любого конкретного объекта в измерениях А, В и С должны быть очень близки.
Предположим, например, что мы хотим получить показатель для качества уличного освещения в окрестностях жилья в рамках изучения работы коммунальных служб. Мы могли бы использовать в качестве такого показателя оценку достаточности уличного освещения, по мнению жителей (выявляется с помощью выборочных интервью). Мы можем выборочно опросить живущих по соседству людей, насколько хорошо, по их мнению, освещена улица около их дома, и взять среднюю оценку за меру качества уличного освещения. Чтобы осуществить внутреннюю валидизацию, мы можем измерить качество уличного освещения также: 1) использовав световой счетчик для получения физической меры яркости и распределения освещения; 2) получив оценки освещенности, сделанные специально обученными наблюдателями; 3) попросив жителей сравнить освещение на улицах с освещением на фотографиях, изображающих улицы, освещенные в разной степени, и усреднив их оценки для получения значения освещенности окрестностей их домов. Таким образом, мы получаем четыре измерения переменной. Если каждое из них является валидным, все они должны быть тесно связаны. Можно проверить это с помощью соответствующих статистических расчетов. Если мы обнаружим, что оценки измерения, в основе которого лежат ответы на вопросы интервью, слабо связаны с оценками остальных трех измерений и что при этом оценки этих трех измерений тесно [c.105] связаны друг с другом, у нас будет основание подозревать, что первое измерение невалидно.
Это очень похоже на взвешивание одного и того же предмета на трех разных весах. Если каждые весы показывают точный вес и у нас нет оснований считать, что в ходе эксперимента вес объекта изменился, мы вправе ожидать, что все эти весы покажут один и тот же вес. Если еще одни весы показывают вес, отличный от данного, можно подозревать, что они не отрегулированы.
На рис.3.5 изображены различия между внутренней и внешней формами конструктной валидизации. Рис.3.5а показывает, что внутренняя валидизация осуществляется через проверку соответствия оценок нескольких разных измерений для одного и того же понятия. Чем точнее это соответствие, тем увереннее мы себя чувствуем, утверждая, что каждое измерение валидно. Рис. 3.5б демонстрирует, что для внешней валидизации требуется установить, как наше измерение одной переменной связано с другими переменными, согласно теоретическим представлениям. Если ожидаемое отношение не проявляется, мы вправе подозревать, что выбранный нами показатель не обеспечивает валидного измерения для понятия. (В гл.14 мы обсудим статистические расчеты, которые можно использовать для определения степени реальной связанности разных измерений.)
Рис. 3.5. Формы конструктной валидизации
Пользуясь внутренней валидизацией, необходимо соблюдать те же предосторожности, которые требуются при внешней валидизации. Мы не всегда можем быть уверены, что наши альтернативные измерения ключевого понятия валидны, и поэтому мы должны с осторожностью делать вывод о валидности или невалидности измерения [c.106] на основании любой проверки валидизации. Наша уверенность в результатах внутренней валидизации может существенно возрасти, если мы последуем простому правилу: альтернативные измерения понятия должны основываться на возможно большем числе различных операционализаций.
В примере с уличным освещением измерения имеют в качестве источника четыре разных типа операционализаций: словесные оценки жителей, физические измерения, оценки наблюдателей и отбор фотографий, произведенный жителями. Каждый из них представляет особый способ операционализации. Чем больше разных способов мы можем использовать и чем более они взаимонезависимы, тем больше мы можем доверять нашей валидизации. Почему? Логика рассуждения здесь такова. Основной источник невалидности это систематические и случайные ошибки измерения. Разные измерения подвержены ошибкам разных типов. Чем больше показателей для некоторой переменной у нас имеется и чем сильнее они отличаются друг от друга, тем менее вероятно, что во всех показателях проявится одна и та же ошибка измерения. А если это так, то у нас будет больше возможностей обнаружить ошибку измерения как источник различий в оценках в любом измерении и получить точное измерение для переменной в том случае, если мы будем использовать множественные показатели7.
Например, факторы, способные сделать непригодным физическое измерение качества уличного освещения (такие, как неисправный световой счетчик), по-видимому, совершенно не связаны ни с какими факторами, которые могли бы внести систематические ошибки в измерение, основанное на оценках жителей (такими, как характерная для людей тенденция считать, основываясь на чувстве местного патриотизма, что их коммунальные службы не хуже, чем в других местах). Если мы используем только один способ измерения, любой источник ошибок измерения может сказаться на оценках в каждом измерении, постоянно предоставляя нам негодный показатель и не давая возможности осуществлять значимые сравнения между измерениями. Если, например, мы опираемся только на физическое измерение освещенности, но снимаем показания несколькими разными способами (на [c.107] тротуаре, на краю тротуара и на мостовой), любой дефект измерительного инструмента (в данном случае светового счетчика) будет оказывать влияние на все измерения и ни одно нельзя будет использовать для проверки другого.
При таком подходе множественные показатели для переменных имеют очень большое значение. Наличие множественных измерений не только дает нам возможность проверить валидность наших показателей, но также в первую очередь увеличивает наши шансы получить валидное измерение переменных. Множественные измерения могут на самом деле повысить валидность измерения, позволяя скомбинировать результаты нескольких разных процедур для получения сложной оценки, которая скорее будет являться правильным отражением действительного значения переменной, чем каждое из измерений, взятое в отдельности. Такая сложная оценка с большей вероятностью будет представлять собой валидное измерение, так как не исключено, что при объединении результатов нескольких процедур измерения ошибки, приводящие к невалидности каждого измерения, нейтрализуются.
Здесь действует практически тот же принцип, что и при взвешивании предмета на многих разных весах. Поскольку весы несовершенны, каждый прибор может показать несколько иное значение веса чуть тяжелее или чуть легче. Однако если предмет взвешивается на нескольких весах, в соответствии с законами теории вероятности достаточно высока вероятность того, что эти небольшие ошибки нейтрализуют друг друга, давая средний вес, который является правильным. Сходным образом, если мы операционализируем понятия несколькими разными способами, так что ошибка измерения, связанная с каждой операционализацией, не зависит от ошибок, сопровождающих все остальные операционализации, мы получаем хорошие шансы обеспечить точное измерение понятия, комбинируя разные оценки. (В разделах гл.8, посвященных шкалированию и индексированию, будут описаны некоторые возможные методы комбинирования оценок для получения составного измерения.)
Третий способ валидизации называется дискриминантной валидизацией. Задавая вопрос, обладает ли измерение дискриминантной валидностью, мы интересуемся главным образом тем, возможно ли, используя данное [c.108] измерение в качестве показателя некоторого понятия, отличить это понятие от других. Например, если бы мы захотели измерять понятие доверия к политическим деятелям с помощью ряда вопросов обследования, а в нашей анкете есть ряд вопросов, предназначенных для измерения понятия доверия к людям (вообще), то, сравнивая оценки двух измерений, мы можем спросить себя, не отражает ли первый набор вопросов всего лишь иной способ измерения доверия к людям. Если оценки очень близки, мы скажем, что измерение политического доверия не обладает дискриминантной валидностью, поскольку не позволяет отличить понятие “доверие к политическим деятелям” от понятия “доверие к людям”. [c.109]
Наконец, последний способ валидизации опирается на понятие очевидной валидностн. Некоторые измерения основаны на столь прямом наблюдении за исследуемым поведением, что задавать вопрос об их валидности представляется неразумным: такое измерение кажется валидным “по внешнему виду”. Предположим, например, что мы хотим измерить степень соблюдения государственного закона, требующего наличия на входной двери каждой фирмы патента на соответствующую деятельность. По-видимому, обучив наблюдателей просто отмечать наличие или отсутствие таких патентов, мы получим явно валидное измерение выполнения закона. И хотя мы всегда должны спрашивать себя, являются ли выбранные нами измерения валидными по внешнему виду, как правило, мы совершали бы ошибку, если бы гарантировали точность результатов исследования, опираясь на одну лишь очевидную валидность. Мы должны попытаться удостоверить валидность наших измерений с помощью стандартных процедур типа тех, что описывались выше.
Основные свойства четырех рассмотренных типов валидизации представлены в табл. 3.1. Если мы хотим на основании наших исследований сделать правильные выводы, мы должны располагать валидными измерениями. Однако чтобы быть валидными, измерения должны быть также надежными. [c.110]
Таблица 3.1
Типы валидизации
Прагматическая валидизация |
Конструктная валидизация |
Дискриминантная валидизация |
Очевидная |
Сверить результаты, полученные путем использования показателя, с результатами, полученными путем использования другого показателя, признанного в качестве валидного измерения соответствующего понятия; или проверить прогностическую валидность показателя, использовав его для предсказания событий, отражающих измеряемое понятие. |
Внутренняя (конвергентная) валидизация: сделать вывод о валидности показателя на основании его соотношения с другими показателями для того же самого понятия, использующего множественные показатели. Внешняя валидизация: сделать вывод о валидности показателя на основании его соотношения с показателями для других понятий, с которыми измеряемое понятие теоретически должно быть связано. |
Сделать вывод о валидности показателя на основании степени несоответствия показателям для других понятий, теоретически отличных от измеряемого понятия. |
Признать валидность, исходя из непосредственной очевидности показателя. (Можно ли убедить людей, находящихся в курсе дела, что это валидный показатель для данного понятия?) |
НАДЕЖНОСТЬ
Когда мы говорим о валидности измерения, нас интересует, насколько точно значения, получаемые с помощью этого измерения, соответствуют истинным значениям измеряемой переменной. Когда мы говорим о надежности измерения, нас интересует устойчивость получаемых с его помощью значений. Можем ли мы, применяя измерение несколько раз, получить для любого данного объекта одно и то же значение или же в результате разных подходов одним и тем же объектам приписываются разные значения? Если при неоднократном применении некоторого измерения один и тот же объект не получает одного и того же значения, это измерение является ненадежным показателем соответствующего понятия. Чтобы гарантировать надежность линеек, их изготавливают из нерастяжимого материала. Если бы линейки изготовляли из растяжимых материалов, они вполне могли бы [c.110] показывать разную длину одного и того же объекта (даже в том случае, если его длина на самом деле не изменилась) просто потому, что линейка растягивается и сжимается.
Если измерение ненадежно, оно не может быть валидным, поскольку по крайней мере некоторые различия в оценках, приписанных объектам, обусловлены ошибками измерения, а не истинными различиями между объектами. Вспомним наш пример с исследованием уличного освещения. Что, если используемый нами световой счетчик окажется настолько чувствительным, что будет фиксировать не только свет от уличных фонарей, но и лунный свет? Тогда значения переменной качество уличного освещения для каждой улицы будут зависеть как от яркости уличных фонарей, так и от случайных факторов, таких, как фазы Луны и характера облачности. В той степени, в которой эти случайные факторы влияют на наши результаты, измерение оказывается невалидным отражением действительных различий в качестве уличного освещения. В этом случае ненадежность обусловливает невалидность.
Измерение может быть вполне надежным и все-таки невалидным. Вспомним приводившееся в качестве примера исследование того, в какой степени люди в разных государствах одобряют политику своего правительства. Мы говорили, что вопросы, задаваемые в ходе обследования, могут привести к невалидным измерениям, поскольку в авторитарных странах люди боятся говорить правду о том, что они думают. Так как данный фактор обусловливает скорее систематическую, чем случайную ошибку, вопросы могли бы давать весьма устойчивые результаты. Вне зависимости от того, сколько раз их спрашивают, люди могли бы отвечать одно и то же. Это, однако, не делает измерение валидным.
Таким образом, измерение может быть надежным, не будучи валидным, но не может быть валидным, не будучи надежным. В то время как валидность уязвима и со стороны систематической, и со стороны случайной ошибки, надежность подвергается опасности лишь со стороны последней. Это означает, что, если в предшествующих исследованиях измерение было убедительно валидизировано, мы можем использовать его, не беспокоясь о его надежности: [c.111] если измерение валидно, оно должно быть надежно. Однако, продемонстрировав надежность, мы не гарантируем валидность.
Как застраховаться от ненадежности? Как определить, надежно ли данное измерение? Чтобы предотвратить угрозу ненадежности, необходимо знать о различных источниках случайных ошибок измерения, описанных нами в данной главе, и делать все возможное для установления контроля над ними. Следует, в частности, продумывать реальный процесс измерения и проводить предварительное тестирование инструментов измерения для выявления ранее неизвестных причин случайных ошибок.
В социальных науках часто бывает довольно сложно определить, надежно ли предлагаемое нами измерение. Это происходит потому, что истинное значение переменных, с которыми мы имеем дело, может коренным образом изменяться с течением времени и под давлением обстоятельств: люди меняют свое мнение под влиянием опыта; государства начинают по-иному распределять ресурсы между социальными службами и ведомствами оборонного характера в ответ на возникновение военной угрозы и т. п. Когда реальные значения так или иначе изменяются, трудно бывает отличить результаты воздействия случайных ошибок измерения от действительных колебаний в рамках измеряемых понятий. Это означает, что тесты на надежность следует проводить через максимально короткие промежутки времени.
В социальных науках имеется три типа методов установления надежности измерений. Первый это метод неоднократного тестирования. В этом случае одно и то же измерение снова и снова применяется в отношении одного и того же набора объектов. Если объекты всякий раз получают одну и ту же оценку, измерение считается надежным. Трудности с данным методом возникают в том случае, когда измерение связано с интервьюированием людей (в отличие от измерения характеристик неодушевленных объектов или осуществления скрытого наблюдения за людьми). Если мы повторяем вопросы через короткий промежуток времени, интервьюируемые могут помнить данные ими ранее ответы и, стараясь быть последовательными, будут повторять эти ответы, вместо того чтобы правдиво отвечать на поставленный вопрос. Если возникает [c.112] такая ситуация, мы оказываемся не в состоянии правильно оценить надежность вопросов как показателя для данного понятия. Пытаясь избежать такого тест-эффекта, мы могли бы приступить к повторному опросу лишь по прошествии значительного промежутка времени. Однако в этом случае мы столкнемся с другой проблемой: с течением времени истинные значения переменной могли измениться, и мы можем оказаться не в состоянии отличить изменения в оценках, возникающие из-за ненадежности измерения, от действительных изменений переменной.
Указанная проблема привела к созданию другого теста на надежность метода альтернативной формы. В соответствии с этим методом в один и тот же момент разные формы измерения применяются к одной и той же группе объектов либо одно и то же измерение применяется к разным группам объектов. В этом случае тест-эффект невозможен, поскольку ни один объект не измеряется более одного раза, а так как измерения не отделены друг от друга никакими временными интервалами, на результатах измерений не могут сказаться реальные изменения исследуемых переменных. Однако успех этой стратегии зависит от того, насколько хорошо сопоставимы друг с другом альтернативные формы измерения как измерения данного понятия, и от того, действительно ли две группы эквивалентны с точки зрения дистрибуции измеряемой переменной. Если у нас есть основания полагать, что эти условия выполняются, то, чем более близки оценки по двум измерениям или по двум группам, тем более мы можем быть уверены в надежности измерения. Однако если в нашем распоряжении нет сравнимых измерений или групп, мы не можем использовать данный метод должным образом.
Наконец, последний способ тестирования надежности измерения известен под названием метода подвыборки. Этот метод заключается в том, что, сформировав выборку из объектов, мы делим ее на несколько подвыборок таким образом, чтобы все они были похожи друг на друга. Затем мы применяем одно и то же измерение ко всем подвыборкам и используем сходство или различие результатов для подвыборок как показатель надежности измерения. Поскольку мы используем одно и то же измерение, у нас нет [c.113] необходимости заботиться о сопоставимости, как в случае метода альтернативной формы; а так как для обеспечения эквивалентности подвыборок мы можем опираться на теорию выборки, нам не приходится беспокоиться о том, что выбранные для измерения группы окажутся недостаточно однородными. Так как ни один объект не измеряется дважды, мы можем не считать тест-эффект угрожающим точности нашего теста на надежность; а поскольку [c.114] измерения осуществляются одновременно, реальные изменения переменной не могут иметь значения для данного метода, как это происходит в случае метода неоднократного тестирования. Однако возможность использования метода подвыборки определяется тем, в состоянии ли мы получить такую большую выборку, что, разделив ее на части, мы будем располагать подвыборками, достаточными для того, чтобы применяемые нами статистические тесты были осмысленными. Это не всегда возможно и может послужить препятствием для использования метода подвыборки при проверке надежности.
Для интерпретации результатов каждого из этих тестов на надежность имеется множество статистических процедур8.
У описанных методов много разновидностей. Какой из вариантов в наибольшей степени подойдет для данного исследовательского проекта, будет зависеть от того, каким временем и возможностями располагает исследователь, а также от характера исследования. Например, если мы хотим измерить уличное освещение на основании оценки освещенности разных кварталов, сделанной обученными наблюдателями, мы можем спокойно воспользоваться методом неоднократного тестирования, не думая ни о каком тест-эффекте. Уличное освещение не будет изменяться просто потому, что его кто-то измеряет, и поэтому можно позволить разным наблюдателям независимо друг от друга оценивать одну и ту же улицу в одну и ту же ночь. Мы не сможем в такой же степени доверять этому методу, если наше измерение качества уличного освещения будет основываться на ответах, данных самими жителями на вопросы интервью.
Вне зависимости от того, какой тест на надежность мы предпочли использовать, надежность измерений важно установить до того, как будет начато исследование. Это требует предварительного тестирования измерения посредством сбора данных, предназначенных исключительно для оценки инструментов, которые будут использоваться в самом исследовании. Если нам не удастся это сделать, то может оказаться, что наши измерения ключевых переменных ненадежны (и поэтому невалидны), и выясниться это может лишь после того, как исследование завершено. А это означает, что мы не сможем доверять [c.115] результатам исследования и что наши усилия были полностью или частично потрачены впустую. Предварительное тестирование солидности и надежности измерения должно быть составной частью любого исследовательского проекта, если в нем используются измерения, которые не были где-нибудь убедительно валидизированы, или если этот проект полагается на измерения, которые были валидизированы только в условиях, очень сильно отличающихся от тех, в которых они будут использоваться. [c.116]
ЗАКЛЮЧЕНИЕ
Рис. 3.6. Модель процесса исследования
К настоящему моменту мы ввели в рассмотрение основные компоненты процесса исследования. На рис.3.6 изображены их взаимоотношения друг с другом. Операционализация понятий посредством разработки измеряемых показателей готовит нас к работе с материалом, в ходе которой мы будем делать наблюдения, ложащиеся в основание наших выводов. Однако для того, чтобы осуществить эти наблюдения, нам понадобится “план наступления” такая схема проведения наблюдений, которая позволит сделать на их основе максимальное количество надежных выводов. Такой план, или программа исследования, является темой гл. 4. [c.116]
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
Информацию об измерении в социальных науках можно почерпнуть из работ, в которых есть результаты исследований или разработки методов измерений. Обобщающее введение в проблему встречается крайне редко. Тем не менее мы можем указать полезный источник сведений в добавление к тем работам, которые упоминаются в примечаниях к настоящей главе. Полезное обсуждение логических оснований измерения имеется в: Кеrlingеr F.N. Foundations of Behavioral Research. N.Y.: Holt, Rinehart and Winston, 1964; Kaplan A. The Conduct the Inguiry. San Francisco: Chandler Publishing Co., 1964. Некоторые практические проблемы, возникающие в процессе измерения, освещаются в: Jоhnsоn J.M. Doing Field Research. N.Y.: Free Press, 1975; а одно из лучших введений в проблему стратегий измерения это работа: Shively Ph.W. The Craft of Political Research. Englewood Cliffs (NJ.): Prentice-Hall, 1980,2nd. ed. Более подробно разработанные подходы к измерению можно найти в: Measurement in Social Science / Ed.: Вlаlосk H.M., jr. Chicago: Adline, 1974, и Вlаlосk H.M., jr. Conceptualization and Measurement in the Social Science. Beverly Hills (Calif.): Sage, 1982. Разнообразные примеры стратегий измерения приводятся в: Bohrnstedt G.W., Bogatta E.F. Social Measurement. Beverly Hills (Calif.): Sage, 1981. Работа Carmines Е.G., Zeller R.A. Reliability and Validity Assessment. Beverly Hills (Calif.): Sage, 1979 представляет собой краткий обзор методов установления валидности и надежности. [c.117]
4. РАБОТА ПО ПЛАНУ: КАК СОСТАВИТЬ ПРОГРАММУ ИССЛЕДОВАНИЯ
Ни один опытный альпинист даже и помыслить не может о том, чтобы совершить восхождение на Эверест, не проделав большой предварительной работы по планированию, которая должна гарантировать соответствующую экипировку, выбор наилучшего маршрута и наличие информации о том, что делать в случае каких-то непредвиденных обстоятельств. Точно так же социологи не спешат браться за крупный исследовательский проект без тщательного планирования тех шагов, которые они должны будут предпринять. Этот “план наступления” называется программой исследования. “Программа исследования схема, лежащая в основе процесса сбора, анализа и интерпретации данных. Это логическая модель доказательства, позволяющая делать валидные каузальные выводы”1. Если нет адекватной и подходящей для данного случая программы исследования, лучшие измерения окажутся бесполезными, поскольку нельзя будет определить их значение. Разработка надежных программ исследования, как и другие обсуждавшиеся нами проблемы исследовательского мастерства, важный фактор успешного развития социальных наук.
Прежде чем предпринять любое серьезное исследование, следует составить его программу, которая не только в точности описывает, что и как вы собираетесь делать, но и объясняет, почему вы совершаете каждый данный шаг и почему вы совершаете его именно так, а не иначе. [c.118]
ЦЕЛЬ И ПРОГРАММА ИССЛЕДОВАНИЯ
Вплоть до настоящего момента мы обсуждали политологическое исследование так, как если бы оно было полностью предназначено для проверки гипотез с помощью процесса, изображенного на рис.3.6. И хотя проверка гипотез обычно считается наиболее важной во всех социальных науках, исследование, вообще говоря, может иметь множество целей, и его программа, [c.118] максимально подходящая для любого данного проекта, будет зависеть от его цели2. Некоторые исследовательские проекты являются поисковыми. Они предназначены для того, чтобы поближе познакомить нас с явлениями, которые мы собираемся исследовать, дать возможность более точно сформулировать проблемы и, быть может, построить гипотезы. Такие исследования могут играть важную роль, когда изучаются новые явления или явления, которые ранее не изучались. Некоторые проекты включают в свой состав описательные исследования. Последние предназначены для того, чтобы дать точное представление о некоторых явлениях, позволяющее нам лучше сформулировать проблемы и гипотезы. Например, прежде чем мы начнем строить теорию возможных причин некоторого явления, нам могут понадобиться сведения о частоте, географическом распределении и последовательности событий в составе данного явления или о том, с какими иными явлениями, как правило, ассоциируется данное явление. И наконец, исследование может быть предназначено для проверки каузальных гипотез. Если результаты исследования можно использовать для подтверждения того, что одно явление вызывает другое, можно попытаться дать объяснение этому другому явлению. Поэтому исследование, проверяющее гипотезы, может быть названо объяснительным исследованием. Такое исследование подходит тогда, когда мы уже достаточно знаем о явлении, чтобы начать искать объяснение того, почему данное явление таково, каково оно есть.
Данная предварительная типология целей исследования удобна потому, что исследование каждого типа предполагает свою программу. Поисковое исследование требует скорее гибкости, чем точности, поскольку его цель выявить возможные, а не проверить гипотетические объяснения. Программы поискового исследования должны давать лишь возможность наблюдать соответствующее явление. А вот описательное исследование требует точного измерения явлений. В описательных исследованиях (если мы надеемся получить точную картину интересующих нас событий) программа призвана обеспечивать беспристрастность и надежность наблюдений. Программы объяснительных исследований должны не только обеспечивать беспристрастное и надежное наблюдение, но и [c.119] давать возможность делать выводы относительно причинного воздействия переменных друг на друга. Программа исследования дает возможность делать каузальные выводы, если она позволяет исключить любые правдоподобные объяснения наблюдаемых фактов, являющиеся альтернативными по отношению к проверяемой каузальной гипотезе.
Вне зависимости от конкретной цели исследования программа исследования должна включать следующие основные элементы:
1) изложение цели исследования;
2) изложение гипотезы, подлежащей проверке (если таковая имеется);
3) спецификацию используемых переменных;
4) изложение способа операционализации и измерения каждой переменной;
5) детальное описание организации и проведения наблюдений;
6) обобщающее обсуждение будущего анализа собранных данных.
Главы 2 и 3 дают необходимые сведения относительно пунктов программы (1) (4); гл. 1216 освещают проблему анализа данных. Настоящая глава посвящена организации наблюдений. Именно этот аспект программы исследования дает основания для исключения альтернативных конкурирующих гипотез, и именно его имеет в виду большинство исследователей, когда идет речь о программе исследования. [c.120]
УЧЕТ В ПРОГРАММЕ ИССЛЕДОВАНИЯ АЛЬТЕРНАТИВНЫХ КОНКУРИРУЮЩИХ ГИПОТЕЗ
На примере гипотетической программы исследования можно продемонстрировать воздействие способа структурирования или организации наших наблюдений на степень полезности результатов. Представьте себе, что департамент юстиции какого-то американского штата осуществил новую программу, направленную на сокращение детской преступности. В программу входит однодневное пребывание в тюрьме малолетних преступников и тех, кто потенциально может стать преступником; во время этого пребывания они получают некоторое представление об [c.120] ужасах тюремной жизни. Программа основана на предположении, что этот опыт отобьет у них охоту совершать преступления, которые могут повлечь за собой тюремное заключение. Предположим, после того как программа осуществлялась в течение нескольких месяцев, администрация штата хочет узнать, имела ли она желаемый эффект, и предлагает вам, опытному политологу, оценить ее результаты. Что вы предпримете для этого?
Поскольку программа, известная под названием “операции по устрашению”, предназначена для сокращения детской преступности, преступность и будет зависимой переменной. Можно операционализировать ее как быть арестованным за совершение уголовного преступления и далее просто проконтролировать регистрацию приводов в течение года после посещения тюрьмы тех молодых людей, которые прошли через “операцию по устрашению”. Если в течение года они подверглись аресту, вы считаете их правонарушителями. Если они не были арестованы, вы не считаете их правонарушителями3.
Ваша программа исследования в данном случае предполагает всего лишь наблюдение за всеми представляющими интерес объектами. Это наблюдение вы проводите, просматривая регистрацию приводов лиц, прошедших через “операцию по устрашению”. Положим, вы обнаружили, что 70% участвовавших в программе не подверглись аресту в течение следующего года. Можете ли вы на этом основании сделать вывод, что эффективность программы по предотвращению преступности 70%?
Для того чтобы сколько-нибудь надежно сделать такой вывод, вам необходимо исключить другие объяснения того, почему 70% этих молодых людей не были арестованы. Ваша рабочая гипотеза заключается в том, что опыт, полученный входе “операции по устрашению”, предотвращает правонарушения. Рассмотрим некоторые возможные альтернативные конкурирующие гипотезы, способные объяснить полученные результаты.
1. Даже если бы “операция по устрашению” не проводилась, арестовано было бы не более 30% молодых людей.
2. У лиц, добровольно принявших участие в “операции по устрашению”, иная семейная обстановка, чем у тех, кто в ней не участвовал, и именно эта обстановка, а не организованная [c.121] штатом программа предотвратила совершение правонарушений.
3. Молодые люди совершали преступления, но не попадались.
4. Хотя “операция по устрашению” может дать временный эффект, постепенно он сойдет на нет, и молодежь снова будет совершать преступления (т.е. программа скорее отсрочивает, нежели предотвращает, совершение преступлений).
5. Молодые люди, участвовавшие в программе, арестовывались чаще, чем если бы они не принимали участия в “операции по устрашению”, поскольку участие в ней навешивало на них ярлык потенциальных преступников и делало их объектом более пристального внимания со стороны полиции (т. е. программа способствует увеличению количества арестов вне всякой связи с ее воздействием на поведение).
Альтернативная гипотеза (1), по существу, утверждает, что программа не оказывает никакого воздействия. Располагая только имеющимися наблюдениями, вы не можете показать, так это или нет. Вы никогда не узнаете, как поступили бы те, кто участвовал в программе, если бы они не приняли участия в “операции по устрашению”, однако вы можете включить в программу исследования просмотр регистрации приводов для группы молодых людей, не прошедших через указанную операцию, но во всех остальных отношениях максимально сходных с теми, кто через нее прошел. Затем вы можете сравнить степень преступности участвовавших и не участвовавших в программе и утверждать, что различия между этими показателями обусловлены влиянием программы, поскольку мы можем считать, что участники программы действовали бы так же, как их сверстники, не охваченные “операцией по устрашению”.
Наблюдение за контрольной группой (за теми, кто не участвует в программе) позволяет нам установить причинную связь между участием в программе и преступным поведением.
Альтернативная гипотеза (2) заключается в том, что представляющееся очевидным отношение между участием в программе и преступным поведением является мнимым. Гипотеза утверждает, что обстановка в семье является [c.122] причиной и участия в программе, и последующего отсутствия правонарушений. Такое рассуждение предполагает, что существует процесс отбора, при котором те, кто имеет в семье поддержку, помогающую не совершать преступления, и те, кто, скорее всего, примет участие в программе, одни и те же люди, и что это создает очевидную связь между “операцией по устрашению” и отсутствием преступлений.
Одно лишь наблюдение не позволит вам исключить эту возможность, однако наличие контрольной группы, включающей молодых людей, условия жизни которых сходны с условиями жизни тех, кто был вовлечен в “операцию по устрашению” как и в случае гипотезы (1), позволяет определить, так ли это. Вы можете проверить, чтобы убедиться, действительно ли участвовавшие и не участвовавшие в программе, как правило, имеют различные семейные условия, а те, кто имеет одинаковые семейные условия, имеет, как правило, одинаковый показатель преступности вне зависимости от участия в операции.
Исключение гипотезы (2), как и работа с гипотезой (1), требует проведения второго наблюдения (проверки регистрации приводов некоторых молодых людей, не участвующих в программе). Однако, помимо этого, проработка гипотезы (2) потребует от вас проведения еще одного наблюдения, в ходе которого будут собраны данные о семейной обстановке объектов наблюдения. Возможно, вы получите некоторые объективные показатели этой переменной (например, наличие обоих родителей, уровень образования и род занятий родителей, доход семьи) из официальных документов, но, быть может, вам придется также провести интервью с членами семьи или самими молодыми людьми. Если вы операционализируете обстановку в семье с учетом отношений и личных взаимосвязей, такие интервью будут крайне необходимы. Вы, таким образом, не только увеличиваете объем данных, но и используете другой метод сбора материала личное интервью.
Альтернативная гипотеза (3) еще в большей степени нуждается в таком дополнительном методе сбора данных. В соответствии с этой гипотезой выдвигается предположение, что “операция по устрашению” сделала своих участников более осторожными и, быть может, [c.123] даже более хитрыми преступниками, а не уменьшила количество совершаемых ими преступлений. Гипотеза ставит под сомнение адекватность операционализации зависимой переменной. Пока единственной мерой преступности является официальная регистрация арестов, вы не можете быть уверены в том, что ваши сомнения напрасны.
Один из способов проработки гипотезы (3) состоит в том, чтобы включать в операционализацию преступности сообщения о преступных действиях, полученные от самих несовершеннолетних, и проводить интервью до и после прохождения программы. Вам придется проводить интервью и с участвующими и с не участвующими в программе и для каждой группы включать информацию о семейной обстановке, для того чтобы обрести уверенность, что ваши результаты нельзя объяснить с помощью гипотез типа (1) и (2), сформулированных в терминах этого нового показателя преступности. Поступив таким образом, вы ввели не только новый момент наблюдения (предваряющее программу интервью), но и другой способ операционализации зависимой переменной.
Альтернативная гипотеза (4) вводит в исследование ось времени. Если вам нужно ее учитывать, придется проводить интервью и проверять регистрации преступлений как для участников программы, так и для контрольной группы не только через год после посещения тюрьмы, но и через два, а возможно, и через три года. Причина проведения последующих наблюдений за участниками программы должна быть очевидна, поскольку гипотеза (4) утверждает, что при определенных обстоятельствах участники программы становятся преступниками. Но необходимо также пронаблюдать и за контрольной группой, чтобы убедиться, что изменения показателей преступности участников программы в последующие годы не являются результатом воздействия других факторов, таких, как взросление, изменение семейных условий или ухудшение материального положения. Только в том случае, если в последующие годы показатели преступности у участников программы оказываются близкими к показателям преступности для неучастников на тот же момент времени (или даже более плохими), вы [c.124] можете сделать вывод, что программа оказалась неэффективной (или что она имела отрицательный эффект).
В отличие от остальных гипотез альтернативная гипотеза (5) утверждает, что “операция по устрашению” была более эффективной, чем позволяют считать ваши результаты. Она выдвигает предположение, что, используя в качестве меры преступности аресты, вы ввели дополнительную независимую переменную (избирательное отношение со стороны властей), воздействие которой перекрывает реальное воздействие операции на преступное поведение.
Один из способов учесть эту возможность ввести другую операционализацию зависимой переменной. Если принимать во внимание не только арест, но и осуждение как в случае участвующих, так и в случае не участвующих в программе, вы будете располагать данными о том, являются ли дела, возбуждаемые против участников программы, менее обоснованными, чем дела тех, кто не проходил через нее; исходя их этого вы сможете сделать вывод, имеется ли со стороны полиции тенденция чаще арестовывать добровольных участников “операции по устрашению”. Разница между числом арестов и числом осуждений для участников и для неучастников будет показателем избирательности внимания со стороны полиции. Если участников программы арестовывают, не предавая в конечном итоге суду или не осуждая, существенно чаще, чем неучастников, у вас есть основания считать, что гипотеза (5) верна.
Этот краткий обзор нескольких возможных конкурирующих гипотез, способных поставить под сомнение ценность полученных результатов, позволяет разработать более детальную программу исследования, чем та, что предлагалась вначале. Если вы хотите получить возможность исключить те пять альтернативных интерпретаций результатов, полученных в ходе вашего исследования (а вы должны это сделать, чтобы ваше исследование имело какой-то смысл), вам придется перейти от одной-единственной операционализации зависимой переменной и от одного-единственного наблюдения к программе, включающей множество способов операционализации, множество методов сбора [c.125] данных и несколько наблюдений. Такая новая программа должна включать следующие основные этапы:
1. Сформировать выборку из числа несовершеннолетних, которые отобраны для участия в “операции по устрашению”, и выборку из числа несовершеннолетних, которые имеют тот же состав характеристик, релевантных с точки зрения преступности (например, пол, возраст, расовая принадлежность, род занятий, образование и доход родителей, жизненные условия и место жительства), но которые не должны участвовать в программе.
2. Взять интервью у испытуемых, предназначенных для включения в программу, до того, как они примут участие в операции, и одновременно взять интервью у контрольной группы, чтобы получить самоотчеты о преступной деятельности и информацию об обстановке в семье.
3. Взять интервью у членов семей всех испытуемых, чтобы получить информацию об обстановке в семье.
4. Через год после того, как испытуемые посетили тюрьму, взять интервью как у участников, так и у неучастников программы, чтобы получить самоответы о преступной деятельности и выяснить, не изменились ли их семейные условия.
5. Во время осуществления этапа (4) сравнить данные по арестам и осуждениям для участников и неучастников программы.
6. Через два года после участия испытуемых в “операции по устрашению” повторить этапы (4) и (5).
7. Через три года после операции повторить этапы (4) и (5).
Анализируя данные, вы захотите сравнить количество арестов, количество осуждений и различия между количеством арестов и количеством осуждений для участников программы и контрольной группы; при этом необходимо внимательно следить за тем, чтобы исключать из контрольной группы тех ее членов, которые, будучи вначале отобранными для исследования, приняли затем участие в “операции по устрашению”. Используя при анализе данных, полученных в ходе этих наблюдений, подходящие статистические процедуры, вы должны суметь получить в высшей степени надежные выводы о ценности операции как средства, противодействующего преступности малолетних. Благодаря вашему умению исключить основные [c.126] конкурирующие гипотезы департамент юстиции штата сумеет вполне довериться вашим выводам, чего никак не могло бы случиться, если бы эти выводы основывались на первой программе исследования.
Цель этого упражнения состоит не в том, чтобы констатировать преимущество сложных программ исследования над простыми. Иногда простая программа гораздо предпочтительнее. Важным фактором является адекватность программы, а не ее сложность. Если программа дает логическое основание для тех типов выводов, которые хочет получить исследователь, она является адекватной.
Обсуждение этого гипотетического исследования можно рассматривать как пример разработки адекватных программ. Составляя план для исследовательского проекта, вы следуете тому же ходу рассуждений, который мы наметили. Программа исследования это процесс формулирования альтернативных конкурирующих гипотез и продумывания, какого рода наблюдения необходимы для проверки этих гипотез, так чтобы их нельзя было рассматривать в качестве объяснений возможных результатов.
Альтернативные конкурирующие гипотезы обнаруживаются так же, как и рабочие гипотезы. Они возникают в результате логического анализа теорий, касающихся событий, которые мы пытаемся объяснить. Действительную альтернативу составляет конкурирующая (соперничающая) гипотеза, предлагающая такие же взаимоотношения, как и наша основная гипотеза, но объясняющая их с точки зрения отличного причинно-следственного процесса. Важно не смешивать действительно альтернативную конкурирующую гипотезу с тем, что мы можем назвать “другие гипотезы”. Благодаря существованию множественности причинных связей в социальных явлениях очень часто мы сталкиваемся с тем, что любому явлению может быть найдено множество равно достоверных объяснений. Устанавливая другую причину изучаемых отношений, мы можем выдвинуть просто иную гипотезу, которая, возможно, ни в меньшей степени не будет конкурирующей с основной. Гипотеза является альтернативной конкурирующей гипотезой только [c.127] тогда, когда логически невозможно доказать, что и она, и основная гипотеза являются достоверными.
Выдвижение критической конкурирующей гипотезы это преимущественно творческий процесс4. Не существует точных и строгих правил, гарантирующих установление всех конкурирующих гипотез, способных поставить под сомнение ценность вашего исследования. Процесс разработки программы для исследовательского проекта индивидуален для каждого исследования. Вы не можете просто выбрать подходящую программу из ограниченного набора альтернатив, как могли бы выбрать в обувном магазине пару туфель на полке с вашим размером. Существует, однако, несколько общих типов программ исследования, каждый из которых удобен для работы с определенной проблемой. Следующий раздел содержит обзор основных типов программ и введение в логику планирования исследования. Имея такую базу и разумное теоретическое и эмпирическое представление о соответствующем объекте, вы будете в состоянии разрабатывать собственные программы. [c.128]
ЭКСПЕРИМЕНТАЛЬНЫЕ ПРОГРАММЫ ИССЛЕДОВАНИЯ
Цель хорошей программы дать возможность с максимально возможной степенью уверенности определить результаты воздействия одной переменной на другую. Программы исследования позволяют сделать это, давая возможность в некоторой степени контролировать условия, в которых взаимодействуют переменные. Такой контроль ключевое понятие для программы. Если после добавления в рацион животных новых кормов какие-то животные на ферме заболевают, фермер не может быть уверен, что причиной болезни являются именно новые корма, так как в то же самое время животные могли пострадать от многих других факторов (например, инсектицидов в питьевой воде). С другой стороны, если в медицинской исследовательской лаборатории обнаруживается, что после введения в рацион новых кормов заболевает необычно большой процент наблюдаемых животных, исследователь скорее может быть уверен, что причина [c.128] болезни новые корма, поскольку в этой ситуации имеется возможность контролировать условия содержания исследуемых животных и гарантировать, что в процессе наблюдения они не подвергаются воздействию никаких других новых факторов. Обстановка, в которой работает исследователь, в отличие от условий фермы дает возможность частичного контроля.
Программы исследования можно классифицировать по степени контроля, который они обеспечивают. Основное различие, интересное для политолога, это различие между экспериментальными и квазиэкспериментальными программами.
Эксперимент классический способ научного доказательства. Он основан на предположении, что изменения в значении одной переменной вызывают изменения в значении другой переменной (например, изменения температуры вызывают изменения вязкости масла). Эксперимент позволяет нам проверить это предположение, подвергнув объекты, обнаруживающие зависимую переменную, воздействию независимой переменной в условиях, дающих нам определенную уверенность в том, что любое наблюдаемое изменение зависимой переменной является результатом изменений независимой переменной.
Для элементарной экспериментальной программы исследования требуется экспериментальная группа, состоящая из лиц, которые будут подвергнуты воздействию независимой переменной, или стимула, и контрольная группа лиц, которые сходны с экспериментальной группой во всех существенных аспектах, но не будут подвергаться воздействию стимула. Значение зависимой переменной в каждой группе измеряется до начала воздействия стимула в ходе так называемого предварительного тестирования (pretest) и затем еще раз после того, как экспериментальная группа подверглась воздействию стимула, в ходе контрольного тестирования (posttest). Вывод о влиянии стимула (независимой переменной) делается на основании сравнения оценок предварительного теста и контрольного теста для каждой группы. Чем больше различие в значениях между предварительным тестом и контрольным тестом в каждой группе, тем большее влияние приписывается независимой переменной. В [c.129] табл.4.1 изображена логическая структура экспериментальной программы исследования. Значение этой исследовательской программы состоит в том, что она позволяет достичь двух условий, облегчающих получение валидных каузальных выводов: сравнения и управления.
Таблица 4.1
Программа классического эксперимента
Группа |
Момент |
Момент |
Момент |
Формула результата |
Экспериментальная |
Предварительный тест |
Стимул |
Контрольный |
Результат (для экспериментальной переменной) = (контрольный тест э предварительный тест э) (контрольный тест к предварительный тест к), |
Контрольная |
Предварительный тест |
|
Контрольный |
Утверждение о том, что одно явление явилось причиной другого, основывается на понятии изменения. Прежде чем утверждать, что имело место причинное воздействие, мы должны быть в состоянии продемонстрировать, что произошло некоторое изменение, а понятие изменения предполагает сравнение. Мы должны иметь возможность сравнивать значения зависимой переменной до того, как исследуемые объекты были подвергнуты воздействию независимой или каузальной переменной со значениями зависимой переменной после такого воздействия; и кроме того, если это возможно, следует сравнить значения зависимой переменной после воздействия с некоторым показателем, задающим эти значения в отсутствие какого бы то ни было воздействия. Экспериментальная программа, с ее процедурой предварительного контрольного тестирования, с ее экспериментальной и контрольной группами, создает условия для сравнений обоих типов.
Чтобы обрести уверенность, что одна переменная оказывает причинное воздействие на другую, мы должны [c.130] располагать информацией, кто из обследуемых подвергался воздействию независимой переменной, а кто нет, так чтобы мы могли сделать необходимые сравнения. Классический эксперимент дает такую информацию, так как независимую переменную вводит сам исследователь. Ученый управляет обстановкой, окружающей обследуемых, так что причинное воздействие происходит не по воле случая. Кроме того, исследователь контролирует обстановку таким образом, чтобы гарантировать, что все другие возможные причины изменения зависимой переменной в течение времени воздействия независимой переменной на объекты исследования из эксперимента устранены.
Многие другие программы основаны на логической структуре классического эксперимента, однако в них имеются модификации, предназначенные специально для ученых. Их потребность в более тщательно разработанных программах в значительной степени объясняется тем, что (1) часто на объекты их исследования оказывает влияние сам процесс исследования (например, поведение людей может меняться, если они знают, что за ними наблюдают) и (2) объекты их исследования не статичны, а постоянно меняются (например, оценки людей могут варьироваться в зависимости от ситуации). Возможности учета этих фактов иллюстрируются на примере двух экспериментальных программ, разработанных Р.Л.Соломоном5.
Первая программа нацелена на один из аспектов проблемы реактивности так называемый тест-эффект. Когда объекты эксперимента подвергаются предварительному тестированию, всегда существует возможность, что их оценка в контрольном тесте будет складываться как из реакции на стимул, так и из реакции на сам предварительный тест. Любое различие между оценками предварительного и контрольного тестов, возникающее исключительно в результате реакции на предварительный тест, известно под названием тест-эффекта. Если нам необходимо получить точную картину воздействия стимула на поведение, мы должны уметь удалять из оценок этот тест-эффект. Сделать это позволяет предложенная Р.Соломоном программа исследования с двумя контрольными группами, представленная в табл. 4.2. [c.131]
Таблица 4.2
Программа эксперимента с двумя контрольными группами, разработанная Р.Соломоном
Группа |
Момент |
Момент |
Момент |
Формула результата |
Экспериментальная |
Предварительный тест |
Стимул |
Контрольный |
Результат = [(контрольный тест э предварительный тест э) (контрольный тест к1 предварительный тест к1)] (контрольный тест э контрольный тест к2) |
Контрольная 1 |
Предварительный тест |
|
Контрольный |
|
Контрольная 2 |
|
Стимул |
Контрольный |
Программа почти такая же, как в классическом эксперименте, различие состоит только в том, что добавлена третья группа. В третьей группе (контрольной группе 2) есть стимул и есть контрольный тест, но нет предварительного теста. В то время как различия между оценками предварительного и контрольного тестов в экспериментальной группе могут быть обязаны своим происхождением и предварительному тесту, и стимулу, те же самые различия в контрольной группе 1 могут возникать только под воздействием предварительного теста, а в контрольной группе 2 только под воздействием стимула. Если мы вправе предположить, что первоначально значение зависимой переменной во всех группах фактически одно и то же и что группы прореагировали на стимул одним и тем же образом, то различие между оценками контрольного теста в экспериментальной группе и оценками контрольного теста в контрольной группе 2 и будет демонстрировать тест-эффект. Тогда воздействие самой независимой переменной (стимула) можно измерить, вычтя тест-эффект из общего результата эксперимента (последний подсчитывается по той же формуле, которая используется для оценки результатов программы классического эксперимента). Формула результата в табл. 4.2 представляет это рассуждение в алгебраическом виде.
Итак, программа с двумя контрольными группами позволяет нам оценить и, как мы надеемся, исключить тест-эффект как альтернативное объяснение наблюдаемых изменений в оценках испытуемых. Существуют, однако, другие возможные причины изменения оценок [c.132] зависимой переменной в группах в контрольном тесте по сравнению с предварительным. Одна из причин воздействие внешних факторов, находящихся вне контроля экспериментатора. Другая причина естественные изменения, происходящие с испытуемыми вне связи с экспериментом (такие, как старение, изменения в ходе длительных экспериментов или умственное утомление). Воздействие таких посторонних факторов можно оценить (и тем самым исключить в качестве конкурирующего объяснения результатов эксперимента), используя программу Р. Соломона с тремя контрольными группами (см. табл. 4.3).
Таблица 4.2
Программа эксперимента с двумя контрольными группами, разработанная Р.Соломоном
Группа |
Момент |
Момент |
Момент |
Формула результата |
Экспериментальная |
Предварительный тест |
Стимул |
Контрольный |
Результат = [(контрольный тест э предварительный тест э) (контрольный тест к1 предварительный тест к1)] [(контрольный тест к2) + (контрольный тест э контрольный тест к3)] |
Контрольная 1 |
Предварительный тест |
|
Контрольный |
|
Контрольная 2 |
|
Стимул |
Контрольный |
|
Контрольная 3 |
|
|
Контрольный |
В этой программе добавлена третья контрольная группа, не получающая ни предварительного теста, ни стимула. Любое различие между оценками предварительного и контрольного тестов в этой группе может возникать только за счет влияния посторонних факторов. Если мы способны вычесть это различие из результата эксперимента, значит, мы способны устранить результаты воздействия посторонних факторов и изменения, которые происходят в результате такого воздействия у испытуемых; и мы можем надеяться исключить альтернативную гипотезу, состоящую в том, что именно эти воздействия, а не независимая переменная были причиной изменения оценки в экспериментальной группе от момента 1 до момента 3. [c.133]
Трудность состоит в том, что контрольная группа 3 не подвергалась предварительному тесту. Как же определить, насколько изменились оценки этих испытуемых с момента 1 до момента 2? Если все наши группы в основном сходны между собой, мы можем считать, что их оценки в предварительном тесте должны были быть очень близки, и просто приписать контрольной группе 3 в предварительном тесте оценку, равную усредненным оценкам экспериментальной и первой контрольной групп. Тогда мы можем вычесть эту оценку из оценки контрольной группы 3 в контрольном тесте, чтобы получить меру изменения, возникающего вследствие воздействия посторонних факторов и естественных изменений, происходящих с испытуемыми. Устранив и это изменение, мы можем более отчетливо увидеть результаты воздействия независимой переменной на зависимую. [c.134]
ФОРМИРОВАНИЕ ГРУПП
Каждая из только что описанных программ эксперимента предназначена для того, чтобы предоставить надежный логический базис для осуществления выводов относительно влияния одной переменной на другую. Чтобы преуспеть в этом, каждая программа опирается на предположение, что все группы, участвующие в исследовании, в основном одинаковы с точки зрения факторов, которые могли бы повлиять на результат эксперимента. Если мы почему-либо не можем считать, что группы в основном одинаковы, у нас нет логического основания для вывода о том, что наблюдаемые различия в оценках групп возникают вследствие разного обращения с группами в процессе эксперимента (например, в зависимости от того, подвергались ли они предварительному тестированию), и мы не можем привести убедительные доводы относительно причинного воздействия независимой переменной.
Как фактически добиться устранения различий между членами разных групп? Существует три подхода к формированию групп. Во-первых, это точный подбор соответствий. Определив, какие характеристики могли бы оказать воздействие на реакцию испытуемых в отношении независимой переменной, мы отбираем для эксперимента ряд испытуемых. Для каждого выбранного испытуемого в состав контрольной группы подбирается другой испытуемый, [c.134] имеющий то же самое сочетание релевантных характеристик. В результате возникает две группы, тождественные с точки зрения характеристик, которые могли бы повлиять на их реакцию в эксперименте. В идеале их оценки в предварительном тесте должны быть очень близки, и мы можем использовать степень близости, реально установленную в ходе предварительного теста, чтобы оценить свои усилия по достижению соответствия.
В связи с этой процедурой возникает ряд проблем. Во-первых, если нам необходимо контролировать большое число характеристик, может оказаться крайне трудно выбрать испытуемых, в точности соответствующих всем этим характеристикам (как это требуется при подборе соответствий). Например, мы могли бы найти людей, одинаковых с точки зрения пола, возраста и расовой принадлежности, но оказаться не в состоянии подобрать их так, чтобы они обладали всеми этими характеристиками и при этом имели одинаковую профессию, уровень образования и одинаково долго жили в данном сообществе. Кроме того, если мы хотим применить программу исследования, предусматривающую наличие более чем двух групп, может оказаться чрезвычайно трудно найти трех или четырех испытуемых с одинаковыми характеристиками. Если только мы не располагаем очень большим фондом потенциальных испытуемых или не имеем дело с самым простым экспериментом, подбор соответствий как способ распределения испытуемых по экспериментальным группам может оказаться невозможным.
Второй метод метод контроля за частотным распределением. В этом случае мы не проводим сопоставление каждого испытуемого с каким-либо другим по всем характеристикам. Вместо этого испытуемые распределяются по группам таким образом, чтобы было гарантировано наличие в каждой группе одних и тех же средних характеристик и одинаковое распределение каждой характеристики. Может так случиться, что не найдется двух испытуемых с одинаковым набором характеристик пола, возраста, расовой принадлежности и профессии, однако каждая группа будет характеризоваться одним и тем же количеством мужчин и женщин, одинаковым средним возрастом и т. п. Более того, группы будут характеризоваться очень близким распределением этих характеристик среди их членов. [c.135]
Контроль за распределением частот практикуется чаще, чем точный подбор соответствий, однако у него есть два существенных недостатка. Во-первых, он позволяет одновременно контролировать только одну переменную. Пользуясь методом распределения частот, можно, например, получить две группы с одинаковым количеством испытуемых в возрасте старше 40 лет и одинаковым количеством чернокожих граждан, однако нет никакой гарантии, что все испытуемые старше 40 лет не окажутся неграми в одной группе и белыми в другой. Если именно так и случится, две группы в действительности не будут сходными. Во-вторых, данный метод не дает возможности контролировать факторы, которые воздействуют на реакции испытуемых, но не были выделены исследователем. Если наша теория неполна (а она почти всегда неполна), мы могли не установить контроль за частотным распределением некоторой важной переменной. Если окажется так, что контрольная и экспериментальная группа систематически различаются по этой неконтролируемой переменной, могут быть получены искаженные результаты.
Третий метод формирования групп более гибок по сравнению с точным подбором соответствий. Это метод рандомизации. Испытуемый, выбранный из списка всех подходящих испытуемых, включается в группу посредством некоторого случайного процесса, например с помощью таблицы случайных чисел. Настоящая рандомизация не может быть достигнута с помощью процедур, имеющих случайный характер (вроде того, чтобы отобрать первых 30 человек, выразивших желание участвовать в эксперименте, в экспериментальную группу, а следующих 30 в контрольную).
Рандомизация имеет большое преимущество, создавая у нас чувство уверенности, что все наши группы сходны между собой во всех отношениях, а не только с точки зрения переменных, которые мы считаем релевантными для эксперимента, поскольку при отборе большого числа испытуемых случайное распределение по группам гарантирует нейтрализацию различий между испытуемыми. Таким образом, рандомизация позволяет исключить любую альтернативную конкурирующую гипотезу, утверждающую, что наблюдаемые результаты объясняются какими-то систематическими различиями между группами, она [c.136] является ключом к успешным лабораторным экспериментам. Детально процедуры случайного выбора объектов обсуждаются в гл.5. [c.137]
ПОЛЕВЫЕ ЭКСПЕРИМЕНТЫ И НЕЭКСПЕРИМЕНТАЛЬНЫЕ ПРОГРАММЫ
Политологи по характеру своей деятельности редко работают в лабораториях. Они скорее наблюдают события в естественной обстановке, где меньше возможности контролировать факторы, которые могли бы повлиять на результаты исследования. В тех случаях, когда исследователи могут управлять независимой переменной и контролировать реакцию испытуемых, но не в состоянии контролировать другие аспекты ситуации, они могут проводить полевые эксперименты. В этих исследованиях используется экспериментальная программа, в которой испытуемые систематически распределяются на экспериментальную и контрольную группы. Примерами полевых экспериментов являются различные эксперименты по “отрицательному подоходному налогу”, проводимые в США6. Эти исследования использовались для измерения воздействия автоматических благотворительных выплат в форме отрицательного подоходного налога на образ жизни и усердие в работе, характеризующие испытуемых. Исследователи могли контролировать, кто из испытуемых получил выплаты в виде отрицательного подоходного налога, но они не могли проконтролировать другие релевантные аспекты ситуаций, в которых находились испытуемые. Например, исследователи не могут гарантировать сохранение здоровья и семейного статуса испытуемого или возможность получить работу в данном месте. Такое положение создавало трудности при отделении воздействия благотворительных выплат от других возможных причин изменений в поведении испытуемых, однако оно имело явные преимущества, позволяя осуществить проверку воздействия отрицательного подходного налога на практике. Лабораторный эксперимент, даже если бы его можно было организовать, не был бы столь же успешным, так как нельзя быть уверенным, что результаты, полученные в таких искусственных условиях, точно отражают то, что происходит в окружающем мире. И это главное преимущество [c.137] полевых экспериментов перед лабораторными исследованиями.
В полевых экспериментах исследователи с большой тщательностью подбирают испытуемых и осуществляют случайное распределение на экспериментальную и контрольную группы, чтобы хоть как-то контролировать фоновые характеристики, которые могут воздействовать на результаты. Они также внимательно следят за условиями, в которых находятся испытуемые на протяжении эксперимента, чтобы исключить альтернативные гипотезы, которые соотносят наблюдаемые результаты с внешними событиями, происходящими во время эксперимента. (Например, все те испытуемые, которые по состоянию здоровья оказывались неспособны работать, исключались из эксперимента по отрицательному подоходному налогу, так чтобы их безработное состояние нельзя было интерпретировать как реакцию на благотворительные выплаты.)
Во многих случаях политологи не в состоянии управлять даже независимой переменной. Вы вполне можете представить себе, насколько трудно убедить одни народы совершить революцию, а других повременить с ней, чтобы провести полевой эксперимент по воздействию революций на политическое развитие! Чем сложнее исследуемый объект, тем меньше вероятность, что мы сможем контролировать его. В этих условиях исследователи должны попытаться приблизиться к экспериментальной программе, как будет описано в следующем разделе, или же обратиться к неэкспериментальной программе.
В неэкспериментальных исследованиях ученые не в состоянии контролировать ни распределение испытуемых по экспериментальным группам, ни распространение независимой переменной, не могут они получить и предварительные оценки для зависимой переменной. Они могут быть вынуждены использовать то, что называют программой постфактум, в которой одно-единственное наблюдение осуществляется после того, как произошло предполагаемое каузальное событие. Иногда может добавляться “контрольная группа” сходных испытуемых, не подвергавшихся воздействию независимой переменной, и различия в оценках двух групп связываются с воздействием независимой переменной. Однако такие программы не позволяют делать надежные выводы относительно [c.138] воздействия независимой переменной, так как не дают возможности исключить даже самые простые альтернативные гипотезы. Например, мы не можем быть уверены даже в том, что значение зависимой переменной, наблюдаемое после воздействия независимой переменной, хоть в какой-то степени отличается от значения зависимой переменной до этого воздействия. Неэкспериментальные программы подходят только для описательных или поисковых, а не для объяснительных исследований. [c.139]
КВАЗИЭКСПЕРИМЕНТАЛЬНЫЕ ПРОГРАММЫ
Большинство исследовательских программ, используемых политологами, можно определить как квазиэкспериментальные. В этих исследованиях невозможно контролировать воздействие независимой переменной или условия, при которых оно происходит, однако исследователи пытаются имитировать экспериментальную программу, либо собирая дополнительные данные, либо используя методы анализа данных. Правильно составленные квазиэкспериментальные программы дают такую возможность, как если бы были использованы все контрольные характеристики настоящего эксперимента; они являются надежной логической основой для получения причинных выводов.
Возможно, наиболее простым типом квазиэкспериментальных программ в политологии является эксперимент ех post facto. В ходе этого эксперимента исследователи осуществляют одно наблюдение и собирают данные о независимой и зависимой переменных и обо всех других переменных, которые, по их мнению, следует контролировать. Если, например, мы хотим изучить воздействие высшего образования на поведение избирателей, мы можем провести исследование на случайно выбранных испытуемых. Затем мы анализируем наши данные, чтобы определить, действительно ли люди, сходные в других отношениях (например, сточки зрения расовой принадлежности, пола, возраста, места жительства), но имеющие разный уровень образования, голосуют по-разному. Для этого существуют более тонкие статистические методы, но проще всего рассортировать наших респондентов по таблицам взаимной сопряженности признаков, так чтобы можно было исследовать соотношение между образованием и участием в выборах в разных категориях [c.139] других переменных, рассматривая, например, только женщин или только мужчин, которые посещали или не посещали колледж.
Эта процедура позволяет нам поступать таким образом, как если бы мы, начав эксперимент много лет назад, распределили людей по экспериментальным группам, проанализировали, как воздействует на мотивы их голосования высшее образование (независимая переменная), а потом опять исследовали бы их, чтобы понять, как повлияло образование на их участие в выборах. Члены нашей выборки, не имеющие высшего образования, но в остальных отношениях похожие на тех, кто его имеет, выступают в качестве контрольной группы. Поскольку у нас не было предварительного теста, мы не можем быть уверены, что именно высшее образование явилось причиной всех наблюдаемых отличий в голосовании, но, использовав дополнительные данные, полученные в процессе исследования, мы можем исключить некоторые возможные конкурирующие гипотезы и рассчитывать, что случайное формирование выборки нейтрализует влияние переменных, которые мы не можем проконтролировать при анализе данных.
Бывают ситуации, когда мы не можем воспользоваться случайной выборкой и не можем подобрать сравнимые контрольные группы. Это происходит в том случае, если количество наших единиц анализа невелико или они уникальны с точки зрения многих релевантных аспектов. Примером может служить ситуация, когда городские власти хотят узнать результат воздействия административной реорганизации на стоимость муниципальных услуг. Чтобы ответить на этот вопрос, политологам следует использовать другую распространенную программу, известную как программа измерения временного ряда.
В программах измерения временного ряда исследователь делает несколько наблюдений как до, так и после введения некоторого каузального явления и сравнивает значения зависимой переменной до и после такого введения. В нашем примере политологи могли бы использовать городские архивы для сравнения стоимости муниципальных услуг на душу населения до и после административной реорганизации. (Им придется учитывать расходы на душу населения и следить за инфляцией, чтобы исключить возможность воздействия на эту стоимость увеличившегося населения города [c.140] или роста цен независимо от влияния реорганизации.) Рис.4.1, 4.2, 4.3 иллюстрируют некоторые возможные результаты такого исследования.
Рис. 4.1. Гипотетическая тенденция динамики расходов городских служб, демонстрирующая коренное изменение первоначальной тенденции
Рис. 4.2. Гипотетическая тенденция динамики расходов городских служб, демонстрирующая отсутствие воздействия со стороны реорганизации
Рис. 4.3. Гипотетическая тенденция динамики расходов городских служб, демонстрирующая, что реорганизация изменила уровень расходов, но не нарушила тенденции
В некотором смысле программы измерения временного ряда используют в качестве контрольной группы один и тот же объект (или множество объектов), только на более раннем этапе. Если в динамике значений зависимой переменной до введения независимой переменной имеется некая отчетливая тенденция, мы считаем, что эта тенденция сохранилась бы, не будь независимой переменной; в качестве показателя воздействия независимой переменной мы используем различия между наблюдаемыми значениями зависимой переменной и теми значениями, которые она имела бы в случае сохранения тенденции.
Рис.4.1 иллюстрирует данное рассуждение. Если данные оказываются такими, как представлено на этом рисунке, городские власти с радостью обнаружат, что реорганизация не только уменьшила расходы служб, но также коренным образом изменила тенденцию в направлении устойчивого снижения расходов. Результат воздействия реорганизации в любом данном году может быть измерен в виде разницы между значением, предсказанным для [c.141] данного года на основе первоначальной тенденции, и наблюдаемым значением. Согласно рис.4.1, для 1995 г. результат воздействия реорганизации на расходы служб составляет 50 долларов. Если данные оказываются такими, как показывает рис.4.2, предсказываемые и наблюдаемые значения будут совпадать и можно будет считать, что реорганизация не оказала воздействия на расходы. Рис.4.3 иллюстрирует случай, когда реорганизация вначале уменьшила расходы, но не повлияла на тенденцию. В то время как рис.4.1 демонстрирует, что общий результат реорганизации за четыре года составил 325 долларов, рис.4.3 демонстрирует результат лишь в размере 25 долларов.
В некоторых случаях тенденция, с которой мы имеем дело, не так отчетлива и устойчива, как в данном примере. Пусть, например, городская полиция, озабоченная ростом количества арестов за проституцию, организует кампанию по борьбе с этим явлением и затем хочет узнать, насколько она была успешна. Рис.4.4 демонстрирует, какого рода данные могли быть собраны на протяжении десятилетнего периода. Значения зависимой переменной (аресты за проституцию) [c.142] в разные годы на протяжении указанного периода то возрастают, то уменьшаются. Задача исследователя определить, есть ли существенное отличие между общей тенденцией, следующей за проведенной кампанией, и общей тенденцией, предшествующей проведению кампании. Один из способов решить эту задачу заключается в сравнении среднегодового количества арестов за проституцию в годы, предшествующие кампании и следующие после нее. (Среднее количество арестов в том и другом случаях равно в данном примере девяти.) Если мы будем считать, что без проведения кампании тенденция осталась бы прежней, то различие между двумя средними значениями можно использовать как показатель воздействия кампании на уровень арестов за проституцию. Другой способ сравнить линии тенденций (представленные на рис.4.4 пунктирной линией), проходящие через разбросы значений зависимой переменной в период до кампании и после нее, чтобы определить, различаются ли общие тенденции.
Рис.4.4. Гипотетическая тенденция динамики количества арестов за проституцию, демонстрирующая отсутствие результатов после проведения кампании по борьбе с проституцией
Этот пример иллюстрирует одно из важных достоинств программ измерения временного ряда. Если мы отмечаем количество арестов только в 1994 и 1996 гг. (как в типичном [c.143] исследовании “до введения стимула после введения стимула”), мы можем сделать вывод, что полицейская кампания уменьшила количество арестов за проституцию. Однако данные измерений временного ряда позволяют увидеть, что падение числа арестов с 1994 по 1996 г. нормальная флуктуация относительно общей тенденции (представленной пунктирной линией), которая остается не затронутой полицейской акцией.
Помимо сильной стороны, программы измерения временных рядов имеют и свою слабую сторону. Во многих случаях у нас нет контрольной группы, и поэтому мы не можем с уверенностью сказать, каковы результаты воздействия независимой переменной, так как не знаем точно, каким было бы значение зависимой переменной в отсутствие независимой переменной; мы можем лишь предполагать, что исходная тенденция сохранится. Однако по многим причинам это может оказаться ошибкой. Одна из наиболее важных причин (в терминологии Д.Кэмпбелла и Дж.Стэнли) регрессия к среднему7. Это явление ставит под сомнение валидность выводов, сделанных на основании многих исследовательских программ. [c.144]
В самом общем виде регрессия к среднему это процесс, в ходе которого объекты исследования, имеющие в определенный момент крайние значения по зависимой переменной, при последующих измерениях естественным образом стремятся вернуться к значению по этой переменной, более близкому к среднему, вне зависимости от того, подвергались ли они воздействию некоторой гипотетической независимой переменной. Если такая регрессия к среднему происходит в момент исследования, то исследователь может ошибочно принять естественную регрессию за результат воздействия независимой переменной. Это может представлять собой особую проблему в тех случаях, когда объекты исследования подвергаются воздействию независимой переменной именно потому, что у них появляются необычные значения зависимой переменной.
В нашем последнем примере полиция провела кампанию из-за исключительно большого числа арестов за проституцию. Такое положение было отклонением от нормы для данного города, и оно могло бы исправиться само по себе, даже если бы полиция ничего не предпринимала. Чтобы исключить регрессию в качестве альтернативного объяснения, можно применить программу контролируемых временных рядов.
Рис. 4.5. Гипотетическая тенденция динамики арестов за проституцию в обследуемом городе и в группе контрольных городов
В программе контролируемых временных рядов мы собираем данные об объекте или множестве объектов, которые во всех существенных отношениях сходны с исследуемым объектом или группой объектов, но не подвергались воздействию независимой переменной; и этот объект или группа объектов используется в качестве контрольных при оценке результатов воздействия независимой переменной. В нашем примере можно выбрать один или несколько городов, очень похожих на тот, в котором проводилась кампания по борьбе с проституцией (притом что в этих городах политика в отношении проституции не менялась), и посмотреть количество арестов за те же самые годы. Рис.4.5 демонстрирует некоторые возможные результаты. Сравнивая исследуемый город (в котором проводилась кампания) с группой похожих городов, мы можем заметить, что в отличие от изменившейся тенденции динамики арестов за проституцию в обследуемом городе в период до 1995 г. среднее количество арестов в контрольных [c.145] городах резко возрастает. Это наводит на мысль, что, хотя кампания по борьбе с проституцией не смогла изменить тенденцию, характерную для обследуемого города, она, возможно, предотвратила воздействие тех событий, которые вызвали рост числа арестов в других городах, похожих на данный. В этом случае мы используем различие между показателями для обследуемого города в период после кампании и показателями для контрольных городов в том же году в качестве меры воздействия независимой переменной, исходя из предположения, что, если бы не действия полиции, ситуация в обследуемом городе складывалась бы так же, как и в остальных, похожих на него городах. Например, в 2000 г. воздействие кампании расценивалось как два ареста на тысячу жителей.
В данном примере применение более строгой программы исследований уберегло бы нас от явно [c.146] неверного вывода, что программа, послужившая в качестве эффективного сдерживающего средства, не оказала никакого влияния. [c.147]
ВЫБОР ПРОГРАММЫ ИССЛЕДОВАНИЯ
Существует ряд как экспериментальных, так и квазиэкспериментальных программ, которые мы здесь не рассматривали8. Количество вариаций на базе этих основных программ ограничено лишь вашей собственной изобретательностью, и программа для любого исследования будет соответствовать его конкретной цели. Мы не столько выбираем, сколько создаем подходящую для конкретного случая программу, хотя обычно мы основываемся на одном из ключевых типов программ. При разработке программ исследователи руководствуются тремя основными факторами: требованием валидности, наличием средств и профессиональной этикой.
Цель программы в объяснительных исследованиях заключается в том, чтобы дать возможность делать валидные выводы о причинных отношениях между переменными, исходя из наблюдаемых изменений значений этих переменных. Следовательно, гарантия валидности результатов должна играть главную роль при разработке программы.
С эмпирическим исследованием связано два основных типа валидности: внутренняя валидность и внешняя валидность. Внутренняя валидность имеет отношение к надежности логического базиса, предоставляемого программой для осуществления вывода о том, вызывает ли независимая переменная изменение зависимой переменной. Вопрос о внутренней валидности это вопрос типа:
“Имеется ли в программе исследования нечто такое, что позволит отнести причинное воздействие за счет независимой переменной (тогда как она такого воздействия не оказывает) либо не даст возможности установить наличие причинного воздействия, оказываемого независимой переменной?” Например, если имеется значительный тест-эффект, связанный с использованием некоторого определенного измерения, любая программа, не дающая возможности контролировать этот тест-эффект, не будет обладать внутренней валидностью, поскольку может вынудить нас ошибочно проинтерпретировать изменения, [c.147] вызванные тест-эффектом, как доказательства причинного воздействия независимой переменной. Внешняя валидность имеет отношение к возможности обобщения полученных результатов. Есть ли у нас основания надеяться на обнаружение тех же самых причинных воздействий в других условиях? Дает ли исследование возможность понять что-либо относительно той части действительности, которая в нем не представлена? Например, полевой эксперимент, в котором изучается воздействие на пользование автомобилем повышения цен на бензин (в размере доллара на галлон), не обладает внешней валидностью, если он приводится в группе, где среднегодовой доход семьи превышает 100 000 долларов, поскольку нельзя надеяться на то, что так же будут вести себя люди со средним и низким доходом. [c.148]
ФАКТОРЫ, УГРОЖАЮЩИЕ ВАЛИДНОСТИ
К числу основных факторов, представляющих собой угрозу как для внутренней, так и для внешней валидности, относятся следующие9.
Факторы, угрожающие внутренней валидности
1. История: события, отличные от проявлений независимой переменной, которые могут изменить оценки контрольного теста и происходят в промежутке между предварительным и контрольным тестами. Например, широковещательные заявления политического лидера могут изменить отношение испытуемых вне зависимости от некоторой долгосрочной обработки, которой они подвергаются в ходе эксперимента.
2. Развитие: естественные изменения, происходящие с испытуемыми, которые с течением времени оказывают влияние на оценки зависимой переменной вне всякой связи с независимой переменной (например, утомление, рост популяции в регионах, подвергающихся анализу, физическое старение).
3. Нестабильность: случайные изменения в зафиксированных значениях, возникающие вследствие ненадежных измерений, несоответствующего выбора испытуемых или по другим причинам. [c.148]
4. Тестирование: описанный в данной главе тест-эффект.
5. Инструментарий: различия в используемых средствах измерения, которые создают вариации в оценках, не связанные с воздействием независимой переменной (например, разные точки зрения у интервьюеров, плохо отрегулированный прибор, недостаточно точное кодирование).
6. Артефакты регрессии: изменения, происходящие в результате регрессии к среднему, обсуждавшемуся в данной главе.
7. Отбор: различия в оценках, возникающие в результате дифференцированного подхода к формированию экспериментальной и контрольной групп (например, в том случае, когда члены экспериментальной группы подвергаются воздействию независимой переменной в законном порядке, а члены одной из контрольных групп идут на это добровольно).
8. Смертность в эксперименте: разные уровни потерь испытуемых в экспериментальной и контрольной группе. (Например, те объекты, благодаря которым контрольная группа в целом реагирует на независимую переменную так же, как экспериментальная группа, могут выбыть из эксперимента до контрольного теста.)
9. Взаимодействие отбора и развития: непоследовательное проведение процессов отбора, которое ведет к разному уровню развития в экспериментальной и контрольной группах. (Например, в “операции по устрашению” испытуемые экспериментальной группы могут быть старше, так как они изъявили желание участвовать в программе лишь после ряда арестов в качестве малолетних правонарушителей, и они, таким образом, могут перерасти преступность несовершеннолетних скорее, чем более юная контрольная группа.)
Факторы, угрожающие внешней валидности
1. Взаимодействие результатов тестирования: оценки в контрольном тесте испытуемых, прошедших предварительное тестирование, могут быть сочтены непредставительными для совокупности, не прошедшей предварительный тест, в силу того, что предварительный тест [c.149] определенным образом повысил чувствительность испытуемых к независимой переменной.
2. Взаимодействие отбора и проведения эксперимента: в результате непоследовательно проведенного отбора может быть сформирована экспериментальная группа, реагирующая на независимую переменную иначе, чем генеральная совокупность.
3. Реактивное воздействие обстановки эксперимента: условия эксперимента могут быть нерепрезентативны с точки зрения условий окружающего мира.
4. Интерференция нескольких исследований: при одновременном осуществлении более чем одного исследования могут возникнуть изменения, отличные от тех, которые возникли бы, если бы каждое исследование проводилось отдельно.
5. Нерелевантные данные измерений: все измерения отражают многообразные аспекты окружающей действительности, в число которых могут входить нерелевантные компоненты, создающие видимость изменений при отсутствии таковых или маскирующие реальные изменения.
6. Нерелевантные повторения исследований: в том случае, когда независимые переменные являются сложными событиями (таковы, например, посещение тюрьмы в примере с “операцией по устрашению” или высшее образование), исследователи могут не знать, какой из аспектов события вызывает изменение в объектах исследования, и по ошибке не включить релевантный аспект независимой переменной во все экспериментальные предъявления.
В идеале в исследовании должна использоваться программа, позволяющая исключить как можно большее количество факторов, представляющих собой угрозу валидности. Однако и самая лучшая программа будет бесполезной, если у нас нет ресурсов для ее выполнения. Временной фактор, наличие денежных средств, обученных кадров, оборудования все это накладывает ограничения при выборе программы исследования. Если исследователь не уверен, что основные факторы, способные представлять угрозу для валидности в данном исследовании, контролируются программой, удобной с точки зрения имеющихся ограничений на ресурсы, следует отложить реализацию проекта до того момента, пока нужные ресурсы окажутся в его распоряжении. Лучше отказаться от [c.150] исследования вообще, чем провести плохое исследование, в результате которого можно прийти к неверным выводам.
И последнее соображение относительно программы исследования. Оно касается возможного в ходе осуществления программы нарушения профессиональной этики. Не будет ли нанесен кому-либо какой-нибудь ущерб? Если да, то насколько серьезный? Не слишком ли это дорогая цена за ту пользу, которая может быть принесена обществу? Каждый ученый должен ответить на эти вопросы в соответствии со своими ценностными ориентациями и принятыми в его профессии нормами. В приложении Б перечисляются рекомендуемые этические нормы проведения исследований, одобренные в ведущих профессиональных ассоциациях политологов и социологов. Единственный руководящий принцип, который мы можем предложить для решения такого рода проблем, это еще раз высказать наше убеждение, что наука существует не сама по себе, а является инструментом, служащим человечеству. [c.151]
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
Вопросы, касающиеся программы исследования, обсуждаются в ряде общих работ, посвященных методам исследования в социальных науках. К таким работам можно отнести кн.: Ваbbiе Е. The Practice of Social Research, 5 ed. Beltmont, Calif.: Wadsworth, 1989; Miller D.C. Handbook of Research Design and Social Measurement, 5 ed. Newbury Park, Calif.: Sage, 1991; Nachmias D.,Nachmias Ch. Research Methods in the Social Science, 3 ed. NewYork: St.Marotin's, 1987. Большой популярностью пользуется работа: Cook Th.D., Сampbеll D.Т. Quasi-Experimentation. Chicago: Rand McNally, 1979.
Путям разработки надежной логической базы в области социальных наук для интерпретации проводимых исследований посвящена кн.: Вlаlосk H.M., Jr. Causal Inferences in Nonexperimental Research. Chapel Hill: University of North Carolina Press, 1964. Сущность квазиэкспериментальных программ и их использование в социологии рассматривается в статьях сборника: Caporaso J.A., Roos L.L., Jr. (eds.) Quasi-experimental Approaches. Evanstone (Ill.): Northwestern University Press, 1973, а соотношение между экспериментальными и квазиэкспериментальными программами рассматривается в работе:
Асlаnd H. Are Randomised Experiments the Cadillacs of Design? // Policy Analysis. Vol.5. 1979, Spring. Более подробный анализ программы исследования можно найти в: Вlаlосk H.M., Jr. (ed.) Causal Models in Panel and Experimental Designs. N.Y.: Adline, 1985. Еще ряд хороших примеров исследовательских программ см. в: Tufte E.R. Quantitative Analysis of Social Problems. Reading (Mass.): Addison-Wesley, 1970. Удачное использование программы измерения временного ряда представлено в: Imring F.Е. Firearms and Federal Law; The Gun Control Act of 1968. // Journal of Legal Studies. Vol.4. 1975, January. P.133-198. [c.152]
5. КТО, ЧТО, ГДЕ, КОГДА: ПРОБЛЕМА ВЫБОРКИ
Раз в десять лет Бюро переписи, отдел министерства торговли США, проводит перепись, стремясь определить, подсчитать и измерить определенные характеристики образа жизни каждого человека в стране. Закон требует, чтобы все сотрудничали с лицами, проводящими перепись, и давали правдивые ответы на вопросы типа: “сколько у вас телевизоров?”, “есть ли в вашем доме водопровод?”. По имеющимся оценкам, перепись 1990 г. обошлась федеральному правительству в 2 600 000 000 долларов; для получения соответствующей информации было привлечено 480000 служащих, интервьюеров и других лиц, работавших в течение нескольких месяцев. Всего в США было идентифицировано и обследовано около 250 000 000 человек.
Надо ли говорить, что не многие политологи готовы к таким огромным затратам для удовлетворения своих личных исследовательских интересов. В то же время объекты их интересов (объекты исследования) для различных практических целей могут быть столь же многочисленны. Сто миллионов избирателей, четверть миллиарда жителей западных демократий, сто тысяч документов все это может оказаться в центре внимания политологического исследования, хотя количество отдельных объектов в каждом из этих случаев слишком велико, чтобы их можно было всесторонне проанализировать. Даже Бюро переписи, со всеми его тысячами работников и миллионами долларов, оказалось не в состоянии задать каждому идентифицированному липу все свои вопросы. Вместо этого была разработана короткая анкета для большинства населения и более полная для отдельных респондентов. Так же как политологи и многие другие исследователи, Бюро переписи сочло необходимым использовать выборку.
В настоящей главе мы рассмотрим применение и механизм формирования выборки, отбора сравнительно небольшого числа объектов, изучение которых может дать [c.153] нам большой объем информации о генеральной совокупности, из которой они были выбраны. Поступая таким образом, мы будем иметь дело с тем, что мы назвали генерализацией, возможностью делать общие выводы, основанные на анализе небольшого числа объектов. С этой целью мы должны задать себе три вопроса. Во-первых, что же такое репрезентативная выборка? Во-вторых, какие существуют возможности для отбора конкретных объектов, которые образовали бы такую выборку? И в-третьих, сколько объектов необходимо отобрать, чтобы можно было назвать выборку репрезентативной? Рассмотрим поочередно все эти вопросы. [c.154]
РЕПРЕЗЕНТАТИВНАЯ ВЫБОРКА
Фактически мы начнем не с одного, а с трех вопросов: что такое выборка? когда она является репрезентативной? что она собой представляет?
Совокупность это любая группа людей, организаций, интересующих нас событий, относительно которых мы хотим сделать выводы, а случай, или объект, любой элемент такой совокупности1. Выборка любая подгруппа совокупности случаев (объектов), выделенная для анализа. Если мы захотим изучить деятельность законодателей штата по принятию решений, мы могли бы исследовать такую деятельность в законодательных органах штатов Виргиния, Северная Каролина и Южная Каролина, а не во всех пятидесяти штатах и, исходя из этого, распространить полученные данные на генеральную совокупность, из которой были выбраны эти три штата. Если мы хотим исследовать систему предпочтений избирателей Пенсильвании, мы могли бы сделать это, опросив 50 рабочих компании “Ю. С. Стил” в Питсбурге, и распространить результаты опроса на всех избирателей штата. Аналогично, если мы хотим измерить умственные способности студентов колледжей, мы могли бы протестировать всех игроков защиты, зарегистрированных в штате Огайо в данном футбольном сезоне, и затем распространить полученные результаты на генеральную совокупность, частью которой они являются. В каждом примере мы действуем следующим образом: устанавливаем подгруппу внутри генеральной совокупности, довольно [c.154] подробно изучаем эту подгруппу, или выборку, и распространяем наши результаты на всю совокупность. Это и есть основные этапы формирования выборки.
Однако представляется совершенно очевидным, что каждая из этих выборок имеет существенный недостаток. К примеру, хотя законодательные органы Виргинии, Северной Каролины и Южной Каролины и являются частью совокупности законодательных органов штатов, они в силу исторических, географических и политических причин, скорее всего, будут действовать очень схожим образом и совсем иначе, чем законодательные органы таких отличающихся от них штатов, как Нью-Йорк, Небраска и Аляска. Хотя пятьдесят рабочих-сталелитейщиков в Питсбурге действительно могут быть избирателями штата Пенсильвания, они в силу социально-экономического статуса, образования и жизненного опыта, вполне возможно, будут иметь взгляды, отличные от взглядов многих других людей, точно так же являющихся избирателями. И точно так же, хотя футболисты штата Огайо и являются студентами колледжей, они в силу самых разных причин вполне могут отличаться от других студентов. Иными словами, хотя каждая из этих подгрупп действительно является выборкой, члены каждой из них систематически отличаются от большинства остальных членов совокупности, из которой они выбраны. В качестве отдельной группы ни одна из них не является типичной с точки зрения распределения признаков мнений, мотивов поведения и характеристик в генеральной совокупности, с которой она ассоциируется. Соответственно, политологи сказали бы, что ни одна из этих выборок не является репрезентативной.
Репрезентативная выборка это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности. Таким образом, если 50% всех законодательных органов штатов собираются лишь раз в два года, приблизительно половина состава репрезентативной выборки законодательных органов штатов должна быть такого типа. Если 30% избирателей Пенсильвании принадлежат к “синим воротничкам”, около 30% репрезентативной [c.155] выборки для этих избирателей (а не 100%, как в приведенном выше примере) должны быть из числа “синих воротничков”. И если 2% всех студентов колледжей являются спортсменами, приблизительно та же самая часть репрезентативной выборки студентов колледжей должна приходиться на спортсменов. Иными словами, репрезентативная выборка представляет собой микрокосм, меньшую по размеру, но точную модель генеральной совокупности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исходной совокупности. Это распространение результатов и есть то, что мы называем генерализуемостью.
Возможно, пояснить это поможет графическая иллюстрация. Предположим, мы хотим изучать модели членства в политических группах среди взрослого населения США.
Рис. 5.1. Формирование выборки из генеральной совокупности
На рис.5.1 изображено три круга, разделенных на шесть равных секторов. Рис.5.1а представляет всю рассматриваемую совокупность. Члены совокупности расклассифицированы в соответствии с политическими группами (такими, как партии и группы интересов), к которым они относятся. В этом примере каждый взрослый принадлежит по меньшей мере к одной и не более чем к шести политическим группам; и эти шесть уровней членства в одинаковой степени распространены в совокупности (отсюда равные сектора). Предположим, мы хотим исследовать мотивы вступления людей в группу, выбор группы и модели участия, однако из-за ограниченности ресурсов мы в состоянии обследовать только одного из каждых шести членов совокупности. Кого же отобрать для анализа?
Одну из возможных выборок заданного объема иллюстрирует заштрихованная область на рис.5.1б, однако она явно не отражает структуру совокупности. Если бы мы делали обобщения на основе этой выборки, мы пришли бы к выводу: (1) что все взрослые американцы принадлежат к пяти политическим группам и (2) что все групповое поведение американцев совпадает с поведением тех, кто принадлежит именно к пяти группам. Однако мы знаем, что первый вывод не верен, и это может зародить в нас сомнение относительно валидности второго. Таким образом, [c.156] выборка, изображенная на рис.5.1б, нерепрезентативна, поскольку она не отражает распределение данного свойства совокупности (часто называемого параметром) в соответствии с его реальным распространением. Про такую выборку говорят, что она смещена в направлении к членам пяти групп или смещена в направлении от всех остальных моделей членства в группах. Опираясь на такую смещенную выборку, мы обычно приходим к ошибочным выводам относительно генеральной совокупности.
Ярче всего это может быть продемонстрировано на примере катастрофы, постигшей в 30-е годы журнал “Литэрари дайджест”, который организовал опрос общественного мнения относительно результатов выборов. “Литэрари дайджест” представлял собой периодическое издание, в котором перепечатывались редакционные статьи из газет и другие материалы, отражавшие общественное мнение; этот журнал был очень популярен в начале века. Начиная с 1920 г. журнал проводил широкомасштабный общенациональный опрос, в ходе которого более чем миллиону человек по почте рассылались избирательные бюллетени с просьбой отметить, чья кандидатура на предстоящих президентских выборах для них предпочтительнее. В течение ряда лет результаты опроса, проводившиеся журналом, оказывались настолько точными, что опрос, проведенный в сентябре, казалось, делал ноябрьские выборы малосущественными. Да и как при такой большой выборке могла произойти ошибка? Однако в 1936 г. именно это и случилось: с большим перевесом голосов (60:40) победа была предсказана кандидату от республиканской партии Альфу Ландону. На выборах Ландон проиграл инвалиду [c.157] Франклину Д. Рузвельту практически с тем же результатом, с которым должен был победить. Доверие к “Литэрари дайджест” было столь сильно подорвано, что вскоре после этого журнал перестал выходить. Что же произошло? Все очень просто: в голосовании, проведенном “Дайджест”, использовалась смещенная выборка. Почтовые открытки рассылались людям, чьи имена были извлечены из двух источников: телефонных справочников и списков регистрации автомобилей. И хотя прежде этот метод отбора не слишком отличался от других методов, совсем по-другому обстояло дело теперь, во время Великой депрессии 1936 г., когда менее состоятельные избиратели, наиболее вероятная опора Рузвельта, не могли позволить себе иметь телефон, не говоря уж об автомобиле. Таким образом, фактически выборка, использовавшаяся в опросе, организованном “Дайджест”, была смещена в сторону тех, кто, скорее всего, должен был выступать за республиканцев, и при этом еще удивительно, что у Рузвельта был такой хороший результат.
Как же решить эту проблему? Возвращаясь к нашему примеру, сравним выборку на рис.5.1б с выборкой на рис.5.1в. В последнем случае для анализа также отобрана шестая часть совокупности, однако каждый из основных типов совокупности представлен в выборке в той пропорции, в которой он представлен во всей совокупности. Такая выборка демонстрирует, что один из каждых шести взрослых американцев принадлежит к одной политической группе, один из шести к двум и т.д. Такая выборка позволит также выявить другие различия между ее членами, которые могли бы соотноситься с участием в разном числе групп. Таким образом, выборка, представленная на рис.5.1в, является репрезентативной выборкой для рассматриваемой совокупности.
Конечно, данный пример является упрощенным по крайней мере с двух чрезвычайно важных точек зрения. Во-первых, большинство совокупностей, интересующих политологов, более разнообразно, чем та, что приведена в примере. Люди, документы, правительства, организации, решения и т.п. отличаются друг от друга не по одному, а по гораздо большему числу признаков. Таким образом, репрезентативная выборка должна быть такой, чтобы каждая из основных, отличная от других область была [c.158] представлена пропорционально ее доле в совокупности. Во-вторых, ситуация, когда реальное распределение переменных, или признаков, которые мы хотим измерить, заранее неизвестно, встречается гораздо чаще, чем противоположная, возможно, оно не измерялось в предшествующей переписи населения. Таким образом, репрезентативная выборка должна быть построена так, чтобы она могла точно отражать существующее распределение даже тогда, когда мы не в состоянии прямо оценить ее валидность. Процедура формирования выборки должна иметь внутреннюю логику, способную убедить нас, что, будь мы в состоянии сравнить выборку с переписью, она действительно оказалась бы репрезентативной.
Чтобы обеспечить возможность точного отражения сложной организации данной совокупности и определенную степень уверенности в том, что предлагаемые процедуры способны сделать это, исследователи обращаются к методам статистики. При этом они действуют по двум направлениям. Во-первых, используя определенные правила (внутреннюю логику), исследователи решают вопрос о том, какие именно конкретные объекты им изучать, что именно включать в конкретную выборку. Во-вторых, используя совсем другие правила, они решают, сколько объектов выбрать. Мы не будем подробно изучать эти многочисленные правила, рассмотрим лишь их роль в политологическом исследовании. Начнем рассмотрение со стратегий выбора объектов, образующих репрезентативную выборку. [c.159]
ПРОЦЕДУРЫ ФОРМИРОВАНИЯ РЕПРЕЗЕНТАТИВНОЙ ВЫБОРКИ
Как видно из примеров предыдущего раздела, не все выборки в равной степени репрезентативны. Действительно, фиаско, постигшее “Литэрари дайджест”, хотя и один из самых известных, однако вряд ли единственный пример исследования, опиравшегося на плохо сформированную выборку. Предварительные выборы, в которых люди участвуют по собственной воле и могут голосовать за кандидата более одного раза; уличные интервью, в которых выбор места и невозможность контроля за прохожими могут оказать сильное воздействие на результаты; результаты проводимых законодателями опросов в большой [c.159] степени зависят от взглядов более красноречивого и интересующегося политикой меньшинства, представители которого, скорее всего, и будут отвечать на заданные вопросы; анализ иностранной прессы, пропагандистских материалов или материалов, опубликованных исключительно в англоязычных источниках, которые могут почему-либо отличаться от других источников того же самого типа, а также слепое формирование выборки, когда исследователь просто оставляет в определенном месте пачку анкет с инструкциями по их заполнению и отказывается от всякого контроля за отбором респондентов (подход, особенно характерный для студентов-дипломников), все это типичные примеры смещения выборки. Частично эти трудности можно разрешить с помощью осторожного (и очень строго ограниченного) определения совокупности, на которую мы собираемся распространить наши выводы. В случае уличных интервью, например, мы могли бы пожелать распространить полученные результаты лишь на тех людей, которые проходят в данном месте между 10.00 и 11.15 утра 4 марта. Однако с гораздо большим успехом имеющиеся трудности можно разрешить, лишь разработав систематическую и гораздо более изощренную процедуру отбора объектов для анализа.
Ведущий принцип, лежащий в основе такой процедуры, это принцип рандомизации, случайности. Выборка называется случайной (иногда мы будем говорить простая случайная или чистая случайная выборка), если выполняется два условия. Во-первых, выборка должна быть построена таким образом, чтобы любой человек или объект в пределах совокупности имел равные возможности быть отобранным для анализа. Во-вторых, выборка должна быть сформирована так, чтобы любое сочетание из п объектов (где п просто количество объектов, или случаев, в выборке) имело равные возможности быть отобранным для анализа. Все это звучит довольно сложно. И действительно, это более строгое определение случайности, чем то, которым мы пользуемся в быту; однако в основе своей случайный выбор довольно простое и незамысловатое понятие. Это почти то же самое, что выбор с помощью лотереи. Если у нас имеется совокупность, состоящая из 1000 человек, чье поведение мы хотим изучить, исследовав репрезентативную выборку, состоящую из [c.160] 100 человек, мы могли бы написать имена всех 1000 членов совокупности на листочках бумаги одинакового размера, сложить их в барабан, хорошо перемешать и отобрать имена 100 человек в нашу в выборку. При такой процедуре каждый человек имеет равную вероятность быть выбранным (100 шансов из 1 000, или, иными словами, 1 шанс из 10), любое возможное сочетание из 100 человек также имеет равную вероятность выбора. Наличие этих двух видов равновероятности и делает выборку случайной.
При исследовании совокупностей, которые слишком велики, для того чтобы можно было осуществить настоящую лотерею, часто используются простые случайные выборки. Выписать имена нескольких сотен тысяч объектов, сложить их в барабан и выбрать несколько тысяч это все же нелегкая работа. В таких случаях используется другой, однако столь же надежный способ. Каждому объекту в совокупности присваивается номер. Номера объектов, которые будут включены в выборку, определяются с помощью таблицы случайных чисел типа табл. A.1 в приложении А, фрагмент которой воспроизведен на рис.5.2. Последовательность чисел в таких таблицах обычно задается компьютерной программой, называемой генераторам случайных чисел, который, в сущности, помещает в барабан большое количество чисел, случайным образом вытаскивает их и выпечатывает в порядке получения. Иными словами, имеет место все тот же процесс, характерный для лотереи, однако компьютер, используя не имена, а числа, осуществляет универсальный выбор. Этим выбором можно пользоваться, просто присвоив каждому из наших объектов номер.
Рис. 5.2. Фрагмент таблицы случайных чисел
Таблица случайных чисел типа той, что представлена на рис.5.2, может использоваться несколькими разными способами, и в каждом случае необходимо принять три решения. Во-первых, следует решить, сколько разрядов мы будем использовать, во-вторых, необходимо разработать [c.161] решающее правило для их использования; в-третьих, нужно выбрать исходную точку и способ прохождения по таблице.
Первое решение определяется просто количеством объектов в совокупности. Если совокупность состоит из менее чем 10 объектов, используются однозначные числа; при числе объектов от 10 до 99 двузначные числа; от 100 до 999 трехзначные и т.д. В каждом случае мы должны позаботиться о том, чтобы каждый перенумерованный объект имел возможность быть выбранным.
Как только это сделано, мы должны разработать правило, которое бы связывало числа в таблице с номерами наших объектов. Здесь существуют две возможности. Самый простой способ (хотя и не обязательно самый правильный) использовать лишь те числа, которые попадают в число номеров, приписанных нашим объектам. Так, если мы имеем совокупность, состоящую из 250 объектов (и, таким образом, используем трехзначные числа), и решаем начать с левого верхнего угла таблицы и двигаться вниз по столбцам, мы включим в нашу выборку объекты с номерами 100, 084 и 128 и пропустим числа 375 и 990, не соответствующие нашим объектам. Этот процесс будет продолжаться до тех пор, пока не будет определено число объектов, нужных для нашей выборки.
Более трудоемкая, однако методически более правильная процедура основывается на положении, что для сохранения случайности, характерной для таблицы, должно быть использовано каждое число данной размерности (например, каждое трехзначное число). Следуя данной логике и вновь имея дело с совокупностью из 250 объектов, мы должны разбить область трехзначных чисел от 000 до 999 на 250 одинаковых промежутков. Поскольку таких чисел 1000, мы делим 1000 на 250 и находим, что каждая из частей содержит четыре числа. Таким образом, числа таблицы от 000 до 003 будут соответствовать объекту 1, от 004 до 007 объекту 2 и т.д. Теперь, чтобы установить, какой номер объекта соответствует числу таблицы, следует разделить трехзначное число из таблицы и округлить до ближайшего целого числа. С помощью данного метода тот же фрагмент таблицы, которым мы пользовались раньше, позволит нам включить в выборку объекты 025 (100:4), 093 (375:4, округлено в меньшую сторону), [c.162] 021 (084:4), 247 (990:4, округлено в меньшую сторону) и 032 (128:4) и не пропустить ни одного числа из таблицы.
И наконец, мы должны выбрать в таблице исходную точку и способ прохождения. Исходной точкой может быть верхний левый угол (как в предыдущем примере), нижний правый угол, левый край второй строки или любое другое место. Этот выбор абсолютно произволен. Однако, работая с таблицей, мы должны действовать систематически. Мы могли бы взять три первых знака из каждой пятизначной последовательности, три средних знака, три последних знака или даже первый, второй и четвертый знаки. (Из первой пятизначной последовательности с помощью этих различных процедур получаются, соответственно, числа 100, 009, 097 и 109.) Мы могли бы применить эти процедуры в направлении справа налево, получив 790, 900, 001 и 791. Мы могли бы идти вдоль рядов, рассматривая поочередно каждую следующую цифру и игнорируя разбиение на пятерки (для первого ряда будут получены числа 100, 973, 253, 376 и 520). Мы могли бы иметь дело лишь с каждой третьей группой цифр (например, с 10097, 99019, 04805, 99970). Существует множество самых разнообразных возможностей, и каждая следующая ничуть не хуже предыдущей. Однако как только мы приняли решение о том или ином способе работы, мы должны систематически следовать ему, чтобы в максимальной степени соблюдать случайность элементов в таблице.
Таким образом, построение простой случайной выборки может оказаться совсем непростым делом. Кроме тех трудностей, которые мы еще будем обсуждать, данный метод требует большого объема технической работы, особенно когда речь идет о широкомасштабных исследованиях. По этой причине процедуры формирования случайной выборки часто видоизменяют, чтобы увеличить их возможности. Один из таких распространенных вариантов называется систематической случайной выборкой и используется тогда, когда мы хотим исследовать сравнительно большую совокупность, каждый член которой занесен в единый список, такой, как, например, телефонная книга, список студентов, список зарегистрированных избирателей, индекс или оглавление, повестка дня или [c.163] список членов какой-либо организации. Процедура выглядит следующим образом.
Подсчитайте (или оцените) количество объектов в совокупности и разделите его на желательное количество объектов в выборке (обсуждается ниже в данной главе). Если обозначить результат через k, то фактически можно сказать, что мы хотим выбрать один из каждых k объектов, или, говоря по-другому, каждый k-й объект. Это можно пояснить на конкретном примере.
Предположим, что из совокупности в 10 000 публичных заявлений, сделанных министерством обороны, мы хотим сформировать выборку размером в 500 документов; предположим также, что мы как свои пять пальцев знаем хронологический список, включающий все 10 000 документов. Чтобы отобрать систематическую случайную выборку:
1. Мы делим количество объектов в совокупности на желательный размер выборки, чтобы определить число k (в данном случае k= 10 000:500=20).
2. С помощью таблицы случайных чисел мы выбираем номер объекта между 1 и k (в нашем примере между 1 и 20) для включения в нашу выборку.
3. Мы движемся по списку документов, выбирая каждый k-й (двадцатый) объект.
Таким образом, если k равно 20 и мы пользуемся фрагментом таблицы случайных чисел, представленном на рис.5.2, начиная с верхнего левого угла таблицы, рассматривая двузначные числа (k в данном случае находится между 10 и 99) и используя только те элементы таблицы, которые соответствуют реальным номерам объектов (т.е. только те, которые находятся между 01 и 20), первым выбранным объектом будет 10. Мы, таким образом, включаем в нашу выборку объекты 10, 30 (10+k), 50 (10+2k), 70 (10+3k) и т.д., и так вплоть до объекта 9900 (10+499k). Эту верхнюю границу выборки можно задать в виде общей формулы j+(n1)k, где j первое случайное число, a n желаемый объем выборки. Таким образом, можно воспользоваться таблицей случайных чисел в сочетании с единым списком для формирования в целях осуществления анализа выборки объемом в 500 документов.
Техника формирования систематической случайной выборки по сравнению с формированием простой случайной [c.164] выборки имеет два важных преимущества: ее удобно применять по отношению к большим совокупностям, отвечающим условию наличия единого списка, и у нее много потенциальных возможностей использования. Тем не менее, применяя эту процедуру, мы должны иметь в виду одну очень важную ее особенность. Поскольку систематическая случайная выборка менее случайна, чем прямой выбор типа лотереи, в результате может быть получена менее репрезентативная подгруппа. Это можно проследить и на уровне определения, и на операциональном уровне.
Прежде всего вспомним, что случайная выборка это выборка, в которой каждый конкретный объект и каждое возможное сочетание из п объектов имеют равную вероятность быть выбранными. В систематической случайной выборке выполняется только одно из этих условий. Поскольку формирование такой выборки начинается с выбора по таблице случайных чисел первого объекта, любой объект из совокупности в конечном счете имеет равные возможности войти в выборку (хотя и не обязательно при первой попытке, так как она осуществляется в пределах от 1 до k). Однако поскольку далее мы выбираем лишь объекты, отстоящие на k номеров один от другого, не всякое возможное сочетание оказывается допустимым. Так, в примере при k=20 в качестве первого можно выбрать любой объект от 1 до 20, но, как только выбран объект с номером 10, мы уже не можем включить объекты с номерами 9,14, 237 и 5 724 просто потому, что номера этих объектов не отличаются от 10 на целое число k. Следовательно, систематическая случайная выборка это в лучшем случае лишь приближение к истинной случайной выборке.
Данное наблюдение особенно важно, когда список, из которого производится выборка, характеризуется систематической направленностью. Для алфавитных и хронологических списков это обычно не существенно, однако для других типов списков может оказаться важным. Например, мы хотим измерить уровень умственных способностей в выборке, состоящей из учеников школы, в каждом классе которой 20 детей. В школе 100 классов, т.е. всего 2000 учеников. В ответ на нашу просьбу директор предоставляет список всех учеников школы, из которого мы собираемся извлечь выборку объемом в 100 человек. Однако перед нами не алфавитный [c.165] список, а последовательность списков отдельных классов. Более того, список каждого класса дан не в алфавитном порядке, а соответствует положению, занимаемому учеником в классе: лучшие ученики идут вначале, и списки продолжаются в порядке убывания успехов. При таком положении дел, если выбирать каждого двадцатого (2000:100), начиная со случайным образом выбранного объекта под номером 1, мы получим выборку, состоящую из 100 лучших (и, возможно, самых умных) учеников школы. Если случайным образом будет выбран объект 10, в выборку попадут одни середняки. А если начать с объекта 20, то мы выберем лишь самых плохих учеников школы. Иными словами, внутренняя направленность, характеризующая список, на котором основана наша выборка, окажется причиной получения нерепрезентативной выборки. В конце концов все это приведет к тому, что мы либо не сможем обобщить наши результаты на генеральную совокупность, либо (если возникшая ситуация останется незамеченной) придем к потенциально неверным выводам. Хотя данный пример достаточно примитивен и приведен специально в целях иллюстрации, подобного рода списки, характеризующиеся определенной направленностью, действительно существуют, и исследователь, использующий процедуры, формирующие систематическую случайную выборку, должен быть подготовлен к таящейся здесь опасности.
Таким образом, простая случайная выборка это идеал, к которому мы стремимся, а систематическая случайная выборка приближение к этому идеалу. Однако очень часто исследуемая ситуация такова, что не позволяет применить ни тот, ни другой метод. В особенности это касается случаев выборочного исследования. Ведь зачастую не бывает сведенных воедино списков совокупности, подлежащей изучению (так, например, не существует списка всех американских избирателей или всех жителей данного города), и даже количество (не говоря уже о конкретном составе) имеющихся объектов может быть заранее неизвестно. Таким образом, может оказаться невыполненным основное условие, необходимое для формирования простой или систематической случайной выборки, наличие отдельных заранее идентифицируемых объектов. Более [c.166] того, даже тогда, когда эта проблема может быть решена, технические трудности и ограниченные ресурсы могут привести к тому, что оба метода формирования выборки окажутся нереализуемыми. Это происходит потому, что случайный выбор конкретных объектов предполагает условие: в выборку должны быть включены определенные лица, причем может оказаться, что они либо живут далеко друг от друга, либо с ними трудно поддерживать связь. Случайный в строгом смысле слова процесс не допускает никаких замен. Все эти факторы могут привести к таким огромным затратам времени и средств, при которых исследование вообще окажется невозможным.
К счастью, существует другой метод, сохраняющий ценные для нас достоинства случайного выбора и лишенный большинства отмеченных недостатков. Этот метод (его называют либо методом кластерной выборки, либо методом многоступенчатого случайного районирования) нашел широкое применение в выборочном исследовании. В основе многоступенчатой случайной районированной выборки лежит следующее соображение: вместо того чтобы считать в качестве членов выборки конкретных людей, будем рассматривать их как жителей того или иного пункта. Эта замена объясняется тем, что в отличие от людей, переезжающих с места на место, само по себе место жительства остается неизменным. Кроме того, расположение фактически любого места жительства в стране известно и нанесено на карту, каждое является частью различных географически определенных зон, таких, как кварталы, переписные участки, избирательные участки, законодательные округа, города, районы, округа, избирательные округа по выборам в конгресс и, наконец, штаты.
Мы увидим, что некоторые из этих районов обладают свойствами, благоприятными для получения репрезентативной выборки. Пока же отметим, что, принимая во внимание жителя места, которое всегда остается постоянным, а не конкретного человека, который может быть более подвижным, мы оказываемся в состоянии стабилизировать и локализовать процедуру формирования выборки. Фактически мы просто даем другое определение нашему понятию совокупности. Вместо того чтобы говорить (если бы речь шла об исследовании [c.167] в масштабах страны) обо всем населении, живущем в Соединенных Штатах, мы говорим об отдельных людях в местах их проживания. Поскольку с точки зрения любой практической цели между этими группами нет различий, мы можем сформировать выборку на основе второй группы и распространить полученные выводы на первую. Мы пользуемся гораздо более простыми и (по ряду причин, которые будут рассмотрены ниже) гораздо менее дорогостоящими методами выбора мест жительства, и тем не менее мы можем распространять наши выводы не на места жительства, а на населяющих их людей. В этом и состоит основная ценность многоступенчатой случайной районированной выборки.
Сама эта процедура иллюстрируется на рис.5.3, где суммируется практика Центра выборочных исследований (ЦВИ) Мичиганского университета основного национального центра по проведению выборочных исследований в политологии. Хотя в своих частностях процедура, используемая в ЦВИ, слегка отличается от той, которую будем описывать мы, обе они складываются из одних и тех же основных этапов. Итак, предположим, что мы собираемся проводить общенациональное выборочное исследование. Те процедуры, которые мы здесь рассматриваем, безусловно, могут быть применены в менее масштабных проектах.
Начнем с того, что возьмем карту Соединенных Штатов и поделим ее на большое число районов с одинаковой численностью населения2. Это не так трудно, как кажется на первый взгляд, так как правительство уже осуществило такую (или по крайней мере близкую к нему) разбивку, образовав 435 избирательных округов по выборам в конгресс, население каждого из которых составляет немногим более полумиллиона человек. Мы приписываем каждому такому округу одно из чисел между 1 и 435 и, пользуясь таблицей случайных чисел, отбираем для анализа несколько округов. Сколько именно округов будет выбрано, зависит как от предельного размера формируемой выборки, так и от имеющихся в нашем распоряжении ресурсов, но в целом, чем больше будет выбрано округов, тем лучше будет выборка. На этом этапе становится очевидной экономичность метода многоступенчатой случайной районированной выборки, поскольку, вместо того чтобы отыскивать [c.169] респондентов по всей стране, мы можем сконцентрировать наше внимание (и денежные средства) на сравнительно небольшом числе территорий, размеры которых в основном поддаются контролю. Таким образом, операции могут быть сосредоточены в нескольких местных отделах.
Как только определены соответствующие округа, каждый из них далее подразделяется на еще меньшие по размеру, однако имеющие одинаковую численность населения территории. Зачастую они могут совпадать с существующими политическими образованиями, такими, как избирательные участки или избирательные округа. Затем эти избирательные участки подразделяются дальше вначале на переписные участки, потом на кварталы и, наконец, на отдельные жилые единицы (дома и квартиры), при этом на каждом этапе отбора используется процесс случайного выбора. В конце концов мы установим множество отдельных жилых единиц, количество которых приблизительно соответствует желательному объему нашей выборки. Их жители и будут объектами нашего исследования.
Существует тем не менее еще одна трудность: хотя обычно мы по ряду причин предпочитаем брать интервью лишь у одного лица по данному адресу, в каждом конкретном доме или квартире вполне может проживать несколько человек. У кого же брать интервью? Большинство исследователей, использующих такие процедуры формирования выборки, снабжают интервьюируемых рядом правил, регулирующих принятие решений на данном этапе, так чтобы в результате было получено множество квот на основе возраста, пола, и/или семейного положения респондента. В одном месте интервьюируемый может получить инструкцию выбрать самого младшего члена семьи мужского пола, в другом самого старшего члена семьи женского пола и т.д. Во многих случаях искомый респондент определяется с помощью карт, подобных тем, что изображены на рис.5.4. Интервьюируемый получает несколько таких карт, в которых объект исследования устанавливается по-разному в зависимости от конкретного состава семьи; кроме того, он снабжается инструкцией последовательно использовать эти карты при переходе от одного интервью к другому. [c.170]
Таким образом, многоступенчатая случайная районированная выборка действительно наглядна. На каждом из этапов среди районов с одинаковым населением (либо среди районов, для которых вероятность быть выбранными устанавливается пропорционально их населению) осуществляется случайный выбор, пока наконец не устанавливаются отдельные жилые единицы. В каждом случае объектом процедуры выбора является географическая местность, и на каждом этапе определяется несколько групп местностей (отсюда и другой термин кластерная выборка). Лишь на последнем этапе этапе установления конкретных респондентов процедура осуществляется с нарушением принципа случайности, однако на столь локальном уровне и с использованием столь аккуратно составленных квот, что воздействие на репрезентативность выборки, по всей вероятности, является при этом минимальным. Во многих случаях многоступенчатая случайная районированная выборка (так же как аналогичные [c.171] процедуры выбора, используемые при выборочном обследовании) дает приемлемое приближение к действительно случайной выборке при небольших затратах времени и средств.
Необходимо упомянуть еще один метод, хотя это скорее не процедура выбора, а всего лишь стратегия. Этот метод известен под названием стратифицированного формирования выборки и используется в первую очередь тогда, когда мы хотим детально исследовать некоторую подгруппу совокупности, которая так мала, что случайная выборка будет содержать слишком небольшое для такого анализа количество членов этой подгруппы.
Предположим, к примеру, что мы хотим проверить гипотезу, согласно которой, в течение первых двух месяцев своего правления (периода, часто называемого “медовым месяцем”) президенты более откровенны со средствами массовой информации, чем когда бы то ни было в дальнейшем, и что для проверки этой гипотезы мы собираемся анализировать содержание стенограмм пресс-конференций президентов. Предположим далее, что за некоторый период времени в нашем распоряжении имеется 500 таких стенограмм и лишь 25 из них представляют пресс-конференции периода “медового месяца” и что мы хотим включить в выборку всего 100 пресс-конференций. Если использовать в этом случае простой или систематический случайный выбор, можно ожидать, что в выборку будет входить приблизительно 5 стенограмм периода “медового месяца” и приблизительно 95 стенограмм последующего периода. Столь небольшое число стенограмм первого типа очень затрудняет осмысленное сравнение, поскольку при этом может оказаться слишком мало примеров, которые бы давали точную картину ответов президента на вопросы журналистов.
В таких условиях, когда мы хотим повысить значимость (придать больший вес) определенной подгруппы, мы применяем метод стратификации. Поступая таким образом, мыв действительности формируем не одну, а две отдельные выборки. Первая это простая или систематическая случайная выборка для меньшей подгруппы (стенограммы периода “медового месяца”), и по объему она будет больше, чем ожидалось, в соответствии с частотой появления этой подгруппы в исходной выборке (в нашем [c.172] примере это будет не 5, а, скажем, 15 объектов). Вторая это простая или систематическая случайная выборка для большей подгруппы (стенограммы всех периодов, следующих после “медового месяца”), и по объему она будет меньше, чем ожидалось, в соответствии с частотой появления в исходной выборке (в нашем примере 85, а не 95 объектов). В данном случае выборку можно назвать стратифицированной относительно времени проведения пресс-конференции. В результате мы получим относительно больше объектов из числа стенограмм периода “медового месяца” для анализа и сопоставления со стенограммами более поздних периодов, чем могли бы отобрать, используя другие методы.
Здесь следует сделать три замечания. Во-первых, стратификация не заменяет простой случайный выбор или какой-либо иной вид выбора, а представляет собой дополнительную возможность, используемую в определенных обстоятельствах. Фактически это процедура формирования выборки второго порядка. При этих условиях стратификация используется достаточно часто, в особенности при опросе общественного мнения, на последних этапах формирования выборки, чтобы обеспечить, к примеру, необходимое равновесие между количеством мужчин и количеством женщин. Таким образом, по своему назначению стратификация очень напоминает квоты, которые используются на последнем этапе многоступенчатой районированной выборки.
Во-вторых, поскольку стратификация требует формирования отдельных выборок, она может использоваться лишь там, где мы в состоянии заранее установить релевантные субсовокупности. В нашем примере это не составляет труда, поскольку до начала формирования выборки мы легко можем отличить стенограммы периода “медового месяца” от стенограмм более поздних периодов. Однако во многих выборочных обследованиях, там, где мы, быть может, захотели бы провести стратификацию, опираясь на менее очевидные переменные, нас могут ожидать большие трудности.
В-третьих, поскольку при стратифицированном формировании выборки используются отдельные выборки и поскольку единственное, что мы в состоянии сделать, это распространить результаты, полученные на данной [c.173] выборке, на ту самую совокупность (или субсовокупность), из которой она извлечена, мы должны с очень большой осторожностью делать выводы на основании исследования, базирующегося на такой выборке. Причина этого вполне ясна: проводя стратификацию с целью повышения в нашем исследовании количества объектов определенного типа, мы фактически смещаем всю выборку в сторону этих объектов.
Чтобы преодолеть это смещение, следует формулировать наши выводы одним из двух единственно возможных способов. Во-первых, мы можем сопоставить друг с другом результаты, полученные для групп, по которым проведена стратификация (например, можем сопоставить результаты для пресс-конференций периода “медового месяца” с результатами для пресс-конференций более поздних периодов). В этом случае мы просто сравниваем результаты для отдельных выборок, не делая никаких выводов о пресс-конференциях в целом. Во-вторых, мы можем приписать разный вес группам, по которым проведена стратификация, пропорционально их доле в совокупности и затем сделать выводы относительно всей совокупности. В этом случае мы в полной мере используем имеющиеся в нашем распоряжении подробные сведения о меньшей подгруппе (пресс-конференциях периода “медового месяца”), но уменьшаем их роль в совокупности всех пресс-конференций (точнее, восстанавливаем правильное соотношение). При использовании данной процедуры стратифицированная выборка может служить в качестве приближения к простой случайной выборке, давая при этом более полную информацию.
Иногда более полезными могут оказаться другие виды выборок. Одна из них это квотная выборка, когда члены совокупности классифицируются в соответствии с несколькими релевантными характеристиками (такими, как пол, возраст или идентификация партийной принадлежности) и лица, обладающие такими свойствами, отбираются в количестве, пропорциональном их доле в совокупности. Еще один тип это экспертная выборка, когда наблюдатель просто выбирает те объекты, которые он по какой-то причине считает типичными или репрезентативными для той совокупности, из которой они извлечены. Такая выборка чаще всего используется при исследовании [c.174] небольших совокупностей и элитарных или специализированных групп. Необходимо, однако, помнить, что такого рода выборки не являются действительно репрезентативными для соответствующих совокупностей (в самом деле, в противоположность случайным выборкам вероятность и степень репрезентативности этих выборок неопределенны) и поэтому они менее предпочтительны. [c.175]
Таблица А.1
Таблица случайных чисел
10097 |
32533 |
|
76520 |
13586 |
|
34673 |
54876 |
|
80959 |
09117 |
|
39292 |
74945 |
37542 |
04805 |
|
64894 |
74296 |
|
24805 |
24037 |
|
20636 |
10402 |
|
00822 |
91665 |
08422 |
68953 |
|
19645 |
09303 |
|
23209 |
02560 |
|
15953 |
34764 |
|
35080 |
33606 |
99019 |
02529 |
|
09376 |
70715 |
|
38311 |
31165 |
|
88676 |
74397 |
|
04436 |
27659 |
12807 |
99970 |
|
80157 |
36147 |
|
64032 |
36653 |
|
98951 |
16877 |
|
12171 |
76833 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
66065 |
74717 |
|
34072 |
76850 |
|
36697 |
36170 |
|
65813 |
39885 |
|
11199 |
29170 |
31060 |
10805 |
|
45571 |
82406 |
|
35303 |
42614 |
|
86799 |
07439 |
|
23403 |
09732 |
85269 |
77602 |
|
02051 |
65692 |
|
68665 |
74818 |
|
73053 |
85247 |
|
18623 |
88579 |
63573 |
32135 |
|
05325 |
47048 |
|
90553 |
57548 |
|
28468 |
28709 |
|
83491 |
25624 |
73796 |
45753 |
|
03529 |
64778 |
|
35808 |
34282 |
|
60935 |
20344 |
|
35273 |
88435 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
98520 |
17767 |
|
14905 |
68607 |
|
22109 |
40558 |
|
60970 |
93433 |
|
50500 |
73998 |
11805 |
05431 |
|
39808 |
27732 |
|
50725 |
68248 |
|
29405 |
24201 |
|
52775 |
67851 |
83452 |
99634 |
|
06288 |
98083 |
|
13746 |
70078 |
|
18475 |
40610 |
|
68711 |
77817 |
88685 |
40200 |
|
86507 |
58401 |
|
36766 |
67951 |
|
90364 |
76493 |
|
29609 |
11062 |
99594 |
67348 |
|
87517 |
64969 |
|
91826 |
08928 |
|
93785 |
61368 |
|
23478 |
34113 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
65481 |
17674 |
|
17468 |
50950 |
|
58047 |
76974 |
|
73039 |
57186 |
|
40218 |
16544 |
80124 |
35635 |
|
17727 |
08015 |
|
45318 |
22374 |
|
21115 |
78253 |
|
14385 |
53763 |
74350 |
99817 |
|
77402 |
77214 |
|
43236 |
00210 |
|
45521 |
64237 |
|
96286 |
02655 |
69916 |
26803 |
|
66252 |
29148 |
|
36936 |
87203 |
|
76621 |
13990 |
|
94400 |
56418 |
09893 |
20505 |
|
14225 |
68514 |
|
46427 |
56788 |
|
96297 |
78822 |
|
54382 |
14598 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
91499 |
14523 |
|
68479 |
27686 |
|
46162 |
83554 |
|
94750 |
89923 |
|
37089 |
20048 |
80336 |
94598 |
|
26940 |
36858 |
|
70297 |
34135 |
|
53140 |
33340 |
|
42050 |
82341 |
44104 |
81949 |
|
85157 |
47954 |
|
32979 |
26575 |
|
57600 |
40881 |
|
22222 |
06413 |
12550 |
73742 |
|
11100 |
02040 |
|
12860 |
74697 |
|
96644 |
89439 |
|
28707 |
25815 |
63606 |
49329 |
|
16505 |
34484 |
|
40219 |
52563 |
|
43651 |
77082 |
|
07207 |
31790 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
61196 |
90446 |
|
26457 |
47774 |
|
51924 |
33729 |
|
65394 |
59593 |
|
42582 |
60527 |
15474 |
45266 |
|
95270 |
79953 |
|
59367 |
83848 |
|
82396 |
10118 |
|
33211 |
59466 |
94557 |
28573 |
|
67897 |
54387 |
|
54622 |
44431 |
|
91190 |
42592 |
|
92927 |
45973 |
42481 |
16213 |
|
97344 |
08721 |
|
16868 |
48767 |
|
03071 |
12059 |
|
25701 |
46670 |
23523 |
78317 |
|
73208 |
89837 |
|
68935 |
91416 |
|
26252 |
29663 |
|
05522 |
82562 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
04493 |
52494 |
|
75246 |
33824 |
|
45862 |
51025 |
|
61962 |
79335 |
|
65337 |
12472 |
00549 |
97654 |
|
64051 |
88159 |
|
96119 |
63896 |
|
54692 |
82391 |
|
23287 |
29529 |
35963 |
15307 |
|
26898 |
09354 |
|
33351 |
35462 |
|
77974 |
50024 |
|
90103 |
39333 |
59808 |
08391 |
|
45427 |
26842 |
|
83609 |
49700 |
|
13021 |
24892 |
|
78565 |
20106 |
46058 |
85236 |
|
01390 |
92286 |
|
77281 |
44077 |
|
93910 |
83647 |
|
70617 |
42941 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
32179 |
00597 |
|
87379 |
25241 |
|
05567 |
07007 |
|
86743 |
17157 |
|
85394 |
11838 |
69234 |
61406 |
|
20117 |
45204 |
|
15956 |
60000 |
|
18743 |
92423 |
|
97118 |
96338 |
19565 |
41430 |
|
01758 |
75379 |
|
40419 |
21585 |
|
66674 |
36806 |
|
84962 |
85207 |
45155 |
14938 |
|
19476 |
07246 |
|
43667 |
94543 |
|
59047 |
90033 |
|
20826 |
69541 |
94664 |
31994 |
|
36168 |
10851 |
|
34888 |
81553 |
|
01540 |
35456 |
|
05014 |
51176 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
98086 |
24826 |
|
45240 |
28404 |
|
44999 |
08896 |
|
39094 |
73407 |
|
35441 |
31880 |
33185 |
16232 |
|
41941 |
50949 |
|
89435 |
48581 |
|
88695 |
41994 |
|
37548 |
73043 |
80951 |
00406 |
|
96382 |
70774 |
|
20151 |
23387 |
|
25016 |
25298 |
|
94624 |
61171 |
79752 |
49140 |
|
71961 |
28296 |
|
69861 |
02591 |
|
74852 |
20539 |
|
00387 |
59579 |
18633 |
32537 |
|
98145 |
06571 |
|
31010 |
24674 |
|
05455 |
61427 |
|
77938 |
91936 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
74029 |
43902 |
|
77557 |
32270 |
|
97790 |
17119 |
|
52527 |
58021 |
|
80814 |
51748 |
54178 |
45611 |
|
80993 |
37143 |
|
05335 |
12969 |
|
56127 |
19255 |
|
36040 |
90324 |
11664 |
49883 |
|
52079 |
84827 |
|
59381 |
71539 |
|
09973 |
33440 |
|
88461 |
23356 |
48324 |
77928 |
|
31249 |
64710 |
|
02295 |
36870 |
|
32307 |
57546 |
|
15020 |
09994 |
69074 |
94138 |
|
87637 |
91976 |
|
35584 |
04401 |
|
10518 |
21615 |
|
01848 |
76938 |
Источник: The RAND Corporation. A Million Random Digits with 100 000 Normal Deviates. N.Y.: Free Press, 1966. Р.1.
УСТАНОВЛЕНИЕ НЕОБХОДИМОГО ОБЪЕМА ВЫБОРКИ
После того как определены термины и рассмотрены процедуры выбора, остается обсудить последний вопрос: каким образом следует решать, сколько выбрать объектов. Ответ на этот вопрос в значительной степени требует привлечения сложных статистических понятий, которые мы не в состоянии обсуждать в рамках настоящей книги. По этой причине часть из того, о чем говорится в данном разделе, должна быть принята на веру, хотя в конце главы мы все-таки указываем некоторые книги, в которых эти проблемы обсуждаются. Спешим, однако, подчеркнуть, что большинство соображений, лежащих в основе определения необходимого объема выборки, понять достаточно просто и, прежде чем двигаться дальше, стоит уделить им немного внимания.
Чтобы установить необходимый объем выборки следует учесть несколько факторов. Один из наиболее важных гомогенность степень близости друг к другу членов данной совокупности с точки зрения изучаемых нами характеристик. Если каждый индивидуум в совокупности в точности такой же, как все остальные, то, выбрав всего лишь одного из них, мы получим действительно репрезентативную выборку. Напротив, если каждый индивидуум в совокупности абсолютно не похож ни на какой другой, то, прежде чем мы сможем утверждать, что у нас имеется репрезентативная выборка, нам потребуется провести перепись всей совокупности. В первом случае совокупность называют полностью гомогенной, во второмполностью гетерогенной. Разумеется, в действительности большинство совокупностей располагается между этими двумя полюсами.
Чем гомогенное данная совокупность, т.е. чем меньше различий между ее членами, тем меньшая по объему выборка необходима для ее представления. Напротив, чем гетерогеннее совокупность, т.е. чем больше различий [c.175] между ее членами, тем большая выборка необходима для ее представления. Это особенно важно учитывать при стратифицированном формировании выборки, поскольку самим актом стратификации мы создаем подгруппы, более гомогенные, чем совокупность в целом. Таким образом, внутри уровней можно использовать, не теряя при этом репрезентативности, выборки меньшего объема, чем следовало бы для всей совокупности.
Сходным образом, чем больше категорий мы хотим исследовать, тем больше должна быть выборка. Это вполне естественно, поскольку, увеличивая разнообразие и тонкость наших измерений, мы подчеркиваем гетерогенность исследуемой совокупности. Иными словами, чем больше вопросов мы задаем и чем больше типов ответов допускаем, тем больше вероятность того, что мы обнаружим различия между исследуемыми объектами. Чем больше различий между объектами мы принимаем во внимание, тем больше объектов мы должны изучить, чтобы выборка получилась репрезентативной.
Еще одно важное соображение касается степени точности, которая нам требуется. Мы используем выборку для оценки характеристик больших совокупностей, однако любая оценка может содержать ошибку. Какую ошибку выборки мы готовы допустить? Ответ часто зависит от предполагаемого использования результатов. Если мы получаем деньги за то, что проводим опрос общественного мнения для предсказания результатов выборов, в которых участвуют кандидаты с близкими шансами, мы, скорее всего, захотим иметь минимальную величину ошибки. Если же мы политологи и пытаемся раскрыть основные тенденции в области отношений и поступков людей, мы, видимо, согласимся допустить существенно большую величину ошибки. Вообще, чем большая точность нам требуется, тем больше должна быть наша выборка.
С этой же проблемой связан и второй вопрос: насколько мы можем быть уверены в правильности нашей оценки величины ошибки выборки? Читателю, недостаточно искушенному в статистике, возможно, непросто понять приводимые в этом случае доводы, однако предлагаемый ниже пример может кое-что прояснить. Здесь существенны следующие моменты. Каждая выборка дает нам некоторую оценку характеристик совокупности, однако вследствие [c.176] того, что никакие две выборки не будут в точности одинаковы, эти оценки будут несколько отличаться одна от другой и от оценки совокупности в целом. Это последнее отличие и есть ошибка выборки. Большинство выборок данного объема, взятых из одних и тех же совокупностей, будут очень похожи друг на друга и на саму совокупность, однако может случиться и так, что сформированная выборка будет отличаться от прочих. Может оказаться, что входящие в ее состав женщины, пожилые люди, республиканцы, выпускники колледжей и т.п. включены в таком количестве, которое не отражает реальной доли этих групп в соответствующих совокупностях. Такая выборка, естественно, не будет репрезентативной: она выйдет за рамки допустимой величины ошибки.
Проблема заключается в том, что в реальной действительности мы не всегда знаем внутренние параметры совокупности, для оценки которых предназначена наша выборка (зачастую установление таких параметров и является целью исследования); кроме того, мы формируем не множество выборок, а всего лишь одну. И хотя мы сумеем проконтролировать очевидную валидность нашей выборки, проведя сравнение с другими исследованиями той же самой совокупности или совокупности, похожей на данную, мы не можем быть уверены, что наша выборка не случайное исключение, что она нерепрезентативна (это мало вероятно, но возможно). Однако из занятий статистикой нам известно, что вероятность вытащить из горы яблок гнилое, можно снизить, если увеличить объем выборки. Чем больше объектов мы включим, тем выше вероятность того, что будет получена истинно репрезентативная выборка, которая действительно не выйдет за рамки заданной нами величины ошибки.
Наши рассуждения можно сделать менее абстрактными, если рассмотреть краткие характеристики выборок разного объема, представленные в табл.5.1. Эти характеристики получены на основе более обширных сведений, содержащихся в табл. А.2 и А.3 приложения А. В табл.5.1 перечислены минимальные объемы выборок, соответствующие нескольким уровням ошибки выборки, и степени уверенности для случая простой случайной выборки при относительно гетерогенной совокупности объемом более 100 000 объектов. (Изучение таблиц приложения А, [c.177] послуживших источником для данной таблицы, показывает, что при формировании выборок для меньших совокупностей приводимые цифры могут быть несколько уменьшены, однако при возрастании объема совокупности приводимые значения задают предельный объем выборки.)
Таблица 5.1
Краткие характеристики выборок разного объема
Допустимый процент ошибки выборки |
Степень уверенности |
+ |
0,95 |
0,99* |
|
± 1 |
10 000 |
22 500 |
± 2 |
2 500 |
5 625 |
± 3 |
1 111 |
2 500 |
± 4 |
625 |
1 406 |
± 5 |
400 |
900 |
± 10 |
100 |
|
* Для большей наглядности имеющееся в исходной таблице значение 0,997 округлено до 0,99.
Возможно использовать эти три таблицы каждым из двух методов.
Мы, возможно, захотим задать определенный уровень ошибки выборки, который мы согласны допустить, и степень уверенности, с которой будем действовать. Предположим, что взяты, соответственно, числа ±4% и 0,99. Первое число означает, что любое измерение, которое мы могли бы произвести в нашей выборке, отклоняется не более чем на четыре процента вверх или вниз от истинного значения того же признака в более обширной совокупности. Если, например, мы устанавливаем, что в проводимом исследовании 43% респондентов сообщают о своей солидарности с демократической партией, мы будем считать, что в случае полной переписи населения реальное количество приверженцев демократической партии будет составлять 43% ± 4% или находиться в пределах приблизительно от 39 до 47%. В соответствии с таблицей (если посмотреть на пересечение строки ± 4% и столбца 0,99) для достижения данной степени точности с уверенностью 99% мы должны иметь выборку, состоящую по крайней мере из 1406 объектов. Если мы хотим уменьшить величину ошибки (повысить точность) до, скажем, ± 2% [c.178] (т.е. оценить количество демократов более точно, в пределах от 41 до 45%), мы должны увеличить объем выборки по крайней мере до 5625 объектов. Из таблицы отчетливо видно, что при любой степени уверенности повышение точности требует увеличения выборки.
Второе число, о котом мы говорили, обозначает вероятность того, что наша выборка действительно репрезентативна для более обширной совокупности в рамках заданной степени точности. В данном контексте 0,95 (95% уверенности) означает, что из 100 выборок данного объема, полученных из одной и той же совокупности, 95 выдержат тест на точность, а 0,99 (99% уверенности) означает, что 99 из 100 выборок данного объема, полученных из одной и той же совокупности, будут точны настолько, насколько это было предсказано. Таким образом, вероятность того, что любая конкретная выборка будет давать желаемую точность, равна, соответственно, 95:5 (т.е. 19:1) и 99:1.
Как и следовало ожидать, для каждого уровня ошибки выборки необходимый объем выборки значительно больше в том случае, когда мы хотим достичь 99, а не 95% уверенности. Так, в нашем примере с демократами видно, что при величине ошибки 4% выборка объемом 625 объектов позволяет с 95%-ной уверенностью утверждать, что доля демократов среди населения находится где-то между 39 и 47%, тогда как то же самое утверждение с 99%-ной уверенностью требует выборки объемом по меньшей мере 1406 объектов. Вообще говоря, чем ниже ошибка выборки и чем выше степень уверенности, тем лучше будет то исследование, которое мы проводим. Для политологического исследования степень уверенности 0,95 или 0,99 принято считать вполне приемлемой.
Таблицу такого вида можно использовать иначе. Если, к примеру, мы анализируем исследование, в котором используется выборка, состоящая из 2500 объектов, то тогда можно обратиться к таблице и установить ошибку выборки и степень уверенности. Посмотрев в табл.5.1, видим, что интерпретация может быть неоднозначной. Мы можем считать, что 2500 объектов дают ошибку выборки ± 3% с уверенностью 0,99 или ошибка выборки ±2% с уверенностью 0,95. Каждая из этих интерпретаций в равной степени приемлема, а вместе они помогают прояснить взаимоотношения между точностью и [c.179] уверенностью. При одном и том же количестве объектов мы будем в состоянии располагать высокой степенью уверенности относительно менее точного результата или несколько меньшей степенью уверенности относительно более высокой точности. Однако нельзя одновременно и вкушать от пирога исследования, и оставлять его нетронутым.
Конечно, в идеале мы всегда предпочитаем действовать с минимальными ошибками и с максимальной уверенностью. К сожалению, в дело часто вмешиваются практические соображения. Например, стоимость одного личного интервью в исследовательском проекте может равняться 50 долларам, включая собственно расходы на интервью, расходы на транспорт и пр. Это означает, что при 99%-ной уверенности стоимость снижения величины ошибки с ±3 до ±2% может составлять 130 000 долларов. Во многих случаях различие в качестве результатов не стоит производимых дополнительных затрат, а в гораздо большем числе случаев средств просто нет. Таким образом, важную '' роль в ограничении объема выборки играют ограничения на ресурсы. В большинстве наиболее значительных опросов общественного мнения, а также в большинстве наиболее значительных исследовательских проектов в области политологам используются выборки объемом приблизительно 14001600 респондентов. Такие исследования дают результаты с точностью 34% и со степенью уверенности 0,99 и считаются одновременно и возможными, и достаточно точными. Проекты, использующие контент-анализ или другие относительно менее дорогостоящие методы сбора данных, часто тяготеют к верхнему правому углу таблицы.
Прежде чем мы завершим обсуждение проблемы объема выборки, следует затронуть еще один вопрос, хотя он, несомненно, менее очевиден и интуитивно менее привлекателен, чем все то, о чем мы говорили ранее. Внимательное изучение табл. А.2 и A.3 приложения А показывает, что, достигнув определенного предела, размер совокупности не влияет на объем выборки, которая должна ее представлять. В то время как доказательство этого утверждения выходит за рамки настоящей книги, вытекающие из него следствия касаются нас вплотную. Ведь, в сущности, наличие такого верхнего предела означает, что практически одна и та же выборка, если она должным образом [c.180] сформирована, может быть в равной степени репрезентативна для населения г.Роанока (штат Виргиния), г. Нью-Йорка, Соединенных Штатов и всего Западного полушария. Размер совокупности является важным фактором при определении объема выборки лишь в случае относительно небольших совокупностей.
Итак, подводя итоги, следует подчеркнуть, что, формируя выборку, необходимо очень внимательно следить за тем, чтобы не только отобрать из данной совокупности достаточное количество объектов, но и взять такую группу, которая, как представляется, будет действительно репрезентативной с точки зрения распределения характеристик внутри данной совокупности. Должное внимание на этом этапе процесса исследования в дальнейшем окупится сторицей. Наоборот, небрежность при формировании выборки может нанести непоправимый вред любому исследованию. [c.181]
ЗАКЛЮЧЕНИЕ
Начинающий политолог часто упускает из виду один важный момент: каждый раз, когда осуществляется сбор данных любым методом и из любого источника, у исследователя появляется соблазн распространить свои выводы на все остальные объекты. Именно для того, чтобы подчеркнуть этот факт, мы предпочли обсудить проблему формирования выборки здесь, а не в разделе, посвященном выборочному обследованию. Что бы ни было объектом исследования: события, политические заявления, подборки новостей, политические юрисдикции, организации, общественное мнение или любые другие интересующие вас вопросы, важно понимать определяющую роль процесса отбора и его влияние на значимость и полезность исследования. [c.181]
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
Статистические процедуры, лежащие в основе определения нужного объема выборки, рассматриваются в ряде изданий, к числу которых относятся: Вlаlосk H.M., Jr. Social Statistics. N.Y.: McGraw-Hill, 1979, 2nd ed., chap. 9; Palumbо D.J. Statistics in Political and Behavioral Science. N. Y.: Columbia University Press, 1977; 2nd ed.; Yamane T. Elementary Sampling Theory. Englewood Cliffs (NJ.): Prentice-Hall, 1967.
О практическом применении многоступенчатой случайной районированной выборки можно прочесть в: Веrelsоn В.R. et al. Voting: A Study of Opinion Formation in a Presidental Campaign. Chicago: University of Chicago Press, 1954, app. C, а более детальное описание того же применения данной процедуры имеется в: Interviewer's Manual: Survey Research Center. Ann Arbor Institute for Social Research, University of Michigan, 1976, sec. С; в кн.: Jacob C.H. Debtors in Court: The Consumption of Government Services. Chicago: Rand McNally, 1969, app. В, предлагаются примеры формирования случайной выборки, а в кн.: Patterson Th.E., McClure R.D. The Unseeing Eye: The Myth of Television Power in National Elections. N.Y.: Putnam, 1976, app. В., рассматривается использование многоступенчатой случайной районированной выборки в городе, определенном экспертным путем. Проблема формирования децентрализованной совокупности затрагивается в: Johnstone J.W.С. et al. The News People: A Sociological Portrait of American Journalists and Their Work. Urbana: University of Illinois Press, 1976, ch. 1. Другие примеры процедур выборки регулярно публикуются на страницах журнала “Public Opinion Quarterly”.
Несколько вариантов каждого из этих методов выборки описывается в: Miller D.C. Handbook of Research Design and Social Measurement. NewburyPark, Calif.: Sage, 1991; 5th ed. [c.182]
МЕТОДЫ СБОРА ДАННЫХ
6. ОПРОС
Зачастую лучший (а подчас и единственный) способ узнать, о чем люди думают и как они поступают, состоит в том, чтобы просто спросить их об этом. Признание этого факта привело к тому, что одним из наиболее распространенных методов в социальных науках стал опрос1. Овладение опросной методикой необходимо для понимания того, как развивалась политология в 3080-х годах. В данной главе мы вкратце рассмотрим, в чем заключается этот метод, в каких случаях его уместно применять и каковы его сильные и слабые стороны. В следующих двух главах будут рассмотрены процедуры интервьюирования и шкалирования, усвоение которых небесполезно, если вы хотите успешно осуществить опрос.
Опрос это метод сбора данных, при котором исследователь получает информацию непосредственно от представителей населения, отобранных таким образом, чтобы на основании их ответов можно было с достаточной надежностью делать выводы обо всем населении или о какой-то его части2. Такая информация может быть получена либо с помощью очного или телефонного интервью, либо с помощью заполнения опрашиваемыми анкет-вопросников, доставленных им по почте или кем-то из проводящих опрос. Эти способы являются составной частью опроса как более общего метода. Лица, которые отвечают на вопросы, называются респондентами.
Опрос предоставляет исследователю информацию пяти типов: факты, знания (perceptions), мнения (opinions), отношения (attitudes) и поведенческие отчеты (behavioral reports) респондентов. В разряд фактов входят те биографические сведения о респонденте (возраст, род занятий, место рождения, первое политическое увлечение), которые могут оказаться существенными при интерпретации других данных. К разряду знаний относятся суждения респондента об окружающем мире, т. е. то, что он [c.183] знает или ему кажется, что он знает (например, фамилии должностных лиц или же сведения о политике федерального правительства в отношении торговли с Кубой). В разряд мнений входят суждения респондента о его предпочтениях или взглядах на определенные предметы и события. На выявление мнений нацелены, например, такие вопросы, как:“Вы за или против легализации торговли наркотиками?”, “Кого бы Вы хотели видеть победившим на предстоящих местных выборах?”. К отношениям можно причислить сравнительно устойчивые настроения респондентов и их оценки определенных событий, явлений и идей. Когда мы пытаемся выяснить, в какой мере население одобряет экономическую политику правительства, то при этом имеем дело с отношениями, на которых зачастую основываются определенные мнения. Поведенческие отчеты это утверждения респондентов о том, как они поступают в том или ином случае (как голосуют, читают газетные передовицы, участвуют в деятельности какой-либо политической организации и т. п.)3.
При опросе средством операционализации понятий служат вопросы, а наблюдение состоит в фиксировании ответов респондентов на эти вопросы. Поэтому этот метод особенно подходит для тех исследований, в которых единицами анализа являются индивиды и основные используемые понятия также связаны с индивидами. В исследовании, имеющем дело с такими, допустим, понятиями, как среднегодовой импорт нефти Соединенными Штатами или число преступлений, совершаемых за год с использованием личного огнестрельного оружия, применение опроса неправомерно, потому что рядовые граждане, скорее всего, не располагают интересующей исследователя информацией об этих явлениях (хотя, наверно, интервью с кем-нибудь из представителей министерства энергетики или ФБР и дало бы требуемые сведения). Если же внимание исследователя сфокусировано на мнениях, отношениях или знаниях индивидов, то в этом случае выборочный опрос может оказаться самым оптимальным способом сбора данных. Однако это очень долгий и дорогостоящий метод. Исследователю следует учитывать, что обеспечить адекватное финансирование крупного проекта может быть очень трудно, поэтому, прежде чем [c.184] приступать к выборочному опросу, надо проверить, нет ли другого, более дешевого способа получения необходимой для целей данного исследования информации4. [c.185]
ЭТАПЫ ПРОВЕДЕНИЯ ОПРОСА
Придя к решению использовать опрос в качестве метода сбора данных, какие шаги и в какой последовательности следует предпринимать?
Опросное исследование включает 14 основных видов процедур5. На практике может производиться сразу несколько процедур одновременно, и исследователь вправе по ходу опроса при необходимости возвращаться назад к той или иной процедуре или, наоборот, “перескакивать” вперед. Этапы опроса могут быть описаны следующим образом:
1. Концептуализация определение цели исследования, выдвижение гипотез, уточнение понятий и нахождение их операциональных соответствий в данном опросе (операционализация).
2. Схематизация установление процедур, которые должны быть применены во время опроса, и принятие решения о характере требуемой выборки.
3. Подготовка инструментария составление анкеты или бланка интервью, определение числа и порядка вопросов, подготовка необходимых наглядных пособий или любых других подсобных средств.
4. Планирование рассмотрение финансовых, административных, материально-технических и кадровых проблем, связанных с проведением опроса.
5. Построение выборки отбор предполагаемых респондентов в соответствии с тем из методов, описанных в гл.5, который лучше других подходит для целей и средств данного исследования.
6. Инструктаж подготовка интервьюеров, кодировщиков и другого обслуживающего опрос персонала к работе с респондентами и к обработке данных; снабжение персонала необходимыми материальными средствами.
7. Предварительное тестирование (pretesting) опробование выбранного инструментария на выборке малых размеров с целью проверки правильности понимания респондентами инструкций и вопросов, а также проверки соответствия их ответов ожидаемому типу ответов. [c.185]
8. Опрос почтовый, телефонный или очный опрос участников выборки с применением пилотажного инструментария.
9. Наблюдение за ходом опроса (мониторинг) проверка корректности применения методики опрашивающими, а также контроль за тем, чтобы опрашивались строго только участники выборки (проверка записей интервьюеров, случаев отказа респондентов от опроса; прослушивание телефонных интервью).
10. Контрольная проверка проверка (посредством дополнительных контактов с респондентами) того, все ли члены выборки оказались реально охвачены опросом и всели из них возвратили анкеты.
11. Кодирование преобразование собранных данных в числовую форму.
12. Обработка подготовка данных для анализа.
13. Анализ переработка данных с помощью статистических и других средств с целью получения содержательных выводов.
14. Составление отчета изложение результатов анализа в форме исследовательского отчета.
Далее в этой главе мы осветим некоторые основные моменты, которые исследователю следует принимать во внимание при проведении каждой из вышеупомянутых процедур. [c.186]
КОНЦЕПТУАЛИЗАЦИЯ
На этом этапе происходит сведение общего исследовательского вопроса к набору более конкретных вопросов, доступных для эмпирического изучения. При этом исследователю следует руководствоваться правилами, изложенными в гл. 2 и 3. От обсуждавшихся там процессов концептуализация отличается только тем, что в случае опроса операционализация понятий должна быть увязана с конкретной методикой сбора данных. Подробнее мы рассмотрим это требование при обсуждении инструментария и способов формулирования вопросов.
Решения, принятые на стадии концептуализации, весьма существенны для следующих этапов схематизации опроса и построения выборки. Например, принимая решение о том, к какой группе населения приложима наша концепция, мы тем самым определяем приблизительные [c.186] границы нашей будущей выборки. Выбирая операционализацию, требующую очного интервьюирования, мы заранее ставим для себя условием обеспечение высокого уровня опроса. Лишь только приступая к обдумыванию теоретических аспектов исследования, мы уже должны сообразоваться с грядущими проблемами, например с проблемой наличных средств и с проблемой доступности респондентов. [c.187]
СХЕМАТИЗАЦИЯ ОПРОСА
По своим целям опросы делятся на поисковые, описательные и объяснительные. Поисковый опрос помогает получить информацию, необходимую для более точной формулировки исследовательских вопросов и гипотез в том случае, если об изучаемом явлении известно недостаточно. Описательный опрос способствует точному измерению важных для теории переменных, но не дает основания для выводов о причинных связях. Объяснительный опрос способствует проверке гипотез о причинных связях и помогает понять наблюдаемые закономерности в свете теории. Он должен быть построен так, чтобы исключать любую конкурирующую гипотезу. Данные для каждого из этих типов опроса могут быть получены с помощью очного интервьюирования, телефонного интервьюирования, почтового и прессового анкетирования. Первые шаги в подготовке опроса заключаются в принятии решения о цели опроса и в выборе подходящего для этой цели способа сбора данных. Выбор цели в значительной степени обусловлен уровнем нашего теоретического и эмпирического знания о предмете. Характер методики сбора данных определяется, во-первых, выбранной нами операционализацией, а во-вторых, нашими материальными возможностями. Ниже мы еще поговорим об этом.
В качестве следующего шага нам предстоит избрать способ организации опроса. Основная дилемма, стоящая здесь перед нами, предпочесть ли перекрестную (cross-sectional) или же лонгитюдную схему обследования6. При перекрестном опросе сбор данных производится всего один раз. При условии наличия репрезентативной выборки это позволяет описывать группы населения и отношения между переменными в этих группах в строго определенный момент времени, но лишает [c.187] нас возможности видеть развитие этих групп и отношений во времени. Перекрестный опрос предоставляет нам как бы моментальный снимок движущегося объекта. Такой тип более подходит для поискового или описательного опроса, однако при наличии хорошо разработанной теории и при надлежащем анализе данных он может сослужить неплохую службу и в объяснительном исследовании. Например, при изучении зависимости между типом личности и ее политическим поведением у нас может возникнуть желание утверждать, что уровень самоуважения является относительно устойчивой личностной чертой, лежащей в основе политической активности индивида. Если мы далее, в ходе опроса, установим, что лица с высоким уровнем самоуважения, как правило, более политически активны, чем лица с низким уровнем самоуважения, то у нас появится веское основание настаивать на том, что высокий уровень самоуважения приводит к (или является причиной) повышенной политической активности, несмотря на то что сбор данных, которыми мы располагаем, носил разовый характер.
При лонгитюдном опросе сбор данных производится более одного раза. Основные виды лонгитюдного опроса это трендовое, когортное и панельное обследования.
В трендовых обследованиях в разное время опрашиваются члены нескольких разных выборок, составленных из представителей одной и той же совокупности (например, из избирателей штата Канзас). При этом каждый раз в опросе могут участвовать разные лица, но результаты всего обследования будут репрезентативно отражать тенденцию развития одной и той же совокупности в целом, поскольку, как уже говорилось в гл.5, каждая правильно построенная выборка будет эквивалентна любой другой выборке из данной совокупности. Так, например, если мы в результате проведенных в разное время опросов членов двух выборок из одной и той же группы населения выясним, что степень политических пристрастий респондентов в этих двух выборках неодинакова, то это будет значить, что за тот промежуток времени, который разделяет эти опросы, в степени политических пристрастий данной группы населения в целом произошли изменения. С помощью трендового обследования можно также изучать изменения, происходящие в зависимостях между переменными. Если [c.188] мы, к примеру, обнаруживаем, что из двух опросов, проведенных на выборках из одной и той же группы населения, зависимость между полом респондента и его политической активностью во втором выражена слабее, то можно заключить, что перед нами налицо тенденция к ослабеванию роли фактора пола в политической жизни данной группы населения.
Когортное обследование отличается от трендового тем, что, в то время как последнее репрезентативно по отношению к крупным группам населения или к населению в целом (например, к совокупности американских женщин, французских избирателей, алжирских студентов), первое нацелено на изучение во времени частных, специфических групп. Например, нам нужно сделать выборку из совокупности всех мексиканских граждан, легально иммигрировавших в США в 1985 г., а затем произвести выборку из той же самой группы тремя годами позже с целью определить степень ее адаптации к жизни в США. Хотя при этом в данной группе может наблюдаться некоторое уменьшение числа членов (за счет смертей или отъезда из США), однако новых членов не прибавится.
Как трендовое, так и когортное обследование помогает нам зарегистрировать изменение группы населения во времени, но. поскольку для каждого опроса строится своя выборка, мы не в состоянии определить, каких конкретно членов данной группы касаются наблюдаемые изменения. Это затрудняет выявление имеющихся причинных связей. В панельном обследовании в противоположность этому используется одна и та же выборка, обследуемая в разные моменты времени, что позволяет увидеть, каких членов группы касаются изменения, и определить те особенности личности или опыта респондента, которые связаны с этими изменениями. Например, мы можем проинтервьюировать членов одной и той же выборки из общей совокупности зарегистрированных в округе избирателей до, во время и после избирательной кампании, с тем чтобы установить, какие аспекты кампании в наибольшей степени повлияли на изменения во мнениях избирателей о кандидатах.
Однако наряду с этим важным преимуществом панельное обследование обладает и некоторыми недостатками. Во-первых, оно требует больших материальных издержек, поскольку не терять членов выборки из виду в течение длительного времени плюс опросить их несколько раз стоит недешево. [c.189] Во-вторых, при панельном обследовании исследователь может столкнуться с проблемой реактивности того типа, который описан в гл.4. Уже сам факт того, что человека несколько раз опрашивают по одному и тому же поводу, может вызвать у него желание изменить свое мнение или поведение, чего он, возможно, и не стал бы делать, если бы не опрос. Такая реакция может привести к искажениям в результатах. Во всяком случае, существует риск того, что данная выборка, включенная в исследование, перестанет быть репрезентативной по отношению к генеральной совокупности. В-третьих, валидность панельного исследования может быть поставлена под сомнение за счет убывания выборки. Убывание имеет место тогда, когда респонденты, опрошенные в первый раз, в последующие разы не опрашиваются. Если же те, кто выпадает из опроса, обладают такими релевантными для исследования особенностями, какими те, кто не выпадает из опроса, не обладают, то это может привести к сильно смещенной выборке, что вызовет смещение в результатах и одновременно не позволит экстраполировать их на генеральную совокупность.
Несмотря на эти недостатки, панельное обследование является самым действенным методом из тех, что используются в объяснительных исследованиях, и чаще всего окупает все расходы за счет той дополнительной информации, которую оно приносит.
Особым типом лонгитюдного обследования является экспериментальное обследование, при котором исследователь вызывает изменения в одной или нескольких независимых переменных в промежутке времени между первым и вторым опросами либо подгоняет опросы ко времени до и после некоторого ожидаемого изменения независимой переменной (например, до и после введения в действие нового закона или до и после избрания нового президента страны). Такое обследование может быть использовано в качестве полевого эксперимента и бывает особенно полезно при оценке той или иной правительственной политики. [c.190]
ПОДГОТОВКА ИНСТРУМЕНТАРИЯ
Какую бы схему опроса мы ни избрали, нам в любом случае нужно будет разработать серию вопросов, используемых в качестве рабочего средства для получения [c.190] необходимых измерений. Эта процедура представляет собой продолжение процесса операционализации понятий, начатого на этапе концептуализации; целью ее является разработка инструментария опроса, т. е. либо анкеты, которую респондент заполняет самостоятельно, либо бланка интервью, который заполняется интервьюером в ходе проведения интервью.
При разработке инструментария исследователю следует обращать внимание на: (а) содержание, (б) тип, (в) форму, (г) словесную формулировку и (д) порядок вопросов. Содержание вопроса обусловливается общей исследовательской проблемой или гипотезой и в свою очередь определяет ту информацию, которая может быть получена из ответа. Что нужно знать, чтобы подтвердить гипотезу, и какие вопросы нужно задать, чтобы получить необходимую информацию? Очень важно уметь ясно себе представлять одновременно и то, какую информацию мы желаем получить в ответ на каждый вопрос анкеты, и то, как эта информация будет использована при анализе данных, что нового она внесет в наши знания об объекте исследования.
Почти о любом предмете можно задать массу самых разных вопросов, однако для того, чтобы респондент был в состоянии заполнить анкету, она должна быть относительно короткой. Очные интервью, как правило, должны длиться не более 45 минут, а телефонные не дольше 20 мин. Анкета, пересылаемая по почте, вообще не должна превышать четырех страниц. Стремление к краткости, однако, не должно преобладать над необходимостью формулировать вопросы так, чтобы исключить конкурирующие гипотезы, которые могут возникнуть при анализе данных. Для решения этой проблемы можно посоветовать следовать двум общим правилам. Во-первых, число гипотез или исследовательских вопросов, изучаемых посредством опроса, должно быть сведено к минимуму; это позволит ограничить число переменных, по которым необходимо получить информацию. Во-вторых, отбирая вопросы, отсеивайте те из них, роль которых в предстоящем анализе данных вам заранее неясна.
Опросы обычно включают в себя как вопросы, специфические для данного исследования, так и вопросы общего, “фонового” характера, предназначенные для измерения тех параметров, которые как это бывает ясно из данных предыдущих исследований непосредственно [c.191] связаны с различительными признаками изучаемого типа политического поведения. Общие вопросы включаются в анкету для того, чтобы исключить конкурирующие гипотезы, относящиеся к таким “фоновым” параметрам, и чтобы уточнить наше понимание существующих зависимостей, проследив за тем, как они различаются в разных демографических группах. Практически в любой опросный инструментарий включаются (или по меньшей мере рассматриваются на предмет включения) вопросы, касающиеся следующих параметров:
|
пол возраст расовая принадлежность доход вероисповедание образование род занятий |
семейное положение состав семьи недвижимое имущество партийность национальность срок проживания в данной местности членство в общественных организациях |
|
Тип вопроса определяется тем, имеет ли он открытый или закрытый набор возможных ответов. На вопрос с открытыми возможностями для ответа, или открытый вопрос (open-ended question), респондент волен отвечать своими словами; никакие варианты ответа извне ему не навязываются. Пример такого рода вопроса: “Какая проблема, по Вашему мнению, будет в этом году самой важной на местных выборах?” У подобных вопросов то преимущество, что они позволяют обнаружить непредвиденные повороты в ответах респондентов. Кроме того, они помогают избежать искажения информации, возникающего зачастую за счет наличия недоговоренности или тенденциозности в вариантах ответов, заранее подобранных исследователем. Однако у вопроса с открытыми возможностями для ответа есть и свои недостатки. Дело в том, что он сильно затрудняет сравнение ответов между собой, поскольку каждый респондент при ответе может исходить из своей уникальной, отличной от остальных “системы координат”. Кроме того, такие вопросы могут приводить к пустым или бестолковым ответам, к ответам не по существу или просто длинным, сложным для анализа.
Отвечая на вопрос с закрытым набором возможных ответов, или закрытый вопрос (closed-ended question), респондент [c.192] вынужден выбирать ответ из ограниченного числа предлагаемых в анкете вариантов. Вопросы этого типа легко поддаются сравнению и дальнейшей обработке, они исключают возможность появления не относящихся к делу ответов. Пример вопроса с закрытым набором возможных ответов: “Кем Вы себя считаете: (1) консерватором, (2) умеренным, (3) либералом?” Варианты ответов должны быть в совокупности исчерпывающими (т. е. они должны включать все ответы, какие только можно предугадать) и взаимоисключающими (т. е. на каждый вопрос должно допускаться не более одного варианта ответа). Кроме того, респонденту следует предоставить возможность отражать в ответе степень своей оценки в тех случаях, когда это является значимым. Такой вопрос, как, например: “Некоторые считают, что клиники, в которых производятся аборты женщинам из неимущих слоев, должны содержаться за счет федерального правительства. Согласны ли Вы с таким мнением?” предполагает более широкий набор потенциальных ответов, чем просто “согласен” и “не согласен”. Спектр возможных оценок, наверно, лучше отразит ряд типа “полностью согласен”, “согласен”, “отношусь нейтрально”, “не согласен”, “совершенно не согласен” и “не знаю”.
Даже тогда, когда вопрос с закрытым набором возможных ответов построен хорошо, не исключен риск того, что подобранные исследователем варианты ответов могут повлиять на ответ респондента, а это явно нежелательно. Например, вопрос, подобный следующему: “Какая из приводимых ниже проблем, стоящих сегодня перед США, является, по Вашему мнению, самой важной?” сам по себе уже подразумевает невозможное, а именно: будто исследователь в состоянии перечислить на выбор все мыслимые проблемы; тем самым использование в данном случае закрытого набора вариантов ответов может помешать обнаружить какую-то непредвиденную нами точку зрения. Выбор между двумя вышеописанными типами вопросов должен осуществляться с учетом как доступных нам средств обработки данных (“открытые” вопросы требуют более сложной обработки), так и теоретических и эмпирических знаний о предмете (“закрытые” вопросы требуют лучшей осведомленности о предмете).
Форма вопроса относится к способу его презентации. Помимо наиболее обычной формы: “устный (письменный) вопрос устный (письменный) ответ”, существует [c.193] целый ряд других способов, помогающих респонденту понять, о чем его спрашивают, и сделать сознательный выбор при ответе. Многие способы связаны с использованием наглядных пособий, таких, как схемы, фотографии, карточки с надписями и рисунками. Один из примеров “термометр ощущений”, разработанный в Опросном научно-исследовательском центре Мичиганского университета. Респонденту предъявляют карточку с изображением “термометра ощущений” (см. рис.6.1) и просят оценить, какие ощущения “горячие” или “холодные” у него вызывает тот или иной объект (например, демократическая партия или мэр города, где он проживает), указывая на соответствующее показание “термометра”. Такое наглядное пособие помогает респонденту упорядочить большее число возможных вариантов (например, всех кандидатов на пост президента страны), чем он это мог бы сделать в уме. Процедура состоит в том, что исследователь просто спрашивает мнение респондента отдельно по [c.194] каждому варианту, а затем сравнивает показания “термометра”. Вообще, чем более сложные умственные операции требуются от респондента, тем полезнее могут оказаться наглядные пособия и другие варианты вопросно-ответной формы.
Решающим фактором успеха всего опроса является правильная словесная формулировка вопросов. Ведь если вы не сумеете точно сформулировать интересующий вас вопрос, то и полученный вами ответ не будет соответствовать тому роду данных, которые нужны для проверки вашей гипотезы. Если вопросы задаются таким образом, что они поощряют одни ответы в ущерб другим, то и результаты опроса будут отражать не столько реальный мир, сколько выбор, внушенный самой структурой вопроса. Конечно, в разных исследовательских проектах и вопросы предполагаются разные, но, несмотря на это, мы можем предложить несколько общих правил составления пунктов опроса, способных обеспечить надежные и достоверные результаты. (Более подробно правила формулирования вопросов излагаются в гл.7.)
Во-первых, во всех случаях, когда это не наносит урон содержанию исследования, старайтесь включать те вопросы и понятия, которые были успешно использованы в предыдущих исследованиях. В настоящее время в политологии существует целый ряд хорошо разработанных и всесторонне опробованных в плане их надежности (валидности) стандартизованных мер понятий (measure of concept) из числа часто применяемых на практике7. Использование их в опросе избавляет исследователя от необходимости разрабатывать какие-то новые меры; кроме того, это позволяет сравнивать результаты разных исследовательских проектов.
Во-вторых, прежде чем включать какой-то вопрос в опросный лист, проверьте, могут ли вообще данные респонденты располагать информацией, необходимой для ответа на него. Не спрашивайте респондента о том, чего он заведомо не испытал или не знает, а если возникает сомнение в компетентности респондента, то для ее проверки можно воспользоваться пробными вопросами. В порядке пробы респондента сначала выясняют его уровень знания предмета, а затем просят выразить свое мнение об этом предмете или высказать суждение о нем. Например, можно [c.195] спросить: “Скажите, пожалуйста, какова позиция кандидата Смита по вопросу о торговле с ЮАР?” и, если респондент ответит правильно, задать следующий вопрос:“Вы согласны с такой позицией?” Такой прием позволяет удостовериться в том, что респондент не будет говорить о том, чего он не знает, например из нежелания признаться в своем незнании.
В-третьих, зачастую полезнее, чем вопросы, могут оказаться утверждения о предмете. При этом исследователь обыкновенно просит респондента сказать, в какой степени он согласен или не согласен с серией утверждений, подобранных так, чтобы отразить различные точки зрения по интересующему исследователя предмету. Такая форма имеет ряд преимуществ по сравнению с просто вопросами. С одной стороны, она предоставляет исследователю простое средство измерения интенсивности оценок в тех случаях, когда это важно. С другой стороны, она помогает добиться того, чтобы все респонденты в своих ответах исходили из одной “системы координат”, что увеличивает надежность и достоверность измерений. Кроме того, утверждения на различные темы могут быть перемешаны так, чтобы респондент не догадался, к чему в конечном счете клонит исследователь. Если, к примеру, целью опроса является определить степень согласованности декларируемых респондентами взглядов на гражданские свободы с их терпимостью или нетерпимостью по отношению к отклоняющимся от нормы социальным группам, то серия вопросов, последовательно вытекающих друг из друга, может побудить респондента увидеть неувязки в своих ответах и устранить их, невзирая на то, каково его мнение в действительности. Вместе с тем серия утверждений, выявляющих ту же самую зависимость, но перемежающихся утверждениями на другие темы, не дает разглядеть очевидной закономерности и легко сбивает с толку чересчур догадливого респондента. Наконец, утверждения по сравнению с вопросами легче использовать при построении сложных мер отношений, называемых шкалами или индексами (см. гл.8).
В-четвертых, используя утверждения вместо вопросов, помните, что респонденты имеют обыкновение соглашаться с утверждениями исследователя независимо от своей собственной точки зрения. Эта закономерность называется [c.196] ответной тенденцией (response set), и в тех пунктах опроса, в которых она не учтена, проявляется сдвиг в сторону ответной тенденции (response set bias). Этот феномен легко заметить, если пытаться измерить степень политического консерватизма сначала с помощью шести утверждений, с которыми консервативно настроенные лица по идее должны согласиться, а затем снова с помощью других шести утверждений, с которыми эти лица, скорее всего, не согласятся. Первое измерение почти наверняка “покажет” значительно больший процент консерваторов, чем второе, вне зависимости от реального числа консерваторов в выборке. Пункты опроса следует перемешивать между собой так, чтобы иногда ожидалось согласие, а иногда несогласие с той или иной точкой зрения или отношением.
В-пятых, измерение переменной с помощью одного-единственного пункта опроса может вызвать смещение в результатах. Например, если для измерения степени недовольства населения мерами по устранению расовой сегрегации в школах руководствоваться только ответами на один-единственный вопрос: “Вы одобряете совместную перевозку школьников на автобусах, невзирая на расовую принадлежность?” то в результате можно переоценить степень общественной оппозиции ввиду того, что респонденты лишены в этом вопросе возможности рассмотреть все те аргументы “за” и “против”, которые в реальной ситуации, возможно, смягчили бы их позицию8. Для измерения отношений, которые могут служить основанием для действий в целом, более предпочтительно использовать сразу несколько пунктов опроса и формировать индекс или шкалу (как это показано в гл.8).
Помимо составления отдельных пунктов опроса, исследователь должен подумать и об организации опросного инструментария в целом. Добротные анкеты и бланки интервью обычно состоят из четырех основных частей: вводной части, нескольких вопросов для разминки, основных вопросов и биографических вопросов. (В случае очного интервью имеет место также предварительная часть, во время которой интервьюер выясняет, соответствует ли респондент требованиям данной выборки, и получает его согласие на проведение интервью. Мы еще вернемся к этому в гл.7 при разговоре о подготовке интервьюеров.) [c.197]
Во вводной части респонденту разъясняются задачи исследования, так чтобы убедить его в важности опроса и в том, что опрос заслуживает того, чтобы потратить на него время. Зачастую это удается сделать посредством апелляции к какой-нибудь высокой цели или к общепризнанному авторитету. Если у опроса имеется влиятельный спонсор, то желаемый эффект может произвести фраза типа: “Государственный отдел по трудоустройству поручил нам...” или “Мы проводим опрос для института социологических исследований...”. Объясняя задачу исследования, важно стараться избегать специальных терминов, не употребляющихся респондентами в повседневном общении. Например, было бы неразумно обращаться к респонденту со словами: “Мы проводим исследование связей между массами и элитой с целью определения, в какой степени формальные механизмы представительства являются ширмой для социального контроля со стороны политической элиты”, даже если это высказывание отражает реальную цель исследования. Правильнее было бы сказать иначе: “Мы хотим выяснить, какие у вас и у таких людей, как вы, имеются контакты с выборными представителями власти, и мы надеемся, что результаты этого исследования помогут улучшить работу нашего правительства”. Не рекомендуется лгать респондентам, но вместе с тем во вводной части нельзя раскрывать ту информацию, которая может привести к искажениям в ответах. Если респонденту сообщить, что объектом исследования являются расовые предрассудки, то он будет давать иные ответы, чем если ему сказать, что исследование касается просто отношений между гражданами или какой-нибудь другой нейтральной темы.
Вводная часть может помочь интервьюеру установить хороший контакт с респондентом, а также развеять возможные опасения последнего относительно того, не служит ли опрос прикрытием для каких-либо неблаговидных целей.
Разминочные вопросы тоже помогают достичь непринужденности в общении с респондентом. Это беспристрастные, нейтральные вопросы, задающиеся с целью завязать беседу. Для разминки хорошо бывает спросить респондента о том, давно ли он живет в данной местности, или о том, какие наиболее актуальные проблемы стоят, по его мнению, перед страной или перед его округом. Однако каждый вопрос, [c.198] отобранный в качестве разминочного, должен быть релевантен для данного исследования и должен играть свою определенную роль в анализе, иначе он пропадет втуне. Поэтому разминочные вопросы не выискивают специально, а отбирают из числа основных вопросов.
Основные вопросы составляют ядро опросного инструментария. Порядок пунктов внутри этой группы определяется главным образом необходимостью придерживаться логического хода опроса. Порядок вопросов отнюдь не всегда неважен. Случается, что исследователь хочет задать один и тот же вопрос несколькими способами. При этом различные модификации этого вопроса не должны занимать смежные места в опросе, чтобы респондент не счел их избыточными. Подобным же образом если некоторое явление нуждается в том, чтобы о нем были заданы как общие, так и частные вопросы, то сначала лучше задать общий вопрос, чтобы получить ответ, не обусловленный рядом частных уточнений. Кроме того, вопросы с открытыми возможностями для ответа имеет смысл помещать перед вопросами с закрытым набором возможных ответов, касающимися той же темы, чтобы варианты ответов, предлагаемые в вопросах “закрытого” типа, не могли искажающе повлиять на ответы на вопросы “открытого” типа. Если есть основание полагать, что порядок вопросов будет влиять на ответы, то проверить это можно в ходе предварительного тестирования.
Биографические вопросы имеют целью получение фактических данных о респонденте; иные из них подчас считаются сугубо личными. Эти вопросы обычно помещаются в конец опроса, чтобы у респондента не возникло раньше времени впечатления, что исследователь сует нос не в свое дело, это может помешать опросу. Хотя люди, как правило, довольно охотно сообщают сведения о своем доходе или семейном положении, получение адекватных ответов на биографические вопросы требует аккуратных словесных формулировок.
Помещение биографических вопросов в конец опроса имеет еще то дополнительное преимущество, что скучные вопросы, с какими людям обычно приходиться сталкиваться при заполнении всякого рода бланков, откладываются на потом, а сначала задаются интересные вопросы, и, таким образом, респондент не успевает сразу заскучать. [c.199] Это особенно важно при самостоятельном заполнении анкеты респондентом, потому что ряд шаблонных вопросов в самом начале, ассоциируясь с выполнением какой-то нудной работы, может отбить у респондента охоту заполнять анкету, тогда как вопросы, касающиеся важных проблем, могут, наоборот, возбудить его интерес к заполнению анкеты.
После того как мы разработали основные детали инструментария, нам надо принять решение, как лучше разместить их на бумаге. Это то, что определяет формат инструментария. Эрл Бэбби утверждает: “Формат анкеты, может быть, не менее важен, чем содержание и формулировка вопросов. Неправильная подача текста в анкете может привести к тому, что респонденты станут пропускать вопросы, неверно их понимать и даже в крайнем случае могут бросить заполнять анкету”9. Не менее важным может оказаться и формат бланка интервью. Плохо составленный бланк сбивает с толку интервьюера, заставляет его перескакивать через вопросы, неаккуратно фиксировать ответы и в итоге отталкивает респондента неуклюжим ведением интервью. Мы можем предложить несколько правил расположения анкеты или бланка интервью на бумаге.
Первое правило заключается в том, чтобы не скучивать на листе пункты опроса. Трудно переоценить урон, который может нанести опросу чересчур тесное расположение текста на странице. Во избежание ошибок на каждой странице опросного инструмента оставляйте как можно больше свободного места. В случае бланка интервью эта мера облегчит для интервьюера следование инструкции и фиксирование ответов. В случае самостоятельно заполняемой анкеты это поможет респонденту правильно прочитать и отметить нужные пункты, а кроме того, создаст у него впечатление, что заполнить анкету нетрудно. Уж лучше пусть анкета содержит много листов с несколькими пунктами опроса на каждом из них, чем несколько листов со многими пунктами опроса на каждом. Общее количество страниц в меньшей степени значимо, чем четкое расположение текста на каждой из них, однако нельзя не считаться и с тем эмпирическим фактом, что на заполнение 10 правильно составленных страниц опросного инструмента уходит примерно 30 минут, а это как раз то время, в течение [c.200] которого исследователю обычно удается задерживать внимание респондента.
При расположении материала на бланке интервью исследователь должен одновременно учитывать нужды интервьюера, кодировщика (который будет считывать информацию с заполненного листа) и тех, кто будет заниматься подготовкой этой информации для машинной обработки. Один из основных вопросов, встающих при этом, пользоваться ли предварительно закодированным инструментом. Детально кодирование информации обсуждается в гл.12. В основе своей это операция придания числовых символов ответам, записанным в словесной форме. В предварительно закодированном опросном инструменте каждому ответу уже приписан свой числовой символ, чего нет в предварительно не закодированном инструменте. На рис.6.2 в качестве примера представлена часть предварительно закодированного бланка интервью. Мелкие цифры рядом с закодированными ответами обозначают ту колонку перфокарты, в которую должен быть внесен код. Стрелки указывают оператору, вводящему данные в компьютер, на необходимость перехода к другой строке или новому полю для ввода данных.
Предварительное кодирование инструмента имеет два преимущества. Во-первых, оно в состоянии ускорить процесс интервьюирования, облегчая для интервьюера задачу фиксирования ответов. В большинстве случаев интервьюеру проще обвести в кружок или выписать числовой символ, обозначающий ответ, чем выписывать сам ответ. Это также способствует снижению числа ошибок при считывании и интерпретации заполненного бланка интервью. Во-вторых, предварительное кодирование позволяет оператору работать прямо с опросным инструментом после его заполнения; при этом из обработки устраняется лишняя процедура, связанная с переносом информации с опросного инструмента на какой-то другой носитель, приспособленный для ввода данных в машину.
Хотя существует много разных способов расположения материала на листе предварительно закодированного инструмента, тем не менее важно, чтобы все ответы были по возможности сосредоточены на одной стороне листа, так чтобы респонденты не обращали внимания на те цифры и стрелки, которые их не касаются. [c.201]
Один из самых важных моментов, который следует учитывать при предварительном кодировании, это то, каким способом отождествить все листы и перфокарты, содержащие ответы одного и того же респондента. Как правило, каждому респонденту приписывается свой номер, отличный от остальных, и этот номер проставляется [c.203] в первых нескольких колонках всех перфокарт, содержащих данные опроса этого респондента. Номер также должен быть записан на каждой странице бланка интервью или анкеты, чтобы обработанные данные можно было сверять с необработанными. В том случае, если на респондента приходится две и более перфокарты, в последней колонке каждой из них указывается, которая это карта из числа всех, относящихся к данному респонденту.
Составление предварительной инструкции, обеспечивающей точное и упорядоченное заполнение опросного инструмента, одно из самых трудных дел при подготовке инструментария. Интервьюер имеет возможность хорошо подготовиться и фактически выучить наизусть весь бланк интервью, да и то в сложных случаях ему без инструкции не обойтись. У респондента, самостоятельно заполняющего анкету, нет и такой возможности, потому что анкету он видит впервые. На рис.6.3 показан один из способов, помогающих респонденту ориентироваться в вопросах. Каждому ответу здесь приписан свой номер. Согласно инструкции, респондент должен обвести кружком номер, соответствующий его ответу, и далее оператор сможет прямо с листа ввести этот номер в машину. Стрелки указывают респонденту, в какой последовательности двигаться от вопроса к вопросу. [c.204]
ПЛАНИРОВАНИЕ ОПРОСА И ПОСТРОЕНИЕ ВЫБОРКИ
Разобравшись с форматом и содержанием опросного инструментария, исследователь может переходить к следующим этапам опроса построению выборки и планированию. Методы построения выборки уже обсуждались выше, в гл.5, поэтому здесь мы их не будем затрагивать.
Этап планирования включает в себя:
1) принятие решения о типе предстоящего опроса;
2) разработку вопросов материально-технического обеспечения опроса;
3) разработку вопросов финансирования опроса.
Характер исследовательской проблемы определяет, какой тип опроса необходим, но то, какой тип возможен, диктуется наличием или степенью доступности соответствующих материальных средств. Опросная практика предоставляет нам на выбор четыре основных типа: очное интервьюирование, телефонное интервьюирование, [c.204] анкетирование по почте и опрос через прессу. Принимая то или иное решение, следует учитывать следующие особенности каждого из этих четырех типов опроса.
Очное интервьюирование это самый гибкий тип, поскольку оно допускает использование самых разнообразных способов опрашивания (например, применение наглядных пособий), а также предоставляет интервьюеру возможность настойчиво добиваться от респондента ответа на каждый вопрос, одновременно разъясняя ему непонятные места. Кроме того, очное интервьюирование поставляет исследователю самый большой объем данных, в силу того что при личном общении интервьюер может, как правило, удерживать внимание респондента дольше, чем при телефонном разговоре или при анкетировании. Скорость получения ответов в очных интервью тоже обычно выше. Однако у этого типа опроса есть и свои недостатки. Прежде всего, он очень дорогостоящ, и только наиболее важные исследовательские проекты позволяют финансировать его. Еще одно неудобство состоит в том, что очные интервью иногда дают сильно искаженные результаты, что обусловлено спецификой самого процесса интервьюирования. Зафиксированные ответы могут отражать не столько реальный мир или реальные отношения, сколько воздействие на респондента обстановки, в которой протекает интервью, реакцию респондента на конкретного интервьюера и его стиль опроса, тенденциозность интервьюера и допускаемые им в процессе опроса ошибки или отступления от правил.
Кроме того, последовательный “от двери к двери” опрос трудно контролировать и контролировать качественно. Исследователь не имеет возможности наблюдать за работой интервьюеров в действии (в “полевых условиях”) и должен опираться на различные способы последующей обработки интервью, чтобы удостовериться, что опрос был проведен должным образом. Хотя такие способы как установление контактов с респондентами с целью проверить, были ли они действительно опрошены, а также сравнение ответов, полученных разными интервьюерами, могут дать определенный эффект, они все же не совсем надежны и отнимают много времени. [c.205]
Почтовый опрос другой возможный тип опроса с целым рядом преимуществ:
1. Поскольку почтовые опросы стоят намного дешевле, чем очные, они допускают более широкий круг распространения опросного инструмента и, соответственно, большие выборки.
2. Почтовый опрос позволяет избежать многих неудобств, связанных с распространением опросного инструмента. К таким сложностям относится нежелание интервьюеров работать в определенных районах и их неумение брать интервью у индивидов или семей определенного типа.
3. Почтовый опрос позволяет также избежать тех искажений в результатах, которые обусловлены личными качествами интервьюера.
4. Благодаря анонимности, обеспечиваемой за счет распространения опросного инструмента по почте, ответы респондентов бывают более правдивыми.
5. При почтовом опросе у респондента больше времени на обдумывание ответов, которые соответственно в большей степени отражают его истинные настроения, чем ответы, порождаемые в спешке в ходе очного интервью.
6. За счет централизованности процедуры кодирования и большей стандартизации всех остальных процедур в почтовом опросе меньше риск дублировании ошибок при обработке данных.
7. Почтовый опрос требует меньшего количества обслуживающего персонала. Это позволяет сэкономить деньги и время, а также обеспечивает большую стандартизацию при обработке данных.
Но, к сожалению, у почтового опроса тоже есть свои ограничения. Прежде всего, этот тип опроса требует разработки единообразного опросного листа, рассылаемого по почте всем респондентам выборки, причем выборка должна быть достаточно представительной. Но подобного единого образца, одинаково приемлемого для опроса разных групп населения, данные о которых требуется обобщить, во многих случаях просто не существует. Во-вторых, для того чтобы опрос протекал достаточно быстро, анкеты должны быть короткими. Это значит, что от каждого контакта с респондентом может быть получено относительно небольшое количество информации. В-третьих, исследователь лишен возможности контролировать действия [c.206] респондента по заполнению анкеты. Это чревато, в частности, тем, что анкета может быть заполнена не по правилам или же каким-то другим лицом, не входящим в данную выборку; кроме того, процесс заполнения анкеты может неоправданно затянуться. В-четвертых, на почтовый опрос нельзя полностью положиться в отношении валидности получаемой информации. Ведь у респондента есть время, чтобы “подсмотреть” ответ на вопрос анкеты, особенно если это касается вопроса на проверку знаний (типа такого: “Как фамилия сенатора от Вашего штата?”). И наконец, существуют такие исследовательские проблемы, которые требуют усложненной техники опроса, доступной только опытному интервьюеру.
Телефонный опрос занимает промежуточное положение между очным и почтовым сразу в нескольких отношениях. Число задаваемых вопросов в нем обычно несколько больше, чем в почтовом опросе, но меньше, чем в очном. Скорость получения ответа, как правило, ниже, чем в очном, но выше, чем в почтовом опросе. Хотя источники искажения информации, обусловленные личностью интервьюера, устранены не полностью, все же голос в телефонной трубке менее способен привести к искажениям в ответах, чем живой человек. Наконец, и требования к подготовке обслуживающего персонала находятся в промежутке между тем, чего требует опрос очный, и тем, чего требует почтовый.
К преимуществам телефонного опроса принадлежат относительная быстрота получения ответа, наличие контроля над респондентом и хорошие возможности по обеспечению более адекватных ответов. Его основной недостаток связан с трудностью получения несмещенной выборки. Ведь те люди, у которых телефона нет или телефоны которых не указаны в телефонном справочнике, могут быть не менее релевантными для исследования, чем остальные. И поэтому исключение их из выборки может привести к искаженным результатам. Например, в справочнике часто не указываются домашние телефоны должностных лиц, а многие неимущие люди вообще не имеют телефонов. И это может решающим образом повлиять на итоги такого опроса, целью которого является, например, изучение зависимости между величиной личных доходов и политическим поведением индивида. То, в какой степени [c.207] при телефонном опросе достижима репрезентативность выборки, зависит в основном от особенностей той совокупности людей, в отношении которой требуется сделать обобщение. Смещение выборки, связанное с отсутствием некоторых телефонных номеров, удается преодолеть с помощью метода рандомизированного набора телефонных номеров (random digit dialing) (т. е. с применением датчика случайных чисел), который к тому же увеличивает скорость проведения телефонного опроса10. Организации, профессионально занимающиеся телефонными опросами, широко используют специально разработанные компьютерные технологии. Их применение позволяет сократить число ошибок, так как, во-первых, пользуясь программой, интервьюер точно следует от вопроса к вопросу, а во-вторых, ответы запоминаются автоматически, по мере того, как они заносятся опрашивающим. Современное оборудование также используется для высококачественного контролирования. Для этого существует 2 способа. Первый: контролер группы может прослушивать любое интервью в любое время, чтобы исправить замеченную ошибку спрашивающего. Второй: поскольку данные заносятся в компьютер по мере поступления, легко заметить, в какой мере репрезентативна получаемая информация и внести необходимые коррективы еще в ходе работы. [c.208]
ПРОБЛЕМЫ, СВЯЗАННЫЕ С ФИНАНСИРОВАНИЕМ ОПРОСА
После того как исследователь определил, какой тип опроса позволит получить наиболее полные и надежные данные по интересующему его вопросу, решающим становится поиск необходимых для опроса финансовых средств. Финансированием политологических исследований занимаются как государственные учреждения, так и частные фонды, основываясь при этом на рассмотрении развернутых предложений научных проектов. В поиске возможных спонсоров успех может зависеть от:
(а) наличия финансирующей организации, которая оказывает поддержку исследованиям предлагаемого типа;
(б) тщательности в подготовке такого развернутого плана исследования, в котором бы ясно и убедительно демонстрировалась его обоснованность и научная значимость;
(в) наличия у финансирующей организации нужных фондов в момент предложения ей проекта, а также от [c.208] наличия у нее намерения вложить средства именно в проект предлагаемого типа.
Профессиональный политолог почти всегда имеет возможность связаться с соответствующими подразделениями своего института, которые располагают информацией о доступных на данный момент источниках финансирования и могут помочь в подготовке развернутой заявки о проекте. Разработка ее составляет основную часть этапа планирования, однако, прежде чем она может быть написана, должны быть продуманы все детали материально-технического обеспечения опроса, с тем чтобы в заявку можно было включить четкий план организации опроса и его подробный бюджет. В плане организации исследование делится на целый ряд частных подзаданий, для каждого из которых указываются сроки исполнения и ответственные исполнители. Кроме того, в этом плане оговаривается порядок осуществления централизованного контроля за поступающими данными и порядок отчетности всех исполнителей перед руководителем (руководителями) проекта. В бюджете должны быть перечислены все намечаемые в проекте статьи расходов. Основные их виды это затраты на оплату труда руководящего и обслуживающего персонала, транспортные услуги, услуги средств связи, обучение персонала, кодирование и проверку данных, оборудование, секретарские и конторские услуги, эксплуатацию компьютеров и других средств обработки данных. [c.209]
ОБУЧЕНИЕ И ИНСТРУКТАЖ ПЕРСОНАЛА
Обучение и инструктаж персонала один из важнейших этапов подготовки опроса, поскольку отдельные ошибки и оплошности в работе кодировщиков, интервьюеров и других сотрудников могут привести к несостоятельности результатов опроса в целом. Располагая достаточными средствами, исследователь может обратиться к услугам фирмы, специализирующейся на проведении опросов и имеющей в своем штате опытных интервьюеров; имея дело с таким персоналом, исследователю остается проинструктировать его только в том, что касается особенностей применения конкретного опросного инструментария. При более скромных материальных возможностях исследователю приходится пользоваться услугами интервьюеров, работающих по совместительству (обычно это бывают студенты), которых прежде [c.209] чем допускать к полевой работе надо предварительно обучить. Большая часть сведений о технике интервьюирования, которые могут понадобиться исследователю при обучении интервьюеров, содержится в гл.7. Здесь же мы хотели бы затронуть только вопрос о том, как подготовить интервьюера к вспомогательным операциям, связанным с проведением интервью.
Прежде всего у каждого интервьюера должна быть своя папка-скоросшиватель, где должны находиться все материалы, касающиеся опроса, а именно:
1. Листы бланка интервью; причем начало интервью с каждым новым респондентом хорошо бы отмечать листом цветной бумаги, чтобы легче было ориентироваться;
скалывать скрепками листы отдельного интервью можно лишь после его завершения.
2. Карта района, где будет работать интервьюер, с пояснениями, как ему найти адреса нужных респондентов.
3. Рекомендательное письмо, предъявляемое респонденту в том случае, если он захочет удостовериться в цели интервью.
4. Все необходимые наглядные пособия.
5. Лист, на котором фиксируются детали договоренности с тем или иным респондентом (или семьей) о сроках посещения его (ее) интервьюером (в том числе повторного посещения).
6. Набор ручек, заправленных чернилами какого-нибудь темного цвета, чтобы он контрастировал одновременно и с белой бумагой, и с черным типографским шрифтом бланка интервью (это сразу облегчает фиксирование ответов и кодирование).
Папка-скоросшиватель позволяет интервьюеру по ходу интервью оперативно вынимать и вкладывать обратно нужные листы.
На оборотной стороне первого листа каждого бланка интервью должно быть предусмотрено место для фиксирования причин и обстоятельств возможного отказа респондента от интервьюирования, для описания обстановки, в которой протекает интервью (шумно, мешают посторонние и т. п.), и общей реакции респондента (настроен враждебно, дружелюбно, недоверчиво).
Укомплектовав папку необходимыми материалами, неплохо испытать ее в работе на ком-нибудь из знакомых [c.210] или коллег, чтобы откорректировать имеющиеся погрешности, и лишь потом давать ее интервьюерам. Затем следует проинструктировать интервьюеров относительно того, как пользоваться этими материалами. Для лучшего понимания надо инструктировать одновременно не более пяти интервьюеров; таким образом, если проект крупный, на инструктаж может понадобиться несколько занятий. Иногда бывает полезно показать интервьюерам фильм или продемонстрировать им на практике, как правильно проводить интервью. В любом случае, а особенно тогда, когда интервьюеры совсем неопытны, исследователь должен проследить, чтобы каждый интервьюер в его присутствии потренировался в ведении интервью на ком-нибудь из других членов группы; исследователь при этом должен проверять правильность понимания интервьюером соответствующих процедур. [c.211]
ПРЕДВАРИТЕЛЬНОЕ ТЕСТИРОВАНИЕ
Предварительное тестирование опросного инструментария и всех сопутствующих процедур организации опроса столь же важен для успеха исследования, как пробная поездка для успешной покупки подержанного автомобиля. Он помогает обнаружить проблемы, которые в полной мере могут проявиться только в реальных полевых условиях.
Предварительное тестирование проводится с помощью опроса небольшой выборки респондентов, сходных по ряду свойств с теми, которые будут опрашиваться в составе большой выборки. Выборка в предварительном тестировании не обязательно должна быть представительной в отношении более крупной группы населения. Куда важнее, чтобы она была построена таким образом, чтобы в процедуру предварительного тестирования оказались включенными члены всех таких групп респондентов, которые способны реагировать на инструментарий по-разному. Если, к примеру, имеются основания полагать, что малообразованные люди будут испытывать трудности в пользовании инструментарием, исследователь должен приложить все усилия, чтобы включить в предварительное тестирование респондентов с низким уровнем образования, даже если они составляют лишь незначительную часть исследуемой группы населения. [c.211]
Предварительное тестирование может служить как для тестирования инструментария, в котором исследователь вполне уверен, так и в целях усовершенствования инструментария в ситуации, когда предмет исследования хуже известен исследователю. В первом случае инструментарий проходит предварительное испытание в своем окончательном варианте. Во втором же случае исследователь может захотеть поэкспериментировать с разными вариантами (макетами) инструмента, чтобы узнать, какой из них удобнее в работе. Предварительное тестирование такого типа может включать в себя:
1. Тестирование различных словесных формулировок и форм вопросов.
2. Опробование анкеты, предназначающейся для самостоятельного заполнения респондентом, в очном интервью, чтобы в процессе живого общения с респондентом выявились возможные трудности ее заполнения.
3. Употребление открытых вопросов для выявления типичных ответов, которые затем можно будет включить в набор ответов на закрытые вопросы, с тем чтобы использовать последние в окончательном варианте.
4. Тестирование различных видов инструментария (почтовых анкет, очных интервью, телефонных интервью) с целью определения годности каждого из них.
После внесения в инструментарий коррективов исследователю следует еще раз опробовать его в предварительном тестировании, чтобы выяснить, не сохранилось ли в нем каких-либо недочетов и не возникло ли новых ошибок.
При предварительном тестировании инструмента, рассчитанного на интервьюирование, исследователь может сам провести ряд интервью, чтобы почувствовать инструмент в работе и чтобы увидеть, сколь он эффективен в работе с типическими респондентами. Если это невозможно, то исследователь по крайней мере должен сразу после того, как интервьюеры вернутся с опроса, сесть с каждым из них за стол и еще раз детально просмотреть весь инструмент и сопутствующие процедуры, чтобы установить, в каких пунктах инструкция неясна, какие конкретно процедуры неуклюжи или неудобны в применении, какие вопросы смущают или сбивают с толку респондентов.
Зачастую предварительное тестирование является способом проверки не только опросного инструмента, но и [c.212] техники взятия выборки, а также процедур оперирования с данными. Если в результате применения интервьюером предписанной выборочной техники выясняется, что выборка в предварительном тестировании совершенно нерепрезентативна или что число отобранных респондентов неоправданно мало, то применимость данной выборочной техники в данной исследовательской ситуации ставится под вопрос и требует пересмотра. Если интервьюер, используя отобранные для предварительного тестирования процедуры, испытывает затруднения в фиксировании и получении данных, то для массового полевого исследования следует разработать другие процедуры.
Иногда, когда социологи и политологи предполагают осуществить совершенно новый для них проект исследования, они должны взять на вооружение процедуру пилотажного исследования. Пилотажное исследование это и есть осуществление широкомасштабного проекта, только в миниатюрном виде. Оно составляется на основе логического осмысления всей проблемы будущего исследования, приблизительного расположения вопросов с точки зрения их очевидной целесообразности. В ходе пилотажа проверяются все процедуры, весь инструментарий исследования, выбраковываются неудачные вопросы, вносятся коррективы на отдельных этапах исследования.
Конечно, предварительное тестирование требует средств и времени, но оно абсолютно необходимо, потому что без его проведения исследователь рискует получить негодные или вводящие в заблуждение данные. К проведению предварительного тестирования надо относиться как к покупке страховки, без которой вы можете в какой-то момент оказаться перед целой горой очень дорогостоящей, но негодной информации, чего не случится, если вы вовремя обнаружите и откорректируете все возможные недочеты. [c.213]
ПРОВЕДЕНИЕ ОПРОСА
Завершив подготовительную работу, мы можем наконец приступить к собственно опросу. Он является ядром всего исследования, поскольку именно в ходе него происходит непосредственный сбор данных. То, какие процедуры производятся на этом этапе, зависит от типа [c.213] проводимого опроса. В гл.7 мы приведем несколько советов касательно очного и телефонного интервьюирования. Здесь же мы упомянем о важнейших моментах проведения почтового опроса.
Самые серьезные проблемы, связанные с почтовым опросом, это невозвращение и задержки с возвращением анкет, искажения в ответах и неправильно заполненные анкеты. В среднем для почтового опроса считается вполне допустимым возврат анкет в размере 50% общего числа разосланных, а 70%-ный возврат считается очень хорошим показателем. Однако отсутствие искажений в ответах важнее, чем высокий процент возврата анкет, поскольку задержка с возвращением анкет чревата лишь тем, что выборка будет нерепрезентативной. Существует несколько методов обеспечения большего процента возврата. Они включают в себя следующее.
В почтовом опросе обычно в одном конверте посылаются анкета, сопроводительное письмо, разъясняющее цель опроса, и пустой конверт для отсылки анкеты обратно. Если опрос невелик, анкеты могут непосредственно вручаться респондентам кем-нибудь из персонала опроса, а затем таким же путем забираться у них обратно. В этом случае респонденту труднее забыть по рассеянности об опросе и не заполнить анкету.
Повторное напоминание по почте помогает не только существенно ускорить возврат анкет, но и установить, кто из респондентов почему-либо не получил первого письма. Обыкновенно бывает достаточно трех почтовых отправлений (первого и двух других с напоминаниями). При условии, если возможно легко определить адреса респондентов, уже вернувших анкеты, повторные письма из соображений экономии имеет смысл рассылать только тем, кто анкет не вернул. Если же адреса вернувших анкеты установить затруднительно или не удается вовсе, хорошим решением может явиться рассылка повторных писем всем членам выборки с выражением благодарности в адрес тех, кто ответил, и с напоминанием о необходимости ответить всем остальным. Повторное почтовое отправление должно содержать письмо с просьбой прислать обратно заполненную анкету и дополнительный экземпляр анкеты на тот случай, если первый экземпляр был утерян или не дошел до респондента. [c.214]
Во все почтовые отправления бывает разумно вложить номер телефона, по которому респонденты могут обращаться с вопросами. Это ускоряет процесс возврата анкет и, кроме того, снижает число анкет, заполненных неправильно. Следует также учитывать, что люди, как правило, более склонны отвечать на вопросы анкеты, если она анонимна. Поэтому процент возврата анкет увеличится, если на анкете не будет стоять никаких лишних, непонятных респонденту отметок или цифр (например, ее порядкового номера), которые респондент может воспринять как способ опознания его личности.
Некоторые исследователи предпочитают платить респондентам за возврат анкеты. Процесс получения ответов может ускориться, однако при этом увеличивается риск искажения результатов, ибо те, кого привлекают столь небольшие суммы денег, какие им обычно готов предложить исследователь, вполне могут оказаться нетипичными для данной группы населения в целом и практика денежного вознаграждения может привести к нерепрезентативному переполнению выборки подобными респондентами. Кроме того, оплачивание труда респондентов исключает анонимность опроса, поскольку, прежде чем заплатить, исследователь должен быть в состоянии определить, кто из респондентов вернул анкеты, а кто нет. [c.215]
НАБЛЮДЕНИЕ ЗА ХОДОМ ОПРОСА (МОНИТОРИНГ)
Мониторинг опроса необходим для обеспечения валидности и обобщаемости результатов. С помощью тщательного мониторинга можно выявить случаи чересчур медленного или неравномерного хода опроса и внести в него нужную коррекцию. Во всех типах опроса это предполагает аккуратное сохранение всех заполненных инструментов по мере их поступления.
В случае почтового опроса каждая возвращенная анкета должна быть вскрыта, проверена на предмет правильности ее заполнения и подшита в общий комплект (файл). Каждой анкете должен быть придан серийный номер, так чтобы впоследствии можно было легко установить время ее возврата. Число анкет, поступивших за день, должно отмечаться в особом журнале, чтобы исследователь имел возможность следить за ходом возврата анкет. Если по возвращенной анкете можно установить личность респондента, то исследователю [c.215] следует фиксировать поступление анкет таким образом, чтобы при этом выявлялись возможные диспропорции в ходе их возврата. Если выяснится, что какая-то географическая или демографическая группа респондентов очень пассивно отвечает на анкеты, то может понадобиться лишний раз напомнить им об опросе иначе выборка может стать нерепрезентативной. Вдобавок к этому просматривание поступающих анкет помогает обнаружить промахи, допущенные респондентом, например пропуск последней страницы инструмента или неверное прочтение инструкции в той ее части, где говорится, как следует отмечать нужные пункты анкеты. Последующий телефонный звонок или уточняющее письмо (в случае неанонимного опроса) может помочь спасти анкету, которую иначе придется признать недействительной.
В случае очного опроса мониторинг производится главным образом посредством выслушивания исследователем устных отчетов интервьюеров, по мере того как они возвращаются с опроса. Исследователь или его опытный ассистент должен проверять заполненные бланки интервью с целью определения: (1) те ли люди (те ли семьи) были опрошены, (2) все ли опросные листы были заполнены и возвращены, (3) указаны ли в путеводителе дата и время проведения интервью, (4) проставлены ли в бланке код интервьюера и опознавательный номер респондента, (5) для всех ли отказов давать интервью изложены соответствующие причины и везде ли, где надо, отмечена договоренность о сроке дополнительного визита к респонденту (если во время первого визита интервьюера респондент почему-либо был недоступен). Все это помогает обеспечить правильность выборки и способствует дальнейшей верификации данных.
Мониторинг телефонного опроса включает в себя периодическую проверку записей интервьюеров по тем же параметрам, что и в случае очного интервьюирования. Кроме того, у исследователя или руководителя полевого обследования зачастую имеется возможность тайно прослушивать выборочные интервью. Эта мера усиливает у интервьюеров чувство ответственности, а также помогает обнаруживать и устранять недочеты, допускаемые ими в ходе применения инструмента.
Тщательный мониторинг способен сыграть значительную роль в обеспечении валидности результатов опроса. [c.216]
КОНТРОЛЬНАЯ ПРОВЕРКА
Контрольная проверка (верификация) особенно важна при очном опросе, когда интервьюер в случае его недобросовестности имеет возможность сфальсифицировать результаты интервью, да и добросовестный интервьюер может ошибиться, опросив не того, кого надо. Бывали случаи, что непрофессиональные интервьюеры, чтобы избежать долгих хождений, сочиняли вымышленные интервью, а приходящие няни выдавали себя за хозяев дома и давали за них интервью. Контрольная проверка позволяет исследователю устранить ошибки этого типа и удостовериться в том, что выборка формируется согласно установленной процедуре.
Верификация итогов очного интервью обычно сводится к дополнительной встрече (разговору) с тем или иным респондентом с целью определения: (1) имело ли место интервью на самом деле, (2) все ли вопросы задал интервьюер и все ли ответы он правильно записал. Чтобы это выяснить, спросите респондента, когда имело место интервью и сколько приблизительно оно длилось. Если респондент подтвердит факт проведения интервью, попросите его ответить еще раз на два простых вопроса (взятых из середины и из конца интервью) под тем предлогом, что его первоначальные ответы были записаны неразборчиво. Сверьте новые ответы с теми, которые были зафиксированы ранее.
Поскольку методика построения выборки иногда не позволяет исследователю заранее знать имена или адреса респондентов, то тогда ему имеет смысл воспользоваться обратным телефонным справочником, где телефонные номера перечисляются в порядке их возрастания, который соответствует расположению дома на местности, а не тому или иному порядку расположения фамилий абонентов. Исследователю следует набирать номера тех домов, которые, согласно выборке, должны были попасть под опрос. В подобном случае неправильно было бы звонить просто тем респондентам, фамилии которых указаны в возвращенных анкетах.
Если телефонная связь оказывается неэффективной, то по тем адресам, которые должны были попасть в опрос, могут быть разосланы письма (со вложенными в них открытками с обратным адресом и с упомянутыми выше [c.217] вопросами), обращенные к тому из членов семьи, кто давал интервью, с просьбой заполнить и отослать обратно открытку.
В широкомасштабных опросах верификация осуществляется на выборочной основе, поскольку связываться еще раз со всеми респондентами может оказаться чересчур накладно. Однако если в ходе выборочной проверки в материалах интервьюера обнаруживается хоть одна значительная ошибка или хоть один случай фальсификации, то проверке должны быть подвергнуты и все остальные взятые им (ею) интервью. [c.218]
ВТОРИЧНЫЙ АНАЛИЗ ДАННЫХ ОПРОСА
Остальные этапы опросного исследования рассмотрены в других главах. Здесь мы не будем забегать вперед, но тем не менее нам хотелось бы остановиться на некоторых аспектах анализа данных, не затронутых в других главах.
Надо иметь в виду, что большинство политологов (возможно, даже большая часть политологов, публикующих книги и статьи, основанные на опросных данных) никогда сами не проводят опроса. Происходит это потому, что зачастую очень трудно получить необходимую финансовую поддержку, а также потому, что ответить на тот или иной исследовательский вопрос нередко вполне возможно, используя опросные данные, собранные другими. Изучение данных, собранных кем-то другим, называется вторичным анализом. Ввиду общей дороговизны опросов такой анализ опросных данных весьма обычен11.
Бытует мнение, что вторичный анализ является анализом низшего сорта по сравнению с первичным сбором данных, поскольку он не дает новой информации, пригодной для изучения. Такой подход представляется ошибочным, ибо вторичный анализ иногда бывает в высшей степени желателен в силу целого ряда причин. Прежде всего, результаты почти любого опроса содержат данные, которые первоначальный исследователь нигде не использовал из-за того, что они имеют лишь косвенное отношение к изучаемому им вопросу. А какой-то другой исследователь, возможно, найдет, что эти данные прекрасно подходят для ответа на занимающий его вопрос. Таким образом, вторичный анализ обеспечивает более полное использование данных и способствует экономии средств в ситуации, [c.218] когда уже имеется вполне достаточно нужной информации. Во-вторых, опросы (как и любой другой столь же назойливый, с точки зрения населения, способ сбора информации) несут в себе опасность контаминации населения. Это означает, что многочисленные повторные исследования одного и того же явления среди одной и той же группы населения фактически могут спровоцировать изменения в этом явлении или же вызвать нежелание людей участвовать в дальнейших опросах. Не требуя дополнительных полевых исследований, вторичный анализ сводит на нет возможность подобного рода контаминации. В-третьих, хотя вообще в распоряжении политолога имеется множество методов анализа данных, в рамках одного исследования он будет склонен использовать лишь некоторые из них. А при вторичном анализе исследователь может применить к изучению тех же самых данных другие или новые методы, что, возможно, расширит его понимание предмета или даже приведет к другому ответу на тот же самый, первоначальный исследовательский вопрос.
Самый плодотворный подход при вторичном анализе заключается в том, чтобы сначала выбрать исследовательский вопрос, выработать подлежащие верификации гипотезы, а затем заняться поиском завершенных исследований, в которых имеются данные, необходимые для верификации этих гипотез. Работа в противоположном направлении (т. е. сначала обнаружение некоторого добротного корпуса данных, а затем его изучение в надежде натолкнуться на какой-нибудь важный исследовательский вопрос) хотя в иных случаях и окупается, но зато сильно ограничивает спектр вопросов, доступных взору исследователя.
Первое требование, предъявляемое к корпусу данных, состоит в том, чтобы он был основан на выборке из релевантной для данной задачи группы населения. Например, если мы хотим сделать некоторое обобщение касательно всех женщин США, то изучение выборки из общего числа женщин-избирателей штата Канзас ничего нам не даст. Второе требование касается того, чтобы инструмент опроса содержал релевантные для данной задачи операционализации ключевых переменных, входящих в те гипотезы, которые подлежат верификации. Если, к примеру, в исследовании центральное место занимает проблема различий [c.219] между белыми и неграми, а в первичном корпусе данных расовые различия фиксированы лишь как различия между белыми и небелыми, то изучение этого корпуса в свете данной исследовательской задачи ничего не даст, поскольку в категорию небелых, кроме негров, входят и другие расовые группы (мексиканцы, индейцы и пр.).
Как же выяснить, подходит для нас или нет то или иное исследование? Прежде всего, в хороших исследовательских отчетах описывается операционализация ключевых переменных и указывается, какая выборка была использована в исследовании. Затем, в книгах и журнальных статьях порой можно найти вполне достаточно информации, чтобы судить о пригодности для наших целей приводимого там корпуса данных; поэтому изучение литературы один из важнейших источников данных для вторичного анализа. Наконец, и некоторые политологи не откажутся поделиться своими данными, если их об этом попросить, поэтому корпус данных иногда можно получить, обратившись непосредственно к автору интересующего нас исследования.
К счастью, есть и более систематический и надежный путь к тому, чтобы обнаружить и получить доступ к данным для вторичного анализа. Существует ряд учреждений, собирающих данные так же, как библиотеки собирают книги. Такие учреждения называются архивами данных. Они занимаются классификацией данных, имеющей целью облегчение их дальнейшего поиска, а также переводят данные в форму, удобную для исследователей, которые не имеют отношения к первичному исследованию, в рамках которого были собраны данные. Затем исследователям за плату предоставляется доступ к хранящейся в архиве информации. Ниже перечислены некоторые из наиболее важных архивов социологических данных в США:
Бюро прикладных социологических исследований, Колумбийский университет, Нью-Йорк (Bureau of Applied Social Research, Columbia University, New York), собрание данных опросов общего характера, проводившихся в США;
Библиотека международных социологических данных и справочная служба. Опросный научно-исследовательский центр, Калифорнийский университет, Беркли (International Data Library and Reference Service, Survey Research Center, University of California, Berkeley), большое собрание результатов опросов, проводившихся за пределами США, в основном [c.220] в Азии и Латинской Америке; Межуниверситетский консорциум политических и социологических исследований, Мичиганский университет, Анн-Арбор (Inter-University Consortium for Political and Social Research, University of Michigan, Ann Arbor), очень большое собрание данных опросов, проводившихся в США и за их пределами; особое внимание уделяется политологическим переменным, имеются корпуса сравнительных данных по разным странам и обширный корпус данных по политическому поведению в США;
Центр политологических данных Льюиса Хэрриса, Университет Северной Каролины, Чэпел-Хилл (Louis Harris Political Data Center, University of North Carolina, Chapel Hill), собрание результатов опросов, проводившихся в США Агентством Льюиса Хэрриса по изучению общественного мнения (Louis Harris Public Opinion Polling Agency);
Центр по обследованию общественного мнения в США, Чикагский университет, Чикаго (National Opinion Research Center, University of Chicago, Chicago), собрание результатов опросов, проводившихся данным центром в США, содержит подразделы по ряду социальных проблем; Центр но изучению общественного мнения Роупера, Уильямс-колледж, Уильямстаун, Массачусетс (Roper Public Opinion Research Center, Williams College, Williamstown, Massachusetts), самый большой в США архив социологических данных, содержащий результаты опросов в разных странах и по широкому кругу проблем;
Библиотечная служба социологических данных и программ, Висконсинский университет, Мэдисон (Social Science Data and Program library Service, University of Wisconsin, Madison), собрание, содержащее главным образом данные по социально-экономическим условиям жизни в США, а также специальный файл данных с характеристиками американских городов.
Каждое из этих учреждений публикует списки и общее описание имеющихся и поступающих в его распоряжение опросных данных. Если мы обнаруживаем в таких списках предположительно интересующее нас исследование, то определить его реальную пользу для нас можно по книге кодов. В ней указываются все вопросы, задававшиеся в ходе опроса, и объясняется способ кодирования ответов, что может позволить нам оценить степень соответствия операционализации [c.221] данного исследования нашим гипотезам. После этого за плату мы можем получить из архива нужные данные.
Опрос представляет собой в высшей степени гибкий метод сбора данных, поскольку он может быть легко приспособлен к получению данных по очень широкому кругу вопросов. Однако для того, чтобы в полной мере осознать потенциал опроса, необходимо ближе познакомиться с процессом интервьюирования, составляющего во многом стержень всего опроса, а также с возможностями возникновения данных, обеспечиваемыми техникой шкалирования. Этим вопросам посвящены гл. 7 и 8. [c.222]
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
Литература по опросным исследованиям в социологии самая обширная. Это свидетельствует о том, что опросный метод широко используется не только в социологии и психологии, но также в политологии и других смежных дисциплинах.
Относительно полный обзор опросной методики приводится в кн.: Fоwlеr Р.J., Jr. Survey Research Methods. Newbury Park, Calif.: Sage, 1988. Издание: Backstrom Ch.H., Hursh-Cesаr G.J. Survey Research. N.Y.: John Wiley & Sons, 1981, 2nd ed., представляет собой сравнительно краткое введение в методику опроса, очень ценимое политологами за возможность использовать в практической деятельности. См. также: Ноinvillе G. et al. Survey Research Practice. L.: Heinemann Educational Books, 1978.
О новшествах в опросных методах можно узнать со страниц журнала “Public Opinion Quarterly”. Например, см. там статью: Сlаusen Aage R. Response Validity. // Public Opinion Quarterly. 19681969. Vol.32. P.588-606.
Приемы формулирования вопросов и операционализации в общих чертах рассматриваются в кн.: Oppenheim A.N. Questionnaire Design and Attitude Measurement. N.Y.: Basic Books, 1966.
Вопросы проведения почтовых опросов очень подробно обсуждаются в издании: Еrdоs P.L. Professional Mail Surveys. N.Y.: Mc-Graw-Hill, 1970.
В кн.: Davis J.A. Elementary Survey Analysis. Englewood Cliffs (NJ.): Prentice-Hall, 1971, излагаются основы анализа опросных данных в форме, доступной даже для начинающих. Более подробно эта тема рассматривается в отличной книге: Rosenberg M. The Logic of Survey Analysis. N.Y.: Basic Books, 1968.
Вторичный анализ результатов выборочных опросов является темой кн.: Нуman H.H. Secondary Analysis of Sample Surveys. N.Y.: Wiley, 1972. О приемах интервьюирования см. в кн.: Dоuglas J.D. Creative Interviewing. Beverly Hills: Sage, 1984; Guezel P.J., Beckmans T.R., Сannell Ch.F. General Interviewing Techniques. Ann Arbor, Mich.: Institute for Social Research, 1983. [c.223]
7. ИНТЕРВЬЮИРОВАНИЕ
Очное интервью является одновременно одним из худших и одним из лучших методов сбора информации, доступных ученому-политологу. Наиболее существенный его недостаток связан с тем, что сама ситуация интервьюирования слишком богата возможностями для такой ответной реакции (реактивности) респондента, которая может оказать нежелательное воздействие на результаты обследования. Реакция респондента на внешний облик или стиль поведения интервьюера, на формулировки вопросов, на обстановку, в которой проводится интервью, может породить информационные “помехи”, имеющие отношение не столько к реальному миру, сколько к самому процессу опроса.
Не рассчитывайте, что вам удастся взять под контроль все факторы, влияющие на этот процесс. Бывали случаи, например, когда интервью фактически расстраивалось из-за того, что интервьюер чем-то напоминал респонденту его мать и вызывал тем самым чисто эмоциональную реакцию, или же из-за того, что ранее опрошенный респондент, делясь впечатлениями об опросе со своими соседями, “натаскал” их в отношении ответов. Однако исследователь может предпринять определенные шаги, с тем чтобы свести к минимуму ожидаемые проявления реактивности и увеличить надежность опроса. Об этом мы немного расскажем в этой главе. Нас будет интересовать динамика ведения опроса как при выборочном обследовании, когда респонденты рассматриваются только как представители какой-то генеральной совокупности, так и при так называемом направленном и специализированном интервьюировании, когда респонденты отбираются по какому-то определенному признаку. Эти два типа интервьюирования требуют от исследователя различных навыков и различных методик. В данной главе предлагаются рекомендации по всем этим проблемам. Эти рекомендации, однако, не могут заменить исследователю [c.224] практического опыта, ибо ведение опроса, как и многое другое в социальных науках, является искусством в не меньшей степени, чем наукой. [c.225]
ВЫБОРОЧНОЕ ИНТЕРВЬЮИРОВАНИЕ
Если вы студент-политолог, то вам может понадобиться провести интервьюирование для курсовой работы либо вам могут предложить поработать в качестве интервьюера в рамках одного из проектов, разрабатываемых вашим научным руководителем. Если вы ученый-политолог, то вам, возможно, придется руководить опросом как составной частью научного поиска в рамках ваших профессиональных интересов либо вас могут попросить дать опенку методике опроса, проводимого другим исследователем. В каждом из этих случаев вам понадобится понимание динамики опроса и знакомство с пригодными для него методиками. Хотя методы и техника опроса, эффективные при любом опросе, могут слегка варьироваться в зависимости от типа исследования и от характеров респондентов, мы тем не менее можем предложить некоторые общие правила интервьюирования, применимые в большинстве случаев.
Если можно заранее установить круг респондентов, то в этом случае неплохо будет для начала послать будущим респондентам почтовые открытки с уведомлением о предстоящем визите интервьюера “в связи с проведением важного научного исследования”. Такой прием породит у респондента доверие и увеличит вероятность того, что он согласится дать интервью.
В дополнение к этому исследователь перед началом опроса должен удостовериться в том, что: (а) каждый интервьюер снабжен стандартным текстом “вступительного слова”, которое позволит в простой форме объяснить респонденту суть обследования и сразу же приступить к опросу; (б) каждый интервьюер имеет при себе рекомендательное письмо и документы, а также номер телефона, по которому респондент при желании может проверить личность интервьюера и цель его визита; (в) местная полиция уведомлена о проведении обследования и знает, как отвечать на возможные телефонные звонки по поводу него.
По ходу интервью интервьюеру следует придерживаться следующих правил: [c.225]
1. Время начала и время окончания каждого интервью обязательно фиксируется в бланке интервью.
2. Все заполненные бланки интервью должны быть подписаны интервьюером, либо на них должен быть проставлен код интервьюера, если таковой ему придан.
3. Чтобы установилась атмосфера доверия, надо стараться смотреть в глаза респонденту.
4. Чтобы не снижать темп интервью, ответ на вопрос следует по возможности фиксировать в тот момент, когда задается следующий вопрос.
5. Фиксировать ответы следует как можно более незаметно для респондента.
6. Интервьюеру следует самому читать и фиксировать все ответы. Нельзя разрешать заполнять опросный лист самому респонденту, как это бывает при анкетировании.
7. Если нужно зафиксировать комментарий к ответу, то следует записывать его не в виде резюме, а точно в тех словах, какими пользуется респондент.
8. Если респондент отвечает расплывчато, то надо добиться от него более четкого ответа.
9. Если респондент предваряет ответ словами типа “Нет, но...”, то подобные оценочные замечания следует фиксировать так же, как и сам ответ.
10. Если для получения адекватного ответа требуется предварительно прощупать почву, то интервьюеру следует пометить это себе в бланке и записать те вопросы, которые могут ему в этом помочь (например: “А почему бывает так, что...?”). В хорошо разработанных интервью соответствующие “пробные шары” указываются в бланке для каждого вопроса, при котором они могут понадобиться.
11. Никогда не надо пытаться интервьюировать одновременно более одного человека.
12. Интервью надо стараться проводить в обстановке с глазу на глаз с респондентом. Если кто-то еще будет настаивать на своем присутствии, то надо поставить условие, чтобы в ход интервью не было вмешательства. Не следует вносить изменения в ответы респондента в том случае, если кто-то другой убедит его переменить свое первоначальное мнение.
13. Интервьюеру не следует позволять респонденту втягивать себя в обсуждение предмета обследования, ибо [c.226] замечания интервьюера могут повлиять на ответы респондента.
14. Если формулировка вопроса или предлагаемого варианта ответа вызывает у респондента возражения, то интервьюеру следует не просто настаивать на ней, а объяснить, что он должен задавать вопросы в том виде, как они записаны, и что не он ответствен за формулировки.
15. Возражения респондента на вопрос следует отмечать на полях бланка интервью, поскольку позже они могут пригодиться.
16. Следует фиксировать только первоначальные ответы. Не надо менять зафиксированный ответ, если респондент попросит об этом, после того как услышит следующий вопрос.
17. Когда респондент отвечает “Я не знаю...”, не нужно торопиться задавать ему сразу следующий вопрос, потому что эта фраза иногда бывает вводной для ответа по существу (“Ну, я не знаю... мне кажется, что...”).
18. Никогда не надо преднамеренно менять формулировку или порядок вопросов.
19. Никогда не надо сообщать респонденту (даже если он просит об этом) того, что ответили на данный вопрос другие респонденты.
20. Никогда не надо пытаться опрашивать по памяти. Бланк интервью должен быть у интервьюера всегда перед глазами, и к нему следует обращаться даже тогда, когда интервьюеру достаточно одного взгляда на лист, чтобы вспомнить вопрос.
21. По окончании интервью, прежде чем отпустить респондента, нужно еще раз проглядеть весь бланк, чтобы убедиться, что были заданы все вопросы и зафиксированы все ответы. Уж лучше задать пропущенный вопрос вне общей последовательности или попросить респондента повторить ответ, чем оставить пустое место в бланке интервью без особой на то причины. [c.227]
ФОРМУЛИРОВАНИЕ ВОПРОСОВ
Исследователь может значительно упростить работу интервьюера, если снабдит его четкими инструкциями и тщательно сформулирует все вопросы. Правильно заданный вопрос может зачастую избавить интервьюера от лишних проблем. Например, интервьюеру гораздо легче [c.227] установить контакт с респондентом и избежать “допроса с пристрастием”, если вопросы сформулированы так, что респонденту не приходится то и дело признаваться в своем незнании того или иного факта или в отсутствии каких-либо соображений по данному предмету. Потенциальную напряженность могут в значительной степени снимать фразы типа “Ну, Вам, наверно, уже доводилось об этом читать”, следующие в конце вопроса.
Дать совершенно точные указания относительно того, какие формулировки корректны, а какие нет, невозможно, так как вопросы, подлежащие формулировке, всякий раз обусловлены конкретным предметом исследования. Можно, однако, указать на некоторые типичные формулировочные ошибки, которых следует избегать. Если вопрос не содержит ни одной из этих ошибок, то вполне вероятно, что он сформулирован корректно. Итак, какими не должны быть вопросы:
1. Чрезмерная длина. Если и существует какое-то общее правило формулирования вопросов, то оно состоит в том, чтобы использовать кратчайшие формы вопроса, в коммуникативном отношении наиболее эффективные. Длинные вопросы не только отнимают больше времени, но также куда скорее могут сбить с толку респондента или проскочить у него мимо ушей. Кроме того, длинный вопрос скорее будет содержать в себе и другие ошибки из числа упоминаемых ниже. Никогда не пользуйтесь двумя словами там, где довольно одного. Избегайте условных придаточных и лишних эпитетов. Например, вопрос “Если бы президентские выборы проходили в настоящее время, а не в ноябре, то, как Вы думаете, за кого из следующих кандидатов вы бы проголосовали?” полезно было бы укоротить до “Если бы президентские выборы проходили сегодня, за кого бы Вы голосовали?” (далее приводится список кандидатов).
2. Неопределенность. Стремление к краткости не должно приводить к неполным или неточным формулировкам. Чтобы убедиться, что вопрос содержит всю информацию, необходимую для получения толкового ответа, спросите себя, не захочется ли респонденту ответить на вопрос вопросом. Так, на вопрос “Вы когда-нибудь жалуетесь на государственные учреждения?” респондент может ответить: “Жалуюсь кому? Государственным чиновникам? [c.228] Соседям?” Вопросы бывают неоднозначными, когда они чересчур общи (“Не кажется ли Вам, что люди слишком много думают о политике?”) или неопределенны в отношении места, времени или основания для сравнения (“Вы голосовали на последних выборах?”, “Здесь живет много выходцев из Азии?”, “Как по-Вашему, Смит лучший из кандидатов?”).
3.Двойной смысл. Особо опасная форма неопределенности таится в двойном вопросе. На такой вопрос зачастую невозможно дать цельный ответ, потому что он содержит в себе два самостоятельных вопроса. Например, на вопрос “Как Вам кажется, не тратим ли мы слишком много средств на военную сферу, или же, по-Вашему, важно иметь сильные вооруженные силы?” нельзя ответить ни “да”, ни “нет”, если считать, что иметь сильные вооруженные силы важно, но что текущие расходы на эти цели превышают пределы необходимого. Чтобы избежать таких вопросов, проверьте, не соединяет ли в себе вопрос с союзами “и” или “или” двух вопросов, каждый из которых следует задать отдельно.
4. Тенденциозность. Вопрос может быть сформулирован так, что один ответ на него как бы поощряется в ущерб другому. Такие вопросы обычно называют внушающими. Если респондента спросить “Вы против перевозки школьников автобусами через весь город только ради достижения расового равновесия в шкалах?”, то он будет скорее склонен согласиться, чем в случае вопроса: “Как Вы относитесь к перевозке детей автобусами через весь город для достижения расового равновесия в шкалах?” Фразы, апеллирующие к общественным нормам (такие, как “Как часто Вы выполняете свой гражданский долг, голосуя?”), с очевидностью вносят в ответ искажение. Фразы, предполагающие определенное отношение к какому-либо государственному или общественному деятелю или организации, также могут исказить результат. Например, вопросы, начинающиеся с “Вы согласны с Верховным судом в том, что...?” или “Вы разделяете мнение коммунистов о там, что...?”, по всей вероятности, спровоцируют искаженные ответы.
Если по проблеме существуют противоположные точки зрения, то важно сформулировать вопрос так, чтобы каждая из этих точек зрения выглядела вполне правомерной. Целесообразно формулировать вопрос, к примеру, следующим [c.229] образом: “Некоторые люди, с которыми мы беседовали, считают, что федеральное правительство должно взять нефтяные компании под свой контроль и обращаться с ними как с государственными предприятиями. Другие думают, что это было бы серьезной ошибкой. А как Вы считаете? Как по-Вашему, следует ли федеральному правительству взять под свой контроль нефтяные компании США?” Чтобы избежать тенденциозности, очень важно соблюдать нейтральность в подборе слов.
5. Отрицательные утверждения. Опыт проведения опросов показал, что вопросы типа “Вы считаете, Соединенные Штаты не должны платить репарации Вьетнаму?” респонденты обычно воспринимают в утвердительном смысле и дают ответы, не отражающие их истинного мнения.
6. Убедительность. Несмотря на то что вопрос иногда бывает необходимо предварить пояснением, отстаивать в нем определенную точку зрения является ошибкой. Например, некорректно спрашивать: “Поскольку с эксплуатацией АЭС и захоронением их отходов связано так много опасностей и поскольку мировые запасы урана, необходимого для АЭС, в любом случае будут исчерпаны примерно через 30 лет, некоторые считают, что неразумно вкладывать столько средств в развитие атомной энергетики, в то время как мы могли бы направить их на развитие безопасных и неисчерпаемых видов энергетики, таких, как солнечная, ветряная, метановая. Вы согласны, что наше государство должно резко сократить капиталовложения в атомную энергетику?” Помимо того что это слишком длинный вопрос, несущий в себе риск оказаться непонятым респондентом, он также, по всей видимости, вызовет искажение в ответе, ввиду того, что в нем опущена альтернативная позиция по затронутой проблеме.
7. Высокопарность слога. Незнакомые респонденту термины делают вопрос бесполезным в плане получения нужной информации. Вопросы типа “Как Вы думаете, большинство политиков эгоцентричны?” или “Вы одобряете судебный активизм Верховного суда?” для среднестатистического респондента звучат бессмысленно. Вопрос типа “Многие выдающиеся авторитеты считают, что распространяющиеся повсюду недуги, вызванные к жизни динамикой современной городской культуры, представляют [c.230] собой неотложную проблему, понуждающую к немедленным оздоровительным действиям в виде комплексной федеральной городской политики. Считаете, ли Вы, что подобная государственная городская политика желательна?”, даже если и будет понят, может послужить причиной отчуждения респондента, выставив перед ним интервьюера в роли сноба.
8. Жаргонный стиль. Стремясь к неформальности формулировок, порой можно и переусердствовать. При использовании жаргонных словечек (например, “Не кажется ли Вам, что федеральщики запичкали средствами большие города?” вместо “Не кажется ли Вам, что федеральное правительство расходует слишком много средств на программы урбанизации!”) исследователь рискует сразу в нескольких отношениях. Во-первых, опрос может показаться респонденту непрофессиональным, во-вторых, использование жаргона может покоробить тех из респондентов, кто вообще не переносит жаргона, либо тех, кто рассматривает жаргон как принадлежность сугубо “своей” субкультуры. Кроме того, если респондент и интервьюер придают жаргонному термину разные значения, это может помешать их взаимопониманию. Лучше всего совсем не использовать жаргона.
9. Поощрение стандартных ответов. Особые сложности при формулировании возникают тогда, когда нужно задать вопрос на какую-либо деликатную тему. Большинство людей не склонны говорить с посторонними о своих доходах, семейной жизни, сексуальном поведении, а в иных случаях даже о своих политических предпочтениях. Скованность респондента можно частично преодолеть с помощью корректной формулировки вопросов. Например, возьмем тот тип вопросов, на которые в обществе принято отвечать вполне определенным образом. Если такой вопрос недостаточно тщательно сформулирован, респондент будет стремиться дать ответ, приемлемый с точки зрения общественной морали, вне зависимости от своего собственного мнения. Таковы вопросы, связанные с расовыми предрассудками. Поскольку расизм в американском обществе в целом осуждается, люди, как правило, не склонны открыто высказывать свои расистские взгляды.
Мы можем предложить три тактических приема, рассчитанных на стимулирование искренних ответов в [c.231] противовес социально обусловленным. Первый из них заключается в том, чтобы указать респонденту на широкую распространенность или правомерность осуждаемых в обществе взглядов. Например, спросите его: “Многие полагают, что в округе, где начинают селиться негры, уровень жизни начинает постепенно падать. Другие же не считают, что присутствие негров что-либо существенно меняет в жизни округа. Согласны ли Вы с тем, что чернокожие жители, как правило, служат причиной ухудшения жизни в округе?” Другой прием состоит в том, чтобы заключить в вопрос презумпцию того, что респондент совершает социально осуждаемые поступки или придерживается непопулярных взглядов; таким образом, если это не так, респондент будет вынужден это отрицать. В то же время такой вопрос облегчает респонденту “признание” в социально осуждаемых взглядах в том случае, если он их придерживается. Например, вопрос “Какой урон, по-Вашему, будет нанесен этому району, если в нем станут селиться негры?” облегчает проявление расового предубеждения в отличие от более нейтральной формулировки: “Как Вы думаете, повредит ли этому району, если в нем станут селиться негры?”
И наконец, если вы просите человека высказать, возможно, негативное мнение о других лицах, организациях или о чем-либо еще, то полезно бывает предоставить ему также возможность выразить и похвалу. Это дает респонденту ощущение собственной справедливости и беспристрастности. Старайтесь перемежать вопросы, на которые ожидаются негативные или критические ответы, такими, которые предполагают более позитивную реакцию.
10. “Вымучивание” ответа. Многие люди думают, что не иметь мнения по политическим вопросам с общественной точки зрения предосудительно, и потому зачастую высказывают свое мнение о том, о чем никогда раньше не задумывались. Это может приводить к искажению результатов обследования. Чтобы избежать этого, целесообразно среди возможных ответов предусмотреть формулировку “не имею определенного мнения” или составлять вопросы так, чтобы отсутствие мнения выглядело вполне допустимым. Например, попробуйте начать вопрос так: “Некоторые люди видят в [c.232] атомной энергетике важную политическую проблему; другие не столь сильно этим озабочены. А каково Ваше мнение по этому поводу?” [c.233]
ОТБОР ИНТЕРВЬЮЕРОВ
Профессиональные политологи не только сами проводят опросы, но и бывают часто вынуждены привлекать других лиц к проведению опроса. Инструктируя опрашивающих, до них необходимо донести те сведения о методах интервьюирования, которые будут изложены ниже. Однако первый шаг в подготовке бригады интервьюеров заключается в отборе подходящих людей.
Поскольку респонденты реагируют не только на вопросы, но и на людей, которые задают им эти вопросы, и на то, как они это делают, постольку решающим фактором успеха могут на деле оказаться такие качества опрашивающего, которые, казалось бы, не имеют отношения к опросу. Опыт опросов в США позволяет выдвинуть следующие основные принципы отбора и подготовки интервьюеров, направленные прежде всего на то, чтобы свести к минимуму нежелательные последствия реактивности.
1. Опрашивающий должен держаться скромно и не вызвать у респондента никаких опасений. Например, те организации, которые специализируются на опросах, в качестве интервьюеров используют чаще всего женщин среднего возраста, поскольку выяснилось, что они менее всего способны внушить страх или подозрения. По этой же причине опрашивающий должен быть иногда в чем-то сходен с респондентом. Оказалось, к примеру, что при изучении расовых отношений чернокожие опрашивающие получают от чернокожих и от белых респондентов ответы, как правило отличающиеся от ответов, получаемых белыми опрашивающими1. Кроме того, интервьюер должен быть одет как можно более скромно для той среды, в которой проводится опрос, но, само собой разумеется, опрятно. Внешний облик опрашивающего должен как можно меньше говорить о его личных пристрастиях или социальной принадлежности.
2. При опросе интервьюеру следует вести себя беспристрастно, открыто и доброжелательно. Под беспристрастностью мы подразумеваем, что задавать вопросы и фиксировать [c.233] ответы надо автоматически, т.е. ничем не выказывая своего одобрения или неодобрения ответам респондента и не подталкивая его к тому или иному ответу. Вопросы следует задавать слово в слово так, как они сформулированы. Если респондент не понял вопроса, то хороший интервьюер не будет пояснять вопрос, а просто повторит его. Вести себя открыто значит прежде всего вести себя так, чтобы не вызывать у респондента излишней недоверчивости или враждебной реакции. Задавать вопрос нужно отстранение) и раскованно, как если бы не было абсолютно никаких оснований ожидать, что респондент откажется отвечать. По стилю хороший опрос должен приближаться к дружеской, но содержательной беседе.
Интервьюер должен освоиться с вопросами настолько, чтобы не было заметно, что он их читает, а в запасе у него должны быть заготовлены ответы на те вопросы, которые могут возникнуть у респондента, такая практика позволяет сократить время на возможные заминки в ходе опроса2.
Доброжелательным интервьюер выглядит в том случае, если он обращается к респонденту уважительно и с симпатией. Очень важно избегать стиля “допроса с пристрастием”; надо стараться всем своим видом показывать, что вы признаете правомерность любого ответа, данного респондентом.
3. В идеале интервьюер должен быть совершенно честен, надежен и скрупулезен в работе, ровен и спокоен в личном общении. Среди предполагаемых интервьюеров важно искать людей именно с такими чертами характера. Однако бывает, что даже наиболее подходящие и подготовленные опрашивающие не в состоянии получить нужную исследователю информацию. В таких случаях исследователь вынужден проводить опрос самостоятельно и с использованием особых методик. Примером ситуации подобного рода может служить прежде всего исследование, требующее направленного интервьюирования.
Эти качества важно учитывать и в работе над будущими интервью. Существуют случаи, однако, когда даже наиболее подходящий и прекрасно обученный интервьюер не может собрать информацию, необходимую исследователю. Тогда ему необходимо самому руководить опросом и использовать особые методы. [c.234]
НАПРАВЛЕННОЕ ИНТЕРВЬЮИРОВАНИЕ
В политологии существует много важных исследовательских вопросов, на которые можно дать ответ, только выяснив, как думают и поступают в соответствующих ситуациях вполне определенные люди или тип людей. Например, хотя мы всегда вправе строить любые предположения относительно причин принятия того или иного законопроекта, но действительные мотивы мы можем узнать, только выяснив мнение законодателей. Для ответа на подобные вопросы обычно проводится не массовое обследование населения, а направленное интервьюирование особых групп элит. В данном контексте это люди, которые располагают такими сведениями, важными для целей данного исследовательского проекта, которые предполагают индивидуальный подход при интервьюировании. Элитный статус этим людям придает не их роль в обществе, но их доступ к информации, которая может помочь ответить на определенный исследовательский вопрос (хотя, конечно, те, кто удостаивается такого подхода при обследовании, зачастую являются реально важными фигурами в политике, общественной жизни или экономике).
Основное различие между выборочным и направленным интервьюированием лежит в степени стандартизации процедуры опроса. Выборочное обследование предполагает как можно более одинаковый подход ко всем респондентам. Дело в том, что целью подобного опроса является получение такой информации, которая может быть использована для количественного сравнения ответов респондентов, что позволит далее обобщить результаты для генеральной совокупности. При направленном опросе каждый респондент требует особого подхода в той мере, в какой это предполагает та уникальная информация, которой только он (она) и располагает. Целью такого опроса является не сбор заранее специфицированных данных, а получение такой информации, которая поможет реконструировать некоторое событие или же обнаружить закономерность в особом типе поведения.
Второе крупное различие между направленным и выборочным интервьюированием заключается в том, что, в то время как выборочное интервьюирование обычно плановое интервьюирование с заранее определенным планом [c.235] опроса, при направленном интервьюировании плана чаще всего нет. Жесткий план интервью предполагает, что вопросы и порядок их предъявления респонденту заранее определены и не могут меняться. При полностью бесплановом интервью опрашивающий руководствуется только общей постановкой задачи (например, выяснить, каким образом было принято конкретное решение данным государственным учреждением) и не имеет заранее заготовленного списка вопросов. Интервью с жестким планом обладают тем преимуществом, что они приводят к сильно стандартизованным результатам, поскольку в них требуется, чтобы все респонденты отвечали на одни и те же вопросы, выбирая ответы из одного и того же набора возможностей. Это позволяет сравнивать ответы разных респондентов и облегчает дальнейшую обработку данных. Однако тщательное планирование интервью имеет свои недостатки: оно ограничивает получаемую информацию теми данными, которые, по заранее сформировавшемуся у исследователя мнению, необходимы для понимания изучаемого явления. Планирование ограничивает возможности исследователя в расширении теоретического горизонта, а также в выяснении того, что именно респонденты считают важным или значимым.
Бесплановые интервью, напротив, приводят к результатам, которые с трудом поддаются сопоставлению, сжатому изложению и подытоживанию. Однако в “активе” у таких интервью возможность получения от респондента незапланированной (и неожиданной) информации, которая может совершенно изменить взгляд на изучаемые явления. Бесплановая методика особенно хорошо подходит для интервьюирования специфических групп, потому что при таком опросе исследователя интересует прежде всего та информация, которую сам респондент считает важной и релевантной для данного предмета исследования, и именно суждения самого респондента наталкивают исследователя на те вопросы, которые следует задать для получения нужной информации. Выявление фактов и закономерностей при этом для опрашивающего важнее, чем измерение предварительно отобранных явлений.
Направленное интервьюирование способно предоставить исследователю информацию, которая наиболее существенна для понимания определенного политического [c.236] события и которую иным путем не добыть. При всем том направленное интервьюирование в научном отношении сопряжено с весьма реальным риском. Ведь оно обычно подразумевает, что свое представление о некоем политическом процессе исследователь формирует на основании мнения тех людей, которые непосредственно вовлечены в этот процесс. Надежность информации, полученной таким путем, оказывается при этом под вопросом в том случае, если респондент: (1) имеет такой узкий взгляд на рассматриваемые события, что не в состоянии оценить, что важно, а что нет в их объяснении; (2) располагает неточной информацией (оттого ли, что он чего-то недопонял в событии, или же оттого, что он забыл какие-то важные детали); (3) пытаясь придать рациональный смысл своим собственным действиям, убедил самого себя, что все обстоит именно так, как он говорит, тогда как на самом деле все обстоит несколько иначе; (4) намеренно лжет, чтобы защитить самих себя или других. Например, интервью с высокопоставленными чиновниками администрации президента Рейгана о событиях вроде антииранской аферы может оказаться примером исходящей от каждого из дающих интервью ненадежной информации.
Хотя жесткий контроль над ответами респондента вряд ли вообще возможен, тем не менее существуют некоторые общие правила, следуя которым при направленном интервьюировании можно уберечься от несостоятельных выводов. Во-первых, никогда не придавайте тому, что говорит интервьюируемый, значения факта; скорее этого заслуживает сам факт того, что он это сказал. Ведь для понимания политического поведения знать, во что люди верят или что они считают правдой, зачастую столь же важно, сколь и знать, что на самом деле является правдой. Например, если вам надо выяснить, почему жители некоторого района требуют закрытия близлежащей атомной электростанции, то для вас будет полезно узнать не столько то, какова в действительности надежность аварийной защиты станции, сколько то, что сами жители думают о степени этой надежности.
Во-вторых, никогда не полагайтесь на сведения, исходящие только от одного респондента. Перед тем как сделать заключение, старайтесь получить информацию о каждом событии от возможно большего числа респондентов. [c.237]
Третье, изыскивайте все возможные способы проверки информации, полученной из элитного опроса, сравнивайте ее со сведениями из других источников. Если мы интервьюируем лидеров некой партии, чтобы узнать, почему представитель, поддержанный ею, получил достаточное число голосов на выборах, и отвечающие предлагают в качестве причины “очевидную общественную поддержку кандидата”, то, как следствие, мы должны задаться целью провести опрос общественного мнения, который с очевидностью покажет уровень этой “общественной поддержки”, реально оказанной тому или иному претенденту.
В-четвертых, изучите сам предмет настолько, чтобы уметь опознавать некорректные суждения о нем и выявлять в ответах возможные источники искажения информации. Перед тем как приступать к направленному интервьюированию, следует научиться отвечать для себя на вопросы, подобные следующим: Есть ли основания полагать, что респонденту захочется поверить в то, что не является правдой, или же заставить других в это поверить? Связаны ли с рассматриваемыми событиями какие-либо материальные или политические интересы респондента? Какие из ответов можно признать правдоподобными, если учесть то, что мы знаем о предмете из других, более надежных источников?
Наконец, следует быть всегда начеку в отношении того специфического лексикона, который может использовать интервьюируемый, поскольку разного рода “словечки” могут изменять кажущееся очевидным значение высказываний. Например, в разведслужбах принято вместо слова убить (kill) применять термин разобраться с особой предвзятостью (terminate with extreme prejudice), а для некоторых американских политиков выражение качественное обучение (quality education) это всего лишь суррогат выражения сегрегация в обучении (racially segregated education).
Опасность того, что результаты направленного интервьюирования окажутся ненадежными, столь велика, что Льюис Декстер, ведущий авторитет в этой области, писал: “Планировать или загодя финансировать целый проект, рассчитывая главным образом на данные интервью, можно, лишь будучи уверенным в том, что интервьюеры достаточно подготовлены, чтобы толково провести опросные беседы, или же если есть надежда, что за респондентом [c.238] удастся каким-то образом понаблюдать, чтобы определить, о чем есть смысл задавать ему вопросы, а о чем нет... План любого обследования, опирающегося на данные направленного интервьюирования, должен включать в себя “аварийный” подплан, предусматривающий применение какой-то заместительной методики... на тот случай, если данные направленного интервьюирования окажутся в целом неинформативными”3.
Несмотря на эти недостатки, в том, что касается освещения важных политических явлений, направленное интервьюирование располагает огромным потенциалом и может служить как ценным дополнением для тех исследований, которые опираются на иные методы сбора информации, так и единственным основанием для важных выводов. Необходимо помнить, что информация, исходящая от людей, которые знают предмет изнутри, не может заменить трезвого теоретического осмысления этого предмета. Чтобы прийти к научно значимым выводам, политолог должен постоянно заниматься наложением своих аналитических категорий и концептуальных схем на собранные при опросе данные. [c.239]
МЕТОДИКА НАПРАВЛЕННОГО ИНТЕРВЬЮИРОВАНИЯ
Один из первых вопросов, с которыми сталкивается исследователь, это вопрос о том, кого следует опрашивать. При выборочном опросе, когда все респонденты предположительно в равной степени способны дать нужную для исследования информацию, применимы выборочные методы, помогающие определить, кого надо опрашивать. При направленном же опросе надо исходить из того, что потенциальных респондентов отличает друг от друга именно то, насколько они могут быть полезны для исследования и насколько уникальна та информация, которой каждый из них располагает. Зачастую при предварительном обследовании выясняется, что относящейся к делу информацией может располагать целая группа населения. Так, если мы изучаем деятельность какой-либо президентской комиссии, то краткого анализа будет достаточно, чтобы указать на членов комиссии, ее секретариат и экспертов как на искомых респондентов. Если же, однако, мы занимаемся изучением “структуры власти” с целью определить, кто держит бразды правления в [c.239] городе N, то нам не удастся найти какого-либо официального списка людей, оказывающих влияние на политическую жизнь в N. Кого следует интервьюировать в данном случае, опрашивающий должен решить самостоятельно.
Когда потенциальные респонденты отобраны, встает вопрос о том, в каком порядке их интервьюировать. Обычно возникает искушение первыми опросить тех, кто наиболее расположен говорить и наиболее симпатичен, либо тех, кто предположительно обладает самой полной информацией. Однако здесь надо иметь в виду две вещи. Во-первых, дело в том, что любое направленное интервью содержит в себе элемент научного открытия. Редко бывает так, чтобы мы с самого начала ясно представляли себе все, о чем следует спросить. На начальном этапе интервью мы, вполне возможно, узнаем такие факты, которые помогут нам извлечь максимально полезную информацию из дальнейшего опроса. Поэтому интервьюирование наиболее предпочтительных для интересующего нас события фигур зачастую лучше отнести на конец. Во-вторых, при направленном интервьюировании мы обычно имеем дело с лицами гораздо более заинтересованными, чем при выборочном опросе. От каждого респондента мы вправе ожидать совершенно особого (возможно, не лишенного личного интереса) взгляда на изучаемое нами явление, и каждый из них может умышленно или неумышленно дезориентировать нас относительно того, кто знает об этом явлении больше других и кого, соответственно, следует опросить. Ни при каких обстоятельствах нельзя допускать, чтобы выбор респондентов или порядок опроса целиком определялся предложениями респондентов, опрошенных вначале, однако частично учитывать эти предложения вполне допустимо. Уже одно то, что ранее опрошенный предложил опросить кого-то еще, само по себе подчас говорит о наличии каких-то альянсов или других типов коммуникативного взаимодействия. Кроме того, поскольку велика вероятность того, что респонденты знакомы друг с другом и как-то связаны с изучаемым нами предметом, очень важно проследить за тем, чтобы первые этапы опроса не навредили дальнейшему обследованию в силу невольного отождествления его со вполне определенной группой людей среди потенциальных респондентов. По возможности следует избегать опрашивать [c.240] первыми диссидентов, лидеров оппозиции, экстремистов либо лидеров любой доминирующей коалиции, поскольку слух об этом может дойти до других респондентов и заранее насторожить их или настроить враждебно по отношению к опросу.
Ввиду вышеизложенного первыми лучше всего опрашивать, по-видимому, тех людей, которые занимают стороннюю позицию по отношению к рассматриваемому явлению и мнение которых другие респонденты, имеющие более непосредственное отношение к этому явлению, считают нейтральным. Например, при изучении структуры законодательной власти в том или ином штате вначале лучше опросить рядовых членов законодательного собрания (основной рабочий орган, в котором принимают участие все, кто имеет отношение к законодательной деятельности) и лишь потом ключевых действующих лиц в законодательстве. Разумно будет также объяснить первым респондентам, что опрос носит предварительный, поисковый характер и что, возможно, вы захотите вернуться к нему после когда уточните все вопросы и уясните, как интерпретировать ответы на них.
На деле проведение направленного опроса может оказаться весьма трудоемким занятием, поскольку элитные респонденты это зачастую занятые люди, а опрос каждого из них, как правило, отнимает немало времени (в среднем час и более). При организации интервью могут быть полезны следующие рекомендации (хотя в отдельных случаях может оказаться нежелательно или невозможно им следовать):
1. О времени опроса договаривайтесь обязательно заранее (по телефону или по почте), не появляйтесь внезапно, как это бывает при выборочном опросе.
2. Договариваться об интервью постарайтесь с самим предполагаемым респондентом, а не с его секретарем или помощником.
3. Избегайте подробно объяснять цель интервью, поскольку это может вызвать у вашего будущего респондента искушение отослать вас к одному из своих сотрудников-экспертов.
4. Всегда старайтесь выявить причину отказа и по возможности ее устранить. Например, если проблема в нехватке времени, предложите провести интервью во внерабочее [c.241] время; если проблема в дефиците доверия к вам, попробуйте сослаться на рекомендацию кого-нибудь из тех, кому предполагаемый респондент доверяет.
5. Обязательно имейте при себе документы, удостоверяющие личность спонсора опроса и вашу (на случай возможных недоразумений).
Направленное интервью нельзя проводить по правилам, годным для выборочного опроса. Декстер пишет, что “почти универсальным правилом для направленного и специализированного интервью является то, что лучший способ интервьюирования в конкретной ситуации определяется самой этой ситуацией (включая сюда знания и черты личности интервьюеров)”4. При направленном интервью по сравнению с выборочным опрашивающий должен проявлять в целом большую гибкость и большее разнообразие в стиле ведения интервью. Можно, однако, предложить несколько общих советов, пригодных для большинства случаев.
1. В начале интервью обязательно представьтесь и изложите вкратце задачу вашего исследования; не полагайтесь на то, что респондент усвоил все это из вашего письма или из предыдущей встречи с вами.
2. Решающее значение может иметь обстановка, в которой берется интервью. По возможности следует исключить из нее отвлекающие факторы. Например, попытки взять интервью во время обеда в ресторане или в присутствии детей респондента обычно кончаются неудачей. Однако в некоторых случаях бывает полезно провести интервью в необычном месте (в парке, автобусе, музее), с тем чтобы создать непринужденную атмосферу или оживить в респонденте воспоминания о прошлых событиях.
3. Хотя групповые интервью иногда могут помочь достигнуть консенсуса в оценке некоторых фактов, а также выявить личные взаимоотношения в группе, все же лучше опрашивать одновременно не более одного человека.
4. Проводите интервью вдумчиво и в дружеском тоне. Не выпаливайте скороговоркой все вопросы подряд. Не бойтесь пауз, нужных вам или респонденту, чтобы собраться с мыслями.
5. Тщательно продумайте, какие вопросы вы зададите первыми. Притом что основная часть интервью лишена плана, первые несколько вопросов очень важны, так как они [c.242] фокусируют внимание респондента, стимулируют его память и проясняют для него, чего именно вы от него хотите. Начальные вопросы должны быть: (а) непосредственным образом связаны с объявленной вами задачей исследования, (б) достаточно нейтральны, чтобы респондент мог на них ответить без каких бы то ни было опасений, (в) сформулированы таким образом, чтобы показать респонденту, что опрашивающий знаком с предметом исследования, (г) рассчитаны на получение свободных и непринужденных ответов, а не плоских или сухих (если вам нужны чисто фактические сведения о респонденте, вы успеете получить их далее в ходе интервью). Особенно полезны в качестве вступительных те вопросы, где делается упор на отношение респондента к исследуемому явлению или на его понимание этого явления.
6. В отличие от выборочного интервью вопросы направленного интервью должны допускать множественные интерпретации. Помните, что ваша задача узнать, что думают о явлении и что ощущают в связи с ним сами респонденты.
7. Помочь спровоцировать нужный ответ, помимо прямого вопроса, может также комментарий. Например, замечание типа “Ну, обыкновенно это делается не так” может вызвать со стороны респондента ответное рассуждение о том, как, по его мнению, “это делается”.
8. Всегда смотрите по возможности респонденту в глаза (если только это ему не неприятно), так чтобы он видел, что вы его внимательно и сочувственно слушаете. Простые фразы типа “Я понимаю...” или “Конечно...” или вдумчивое “Да...” помогут вам подбодрить респондента и разговорить его. Помните, что основное вознаграждение, которое респондент получает за развернутое интервью, это возможность “просветить” кого-то, кому знаком и искренне интересен тот предмет, который для него самого очень важен. Поэтому полезно бывает дать респонденту понять, что он действительно помогает вам своей информацией.
9. С комментариями респондентов, каковы бы они ни были, лучше, по-видимому, соглашаться. Не показывайте респонденту, что вы не согласны с его мнением или сомневаетесь в приводимых им фактах.
10. Исключение из правила 9 составляют те случаи, когда [c.243] респондент не хочет выдавать вам информацию, которой он, как вам кажется, располагает. Здесь может оказаться необходимым применить так называемую “методику Наделя”5. Она состоит в том, что опрашивающий берет на себя роль критика или оппонента респондента, стараясь оспаривать и ставить под сомнение его тезисы в надежде, что в споре тот проговорится. Для выведывания нужной информации может пригодиться даже определенная доля враждебности.
11. Респондента, который избегает разглашать информацию, потому что боится, что ею могут злоупотребить, иногда удается разуверить в его опасениях, напомнив, что опрос носит строго конфиденциальный характер и что исследователь ни в коей мере не в состоянии повлиять на сложившееся положение дел.
12. Ведение записей по ходу интервью один из способов увеличить его результативность. При направленном опросе (в отличие от выборочного, когда заметки следует делать незаметно) то, как опрашивающий делает записи, может зачастую побудить респондента детализировать либо дополнить приведенную им информацию. Если вы тщательно все записываете, то для респондента это значит, что его комментарий для вас важен; если же вы откладываете ручку в сторону это сигнал того, что респондент слишком далеко уклонился от основной темы. Поскольку вам придется вести столь пространные записи, что делать незаметно это невозможно, вы можете по ходу делать заметки по поводу всего, что достойно внимания.
13. Старайтесь приноровиться к стилю поведения и характеру респондента. Одним людям свойственно держаться подчеркнуто сухо, другие, наоборот, очень раскованны; одни оперируют почти исключительно отвлеченными понятиями, другие же стараются все приложить к себе и к своему опыту. Кто-то привык общаться главным образом с начальством, а кто-то в основном с подчиненными. И вы получите больше информации, если сможете перенять одну из этих ролей. Нельзя начинать интервью, заранее жестко определив, в каком стиле вы будете действовать это можно решить лишь в ходе беседы с респондентом.
14. Обязательно просмотрите свои записи сразу после интервью, с тем чтобы записать свой комментарий к нему и проработать те пункты, которые вам удалось затронуть [c.244] лишь в общих чертах. Очень важно как можно меньше доверять своей памяти, даже если для этого вам придется провести пару часов в неуютном кафе или в промерзшем салоне автомобиля.
15. Свои рукописные заметки как можно скорее перепечатайте на машинке. Сделайте несколько экземпляров и храните их раздельно, чтобы не потерять.
Использование магнитофона при опросе имеет как свои плюсы, так и свои минусы. Магнитофон способен уловить изменение тона и помогает избежать искажений при передаче того, что было реально произнесено. Кроме того, он позволяет опрашивающему услышать себя со стороны. Это полезно, потому что то, как прозвучал вопрос, может оказаться существенным для интерпретации ответа. Сложность заключается в том, что магнитофон часто “затормаживает” речь респондента, поскольку лишает его возможности отказаться в дальнейшем от своих слов в случае, если возникнет какое-либо недоразумение. Иногда респондент боится, что запись может быть обнародована в искаженном виде. Кроме того, сама техника магнитофонной записи может отвлекать внимание респондента от опроса. Решение о том, использовать магнитофон или нет, в каждом конкретном случае исследователь должен принимать с учетом типа задаваемых вопросов и характера респондента. Если предмет обсуждения достаточно деликатен или если магнитофон респонденту “противопоказан”, то ясно, что издержки его использования перевесят преимущества. Если же предстоит длинное интервью со множеством технических подробностей и специфических фактов, ключевых для исследования, то магнитофон может оказаться незаменимым.
Используя магнитофон, не скрывайте его и помещайте так, чтобы он находился у респондента перед глазами. Заранее проверьте его в действии, чтобы убедиться, что он подходит для данного вида работы (обладает достаточной чувствительностью, прост в эксплуатации, способен обеспечить нужную продолжительность записи). Никогда не полагайтесь целиком только на магнитофон. Он может забарахлить, а это приведет к безвозвратной потере текста интервью. Поэтому всегда параллельно ведите запись от руки на бумаге6.
Наконец, важная проблема при направленном опросе это его конфиденциальность, которая играет здесь [c.245] более важную роль, чем при выборочном, поскольку от респондента требуется зачастую такая информация, которая в случае злоупотребления ею или ее обнародования может привести к нежелательным социальным последствиям. Гарантируя конфиденциальность интервью (а делать это надо непременно), исследователь должен приложить все усилия, чтобы сохранить секретность информации. Сделать это зачастую даже легче, чем при выборочном опросе, поскольку в направленный опрос обычно вовлечено меньше обеспечивающего его персонала, и если исследователь будет хранить сделанные записи в надежном месте, то существует определенная гарантия, что они не станут достоянием гласности. Опасность разглашения тайны возникает чаще всего, когда для перепечатки рукописной или магнитофонной записи исследователь прибегает к услугам машинистки. Уж если он совершенно не в состоянии сделать эту работу сам, то надо по крайней мере использовать услуги только проверенных людей и по возможности хранить личность респондента в тайне от машинистки. Нельзя допускать доступа посторонних лиц к материалам опроса. [c.246]
СПЕЦИАЛИЗИРОВАННОЕ ИНТЕРВЬЮИРОВАНИЕ
При некоторых типах исследований политологи нуждаются в информации, полученной не от уникальных в своем роде респондентов, как в случае направленного интервьюирования, и не от респондентов, представляющих население в целом, как при выборочном опросе, а от типичных представителей какой-то достаточно узкой группы населения. Это вызывает необходимость провести специализированное интервью.
Специализированным является любой опрос, при котором наличие у респондента определенных особенностей требует использования иной опросной техники, нежели при стандартном выборочном опросе. Опрос детей, неграмотных взрослых, заключенных, бродяг из трущобных районов, душевнобольных, рабочих-иммигрантов, не владеющих английским языком, все это примеры специализированного опроса. Такой опрос отличается от выборочного целым рядом черт. Во-первых, при специализированном опросе случается, что исследователь и респондент говорят на разных языках. Употребляемые [c.246] исследователем слова респонденту могут быть подчас непонятны. И точно так же респондент может употреблять жаргонные слова, неизвестные исследователю, или же использовать обычные слова в непонятном для исследования значении. Вторая отличительная черта специализированного опроса заключается в том, что исследователь не вправе ожидать от респондента умения читать, рассуждать или следить за развитием чужой аргументации, т.е. навыков, привычных для обычного культурного человека. Вдобавок ко всему этому определенное своеобразие в процесс коммуникации между респондентом и опрашивающим привносит и сама ситуация специализированного опроса. В то время как обычные респонденты смотрят на опрашивающих большей частью как на равных, к которым можно относиться дружелюбно и с доверием, респондент специализированного опроса вполне может держаться недоверчиво или враждебно, рассматривая опрашивающего как представителя власти. В таких условиях общение может быть сильно затруднено; может снижаться и надежность ответов.
В силу всего этого исследователь при специализированном интервьюировании не должен думать, что нормальное общение с респондентом сложится само собой. Напротив, контакт с респондентом нужно налаживать постепенно, и, только удостоверившись в его наличии, можно приступать к опросу.
Рассмотрим следующий пример. Если мы хотим узнать, насколько легитимной, по мнению школьников, является американская политическая система, то нам прежде всего придется определить понятие “легитимность”, а также удостовериться, что наши юные респонденты правильно понимают, что мы имеем в виду, когда говорим “политическая система”. Убедившись в том, что они усвоили эти понятия, и задав затем наши основные вопросы, мы должны будем задать также и дополнительные, контрольные вопросы, с тем чтобы определить, придают ли школьники своим ответам то же значение, какого можно было бы ожидать, если бы эти ответы исходили от взрослых людей. Для этого можно воспользоваться таким приемом: предложить нашим респондентам примеры, в которых школьники ведут себя так, что оценка ими степени легитимности того или иного учреждения однозначно ясна, [c.247] и попросить затем каждого из респондентов проинтерпретировать описанные в примерах действия в терминах легитимности и сказать, стал бы он сам вести себя подобным образом или нет. Если респондент толкует эти вымышленные действия неверно или если он допускает, что мог бы совершить действие, несообразное с тем пониманием легитимности, которое он ранее продемонстрировал нам на словах, то вряд ли мы можем считать, что данный респондент понимает свои ответы в том же смысле, что и мы.
Интервьюирование может быть очень богатым источником сведений для социолога. Однако чтобы быть эффективным, интервьюирование требует от исследователя почти артистических навыков. Никакая литература не может заменить в этом деле практического опыта. [c.248]
Дополнительная литература
Gorden R.L. Interviewing. Homewood: The Dorsey Press, 1975. Это одно из наиболее полных пособий по методикам выборочного и направленного интервьюирования; содержит ряд ценных советов по методике планирования и проведения обоих типов интервью, здесь же разбираются наиболее часто встречающиеся трудности, приводится обширная библиография. Dexter L.A. Elite and Specialized Interviewing. Evanston: Northwestern Univ. Press, 1970. Эта книга представляет собой классический труд по данному предмету, плод многих лет оригинальной социологической практики автора. Rich J. Interviewing Children. N.Y.: Jason Aronson, 1977. Эта книга содержит ряд рекомендаций по ведению специализированного интервью. По проблемам психологии опросных ситуаций см. работы: [c.248] Davis J.D. Interview as an Arena. Stanford (Cal.): Stanford Univ. Press, 1971; Sudman S., Bradburn N.M. Response Effects in Surveys. Chicago: Aldine, 1974.
Проблема влияния формулировки вопроса на ответ исследуется в статье: Schuman H., Duncan O.D. Questions About Attitude Survey Questions. // Sociological Methodology. San Francisco: Jossey Bass, 1974. Лучший способ понять сущность и возможности направленного и специализированного интервьюирования почитать исследования, основанные на результатах их применения. Методика опроса детей предлагается в кн.: Niemi R.G. et al. The Politics of Future Citizens. San Francisco: Jossey Bass, 1974.
Примеры других типов специализированного опроса можно найти в кн.: Hannerz U. Soulside: Inquiries into Ghetto Culture and Community. N.Y.: Columbia Univ. Press, 1969; Lewis O. Life in a Mexican Village. Urbana: Univ. of Illinois Press, 1951; Liebоw E. Tally's Corner. Boston: Little, Brown, 1967.
Среди пособий, опирающихся на данные направленных опросов, приведем работы: Higley J., Field G.L., Grоhоlt К. Elite structure and Ideology. N.Y.: Columbia Univ. Press, 1976 (исследование норвежской политической элиты); Matthews D.R., Stimson J.A. Yeas and Nays. N.Y.: Wiley, 1975 (исследование процесса принятия решений в конгрессе США); Рutnam R.D., Leonardi R., Nanetti R.Y. Attitude Stability among Italian Elites. // American Journal of Political Science. 1979. Vol. 23. P. 463494. См. также: Hess R.D., Тоrneу J.V. The Development of Political Attitudes in Children. Chicago: Aline, 1967. К этой работе даны очень хорошие методологические приложения по проведению специализированных интервью.
Хорошее методическое приложение по специализированному опросу (с примерами) приводится в кн.: Hess R.D., Тоrneу J.V. The Development of Political Attitudes in Children. Chicago: Aldine, 1967. [c.249]
8. ШКАЛИРОВАНИЕ
Одна из проблем, наиболее часто встречающихся при планировании опроса и подготовке инструментария для него, заключается в том, каким образом следует приписывать единое репрезентативное значение или оценку (score) некоторому сложному отношению или поведению. В качестве примера рассмотрим, как можно было бы измерить предубежденность населения против студентов колледжей. Такая предубежденность может проявляться в самых разных формах в зависимости от того, на каких признаках студентов сосредоточено внимание конкретного индивида (респондента). Так, некоторые люди судят о студентах по одежде, другие по манерам, третьи по поведению в повседневной жизни, по социально-экономическому статусу и даже по уровню личной гигиены. У иных стереотипное мнение могло сложиться на основании всего одной-двух встреч (приятных либо нет) с какими-то конкретными студентами; а кто-то, возможно, вообще едва ли способен отличить студента от других людей. Элементы суждения могут сильно варьировать по содержанию, направленности, степени оценки, но каждый и” них представляет собой по крайней мере потенциально компонент более широкого понятия “предубежденность”.
Если мы хотим учесть все эти моменты, то нам надо подобрать такой инструмент, который сумеет выявлять и измерять как можно больше подобных составных элементов понятий и одновременно будет достаточно точен, чтобы позволять осмысленным образом определять степень проявления общего понятия в единичном наблюдении. Иными словами, нам нужно такое средство, которое бы улавливало и отображало понятие, подобное понятию “предубежденность”, во всех деталях, а кроме того, показывало бы нам, сколько (какая доля) этого понятия содержится в том или ином случае или ответе респондента. Одно из таких средств называется шкалированием.
Шкалирование это процедура объединения ряда относительно узких показателей (в нашем примере это пункты [c.250] опроса, касающиеся отдельных отмеченных респондентами признаков студентов) в единую суммарную меру, которая принимается за отображение более широкого основного понятия (в нашем случае предубежденности), частью которого является каждый отдельный признак. Так, мы могли бы измерить отношение респондента к различным видам поведения студентов (например, к тому, сколько они употребляют алкогольных напитков, или к тому, сколь шумны их вечеринки) или к манерам студентов (к тому, насколько они чванливы, самонадеянны или невнимательны к другим людям), но ни один из этих признаков в отдельности мы не могли бы принять за полноценное отображение столь широкого понятия, как предубежденность. Нам скорее следовало бы каким-то образом свести все эти меры воедино, чтобы иметь возможность делать выводы о более общей точке зрения, которую каждая из них в чем-то дополняет и отображает. Более того, нам нужно решить эту задачу так, чтобы можно было сравнивать количество предубежденности (или любого другого измеряемого нами понятия), содержащееся в ответе одного респондента, с количеством ее, содержащимся в ответе другого респондента, и в конечном итоге судить о том, кто из респондентов предубежден более.
Унифицирующая мера, отображающая определенное основное понятие, называется шкалой. Частное значение степени проявления в каждом данном случае основного понятия называется шкальной оценкой. Шкалирование, или построение шкалы, это процедура, с помощью которой исследователь формирует шкалу и приписывает отдельным случаям оценки на этой шкале. [c.251]
ПОСТРОЕНИЕ ШКАЛЫ: ДВЕ ОСНОВНЫЕ ПРОБЛЕМЫ
Из вышеизложенного шкалирование может показаться достаточно простой, прямолинейной процедурой, когда в задачу исследователя входит просто идентифицировать ряд компонентов основного понятия, установить, каким показателем можно измерить каждый из них, затем объединить эти показатели в суммарную оценку с помощью произнесения нескольких волшебных слов или статистических заклинаний, и раз-два! дело сделано. К сожалению, эта видимая простота обманчива, потому что при отборе и интерпретации [c.251] компонентов шкалы нам может встретиться целый ряд подводных камней, требующих особой внимательности. С наиболее существенными из них мы уже знакомы это проблемы, связанные с понятиями валидности (обоснованности) и надежности.
Валидность, как вы помните, это свойство, определяемое ответом на вопрос: “Действительно ли мы измеряем именно то, что хотим измерить?” В теперешнем нашем контексте этот вопрос может быть несколько трансформирован следующим образом: “Есть ли основания полагать, что каждый из отдельных компонентов шкалы (каждый из конкретных вопросов) действительно напрямую связан с основным понятием и что все компоненты в совокупности полностью охватывают это понятие?” Иначе говоря, мы должны задаться вопросом: “А есть ли реальный смысл в том, чтобы объединять между собой ряд частных показателей, и коли уж мы это сделали есть ли смысл навешивать на этот ряд показателей избранный нами ярлык основного понятия?” Так, обращаясь снова к примеру со студентами, мы должны спросить себя, во-первых, действительно ли мнение человека о поведении студентов непосредственно связано с его мнением о студенческом стиле одежды или о манерах студентов, и во-вторых, действительно ли все эти мнения в совокупности отражают степень предубежденности данного лица против студентов.
Что касается надежности, то она определяется ответом на вопрос: “Вне зависимости от того, что конкретно мы измеряем, последовательно ли мы это делаем?” Применительно к шкалированию этот вопрос трансформируется в заботу о том, чтобы различные показатели, являющиеся компонентами шкалы, были связаны друг с другом последовательным и осмысленным образом. На деле нас интересует здесь не то, позволяет ли данный набор вопросов или показателей отличить яблоки от апельсинов, а скорее то, позволяет ли этот набор последовательно сортировать уже идентифицированные нами яблоки по размеру, цвету и т. п. в соответствии с некоторым стандартом. Если да, то объединение различных мер будет говорить о яблоках больше, чем любая отдельная мера. Но если наши стандарты (цвета, размера и т. п.) непоследовательны или [c.252] двусмысленны, то основанные на них наблюдения могут оказаться ложными.
Возможно, другой пример поможет сделать эти положения более понятными. Рассмотрим некую шкалу, предназначенную для того, чтобы каждый респондент выразил свое согласие или несогласие со следующими утверждениями:
1. Кубинцы дурны, и им нельзя верить
2. Французы дурны, и им нельзя верить
3. Японцы дурны, и им нельзя верить
4. Китайцы дурны, и им нельзя верить.
Давайте представим, что перед нами шкала для измерения ксенофобии, то есть страха и недоверия к иностранцам. Предположительно, чем с большим количеством утверждений согласится респондент, тем выше уровень ксенофобии, который мы можем ему приписать. Но будет ли дело обстоять именно так? Человек, полагающий, что только кубинцы дурны и им нельзя верить, утверждает это более в силу антикоммунизма, чем ксенофобии. В свою очередь человек, полагающий, что только японцы и китайцы дурны и им нельзя верить, утверждает это более в силу расизма, чем ксенофобии. И даже респондент, считающий, что все четыре группы дурны и им нельзя верить, как выясняется при ближайшем рассмотрении, страдает не ксенофобией, а скорее чувством, что все люди, или все правительства (даже той страны, где он живет) дурны и им нельзя верить. И следовательно, поскольку мы не можем с уверенностью утверждать, что эта шкала измеряет ксенофобию по существу, то эта шкала несостоятельна. И можем ли мы вообще доверять ей? Составлена ли она продуманно даже для измерения уровня ксенофобии? Страх и недоверие к китайцам, например, возможно, являются индикатором по меньшей мере двух совершенно различных особенностей, одна из которых идеологическая, вторая же имеет своей причиной расизм, и два респондента могут дать одинаковый ответ по совершенно разным причинам. И будет ли одинаковым чувство ксенофобии у антикоммуниста и расиста? Скорее всего нет. Таким образом, механическое соединение этих конкретных пунктов с целью их соизмерения в лучшем случае будет [c.253] лишь тщетным упражнением, а в худшем станет источником ошибочных умозаключений.
Проблемы подобного рода преодолеть не всегда просто, и ввиду этого при шкалировании нужно действовать очень внимательно, заранее все просчитывая. Тем не менее возможность представления сложного отношения или поведения в виде отдельного числа или оценки, являющаяся неоспоримым преимуществом шкалирования, служит стимулом к использованию этой методики во множестве самых разнообразных случаев. В этой главе мы обсудим четыре различных подхода к построению значимых (meaningful) шкал. При этом будут рассмотрены достоинства и недостатки каждого из них в том, что касается решения проблем валидности и надежности, а также присущие каждому из этих подходов процедуры. [c.254]
ШКАЛИРОВАНИЕ ПО ЛАЙКЕРТУ
Первый и, по-видимому, наименее удовлетворительный из методов шкалирования известен под названием шкалирования по Лайкерту. Это очень простая методика, в соответствии с которой каждому респонденту предъявляется некоторая серия утверждений (пунктов), требующих от него оценочных суждений. В табл. 8.1 приведена в качестве примера типичная серия таких пунктов, которые могли бы служить мерой антистуденческой предубежденности населения1. В каждом случае респонденту предлагается сказать, согласен (или полностью согласен) он или не согласен (или полностью не согласен) с приводимым утверждением. Каждому ответу приписывается определенная числовая оценка в диапазоне от 5 до 1 (5 “полностью согласен”, 1 “полностью не согласен”, 3 “не имею определенного мнения”). Чтобы получить суммарную меру предубежденности, свойственной конкретному индивиду, нужно сложить все оценки, проставленные против его ответов, и сумму разделить на число утверждений (пунктов). Так, например, респонденту, ответившему на вопросы 16 следующим образом: по пункту 1 “согласен” (4), по пункту 2 “полностью согласен” (5), по пункту 3 “не имею определенного мнения” (3), по пункту 4 “согласен” (4), по пункту 5 “не согласен” (2), по пункту 6 “согласен” (4), будет приписана суммарная оценка 3,67 ([4+5+3+4+2+4]:6), округляемая до 4. [c.254]
=================================================================
Таблица 8.1
Типичные пункты шкалы Лайкерта
=================================================================
Против каждого из следующих утверждений укажите, пожалуйста, согласны ли Вы с ним, полностью согласны, не согласны или полностью не согласны.
1. Студенты, за редкими исключениями, все очень похожи друг на друга.
2. Со студентами сложность состоит в том, что, где бы они ни поселялись, они постепенно вносят в жизнь округи дух студенческого общежития.
3. Чтобы положить конец предубежденности людей против себя, студентам необходимо самим первым избавиться от своих вредных и раздражающих других привычек.
4. В студентах есть что-то чуждое и непонятное мне; неясно, о чем они думают, что замышляют, чем живут.
5. Студенты в большинстве своем готовы сесть вам на голову, если их вовремя не осадить.
6. Пример студентов подтверждает, что если таким людям предоставить в избытке деньги или свободу, то они начнут этим просто злоупотреблять и доставлять другим неприятности.
--------------------------------------------------------------------------------------------------------------
Источник: В сокращенном виде приводится по кн.: Adorno Th. et al. The Authoritarian Personality. N.Y.: Harper & Row, 1950.
=================================================================
Предполагается, что, чем выше оценка, получаемая респондентом в рамках данной шкалы, тем большим количеством измеряемого признака (в нашем примере предубежденности против студентов) он обладает. Недостаток шкал этого типа состоит в том, что мы ничего не знаем о взаимодействии между отдельными компонентами шкалы. Каждый из них действительно может измерять разные аспекты одного и того же основного признака, и на первый взгляд так оно и есть, однако мы не можем быть в этом абсолютно уверены. При использовании шкал Лайкерта в политологии исследователи часто пытаются обойти это затруднение, удостоверившись в том, что между пунктами шкалы существует высокая степень корреляции, но при этом зачастую нарушаются некоторые статистические допущения, касающиеся измерения степени корреляции. В общих чертах эта проблема будет рассмотрена в гл. 16. Однако уже здесь следует оговорить один связанный с нею момент, а именно то, каким способом определяется суммарная (средняя) оценка. Мы просто складываем оценки отдельных пунктов и делим сумму на число пунктов. Но если поближе присмотреться к типам [c.255] ответов (т. е. “полностью согласен”, “согласен” и т. д.), то мы обнаружим, что они представляют измерение на порядковом уровне. То есть они различают взаимоисключающие категории и упорядочивают их относительно друг друга (сообщают, в какой степени респондент согласен или нет с некоторым утверждением). Однако они не устанавливают известных и равных интервалов между собой (разница между “полностью согласен” и “согласен” не всегда одинакова, касается ли это разных пунктов шкалы или разных респондентов). И следовательно, бессмысленно и некорректно складывать эти числа друг с другом, не говоря уже о том, чтобы их усреднять. Более правильная (однако редко применяемая) процедура состоит в вычислении на основании ответов каждого респондента средней величины другого вида медианы, которая затем приписывается респонденту в качестве оценки шкалы. Способ определения медианы описан ниже, в гл. 14. [c.256]
ШКАЛИРОВАНИЕ ПО ГУТТМАНУ
Многие из сложностей, связанных со шкалированием по Лайкерту, могут быть при определенных условиях преодолены посредством использования более сложной методики, известной под названием шкалирования по Гуттману. Эта методика исходит из допущения, что некоторые типы поведения (и отношений) связаны друг с другом так, что следование одним из них достигается с большим трудом, чем следование другим. По-видимому, самой лучшей аналогией тут может служить пример с человеком, стоящим на лестнице-стремянке. Если человек стоит на пятой по счету от земли перекладине, то, по всей видимости, он взобрался туда, ступая сначала на первую, потом на вторую, третью, четвертую перекладины. Возможно, но менее вероятно, что этот человек перескочил при движении вверх через одну (или более) перекладину. Совсем маловероятно, чтобы он мог без особого неудобства для себя встать на пятую перекладину, ступая прямо с земли. Таким образом, данный субъект достиг пятой перекладины, проделав целую серию все более высоко расположенных движений, и мы имеем полное основание [c.256] допустить, что для достижения более высокой позиции он преодолел нижние.
Точно так же если мы знаем, что некий индивид принял участие в голосовании на президентских выборах (что, как известно из многих исследований, является одним из самых обычных и наименее обязывающих политических действий), то мы не можем с какой-либо долей уверенности утверждать, что этот человек также активно участвует в деятельности какой-либо политической организации (намного более обязывающее и менее обычное действие) или что он баллотировался на какой-либо государственный пост (одно из самых редких политических действий). Однако с другой стороны, если мы знаем о данном индивиде, что он активно участвует в деятельности какой-либо политической организации, то мы можем с достаточной уверенностью утверждать, что он также участвует и в таком менее значительном политическом действии, как голосование на выборах (хотя не можем утверждать, что он сделал и следующий шаг, а именно баллотировался кандидатом на выборах). И далее, если данный индивид баллотировался в качестве кандидата на государственный пост, то у нас есть все основания полагать, что он также принимал участие в голосовании и в деятельности некоторой политической организации. На практике подобные допущения оказываются верными не всегда, но очень часто.
Некоторые отношения связаны друг с другом очень похожим образом. Это иллюстрирует табл. 8.2, в которой представлен один из альтернативных способов измерения степени предубежденности того или иного индивида против студентов2. Процедура схожа с той, которая используется при шкалировании по Лайкерту, и состоит в том, что респондентов просят ответить, согласны они или нет с каждым пунктом (утверждением) из некоторой серии. Тому ответу, который в большей степени отражает измеряемое свойство (например, предубежденность), приписывается знак “+”, а альтернативным ответам знак “”. Так, к примеру, согласие с пунктом 1 будет оценено как “+” (наличие предубежденности). Тогда как несогласие с пунктом 2 получит оценку “” (отсутствие предубежденности). Сами утверждения, как нетрудно видеть, связаны между собой таким образом, что различные ответы на них отражают степень предубежденности (или свободы от таковой) респондента. На деле, чем ближе “угроза” общения со студентами касается самого респондента или его семьи, тем ему, по-видимому, труднее освободиться от предубеждения. Это значит, что между пунктами шкалы существует, по меньшей мере в потенции, вполне логичное отношение порядка, отсутствующее в Лайкертовых шкалах.
=================================================================
Таблица 8.2
Типичные пункты шкалы Гуттмана
=================================================================
Укажите, пожалуйста, согласны Вы или не согласны с каждым из следующих утверждений:
1. Если бы мне было дано выбирать, я бы предпочел не видеть студентов в нашей округе.
2. Я не возражаю против появления студентов в нашей округе.
3. Я бы не возражал, если бы какие-нибудь студенты захотели поселиться у нас в округе.
4. Я бы не хотел, чтобы у нас в округе жили студенты.
5. Я ничего не имел бы против, если бы кто-то из нашей семьи привел к нам в гости студента.
6. Мне не понравилось бы, если бы кто-то из нашей семьи собрался сочетаться браком со студентом / студенткой.
--------------------------------------------------------------------------------------------------------------
Источник: В сокращенном виде приводится по кн.: Bogardus E. Social Distance. Yellow Springs, Ohio: Antioch Press, 1959.
=================================================================
Более того, шкалирование по Гуттману обеспечивает не только адекватный способ вычисления степени признака, характерной для данного респондента, но и прежде всего способ оценки степени соответствия определенного набора компонентов допущению об их упорядочиваемости (assumption of ordinality). Эти способы могут быть проиллюстрированы с помощью табл. 8.3, где отображены ответы 170 гипотетических респондентов на утверждения, приведенные в табл. 8.2.
Некоторые детали этой таблицы нуждаются в пояснении. Начать с того, что пункты упорядочены в направлении слева направо в порядке возрастания числа полученных ими при ответах плюсов (+). Это число получается в результате подсчета числа (n) всех тех случаев, когда ответ на данный пункт получил оценку “+”. (В данной таблице эти числа, помеченные внизу каждого столбца, выбраны произвольным образом.) [c.258]
Основное допущение заключается в том, что число плюсов должно уменьшаться по мере возрастания трудности следования определенному типу поведения / отношения (или по мере возрастания его экстремальности). В данном примере результаты такого упорядочения совпадают с нашими ожиданиями в том смысле, что наблюдаемое упорядочение соответствует нашему изначальному упорядочению. Однако так бывает далеко не всегда.
Каждая строка таблицы представляет группу респондентов, давших на предложенные шесть пунктов вполне определенный набор ответов. Так, первая строка сверху представляет тех 10 респондентов (n=10), чьи ответы на все шесть вопросов свидетельствуют о наличии у них сильной предубежденности против студентов. Вторая строка сверху представляет тех 20 респондентов, чьи ответы указывают на наличие предубежденности по всем пунктам, кроме пункта 1, и т. д. Первые семь строк таблицы представляют те наборы ответов, которые полностью соответствуют допущению о [c.259] том, что данные шесть пунктов связаны между собой отношением порядка. Группы респондентов, для которых характерен любой из этих семи наборов ответов, называются типами идеальной шкалы (perfect scale types).
При шкалировании по Гуттману количество типов идеальной шкалы всегда на единицу больше числа пунктов данной шкалы, поскольку полное отсутствие измеряемого свойства (отсутствие предубежденности, как в строке 7) рассматривается как идеальная оценка (perfect score). Каждой идеальной оценке приписывается число от 1 до i+1, где i количество пунктов (items) шкалы, причем 1 обозначает тех респондентов, которые в наименьшей степени обладают измеряемым свойством, а i+1 тех из них, кто обладает им в наибольшей степени. Таким образом, каждому респонденту приписывается соответствующая оценка. Так, в нашем примере каждый из 10 респондентов строки 1 (чьи ответы отражают самую высокую степень предубежденности) получает оценку 7 (i+1 = 6+1 =7), каждый респондент из строки 2 оценку 6 и т. д. до оценки 1, выставляемой каждому респонденту из строки 7. Эти оценки ранжируют (упорядочивают) всех респондентов соответственно степени их предубежденности против студентов.
Нам осталось объяснить строки 8, 9 и 10. Один или более ответов из этих строк не укладываются в предсказанный нами заранее порядок пунктов. На самом деле это ответы тех, кто, взбираясь по лестнице, перескочил через одну или более ступенек. О подобных наборах ответов принято говорить, что они содержат одну или более ошибок (errors). Термин “ошибка” обозначает здесь не оплошность респондента, а несоответствие данных случаев основному допущению шкалирования по Гуттману. Встречая подобные ошибки а они вполне обычны, мы вынуждены обратиться к следующей процедуре.
Прежде всего следует подсчитать, какое число изменений в строке минимально необходимо для того, чтобы получить идеальную оценку. К примеру, в строке 8 плюс в столбце 1 можно изменить на минус, в результате получим оценку 5; или, наоборот, изменив минус в столбце 2 на плюс, получим оценку 7. И в том, и в другом случаях мы внесли изменение [c.260] только в один пункт, поэтому мы можем сказать, что строка 8 содержит одну ошибку. Это обстоятельство отмечено в столбце под названием “Ошибка” “Error” (e). Затем мы умножаем число ошибок (т.e. 1) на число случаев, в которых встретились данные ошибки (т.e. 30), и результат заносим в следующий столбец. И наконец, каждому случаю мы приписываем ту оценку шкалы, которую он получил бы, если бы не было ошибок (ошибки). Хотя в строке 8 всего одна ошибка, у нас имеется выбор из двух возможных исправлений либо на оценку 5, либо на оценку 7. За исключением тех случаев, когда есть какое-то веское основание предпочесть одну из этих оценок другой, стандартная практика заключается в том, чтобы приписывать каждому из 30 респондентов ту или иную оценку шкалы (5 или 7) случайным образом.
Далее переходим к строке 9 и повторяем ту же процедуру. Здесь нам придется произвести минимум два изменения, обратив два минуса в плюсы. И опять мы отмечаем число ошибок, умножаем его на число случаев и приписываем каждому определенную оценку шкалы. Здесь, однако, возможна только одна оценка, поскольку возможен только один вариант внесения исправлений.
Затем эта же процедура повторяется для строки 10, равно как и для любых других наборов ответов, отклоняющихся от основного допущения шкалы.
Работая со строками 8, 9 и 10, мы, конечно, приписывали оценки отдельным случаям (респондентам) так, как если бы они идеально укладывались в нашу шкалу, хотя нам известно, что это не соответствует действительности. Значит, в той мере, в какой мы полагаемся на оценки шкалы, характеризующие случаи из строк 810, мы рискуем прийти к ошибочным выводам. Встает вопрос, сколь велик этот риск. К счастью, шкалирование по Гуттману дает нам возможность ответить на него. Вспомним, что мы отмечали общее число ошибок в шкале. Оценка риска, по сути дела, требует, чтобы мы определили величину этой общей ошибки, т. e. оценили то ли она относительно мала и потому пренебрежима, то ли настолько велика, что делает недействительной саму шкалу. Ответить на этот вопрос позволяет вычисление статистики, называемое коэффициентом воспроизводимости по Гуттману (the Guttman coefficient of reproducibility СR) и определяемое по следующей формуле: [c.261]
где n - число случаев в строках, содержащих ошибки,
е - число ошибок в каждой строке,
i - число пунктов шкалы,
N - общее число случаев.
Подставив соответствующие значения, получим коэффициент воспроизводимости для нашего примера:
В данной формуле величина Σn(e) обозначает общее число ошибок в шкале, тогда как величина i(N) обозначает общее число возможных ошибок, когда ни один из пунктов или респондентов не укладываются в шкалу. Таким образом, дробь говорит нам, какая доля всех возможных ошибок имела место в действительности. Вычитая эту долю ошибок из единицы, мы устанавливаем долю тех элементов (вхождений) шкалы, которые свободны от ошибок. Принято считать обоснованной любую шкалу Гуттмана с коэффициентом CR > 0,90 и выше; шкалы с более низким коэффициентом рассматриваются как сомнительные и обычно в аналитических целях не используются3.
Таким образом, мы видим, что применительно к пунктам, поддающимся естественному упорядочению по степени трудности, шкалирование по Гуттману является сильным средством, с помощью которого мы можем объединять несколько показателей в единую суммарную величину, адекватно отображающую какое-то более общее свойство (признак) респондента. [c.262]
ШКАЛИРОВАНИЕ ПО ТЁРСТОУНУ
Еще один способ вычисления суммарных мер (хотя и предназначенный для решения несколько иных задач) это равномерное (equal-appearing) интервальное шкалирование по Терстоуну. У нас уже шла речь о том, что при формулировке вопросов, нацеленных на измерение такой, например, переменной, как социальные классы, исследователь вправе избрать способ [c.262] измерения, опирающийся на какой-то объективный критерий (уровень доходов, общественный престиж профессии и т. п.), но альтернативно он может разрешить респонденту применять свои собственные критерии оценки (спрашивая его, например, к какому социальному классу он сам себя относит). Первый подход облегчает сравнение данных, полученных от разных респондентов, тогда как второй позволяет получить, возможно, менее сравнимые, но зато более значимые данные.
Шкалирование по Терстоуну рассчитано на вторую из этих стратегий с учетом, однако, улучшенного показателя сопоставимости. Метод состоит в том, что отдельным представителям изучаемой совокупности (группы населения) предоставляется возможность фактически самим участвовать в разработке тех шкал, которые в дальнейшем будут использованы для измерения определенных свойств данной совокупности (группы) в целом. Допуская интериоризованные определения значений тех или иных показателей, метод Тёрстоуна усиливает валидность шкалы. А устраняя из рассмотрения те пункты шкалы, с которыми не согласно большинство респондентов, он усиливает также ее надежность. Метод этот довольно сложен, но после того, как мы уяснили для себя его основные цели, он будет нетруден для понимания.
Приступая к построению шкалы Тёрстоуна, исследователь прежде всего отбирает большое количество утверждений (от 50 до 100), отражающих самые различные отношения к некоторому объекту. Затем из изучаемой группы населения произвольным образом отбирается некоторое число “арбитров”. Это те люди, на которых будет опробован имеющийся список утверждений. Обычно число арбитров достигает 50 и более человек, а иногда если позволяют возможности и нескольких сотен.
Каждому из арбитров предъявляется 11-балльная шкала, значения которой варьируют от “одобрительного отношения” (11) до “неодобрительного отношения” (1), и стопка карточек, на каждой из которых напечатано одно утверждение из имеющегося списка. Арбитра просят внимательно прочитать каждое утверждение и в зависимости от того, как оно связано с изучаемым объектом, поместить данную карточку в одну из 11 стопок, соответствующих той или иной [c.263] оценке. Таким образом, те утверждения, которые данный арбитр рассматривает как наиболее “одобрительные” по отношению к объекту (например, к студентам), попадут в стопку 11; те, которые он оценивает как несколько менее “одобрительные”, окажутся в стопке 10, и т. д. В итоге этой процедуры исследователь будет располагать мнением каждого арбитра об оценочном значении каждого утверждения.
На следующем этапе каждому утверждению приписывается определенная обобщенная оценка шкалы, указывающая на его относительное положение на шкале; при этом, чем более “одобрительным” видится арбитрам некоторое утверждение, тем выше его оценка. Многие исследователи вычисляют оценку шкалы, приравнивая ее к среднеарифметическому, т. е. сначала складывая все частные оценки какого-либо утверждения, а затем деля сумму на число арбитров4. Более надежный способ заключается в определении в качестве оценки шкалы медианного значения для каждого утверждения (см. гл.14). На данном этапе те пункты (утверждения), которые получили у разных арбитров сильно расходящиеся оценки (например, демонстрирующие разброс в диапазоне пяти или шести категорий шкалы), устраняются из списка. Окончательно в опросный лист попадают 1520 пунктов, по которым арбитры ближе всего сошлись в опенках. В совокупности эти пункты должны покрывать весь диапазон оценок. В табл. 8.4 приведены некоторые типичные утверждения, которые могли бы быть включены в шкалу Тёрстоуна, предназначенную для измерения различных типов отношения населения к студентам5.
Далее, на этапе интервьюирования, респондента из обследуемой выборки просят сказать, с какими из предъявленных пунктов (утверждений) он согласен или в альтернативном порядке какие пункты (но не более двух-трех) наиболее близки к его мнению о рассматриваемом объекте (в нашем случае о студентах). Затем для установленных таким образом пунктов определяется медианное значение6, каковое и приписывается данному респонденту в качестве его оценки шкалы, т. е. в качестве обобщения его взглядов на объект. В том случае, если ответы респондента оказываются разбросанными по нескольким несмежным точкам шкалы, исследователь обычно делает заключение, что [c.264] либо у данного индивида нет определенного отношения к исследуемому объекту, либо его отношение отлично от того, который подразумевается в данной шкале. Но если, как это чаще случается, ответы оказываются тесно сгруппированными на каком-то одном участке шкалы, исследователь вправе сделать вывод о валидности и надежности разработанной им меры. Этим он не в последнюю очередь обязан арбитрам, сыгравшим важную роль в построении исследовательского инструмента.
=================================================================
Таблица 8.4
Типичные пункты шкалы Тёрстоуна
=================================================================
Внимательно прочитайте следующие утверждения и укажите, с какими из них Вы согласны.
1. Возможно, это малоизвестно, но среди студентов процент добровольно поступивших на воинскую службу гораздо выше, чем среди других групп населения.
2. Некоторые из студентов, без сомнения, сильно превосходят по уровню интеллекта остальных жителей нашей округи.
3. Несмотря на все свои недостатки, студенты вносят большой вклад в улучшение жизни в нашей округе.
4. Представление о студентах как о людях менее целеустремленных и менее трудолюбивых, чем другие, мало соответствует действительности.
5. Одни студенты чистоплотны, другие нет, но средний студент по своим личным привычкам ничем не отличается от среднестатистического гражданина.
6. Когда непосредственно сталкиваешься со студентами, то обнаруживаешь, что они такие же, как остальные люди: у них есть свои недостатки, равно как и свои достоинства.
7. Хотя, несомненно, встречаются исключения, но в целом студентам свойственна ярко выраженная тенденция к клановости, к тому, чтобы держаться замкнутыми группками.
8. Хотя, конечно, каждая социальная группа вправе выделяться среди других групп, студенты все же чересчур склонны не уважать права и собственность других людей.
9. Студенты иногда пытаются входить в не предназначенные для них магазины, отели и рестораны.
10. Многие жители нашей округи относились бы к студентам лучше, если бы в их поведении было меньше самоуверенности, аморальных поступков, случаев пьянства и публичной демонстрации сексуальной распущенности.
11. Хорошо известно, что от студентов пахнет хуже, чем от других людей.
--------------------------------------------------------------------------------------------------------------
Источник: Приводится в сокращенном виде по статье: Shuman H., Harding J. Prejudice and the Norm of Rationality. // Sociometry. 1963. Vol. 27. P. 353-371.
=================================================================
[c.265]
МЕТОД СЕМАНТИЧЕСКОГО ДИФФЕРЕНЦИАЛА
Четвертый, и последний, способ шкалирования, который мы хотим обсудить, называется методом семантического дифференциала. Этот метод основан на предъявлении респонденту некоторой серии пар прилагательных, с тем чтобы выявить, как данный индивид понимает определенное понятие (или как он к нему относится). В табл. 8-5 приводится типичная серия таких пар прилагательных. Респонденту предъявляется подобный список (выписанный обычно на отдельной карточке) и предлагается оценить определенный объект (в нашем примере студентов) по 7-балльной шкале, на полюсах которой располагаются антонимические прилагательные. Измерение такого типа допускает варьирование как интенсивности (силы), так и направленности измеряемого отношения; при этом нейтральному отношению соответствует срединная точка шкалы. Порядок расположения прилагательных внутри каждой пары определяется случайным образом, чтобы избежать сдвига в сторону ответной тенденции.
=================================================================
Таблица 8.4
Типичные пункты при построении семантического дифференциала
=================================================================
Ниже перечислен ряд словесных пар, которые можно было бы использовать для описания студентов. Между членами каждой пары стоит несколько прочерков. Пометьте крестиком тот прочерк в каждой паре, который ближе всего соответствует Вашему мнению о студентах.
Студенты - это, как правило, люди:
1) скучные |
|
интересные |
Несмотря на то что некоторые исследователи делают под-разбивку таких шкал на различные более мелкие подшкалы и далее просчитывают результаты уже внутри каждой подшкалы, большинство все же сходится в том, что шкалы семантического дифференциала позволяют получать оценки несколько иного свойства, нежели другие рассмотренные нами методы. Эти шкалы пригодны в первую очередь для сравнения объектов между собой (обозначаются ли по видимости сходные объекты разными респондентами в сходных терминах?) или для формирования шкал, измеряющих более общие понятия (например, какие типы действий или взглядов рассматриваются респондентами как либеральные или консервативные?). И таким образом, метод семантического дифференциала выполняет в исследовательском процессе несколько иную и более фундаментальную задачу, чем методы Лайкерта, Гуттмана и Терстоуна, а именно помогает формированию и оцениванию дефиниций тех или иных понятий.
Следует отметить, что существуют и другие методы шкалирования, используемые в опросных исследованиях. Однако те методы, что мы рассмотрели, являются самыми широкоупотребительными ив очерченных нами пределах самыми эффективными. В совокупности они обеспечивают нас доступными вариантами выбора и критериями, которыми нужно руководствоваться при формировании ограниченных мер для широких основных понятий. [c.267]
Дополнительная литература
Маranell О.М. Scaling: A Sourcebook for Behavioral Scientists. Chicago: Aldine, 1974. Обзор многих работ по шкалированию. Anderson Lee F. et al. Legislative Roll-Call Analysis. Evanston: Northwestern Univ. Press, 1966. Гл.6 этой книги содержит удачное описание методики Гуттмана. McIver J.P., Carmines E.G. Quantitative Applications in the Social Sciences. Beveriy Hills: Sage, 1981. Глава “Одномерное шкалирование” содержит краткие, но усложненные по сравнению с нашим описания методик Лайкерта, Гуттмана и Терстоуна. О применении шкалирования см. вводный курс: Dе Vеllis R.F. Scale Development. Newbury Park, Calif.: Sage, 1991.
Следующие книги содержат исчерпывающие описания методов шкалирования, применяющихся в социологии:
Robinson J.P., Shaver Ph. R. Measures of Social Psychological Attitudes. Ann Arbor: Institute for Social Research, 1973. Robinson J.P. et al. Measures of Political Attitudes. Ann Arbor Institute for Social Research, 1968. Пример построения политологической шкалы см.: Finiftеr A. Dimensions of Political Alienation. // American Political Science Review. 1970. Vol. 64. P. 389-410. [c.268]
9. КОНТЕНТ-АНАЛИЗ
Очень часто политолог может узнать об индивидах, социальных группах, учреждениях и даже о странах много нового, если он изучит связанные с ними информационные источники. Много ли информации о политических предпочтениях и способностях кандидатов содержится в предвыборных плакатах и в предвыборных сводках новостей? Может ли изучение внутреннего циркуляра крупной корпорации помочь обнаружить тайные планы ее администрации, направленные на подкуп представителей иностранных правительств, с которыми она собирается иметь дело? Насколько точна информация, публикующаяся в “Вестнике конгресса” (“Congressional Record”), о влиятельности того или иного американского сенатора? Отражают ли российско-американские дипломатические коммюнике состояние общественного восприятия тех изменений, которые происходят в российско-американских отношениях?
Лучший ответ на эти и другие вопросы может дать непосредственное изучение различных информационных источников. В целом эти источники можно подразделить на 3 категории: источники внутреннего происхождения (т.е. составленные изучаемым нами индивидом, учреждением или правительством) и внутренне ориентированные (например, служебные циркуляры, отражающие сам процесс принятия решения); источники внутреннего происхождения, но внешне ориентированные (такие публикации, как “Вестник конгресса”, в которых информация намеренно подается таким образом, чтобы сформировать у людей вполне определенный имидж источника, и которые, следовательно, могут как точно отражать, так и затемнять процесс и результаты принятия решений) и, наконец, источники внешнего происхождения, но внутренне ориентированные (например, предвыборная агитация, предоставляющая реципиенту исходный материал для принятия решений). Каждая из этих категорий источников может быть в большей или меньшей степени доступна или полезна для исследователя, но при этом все они в [c.269] равной мере обеспечивают возможность более глубокого проникновения в суть политического поведения.
Наиболее адекватным методом выявления такой возможности является контент-аналнз, т.е. систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника. Контент-анализ снабжает нас методом вернее, серией методов, с помощью которого мы можем обобщать те или иные материальные проявления поведения и отношений различных типов политических субъектов. В этой главе мы обсудим, когда следует применять контент-анализ, каковы основные приемы этой методики, как интерпретировать ее результаты и каковы пределы ее применения. [c.270]
ПОДГОТОВКА К КОНТЕНТ-АНАЛИЗУ
Контент-анализ может быть использован для ответа на исследовательские вопросы всегда, если имеется какой-то материальный носитель информации, так или иначе относящейся к интересующим нас политическим субъектам, и когда у исследователя есть доступ к этому информационному источнику. Примеры таких носителей книги, памфлеты, журналы, газеты, фонограммы, аудио и видеозаписи, фотографии, протоколы собраний или заседаний, правительственные документы, внутриведомственные циркуляры, фильмы, дипломатические коммюнике и инструкции, политические плакаты, карикатуры и лозунги, тексты речей и даже письма и дневники. Некоторые из этих носителей могут быть предельно подробными и точными (как, например, стенографический отчет о заседании конгресса) в отличие от других (например, от повестки дня того же самого заседания). Многие из них никак не зависят от исследовательского процесса (как, например, газетные публикации об изучаемом нами лице или организации), но есть и такие, которые исследователь должен воспроизвести сам (например, видеозаписи информационных телепрограмм). Однако все источники данных для контент-анализа имеют одну существенную черту: наличие материального носителя информации. Во всех случаях, когда он существует или может быть воссоздан, допустимо использование контент-анализа.
Первый шаг в подготовке к контент-анализу состоит в определении той совокупности сообщений, которую мы [c.270] будем изучать. Здесь перед нами открывается ряд возможностей. То, какая из них оптимальна, будет зависеть от конкретного исследовательского вопроса. Например, если объектом нашего исследования являются политические сюжеты в американской романистике XX в., то мы вправе определить искомую совокупность как все романы (тип сообщений), вышедшие из-под пера американских авторов (продуцент сообщений) и опубликованные в США (место распространения сообщений) в период между 1 января 1900 г. и сегодняшним днем (время появления сообщений). Если же нас интересует то, как освещалась в газетах определенная предвыборная кампания, искомая совокупность будет включать в себя все предвыборные газетные публикации (тип сообщений) размером в два и более газетных столбца (объем сообщений), опубликованные в ежедневных газетах (частота появления сообщений), которые были доставлены подписчикам (способ распространения сообщений) 6-го, 7-го и 8-го избирательных округов штата Огайо (место распространения сообщений) в период с 1 сентября по 5 ноября соответствующего года выборов (время появления сообщений).
Точно так же если мы хотим исследовать динамику развития напряженности в отношениях между США и Угандой в 70-е годы, то искомая совокупность может быть определена как все дипломатические послания (тип сообщений), которыми обменялись правительства США и Уганды (стороны, участвующие в процессе коммуникации) в течение определенного периода времени.
В каждом из этих примеров совокупность сообщений, подлежащих изучению, определяется с помощью набора заданных критериев, которым должно отвечать каждое сообщение. К этим критериям относятся: тип сообщений (романы, газетные публикации, дипломатические ноты), тип продуцента сообщений, стороны, участвующие в процессе коммуникации (отправитель, или получатель, или они оба), а также место распространения, частота появления, минимальный объем или длина, способ распространения и время появления сообщений. При необходимости могут быть использованы и другие критерии, однако те, которые перечислены нами выше, встречаются в большинстве исследований, где применяется контент-анализ. Первоочередная задача при подготовке к контент-анализу [c.271] состоит в том, чтобы выбрать среди этих критериев те, которые имеют наиболее непосредственное отношение к конкретному исследовательскому вопросу.
После того как мы определили совокупность сообщений, перед нами встает задача решить, какие из сообщений мы будем изучать наиболее детально. Поскольку подлежащие анализу случаи (сообщения) зачастую ограничены по числу и относительно хорошо доступны и поскольку контент-анализ в целом менее дорогостоящ (в расчете на каждое сообщение), чем другие методы (в особенности опрос), иногда удается подробно исследовать каждый случай (сообщение) из данной совокупности, т.е., по сути, произвести опись всех случаев. Именно возможность изучения большого количества случаев является одной из главных привлекательных черт контент-анализа как исследовательского метода. Чаще, однако, случается, что даже контент-анализ вынужден опираться на ограниченную выборку, взятую из более крупной совокупности.
Ввиду того что для документов, газетных статей и пр. обыкновенно существуют указатели или перечни, публикуемые в центральных изданиях и потому доступные для исследования, в контент-анализе из выборочных методов чаще всего применяются простой случайный отбор и систематический случайный отбор. Но даже тогда, когда необходимо выборочное обследование, размеры выборок для контент-анализа благодаря доступности и относительной дешевизне исходных данных обычно значительно превосходят те, которыми вынуждены довольствоваться другие виды исследования. Результатом этого, конечно же, является уменьшение ошибки выборки и повышение уровня надежности наших обобщений.
И наконец, готовясь к проведению контент-анализа, мы должны принять решение о единице измерения, или если использовать более общеупотребительный термин о единице анализа. В контент-аналитическом исследовании единица анализа это просто отдельный элемент или признак того сообщения, которое мы собираемся изучать, обсчитывать или оценивать. Простейшим элементом сообщения является слово, и оно может быть использовано в контент-анализе наиболее непосредственным образом. [c.272]
Например, желая ответить на вопрос “Насколько интересовали проблемы мира во всем мире Р. Рейгана, Дж. Картера, Дж. Форда и Р. Никсона?”, мы могли бы взять выборки из выступлений каждого президента и подсчитать, сколько раз в тексте появится слово “мир” (и, возможно, некоторые другие, связанные с этим слова). Отвечая на вопрос “Какая страна Израиль, Египет, Сирия или Саудовская Аравия занимает наиболее миротворческую позицию по вопросам ближневосточного конфликта, если судить по выступлениям ее представителей в ООН в период с 1975 по 1990 г.?”, мы снова могли бы, взяв записи всех таких выступлений, подсчитать частоту появления слов типа “мир”, “братство”, “компромисс” и т.п. Таким образом, метод состоит в том, что устанавливаются определенные ключевые слова и подсчитывается частота их употребления в сообщениях.
Однако даже в столь простой процедуре надо следить за тем, чтобы избежать по меньшей мере двух характерных ошибок. Во-первых, следует помнить, что оперирование нестандартизированными мерами может приводить к смещениям в результатах. Если за рассматриваемый период времени представители Израиля в своих выступлениях произнесли 100 тыс. слов, причем интересующие нас ключевые слова были упомянуты ими 50 раз, а представители Египта произнесли 200 тыс. слов, включая 100 упоминаний соответствующих ключевых слов, то, исходя из этого, можно прийти к двум разным заключениям в зависимости от того, стандартизированы или нет наши показатели. Если мы просто подсчитаем общее число упоминаний ключевых слов, то у нас получится, что египтяне выказали вдвое большую заинтересованность в мирном урегулировании конфликта, чем израильтяне. Если же, однако, мы стандартизируем нашу меру так, чтобы с ее помощью можно было определять долю всех ключевых упоминаний (допустим, в расчете на каждую тысячу слов), то в итоге мы сможем заключить, что обе стороны одинаково заинтересованы в улаживании конфликта. Какой из этих подходов правильнее? Это основной вопрос при операционализации переменных, и ответ на него достигается успешнее всего, если более внимательно присмотреться к тому, как была изначально концептуализована исследовательская проблема. Дело в том, что использование даже [c.273] такого на вид конкретного показателя, как число произнесенных ключевых слов, может быть чревато определенной двусмысленностью. Исследователь должен видеть эту двусмысленность и уметь с нею справляться, поскольку принятые (или, наоборот, упущенные) в связи с этим решения могут оказать существенное влияние на окончательные выводы.
Вторая возможная ошибка, связанная с грубо прямолинейным подсчетом слов, состоит в том, что одно и то же слово может употребляться в самых разных контекстах, изменяющих его значение. “Мы стремимся к миру, но...”, “Арабское братство никогда не допустит...”, “О компромиссе не может быть и речи...” при отсутствии каких-либо средств контроля такие упоминания слов “мир”, “братство”, “компромисс” будут сочтены упоминаниями в позитивном смысле, а это самое меньшее приведет к завышению оценки степени заинтересованности соответствующей стороны в достижении мирной договоренности. Если подобного рода употребления достаточно часты, они могут в конечном итоге совершенно нас дезориентировать. Поэтому когда мы беремся считать слова, то это следует делать с учетом контекста.
Тут у нас имеется по меньшей мере две возможности. С одной стороны, мы можем использовать мнения арбитров, или кодировщиков, т.е. членов исследовательской группы, в задачу которых входит прочтение и оценка контекстов ключевых слов с точки зрения их позитивности, негативности или нейтральности. Обычно, прежде чем будет достигнуто окончательное решение, каждое упоминание должно быть прочитано не менее чем двумя кодировщиками, оценки которых должны быть согласованы. (Позже мы еще вернемся к этому вопросу.) Подобные оценки контекста позволяют впоследствии подсчитать числовое соотношение позитивных и негативных упоминаний.
Другой возможный путь интерпретации отдельных слов в контексте (хотя это дает всего лишь частичное решение проблемы) состоит в том, чтобы добавить к рассмотрению вторую единицу анализа тему. Тема это некоторое вполне определенное сочетание слов или понятий, воплощенное во фразе, в предложении или даже в абзаце. Фактически, подсчитывая темы, мы занимаемся поиском упоминаний в тексте объектов обсуждения, например [c.274] в виде фраз “холодная война”, “проблема беженцев”, “государственное социальное страхование”, “христианское поведение”. Данная процедура является вариантом подсчета слов но вариантом улучшенным в том отношении, что в состав тем входят пояснительный текст и слова-модификаторы (наречия, прилагательные), сопровождающие употребление конкретного слова и помогающие установить его значение.
Однако и в этой процедуре есть своя трудность. Дело в том, что хотя такой анализ действительно проясняет контекст употребления отдельных слов, но происходит это за счет значительного усложнения всей процедуры. Ведь одна и та же тема может упоминаться по-разному и с помощью самых разных словосочетаний. Иногда это тонкий намек, почти или совсем лишенный тех эксплицитных признаков, по которым мы опознаём данную тему. Упоминание о “холодной войне”, например, вполне может быть завуалировано миротворческими словами о разрядке, а упоминание о христианском доброчестии может быть замаскировано националистической риторикой. Можно ли подобные слова и риторику считать ключевыми? Содержат ли они в себе данную тему или нет? На эти вопросы непросто ответить. Попытки сделать это заставляют приходить к четким, но ограниченным определениям, к формулировке целого ряда строго формализованных правил принятия решения (разрешающих, например, производить подсчет только по эксплицитным, заданным некоторым списком упоминаниям темы), которые делают наши результаты, возможно, более надежными, но одновременно и менее содержательными.
Третий элемент, часто используемый в исследованиях с применением контент-анализа, это собственно предмет как таковой, рассматриваемый в целом. Каков процент книг, пропагандирующих социализм, опубликованных в США в 1935 году? Какому кандидату в президенты в 1992 г. симпатизировало наибольшее количество редакций газет? Как письма, написанные Ричардом Никсоном после того, как он ушел со своего поста, отличаются от писем, написанных ранее? В каком из этих случаев мы обрабатываем несущий информацию блок как некую целую единицу и изучаем его общие, всеохватывающие характеристики. Какой конкретный вопрос рассматривается в [c.275] этом случае? Отражаются ли определенные ценностные установки или пристрастия? При рассмотрении таких вопросов притупляется острота взгляда, необходимого при анализе более мелких структур. Неизбежным становится присвоение обобщающих определений, но именно в силу этих причин их анализ обычно легче выполнить, чем анализ слов или тем, в том смысле, что исследователю приходится делать меньше запросов. И это действительно так, поскольку можно оперировать переменными достаточно нейтрального уровня, уровня, на котором события (то есть происшествия заметные, яркие) часто более очевидны и на котором оценки более достоверны.
Предметное изучение употребления слов и тем в последнее время стало легче проводить благодаря развитию компьютерных баз данных, таких, как LEXIS/NEXIX. Предположим, к примеру, что мы хотим узнать, как часто Дж. Буш сравнивал Саддама Хусейна с Гитлером в течение месяца, предшествующего войне 1991 г. в Персидском заливе. Используя NEXIS, мы можем сделать запрос на полнотекстовое исследование всех статей в “Нью-Йорк Тайме” (и любых других газетных статей и текстов передач широкого вещания), в которых слова “Дж. Буш”, “Саддам Хусейн” и “Гитлер” встречаются в хронологический период, выбранный для изучения. Тогда в соответствующем файле, с учетом особенностей пакета и языка, можно будет написать команду примерно следующего вида:
((George Bush) OR (President Bush) AND ((Saddam Hussein) w/10 Hitler)) AND (Date = September 1990)
Это длинное выражение задает команду, по которой в любой статье, опубликованной в сентябре 1990 г., будет опознан, во-первых, поименованный мистер Буш, а во-вторых, мистер Хусейн, если его имя отстоит в тексте от слова “Гитлер” не более чем на 10 слов в любую сторону. Такой запрос позволяет нам, кроме всего прочего, проверить (1), упоминалось ли имя мистера Буша вместе с его титулом чаще, чем без титула в то время, как становилось все яснее, что кризис будет разрешен военным путем (поскольку было бы возможно предположить ситуацию, что средства массовой информации неуловимо будут повышать весомость статуса президента, по мере того как [c.276] нация приближается к войне); (2) по сравнению с другими политиками мистер Буш лидировали или отставал по числу использования имени “Гитлер” в различных аналогиях, или (3) бесконечное число других гипотез, относящихся к формулированию восприятия конфликта обществом.
Результаты обобщенного анализа во многих отношениях не менее содержательны, чем результаты компонентного. Какой факт важнее: то, что египтянами в ходе одного из выступлений в ООН семь раз было упомянуто слово “мир”, или же то, что ими была произнесена в целом миротворческая речь? Более важно, посылали ли США в Ирак ноту с четырьмя открытыми упоминаниями об интервенции, тремя скрытыми намеками на неспособность разоружиться и двумя острокритическими намеками на военную экспансию, или что США послали ноту, которая может быть охарактеризована как вздорная по тону? В контент-анализе иногда и всегда по недостатку средств мы рискуем не увидеть леса за деревьями или , по аналогии, значение информации вообще за частями, ее составляющими. По этой причине мы должны быть очень и очень осторожными в выборе измеряемой единицы анализа и избрать наиболее перспективную и благоприятную для проведения исследования в целом. [c.277]
ПРОВЕДЕНИЕ СОДЕРЖАТЕЛЬНОГО КОНТЕНТ-АНАЛИЗА
Приняв решение о совокупности сообщений, выборке и единице анализа, мы можем приступать к самому анализу. Контент-анализ, основанный на исследовании слов, тем и сообщений, сосредоточивает внимание исследователя на содержании сообщения, на том, о чем в нем говорится. Таким образом, собираясь подвергнуть анализу эти элементы, мы должны уметь предвидеть их смысл и уметь определять каждое возможное наблюдение в соответствии с нашими ожиданиями.
На деле это означает, что в качестве первого шага при проведении контент-анализа этого типа мы должны создать своего рода словарь, в котором каждое наше наблюдение получит определение и будет отнесено к соответствующему классу. Допустим, например, нас интересует проблема идентификации в кубинских школьных учебниках [c.277] для 6-го класса всех упоминаний об американцах и США. Прежде чем приступать к анализу, мы должны определить, что же является в данном случае ключевым словом (словосочетанием). Должны ли мы обращать внимание только на слова “американец”, “американский” и “США”? Если да, то мы рискуем упустить из виду упоминания, состоящие из таких экспрессивно-оценочных терминов, как “агрессоры-янки”, “империалисты с Севера”, “гринго”, “захватчики”, “вторжение в Гуантанамо”, “беззаконный режим Вашингтона”. Более того, некоторые такие фразы могут употребляться в нескольких разных смыслах, из которых лишь один относится непосредственно к США. Рассмотрим следующие условия задач по арифметике:
1. Если кубинский народ владеет 1 тыс. акров пахотных земель, а неоколониалистские агрессоры отнимут у него 1 тыс. акров пахотных земель, то сколько акров пахотных земель останется кубинскому народу на пропитание?
2. Если африканцы владеют 1 тыс. акров пахотных земель, а неоколониалистские агрессоры отнимут у них 1 тыс. акров пахотных земель, то сколько акров пахотных земель останется африканцам на пропитание?
Допустим, что оба случая упоминания “неоколониалистских агрессоров” мы будем считать относящимися к США, тогда обе задачи будут восприняты нами как антиамериканские по смыслу. Однако тот, кто знаком с новейшей историей и идеологией Кубы, сочтет ключевым лишь первое из этих упоминаний, в то время как второе будет им интерпретировано скорее как выпад в адрес белого правительства ЮАР.
Проблема состоит в том, что мы должны предвидеть не только упоминания, которые нам могут встретиться, но и элементы их контекстуального употребления, а для этого мы должны разработать детальную систему правил оценки каждого случая употребления. Эта задача обычно решается посредством пилотажа подлежащей анализу совокупности сообщений (т.е. с помощью выявления на материале небольшой выборки сообщений тех типов ключевых упоминаний, которые с наибольшей вероятностью могут встретиться в последующем, более полном анализе) в сочетании с арбитражными оценками контекстов и способов употребления терминов. Здесь, как и в формальном [c.278] анализе, о котором речь пойдет ниже, предпочтительнее иметь дело с наблюдениями не одного, а нескольких исследователей.
==================================================================
Таблица 9.1
Образцы фраз из газетных передовиц в поддержку
некоторого кандидата (в случайном порядке)
Лучший из худших
Лучший из имеющихся
Лучше, чем его соперник
Наш главный избранник
Наилучший кандидат среди множества других
Кандидат, о каком можно только мечтать
Выдающийся деятель
Многообещающий деятель
Один из лучших сынов нации
Меньшее из двух зол
Лучшее из того, что мог бы дать процесс отбора
Наш неизменный любимец
Нужный сегодня человек
Приемлемый кандидат
Весьма приемлемый кандидат
Рекомендуем с рядом оговорок
Безоговорочно рекомендуем
Горячо поддерживаем
Искренне рекомендуем
Предлагаем свою поддержку
С радостью рекомендуем вашему вниманию
Призываем вас голосовать “за”
==================================================================
Более трудной является задача, заключающаяся в необходимости приписывания ключевым упоминаниям конкретных оценок, когда мы должны решить, приводится ли данное упоминание в позитивном или негативном смысле, “за” или “против” интересующего нас объекта и т.д., а также когда нам надо ранжировать ряд упоминаний соответственно силе их оценок (т .е. в соответствии с тем, какое из них самое положительное, какое следующее за ним по положительности и т.д.). При этом мы нуждаемся в показателях достаточно тонких, которыми можно было бы измерять не только настроения политических субъектов, но и силу этих настроений. Ситуация подобного рода отражена в табл. 9.1, где в обобщенном виде перечислены возможные формы предвыборной поддержки газетой некоторой кандидатуры. Если целью является определить, какая из газет активнее всего поддерживает эту кандидатуру, то наша непосредственная задача будет [c.279] заключаться в том, чтобы решить, как следует ранжировать эти утверждения в соответствии с той силой поддержки, которую каждое из н их отражает.
Существует несколько методов, облетающих принятие такого решения. Два наиболее известных способа ранжирования это метод Q-сортировки и шкалирование путем парного сравнения. Подобно методу шкалирования по Тёрстоуну, описанному в гл. 8, они опираются на суждения группы арбитров о значении или силе (интенсивности) некоторого термина с той только разницей, что здесь арбитры могут отбираться из числа как отправителей, так и получателей сообщения, как из группы ученых, хорошо знакомых с предметом изучения, так и из населения в целом, а также из числа самих исследователей. Оба эти метода отличаются друг от друга и от метода Тёрстоуна по тем задачам, которые они ставят перед арбитрами.
Q -сортировка в этом отношении ближе к методике Тёрстоуна. В этом методе используется шкала жесткого распределения (forced distribution scale) из девяти пунктов: пункт 1 соответствует минимальной степени интенсивности измеряемого признака (например, наименьшей степени одобрения), а пункт 9 максимальной степени интенсивности (например, наивысшей степени одобрения). В отличие от методики Тёрстоуна в рамках данной шкалы не предусмотрено отражение нейтрального или антитетического (прямо противоположного) суждения или оценки. Цель здесь состоит в том, чтобы просто ранжировать (упорядочить) все суждения вдоль единой оценочной оси. Кроме того, при пользовании Q-шкалой арбитры связаны ограничениями сильнее, чем в методике Тёрстоуна. Арбитру дается определенная жесткая квота на каждую категорию шкалы (т.е. ожидаемое число слов или фраз, которые должны быть им отнесены к данной категории), а затем ему предлагается распределить заданный набор терминов так, чтобы установленные квоты не нарушались. Квоты основаны на предположении (не обязательно верном), что колебания в интенсивности слов и фраз должны укладываться в рамки нормального распределения (когда изучаемые случаи максимально скучены в средней части шкалы, а по мере продвижения к ее полюсам их число равномерно убывает). Арбитры, таким образом, вынуждены давать относительные оценки конкретным словам и фразам [c.280] (случаям), относя их к определенным категориям шкалы1. Эта процедура отражена в табл. 9.2.
Таблица 9.2
Распределение случаев при Q-сортировке
Категория (значение) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Распределение |
5 |
8 |
12 |
16 |
18 |
16 |
12 |
8 |
5 |
Распределение |
2 |
4 |
6 |
8 |
10 |
8 |
6 |
4 |
2 |
Таблица состоит из трех строк. В первой представлены значения (оценки), приданные каждой категории шкалы (от 1 до 9). Во второй отображено процентное распределение всех изучаемых случаев по девяти категориям. Эти числа суть квоты, из которых исходит каждый арбитр. Так, например, каждый арбитр должен 5% всех случаев отнести к категории 1, 8% всех случаев к категории 2, 12% к категории 3 и т.д. В третьей строке таблицы указано конкретное число случаев, определяемое данным процентным отношением для конкретной исследовательской проблемы. По исходному предположению табл. 9.2 каждому арбитру нужно ранжировать 50 слов или тем. Числа в строке 3, таким образом, представляют собой результаты вычисления процентных отношений, указанных в строке 2, от общего числа п = 50. Эти числа диктуют каждому арбитру, сколько случаев должно быть отнесено к каждой категории2. При проведении Q-сортировки строки 1 и 2 остаются все время неизменными, а в строке 3 значения меняются в зависимости от числа случаев, подлежащих ранжировке.
После того как арбитры завершили свою работу, вычисляется средняя (арифметическая) оценка шкалы для каждого случая, а затем полученные средние оценки соответствующим образом ранжируются. (Логическое обоснование этого последнего шага то же, что и в случае использования статистики интервальной шкалы анализа данных, полученных методом шкалирования по Тёрстоуну.) Далее результаты этого ранжирования случаев по [c.281] интенсивности используются для приписывания анализируемым текстам кодов, обусловленных встречаемостью в них слов или тем, получивших нашу оценку. Произвольность оценки одного исследователя заменяется таким путем коллективной мудростью нескольких арбитров.
Шкалирование методом парного сравнения имеет те же цели, но техника его несколько иная. Каждый случай, подлежащий оценке, последовательно сравнивается попарно со всеми другими случаями, при этом каждый арбитр должен решить, какое из слов (или фраз) в каждой паре “сильнее” (или интенсивнее) другого. Так, если нам надо сравнить пять утверждений (случаев), то каждый арбитр будет последовательно сравнивать сначала 1-е из них со 2-м, с 3-м, 4-м, 5-м, потом 2-е с 3-м, 4-м, 5-м и т.д., всякий раз при этом отмечая, какое из двух более интенсивно. Подсчитав, сколько раз каждый случай оказался в оценке всех арбитров “сильнее” других, и разделив полученное число на число арбитров (т.е. вычислив среднюю оценку, вынесенную группой арбитров каждому утверждению), мы получаем возможность осуществить количественное ранжирование всех случаев по степени их интенсивности. Чем выше средняя оценка некоторого утверждения, тем оно, по мнению арбитров, “сильнее”.
С методами Q-сортировки и парного сравнения связаны по меньшей мере две сложности. Во-первых, в обоих этих случаях исследователь полагается полностью на решения арбитров, критерии оценки которых могут быть, а могут и не быть правомерными и/или состоятельными. В экспертизе такого рода стандарты не всегда ясны или, во всяком случае, не всегда ясно определены, и вследствие этого сами оценки носят дискуссионный характер. Действительно, не столь редки случаи, когда один и тот же арбитр выставляет различные оценки одному и тому же утверждению в серии идентичных испытаний. Поскольку мы здесь подвергаем выборочному обследованию не людей, а содержание сообщений, у нас нет четко обозначенной референтной группы населения, как при шкалировании по Тёрстоуну, и нет также набора имплицитных параметров, на которые можно было бы равняться. Другими словами, отбор арбитров в высшей степени произволен. Следовательно, и надежность результатов, полученных при опоре на таких арбитров, может быть минимальной. В [c.282] довершение ко всему эти оценочные методы могут оказаться весьма утомительными и громоздкими. Q-сортировка 100200 случаев, требующая бесконечно повторяющейся идентификации мельчайших различий между ними, или же попарное сравнение 50 случаев, требующее рассмотрения 1225 различных пар (n[n1]/2, где n число случаев), может исчерпать терпение любого, сколь угодно прилежного арбитра. Поэтому к данным процедурам следует прибегать с осторожностью. [c.283]
ПРОВЕДЕНИЕ СТРУКТУРНОГО КОНТЕНТ-АНАЛИЗА
Помимо слов, тем и других элементов, обозначающих содержательную сторону сообщений, существуют и иные единицы, позволяющие проводить структурный контент-аналнз. В этом случае нас интересует не столько что говорится, сколько как говорится, и хотя мы не должны сильно отступать от предмета сообщения, но измеряем мы при этом нечто иное.
Нас может интересовать, например, сколько времени или печатного пространства уделено интересующему нас предмету в том или ином источнике. Сколько слов или газетных столбцов было уделено каждому из кандидатов во время определенной избирательной кампании? Сколько статей или страниц бывает ежегодно посвящено в американских политологических журналах анализу государственно-политических проблем Африки? Изменялось ли это количество за последние 30 лет или осталось неизменным?
С другой стороны, нас могут интересовать и другие, возможно, более тонкие вопросы, относящиеся к форме сообщения. Сопровождается ли конкретное газетное сообщение фотографией или какой-либо иллюстрацией? Ведь, как выяснилось, те, которые сопровождаются, привлекают больше читательского внимания. Каковы размеры заголовка данного газетного сообщения? Напечатано ли оно на первой полосе или же похоронено в ворохе реклам? При ответе на подобные вопросы нас интересуют не тонкости содержания, а способ презентации сообщения. Мы следим за фактом наличия или отсутствия материала по теме, за степенью его выделенности, за его размерами скорее, нежели за нюансами его содержания. В результате мы [c.293] зачастую получаем анализ с куда более надежными измерениями, чем в случае исследования, ориентированного на содержание (постольку, поскольку формальным показателям в меньшей степени присуща неоднозначность), но зато, как следствие, и куда менее значимый.
На рис. 9.1 представлен образец типичного кодировального бланка, используемого для записи данных в ходе структурного контент-анализа. Рисунок взят из работы, в которой исследовалось освещение в прессе выборов в конгресс3. За единицу анализа в ней был принят материал о кандидате (candidate insertion), определяемый как любое газетное сообщение, в котором поименно или имплицитно упоминались любые кандидаты в конгресс от того округа, где распространялась данная газета. Таким образом, каждая строка кодировочной таблицы суммарно отражает признаки одного такого материала о кандидате.
Рис. 9.1. Типичный кодировальный бланк для проведения структурного контент-анализа.
О приписывании каждому столбцу кодировального бланка определенного номера мы будем говорить ниже, в гл. 12, а пока укажем на тип регистрируемой информации. После того как каждому случаю придан индивидуальный регистрационный номер, он классифицируется по типу (информационное сообщение, передовица, очерк на данную тему, письмо в редакцию), указываются: дата его публикации; имя кандидата, к которому он относится; название газеты, где он опубликован; общие предпочтения, если таковые выражены в материале; степень его выделенности по расположению на площади газетного листа (напечатан на первой полосе, на вкладыше, в подвале); наличие [c.284] или отсутствие сопроводительных фотографий или рисунков; наличие упоминания о кандидате в заголовке материала; основное содержание материала (предвыборные новости, реферат речи, публикация в поддержку кандидата); общий объем материала и объем той его части, которая относится непосредственно к интересующему нас кандидату.
Надо заметить, что измерения такого рода весьма поверхностно затрагивают само содержание каждого сообщения в отличие от детального и внимательного обследования, необходимого при содержательном анализе. В результате структурный контент-анализ обычно более прост в разработке и проведении, а потому и более дешев и надежен, чем содержательный контент-анализ. И хотя его результаты, возможно, удовлетворят нас в меньшей степени ибо они дают нам скорее набросок, чем законченную картину сообщения, но при ответе на конкретный исследовательский вопрос они могут зачастую оказаться вполне адекватными. [c.285]
НЕКОТОРЫЕ ПРОБЛЕМЫ, ВОЗНИКАЮЩИЕ В ХОДЕ КОНТЕНТ-АНАЛИЗА
Хотя контент-анализ представляет собой относительно недорогой метод, опирающийся на доступные базы данных, и хотя при его проведении мы не рискуем столкнуться со сложностями и весьма специфическими этическими проблемами (кроме тех случаев, когда анализу подвергается конфиденциальная или засекреченная информация), нам все же надо проявлять определенную внимательность, чтобы избежать кое-каких трудностей, заключенных в этом методе.
Прежде всего необходимо учитывать, что сообщения публикуются и соответствующим образом составляются не просто так, а с какой-то определенной целью с целью то ли информирования, то ли описания, то ли призыва, предписания, самозащиты или даже с целью дезинформации. Поэтому при анализе сообщений мы должны стараться интерпретировать их содержание не иначе, как в контексте их очевидных целей. Например, часто в китайской прессе можно встретить утверждения типа: “Весь китайский народ верит, что новая сельскохозяйственная политика является главным (коренным) шагом вперед на [c.285] пути к прогрессу и социальной революции”. Рассматриваемые по сути, они представляют собой очевидную демонстративную ложь, поскольку не может каждый из миллионов и миллионов человек осознавать какую-то одну установку (в данном случае мы не берем во внимание ее достоинства). С этой точки зрения мы бы должны были склониться к рассмотрению этих утверждений как наиболее вульгарной формы пропаганды. Однако из опыта изучения китайской прессы видно, что утверждения такого типа публикуются совсем не с целью чисто внешней иностранной пропаганды, но более всего предназначены для внушения самим китайцам веры в то, что их правительство хочет, чтобы они были сильными. Другими словами, такие утверждения о единодушии носят не описательный, но директивный характер. Знание этого позволит интерпретировать их скорее как удачный индикатор политических интересов китайских лидеров, нежели как бессмысленную и пустую пропаганду, и мы можем использовать их с некоторой выгодой для себя. Таким образом, цель, с которой информация вводится в оборот, сама по себе может рассмотрена как важный для понимания сути контекст, который мы должны попытаться по возможности вытащить.
Сходным образом и характер распространения того или иного сообщения может неявно выражать многое в его значении. Предвыборная листовка, распространяемая по списку адресов избирателей, является примером сообщений с ограниченной или особой сферой распространения. Даже общедоступная газета может иметь ограниченный или особый круг читателей. У “Нью-Йорк таймс”, например, читательская аудитория состоит из более состоятельных и образованных людей, чем у “Нью-Йорк дейли ньюс”, притом что обе газеты легкодоступны для всех. Журнал “Уолл-стрит джорнэл” можно купить везде в США, но круг его читателей охватывает далеко не все социально-экономические группы населения. Следовательно, если мы должны дать адекватную оценку значимости некоторого сообщения, нам зачастую надо при этом знать, кому оно адресуется и как распространяется. Опираясь то ли на чье-то индивидуальное мнение (например, на мнение хорошо осведомленных лиц), то ли на наведение справок, когда мы пытаемся узнать у отправителей сообщения список его получателей, толи на самоочевидные свидетельства, когда к документу прилагается список [c.286] всех ознакомившихся с ним лиц, иногда с их личными подписями, то ли на опрос читательской аудитории (типа тех, которые обычно проводят газеты, чтобы документально обосновать свои претензии по доставке), мы должны постараться измерить или оценить круг распространения сообщения. Эта информация позволит нам судить о значимости и о важности анализируемого нами материала.
Мы должны постараться правильно оценить степень доступности интересующих нас сообщений. Обеспечена ли нам возможность свободного отбора материалов для анализа? Доступны ли нам все материалы в неискаженном виде или же нам навязан некий контроль извне? Имеем ли мы доступ, например, только к рассекреченным документам (к газетам, издаваемым в расчете на иностранных читателей; к стенограммам только официальных заседаний правительственных комиссий)? Здесь мы имеем дело с проблемой обобщаемости результатов: вопрос в том, насколько репрезентативна исследуемая совокупность сообщений, не говоря уже о выборке из нее. Если совокупность непредставительна, то исследователь при отсутствии у него должной бдительности может быть, самое малое, введен в заблуждение, а то и хуже: может стать объектом сознательной манипуляции.
В каждом из этих случаев основная сложность заключается в том, что информация, необходимая для адекватной оценки, может быть нам просто недоступна. Мы можем не знать и не иметь возможности уточнить цели сообщений, сферу их распространения и реальную степень своего доступа к ним. За этим скрываются весьма многообразные опасности, и контент-аналитик должен быть наготове, чтобы вовремя с ними справиться. Нельзя строить свои оценки на первом впечатлении; напротив, надо сохранять здоровый скептицизм в отношении имеющихся данных, до тех пор пока не будут получены ответы на все обсуждавшиеся выше вопросы. Сказанное, конечное, не означает, что в условиях неопределенности проведение контент-анализа исключается; оно значит только, что, приступив к анализу, исследователь не должен забывать об этой неопределенности.
Наконец, следует сказать несколько слов о надежности интеркодирования. За исключением полностью компьютеризованных контент-аналитических процедур (существует [c.287] целый ряд программ, специально разработанных в расчете на составление словарей ключевых слов, а также на поиск в тексте и числовую обработку последних), контент-анализ целиком опирается на суждения совершенно определенного человека о содержании сообщения. В конце концов, информация сама себя не анализирует. Она изучается, обрабатывается, обсчитывается и классифицируется человеком в лице конкретного исследователя. При этом разные исследователи могут расходиться между собой в понимании данного сообщения. Однако измерения могут считаться достаточно надежными лишь тогда, когда относительно их содержания между исследователями достигнут определенный уровень консенсуса. Надежность интеркодирования термин, используемый в политологии для описания степени такого консенсуса. Чем она выше, тем лучше. Повысить надежность интеркодирования можно с помощью следующих правил:
1. К операционализации любой переменной следует подходить с осторожностью и тщательностью. Удостоверьтесь в том, что все значения сформулированы ясно и по возможности недвусмысленно. На деле такая мера поможет формированию общих критериев оценки, которые можно будет последовательно использовать при классификации и измерении содержания.
2. Используйте услуги как можно большего числа наблюдателей (кодировщиков). Чем больше людей участвует в достижении консенсуса, тем он более значим. Конечно, это может привести к сильному увеличению объема работы (а в случае если наблюдатели плохо подготовлены, то и к риску увеличения ошибки измерения), но и отдача от этой меры может быть очень велика. Ограничивающим фактором здесь обычно выступает нехватка денежных средств.
3. Всячески способствуйте тому, чтобы наблюдатели как можно больше взаимодействовали между собой. Проводите совместные практические занятия с обязательным обсуждением всех нюансов в интерпретации данных; это приведет к достижению консенсуса не только в отношении самих данных, но и в отношении истинных значений операциональных определений.
Успех вышеприведенных мер может быть численно оценен двумя разными способами, связанными со [c.288] статистическими понятиями, которые мы подробнее обсудим в гл. 16. Один из этих способов, применяющийся главным образом в содержательном контент-анализе, состоит в том, что все наблюдатели, задействованные в данном проекте, независимо друг от друга анализируют и кодируют одно и то же сообщение (т.е. приписывают ему свои собственные числовые оценки), после чего вычисляется коэффициент корреляции (r Пирсона) кодов, выданных каждыми двумя наблюдателями. Этот коэффициент измеряет степень согласованности между собой принадлежащих разным наблюдателям оценок наличия и/или частоты встречаемости отдельных слов или тем. Значения коэффициента колеблются в диапазоне от 1 до +1, и показания от +0,9 и выше обычно свидетельствуют о высокой степени интерсубъективной надежности кодирования4.
Другой прием более подходит для структурного контент-анализа, при котором нас интересует не столько трактовка тем, сколько факт их наличия или отсутствия, и при котором дублирующие друг друга измерения не столь необходимы. В данном случае мы рассматриваем все расхождения между наблюдениями, принадлежащими разным наблюдателям, как самостоятельную переменную, в отношении которой имеет смысл задать вопрос, связана ли она с систематическими расхождениями значений любой другой измеренной нами переменной. Другими словами, нас занимает проблема: возможно ли, что один (или более) наблюдатель фиксировал результаты последовательно отличным от других наблюдателей образом? Если признать, что все случаи были распределены между наблюдателями без смещений (обычно особые усилия приходится приложить, чтобы распределить их случайным образам), то любые систематические расхождения, наблюдаемые нами, являются результатом скорее расхождений между кодировщиками, нежели глубинных расхождений между отдельными случаями, которые оказались приписанными ошибающемуся наблюдателю. Коэффициент надежности интеркодирования здесь принимает форму (1η2), где η мера рассеяния значений каждой зависимой переменной, обусловленная наличием расхождений между кодировщиками5. Вычтя эту “межнаблюдательскую ошибку” из 1, мы получаем долю наблюдений, свободных от ошибки. Данный коэффициент вычисляется [c.289] отдельно для каждой переменной, и, чтобы можно было рассчитывать на достаточную надежность измерений, должен превышать 0,9.
Мы видим, что контент-анализ это методика с широким спектром применения, с определенными преимуществами в виде дешевизны, небольшого объема выборки, доступности данных. Однако, возможно, более, чем любой другой метод, он требует тщательной операционализации всех переменных и постоянного мониторинга процесса Наблюдения. Благодаря ему можно получить высокоинформативные результаты, которые, однако, должны интерпретироваться лишь в контексте, подчас не достижимом средствами только контент-анализа. По этой причине этот метод используется чаще всего в сочетании с другими методами сбора данных (опросом, непосредственным наблюдением). [c.290]
Дополнительная литература к главе 9
Общие работы по контент-анализу и соответствующим методикам: North R.С. et al. Content Analysis: A Handbook with Applications for the Study of International Crisis. Evanston: Northwestern Univ. Press, 1963. Особое внимание в этой работе уделено методам измерения надежности и шкалирования по признаку интенсивности. Stone Ph. J. (ed.). The General Inquirer. Cambridge (Mass.): МГГ Press, 1966. Книга Стоуна дает примеры применения широко распространенной компьютерной методики контент-анализа, опирающегося на элементы структуры предложения. [c.290]
Детальный обзор контент-аналитических приемов см. в: Krippendorff К. Content Analysis: An Introduction to its Methodology. Beverly Hills: Sage, 1980.
Основы контент-анализа см. в: Weber R. Ph. Basic Content Analysis. Beverly Hills: Sage, 1985.
О применении контент-анализа в политологии: Мerritt R.L. Symbols of American Community, 17351775. New Haven (Conn.): Yale Univ. Press, 1966. В книге Мерритта исследуется развитие американского национального самосознания (по материалам американской печати колониального периода). Fоwles J. Mass Advertising as Social Forecast: A Method for Future Research. Westport: Greenwood Press, 1976, анализ содержания реклам как основа для прогнозирования социального развития.
Контент-аналитическое измерение тем насилия в американском телерепертуаре см. в: Gеrbnеr G., Сrоss L. Living with Television: The Violence Profile. // Journal of Communication. 1976. Vol. 26. P. 173-199.
Graber D.A. Processing the News: How People Tame the Information Tide. White Plains: Longman, 1988. Грабер пишет о применении контент-анализа к кодированию дневников и экспертных интервью; экземплифицирует преимущества комплексных проектов, использующих сразу несколько разных исследовательских методов.
Примеры применения контент-анализа и обсуждение связанных с ним методологических вопросов регулярно можно встретить на страницах журналов “Journalism Quarterly”, “Journal of Communication”, “Communication Research”. [c.291]
10. ИСТОЧНИКИ И ПРИМЕНЕНИЕ СВОДНЫХ ДАННЫХ
Политолога не интересуют отдельные люди. Вернее, политолога (как ученого) интересуют отдельные индивиды лишь постольку, поскольку они являются составной частью изучаемой им группы людей. Например, мы можем изучать поведение какого-то конкретного губернатора, но не потому, что мы хотим узнать больше о губернаторе Смите, а потому, что, как нам кажется, из наблюдений над губернатором Смитом мы можем вынести лучшее представление об американских губернаторах вообще и можем научиться прогнозировать их поведение. Политолога интересует изучение групп или сообществ людей, таких, как совокупность американских избирателей, индийское крестьянство или российская бюрократия.
Иногда для изучения этих групп нам приходится собирать данные об их отдельных членах (или о репрезентативных выборках из них) и затем объединять, или сводить, эти данные, для того чтобы получить информацию о группе в целом. Однако зачастую совокупная информация о группе уже имеется. Данные, характеризующие группу или сообщество индивидов в совокупности, принято называть сводными данными.
Существует две основные разновидности сводных данных. Первая из них это суммарные показатели, к которым относятся большие совокупности мер групповых признаков, получающиеся путем объединения данных о поведении всех членов группы. К сводным данным, к примеру, можно отнести население государства. Уровень рождаемости, смертности, грамотности, преступности это все сводные показатели, получаемые посредством сложения всех соответствующих отдельных событий (смертей, рождений, преступлений и т д.) в группу и выражаемые в стандартизованных единицах (например, в расчете на тысячу человек населения). В каждом случае сводные данные отражают количество какого-то группового признака (или свойства), которым члены группы, будучи взятыми по [c.292] отдельности, не обладают. Индивид может выступать в качестве составной части населения, но не может быть самим населением. Индивиды могут рождаться, учиться, умирать, но не могут обладать коэффициентом рождаемости, грамотности, смертности в том же смысле, что и целое государство. Эти данные являются мерами совокупных признаков.
Ко второй основной разновидности сводных данных относятся те меры, которые отражают количество группового признака, выводимого не из объединения признаков отдельных членов группы, а из системных свойств группы. Такие меры часто называют системными показателями. Форма правления, например, это системная переменная, и в любом государстве может быть установлена демократическая или недемократическая форма правления вне зависимости от того, какого поведения и каких взглядов демократических или нет придерживаются отдельные граждане этого государства. Точно так же бюджет любого округа в США может обнаруживать высокий уровень расходов на государственное образование вне зависимости от того, какое значение придают соответствующим проблемам отдельные жители этого округа.
Данные обеих указанных разновидностей, относящиеся к самым различным типам групп, можно получить из целого ряда источников. Группы можно разбить на две категории: территориальные группы (определяемые проживанием их членов в пределах определенного географического района, как-то: государства, города или переписного района) и демографические группы (определяемые личными признаками их членов, как, например, расовой принадлежностью или родом занятий).
Из этой главы вы узнаете, что использование сводных данных сопряжено с решением некоторых встающих при этом методологических проблем. Однако преимущества, получаемые от применения сводных данных, чаще всего сильно перевешивают возможные издержки. Использование сводных данных может быть сочтено необходимым или желательным тогда, когда индивидуальные данные (т.е. относящиеся к индивидуальным случаям) недоступны или слишком дорогостоящи. Можно привести следующие примеры. Если мы собираемся предпринять историческое исследование, то по крайней мере часть интересующих нас групп (например, население Чикаго в 1880 г.) [c.293] может принадлежать к числу уже умерших. Члены некоторых важных в политическом отношении групп (например, международных террористических организаций) могут упорно избегать интервьюирования и идентификации их личностей. Чаще, правда, политолог оказывается в ситуации, когда сбор индивидуальных данных теоретически возможен, но непомерно дорогостоящ. В особенности это относится к сравнительным исследованиям, поскольку расходы и организационные проблемы, связанные с проведением международного опроса, огромны.
Занимаясь вопросами, по которым индивидуальные данные почему-либо недоступны, политолог часто находит полезным использовать сводные данные, содержащие основную необходимую ему информацию. В настоящей главе читатель познакомится с тем, какие типы сводных данных являются доступными, какие бывают источники сводных данных, какие методологические проблемы встают при использовании сводных данных и, наконец, какие можно предложить общие правила сбора сводных данных. Читателю вскоре станет ясно, что правильное применение сводных данных требует мастерского владения методами сбора, обработки и анализа информации. Однако как студентам, так и профессиональным политологам приходится иметь дело чаще со сводными данными в силу их большей доступности, чем с любыми другими данными, получаемыми с помощью методов, описанных в предыдущих главах. [c.294]
ТИПЫ СВОДНЫХ ДАННЫХ
Большая часть доступных политологам сводных данных бывает, как правило, собрана не политологами и не в исследовательских целях. Поэтому они зачастую имеют лишь косвенное отношение к конкретному политологическому исследованию. На самом деле при анализе сводных данных сложнее всего бывает уметь использовать имеющиеся данные в качестве показателей тех понятий, которые непосредственно интересуют исследователя. Например, на первый взгляд почти нет оснований думать, что политолога может заинтересовать число купленных в стране радиоприемников или величина оформленной подписки на газеты. В конце концов политолог это не агент по сбыту печатной продукции. И все же соответствующие [c.294] цифры могут оказаться для него полезными, выступая в качестве косвенных показателей уровня обмена политической информацией в обществе или уровня его экономического развития, что само по себе, безусловно, входит в сферу интересов политологии. Точно так же и сведения о числе больничных коек в расчете на тысячу человек населения обретают определенную политологическую значимость, если их рассматривать как показатели, допустим, эффективности государственной политики в области здравоохранения или степени доступности медицинских услуг для различных социальных слоев в рамках города или государства.
Суть в том, что сводные данные часто не представляют самостоятельного интереса; поэтому, чтобы быть примененными с пользой для исследования, они нуждаются в определенной обработке. Не следует ориентироваться только на уже готовые показатели, но нужно уметь увидеть возможность объединения кажущихся не связанными друг с другом мер в пригодные для данного исследования показатели.
Существует шесть типов сводных данных1, приводимых ниже в порядке убывания их валидности и надежности.
1. Данные переписи (цензовые данные). Многие государства мира периодически предпринимают сплошные опросы всего населения (или, как минимум, всех семей), для того чтобы получить информацию, которую можно будет в дальнейшем использовать в целях регулирования налогообложения и планирования государственной политики. Среди прочего эта информация включает данные о количественном составе семьи, о половой принадлежности главы семьи, о времени проживания в данной местности, об уровне образования, о доходах семьи и о ее жилищных условиях. Хотя цензовые данные собираются по каждой семье индивидуально, но к тому времени, как они станут доступными исследователям в форме официальных учетных документов, они обретают вид суммарных итоговых цифр (например, общее число владельцев автомашин в некотором данном районе).
У цензовых данных есть целый ряд свойств, делающих их крайне ценными для политологического анализа. Во-первых, несмотря на то что в них встречаются ошибки2, данные переписи бывают в целом вполне надежными. Во-вторых, [c.295] поскольку измеряемые переписью переменные обычно просты, ее данные принято рассматривать как высоковалидные. В-третьих, в некоторых государствах сбор относительно стандартизованных данных продолжается в течение многих лет. Таким образом, данные переписи дают возможность выявлять исторические тенденции и проверять гипотезы о различных изменениях во времени. В-четвертых, поскольку цензовые данные обычно носят стандартизованный характер (а именно содержат ответы на одинаковые вопросы и подразделяют ответы на одинаковые классификационные категории), они сравнимы между собой и поэтому бывают весьма полезны при сравнивании различных государств, городов или регионов. Вдобавок ко всему цензовые данные легкодоступны. Во многих странах публикуются итоговые отчеты как о всеобщей переписи населения, проводимой обыкновенно раз в десять лет, так и о различного рода специализированных опросах, проводимых в промежутках между всеобщими переписями. ООН раз в год публикует “Демографический ежегодник”, где приводятся данные переписей в разных странах. В США имеется Бюро переписей большой отдел обслуживания исследователей, который помогает найти и получить для работы нужные данные из тех, что имеются в распоряжении бюро.
2. Ведомственная статистика. В каждом государстве различные органы государственного управления, предприятия, профсоюзы и другие общественные организации занимаются сбором информации, связанной с их собственной деятельностью. Если эти данные удовлетворяют запросам конкретного социологического исследовательского проекта, они могут принести большую пользу исследованию.
Некоторые организации собирают данные самостоятельно, как это делают, например, международные корпорации, ведущие учет своих капиталовложений, больницы, регистрирующие сведения о пациентах, и городские управления, ведущие в целях налогообложения учет недвижимого имущества. Есть организации, которые используют данные, добытые другими агентствами (такими, как министерство торговли США), для преобразования их в форму различных индексов, отражающих, например, экономическое развитие или демографические сдвиги. В [c.296] США к такому типу организаций относятся Комиссия по вопросам экономического развития и Международная ассоциация городских руководителей.
У исследователя, желающего ознакомиться с ведомственной статистикой, могут возникнуть определенные проблемы. Первой и, наверное, самой важной является проблема получения доступа к информации. Данные, собираемые государственными учреждениями, являются обычно частью государственной статистики и легкодоступны, но данные, которые собираются неправительственными организациями, находятся в частной собственности последних. Некоторые организации особенно это относится к частным компаниям считают свои данные секретными и очень неохотно делятся ими. Зачастую проблема состоит даже не столько в том, чтобы добраться до информации, сколько в том, чтобы просто узнать о ее существовании. Ведь никаких централизованных списков статистических данных не существует, поскольку они собираются тысячами самых разных государственных и частных организаций, вовлеченных в деятельность по учету информации. Исследователь может упустить из виду массу важнейших данных в силу простого недостатка сведений о существовании или о содержании конкретной статистики.
Проблема состоит в том, что содержание и качество данных могут сильно варьировать, затрудняя возможность их сравнения и обобщения. Если профсоюзы учителей штатов Индиана и Огайо собирают о своих членах почти несравнимые данные, то и мы не можем использовать эту статистику для осмысленного сравнения этих профсоюзов. Если мы к тому же не знаем, как собиралась информация, то мы и не можем знать, до какой степени надежны приводимые цифры.
И наконец, данные могут находиться в неудобной для обработки форме. Бывает, что статистика естественного движения населения какого-то конкретного района (данные о рождениях, смертях, заключении и расторжении браков и пр.) будет доступна только в несведенной форме и только в центральном населенном пункте этого района, так что исследователю придется много часов провести в здании местного управления, занимаясь утомительным [c.297] переписыванием данных от руки, с тем чтобы их впоследствии можно было ввести в машину и подытожить.
Вышеуказанные проблемы возникают не всегда, и, даже когда исследователю приходится сталкиваться с ними, все равно потенциальная отдача от использования сводной информации обычно стоит тех усилий, которые были приложены для их решения.
3. Выборочные опросы. Опросное исследование предполагает сбор данных на индивидуальном уровне. В тех случаях, когда опросы основываются на выборках, репрезентативно отражающих интересующую нас группу населения, их результаты могут быть использованы нами в качестве сводных данных. Например, мы хотим сравнить уровни политической информированности граждан двух разных государств. Если в каждом из этих государств имеется своя служба изучения общественного мнения, которая регулярно проводит выборочные опросы населения (так, как это делают институты Гэллапа и Роупера в США), включая вопросы о таких поведенческих признаках, как величина подписки на общественно-политические журналы или время, потраченное на просмотр информационных телепрограмм, то результаты этих опросов мы можем применить для построения сводных мер нашей переменной. Подобным же образом иногда можно использовать результаты опросов, проводимых в академических целях3. Преимуществом опросных данных если они грамотно собраны является высокий уровень надежности и валидности, причем степень последней зависит от умения исследователя выводить новые показатели. Опросные данные тоже в целом доступны (во всяком случае, за определенную плату их можно получить у тех организаций или ученых, которые занимались их сбором), притом зачастую в удобной для использования форме.
4. Содержание публикаций. Для получения сводных данных можно предпринять и контент-анализ публикаций, финансируемых какой-то определенной организацией или распространяемых среди ее членов. Например, если мы изучаем процесс политизации населения Великобритании, то можно подвергнуть контент-анализу английские учебники по гражданскому праву на предмет определения того, какое внимание уделяется в них демократическим ценностям, и объединенные результаты такого анализа затем использовать в качестве единого показателя демократических ориентации населения страны. Точно [c.298] так же для получения показателя, отражающего соотношение интереса жителей развивающихся стран к международным делам и ко внутренней политике (или соотношение их симпатий к странам советского блока и к странам западного блока), мы могли бы прибегнуть к контент-анализу основных газет этих стран. И в том и в другом случаях результатом контент-анализа будет показатель определенного группового признака.
Сводные данные этого типа собираются исследователем специально для целей конкретного исследовательского проекта в отличие от тех, что берутся в готовом виде из какого-либо первичного источника, как, например, из отчета о результатах переписи. В силу этого доступность таких данных зависит от доступности необходимых публикаций и от того, располагает ли исследователь средствами для проведения контент-анализа. Надежность и валидность этих данных будут зависеть от умения исследователя правильно применять правила, описанные в гл.9. Сводные данные, собранные посредством контент-анализа публикаций, имеют то преимущество, что они могут быть пригодными для любого исследования, но получаемые с их помощью показатели базовых понятий бывают обычно весьма несовершенными. Ведь не очень ясно, насколько, например, можно быть уверенным в состоятельности утверждений о политических ценностях английских школьников, полученных на основе анализа учебников гражданского права.
5. Событийная информация. Политолога зачастую интересует такая информация об отдельных событиях, которая не отражается ни в отчетах о результатах переписи, ни в ведомственной статистике ввиду того, что эти события либо слишком редки, либо вообще выпадают из поля зрения статистики. Примерами событий такого рода могут служить восстания, революции, убийства, разрыв дипломатических отношений, привлечение государственных должностных лиц к суду за служебные злоупотребления, государственные перевороты и создание новых политических партий. Информация о таких событиях может оказаться полезной при построении показателей каких-либо групповых свойств. Например, уровень политической стабильности в стране можно было бы измерить путем подсчета числа актов политического насилия, имевших [c.299] место в течение определенного периода времени, а уровень политической коррупции в крупных городах через подсчет числа случаев привлечения государственных чиновников к суду за взяточничество.
Процесс сбора событийной информации очень напоминает контент-анализ. После того как мы решим, какие события важны для нашего исследования, и тщательно их операционализируем (например, решим для себя, из каких действий состоит восстание), мы приступаем к систематическому обследованию всех источников (газет, ежегодников, записей радиопередач), в которых может содержаться информация об этих событиях, после чего подводим итог (следя при этом за тем, чтобы не посчитать одно и то же событие дважды, в том случае если оно упомянуто более чем в одном источнике). Кроме того, для получения более детализированной информации мы можем воспользоваться техникой контент-анализа. Например, для определения того, насколько серьезны общественные беспорядки, их можно классифицировать либо по продолжительности, либо по размерам примененного насилия, либо по числу участников.
Относительная надежность событийной информации может быть обеспечена за счет тщательной подготовки исследователя и благодаря контролю со стороны тех, кто регулярно читает источники. Однако сделать эту информацию валидной чрезвычайно трудно. Главная проблема заключается в полноте отчетности. Даже если исследователь просмотрел все известные источники или отчеты о каком-либо типе событий, все равно нельзя поручиться, что ни одно имевшее место событие подобного рода не избежало регистрации. Есть страны, в которых правительство строго контролирует сообщения о политических событиях, с тем чтобы огласку получала только предпочтительная, с точки зрения этого правительства, информация, поэтому о многих важных акциях (вроде применения войск для подавления забастовки) может не появиться никаких сообщений и, следовательно, никакой валидной меры, этих событий построить нельзя.
Вторая проблема проистекает из первой и связана с тем, что в сообщениях возможны неточности. Даже когда о событиях имеется какая-то информация, детали этой информации могут оказаться намеренно или ненамеренно [c.300] искаженными, эти проблемы, конечно, преодолимы, однако, планируя исследование с привлечением событийной информации, о них следует помнить и реалистически оценивать возможности построения таким путем валидных мер4.
6. Экспертные данные. Бывают случаи, когда данных, нужных для построения мер каких-то определенных совокупных свойств, просто не существует. В этих случаях исследователь может иногда прибегнуть к использованию суждений экспертов или лиц, знакомых с предметом исследования.
Рассмотрим пример исследования, предметом которого является лоббистская борьба нескольких заинтересованных групп в защиту и против природоохранного законодательства. По данному вопросу может не существовать никаких официальных документов, но исследователь вполне может расспросить ведущих законодателей о том, какая группа и сколь интенсивно, по их оценке, поддерживает это законодательство или противодействует ему в своей лоббистской деятельности. Точно так же, если исследователь не в состоянии собрать данные о том, насколько широко тот или иной государственный режим прибегает к насилию, чтобы удержаться у власти, он может обратиться к ученым, которые бывали в соответствующих странах и знакомы с их политическими системами, с просьбой дать оценку соответствующих режимов.
Экспертные данные очевидным образом страдают определенными недостатками. Прежде всего, степень точности таких данных ограничена рамками личного опыта экспертов. Чтобы не полагаться на неверные или ограниченные оценки, можно прибегнуть к помощи нескольких экспертов, сверяя их показания между собой. Однако зачастую трудно найти сразу несколько квалифицированных экспертов, которые бы отличались друг от друга уровнем подготовки и опытом знакомства с предметом исследования, так что даже привлечение целой группы экспертов не может подчас служить гарантией точности данных. Во-вторых, даже тогда, когда информация, полученная от эксперта, абсолютно достоверна, она носит в целом весьма размытый характер. Ведь в конце концов исследователь интересуется впечатлениями и мнением эксперта о сложных явлениях, а не о числе отдельных событий. Тем не [c.301] менее указанные ограничения не должны обескураживать исследователя. Важно, чтобы он помнил о них, планируя исследование и анализируя экспертные данные, ибо ошибочно было бы обращаться с этими данными как с более надежной и точной информацией, чем это есть на самом деле. [c.302]
ПРОБЛЕМЫ, СВЯЗАННЫЕ С ИСПОЛЬЗОВАНИЕМ СВОДНЫХ ДАННЫХ
Из предшествующего изложения видно, что специфические проблемы, встающие при анализе сводных данных, меняются в зависимости от типов и источников этих данных. Существуют, однако, некоторые общие проблемы, с которыми всегда приходится сталкиваться при использовании сводных данных. Мы рассмотрим две такие проблемы, не ставя перед собой цели предложить готовые их решения, но желая предупредить исследователя о необходимости не упускать их из поля зрения.
Обсудим сначала так называемую проблему экологической ошибки, которую необходимо учитывать при составлении плана исследования и при спецификации и операционализации переменных, равно как и собственно при принятии решения об использовании сводных данных применительно к конкретному исследовательскому вопросу.
Исследователь рискует совершить одну из нескольких экологических ошибок всякий раз, как он пытается, основываясь на данных, собранных на одном уровне анализа, обобщить результаты на другой уровень анализа. Например, если мы, собирая данные о расовой принадлежности получателей государственного социального пособия в разных штатах США, обнаружим наличие сильной прямой зависимости между получением регулярной помощи от государства и принадлежностью к небелому населению, у нас может возникнуть искушение распространить этот результат на более высокий, т.е. общенациональный, уровень и объявить, что эта зависимость верна для данного государства в целом, либо, наоборот, обобщить “вниз”, допустив, что зависимость, обнаруживаемая в каждом отдельном штате, будет также верна и для каждого из его округов. Если же сведением данных мы занимаемся на общенациональном или окружном уровне, то, возможно а по сути дела, почти наверняка, мы обнаружим, что на [c.302] этих уровнях наблюдается зависимость, сильно отличная от той, которая была получена на основе данных, сведенных на уровне штата. Эмпирическое изучение “экологической” проблемы показало, что зависимости на разных уровнях могут быть не просто слабее или сильнее, но они могут быть даже разнонаправленными5. Когда исследователь экстраполирует результаты одного уровня анализа на другой, он рискует неверно проинтерпретировать свои данные и прийти к ошибочным выводам.
Значит ли это, что мы должны использовать только те данные, которые были сведены на уровне единиц анализа, изначально выбранных нами для изучения, и что мы в своем исследовании совсем не можем обобщать “вверх” или “вниз”? Нет, это не так. Существуют методы анализа данных, которые при определенных условиях помогают по меньшей мере свести к минимуму тот риск, с которым бывают связаны межуровневые обобщения6. Когда исследователь видит, что он волей обстоятельств вынужден использовать данные, сведенные не на том уровне анализа, с которым он имеет дело, а на другом, то, прежде чем собирать данные, он должен предусмотреть применение одного или нескольких таких методов и проследить, чтобы имеющиеся у него данные отвечали их требованиям.
Наверное, еще важнее проявлять бдительность памятуя о риске “экологических” заключений при планировании исследования и операционализации понятий. Здесь надо по возможности избегать применения показателей, требующих обобщения результатов разных уровней анализа. Пусть, например, задачей нашего исследования является определение зависимости между членством в профсоюзе и поддержкой демократической партии (в США), и в нашем распоряжении оказываются сводные данные по избирательным округам, где указано, какой процент избирателей каждого округа голосовал на последних выборах за демократов и какой процент трудящихся каждого округа состоит в профсоюзе. Мы сможем использовать эти данные только в том случае, если единицей нашего анализа являются избирательные округа, а целью анализа суждения типа: “Чем больше в округе членов профсоюзов, тем больше вероятность, что на выборах в нем победит кандидат от демократов”. Однако если единицей анализа у нас выступают отдельные избиратели [c.303] (индивиды), то мы будем стремиться к получению суждений типа: “Члены профсоюзов, как правило, голосуют за кандидатов от демократов”. При этом мы не можем сколь-нибудь уверенно использовать сводные данные по избирательным округам, и будет разумнее, если мы попытаемся поискать данные, относящиеся к членству в профсоюзе и поведению на выборах отдельных индивидов.
Вторая (близкая первой) группа проблем, часто встречающихся при анализе сводных данных, связана с трудностями построения на основе сводных данных валидных показателей. Редко когда случается обнаружить сводные цифры, которые можно было бы использовать в качестве непосредственной меры какого-либо интересного для политолога понятия. Чаще всего мы имеем дело с числами, представляющими такие переменные, которые можно рассматривать как часть какого-то более крупного явления, с которым связаны наши базовые понятия. При изучении политических последствий научно-технического прогресса, например, исследователю, возможно, не удастся найти сводных данных, непосредственно отражающих уровень научно-технического прогресса в различных странах. Но он, наверное, сможет получить информацию о том, какая часть населения каждой страны грамотна, или живет в населенных пунктах численностью свыше 25 тыс. человек, или занята в несельскохозяйственных отраслях экономики; все эти параметры могут рассматриваться как составляющие научно-технического прогресса. Подобные цифры часто называют необработанными (“сырыми”) данными; они интересуют исследователя не сами по себе, а как основа для создания важных в рамках конкретного исследования понятий.
Перед исследователем стоит задача найти поддающиеся теоретическому и методологическому обоснованию пути превращения необработанных данных в пригодные для использования меры. Существует два основных подхода к этому через формирование индексов и через преобразование данных.
Построение индекса заключается в сведении сложных данных в единый показатель, который отражает значение понятия полнее, чем любой из его компонентов. Широко используются три типа индексов аддитивные, мультипликативные и взвешенные. Аддитивный индекс употребим [c.304] в тех случаях, когда доступные исследователю данные отражают различные меры одной и той же базовой переменной. Например, для получения показателя понятия “размеры экспорта сельскохозяйственной продукции” мы могли бы просто сложить все отчетные цифры, отражающие количество экспортированной пшеницы, кукурузы и соевых бобов (в бушелях); для выяснения размеров “религиозного сообщества” в некоторой стране можно было бы просуммировать все числовые данные, отражающие количество приверженцев различных религий, исповедуемых в этой стране.
Часто, однако, сводные данные отражают меры различных сторон некоторого явления, что не допускает возможности суммирования. Следуя законам математической логики, мы не можем, например, складывать число людей, участвовавших в беспорядках, с числом часов, в течение которых длились эти беспорядки, в надежде тем самым построить индекс степени серьезности беспорядков. Число участников и продолжительность являются неаддитивными элементами явления под названием “беспорядки”. Можно, однако, утверждать, что эти два элемента взаимодействуют друг с другом, и тогда для получения показателя степени серьезности беспорядков мы могли бы число участников умножить на число часов, вычислив таким образом число “человеко-часов”, пришедшихся на беспорядки. Полученный таким путем показатель называется мультипликативным индексом. Подобные индексы бывают нужны в тех случаях, когда мы измеряем различные аспекты некоторого понятия7.
При определенных обстоятельствах необработанные данные для того чтобы стать обоснованным показателем понятий нуждаются во взвешивании с помощью некоторого эталона. Например, использование числа участников антиправительственной манифестации в качестве показателя величины кредита доверия к правительству правомерно только тогда, когда это число выражено в форме процентного отношения к численности всего населения. Чтобы получить взвешенный индекс, мы должны одну переменную (число участников антиправительственных манифестаций) взвесить с помощью другой (численности населения). Точно так же, исходя из предположения, что десять демонстраций в год указывают на [c.305] большую политическую нестабильность, чем те же десять демонстраций, но растянутые на десять лет, мы могли бы число антиправительственных демонстраций взвесить с помощью эталонной переменной “время”, получив индекс количества демонстраций в год. Этот конкретный тип взвешивания называется стандартизацией.
Взвешивание технически простая операция, но с концептуальной стороны зачастую бывает трудно определить, нуждается ли конкретная мера во взвешивании и что следует выбрать в качестве эталона веса. Неясно, к примеру, что выступает в роли спускового крючка гонки вооружений: абсолютные уровни вооружений вовлеченных в гонку государств или определенное соотношение этих уровней? Следует ли в качестве эталона веса использовать уровень вооружений государства-противника? Ответы на подобные вопросы обычно можно получить посредством эмпирического выяснения того, как именно применение взвешенных и невзвешенных показателей влияет на результаты статистического анализа.
Случается, что при использовании сводных данных исследователь сталкивается с такими мерами, которые невозможно сделать пригодными для целей конкретного исследования путем простого сочетания с другими мерами и их необходимо видоизменить в индивидуальном порядке. Иногда даже индексы после их видоизменения становятся более пригодными. Такие видоизменения обычно называются преобразованиями данных. Данные преобразуются главным образом для того, чтобы они отвечали требованиям определенных статистических процедур, которые исследователь намеревается применять в процессе анализа. Самым общим основанием для преобразования данных является необходимость избежать такого искажения результатов статистического анализа, которое бывает обусловлено определенными свойствами распределения необработанных данных.
Существует много методов преобразования данных, и каждый из них рассчитан на исправление вполне определенных изъянов, имеющихся у необработанных данных8. Однако логарифмическое преобразование может, пожалуй, служить хорошим общим примером того, как работают эти методы. Некоторые из наиболее часто используемых статистических процедур могут быть законно применены [c.306] только к данным с нормальным распределением (о нормальном распределении см. гл.15). Применение этих процедур к данным, не характеризующимся нормальным распределением, может привести к серьезной недооценке силы зависимостей, существующих между переменными, и к другим неверным выводам. Но необработанные сводные данные чаще всего не отличаются нормальным распределением. Логарифмические преобразования рассчитаны как раз на то, чтобы как можно более приблизить данные к нормальному распределению. Основная процедура состоит в том, что к “оценке” каждого случая в рамках множества необработанных данных прибавляется некоторая константа, после чего исходная оценка заменяется на подходящий логарифм с использованием логарифмической таблицы. Итог такого преобразования виден на рис.10.1, где показаны результаты преобразования гипотетических данных о числе людей, принявших участие в демонстрациях в защиту прав гомосексуалистов в 57 городах США. Распределение преобразованных данных (см. рис. рис.10.1б) не образует нормальной, или колоколообразной, кривой, но оно гораздо ближе к ней, чем распределение необработанных данных (см. рис. рис.10.1а).
а) Необработанные данные |
(б) Преобразованные данные |
Рис. 10.1. Влияние логарифмическою преобразования на гипотетические данные о демонстрациях в защиту прав гомосексуалистов, имевших место в 57 городах США.
Сказанное выше не следует интерпретировать в том смысле, что иметь дело сразу с несколькими мерами нежелательно. Наоборот, иметь множественные показатели (multiple indicators) понятий весьма желательно; при этом зачастую полезно как объединять разные меры в индексы, так [c.307] и изучать их на каком-то этапе анализа данных отдельно друг от друга. Это мотивируется тем, что использование множественных показателей позволяет контролировать степень обоснованности нашей операционализации понятий.
Пусть, например, мы хотим измерить понятие “дискриминация по признаку пола в сфере занятости” применительно к разным американским штатам. Допустим, нам удалось раздобыть данные по следующим переменным:
(1) соотношение средней заработной платы мужчин и женщин;
(2) доля женщин среди работников квалифицированного труда;
(3) соотношение уровней безработицы среди мужского и среди женского населения.
Мы можем использовать все три показателя, приписав каждому штату оценку (ранг) в рамках каждой переменной, а затем сравнив полученные результаты. Если те штаты, в которых выявляется наибольшая степень дискриминации по одному показателю, заняли высокий ранг и по другим показателям, то у нас есть все основания полагать, что каждый из этих показателей является валидной мерой базового понятия “дискриминация по признаку пола в сфере занятости”. С другой стороны, если мы обнаружим, что штаты, занявшие высокий ранг по двум каким-то показателям, по третьему из показателей имеют низкий ранг, то нам придется воздержаться от дальнейшего использования этого последнего девиантного показателя в качестве меры нашего базового понятия.
Чем больше независимых показателей удается выделить для каждого понятия, тем лучше, потому что большее количество показателей позволяет осуществить более основательную проверку валидности каждого из них. Так, в отношении предыдущего примера, где были выделены всего три меры, мы не можем быть совершенно уверены в том, что “девиантная” мера не является на самом деле валидной, а две другие, наоборот, лишенными валидности. Возможно, именно в силу своей валидности эта мера отклоняется от других показателей в том, как они ранжируют штаты. Если бы, однако, у нас было пять или десять мер, которые бы вполне непротиворечиво ранжировали штаты, наряду с одной стоящей в стороне от них мерой, то мы бы могли быть совершенно уверены в том, что валидности [c.308] лишена именно эта девиантная мера, а не остальные. Существует целый ряд методов, использующих множественные меры для проверки и усиления валидности показателей9.
Существует еще один очень важный вопрос, о котором необходимо помнить при использовании сводных данных. Он связан с тем фактом, что сводные данные доступны подчас только в форме, не позволяющей делать состоятельных сравнений между единицами. Так, например, если нас интересует, какое внимание уделяется в различных американских штатах вопросам народного образования, то нам следовало бы поискать данные о величине ежегодных расходов каждого штата на народное образование. Было бы, однако, некорректно сравнивать общую сумму денег, расходуемых Техасом, с общей суммой, расходуемой Род-Айлендом, ввиду того что эти штаты несопоставимы по размерам и благосостоянию. Род-Айленд может расходовать только малую долю того, что расходует Техас, и при этом демонстрировать большую степень заботы о народном образовании, благодаря тому что здесь на школы будет тратиться намного больше в расчете на каждого ребенка школьного возраста или относительно объема всего бюджета штата. Чтобы сравнить бюджеты штатов, нужно перевести данные об их расходах на образование в такую форму, которая бы учитывала имеющиеся между ними различия в численности населения и в величине бюджета. Если мы этого не сделаем, то у нас не будет валидного показателя базового понятия и наши выводы будут отражать не столько относительную величину заботы каждого штата о народном образовании, сколько его относительные размеры и благосостояние.
Подобные ситуации вынуждают нас каким-то образом стандартизовать наши меры. Мера является стандартизованной, когда она сформулирована так, чтобы в ней учитывались возможные расхождения между отдельными случаями в рамках переменных, отличных от той, которую она отображает. Очень часто бывает необходимо стандартизовать сводные данные перед тем, как приступать к сравнению единиц анализа. Это может повлечь за собой необходимость сбора данных по переменным, не имеющим прямого отношения к данному исследованию. Так, возвращаясь к предыдущему примеру, нам могут [c.309] понадобиться данные по численности населения и общей величине расходов штатов, чтобы с их помощью можно было стандартизовать расходы штатов на образование, выразив их в количестве долларов, приходящихся на обучение каждого ребенка школьного возраста, или в форме процентного отношения ко всему бюджету штата.
Точно так же, если бы мы захотели измерить понятие “милитаризация”, опираясь на цифры военных расходов различных государств, то, прежде чем делать какие бы то ни было сравнения, нам нужно было бы стандартизовать эту меру, выразив ее в форме процентного отношения к валовому национальному продукту (общая стоимость всех товаров и услуг, произведенных в данной стране за определенный период). Не сделай мы этого, и богатое государство будет выглядеть большим милитаристом, чем бедное, даже если оно расходует на военные цели относительно общей суммы своих доходов в десять раз меньше, чем бедное государство.
Итак, всякий раз, как вы собираетесь сравнивать какие-нибудь группы (страны, города, организации и т.п.), вам надо помнить о необходимости стандартизовать ваши меры и запланировать сбор дополнительных данных, которые могут понадобиться для стандартизации. Стандартизация обычно заключается в приведении меры к выражению вида “такое-то количество единиц в расчете на единицу какой-то другой переменной” или к форме процентного отношения к какой-то другой переменной. Это зачастую предполагает вычисление некоторого коэффициента, или уровня, как-то: уровень преступности (количество преступлений на тысячу человек населения), уровень грамотности (количество грамотных на тысячу человек населения), уровень детской смертности (количество детских смертей на тысячу рождений) и т.п. Дополнительная работа по сбору данных по тем переменным, с помощью которых должна быть стандартизована ключевая переменная, совершенно необходима, если стремиться к обоснованности сравнений между теоретически сильно различающимися случаями.
Итак, при анализе сводных данных исследователь должен не только проявлять осторожность в использовании необработанных данных в качестве показателей понятий, но и помнить о пользе множественных мер, а также о [c.310] возможности усовершенствования показателей посредством их сочетания, преобразования или стандартизации. [c.311]
ИСТОЧНИКИ СВОДНЫХ ДАННЫХ
Количество имеющихся в мире сводных данных так велико, что начинает казаться, что для каждого эмпирически полезного понятия могут найтись свои показатели. Изобилие данных иногда само по себе представляет проблему для исследователя, когда тот вынужден просматривать сотни источников в поисках всех существующих показателей. И в то же время при всем многообразии имеющихся данных исследователь бывает часто не в состоянии найти показатели, относящиеся именно к тому понятию, которое он хочет измерить, именно к нужному ему периоду времени и сведенные именно на нужном ему уровне анализа.
Мы не можем перечислять все источники сводных данных10. Но мы упомянем те источники данных общего характера, которые скорее всего могут понадобиться политологу. Хотя некоторые источники включают в себя данные по целому ряду проблем и поэтому не могут быть охарактеризованы как содержащие какой-то один конкретный тип данных, мы сгруппировали перечисляемые ниже источники в соответствии с тем, какой основной тип данных в них отражен.
Ключ к успешной работе с любыми документами и архивами данных лежит в точном знании того, какой тип показателей вы ищете. В уяснении этого вам может помочь испытываемая вами гипотеза, разрабатываемая теория или точная формулировка вашего исследовательского вопроса, благодаря которой вы лучше поймете, какой тип данных (например, общенациональный показатель производительности труда или размеры вооруженных сил страны) необходим для операционализации применяемых в вашем исследовании понятий. Если вы отправляетесь в библиотеку с намерением просто полистать доступные источники и, возможно, натолкнуться на какие-то полезные показатели, то вас почти наверняка постигнет самая горькая и абсолютно заслуженная неудача. Если же вы идете туда, имея в голове ясно продуманный план исследования, то вы по крайней мере будете в состоянии объяснить библиографу или работнику справочного отдела, что вам нужно. [c.311]
1. Демографические и связанные с ними данные по США. Вся статистика, публикуемая службами федерального правительства, находит отражение в “Американском статистическом указателе” (“American Statistical Index”), который можно использовать для установления того, какие имеются источники по конкретным показателям. Кроме того, публикации Бюро переписей отражаются в “Каталоге публикаций итогов переписей в США” (“Catalog of the United States Census Publications”), где описаны данные переписей жилищного фонда, населения, правительственных учреждений, сельского хозяйства и пр. Большая часть этих данных суммируется в издании “Статистическая сводка по США” (“Statistical Abstract of the United States”), которое содержит избранные статистические очерки по США в целом и по отдельным регионам страны, а также обширный указатель государственных и частных источников данных. Итоги каждой переписи в США в сжатом виде приводятся в издании “Subject and U.S. Area Reports”. В издании “Каталог Бюро переписей” (“The Bureau of the Census Catalog”) описываются все материалы, находящиеся в распоряжении Бюро переписей (опубликованные и неопубликованные). Это издание содержит географический и предметный указатели и выходит ежеквартально.
Из специализированных источников наиболее широко используются “Справочник по избирательным округам США” (“Congressional District Data Book”), где приводится демографическая и экономическая информация, а также результаты голосования в различных избирательных округах США, и “Справочник по округам и городам США” (“County & City Data Book”), содержащий ежегодные демографические и экономические данные по отдельным штатам, округам, городам и городским поселениям с населением свыше 25 тыс. человек. Сходные сведения имеются и в “Справочнике по отдельным штатам и столичному району” (“The State and Metropolitan Area Data Book”), издаваемом Бюро переписей. Данные голосования в сжатом виде публикуются в “Справочнике по выборам в США” (“Guide to U.S. Elections”), где даются сведения о результатах выборов президентов, губернаторов штатов и депутатов сената и палаты представителей (начиная с 1824 г.), и в издании “Америка голосует” (“America Votes”), [c.312] освещающем результаты всеобщих и первичных выборов (с 1952 г.).
2. Демографические и связанные с ними данные по другим странам. Сознавая все трудности, возникающие при поиске сравнимых данных по практически любой переменной, некоторые исследователи взяли на себя труд составления справочных пособий, в которых приводятся сведения по общенациональным показателям, представляющим наибольший интерес для политолога. Особой популярностью пользуются следующие три справочника:
1. Тауlоr Ch. L., Jоdiсе D.A. (eds.). World Handbook of Political and Social Indicators. New Haven: Yale Univ. Press, 1983. Здесь представлены показатели почти по всем странам мира, отражающие как демографические, так и политические особенности отдельных государств (например, форму и степень стабильности государственного режима и пр.);
2. Rummеl R.J. Dimensions of Nations. New Haven: Yale Univ. Press, 1971. Данное издание представляет собой исследование 82 стран мира по 236 показателям демографических, экономических и политических признаков;
3. Вanks A.S. Cross-Polity Time-Series Data. Cambridge (Mass.): MIT Press, 1971. Содержит сведения исторического характера по 102 политическим, экономическим и демографическим признакам для 155 государств.
Существуют также и другие подобные издания.
Имеется, кроме того, целый ряд источников, в которых содержатся данные, собираемые различными международными организациями и государствами. Исследователь, обращающийся к таким источникам, должен быть особенно внимателен в отношении сравнимости приводимых в них цифр. Статистическое бюро ООН, Отдел экономических и социальных проблем (UN Statistical Office, Department of Economical and Social Affairs), регулярно публикует три в высшей степени полезных издания. В “Статистическом ежегоднике” (“Statistical Yearbook”) в сжатом виде приводятся данные по народонаселению, экономической деятельности, системе образования, средствам связи всех стран мира. “Статистический ежегодник государственных бюджетов” (“Yearbook of National Accounts Statistics”) содержит подробную информацию об экономической [c.313] деятельности, а “Демографический ежегодник” (“Demographic Yearbook”) исторические сведения по народонаселению, а также специальные очерки по отдельным проблемам (по территориальному распределению населения, по уровням смертности, по этническому составу населения и пр.). Кроме того, ЮНЕСКО публикует “Статистический ежегодник” (“Statistical Yearbook”), в котором суммируются данные документов ЮНЕСКО по вопросам народного образования, здравоохранения и др. Существует также “Ежегодник государственного деятеля” (“Statesmans Yearbook”), предоставляющий подробную информацию о различных странах, собранную из ряда государственных и международных источников. “Ежегодник Европы” (“Europe Yearbook”) несет в себе различные сведения по европейским, а в последние годы и по неевропейским странам (в удобной для использования форме). Дополнительные цифры итогового характера можно обнаружить в изданиях “Мировой альманах” (“World Almanac”) и “Энциклопедия стран мира” (“Worldmark Encyclopedia of Nations”), снабженных хорошими указателями. Много экономической информации содержится в “Статистическом ежегоднике международной торговли” (“Yearbook of International Trade Statistics”).
3. Данные по правительственным учреждениям в США. Американские федеральные и местные органы власти выпускают тысячи публикаций, отражающих различные аспекты положения в обществе и их собственной деятельности и приуроченных к проведению различных мероприятий государственной политики. Конечно, в качестве наиболее плодовитого поставщика информации выступает федеральное правительство, чьи многочисленные публикации перечисляются в “Ежемесячном каталоге публикаций правительства США” (“Monthly Catalog of U.S. Government Publications”). Если вы приблизительно знаете, от какого ведомства или правительственного органа может исходить интересующая вас информация, то в “Ежемесячном каталоге” вы можете обнаружить сведения о публикациях этого органа. “Окружной ежегодник” (“County Yearbook”) .и “Муниципальный ежегодник” (“Municipal Yearbook”) содержат данные местного уровня по политическим, экономическим и демографическим переменным. [c.314]
4. Событийная информация. По своей природе событийные данные не могут фиксироваться регулярно и в сжатой форме. Их приходится отыскивать в текущих сводках новостей, составляемых, как правило, без какой-либо оглядки на специфические интересы политологов. Два наиболее полных источника газетных новостей это указатели (индексы) к “Times of London” и “New York Times”. Еженедельный дайджест текущих событий (с распределением их по темам) представлен в “Facts-on-File”; впоследствии эти сведения собираются в ежегоднике “New Dictionary”, уделяющем основное внимание событиям внутри и вокруг США. “Deadline Data on World Affairs” сообщает о событиях в мире, группируя их по странам и темам. По-видимому, самым пространным дайджестом новостей общего характера является “Keesings Contemporary Archives: Weekly Diary of World Events”, где печатаются стенограммы важнейших речей, информация о выборах и сводки новостей, а также имеются предметный и именной указатели.
5. Опросные данные. Все перечисленные выше источники представляют данные в печатном виде. Использование их в крупных исследовательских проектах предполагает необходимость аккуратной регистрации данных и приведения их к машинночитаемому виду. Наиболее полезные источники опросных данных, наоборот, являют собой множества необработанных данных, зафиксированных в машинно-читаемой форме. Доступ к ним можно получить в ряде архивов данных, о которых мы говорили выше.
Важно упомянуть о том, что существует также много частных источников данных. Какие из них способны пригодиться в каждом конкретном исследовании, определяется спецификой предмета исследования. Если исследование касается структуры капиталовложений западноевропейских компаний, то полезные для нее данные можно найти в частных банках или общенациональных и международных ассоциациях банков. [c.315]
СБОР СВОДНЫХ ДАННЫХ
Установив, какие источники данных нужны для исследования, исследователь оказывается перед проблемой перевода данных источника в пригодную для использования форму (кроме тех случаев, когда данные записаны на [c.315] перфокартах и магнитных носителях). Основная задача тут заключается в систематическом кодировании и регистрации данных.
Хотя эти операции займут всего лишь малую долю того времени, которая понадобилась бы для сбора тех же самых данных полевым способом, тем не менее такая работа может оказаться весьма трудоемкой. Поэтому очень важно организовать ее как можно более эффективно. Прежде всего следует заранее тщательно обдумать план исследования и ход намечаемого вами анализа данных, с тем чтобы уяснить для себя, применительно к каким именно случаям вам необходимы сводные данные и какие именно меры вас интересуют в отношении каждого из этих случаев. Не сделав этого, вы рискуете потерять время на фиксацию в конечном счете ненужных вам данных. Более того, если достаточно тщательно спланировать исследование, составив список приоритетных случаев и переменных, то при внезапно обнаруживающейся нехватке времени или средств на сбор данных можно будет легко принять наиболее рациональное решение, выключив из рассмотрения некоторые случаи или переменные, так чтобы обойтись при этом по возможности малыми жертвами. Если не принять такого решения, то это будет значить, что надо действовать строго последовательно, собирая либо сразу все данные по каждому случаю (в ситуации, когда вы хотите оставить за собой право опускать по ходу дела какие-то случаи, сохраняя, однако, все переменные), либо данные сразу по всем случаям для каждой переменной или собирать данные для всех случаев по каждой переменной в отдельно взятый момент (если вам нужна эта информация, но вы хотите иметь возможность исключить некоторые переменные).
Так или иначе вам понадобятся два основных средства сбора данных: набор спецификаций данных и регистрационный бланк данных (recording form). Спецификации данных это просто подробные описания данных, подлежащих регистрации для каждого случая и для каждой переменной, включая любые инструкции по кодированию. Иногда в качестве спецификации может выступать одна-единственная фраза (в случае данных переписи и ведомственной статистики), например общая численность муниципальных служащих в 1980 г. или взрослое население [c.316] страны в 1970 г. Случается, однако, что простые по видимости данные требуют пространных спецификаций. Например, если мы хотим получить цифру, отражающую общую величину государственных расходов на программы социального обеспечения в каком-то определенном году, нам придется сформулировать, что в рамках данного исследования понимается под “программой социального обеспечения”; если нам нужна мера численности личного состава вооруженных сил государства, то мы должны будем включить в спецификацию этой меры оговорку, исключающую из подсчета полицейские силы применительно к тем странам, где полиция формально входит в состав вооруженных сил. Навыки работы с подобными деталями приходят в результате предварительного изучения, с одной стороны, предмета исследования, а с другой различных систем фиксации конкретных единиц анализа. Но и после такого изучения исследователь может столкнуться с дополнительными трудностями. Так, например, может выясниться, что запланированные бюджетом и реальные расходы на социальное обеспечение сильно различаются или что в исследовании, предполагающем анализ временного ряда, необходимо учитывать поправки на инфляцию. Но какую бы корректировку ни приходилось вносить в исследование в ответ на подобные “хитрости” материала, делать это надо методологически грамотно и сообразуясь со значением понятия, операционализированного посредством конкретной меры.
При сборе событийной информации понадобятся очень подробные спецификации данных, гарантированно учитывающие все значимые различительные признаки. К примеру, может оказаться необходимым различать беспорядки и мирные демонстрации, про- и антиправительственные демонстрации и т.д. Самый надежный способ это сделать занести в кодировочную инструкцию, которой предстоит пользоваться кодировщику при заполнении листа регистрации, те признаки (пусть даже мелкие), которые отличают интересующее исследователя событие от других событий. (О кодировании см. подробнее в гл.12.)
Регистрационный бланк предназначен для облегчения процесса сбора данных. Это аналог бланка интервью, используемого в опросном исследовании, поскольку, как и [c.317] бланк интервью, регистрационный бланк является средством систематизации и кодирования наблюдений. Если данные предстоит впоследствии переносить на перфокарты или на дисплей, в листе регистрации для ускорения ввода в машину может быть оговорена ширина каждого столбца, рассчитанного на запись того или иного типа информации. В книге Т.Р. Гурра11 приводится пример заполнения регистрационного бланка событийных данных (см. рис. 10.2 и 10.3). [c.318]
СТОЛКНОВЕНИЕ ЛИБЕРИЙСКИХ ЗАБАСТОВЩИКОВ С ПОЛИЦИЕЙ
Рис. 10.2. Кодирование статьи для анализа сводных данных
(взято из кн.: Gurr Т.R. Polimetrics. Englewood Cliffs (NJ.): Prentice-Halt. 1972. p. 93).
КОДИРОВОЧНАЯ ТАБЛИЦА “ПОЛИТИЧЕСКАЯ БОРЬБА”
Страна Либерия
Кодировщик _____Т9_____ Месяц и год кодирования ___7 / 66_____
Источник(и) ________“Нью-Йорк Таймс”, 9 / 13 / 61__________________
Том и страница _________________с. 21 ____________________________
Краткое содержание __Столкновение с полицией во время забастовок_
№ |
Содержание столбца |
1 3 |
Код государства |
|
I. СВЕДЕНИЯ ОБ ИНИЦИАТОРАХ СОБЫТИЯ 0000 (закодировано в предыдущей позиции) |
|
II. ГРУППОВОЙ И СОЦИАЛЬНЫЙ КОНТЕКСТТ |
|
III. ТИП СОБЫТИЯ |
|
IV. ОБЪЕКТЫ СОБЫТИЯ |
|
V. ОТКРЫТО ДЕКЛАРИРОВАННЫЕ ИЛИ ОЧЕВИДНЫЕ ЦЕЛИ СОБЫТИЯ 8 несколько из вышеназванных |
|
VI. КАРАТЕЛЬНЫЕ АКЦИИ |
|
VII. РАЗМЕРЫ НАСИЛИЯ |
|
VIII. ВНЕШНЯЯ ПОДДЕРЖКА |
77 |
Надежность сообщения |
78 80 |
Код события |
КОММЕНТАРИИ, ИНЫЕ СВЕДЕНИЯ |
Рис. 10.3. Регистрационный бланк сводных данных (пример заполнения)
(взято из кн.: Gurr T.R. Politimetrics. Englewood Cliffs (N.J.): Prentice Hall, 1972. Р. 94-97) [c.326]
ЗАКЛЮЧЕНИЕ
Мы хотели бы призвать начинающих исследователей отдать должное потенциальным возможностям сводных данных как дополнения к другим видам данных. Хотя существует множество исследований, опирающихся исключительно на сводные данные, последние часто могут быть использованы также и для контрольной проверки точности результатов, полученных на основании данных других видов. Например, те, кому доводилось изучать поведение избирателей на выборах, наверняка сталкивались со случаями, когда те люди, которым свойственно всегда занимать сторону победителя, в интервью, взятых после выборов, начинают обманывать, заявляя, что они голосовали за победившего кандидата. Долю ложной информации в выборке здесь могут помочь оценить как раз сводные данные по результатам голосования. Если из ответов опрашиваемых следует, что за победителя на последних президентских выборах голосовало 75% избирателей округа, а статистика результатов голосования говорит, что реально за него голосовало лишь 25% избирателей, то результаты опроса придется признать недостаточно (по меньшей мере) валидным показателем той степени поддержки, которой победивший кандидат пользуется в данном округе.
Кроме подобного применения, возможно использование сводных данных в качестве основы для выработки дополнительных показателей понятий, что позволяет контролировать валидность с помощью множественных показателей (этот подход обсуждался нами выше). Так, желая определить степень стабильности социально-политического положения в некотором районе, мы могли бы, с одной [c.318] стороны, опросить жителей на предмет того, собираются ли они и дальше проживать в этом районе, а с другой в качестве дополнительного показателя изучить сводные данные о частоте смены домовладельцев в районе за последние несколько лет. Когда результаты исследования подтверждаются данными, собранными столь различными методами, степень доверия к этим результатам сильно возрастает. [c.319]
Дополнительная литература к главе 10
Специальных руководств, посвященных исключительно анализу сводных данных, не существует. Информация о сводных данных большей частью разбросана по отдельным работам, отражающим результаты применения различных методов анализа сводных данных. Методика использования сводных данных в политологии в общих чертах лучше всего описана в работах: Gurr T.R. Politimetrics. Englewood Cliffs (N.J.): Prentice-Hall, 1972; Merritt R.L. Systematic Approaches to Comparative Politics. Skokie (Ill.): Rand McNally, 1970. Chap. 2. Целый ряд практических советов приводится в работе: Stewагt D.W. Secondary Research. Beveriy Hills (Calif.): Sage, 1984. Более развернутое изложение проблем и методов применения сводных данных (с примерами) содержится в кн.: Тауlоr Ch. L. (ed.) Aggregate Data Analysis. Paris: Mouton, 1968. Дополнительные примеры исследований, основанных на сводных данных, собраны в кн.: Тufte Ed. R. (ed.) The Quantitative Analysis of Social Problems. Reading (Mass.): Addison-Wesley, 1970. [c.327]
Работа: Steward Ph. L., et al. Political Mobility and the Soviet Political Process: A Partial Test of Two Models. // American Political Science Review. 1972. Vol. 66. P. 12691290, представляет собой особо впечатляющий прием использования в качестве сводных данных результатов контент-анализа публикаций. Примером использования в качестве сводных данных результатов опроса может служить исследование: Hamilton R.F. Class and Politics in the United States. N.Y.: Wiley, 1972. На использовании оценочных данных построена в основном работа: Banks A.S., Техtоr R.B. A Cross-Polity Survey. Cambridge (Mass.): MIT Press, 1965. Весьма поучительным примером использования демографических данных и ведомственной статистики может считаться работа: Lеwis-Bесk M.S. The Relative Importance of Socioeconomic and Political Variables for Public Policy. // American Political Science Review. 1977. Vol. 71. P. 559566.
Построение индексов обсуждается в работе: Valkonen Т. Individual and Structural Effects in Ecological Research. // Dоgan M., Rоkkan S. (eds). Social Ecology. Cambridge (Mass.): МГГ Press, 1968. P. 5368, а преобразование данных (и вообще способы сбора и применения сводных данных) в кн.: Wеbb E.L. et al. Nonreactive Measures in the Social Sciences. Boston Houghton Mifflin, 1981. [c.328]
11. ПОВЕРХ ГРАНИЦ: ПРАКТИКА СРАВНИТЕЛЬНЫХ ИССЛЕДОВАНИЙ
Все те исследовательские стратегии, с которыми мы до сих пор имели дело, без труда можно было реализовать, не выходя как в буквальном, так и в переносном смысле за пределы одной страны. По большинству политических вопросов начиная с проблемы полномочий правоохранительных органов и кончая поиском коррелятов политической активности масс мы можем получить исчерпывающие данные, исходя из опыта собственной страны. Но в то же время, сосредоточиваясь только на одной стране, мы ограничиваем свой кругозор. Если мы хотим научиться лучше объяснять и предсказывать политические события, то один из путей к этому обратиться к сравнительному анализу. Такой подход предоставляет нам возможность оперировать более широким кругом данных и одновременно позволяет поднимать такие вопросы, на которые данные одной отдельно взятой страны ответа дать не могут. Касается ли это мотивов политического насилия, причин отчуждения народа от правительства, результатов воздействия различных типов политических организаций на государственную политику или каких-либо других проблем во всех случаях сравнительный анализ повышает надежность наших выводов.
Зачем, в самом деле, ограничиваться изучением только одной страны? Ведь при этом наши результаты будут прежде всего культурно обусловленными. Дело в том, что каждая страна обладает своими уникальными особенностями, которые могут вызвать смещение в результатах исследования. К примеру, мы хотим выяснить, как социально-экономический статус избирателя влияет на его выбор при голосовании. Если мы будем располагать только американскими данными, то скорее всего придем к [c.329] заключению, что социально-экономический статус и поведение на выборах связаны между собой очень слабо и что неверно полагать, будто политическое поведение определяется теми социально-экономическими условиями, в которых приходится жить и работать избирателям. Если же мы расширим нашу выборку и привлечем данные других стран Запада скажем, Великобритании, Франции, ФРГ, то с большой вероятностью обнаружим куда более сильно выраженную зависимость, что отчасти объясняется разницей в историческом развитии социальных классов в этих странах. Таким образом, США не могут служить типичным примером для данного случая1.
Возьмем другой пример. Допустим, нас интересует, кто и по какой причине воздерживается от голосования на всеобщих выборах. Что касается США, то мы обнаружим, что примерно половина избирателей не приходит в день выборов на избирательный участок. Можно попытаться объяснить это тем, что демократические выборы особенно на общенациональном уровне отбивают у избирателей охоту голосовать, поскольку не дают им почти никакой гарантии того, что голос каждого из них может повлиять на исход выборов. Но стоит нам обратиться к данным Западной Европы, как мы придем к совершенно иному заключению. Число не пришедших к урнам в среднем составляло 82% всего числа избирателей в Норвегии в 70-е годы и более 90% в Италии в тот же период, несмотря даже на то, что там в меньшей степени считали, что большое число голосовавших преуменьшает эффект любого отдельного бюллетеня2. Таким образом, должны быть другие объяснения тому, почему в США такой низкий процент участия в выборах, и это становится нам ясно только благодаря привлечению данных других стран. Сравнительный анализ показывает, что состязательность в процессе выборов и институционные черты, такие, как относящиеся к выборам законы и существование двух или многопартийной системы, развивались долго и постепенно, что объясняет различный уровень числа голосующих3. Оба рассмотренных нами примера говорят о том, что у американской культуры как и у любой другой есть свои специфические черты, которые могут исказить наши выводы. [c.330]
Сосредоточение внимания целиком на одной стране ограничивает нас еще и в следующем отношении: оно мешает нам анализировать явления системного уровня. Другими словами, существуют такие переменные величины (как, например, тип политической системы или тип административно-территориальной организации), которые характеризуют страну в целом и поддаются изучению только при сравнении между собой двух и более стран. Взять, к примеру, проблемы федерализма. У нас может возникнуть желание утверждать, что федеральное устройство (когда власть поделена между правительствами двух и более уровней) способствует неравному распределению государственных средств между отдельными районами страны. Если районные власти независимы от федерального правительства, то их взгляды на то, как и куда тратить правительственные фонды, скорее всего будут отличаться от мнения центральных властей. Чтобы проверить это утверждение, нам нужно для сравнения изучить данные по меньшей мере одной не федеральной, или унитарной, системы (когда отдельные районы формально не располагают властью, независимой от центрального правительства). И только обнаружив значительные расхождения между странами с федеральным и с унитарным устройством, мы будем вправе заключить, что федерализм представляет собой важную переменную, влияющую на распределение государственных средств. Точно так же если мы беремся утверждать, что экономический рост в странах, где индустриализация началась недавно, зависит от способности правительства контролировать трудовые ресурсы. Чтобы проверить это утверждение, нам необходимо иметь выборку, включающую страны с различным уровнем контроля над производством4. Таким образом, всякий раз, когда мы затрагиваем свойства системного уровня, мы оказываемся перед необходимостью провести сравнительный анализ на материале двух и более государств.
Сравнительный анализ может оказаться ценным подспорьем также и при оценке политических реформ или их проектов. Изучение опыта других стран помогает лучше понять преимущества и недостатки альтернативных “правил политической игры” и, следовательно, точнее определить потенциальные плюсы и минусы политической [c.331] реформы у себя дома. В 50-х годах в США некоторые эксперты выступали за проведение реформы по образцу британской политической системы, с тем чтобы добиться большего единства внутри основных политических партий и, как следствие, обеспечить для среднего избирателя большую ясность в выборе между партиями. Другие тогда же выдвигали идею пропорционального представительства (система Франции), при котором число мест, отданных некоторой партии в законодательном органе, прямо пропорционально числу голосов, полученных ею на выборах, в результате чего значительное число различных партий и групп имеют в законодательном органе свой голос, соответствующий степени поддержки их электоратом. В каждом из этих случаев опыт других стран много говорит нам как о преимуществах, так и о недостатках соответствующего политического устройства.
Сравнительный анализ является, таким образом, важной составной частью политологического исследования, потому что позволяет делать обобщения поверх узких подчас рамок отдельной культуры, а также осуществлять проверку некоторых системных свойств. Само собой разумеется, такой анализ должен удовлетворять всем тем стандартам качественного исследования, о которых шла речь в предыдущих главах. Кроме того, необходимо придерживаться следующих правил.
Первое правило касается концептуализации предполагаемого объекта исследования: необходимо удостовериться, что вопросы, которые мы ставим, реально допускают проведение сравнительного анализа. Второе правило заключается в операционализации: каждая переменная величина, используемая нами, должна быть эквивалентной мерой понятий, которые соответствует каждой культуре в нашей выборке. Процесс построения выборки в свою очередь приводит нас к третьему правилу: страны для анализа нужно отбирать таким образом, чтобы свести к минимуму влияние культуры, которое может исказить результаты. И наконец, выборка должна удовлетворять еще одному правилу: наблюдения по каждой стране должны быть независимыми.
Теперь рассмотрим каждое из этих требований, объясняя, как они могут влиять на получаемые результаты. [c.332]
ВЫЯВЛЕНИЕ “КОЧУЮЩИХ” ВОПРОСОВ
Первое требование к сравнительному исследованию заключается в том, чтобы ставить только такие вопросы, которые приложимы к разным культурам. В такой формулировке это правило, возможно, покажется очевидным, не нуждающимся в комментарии. Однако его простота обманчива, ибо многие вопросы из тех, что поднимаются в политологии, на деле приложимы только к очень узкому спектру стран. Взять, например, излюбленную в современной политологии проблему объяснения поведения избирателей на выборах. Постоянный интерес к тем факторам, которые обусловливают выбор избирателя при голосовании, привел к появлению целой теории со своим набором изощренных методов, которые по замыслу должны быть применимы в любой политической обстановке, у нас в стране и за ее пределами. Однако вопросы о том, почему и как люди голосуют, плохие “кочевники”, потому что ограничивают изучение только теми странами, в которых имеют место регулярные выборы на состязательной основе, а такое условие автоматически исключает из рассмотрения более половины государств мира5. Мы бы, скорее, согласились исключить обсуждение однопартийных выборов или выборов с одним кандидатом, хотя в этом случае мы могли бы наблюдать несколько иное поведение электората и в основном только один выбор “воздержаться”. Но когда мало различий особенно нечего объяснять. Те факторы, которые заставляют людей голосовать тем или иным образом в странах с состязательной системой голосования, не имеют никакого значения в случае выборов, проводимых на конкурентной основе.
Таким образом, выбрав для анализа проблему голосования, мы сформулировали исследовательскую задачу в терминах, применимых лишь к части стран. Возможно, само по себе это и не покажется таким уж сильным недостатком, поскольку наша выборка включает множество стран. Но существует и другая проблема, проблема получения по материалам голосования выводов более общего характера. Считая, как это делают многие исследователи, что результаты голосования отражают одобрение или неодобрение избирателями политической системы или [c.333] их предпочтение определенного кандидата, партии или политики, мы тем самым рассматриваем выборы как меру для более общего понятия изъявления населением своих политических предпочтений. А это исключает допущение того, что государства без регулярных выборов на состязательной основе могут предоставлять своим гражданам средства для выражения одобрения, неодобрения или пожеланий правительству.
Так ли это? Или, может быть, мы искусственно ограничиваем наше исследование рамками выборов на состязательной основе? Не придем ли мы к иным выводам, если переформулируем свою задачу? Если, например, мы начнем задавать вопросы по более общей проблеме проблеме того, как люди выражают свое одобрение, неодобрение или предпочтения в сфере политики, то обнаружим, что обычные граждане в странах без выборов на состязательной основе имеют возможность донести до правительства свои предпочтения другими средствами, а именно теми, которые в более демократических странах обычно ассоциируются с бросанием бюллетеня в урну6.
Например, голосование может быть формальностью, но граждане могли бы рассмотреть другие формы участия в гораздо более благоприятном свете. Таким образом, множество людей, игравших активную роль в советских общественных организациях (таких, как домовые комитеты или профсоюзные комитеты) в брежневскую эпоху, чувствовали, что они имеют влияние и широкие полномочия в своих организациях и в советском обществе, хотя в то время “выборы” единственного кандидата были, скорее, политическим ритуалом7. И множество активистов, участвовавших в общественной жизни, чувствовали, что их деятельность имеет вес и значение и изменяет ход событий, хотя они и не были удовлетворены системой в целом8.
В дополнение можно сказать, что, даже если выборы в коммунистических странах традиционно предлагали очень ограниченное число возможностей “для выбора”, избиратели все же в известном смысле использовали их, чтобы “озвучить” свои требования к деятельности правительства. Например, в СССР избиратели имели несколько путей, чтобы посредством голосования “надавить” на местные власти, даже когда выбирался единственный [c.334] кандидат. Коммунистическая партия, как правило, ожидала, что представители местных властей обеспечат как можно более высокий процент голосования, а это давало в руки избирателей своего рода рычаг, позволявший требовать улучшений в сфере коммунальных услуг. Иногда избиратели грозили воздержаться от голосования, если местные власти не пойдут навстречу их требованиям, касающимся улучшения жилищных условий, состояния дорог, водопровода, канализации. (Тем не менее не все их требования могли быть удовлетворены, и некоторые избиратели никогда даже не регистрировались, чтобы не участвовать в выборах)9.
Более того, хотя в социалистическом государстве избиратель, возможно, и не решал, кто будет управлять страной, у него (нее) было несколько путей донести до правительства свое мнение или свои предпочтения в отношении действий властей. Существовал и такой путь: обратиться с вопросом или жалобой. Официальная пресса ежедневно публиковала вопросы и предложения читателей по поводу деятельности государственных учреждений, начиная с вопросов качества потребительских изделий и кончая вопросами охраны окружающей среды и безопасности атомной энергетики. Жители могли также обращаться непосредственно в государственные учреждения с просьбами помочь в разрешении жилищных или пенсионных проблем10. Круг таких проблем, разрешенных к обсуждению, был, конечно, ограничен; “политические” жалобы на высших политических лидеров или на роль партии, например, могли повлечь серьезные репрессии. И все же, как сообщали многие граждане, они получили существенную поддержку от редакций по вопросам жизнеобеспечения, далеким от политики. У некоторых советских граждан был еще один канал воздействия на власти: государственные учреждения часто консультировались у групп специалистов по той или иной проблеме, предоставляя наиболее заинтересованным лицам возможность повлиять на государственные решения11.
Очевидно, что система участия граждан в такого рода делах разительно изменилась, когда Михаил Горбачев начал кампанию за более открытые выборы, более широкое участие граждан, и более широкие гражданские свободы и [c.335] за появление 15 новых государств на месте бывшего Советского Союза. Но все же в гражданской политике существуют некоторые противоречащие этому процессы, тянущиеся еще с до перестроечных времен. Граждане продолжают контактировать с властью, и прежде всего по основным вопросам жизнеобеспечения, таким, как жилье. И множество людей, проявляющих ныне активность в новых, неформальных политических организациях, были активистами и в “старых” общественных организациях. Поскольку мы концентрировали наше внимание прежде всего на обсуждении голосования как меры участия в процессах демократического правления, то они и были рассмотрены. Важным пунктом здесь является то, что в каждой стране гражданам могут быть предоставлены различные способы выражения предпочтения или несогласия с тем, что делает правительство. И именно это мы должны изучать в том случае, если мы нацеливаем наше исследование только на изучение поведения электората в странах с выборами на состязательной основе.
Рассмотрим другой пример. Возможно, мы захотим исследовать судебные дела в различных странах на предмет того, насколько они отражают связи между политическими институтами, как часто происходят тяжбы и каковы судебные решения. Здесь, как мы увидим, процесс сравнения также будет затруднен, поскольку общество может иметь самые различные образцы разрешения конфликтов и спорных вопросов. В некоторых странах основной акцент может делаться на разрешение конфликтов с помощью прежде всего местных авторитетов, а не в суде, и такие страны мы исключим из нашего анализа, поскольку мы изучаем именно официальные судебные процедуры12. Если же мы, как всякий политолог, хотим получить надежные выводы, не зависящие от той или иной культуры, тогда нашу исходную исследовательскую задачу следует сформулировать так, чтобы она позволяла делать обобщения, выходящие за рамки одной или нескольких стран.
Исходный вопрос должен быть также корректен в применении к изучаемым нами странам. Предположим, например, что мы изучаем проблему прав женщин в США, Западной Европе и странах членах СНГ. В теории мы [c.336] должны предположить, что в посткоммунистических государствах, более чем в других, мужчины и женщины имеют равные права на работу в связи с традиционной идеей равенства полов. Но если сфокусировать внимание только на праве на работу, станет ясно, что ситуация переломная. В ходе дискуссии о правах женщин в посткоммунистических государствах выяснилось, что множество женщин предпочли бы вести хозяйство, а не бороться за работу на рынке труда. Таким образом, окончательно сформулированный вопрос выглядел бы так: “Сколько спорных вопросов о женских правах стоит на политической повестке дня в каждом государстве?”. Наш исходный вопрос, следовательно, нуждается в переформулировке в терминах, применимых ко всем изучаемым нами странам.
В нашем кратком обсуждении мы не касались проблемы всех тех культурных влияний, которые способны наложить свой отпечаток на исходную исследовательскую задачу. А именно: мы до сих пор имели дело только со случаями развитых индустриальных обществ, в которых правительство воплощено в обширной, высокоспециализированной бюрократической машине. Понятно, что в обществах без такого рода институтов (а таковы многие развивающиеся страны) способы политического самовыражения, равно как и обеспечение жителей общественными благами, принимают совершенно иные формы, и это необходимо учитывать при формулировке исследовательских вопросов. И все же, каковы бы ни были исследовательский вопрос и страна изучения, мы в любом случае должны удостовериться, что наше исследование строится так, что позволяет делать обобщающие выводы и адекватно вписывается в контекст изучения тех стран, к которым мы обращаемся. Наш проект, по сути дела, должен уметь “кочевать” и сосредоточиваться на вопросах, корректных в применении к нашей окончательной выборке. [c.337]
ПОИСК ЭКВИВАЛЕНТНОЙ МЕРЫ
После того как мы определили для себя вопрос, допускающий сравнительный подход, нам предстоит отыскать [c.337] эквивалентную меру для всех рассматриваемых стран. Иначе говоря, сравнительное исследование должно в разных культурах измерять одно и то же понятие. Этого можно достичь двумя способами: либо используя везде одну и ту же переменную, либо выбирая переменные, специфичные для каждой страны. Такая альтернатива может показаться на первый взгляд однобокой: ведь ничто так не обеспечивает эквивалентности в подходе к разным странам, как использование одной и той же переменной. Это верно, однако, только в том случае, если наша “единая” переменная для каждой из изучаемых нами стран означает одно и то же.
Чтобы понять, в чем здесь таиться трудность, представим, к примеру, что мы поставили цель сравнить уровни терпимости к правам меньшинств применительно к обществу. Существует два подхода. Во-первых, мы можем сравнить, до какой степени люди в разных странах желают обеспечить политическими правами определенные группы, например, религиозные секты. Если основываться на этом измерении, то мы, вероятно, придем к заключению, что граждане отдельных стран более терпимы, чем другие. Но если люди в изучаемой нации более или менее враждебны к такой группе, то наше измерение покажет, как люди разных стран воспринимают группу, а не терпимость к правам меньшинств. Это означает, что наша “тождественная” мера терпимости неодинакова в различных государствах.
Однако мы можем использовать второй путь. Мы можем узнать, желают ли люди признать политические права групп, которые им совершенно не нравятся. Это позволит нам проконтролировать различия в восприятии различных групп в различных странах. Однако тогда встает еще один вопрос. Некоторые народы особенно не любят группы, которые а) более многочисленны и б) более влиятельны, чем в других странах, где та же самая группа может быть очень маленькой и слабой. Если так, то степень, с которой люди хотят признать политические права группы, может отражать уровень угрозы, которую группа составляет для большинства нации. В этом случае наша мера может отражать более уровень страха граждан, чем меру их политической терпимости. Таким образом, для [c.338] того чтобы наши сравнения были весомыми, нам нужна мера, которая бы адекватно отражала одно и то же лежащее за ней понятие, какие бы страны мы ни включали в нашу выборку.
Подобные проблемы возникают постоянно, вне зависимости от того, какой вопрос или какую страну мы рассматриваем. Например, мы хотим сравнить уровни социального обеспечения в странах, находящихся на разных ступенях социально-экономического развития. Можно предположить, что в более развитых странах на социальные программы выделяется больше средств. И наоборот, чем более слаборазвита страна, тем меньше она выделяет средств на социальные нужды. Казалось бы, не так трудно определить однозначную меру уровня социального обеспечения: стоит только оценить долю расходов на программы социального обеспечения (пенсии, помощь инвалидам и беднякам и пр.) в общем объеме государственных расходов или в общем объеме произведенных товаров и услуг (измеряя его совокупным общественным продуктом). Применяя эту меру, мы скорее всего обнаружим, что наше предположение верно: чем более развита страна, тем большая доля средств выделяется в ней на социальные нужды.
Однако и здесь наша мера может оказаться неприложимой к целому ряду стран. Определяя ее в терминах таких формальных параметров, как правительственные выплаты пенсионерам, инвалидам и нуждающимся, мы можем недооценивать степень участия неформальных или местных организаций в оказании помощи нуждающимся в тех странах, где официальные социальные программы либо не существуют, либо ограничены по масштабам. Когда в слаборазвитых странах фермеры или односельчане организуют помощь своим неимущим родственникам или соседям, предоставляя им пищу, кров и т.п., то они, по сути дела, занимаются перераспределением общественных средств в том же глубинном смысле, в каком это делают социальные программы в развитых странах. Следовательно, разные сообщества могут опираться на разные способы обеспечения нуждающихся, и мера, учитывающая только официальные программы помощи, вполне может исключить из поля зрения исследователя [c.339] неофициальные, но отнюдь не менее важные действия по перераспределению средств. В этом случае наша мера социального обеспечения отражает не столько заботу о нуждающихся, сколько общий уровень институционализации в стране.
Оба примера показывают, что использование одной меры для всех стран может привести к серьезным промахам в том случае, если наши переменные в разных странах наполняются разным содержанием. В качестве альтернативного решения мы можем использовать в применении к каждой изучаемой стране свою, специфичную переменную, ставя ее выбор в зависимость от конкретной культуры. В этом случае мы должны удостовериться, что каждая такая переменная отражает одно и то же базовое понятие. Как и при выборе единых или общих показателей, это может представить определенную трудность, поскольку нет гарантии, что выбранные нами переменные равнозначны (эквивалентны). В подтверждение этому рассмотрим проблему политического протеста. Ясно, что поскольку в каждой политической системе действуют свои правила, регулирующие политическую жизнь, то и протест против системы может принимать в разных странах неодинаковые формы. В то время как в одной стране правительство разрешает массовые демонстрации и существование инакомыслия, правительство другой страны за то же самое подвергает своих граждан серьезным наказаниям, вынуждая их искать другие способы выражения своего недовольства. Так, можно было бы утверждать, что в странах, где открытое инакомыслие наказуемо, люди протестуют скрытыми способами, к которым относится уклонение от требований и предписаний правительства13. Лишенные возможности открыто выразить свое несогласие с системой, люди могут обратиться к таким средствам борьбы, как растрата государственных средств, уклонение от уплаты налогов, злоупотребление бюрократическими инструкциями. Таким образом, чтобы сравнить антиправительственную деятельность в разных странах, мы будем в одних случаях рассматривать открытые выражения протеста, а в других “беловоротничковую” преступность (если допустить, что мы умеем ее измерять). Вполне правдоподобно, что обе эти переменные являются эквивалентными мерами протеста, но у нас нет достаточно убедительных [c.340] доказательств этого. Другой исследователь на нашем месте, возможно, стал бы утверждать, что эти два вида деятельности на самом деле отражают разные вещи: открытый протест это хороший барометр нашего базового понятия, а “беловоротничковая” преступность нет. Люди могут растрачивать государственные средства, уклоняться от уплаты налогов, злоупотреблять своим служебным положением в силу самых разных причин, вовсе не обязательно напрямую связанных с недовольством политической системой или с протестом против нее. Если это так, то обе наши меры не эквивалентны и в разных странах мы имеем дело с явлениями разного порядка. Другими словами, “беловоротничковая” преступность, возможно, не является в данном случае надежным показателем, потому что отражает не совсем то, что мы хотим измерить. Следовательно, использование специфичных для каждой страны переменных лишает нас гарантии, что мы оперируем данными, сравнимыми по всем странам нашей выборки.
Все это означает, что обе возможности выбора переменных, стоящие перед нами, будь то использование одного и того же или культурно обусловленных показателей имеют свои ограничения. Ни одна из них не гарантирует эквивалентности переменных. Вместе с тем можно предложить несколько путей разрешения этой проблемы. Во-первых, необходимо хорошее, основательное знание культуры каждой изучаемой страны, которое позволяло бы определить адекватность применения к ней конкретной меры. Во-вторых, необходимо использовать сложные меры или показатели. Если, например, мы в состоянии определить несколько различных способов измерения протеста и если они приводят нас к одинаковым выводам, то мы можем быть до некоторой степени уверены, что наши измерения верны. Следование этим стратегиям помогает получить эквивалентные, или сравнимые, данные для всех изучаемых нами стран. [c.341]
ОТБОР СТРАН ДЛЯ ИЗУЧЕНИЯ
Разобравшись с проблемами адекватности исследовательского вопроса и эквивалентности измерения, исследователь сталкивается с проблемой построения выборки. [c.341] В идеальном варианте мы не должны были бы выбирать между странами: ведь лучший способ предохранить наши результаты от культурной обусловленности это включить в выборку данные всех стран, какие только есть на свете. Но на практике наши возможности гораздо скромнее, ибо доступные нам данные ограничены. Если например, мы опираемся на официальные источники информации, то нас будет связывать то обстоятельство, что многие страны не публикуют совсем или публикуют очень мало информации по интересующим нас вопросам. В некоторых странах точные и своевременные публикации политических, экономических и социальных данных все еще дорогостоящая роскошь. И даже там, где исследования возможны, некоторые темы остаются весьма деликатными (такие, как данные по политическим беспорядкам) или слишком прозаическими (например, статистика по бытовым преступлениям), чтобы их публикация была оправданной. Те же, которые публикуют достаточно такой информации, зачастую используют совершенно несхожие методы получения и регистрации данных (отчетности), в результате чего опубликованная ими информация может оказаться непригодной для сравнения. Если же, с другой стороны, мы хотим собрать свои собственные данные, например с помощью опроса, то количество собранных сведений будет ограничено, так как стоимость может быть весьма высокой.
Все эти ограничения означают, что в отношении большинства исследовательских вопросов нам придется работать с выборкой из нескольких стран, отобранных специально так, чтобы свести к минимуму возможные искажения. Выбор следует делать весьма осторожно, поскольку, он может ощутимо сказаться на наших результатах. Мы вправе избрать одну из двух стратегий, принятых в сравнительных исследованиях. Первая, называемая принципом максимального сходства систем, концентрирует внимание на сходных между собой странах на том основании, что общие для них особенности при анализе можно интерпретировать как константы и далее пренебречь ими, считая, что причины возможных расхождений лежат не в них. А если страны различаются какими-то другими чертами, [c.342] мы можем игнорировать одинаковые характеристики как объясняющие разновидности14.
Чтобы наглядно представить себе этот принцип в работе, вообразим, что мы взялись исследовать различия в масштабах правительственной деятельности в разных странах. Почему в одних странах правительства играют большую роль в экономике и политике, чем в других? Тут допустимы разнообразные объяснения от различий в уровне экономического развития до различий в политической культуре. Однако политическую культуру порой трудно точно измерить. И значит, есть смысл отсечь ее как фактор, влияющий на различия в масштабах правительственной деятельности, взяв для анализа страны со сходными политическими культурами, как, например, Великобритания и США. Тогда все те различия, которые мы обнаружим в масштабах действий их правительств, нельзя будет отнести на счет политико-культурных факторов, поскольку эти факторы в грубом приближении постоянны во всей нашей выборке. Иначе говоря, отбор стран со сходными чертами означает, что при объяснении обнаруженных нами различий мы можем спокойно исключить эти сходные черты из рассмотрения.
В качестве альтернативы можно воспользоваться и диаметрально иной стратегией, заключающейся в отборе стран с максимально возможным числом расхождений между ними. Это то, что называется принципом максимального различия систем. В этом случае, когда мы находим среди стран нашей выборки какую-либо общую особенность, различия между этими странами мы исключаем из объяснения. В качестве примера приведем ранее рассмотренный вопрос о социальном обеспечении. Можно было бы отобрать ряд стран с разными уровнями экономического развития и с разными типами политической системы и, прилагая к каждой из них эквивалентную меру, обнаружить, что они вкладывают в социальное обеспечение приблизительно равные доли государственных средств. А коли так, то, следовательно, различия, существующие между ними, не влияют на размеры их помощи нуждающимся согражданам. Или рассмотрим связь между социальным положением, условиями работы и индивидуальными достоинствами. Исследования в Соединенных [c.343] Штатах показали, что люди, имеющие более высокий статус работы (требующие более высокого уровня образования и соответственно хорошей оплаты), преимущественно ценят труд, позволяющий решать сложные задачи, избегают рутины и стремятся работать самостоятельно, без чьего-либо руководства. Одно логическое объяснение этому лежит в американской индивидуалистической культуре. В стране, где ценят права личности и самостоятельность, автономия в сфере работы поощряется. И эта автономия может особенно превалировать на высших уровнях профессиональной иерархии. И все же данные сравнительных исследований по разным странам позволяют подвергнуть сомнению это культурологическое объяснение. Ведь такая же связь между социальным положением, условиями работы и индивидуальными достоинствами наблюдается в таких разных странах, как Польша и Япония15. Таким образом, влияние социальной структуры и характеристик работы не зависит от страны, которую мы изучаем. Отбор стран, различающихся по ряду параметров, позволяет нам пренебречь чертами различия при объяснении какой-то общей для них особенности.
Какую же из этих двух стратегий нам предпочесть? Ответ отчасти зависит от того, насколько хорошо разработана теория, которой мы руководствуемся в нашем исследовании. Так, принцип максимального сходства систем более уместен тогда, когда мы в состоянии а) установить все основные факторы, могущие влиять на наши результаты, а также б) определить страны, в которых они действуют. Но поскольку в такие рамки обычно укладывается совсем немного стран, то куда проще, как правило, найти примеры, сильно различающиеся по ряду важных параметров. И в этом случае более подходит принцип максимального различия систем. Кроме того, обнаружение какой-либо общей особенности между сильно различающимися странами весьма маловероятное событие, поэтому если уж оно происходит, то это дополнительно повышает доверие к нашим результатам. Значит, принцип максимального различия систем фактически позволяет нам лучше контролировать факторы, могущие исказить результаты; кроме того, он обеспечивает большую надежность результатов. [c.344]
ОТБОР НЕЗАВИСИМЫХ НАБЛЮДЕНИЙ
При построении выборки мы обычно руководствуемся тем, что чем больше стран мы включим в нее, тем большей представительностью будут обладать наши результаты. Большой объем выборки, увеличивая вероятность того, что отобрана достаточно представительная группа значений, принимаемых ключевыми переменными, придает больший вес используемым статистическим методам. Это верно, однако, только тогда, когда результат каждого наблюдения является независимым. Большая выборка сохраняет свои преимущества, только если события в какой-то одной стране не находились под влиянием событий в какой-то другой стране. Если эти события не являются независимыми, то тогда за нашими результатами стоит в действительности не две, а одна порция информации.
Возьмем пример из истории стран социалистического блока. Когда в 1953 г. умер И. Сталин, в СССР и его восточноевропейских сателлитах произошли крупные изменения: в большинстве этих стран сменилось руководство и была пересмотрена политическая стратегия, навязывавшаяся ранее Сталиным. Вплоть до 1953 г. основным приоритетом почти во всех этих странах являлось развитие тяжелой промышленности, даже если это влекло за собой сокращение жилищного строительства и производства потребительских товаров. После смерти Сталина большинство социалистических стран начало уделять больше внимания улучшению жизни простых граждан. Можно было бы сделать из этого вывод, что эти перемены в руководстве и в политике явились частью естественного прогресса или тенденции в политическом развитии стран социализма и что подобные изменения происходят в социалистической стране закономерно, когда она достигает определенного уровня развития. Такой вывод на первый взгляд подтверждают данные разных стран. Однако наблюдения в нашей выборке не являются независимыми, поскольку как смена руководства, так и изменение политического курса в странах советского блока были инициированы, а возможно, и срежиссированы Советским Союзом. Таким образом, наш вывод относительно того, что перемены в странах Восточной Европы были вызваны [c.345] естественной тенденцией в их развитии, оказывается неверным, поскольку в действительности эти перемены имели один источник события только в одной стране, а именно в СССР.
Процесс, при котором события в какой-либо одной стране влияют на жизнь какой-либо другой страны, называется диффузией, а проверка его воздействия на результаты сравнительного исследования получила название проблемы Гальтона по имени ученого, который впервые ее описал. Эта проблема заключается в том, что мы, случается, усматриваем сильную причинную связь между двумя переменными (например, между достижением страной определенного уровня развития и происходящими в ней изменениями в руководстве и политическом курсе) там, где в действительности ее не существует, исключительно потому, что некоторые страны из нашей выборки находятся под общим для них влиянием какой-то другой страны. В этом случае увеличение объема выборки не имеет смысла, ибо любые дополнительные наблюдения реально не дают никакой новой информации.
На самом деле довольно трудно составить такую выборку, в которой все данные были бы совершенно независимыми. Некоторая степень диффузии почти неизбежно будет присутствовать фактически во всем, что мы изучаем при сравнительном анализе. Если это так, то нужны методы ослабления ее воздействия. Само собой разумеется, один из таких методов состоит в том, чтобы выявлять в выборке все явные признаки влияния одной страны на другую, после чего исключать последнюю из анализа. Другой способ состоит в использовании принципа максимального различия систем, когда отбираются страны, расходящиеся по возможно большему числу признаков, а также наблюдения, относящиеся к разным периодам времени. Если учесть, что действие диффузии со временем и с расстоянием ослабевает, то такая стратегия увеличит шансы на то, чтобы данные нашей выборки были независимыми. [c.346]
ОТБОР МАТЕРИАЛА
Каждый вопрос из рассмотренных выше соответствует одному из этапов сравнительного исследования от корректной постановки исследовательской задачи до выбора [c.346] адекватной меры и построения выборки. Окончательный (по крайней мере в теории) этап состоит в отборе фактического материала (заметим, что на практике этапы могут меняться местами). Отбор данных, разумеется, будет зависеть от выбранных нами для изучения темы, страны и периода времени. Здесь открывается столь широкий спектр возможностей, что мы ограничимся указанием лишь на наиболее известные источники политологических данных. Более специальные сведения можно почерпнуть в исследованиях, посвященных частным вопросам или отдельным странам. Чтобы наметить некоторые возможные варианты, обратимся к двум видам примеров со сводными и с опросными данными.
Что касается сводных данных, то здесь наиболее полными и удобными источниками являются справочники, такие, как справочник Бэнкса и справочник Тэйлора и Джодиса16. Бэнкс приводит сведения по политическим, экономическим и демографическим показателям более чем 150 стран начиная с конца XIX в., что позволяет анализировать долговременные процессы практически в любой части света. В то же время такой широкий охват материала позволяет увидеть и некоторые недостатки сводных данных. Один из них заключается в том, что для многих стран просто не существует непрерывных данных по некоторым важным показателям (переменным). Бэнкс в этих случаях дает усредненные или интерполированные цифры, выведенные из имеющихся данных. Такое решение вполне закономерно, однако оно начинает вызывать сомнение в том случае, если мы намереваемся изучать изменения во времени: при оценке результатов наблюдений Бэнкс исходит из предположения о равномерности общественного развития, поэтому его данные неизбежно создают видимость постепенных пропорциональных изменений, происходящих из года в год, что на самом деле может не соответствовать действительности.
В связи с данными Бэнкса возникают и другие вопросы, например вопрос о взаимозависимости между числом охваченных стран и лет и точностью каждого наблюдения. Чем больше стран включено в рассмотрение, тем труднее гарантировать, что данные по разным странам измерены точно и эквивалентно. При большом числе стран сложнее [c.347] найти точное определение таких величин, как, например, расходы на оборону, а также удостовериться в том, что в случае каждой страны мы измеряем одну и ту же величину. Здесь могут возникнуть серьезные проблемы, как, например, при сравнении Запада и Востока. Бюджетные цифры всех военных расходов в странах коммунистической ориентации традиционно преуменьшались, и поэтому на них нельзя особо полагаться при выверке сообщенных данных. Однако Бэнкс полагается именно на эти официальные цифры, что вызывает сомнение в надежности сравнений военных расходов на основании данных его справочника. Подобного рода несоответствия пронизывают практически весь его материал; это значит, что в данном справочнике переменные имеют одинаковые названия, но означают разное.
Тэйлор и Джодис несколько лучше справляются с этой проблемой, так как в их справочнике предусмотрена сложная система перепроверки данных по разным источникам, гарантирующая их эквивалентность для более чем 100 стран в фиксированные годы. У этого справочника есть и другие преимущества, а именно в нем приводятся: (а) обзор расхождений, имеющихся в различных типах данных, и обсуждение необходимых корректировок; (б) обсуждение политологических теорий, оперирующих приводимыми в справочнике данными. Недостатком справочника является то, что упор на эквивалентность данных неизбежно сужает охват и по большинству переменных данные приводятся лишь за несколько лет. Поэтому использовать эти данные для изучения долговременных процессов довольно затруднительно.
При изучении таких проблем, как выборы, партии и официальные организации, некоторые справочники по конкретным вопросам будут полезны и облегчат сравнительные исследования. В работе Кеннета Янды изложены основные положения и ключевые данные долгосрочного проекта сравнительных исследований политических партий17. Данные по правительствам, выборам, населению и социальным показателям в Европе представлены в серии справочников “по политическим фактам”18. Другой справочник содержит данные по голосованиям и выборам для 24 стран19. Это, конечно, только малая часть [c.348] информации, на которую мы могли бы сослаться, но эти книги иллюстрируют наиболее общие ограничения, возникающие при сравнительном изучении данных. Естественно, что сравнению лучше поддаются данные по США и Западной Европе, нежели по США и социалистическим или развивающимся странам20.
Другие, более специальные источники сводных данных также вызывают серьезные сомнения. Можно, например, использовать информацию, поставляемую различными исследователями Межуниверситетскому консорциуму политических и социальных исследований (ICPSR Inter-University Consortium for Political and Social Research) и хранящуюся в Мичиганском университете это избавило бы нас от задачи сбора данных. Но, полагаясь на чужие работы, мы с очевидностью ограничиваем свой выбор теми странами, переменными и периодами времени, которые были отобраны другими исследователями. Один из способов обойти это неудобство добрать недостающие данные из других источников, как-то: из ежегодных справочников ООН по международной статистике или из официальных публикаций отдельных стран. Тем самым мы возьмем выборку под свой контроль, однако одновременно перед нами встанет проблема эквивалентности. Дело в том, что в разных странах для характеристики данных используются слегка различающиеся между собой определения, и привести такие данные к единому знаменателю оказывается вовсе не просто. Более того, публикации таких международных организаций, как ООН, обычно основываются на отчетах отдельных стран, что ограничивает сравнимость данных в том же отношении. При сборе и публикации данных каждая страна может преследовать свои собственные цели и использовать свои оригинальные методы, которые к тому же со временем могут меняться. Если вернуться к нашему примеру, это означает, что в графу “военные расходы” в разных странах могут быть включены разные виды ассигнований. Эта проблема решается только с помощью подробного анализа ситуации в каждой из изучаемых нами стран.
Подобные же ограничения возникают и при использовании данных индивидуального опроса, полагаемся ли мы при этом на чужую информацию или собираем [c.349] материал самостоятельно. В первом случае мы, естественно, связаны теми переменными и выборкой, которые уже отобрал кто-то другой для анализа других, отличных от нашей проблем. Во втором случае, с другой стороны, мы можем самостоятельно осуществлять отбор переменных и построение выборки. Но как и в случае со сводными данными чем больше стран и периодов времени мы включаем в выборку, тем труднее гарантировать, что для каждой (каждого) из них мы измеряем одно и то же. На самом деле проведение индивидуального опроса в чужой стране может оказаться чрезвычайно сложной задачей. Даже если мы располагаем необходимыми средствами, а также поддержкой правительства в каждой из стран нашей выборки (что само по себе отнюдь не очевидно), перед нами все равно встанет целый ряд проблем.
Первая касается обеспечения языковой эквивалентности опроса, т.е. адекватного перевода наших вопросов с одного языка на другой (другие). Ясно, что это сопряжено с проблемой хорошего владения всеми теми языками, на которых говорят наши респонденты (или с проблемой хорошего переводчика). Однако даже при условии хорошего знания языка у исследователя могут возникнуть определенные трудности при попытке адекватно передать на нем некоторые понятия. В чужом языке может просто не существовать эквивалентов для некоторых специфических для нашей культуры представлений и терминов. Взять, к примеру, понятие “группы по интересам” (группа людей, объединенных общими интересами и пытающихся сообща воздействовать на политику правительства) и понятие “плюрализм” (политическое устройство, при котором различные группы населения сотрудничают и конкурируют друг с другом в борьбе за влияние на правительство). Поскольку оба эти понятия являются продуктом развития западной демократии, для них существуют эквивалентные обозначения во всех культурах западно-демократического типа. Но в других культурах может вообще не существовать ни одного из этих понятий, ибо они являются порождением специфического опыта высокоразвитых политических систем, в рамках которых появляются формально организованные группы населения. При возникновении [c.350] подобных неувязок вопросы приходится переформулировать, используя термины, допускающие эквивалентный перевод.
Помимо концептуальных и языковых различий, между культурами могут лежать и различия в особенностях речевого взаимодействия, влияющие на то, как респондент будет отвечать. Так, в некоторых странах респонденты бывают склонны рассматривать опрос как игру, в которой их роль состоит прежде всего в подыгрывании или поддакивании опрашивающему, возможно, даже в ущерб правильности ответов. Другой случай это когда респонденты придают слишком большое значение изъявлению своей лояльности по отношению к властям и дают соответственно такие ответы, какие, как им кажется, от них ожидают услышать. Иногда, наконец, респонденты избегают признаваться в тех или иных своих реакциях, если последние идут вразрез с местными обычаями. В каждом из этих случаев особенности культуры вызывают смещения в ответах респондентов.
Как и другие аспекты проблемы эквивалентности, эта трудность может быть частично преодолена с помощью всестороннего анализа особенностей каждой страны, который помогает определить факторы, могущие влиять на ответы респондентов. Другой путь состоит в том, чтобы использовать при изучении некоторой проблемы несколько разных показателей. Ведь если результаты опроса подтверждаются и другими типами фактов, то это усиливает состоятельность выводов.
В этом очень кратком обзоре мы, конечно, не претендовали на перечисление всех источников данных для сравнительно-политологического анализа и всех связанных с ними проблем. Но из него видно, что у каждого источника есть свои сильные и слабые стороны, которые необходимо учитывать в любом сравнительном исследовании. [c.351]
ЗАКЛЮЧЕНИЕ
Мы начали эту главу с утверждения о том, что сравнительный анализ необходим тогда, когда мы ставим целью построить обобщение, верное для разных государств или [c.351] же когда мы изучаем явления системного уровня. При этом сравнительное исследование должно строиться в соответствии с целым рядом правил, касающихся правильного выбора исследовательского вопроса, эквивалентной меры, построения адекватной выборки и использования независимых результатов наблюдений. Почему мы делаем упор именно на эти правила? Потому что они помогают четко определить, что именно мы изучаем и можем получить в ходе исследования, и таким образом влияют на наши выводы в области политических отношений. Принимая в расчет нашу нынешнюю ограниченность как в теории, так и в источниках информации, нельзя, конечно, гарантировать совершенные решения по всем тем проблемам, которые могут возникнуть в ходе сравнительного исследования. И тем не менее всякий раз, как мы приступаем к анализу или к интерпретации его результатов, мы должны учитывать каждое из вышеизложенных правил. Чем яснее мы видим возможные искажения, тем больше у нас уверенности в том, что наши выводы относительно социальных классов, участия населения в выборах, здравоохранения, форм социального протеста и пр. правильны. [c.352]
Дополнительная литература к главе 11
Существует целый ряд публикаций, в которых затронутые нами проблемы и аспекты сравнительно-политологического исследования обсуждаются гораздо подробнее, чем в этой главе. Так, для общего ознакомления с методикой сравнительного исследования следует обратиться к классическим в этой области работам: Меrritt R. Systematic Approaches to Comparative Politics. Skokie (Ill.): Rand McNally, 1970. Przeworski A., Tenne H. The Logic of Comparative Social Industry. N.Y.: Wiley-Interscience, 1970; Сullier D. The Comparative Method: Two Decades of Change. // Rustоn D.A., Eriksоn K. (eds.) Comparative Political Dynamics: Global Research Perspectives. N.Y.: Harper Collins, 1991. P. 7-31.
Отдельные вопросы методологии рассматриваются в: Sаrtоri J. Concept Misformation in Comparative Politics. American Political Science Review. 1970. Vol. 54. P. 10331053 (о выборе адекватного исследовательского вопроса); Chandler W., Chandler M. The Problem of Indicator Formation in Comparative Research. // Comparative Political Studies. 1974. Vol. 7. P. 2646 (об эквивалентных показателях); Rоss M., Homer E. Galton's Problem in Gross-National Research. // Worid Politics. 1976. Vol. 27. P. 128. Meckstroth Th. “Most Different Systems”m and “Most Similar Systems”: A Study in the Logic of Comparative Inquiry. // Comparative Political Studies. 1975. Vol. 8. P. 132157 (сравнение принципов максимального сходства и максимального различия систем). Geddes В. How the Cases You Choose Affect the Answers You Get: Selection Bias in Comparative Politics. Этот доклад представлен на ежегодной конференции Американской политической научной ассоциации в Атланте в 1989г.; Асhen Ch. H., Duncan S. Rational Deterrence Theory and Comparative Case Studies. // World Politics. 1989. Vol. 41. P. 143-169.
О сравнительном методе см. также: Саntоri L.J., Zieglеr A., Jr. (eds). Comparative Politics in the PostBehabioral Era. Boulder, Colo.: Lynue Reiner Publishers, 1988; Mауer L. Redefining Comparative Politics: Promise Versus Performance. Newbury Park, Calif.: Sage 1989; Heidenheimer A.J., Helclo H., Adams C.T. Comparative Public Policy: The Politics of Social Choice in America, Europe and Japan, 3d ed. N.Y.: St Martin's, 1990.
Следующими авторами рассматриваются вопросы, связанные с использованием в сравнительном исследовании сводных и опросных [c.354] данных: Hudson M. Data Problems in Quantitative Comparative Analysis. // Comparative Politics. 1973. P. 611-629; Freу F. Cross-Cultural Survey Research in Political Science. // Holt and Turner Comparative Research. P. 173-294; Brislin R., Lоnner W., Thorndike R. Cross-Cultural Research Methods. N.Y.: Wieley, 1973; Jасkman R.W. Gross-National Statistical Research and the Study of Comparative Politics. // American Journal of Political Science. 1985. Vol. 29. P. 161-182.
О недостатках сравнительного стратегического анализа см.: Rаgin Сh.С. The Comparative Method: Moving beyond Qualititive and Quantitative Strategies. Berkeley, Calif.: University of California Press, 1987. [c.355]
ОБРАБОТКА ДАННЫХ
12. ПОДГОТОВКА И ОБРАБОТКА ДАННЫХ
Мы достигли той стадии исследовательского процесса, когда в нашем распоряжении уже имеется массив данных и предстоит выбрать наиболее доступный и эффективный способ его обработки. Именно на этой стадии мы начинаем окончательное оформление результатов наших усилий в виде схем, графиков, статистических выкладок и других элементов, составляющих отчет о проделанной научной работе; эту часть нашего исследования мы представляем для всеобщего обозрения и прочтения. Однако остается еще один гораздо менее заметный комплекс операций, которых нельзя избежать, если мы хотим извлечь из наших данных наиболее полную информацию. Имеется в виду подготовка и обработка данных, чему будет посвящена настоящая глава. Как исследователь приписывает цифровые значения той информации, которую он или она собрали, чтобы можно было бы ее основательно проанализировать? Как можно использовать эти цифры, чтобы осмысленно связаться с компьютером, без которого обрабатываемые нами массовые данные зачастую становятся неуправляемыми? Что в этом случае компьютер может сказать нам о наших данных? Как мы должны спрашивать его? Эти и другие имеющие отношение к делу вопросы должны быть решены прежде, чем мы перейдем к анализу данных и презентации результатов. [c.356]
КОДИРОВАНИЕ: ЧТО ВСЕ ЭТИ ЦИФРЫ ЗНАЧАТ?
Процесс присвоения количественных значений имеющейся у нас информации называется кодированием. Кодирование для измерений значит то же, что алфавит для речи, а именно средство, с помощью которого информации придается форма связного и продолжительного сообщения. Так же как каждая буква или комбинация букв алфавита представляет определенный звук, каждая цифра или комбинация цифр кода представляет определенную характеристику или состояние исследуемого объекта. И так же, как буквы позволяют тем, кто знает алфавит, оперировать сложными мыслями, цифры позволяют тем, кто [c.356] знает код, оперировать сложными понятиями в более сокращенной форме. Кроме того, цифровая кодировка дает возможность исследователю пойти еще дальше, поскольку кодированная информация, особенно кодированная в цифровой форме, позволяет применить математические методы, и тогда полученные данные могут выявить то, что без обращения к цифровой интерпретации могло остаться скрытым. Другими словами, кодирование открывает путь к более глубокому исследованию, чем это могло бы быть в любом другом случае.
Цифровые коды в исследовательской работе очень похожи на азбуку Морзе в телеграфии, с которой вы, вероятно, знакомы. В азбуке Морзе определенные комбинации точек и тире заменяют буквы алфавита. Сами точки и тире преобразуются в длинные и короткие звуки, которые могут быть переданы по радио от соответственно оборудованной передающей станции к соответственно оборудованному приемнику. Звуки затем преобразуются в буквы, и передача сообщения, таким образом, завершена. На рис. 12.1 этот процесс изображен в форме диаграммы.
Рис. 12.1. Кодирование в телеграфии
Точно также в научном исследовании каждая цифра кода означает определенную градацию данной переменной. Например, если мы измеряем уровень образования членов определенной группы, в которой каждый опрашиваемый может иметь незаконченную высшую школу, законченную высшую школу и законченное высшее образование колледжа, мы можем представить эти три уровня градаций цифрами 1, 2, 3. Или же, если мы хотим учесть число лет обучения, цифровой код должен отражать это число (например, цифра 7 будет значить семь лет обучения). Обе системы кодирования позволяют довольно точно подытожить результаты исследования, хотя принципы, кодирования разнятся. Ну и, поскольку мы имеем комплекс закодированных в той или иной форме данных, можно обрабатывать и анализировать их в соответствии с нашими желаниями, прежде чем преобразовывать их обратно в словесную форму при подготовке отчета о нашей нагнои деятельности. Этот процесс перевода информации из словесной формы в цифровую и обратно в обобщенной форме показан на рис. 12.2.
Рис. 12.2. Кодирование в исследовании
Самое главное, что необходимо помнить при разработке кодирования данных, это то, что принцип [c.357] кодирования должен всегда определяться характером измерения исследуемой переменной. Так, переменные, измеряемые номинальными шкалами, должны иметь номинальные коды, переменные, измеряемые шкалами порядков, порядковые, и переменные, измеряемые интервальными шкалами, интервальные. Внешне все эти цифры могут казаться [c.358] одними и теми же, однако их значения в каждом случае существенно отличны от других. Анализ или оперирован данными, преобразованными из словесной формы в цифровую, чреваты непреодолимым искушением применить м годы, которые просто невозможны в данном случае в си особенностей измерения переменной (более подробно мы рассмотрим эту проблему в следующих главах). Такое искушение нужно преодолеть, если мы хотим извлечь пользу своего исследования. [c.359]
Механизм закодирования (или раскодирования) данных действительно очень прост. Мы начнем с определения типа каждой переменной нашего исследования с точки зрения шкалы ее измерения. Если это номинальная переменная, в которой нам нужно распределить цифры кода между взаимоисключающими категориями, невзирая на порядок их расположения, то мы делаем это так, как нам удобно. Возьмем довольно типичный пример. Если члены исследуемой группы подразделяются по вероисповеданию на протестантов, католиков и иудеев, то распределить коды между этими категориями можно согласно любой из нижеследующих схем:
|
1 Протестанты |
1 Католики |
1 Иудеи |
43 Протестанты |
|
В каждом случае отдельная цифровая градация используется для обозначения градации или категории переменной. Поскольку вероисповедание есть номинальная характеристика, порядок расположения и размерность кода не имеют никакого значения. Мы можем при кодировании использовать одно-, трех- и даже десятизначные цифры, если нам этого захочется. Конечно, лучше давать наиболее простые и удобные коды, и обычно выбирают простые цифры с наименьшим количеством знаков, но вообще это зависит от нашей приверженности к экономии, а не от каких-либо математических требований.
Можно также использовать более сложную схему номинального кодирования для более полного отражения информации. Например, мы хотим в нашем исследовании более подробно представить информацию о лицах протестантского и иудейского вероисповедания. Тогда мы можем использовать систему двузначных кодов, которая строится на предыдущей классификации. В качестве первой цифры выбираем ту же, что и ранее (например, 1 протестанты, 2 католики, 3 иудеи). Вторая будет обозначать новую информацию. Взгляните на следующую схему:
|
10 Протестанты |
20 Католики |
|
[c.360]
Здесь наши коды отражают (в первой колонке) приблизительную разницу между категориями и в то же время (вторая колонка) дают возможность уточнения. В результате мы имеем более полную запись характеристик исследуемых лиц, которая вместе с тем сохраняет следы менее точной (но зачастую более удобной с точки зрения анализа) системы записи, с которой мы начали.
Если бы нам нужно было перечислить все градации протестантского вероисповедания, то возможности кода в диапазоне “10” (от 10 до 19) вскоре были бы исчерпаны и нам пришлось бы изменить схему записи. Любой из нижепредложенных вариантов может легко решить эту проблему, хотя выбор того или иного пути может варьироваться в зависимости от задач исследовательского анализа или навыков компьютерного программирования.
В первом случае мы просто увеличили количество двузначных кодов (комплектов десятичных кодов), приписанных протестантам, тогда как во втором упорядочили их. И опять если переменная, по сути, является номинальной, то ни конкретная цифра, ни количество знаков кода не имеют никакого значения. До тех пор пока наша система кодировки является оптимально экономной, а градации переменной взаимоисключающими, любая цифра удовлетворительна. [c.361]
Когда мы кодируем порядковые переменные, наши возможности уже несколько ограничены. Поскольку порядковое измерение не предполагает равных или просто известных нам интервалов, мы остаемся, вольны в выборе цифр любой величины. Но поскольку порядковое измерение требует сохранения в наших кодах относительного ранжирования градаций (позиций), мы должны заботиться о том, чтобы наши цифры были по меньшей мере определенным образом расположены. Так, для переменной уровень политического развития или любой другой переменной, содержащей разницу в уровне, степени или сходстве градаций, любая из предложенных ниже систем кодировки может быть одинаково верной (и одинаково значимой).
|
1 Самый низкий |
|
1 Самый низкий |
1 |
Самый низкий |
Каждая из них сохраняет порядок, заданный самой переменной. И ни одна не является более точной, чем остальные, поскольку точность здесь функция не самих цифр, а стоящего за ними порядкового измерения. Как и ранее, наша приверженность к экономии может подтолкнуть нас к выбору первой из трех предложенных схем, однако если не принимать этого во внимание, то наш выбор строго случаен.
Напротив, ни одна из следующих схем не является подходящей:
|
1 Самый низкий |
1 Высший |
|
Если относительная величина или расположение цифровых кодов (а следовательно, и направление их изменения) не имеют значения для номинальных измерений, то в случае работы с порядковыми данными они очень важны. В первом из вышеприведенных примеров смещен порядок кодов, во втором он изменен на обратный. В результате ни одна из систем кодировки не сохраняет в достаточной мере относительного расположения и величины градаций самой переменной. Таким образом, коды неверно передают сведения. Они либо лишают нас возможности выстроить наши данные по порядку, либо вводят в заблуждение относительно причин [c.362] той систематизации, которую мы пытаемся выработать. Короче говоря, подобных ошибок нужно избегать при работе с порядковыми данными.
Разработка кодов для интервальных измерений, с одной стороны, наиболее трудоемкий процесс, однако с другой он может оказаться наилегчайшим. Здесь цифры имеют гораздо более точное значение, и наши возможности в кодировании существенно ограничены. Доллар это доллар, год это год, а разница между 47 и 43% такова же, как и между 73 и 69%. В интервальном измерении не только величины являются взаимоисключающими и определяющими порядок расположения, но и интервал между двумя соседними значениями одинаков и неизменен. Кодирование интервальных данных должно сохранять эти характеристики.
На первый взгляд это может показаться невыполнимой задачей. Для того чтобы закодировать интервальную переменную, необходимо найти такую систему кодов, где каждый исключает другие, каждый соответствует определенной величине переменной, каждый отстоит на равное количество единиц измерения от ближайшего соседа и дистанция эта между двумя соседними величинами известна. В действительности, однако, нахождение таких цифр, в общем-то, простая задача, поскольку в отличие от большинства номинальных или порядковых шкал, когда исследователь, по сути дела, вынужден выискивать цифровые эквиваленты для своих сведений, многие интервальные коды заданы изначально. Иными словами, интервальные коды гораздо чаще, чем на более низких уровнях измерения, следуют непосредственно из операционных характеристик самой переменной. Если определить личный доход как количество долларов, которое он или она зарабатывает за определенное время, то каждое конкретное количество заработанных долларов определяет не только какую-либо градацию переменной дохода, но и код для этой градации. Если градации номинальных и порядковых переменных в основе своей являются вербальными (как, например, протестант и католик, высокий и низкий уровни развития) и должны быть заменены цифровыми эквивалентами, то градации интервальных переменных изначально имеют цифровую форму (доллары дохода при исчислении стажа работы в административном [c.363] учреждении) и не требуют специального перевода. Результатом является то, что при кодировании интервальных данных основное внимание уделяется не созданию имеющих смысл кодов, а опознаванию и сохранению их.
Как отмечалось в гл. 3, иногда могут возникнуть такие ситуации, когда исследователь, желая повысить возможности обработки и информационную отдачу своих данных, захочет свести интервальные данные к порядковым категориям. Например, для нас гораздо проще и значимее может оказаться анализ респондентов по общему уровню их доходов, чем учет каждого доллара разницы. В таких случаях в первоначальной кодировке данных можно сохранить их интервальный характер, а затем полученные категории преобразовать согласно нуждам исследователя (например, мы записываем действительное количество долларов, заработанных респондентами, а затем группируем их в более крупные категории) или же можно действовать по методу, когда данные сразу, по мере поступления записываются в сгруппированном виде так, как будто мы классифицируем респондентов по большим категориям дохода и не фиксируем точный размер их заработка. Каждый метод имеет свои достоинства и свои недостатки, которые должны учитываться в каждом конкретном случае. Какой бы метод ни был взят, исследователь должен быть уверен, что выбранная схема кодирования отвечает требованиям измерения конкретного признака.
Становится очевидным, что процесс приписывания определенных кодов данным неотделим от процесса операционализации переменных. Безусловно, коды это ничто иное, как цифровое выражение наших операциональных определений. Поэтому обсуждение проблемы кодирования было бы более уместно в начале книги. Все вопросы, связанные с тем, какие коды дать градациям переменных, должны быть решены на ранних стадиях исследовательского процесса. Все это неотъемлемая часть верного планирования исследования. Однако истинная ценность кодов становится понятной позже, поскольку именно на стадии анализа данных коды начинают играть ту роль, которую они призваны сыграть во всем проекте исследования. Именно тогда коды дают возможность перейти от обзора к обработке данных, а затем от обработки к интерпретации. Для того чтобы понять, как происходит этот переход, давайте рассмотрим некоторые аспекты техники кодирования. [c.364]
КНИГА КОДОВ И КОДИРОВАЛЬНЫЙ БЛАНК
Первое, что нам следует рассмотреть, это книга кодов. Книга кодов это перечень всех переменных, встречающихся в исследовании, всех значений, которые могут принимать переменные, и всех приписанных им цифровых значений.
Представьте, например, что 1 июля 1995 г. правительства Ирана, Никарагуа и Вьетнама заключили соглашения с некоторыми рекламными агентствами с целью улучшения своего имиджа в американской прессе и что мы хотим провести исследование, для того чтобы определить, каково воздействие этих усилий на содержание новостей и редакционных статей. В таком исследовании нам можно сравнить период, непосредственно предшествующий, и период, непосредственно следующий за исходной датой, с тем чтобы установить, что произошло после заключения контрактов: 1) количество репортажей о каждой) стране значительно возросло или значительно упало, 2) отношение к этим странам в прессе более предпочтительно или менее предпочтительно, чем в предыдущий период. Необходимо также учитывать такие дополнительные факторы, как регулярные сезонные перемены в репортажах, например большее внимание прессы к некоторым странам в период туристского сезона, или увеличение потока достойных внимания прессы событий во время обострения политической ситуации или в результате стихийных бедствий; однако для большей наглядности мы не будем обращать внимание на эти факторы.
Для того чтобы оценить эффект усилий по улучшению имиджа, мы можем обратиться к любому количеству репортажей новостей или проанализировать лишь перечень, который может быть в форме как заголовков, так и кратких резюме различных статей и содержит, по сути дела, значительную долю информации; можно также использовать его лишь для обозначения самих статей. Для наглядности давайте воспользуемся перечнем (который в нашем случае содержит заголовки и полные библиографические ссылки) в “Reader's guide to Periodical Literature”, в котором публикуется содержание большого количества популярных журналов; выберем гуда заголовки “Иран”, “Никарагуа”, “Вьетнам”. Нашей зависимой переменной будет деятельность профессиональных рекламных агентств, точнее, ее отсутствие (до l июля 1995 г.) или присутствие (после этой даты). [c.365]
Следуя двум отмеченным принципам, мы будем иметь два комплекса зависимых переменных. В первом будет учитываться количество статей, в нем будет отмечаться ежемесячное количество их в период до и после тестирования и соотношение (на основании заголовка или содержания) статей, относящихся к политической, экономической или социальной системам каждой страны. В дальнейшем мы будем обозначать эти статьи как затрагивающие внутренние или внешние проблемы. Второй комплекс зависимых переменных будет учитывать качество репортажей на основании суждений о том, насколько положительно или отрицательно (опять же на основании заголовков) оцениваются в них названные страны. И, наконец, в любом исследовании такого рода необходимо иметь специальные коды для обозначения каждой отдельной статьи, страны, к которой она относится, даты публикации, объема статьи, типа издания, в котором она появилась.
В упрощенном виде макет кодировки для этого гипотетического исследования представлен в табл. 12.1. Как видите, макет кодировки суммирует переменные, используемые в исследовании, и приданные им значения. Это, по сути дела, немного больше, чем просто формальная классификация, с которой начинается любое исследование. Здесь эта классификация представлена во всех деталях, включая инструкции к интерпретации, и структура ее построена не в соответствии с нашими гипотезами, а с тем, чтобы облегчить сбор информации. Книга кодов обеспечивает постепенное продвижение к тому, что мы пытаемся выяснить, а также описание этого искомого, когда мы его нашли.
Эта “Книга кодов” идентифицирует компьютерные колонки, в которых будут храниться данные, а также предоставляет описания информации, которая должна быть найдена в определенном месте. Она также сообщает, какие коды были использованы для представления данных, не являющихся числовыми. Например, кодовая таблица, представленная в табл. 12.1, показывает, что номер 1, обнаруженный в компьютерной колонке 16, означает тип журнала, в котором была найдена искомая статья, а именно еженедельник (как, например, “Time” или “Newsweek”). Такая организация информации помогает исследователю записывать данные правильно и аккуратно интерпретировать результаты анализа, после того как он закончен. А [c.366] тем, кто может использовать эти данные впоследствии, это также дает возможность увидеть, как организованы данные, и в свою очередь интерпретировать результаты анализа, не опираясь на уже существующее мнение.
Таблица 12.1.
Макет кодировки для исследования “Информационные агентства о некоторых странах”
Колонка |
Переменная |
Значение переменной |
Код |
1 - 4 |
Статья и номер кодирования |
|
- |
5 |
Государства |
Иран |
1 |
6 - 7 |
Месяц публикации |
Июль 1995 |
01 |
8 |
Отношение к политической системе в заголовке статьи (включая любое упоминание о политических деятелях, правительствах, политических событиях, оппозиционных партиях, политике и т.д.) |
Не относится |
0 |
9 |
Отношение к экономической системе в заголовке статьи (включая любое упоминание о промышленности, экономике, денежном курсе, рабочей силе, продукции, экономических возможностях, рынке, торговле и т.д.) |
Не относится |
0 |
10 |
Отношение к социальной системе в заголовке статьи (включая любое упоминание о культурных, религиозных и социальных институтах, событиях или деятелях и т.д.) |
Не относится |
0 |
11 |
Посвящена внутренним или внешним проблемам |
Заголовок статьи относится исключительно к внутренним объектам, действиям или событиям |
|
12 |
Положительное или отрицательное отношение |
Заголовок статьи касается исключительно прогресса, достижений, ресурсов, активов, мощи страны |
|
13 - 15 |
Количество страниц в статье |
|
- |
16 |
Тип журнала, опубликовавшего статью |
Еженедельник новостей (включая только “Time”, “Newsweek”, “U.S. News and World Report”) |
|
Разработка книги кодов облегчает быстрый переход к следующей стадии подготовки данных созданию кодировального бланка. Кодировальный бланк это лист записи данных в соответствии с книгой кодов и в форме, облегчающей компьютерную обработку собранной информации. Обзорная анкета и форма записи для структурированной информации, описанные в предыдущих главах, являются, например, вариантами кодировального листа, так же как и представленная на рис. 12.3 запись сведений в нашем исследовании репортажей о различных странах в американской прессе. [c.368]
Рис. 12.3. Кодировальный бланк для исследования “Пресса США о некоторых странах”
На рис. 12.3 в колонки занесены признаки книги кодов. На каждую цифру кода отведена специальная колонка; так, двухпорядковый код (такой, как у переменной месяц публикации) требует двух колонок в копировальном листе. Точно так же каждый ряд представляет отдельный случай и каждая цифра обозначает значение переменной в каждом конкретном случае. Так, мы видим, что под номером 0001 описана статья об Иране, которая появилась в еженедельнике новостей в январе 1996 г., посвящена исключительно политической системе и не содержит упоминаний об определенных затруднениях во внутренней ситуации. Этим характеристикам может отвечать, например, статья [c.369] из “Тайм”, озаглавленная “Иран в хаосе: руководители не в состоянии остановить казни, стабильность под угрозой”. И таким же образом могут быть записаны относительные характеристики заголовка любой статьи, которую мы встретим; при этом каждая статья (каждый отдельный случай) будет занимать один ряд или строку. И если мы изучим, или закодируем, 821 случай, то все данные займут всего 821 ряд. Данные разных случаев (статей), но относящиеся к одному и тому же признаку, будут записаны в одних и тех же колонках на кодировальном бланке. И, наконец, все кодировальные бланки следует пронумеровать (чтобы быть уверенным, что ни один из них не потерялся), датировать (даты часто бывают, полезны, например, если мы вынуждены изменить формулировку или добавить переменную в книгу кодов и приходится перекодировать или добавлять коды к предыдущему материалу) и подписать полным именем или инициалами кодировщика (это основа для измерения надежности интеркодирования, описанной в гл. 9). Если для каждого случая требуется больше одного кодировального бланка, например когда количество переменных, которые нужно измерить, достаточно велико, все бланки, относящиеся к одной группе случаев, следует скрепить и пронумеровать однотипно. Это сведет к минимуму шансы перепутать их при обработке. Имеет также смысл выносить порядковый номер каждого случая на отдельный копировальный бланк, используемый для него. [c.370]
КАК ОБРАБОТАТЬ ДАННЫЕ
Когда кодировка данных закончена, мы обращаемся к их обработке, с тем чтобы прийти к каким-либо выводам. Понятно, что в работе с большим количество случаев и переменных путаница может быть абсолютно непреодолимой. Если мы хотим преодолеть эту трудность и добиться максимальной простоты, точности и емкости анализа, нужно положиться на компьютер. Конечно, компьютер очень сложная система, но ее основные принципы несложно понять.
Компьютеры состоят из комплектов выключателей (кнопок), которые используются для набора информации посредством простых кодов. Можно проиллюстрировать это, пользуясь аналогией с выключателями света в вашем [c.370] доме. Выключатель может выполнять только два типа операций. Он либо включен, либо выключен, посредством постановки в ту или иную позицию выключатель (и свет) могут быть использованы для передачи информации. Если, например, вы хотите, чтобы в канун Дня всех святых ваши дети навестили вас, вы информируете об этом, включая свет у дверей вашего дома. Если вы не хотите, чтобы вас беспокоили, вы не станете включать свет. По сути дела, вы передаете сообщение посредством замыкания и размыкания электрической цепи. Точно так же, сочетая комплекты выключателей и лампочек и используя двоичную систему исчисления (описанием которой мы сейчас не станем заниматься), вы можете составлять все более и более сложные информационные сообщения. Построение такой системы кодов по типу “да нет” и использование ее для обмена информацией можно представить себе как программирование ваших действий с выключателями света. Собственно говоря, так компьютер и работает, конечно, в гораздо большем и более сложном масштабе. Обычный компьютер состоит из многих тысяч маленьких выключателей, запрограммированных на сбор и обработку информации точно таким путем.
Некоторые виды анализа особенно такие, в которых задействованы очень большие объемы данных или очень сложные процедуры обработки, производятся на компьютерах типа “мэйнфрейм”, но большинство политологических исследований могут быть сделаны и на достаточно быстрых персональных компьютерах с большой памятью. Для “общения” с компьютером мы используем различные средства от пишущей машинки консоли до оптической “мышки” и светочувствительного пера. Информация, вводимая в компьютер с помощью клавиатуры (или какими-то другими средствами), конвертируется в электронные коды, которые хранятся в виде, предварительно оговоренном. Каждой строке информации соответствует строка в кодировочной таблице. Таким образом, продолжая разговор о нашем примере, чтобы ввести коды 821 статей о трех запрашиваемых странах, мы должны были напечатать их в 821 строке данных на клавиатуре.
Некоторые программы пригодны для проведения статистического анализа на персональных компьютерах. Они различаются по форме и возможностям. Одни особенно [c.371] разработанные для компьютеров “Apple” или IBM совместимых систем, использующих программное обеспечение типа “Windows”, ориентированы на визуальные (графические) команды. Другие IBM совместимые системы, использующие операционную систему MS-DOS, ориентированы на текстовые команды. Разнообразие аппаратного и программного обеспечения слишком велико, чтобы подробно рассматривать его на этих страницах. Однако что касается ввода данных, то в наиболее современных программах используется обычно формат, называющийся “электронные таблицы”*.
При использовании электронных таблиц сначала необходимо пометить и определить значение колонок для ввода данных, установив параметры (число колонок, необходимых для каждой переменной, тип и определяющие метки). Затем производят ввод данных построчно, причем в каждой строке должен быть представлен отдельный случай или наблюдение. Соответствующие колонки заполняются цифрами или буквами. Все это выглядит достаточно знакомо, ибо процедура совершенно совпадает с созданием программного бланка (coding sheet), которое мы описали выше.
Когда данные введены в компьютер, их нужно обрабатывать. Это значит, что мы должны “проинструктировать” компьютер, каковы наши требования к их обработке. Какие случаи нам нужно проанализировать? Какие подсчеты должны быть выполнены? В какой форме мы хотим получить результаты?
Полезно уметь писать компьютерные программы, но нет никакой необходимости создавать свою собственную программу, для того чтобы проанализировать большинство данных, привлекаемых для политологического исследования. Пригодное для этого программное обеспечение включает в себя очень сложные и хитроумные программы, выполняющие разнообразные статистические, аналитические, текстовые и другие операции. Но даже если программы сами по себе сложны, то использовать их [c.372] очень легко. В каждой имеется своеобразная “поваренная книга” для обработки данных. Эта “книга”, или учебник, содержит пошаговые инструкции по использованию программы и выполнению определенных задач. В сущности, компьютер задает нам разные вопросы, посылая на экран сообщения типа: “Хотите ли вы, чтобы я вывел на экран эти данные в виде таблицы?” или “Вы хотите посчитать среднее квадратическое отклонение для этих случаев?” Следуя инструкциям, мы отвечаем “да” или “нет” и указываем на специфические процедуры, которые мы хотим проделать. Форма и суть этих инструкций меняются в зависимости от пакета, но в целом функции их одинаковы. Таким образом, на самом деле нет необходимости создавать программы, поскольку есть возможность пользоваться уже имеющимися в компьютере.
В заключение хочется сделать еще три замечания. Во-первых, довольно распространено явление, когда люди, не имеющие прежнего опыта работы с компьютером, теряются и слегка побаиваются его. Такие чувства понятны, однако нельзя позволять им становиться препятствием в обучении. При наличии всех закрытых программ, руководств и консультационных служб, которые сейчас существуют, использование компьютера значительно облегчается по сравнению с прежними временами. Когда, наконец, вы преодолеете свои сомнения, то, возможно, обнаружите, что попались компьютеру “на крючок” и получите огромное удовольствие от общения с ним.
Во-вторых, не стесняйтесь ошибаться. Внимательный ввод данных и считывание предотвратят многие ошибки, И, как в любой новой сфере, вы вскоре найдете пути улучшения работы. Это обычное дело. Если подумать, ошибки и их исправление один из наиболее важных моментов обучения. Следите за своими ошибками там, где это возможно, не отказывайтесь от помощи там, где это необходимо, и не прекращайте своих попыток.
И наконец, не увлекайтесь. Компьютеры по природе своей бестолковы; они обрабатывают информацию, они точно следуют командам, но они не думают. Используя пакеты программ, которые мы здесь описали, вы можете с легкостью заставить компьютер выполнять сложнейшие статистические расчеты, какие только можно вообразить, данных такого низкого уровня, что результаты, несмотря [c.373] на впечатляющую внешнюю форму, будут бессмысленны. Соответственно, очень важно, чтобы вы заранее продумывали и понимали статистические и аналитические процедуры, которые предстоит осуществить компьютеру, и отбирали только те, которые соответствуют вашим данным. Эти процедуры будут предметом обсуждения нескольких следующих глав. [c.374]
Дополнительная литература
Более детально процедуры кодирования рассмотрены в кн.: Janda К. Data Processing: Applications to Political Research, 2nd.ed. Evanstone (Ill.): Northwestern University Press, 1969.
Полезные примеры использования книги кодов см. в: Janowitz М. The Community Press in an Urban Setting: The Social Elements of Urbanism. - 2nd ed. Chicago: University of Chicago Press, 1967; Leuthhold D.A. Electioneering in a Democracy. Campaigns for Congress. N.Y.: Wiley, 1968.
13. ОПИСАНИЕ ДАННЫХ: ПОСТРОЕНИЕ ТАБЛИЦ, ДИАГРАММ, ГИСТОГРАММ
Проблема, которую мы ставим в этой части исследования, состоит в том, как наилучшим образом преподнести результаты нашей работы. Мы должны найти стиль ясный, сжатый, точный и, кроме того, объективно отражающий данные. И одновременно мы должны помочь другим исследователям понять значение или значимость того, что мы выяснили. Иначе говоря, нам нужно представить результаты так, чтобы они были без труда поняты. Частично это зависит от применения статистического анализа, обсуждение которого мы отложим до следующей главы. Но в основном успех правильной интерпретации данных зависит от качества схематического и графического материала, от удачного выбора таблиц и диаграмм, от четкости и ясности их построения.
Разнообразие типов схематического и графического описания данных огромно, и нам не удастся рассказать обо всех или даже о наиболее часто встречающихся. Лучше, изучив несколько типичных примеров, мы обсудим те подводные камни, о которых необходимо знать как при чтении, так и при подготовке таблиц, графиков и т. п. По ходу дела мы затронем такие вопросы, как: “В каких случаях следует прибегать к графику? Что лучше таблица или схема? Как выглядят таблицы, схемы, диаграммы (какова их структура)? Как схематическое и графическое изображение может помочь в понимании материала?” [c.375]
ПЕРЕЧНЕВАЯ ТАБЛИЦА
Начнем изучение этих проблем со знакомой вам уже, возможно, перечневой таблицы. Перечневая таблица это попросту представление исследовательских данных в виде таблицы, которая, по сути дела, является перечнем. Таблица 13.1, например, суммирует данные о голосовании избирателей за демократов на президентских выборах и их расовую принадлежность за период 19601976 гг. Каждая колонка таблицы представляет отдельную переменную (всего четыре переменных). Тот факт, что [c.375] таблица задана переменной год, которая расположена в первой колонке, определяет и порядок изложения данных. Порядок этот подсказывает, что таблица построена так, чтобы ответить на вопрос, как голосование за демократов на президентских выборах изменялось из года в год.
Табл. 13.1 иллюстрирует некоторые правила построения таблиц.
Таблица 13.1.
Голоса белых и чернокожих избирателей,
поданные за демократов в 1960 - 1976 гг., % *
Год |
Голосование |
Голосование за белых демократов |
Голосование за чернокожих демократов |
1960 |
50 |
49 |
68 |
* Данные о выходцах из Азии, испанцах и др., кроме негров, небелых избирателях, хотя и присутствуют в том наборе данных, по которому построена таблица, из настоящего анализа исключены.
** Данные за 1976 г. основаны на предварительном анализе некоторых сведений Научно-исследовательской кампании по прогнозам
Источник. Данные, представленные в этой таблице, взяты из обзоров Научно-исследовательской кампании по прогнозам, издаваемых раз в четыре года.
Все таблицы должны быть последовательно пронумерованы. В солидных работах с несколькими пронумерованными частями (в диссертации или в книге с большим количеством глав) эти номера должны выглядеть так: табл. 3.1, 3.2 и т. д. или табл. III.1, III.2 и т. д. В небольших по объему работах вполне достаточна нумерация из одной цифры (табл. 1, табл. 2). Если в одной и той же работе таблицы даются наряду с графиками, схемами и другим иллюстративным материалом, то обычно они нумеруются отдельно. Графические изображения обозначаются, например: рис. 1 или рис. 3.1.
Каждая таблица должна иметь заголовок, который точно отражает содержание представленных в ней данных. Этот заголовок должен давать читателю достаточно информации, чтобы решить, изучать ли таблицу детально. Так, для табл. 13.1 заголовок типа “Данные, показывающие, что за демократов трижды за период 19601976 гг. [c.376] голосовало более половины избирателей и что чернокожие избиратели отдали им больше голосов, чем белые” будет неуместен. В общем, заголовок должен отражать основные переменные, по которым в этой таблице имеются данные. В случае, если, как в табл. 13.1, данные охватывают определенный период времени, этот период также следует включить в заголовок. Когда таблица полностью или частично составлена по сведениям другого источника, сразу под ней следует дать ссылку. Объяснительные ссылки, относящиеся к таблице в целом (первое примечание в нашем примере), следует отметить звездочкой или другими символами сразу после заголовка. Ссылка, относящаяся лишь к части таблицы (второе примечание в нашем примере), отмечается прямо в самой таблице. Сами примечания помещаются сразу под таблицей, затем упоминается источник.
Что еще следует помнить при подготовке таблицы?
1. Номер таблицы и заголовок лучше помещать в центре страницы (или в ее правой части) и с отступом от предыдущего текста и самой таблицы. Другой вариант помещать каждую таблицу на отдельной странице. В том месте текста, где идет речь о таблице, отступите строку, напечатайте СЮДА ТАБЛИЦУ 1 заглавными буквами в центре страницы, отступите еще строку и продолжайте текст. В обоих случаях можно внешние границы таблицы обозначить двумя чертами, внутренние одной.
2. Если это возможно, лучше избегать вертикальных линий для отделения секций внутри таблицы.
3. Между заголовками и данными внутри таблицы следует оставлять два пробела. Для облегчения чтения, кроме тех случаев, когда они не расположены на одной линии, можно оставить один пробел. Заголовки категорий должны по возможности коротко описывать затрагиваемые переменные и величины, но всегда они должны быть достаточно полными, для того чтобы сделать ясными значения данных.
Опыт показывает, что ни одна таблица не должна быть включена в текст, если по ней нельзя дать хотя бы страницу пояснений. Эти пояснения не должны просто повторять содержание таблицы. Оно, по сути дела, и так перед читателем. He нужно также перегружать таблицы цифрами или другими количественными терминами, хотя иногда их можно [c.377] использовать. Лучше, если пояснения к таблице будут прояснять взаимосвязи, продемонстрированные в ней, и обратят внимание читателя на основные и не основные выводы. Эти пояснения можно использовать также для того, чтобы прокомментировать результаты каких-либо статистических тестов, выполненных на основе табличных данных (см. гл. 1416). В нашем примере подробные пояснения, возможно, коснутся общего уровня и изменений в голосовании за демократов в рассматриваемый период и относительной роли белых и чернокожих избирателей в этом голосовании. Они могут также коснуться любых замеченных сходств или различий. Особо можно обсудить вопросы об изменчивости или постоянстве, если таковое имеется, в характере вариации переменных, любом отмеченном отклонении в данных и даже надежности источника, из которого были извлечены данные. [c.378]
ЛИНЕЙНАЯ ДИАГРАММА
Иногда хочется избавиться от табличного изображения или заменить его более простым и наглядным графиком. Это может быть сделано как для более ясного изображения (представьте трудности работы с табл. 13.1, если бы она охватывала период с 1876 до 1976 г.), так и для того, чтобы подчеркнуть определенный аспект в имеющихся данных. Существует множество способов для этого, один из самых простых линейная диаграмма, изображенная на рис. 13.1. Линейная диаграмма соединяет все значения одной переменной непрерывной линией и дает возможность сравнения значений разных переменных путем нанесения нескольких аналогичных линий, часто различающихся цветом или манерой изображения. Линейные диаграммы особенно полезны при изображении трендов.
Рис. 13.1. Линейная диаграмма: голосование за демократов и его расовая составляющая, 1960-1976 гг.
Диаграмма на рис. 13.1 отражает те же данные, что и табл. 13.1, но в графической форме. В отличие от таблицы, требующей тщательного чтения, одного взгляда на рис. 13.1 достаточно, чтобы сказать, что между 1960 и 1976 гг. демократам было отдано в общем от 40 до 60% голосов на президентских выборах; что в 1960, 1964 и 1976 гг. за них голосовало больше, чем в 1968 и 1972 гг.; что распределение голосов белых избирателей, голосующих за партию, практически соответствует общему (белые выходили из партии в 1968 и 1972 гг., но вернулись в [c.378] в 1976 г., что поддержка партии среди негров постоянно активнее, чем среди белых, и что поддержка негров держится на высоком уровне независимо от успехов или неудач партии. Некоторые доступные детали табл. 13.1 менее очевидны на рис. 13.1 (например, трудно увидеть разницу между 50% голосов в 1960 г. и 51% в 1976 г.), но в общем анализ данных существенно облегчен.
По сути дела, подобные графики нужно оформлять также, как и таблицы. Каждый рисунок должен иметь свой номер и точный заголовок. Горизонтальная и вертикальная оси, если таковые используются, необходимо обозначить, и нужно проявить большую осторожность и внимание, чтобы удостовериться, что каждая из них правильно и убедительно прошкалирована1. Название вертикальной оси следует помещать над номерами ее градаций, название горизонтальной оси под диаграммой. Если градациями горизонтальной оси являются годы (как в нашем примере), дополнительного названия не нужно. В случае нанесения нескольких линий под диаграммой следует поместить ключ (попунктное описание) к ним. Если необходимо, на самой диаграмме можно поместить добавочный пояснительный текст. [c.379]
Легче всего читать диаграмму, если количество линий сведено к минимуму. Однако иногда бывает полезно поместить данные о нескольких переменных на одной диаграмме. Тогда диаграмму следует сделать как можно больше и, если какие-нибудь из линий пересекаются, придать максимум разнообразия изображенным линиям. Наиболее часто употребляемые способы изображения линий таковы:
[c.380]
СЕКТОРНАЯ ДИАГРАММА И ГИСТОГРАММА
Как перечневая таблица, так и линейная диаграмма хороша преимущественно при описании и суммировании требующейся информации. При небольшом изменении данных, однако, возможно также использование графических способов анализа и интерпретации цифр. Представьте, например, что мы заинтересованы в выявлении относительного влияния чернокожих и белых избирателей н успех кандидатов в президенты от демократической партии. Особенно нас интересует вопрос о том, чья поддержка белых или чернокожих избирателей имеет боль шее влияние на победы демократов и действительно ли (чем много спорили в свое время) чернокожие избиратели привели Джимми Картера в Белый дом в 1976 г. И давай те еще представим (с целью облегчить проблему), что каждой из пяти избирательных кампаний, которые mi рассматриваем, 90% всех избирателей были белыми 10% неграми. На самом деле негры составляют при мерно 10% избирателей, но нормы представительства колеблются от выборов к выборам и, кроме того, некоторую часть электората представляют и другие группы, наиболее значительными из которых являются выходцы из Азии и [c.380] латиноамериканцы. Сочетая эти данные о представительстве со сведениями табл. 13.1, мы можем представить компоненты голосования за демократов на каждых выборах в виде пропорций.
Что касается, например, 1976 г., мы знаем, что 48% белых избирателей голосовали за демократов и что 90% всех голосующих были белыми. Взяв 48% от 90%, мы найдем, что 43,2% всех избирателей были белыми, проголосовавшими за демократов. И точно так же мы знаем, что 83% чернокожих избирателей поддерживали демократов, а 10% всех голосующих были чернокожими. Берем 83% от 10% и находим, что 8,3% избирателей были чернокожие, поддерживающие демократов. Вместе эти цифры составят 51,5% всех избирателей; они проголосовали за демократов в 1976 г.2
Но давайте продолжим наши подсчеты. Мы знаем, что эти чернокожие и белые избиратели составили в 1976 г. 51,5% всех проголосовавших. Каковы же пропорции поддержки, оказанной демократической партии каждой из этих групп? Чтобы узнать это, мы просто разделим каждую цифру на 51,5% (43,2:51,5 и 8,3:51,5) и получим, что в 1976 г. около 84% голосов дали демократам белые и около 16% негры. Подобные подсчеты для каждого из четырех предшествующих выборов показывают, что голоса чернокожих избирателей составили соответственно 13, 15,20 и 23% всех проголосовавших за демократов в 1960, 1964, 1968 и 1972 гг., тогда как белые избиратели составили соответственно 87,85,80 и 77%. Эти цифры могут быть проиллюстрированы секторной диаграммой, так, как это; сделано на рис. 13.2.
Рис. 13.3. Секторная диаграмма: расовая составляющая демократической коалиции, 1960-1976 гг. [c.381]
Секторная диаграмма это такой рисунок, на котором круг (или, как в нашем случае, ряд кругов), представляет собой определенную совокупность и разделен на сегменты, для того чтобы показать долю каждой части. На рис. 13.2 каждый круг представляет 100% проголосовавших за демократов в определенном году, а заштрихованная часть долю голосов чернокожих избирателей.
Обратите внимание, что заголовок и примечания к рисунку выполнены и расположены так же, как на рис. 13.1 и что год проставлен под каждым кругом. Доля, занимаемая каждым сегментом (в процентах), может быть указана как внутри диаграммы, как на рис. 13.2а, так и вне ее, как на рис. 13.2е, смотря что яснее. Буквы алфавита (а, б, в и т.д.) под каждым элементом диаграммы часто облегчают исследователю описание диаграммы в тексте, а читателю восприятие описания.
При взгляде на рис. 13.2 бросается в глаза постоянно увеличивающаяся доля чернокожих избирателей в голосовании за демократов в период между 1960 г. (когда они составили 13% голосовавших за демократов) и 1972 г. (когда они составили 23% или почти вдвое больше) и уменьшение зависимости демократов от чернокожих избирателей в 1976 г. Используя эти цифры (и допустив, что наши данные верны), можно попытаться оспорить ответ на один из поставленных выше вопросов: по сути дела, Джимми Картер не был приведен в кабинет неграми. Напротив, он менее зависел от поддержки негров, чем предыдущий кандидат от его партии. Безусловно, доказательство этого аргумента очевидно уже при самом поверхностном изучении секторных диаграмм. К сожалению, в данном случае секторные диаграммы, хотя и выполнены аккуратно, содержат данные, которые не являются полными и, следовательно, могут ввести в заблуждение. Так получается потому, что количество голосующих за демократов меняется от выборов к выборам (50% в один год, 61% на следующий), тогда как размер кругов на диаграммах независимо от количества представляющий 100% голосующих за демократов остается неизменным. Для того чтобы быть не только точными, но и полными, сами диаграммы должны колебаться в размерах в соответствии с изменениями общего количества голосующих за демократов. [c.382]
Однако визуальная интерпретация секторных диаграмм разных размеров в лучшем случае затруднительна. Люди просто не умеют этого делать. Кроме того, такие диаграммы могут свести на нет эффективное изложение наших исследовательских результатов. Нужно искать другие пути, но, прежде чем мы найдем их, хотелось бы подчеркнуть, что мы отнюдь не думаем, что секторные диаграммы всегда обманчивы и их не следует использовать. Напротив, секторные диаграммы очень полезны, и зачастую они являются наиболее эффективным графическим средством убеждения. Мы просто хотим сказать, что любые формы схем и диаграмм нужно использовать осторожно. Мы должны понимать данные, лежащие в основе графического представления, и мы должны быть уверены, что график отражает данные именно в том аспекте, в котором мы хотим их использовать (т. е. в контексте определенных исследовательских вопросов, например для того, чтобы узнать, была ли доля голосов чернокожих избирателей в демократической коалиции постоянно увеличивающейся, диаграммы на рис. 13.2 совершенно достаточны, поскольку отражают соответствующую информацию). Только в этом случае графические изображения действительно будут существенным вкладом в изучение данных и представление результатов исследования.
Возвращаясь к поставленной проблеме, мы должны найти альтернативное графическое средство, которое покажет долю голосов чернокожих избирателей, отданных за демократов в определенном году, и в то же время учтет изменения общего количества проголосовавших за демократическую партию. Одним из таких средств является столбиковая гистограмма, или, как в нашем случае, сегментная гистограмма, такая, как изображена на рис. 13.3.
Столбиковая гистограмма это графическое изображение, в котором высота и иногда ширина серии столбцов иллюстрируют некоторые наблюдения по одной или нескольким переменным. В сегментной диаграмме каждый отдельный столбец разделен на части, что несет некоторую добавочную информацию о распределениях или свойствах совокупности, представленной самим столбцом. Заметьте еще раз, что формат практически такой же, как на рис. 13.1 и 13.2, только в гистограмме описание обычно располагается не под рисунком, а над ним. (Иногда [c.383] гистограммы располагают не вертикально, как на рис. 13.3, а вертикально на левой части страницы. В таких случаях описание следует помещать либо под рисунком, либо справа.)
Рис. 13.3. Сегментная гистограмма: расовая составляющая демократической коалиции, 1960-1976 гг.
На рис. 13.3 количество голосов чернокожих избирателей опять представлено заштрихованной частью диаграммы. Вместе с тем сами столбцы разнятся в размерах в соответствии с относительным количеством всех голосов, отданных за демократов. Их доля видна как из масштаба оси, нанесенного на левой части страницы, так и из надписей над каждым отдельным столбцом. В результате впечатление, полученное от этого рисунка, значительно отличается от того, которое мы получили от секторной диаграммы, поскольку здесь мы видим, что, хотя количество голосов чернокожих избирателей колебалось, это происходило в относительно узких пределах. Количество же голосов белых избирателей оказалось более подверженным изменениям, увеличиваясь и уменьшаясь в соответствии с успехами партии. Возвращаясь к вопросу нашего исследования чья поддержка (белых или чернокожих избирателей) более значима для демократов, мы теперь можем ответить, что и та и другая, только каждая по-своему. Чернокожие избиратели составляют относительно небольшую, но постоянно ощутимую базу поддержки, которая [c.384] может оказаться решающей в ситуации с почти равным количеством голосов “за” и “против”. Белые избиратели гораздо менее постоянны и надежны, но настолько превосходят количественно, что их поддержка гораздо более важна в достижении по меньшей мере равенства, а иногда и в балансировании на грани победы и поражения в определенных выборах. Другими словами, роль белых зачастую решающая в достижении победы или поражении кандидатов от демократов. Негры практически всегда оказывают поддержку партии, но она не всегда оказывается решающей. Данные, использованные для того, чтобы прийти к этому заключению, по существу, те же, что и на рис. 13.2, но здесь они более полные. В результате выводы, , которые можно сделать по ним, более глубокие и больше нас удовлетворяют.
Некоторые из наиболее распространенных способов штриховки, используемых для секторных диаграмм и секторных гистограмм, показаны на рис. 13.4.
Рис. 13.4. Способы штриховки для секторных диаграмм и гистограмм.
Обычно при графическом оформлении выбирают способ, наилучшим образом иллюстрирующий и проясняющий представленные данные. [c.385]
ДВУСТОРОННЯЯ ГИСТОГРАММА
Еще одним видом графиков, который часто встречается в политологической литературе, является двустороння гистограмма. Двусторонняя гистограмма это расположенный [c.385] в двух направлениях график, используемый для того, чтобы показать колебания сверх или менее какой-то нормы, представленной центральной линией. Две типичные двусторонние гистограммы изображены на рис. 135. На рис. 13.5а центральная линия это среднее (усредненное) количество белых, голосовавших за демократов на президентских выборах в 19601976 гг., выраженное в процентах (46%).
Столбцы представляют колебания вокруг среднего значения на каждых из пяти выборов; при этом столбцы справа от линии обозначают поддержку демократов белыми избирателями со значением выше среднего, а слева ниже среднего. Протяженность столбцов показывает степень отклонения от среднего, цифры обозначают точное значение разницы. Например, среднее значение (46%) плюс отклонение (3%) в 1960 г. вместе составляют 49% проголосовавших “за” в том году, который отмечен в табл. 13.1. Рис. 13-5 представляет схожий анализ голосования чернокожих избирателей, основанный на среднем количестве голосовавших “за” в 84%.
Эти цифры добавляют еще одну грань в анализ данных, представленных в табл. 13.1, и, взятые вместе, они доказывают, что в I960 г. негры представляли довольно серьезную оппозицию партии, чем в более поздний период; что как белые, так и чернокожие избиратели оказали необычно сильную поддержку демократам в 1964 г.; что белые покидали партию в 1968 и 1972 гг., тогда как поддержка чернокожих избирателей была чуть выше среднего, и что уровень голосования обеих [c.386] групп в 1976 г. был приблизительно равен его среднему значению за весь рассматриваемый период. Если добавить эту новую информацию к нашем прежним выводам, то мы получим более полную картину роли белых и чернокожих избирателей в успехах демократической партии в эти годы. В целом можно сказать, что информация, заключенная в двусторонних гистограммах, углубляет и дополняет ту, что можно получить при использовании других графических способов. [c.387]
ТАБЛИЦА ВЗАИМНОЙ СОПРЯЖЕННОСТИ ПРИЗНАКОВ
Еще одна форма табличного изображения данных заслуживает нашего внимания, прежде чем мы перейдем к обсуждению статистических процедур. В самом деле, это, наверное, наиболее распространенная в современных политологических исследованиях форма таблиц; она может служить основой для некоторых статистических расчетов, которые мы обсудим в следующей главе. Эта форма подачи данных известна как таблица взаимной сопряженности признаков (см. табл. 13.2 и 13.3).
Таблица 13.2.
Расовые различия на президентских выборах 1964 г., %
Расовая |
Голосование за кандидата |
|||
от демократов |
от республиканцев |
Всего, |
Число |
|
Белые |
59 |
41 |
100 |
1 350 |
Таблица 13.3
Расовые различия на президентских выборах 1972 г., %
Голосование |
Расовая принадлежность |
||
Белые |
Чернокожие |
Все проголосовавшие |
|
От демократов |
34 |
89 |
40 |
[c.387]
По формату и структуре таблица взаимной сопряженности признаков похожа на перечневую таблицу, о которой говорилось ранее, однако содержание у нее совершенно другое. Таблицы взаимной сопряженности признаков в большей степени основаны на предположениях и построены так, чтобы облегчить изучение взаимосвязей между переменными. Таблица 13.2, например, суммирует взаимосвязь между расовой принадлежностью и голосованием за президента в 1964 г., табл. 13.3 подытоживает те же сведения за 1972 г. В обоих случаях приведены данные гипотетического обследования 1 500 избирателей. Таблицы построены так, чтобы позволить нам изучить гипотезу, что в любом из приведенных годов чернокожие избиратели по той или иной причине чаще голосуют за демократов, чем белые.
Каждый пункт перечисления в таблице (частный или итоговый) называется графой. Каждая из этих таблиц, таким образом, имеет четыре графы. Таблицы могут быть также описаны количеством содержащих в них рядов и колонок, если каждый ряд представляет определенное значение одной переменной, а каждая колонка определенное значение другой, т. е. табл. 13.2 и 13.3 можно считать таблицами 2х2 (два на два), поскольку каждая имеет два ряда и две колонки.
Таблицы сопряженности всегда строятся так, что данные о независимой или объясняющей переменной суммируются. В нашем случае такой переменной является расовая принадлежность. Это значит, что если таблица содержит процентные распределения, то они будут основаны на 100%-ном итоге по независимой переменной. Так, в табл. 13.2 утверждается, что в 1964 г. 59% белых голосовали за демократов, но отнюдь не то, что 59% всех проголосовавших за демократов были белыми. Подсчитать процентные распределения возможно и по другому, но в нашем случае это не имеет никакой информационной ценности, поскольку партийные привязанности неизбежно приобретаются позже, чем расовая принадлежность. В 1-й строке таблицы суммируются процентные распределения для всех (для 100%) белых избирателей, во 2-й строке для всех чернокожих избирателей, и в 3-й строке для всех проголосовавших. Колонка, обозначенная “Число случаев”, суммирует количество респондентов [c.388] нашего гипотетического обследования, которые были отнесены к каждой из групп. Сведения этой колонки определяют частотное распределение (оно будет рассмотрено в следующей главе) и из-за своего расположения в таблице часто называются маргинальными.
Независимая переменная в таблице сопряженности может располагаться как по ряду (см. табл. 13.2), так и по колонке (см. табл. 13.3). Оба способа распространены в научной литературе. Однако, если уж вы выбрали ту или иную форму, важно следовать ей до конца исследования, с тем чтобы не путать читателя.
При изучении таких таблиц, как эти, часто бывает возможно в общих словах сказать, насколько данные подтверждают гипотезу. Так, например, из обеих таблиц 13.2 и 13.3 ясно, что чернокожие избиратели постоянно голосовали более продемократически, чем белые. В 1972 г. чернокожие избиратели отдали большую часть голосов демократам, тогда как белые республиканцам, и даже в 1964 г., когда обе группы голосовали в основном за демократов, чернокожие избиратели составили более надежную их опору, чем белые. Тем не менее эти прикидки “на глазок” в лучшем случае грубы, и, когда, таблицы сложнее, чем эти, состоят из многих граф или имеют не столь прямолинейные результаты, подобные прикидки часто ненадежны. В следующей главе мы рассмотрим некоторые статистические способы, которые помогают более точно установить степень соответствия гипотезы имеющимся данным. [c.389]
НЕКОТОРЫЕ ПРЕДОСТЕРЕЖЕНИЯ
В заключение давайте еще раз отметим три важнейших аспекта использования таблиц и графиков.
Во-первых, они должны быть и наглядны и конструктивны. Как часть самого исследовательского процесса, они могут быть чрезвычайно полезны для наиболее глубокой разработки нашей концепции и для твердого понимания того, что же наши данные говорят нам. Гибкость и способность к новым формам анализа могут значительно помочь в углублении наших знаний о политических событиях, а методики, даже такие простые, как эти, окажут действие в оформлении выводов. [c.389]
Во-вторых, таблицы и графики нужно правильно применять. Даже из этого короткого обзора ясно, что совершенно не исключена возможность ошибочного представления результатов из-за небольшого искажения методики, и точно так же не исключена возможность, что кто-то будет одурачен этим бездумным злоупотреблением. У исследователей существуют моральные обязательства по отношению к другим излагать свои выводы не только точно, но и правдиво и интеллектуальные обязательства по отношению к себе тщательно их проверять. Эти обязательства составляют краеугольный камень исследования. Мы не должны забывать о них.
Наконец, ваша работа не должны быть перегружена таблицами и графиками. Обилие подобного материала забивает текст и ухудшает его восприятие. Авторское решение включить таблицу или диаграмму в текст воспринимается читателем как сигнал к тому, что автор придает особое значение заключенной в них информации. Автор обязан делать выбор, а не просто предлагать читателю “шведский стол” информации. Такая осмотрительность не только повышает ценность работы, но и вынуждает его или ее подумать и решить, что важнее, и, таким образом, вносит дополнительный вклад в работу. [c.390]
Дополнительная литература
Прекрасным руководством по применению таблиц, схем и диаграмм в политологических исследованиях является кн.: Веnsоn О. Political Science Laboratory. Columbus (Oh.): Merrill, 1969, ch. 2,3. Полезная информация о графическом изложении данных содержится в: Spear М.Е. Practical Charting Techniques. N.Y.: McGraw-Hill, 1969; Rogers А.С. Graphic Charts Handbook. Washington (D.C): Public Affairs Press, 1961; Smart L.E., Arnold S. Practical Rules for Grade Presentation of Business Statistics. Columbus (Oh.): Bureau of Business Research, Ohio State University, 1947; Тufte Е.R. The Visual Display of Quantitative Information. Cheshire (Conn.): Grades Press, 1983. Этот же автор в кн.: Envisioning Information. Cheshire, Conn.: Graphics Press, 1994, приводит много примеров использования графических методик для обобщения данных. Об ошибках при графическом отображении информации можно узнать из кн.: Huff D. How to Lie with Statistics. - N.Y.: Norton, 1954.
Одним из лучших примеров использования графических методик можно считать работу: Vегbа S., Niе N. Political Participation in American Political Democracy and Social Equality. N.Y.: Harper and Row 1972.
ПРИМЕЧАНИЯ
1 Неверно или небрежно шкалированная ось может запутать читателя или даже исследователя, преувеличивающего или недооценивающего порядок величин или степень изменений. Конечно, усеченные графики (те, в которые не включены наименьшие значения) или протяженные графики (те, в которых масштаб увеличен для одной группы значений и уменьшен для другой) могут быть умышленно использованы для введения невнимательного читателя в заблуждение. К счастью, использование подобных приемов более характерно для рекламы или комментариев к исследованиям, чем для научной литературы.
2 Цифры мало отличаются от представленных в таблице частично в результате округления, частично потому, что действительное представительство, которое лежит в основе данных табл. 13.1, лишь приближается к 90% и 10%, использованным здесь. Если бы мы взяли действительные данные о представительстве, так же как и частичные процентные сведения таблицы, в сумме они были бы сопоставимы с количеством голосующих за демократов. Очевидно, что особенно наши подсчеты будут отличаться от реальных данных таблицы за 1960 и 1964 гг., когда негры в некоторых районах все еще активно воздерживались от голосования и их представительство было относительно ниже.
14. СТАТИСТИКА I: АНАЛИЗ ОДНОМЕРНЫХ РАСПРЕДЕЛЕНИЙ
Зачастую в политологических исследованиях одни таблицы и графики не дают достаточных сведений о данных для успешного решения исследовательских задач. Иногда это проблема сложности (или слишком много градаций переменных, или слишком большой массив, или задействовано слишком много переменных, для того чтобы данные годились для непосредственного анализа), иногда вопрос точности (степень различий небольших колебаний переменных может оказаться важной, а при оценке таблицы или схемы “на глазок” их бывает трудно уловить). В случаях, подобных нашему, когда нужен более глубокий анализ, ученые прибегают к статистическому анализу.
Статистика с этой точки зрения это количественные значения, которые оценивают распределения градаций или взаимосвязи между переменными. Статистика является своего рода математической стенографией, дающей возможность визуально и с большой точностью оценить, что показывают (а иногда что не показывают) данные. “Каковы политико-философские взгляды типичного студента колледжа? Всегда ли белые избиратели отличаются в своих партийных пристрастиях от негров? Какие действия или ситуации в мировом сообществе вероятнее всего могут привести к возникновению вооруженного конфликта? “Если мы располагаем верными данными для анализа, статистика в состоянии ответить как на эти, так и на многие другие вопросы.
Статистика чрезвычайно сложна. Однако так же верно и то, что многие из основных принципов и приемов статистического анализа необычайно просты, очень быстро запоминаются и могут увести вас в изучении вашего предмета гораздо дальше, чем вы думаете. Фактически если вы изучали алгебру в средней школе, то вы знаете о математике все, что вам понадобится; вы будете удивлены, насколько интуитивно очевидны многие математические выкладки. [c.392]
Следует уточнить, что эта глава и две последующие не научат вас ни всему тому, что можно узнать о статистике, ни даже всему тому, что можно узнать о конкретных статистических методах, которые мы будем обсуждать. Тем не менее к тому моменту, когда вы прочитаете эти главы, вы будете иметь достаточно полное представление о том, что такое статистическая процедура и как ее можно применять (или почему ее нужно применять); у вас также появится некоторое понимание того, что лежит за цифрами и подсчетами; вы сможете относительно легко применять некоторые специальные статистические методы. Все вместе эти навыки позволят вам использовать статистический анализ в своем исследовании и глубже и критичнее воспринимать то, что вы читаете в научных журналах и других политологических исследованиях.
Эту главу мы посвятим изучению статистических методов, которые позволят нам ответить на следующие вопросы о массиве данных: “Как выглядят одномерные распределения? Как выглядит типичная единица массива? Насколько она типична?”
В каждом случае мы рассмотрим различные статистические методы для различных типов измерения номинального, порядкового и интервального. Из гл. 3 вы помните, что эти типы (уровни) отличаются один от другого тем, что первый просто дифференцирует категории, второй ранжирует их, в третьем устанавливается постоянный интервал различий между ними. Иными словами, цифры эминальной, порядковой и интервальной шкал есть различные виды цифр с разными свойствами. Если точнее, цифры номинального измерения мало содержательны, данные не очень много могут сказать нам. Поскольку они лишь разделяют объекты на группы и служат не более чем ярлыками для этих групп, их нельзя складывать или вычитать. Соответственно применить сложные методы статистического анализа к номинальным данным нельзя. (цифры же интервальных шкал гораздо более содержательны и точны, они несут гораздо больше информации о тех данных, которые они представляют. Их можно складывать, вычитать, возводить в квадрат и изменять по-всякому. В результате они дают возможность более гибкого подхода и применения более сложных методов анализа. Именно по этим причинам к разным уровням измерения [c.393] применяются разные методики. И именно по этим причинам, конечно, необходимо применять эти методики правильно. [c.394]
ИЗМЕРЕНИЕ СРЕДНЕЙ ТЕНДЕНЦИИ И ДИСПЕРСИИ
Для описания распределения признаков по значениям одной переменной используют два типа статистических процедур. Первый измерение средней арифметической величины признака помогает нам выявить наиболее типичные значения, одно или несколько, которые наилучшим способом представляют весь комплекс признаков по этой переменной. Вообразите, что нам сказали, будто так называемый средний американец это “синий воротничок”, получивший среднее образование и вместе со своей женой имеющий в среднем 1,7 ребенка. Понятно, что не каждый американец отвечает этим требованиям, но если бросить на американцев этакий общий взгляд, то приведенный набор характеристик может оказаться весьма близким к тому общему впечатлению, которое у нас сложится. Вот именно такое представление об усредненном или типичном случае мы получаем при измерении средней арифметической величины. И именно это измерение было использовано при выявлении наиболее типичных свойств американцев.
Однако, как уже отмечалось, не все американцы обладают такими характеристиками. Многие являются “белыми воротничками”, либо специалистами, либо даже безработными, некоторые закончили только начальную школу, у других более высокое образование, иные имеют 10 или 20 детей, другие же не женаты и детей не имеют. Иными словами, “типичный” американец представляет лишь среднюю тенденцию внутри совокупности, но не отражает точно каждый отдельный признак. Ну, а поскольку такой типичный признак найден, мы вправе задать вопросы:
“Насколько это типично? Насколько правильно эти усредненные признаки отражают распределение свойств всех единиц массива по данной переменной?” Мы ответим на них, если используем другой тип статистических расчетов дисперсию. Измеряя дисперсию, мы узнаем, как колеблется (варьирует) отклонение от того среднего значения, которое мы нашли, в каких случаях можно быть уверенным, что наше среднее значимо, и не является ли отклонение [c.394] настолько большим, что наиболее типичный признак на самом деле не является репрезентативным для всей совокупности.
В связи с этим возникает важная проблема, которую дует обсудить, прежде чем двигаться куда-либо дальше. Статистика это могучее средство анализа; она можно сказать о наших данных гораздо больше, чем можно выявить любым другим путем. Но сама по себе статистика бездумна. Можно произвести любые статистические счеты на любом массиве данных и, казалось бы, выжать из данных все до последней капли. Однако многие из этих “результатов” по двум причинам могут оказаться бессмысленными. Первую причину мы уже обсуждали, логика ее станет яснее по мере дальнейшего продвижения. Говоря проще, уровень сложности анализа может превосходить уровень сложности, заложенный в данных. Если выбранный нами метод требует сложить две цифры, а данные основаны на номинальной шкале, для которой неприемлема сама концепция сложения, то вообще-то механически можно сложить значения двух кодов, однако результат этого окажется бесполезным. Так, если код 1 представляет рабочих “синих воротничков”, код 2 “белых воротничков”, а 3 специалистов, то мы, конечно, можем к ому прибавить два и получить три, но неужели мы действительно будем утверждать, что один рабочий “синий воротничок” плюс один рабочий “белый воротничок” равны одному специалисту? Конечно, нет.
Другая причина, по которой результаты статистические расчетов могут оказаться незначимыми, это то, что одна статистика сама по себе часто не может представить всю картину целиком. Если единственный наиболее типичный уровень образования американцев это средняя школа, но только 25% всего населения достигли этого уровня и остановились на нем, то насколько много в действительности может сказать нам это среднее значение? Не так уж много. И много ли вы знаете людей, которые действительно имеют 1,7 ребенка? Таким образом, хотя мы можем точно подсчитать и представить эти цифры, нельзя останавливаться только на них. Каждое измерение средней арифметической должно быть взвешено или оценено сопутствующим измерением дисперсии. И еще (мы обсудим это позже): всегда, когда мы имеем дело с [c.395] расчетами, каждое измерение взаимосвязей между двумя переменными следует сопровождать измерением статистической значимости, т.е. следует обозначить, насколько точно найденные величины представляют существенные связи между данными переменными. Таким образом, статистические расчеты должны не только соответствовать уровню измерений данных, но и быть существенно значимыми, если мы хотим получить от них максимум пользы.
Любое измерение средней тенденции и дисперсии основано на общей оценке градаций переменных и единиц массива, которая называется частотным распределением. Частотное распределение это упорядоченный подсчет количества признаков по каждому значению какой-либо переменной. Представьте, например, что мы задали 100 респондентам вопрос об их занятии в настоящее время и затем распределили их ответы по типам. Тогда частотное распределение для переменной “тип занятий” может выглядеть так, как это показано в табл. 14.1.
Таблица 14.1.
Частотное распределение: типы занятий респондентов
Код |
Значение |
Число случаев |
1 |
“Синие воротнички” |
25 |
В частотном распределении исследователь просто перечисляет все значения переменной и показывает, сколько имеется случаев каждого значения. Та же самая информация может быть представлена в виде гистограммы, как показано на рис. 14.1. Используя эту информацию, можно выделить наиболее типичный случай и определить его репрезентативность. [c.396]
Рис. 14.1. Гистограмма: тип занятий респондентов
ИЗМЕРЕНИЯ ДЛЯ НОМИНАЛЬНЫХ ПЕРЕМЕННЫХ
Как мы уже отмечали, для различных уровней измерений подходят различные способы исчислений средней тенденции и дисперсии. Поскольку “тип занятий” номинальная переменная, давайте начнем изучение этих [c.396] исчислений с рассмотрения статистических процедур, подходящих для номинального уровня измерения. На этом уровне, где цифры просто обозначают категории безотносительно к порядку их расположения, единственно возможный способ измерения средней тенденции это исчисление моды. Мода это просто наиболее часто встречающееся значение признака, т.е. то значение, которое наиболее часто может встречаться в серии зарегистрированных наблюдений. В нашем случае это первая категория, или градация “синие воротнички”. Можно назвать их как модой, так и модальной категорией. (Распределенное, в котором две категории имеются с наибольшим количеством случаев, называется распределением с двумя модами, или бимодальным, возможно также распределение с большим количеством таких категорий.) Таким образом, занятие уровня “синих воротничков” являются наиболее типичными в нашем примере из 100 человек.
Однако ясно, что большинство людей в этом примере (фактически ровно75%) не являются рабочими “синими воротничками”, т.е., даже если мы выделим наиболее типичное значение в данном распределении, информация эта не обязательно полностью верно отражает картину. [c.397] Более точно об этом можно судить, если подсчитать точное значение дисперсии для номинального уровня измерений, или коэффициент вариации, формула которого выглядит следующим образом:
или
,
где Σfнемодальное сумма всех случаев, не входящих в модальную категорию;
fмодальное количество случаев в модальной категории;
N общее число случаев.
По сути дела, этот коэффициент дает нам процентную долю всех признаков, которые не входят в модальную категорию. В нашем примере
,
или, по упрощенной формуле
Значение коэффициента вариации колеблется между 0 (когда все случаи принимают одно и то же значение) и 11/N (когда каждый случай имеет свое значение). В общем, чем меньше коэффициент вариации, тем типичнее, или значимее (верно отражает картину), мода. В случае бимодального или многомодального распределения произвольно выбирается одно модальное значение в зависимости от целей подсчетов, и v определяется так, как указано выше. [c.398]
ИЗМЕРЕНИЯ ДЛЯ ПОРЯДКОВЫХ ПЕРЕМЕННЫХ
Когда мы имеем дело с данными порядкового уровня, у нас несколько больше информации, поскольку коды представляют не только категоризацию, но и относительные позиции, или ранжирование. Выбор способа измерения средней тенденции и дисперсии должен как отражать этот факт, так и использовать его возможности. Наиболее подходящий способ измерения средней тенденции для порядковых данных медиана. Медиана это просто [c.398] значение среднего признака в упорядоченном ряду, признака, до и после которого находится равное количество признаков. Вычисление медианы, таким образом, требует лишь того, чтобы отсчитать с обоих концов частотного распределения равное количество признаков, до тех пор пока не доберемся до срединного, и определить затем его значение. Там, где имеется нечетное количество признаков, можно определить единственный срединный признак (например, для 99 признаков 50-я от любого конца частотного распределения единица будет иметь 49 единиц как до, так и после себя). Значение этого признака и будет медианой. Если же N (количество единиц) четное число, появятся две срединных единицы (например, для 100 единиц 50-я и 51-я вместе составят середину распределения). Если обе эти единицы имеют одно и то же значение, оно и будет медианой. Если у них разные значения, медианой будет среднее арифметическое между ними. Поясним на примере. Давайте рассмотрим распределение уровней образования по трем массивам данных (см. табл. 14.2).
Таблица 14.2.
Уровни образования по трем массивам
Код |
Значение |
Массив 1 |
Массив 2 |
Массив 3 |
1 |
Начальная школа |
25 |
25 |
10 |
В первом массиве выделяется один срединный случай (50-й с обоих концов), определяется его значение и выясняется, таким образом, что медианный уровень образования 3, или “законченное среднее”. Во втором массиве выделяется два срединных случая (50-й и 51-й с обоих концов), определяется, что каждый принимает одно и то же значение и выясняется, что медиана опять 3. В третьем [c.399] же массиве срединные случаи включают две категории “незаконченное среднее” и “законченное среднее”. Здесь медианой является среднее арифметическое между этими величинами, т.е. (2+3)/2=2,5. Поскольку дробные значения не имеют смысла в порядковом измерении, эта цифра просто говорит нам, что середина распределения лежит примерно между 2 и 3.
Любой из нескольких способов измерения дисперсии для порядковых переменных, называемый квантильным рангом, показывает, насколько плотно различные значения группируются вокруг медианы, или опять насколько типична или репрезентативна медиана для распределения в целом. Квантиль это мера положения внутри распределения. Например, персентиль делит совокупность на 100 равных частей так, что первый персентиль это такая точка или значение в этой совокупности (считая от меньшего значения вверх), ниже которой находится 1% всех случаев, второй персентиль такая точка или значение, ниже которой находятся 2% всех признаков, и т. д. Или, используя более знакомый пример, будущий студент колледжа, достигший 85-го персентиля в тесте на эрудицию, дошел до уровня более высокого, чем уровни 85% всех, кто проходил тест. Точно так же дециль делит совокупность на десятки (например, третий дециль это точка, ниже которой находятся 30% случаев), квантиль на пятые доли, квартиль на четвертые. Любой из них может быть использован для определения дисперсии вокруг медианы, хотя децильные и квантильные ранги наиболее часто встречаются в литературе.
Давайте проиллюстрируем эту процедуру на примере квантильных рангов. Квантильный ранг (q) определяется следующим образом:
q = q4 q1,
где q4 четвертый квантиль (значение, ниже которого находится 4/5, или 80% всех признаков);
q1 первый квантиль (значение, ниже которого находится 1/5 или 20% всех признаков).
Чем меньше степень разброса величин между этими двумя точками совокупности, тем плотнее сгруппированы случаи вокруг медианы и тем точнее представляет медиана всю совокупность. В массиве 2 табл. 14.2, например, [c.400] где N=100, можно подсчитать q, определив 81 признак (ниже которого расположено 80% признаков) и 21 признак (ниже которого расположены 20% признаков), начиная наш счет внутри частотного распределения с наименьших значений. Затем мы вычитаем значение 21-го признака из значения 81-го (q=q4q1=41=3) и получаем квантильный ранг. В массиве 3 подобные вычисления выделяют квантильный ранг, равный единице (q=32=1), показывающий при сравнении, что это распределение лучше представлено своей медианой, равной 2,5, чем второй массив своей медианой, равной 3. Внимательное изучение этих двух частотных распределений подтвердит обоснованность нашего вывода.
Одна из трудностей интерпретации квантильных рангов состоит в том, что они чрезвычайно чувствительны к изменениям в количестве градаций самой переменной. Чем больше градаций, тем вероятнее большой разброс. Поэтому квантильные ранги не всегда поддаются интерпретации в случаях сравнений переменных с разным количеством градаций. Для переменных же с примерно равным количеством градаций для построчного или постолбцового сравнения значений одной переменной или для какого-либо абсолютного измерения разброса вокруг медианы они вполне подходят. [c.401]
ИЗМЕРЕНИЯ ДЛЯ ИНТЕРВАЛЬНЫХ ПЕРЕМЕННЫХ
Интервальные данные, безусловно, предоставляют нам наиболее полную информацию, включая категоризацию, ранжирование и установление интервалов. Интервальные значения могут быть подвержены любым арифметическим манипуляциям. Следовательно, приступая к исчислению средней тенденции и дисперсии для интервальных данных, мы можем и должны принять эту информацию о дополнительных возможностях во внимание.
Главной единицей для интервальных данных является среднее геометрическое, определяющее место средней точки в распределении с позиций как количества признаков от каждого конца распределения до этой точки, так и расстояние между ней и каждым признаком. Среднее геометрическое распределения это то, что многие люди обычно связывают с термином “среднее арифметическое”. [c.401]
Давайте проиллюстрируем нахождение среднего геометрического на примере рис. 14.2. Если все признаки распределения имеют равные веса, и если они расположены на оси на равных интервалах так, что признаки с предельными значениями наиболее удалены от средней точки в том или ином направлении, а случаи с равными значениями расположены на равноудаленных точках оси, то точка среднего геометрического будет расположена в центре оси, где сумма значений и интервалов одной стороны уравновешивается суммой значений и интервалов другой. Как ясно из рисунка, и веса (количество признаков) и интервалы (крайние значения) важны для определения среднего геометрического.
Среднее геометрическое распределения, обозначаемое , вычисляется по следующей формуле:
,
где Xi значение каждого отдельного случая;
N количество случаев;
знак суммы всех отдельных случаев от 1 до N.
Обратите внимание, что в подсчете используются сложение и деление, два арифметических действия, произведенные с самими значениями (что принципиально отлично от просто количества случаев с данным значением) с подсчетом как всех значений, так и интервалов. Это и есть те манипуляционные возможности, которые отличают интервальные данные от данных более низких уровней измерения.
Заметьте, однако, еще, что, как видно из рис. 14.2г, именно потому, что среднее геометрическое чувствительно к величине интервалов, оно зависит от кренов в распределении, которые вызываются наличием одного или нескольких предельных признаков. Иными словами, небольшое количество случаев с предельными значениями может сделать значение среднего геометрического меньше или больше, чем реально репрезентативное. Давайте посмотрим, как это может получиться. [c.402]
Возьмем группу из 11 человек, 10 из которых зарабатывают 10.000 долларов в год, а один 1 млн. Значение среднего геометрического дохода для этой группы 100.000 долларов.
Но 10 из 11 членов группы зарабатывают, по сути дела, десятую часть этого количества. Таким образом, среднее геометрическое, хотя и точно подсчитанное, тем не менее не так репрезентативно, как, скажем, медиана, которая в другом случае равна 10.000 долларов. Вообще говоря, статистические процедуры с меньшими возможностями (предназначенные для более низких уровней измерения) всегда можно использовать в анализе данных, и, хотя они теряют некоторую информацию (например, расстояние до предельного значения, как здесь), иногда с их помощью можно получить более значимые результаты. Поспешим отметить, однако, что обратное неверно; статистические процедуры с высоким уровнем возможностей не имеют ни малейшей ценности для шкал низких уровней.
Наиболее часто употребляемый способ измерения дисперсии для интервальных данных, стандартное отклонение, из всех видов статистических процедур, которые мы используем, вероятно, один из интереснейших. На первый взгляд может показаться, что если мы хотим определить, насколько по отношению к распределению в целом типично среднее геометрическое, то все, что нужно сделать, это измерить расстояние от его точки до каждого случая, сложить их и разделить на количество случаев N. Иными словами, мы подсчитаем среднее геометрическое расстояний вокруг среднего геометрического распределения по формуле:
Чем больше дисперсия для данного распределения, тем менее типично среднее геометрическое, и, чем меньше дисперсия, тем более типично среднее геометрическое. [c.403]
Но если мы попробуем сделать все это на примере, скажем, рис. 14.2в, возникнут некоторые проблемы. Применив формулу к этому случаю, мы получим:
Даже в случае распределения с таким сильным отклонением, как в примере с доходами, мы получим:
И в любом случае среднего геометрического для любого распределения результат будет тот же. Причина проста. Мы, по сути дела, определили среднее геометрическое как такую точку, где все веса и интервалы уравновешены, точку или значение, относительно которых все остальное сбалансировано. Следовательно, при подсчете среднего геометрического вряд ли стоит удивляться, что мы получим [c.404] как раз то, что предполагалось. Тем не менее искушение измерить дисперсию путем измерения близости признаков к или удаления их от среднего геометрического сохраняет свою притягательность. Введем понятие стандартного отклонения.
Стандартное отклонение (s) является тем математическим инструментом, который может помочь выполнить вашу задачу. По сути дела, это процедура, которая сводит на нет свойства разнонаправленных интервалов уравновешивать друг друга путем простого возведения в квадрат утих интервалов (и избавляясь таким образом от отрицательных значений), измерения разброса квадратов интервалов вокруг среднего геометрического и затем извлечения из результата квадратного корня, с тем чтобы вернуться к начальным единицам интервалов. Формула, по которой все это вычисляется, напоминает прежнюю, акромe возведения в квадрат и извлечения квадратного корня. Формула эта такова:
где Xi значение каждого отдельного случая;
среднее геометрическое;
N количество случаев;
знак суммы всех отдельных случаев от 1 до N.
Таким образом, для примера на рис. 14.2в
Она выражена в тех же единицах, что и исходные данные. Если переменные измеряются в одних и тех же или единицах, то стандартное отклонение может основой для выяснения репрезентативности средних геометрических; чем больше стандартное отклонение, ее репрезентативно среднее геометрическое. Но если единицы принципиально отличны или если анализируется одна переменная, интерпретация стандартного отклонения уже не столь проста.
Существует одно исключение из этого: переменные, чье [c.405] распределение близко к нормальному, т.е. такие, у которых существует единственная мода в самом центре распределения, а частоты симметрично убывают по направлениям к предельным значениям (графическое изображение нормального распределения, с которым вы, наверно, хорошо знакомы, это просто колоколообразная кривая). Известно (из рассуждений, которые не входят в рамки нашего разговора), что в таких случаях 68,3% всех случаев лежат в пределах одного стандартного отклонения, от среднего геометрического (± s), 95,5% в пределах двух стандартных отклонений от среднего геометрического (± 2s) и 99,7% в пределах трех стандартных отклонений от среднего геометрического ( ± 3s). Фактически в случае таких распределений мы для любой точки можем определить, на сколько стандартных отклонений ниже или выше среднего геометрического она находится, и затем использовать эту информацию для выяснения относительного положения двух признаков в одной переменной или, наоборот, относительного значения двух переменных для одного и того же признака. Позволяет это сделать нам стандартная оценка, (z), которая вычисляется по следующей формуле:
Представьте, что мы располагаем данными, например, по затратам на образование на душу населения в каждом штате, количеству работающих преподавателей на 1000 студентов в каждом штате и количеству награжденных выпускников средней школы на 100.000 населения в каждом штате в определенном году и что значения этих переменных по штатам распределяются по кривой, близкой к нормальной. Представьте затем, что мы хотим использовать эти данные для изучения политики в области образования в Аризоне и Виргинии. Мы сначала подсчитаем среднее геометрическое () и стандартное отклонение (s) для каждой переменной по всем 50 штатам, затем определим соответствующие стандартные оценки (z) для каждой переменной по двум нужным нам штатам. Результатом будут два набора значений в стандартных единицах (уже не в долларах, количестве учителей и документов, а в количестве стандартных отклонений от среднего [c.406] геометрического), которые могут быть использованы для определения индексов политики в области образования, для выяснения относительной позиции Аризоны и Виргинии среди других штатов или для стандартизации при необходимости cравнения принципиально отличных измерений. Таким образом, при использовании стандартного подсчета стандартное отклонение может оказаться очень полезным. [c.407]
ЗАКЛЮЧЕНИЕ
В этой главе мы остановились на статистических процедурах, которые описывают распределения в рамках одной переменной. Поскольку эта статистика характеризует отдельные переменные, ее часто называют одномерной. Мы видели, что различные одномерные статистические процедуры подходят для переменных различного уровня измерений номинального, порядкового и интервального. В следующей главе мы рассмотрим двумерную статистику, т.е. такую, которая включает взаимосвязи двух переменных. [c.407]
Дополнительная литература
Если вы захотите глубже изучить статистику, см. литературу к гл. 16. Сейчас же будет полезнее начать с книг, которые облегчат применение диагностики и помогут овладеть некоторыми основными ее принципами. Мы предлагаем классическую и, вместе с тем, веселую кн.: Darrel H. How to Lie with Statistics. N.Y.: Norton, 1954. Даррел определяет статистику как “статистикуляцию”. Гораздо более полное и легко читающееся издание по статистике: Schutte J.G. Everything You Always Wanted to Know About Elementary Statistics (but were afraid to Englewood Cliffs (NJ.): Prentice-Hall, 1977. [c.407]
15. СТАТИСТИКА II: ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ МЕЖДУ ДВУМЯ ПЕРЕМЕННЫМИ
Чаще всего в политологических исследованиях мы заинтересованы в изучении распределений по одной переменной меньше, чем в определении того, взаимосвязаны ли две или более переменных и если да, то каким образом и насколько тесно. Именно эти двумерные (относящиеся к двум переменным) и многомерные (относящиеся к более чем двум переменным) взаимосвязи обычно проливают свет на самые интересные исследовательские вопросы.
Обычно при изучении взаимосвязей между двумя переменными встает три важнейших вопроса; вы, должно быть, помните о них из гл. 1. Первый заключается в том, влияют ли и до какой степени изменения значений одной переменной обычно независимой переменной на изменения значений другой зависимой переменной. Второй вопрос касается формы и направления любой связи, которая может существовать. Третий рассматривает возможность того, что любая взаимосвязь, существующая между признаками, которые представляют выборку из более крупной совокупности, действительно является характеристикой этой совокупности, а не просто артефактом меньшей и потенциально нерепрезентативной выборки. В этой главе мы познакомимся со статистическими приемами, которые чаще всего используются при ответах на эти вопросы, и объясним, когда правомерно их использование. [c.408]
ИЗМЕРЕНИЕ СВЯЗИ И СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ
В том случае, если знание значений одной переменной по определенному случаю позволяет сделать некоторые предположения относительно соответствующих значений другой переменной, между этими переменными существует связь 1. Если, например, мы исследуем взаимосвязь между численностью населения какой-либо страны и долей взрослых, получивших высшее образование (принимая во внимание, что мы располагаем такими данными), то возможны три вывода: (1) более крупные страны [c.408] обычно имеют большую долю взрослых, получивших высшее образование, чем менее крупные; (2) малые страны обычно имеют большую долю взрослых, получивших высшее образование, чем более крупные, и (3) систематических различий нет; некоторые страны из обеих групп имеют относительно высокую долю таких людей, а другие тоже из обеих групп относительно низкую. Если исследование покажет, что верен случай 1 или случай 2, то мы можем использовать знание значений независимой переменной количество населения, для того чтобы примерно представить или предсказать значения зависимой переменной доля взрослых, получивших высшее образование для любой из взятых стран. В первом случае для густонаселенных стран можно предсказать и относительно высокую долю взрослых с высшим образованием, а для малонаселенных стран более низкую их долю. Во втором случае наши предположения будут прямо противоположны. В обоих случаях, хотя мы можем и не угадать каждый случай точно, мы будем чаще всего правы, поскольку между этими переменными существует связь. И конечно, чем теснее связь между двумя переменными, тем более вероятно, что наши догадки в каждом отдельном случае будут верны. Если существует полная зависимость значений одной переменной от значений другой, т. е. высокие значения одной переменной вызывают высокие значения другой или, наоборот, высокие значения одной вызывают низкие значения другой, мы можем вывести одну из другой с довольно большой степенью точности. Все это в корне отличается от третьего случая, который не позволяет с достаточной долей точности предугадать значения переменной образование, основываясь на знании количества населения. Если признаки по двум переменным распределяются, по сути дела, произвольно, то считается, что эти переменные не имеют связи.
Чтобы понять, как же выглядит эта самая “сильная связь”, рассмотрим две схематические карты, изображенные на рис. 15.5. (см. с. 434-435), которые представляют уровень убийств в Вашингтоне в 1988 г. На схеме 15.5а указаны известные рынки, производящие торговлю наркотиками в столице. На схеме 15.5б показаны места, где происходили убийства. Обе схемы отражают данные, полученные в городской полиции. Легко заметить, что [c.409] сосредоточение точек, обозначающих места продажи наркотиков и убийств, практически одинаково, и таким образом выявляется связь между двумя этими феноменами.
Понятно, что между переменными может существовать более или менее сильная связь. Естественно, возникает вопрос, насколько сильна эта связь. На помощь приходит статистика. Из статистики возьмем показатель, который называется коэффициентом связи. Коэффициент связи это показатель, который обозначает степень возможности определения значений одной переменной для любого случая, базируясь на значении другой. В нашем примере этот коэффициент может показать, насколько знание количества населения страны поможет в определении доли взрослых, получивших высшее образование. Чем больше коэффициент, тем сильнее связь и, следовательно, выше наши возможности прогноза. Вообще коэффициент колеблется в переделах от 0 до 1 или от 1 до 1, где значения, близкие к единице, обозначают относительно сильную связь, а значения, близкие к 0, относительно слабую. Как было в случае с одномерной статистикой и по тем же причинам, каждый уровень измерения требует своего типа исчислений, и поэтому каждый из них требует своего способа измерения связи.
В дополнение к величине связи полезно также знать направление или форму взаимоотношений между двумя переменными. Еще раз обратите внимание на вышеприведенный пример, особенно на варианты 1 и 2. Мы уже предположили, что, чем теснее связаны признаки, тем больше будет коэффициент связи и тем выше шансы угадать долю взрослых с высшим образованием на основании знаний о количестве населения в данной стране. Очевидно, однако, что наши прогнозы относительно каждого случая будут совершенно противоположны. В первом случае большие значения одной переменной вероятнее всего связаны с большими значениями другой, тогда как во втором случае большие значения одной переменной вероятнее всего связаны с меньшими значениями другой. Такие связи называются связями, имеющими разное направление. А такой тип связей, как в первом случае, когда обе переменные возрастают и убывают одновременно, называется прямой, или положительной, связью. Тип связей второго случая, когда значения постоянно изменяются в [c.410] разных направлениях, называется обратной, или отрицательной, связью. Эта добавочная информация о знаке (плюс или минус) перед коэффициентом связи способна сделать наши предположения более эффективными. Таким образом, коэффициент, равный 0,87 (отрицательный и близкий к единице), может описывать относительно сильную взаимосвязь, в которой значения двух данных переменных обратно связаны (изменяются в разных направлениях), коэффициент же, равный 0,10 (положительный знак “плюс” обычно опускают и близкий скорее к 0), может описывать слабую прямую связь.
Для всех случаев понятие направления или формы имеет разный смысл для разных уровней измерения. На номинальном уровне, где цифры играют роль просто обозначений, концепция направления вообще не имеет смысла и, соответственно, номинальные коэффициенты связи не изменяют знака. Все они положительны и просто показывают силу связи. На интервальном же уровне, наоборот, знаки могут не только изменяться, но и иметь достаточно сложную геометрическую интерпретацию. Проверка на связь на этом уровне измерений обладает очень высокими прогностическими способностями, причем знак коэффициента является в этом случае ключевым элементом.
Наконец, несколько слов о проверке статистической значимости, хотя обсуждение этого сюжета будет сознательно ограничено2. Если мы делаем предположительно репрезентативную выборку некоторого определенного размера и используем эту выборку для формулирования каких-то выводов о той генеральной совокупности, из которой она была сделана, мы несколько рискуем получить неверные выводы. Это так, потому что существует вероятность, что выборка, по сути дела, нерепрезентативна и что в действительности ошибка измерений превышает уровень, допустимый для выборки данного размера (см. табл. А.2 и А.3 в приложении А). Вероятность подобных неверных обобщений в принципе известна, однако в каждом отдельном случае мы не всегда можем сказать, имеются они или нет. Для доверительного уровня 0,95 вероятность этого составит 0,05 или 1 0,95, для доверительного уровня 0,99 0,01. Эти величины 0,05 и 0,01 или 5% и 1% свидетельствуют о том, что любое обобщение, [c.411] сделанное по выборке и относящееся к генеральной совокупности, даже подпадающее под подсчитанный уровень ошибки выборки, просто-напросто неверно.
Проверки на статистическую значимость играют ту же роль для оценки измерений связи. Они определяют, насколько вероятна связь, зафиксированная между двумя признаками в выборке. Давайте попробуем пояснить этот пункт.
Продолжая наш пример, представьте, что у нас есть совокупность из 200 стран, для которых доподлинно известно, что коэффициент связи между количеством населения и долей взрослых, получивших высшее образование, равен 0, т. е. в реальности такой связи нет. Представьте далее, что в силу тех или иных причин мы считаем необходимым взять выборку только в 30 стран и подсчитать для них связь между этими двумя переменными. Он также может оказаться равным 0, но в действительности это маловероятно, поскольку сила связи теперь зависит не от всех 200 стран, а только от 30 и, возможно, будет отражать их характерные особенности. Другими словами, величина коэффициента предопределена тем, какие именно 30 стран мы выберем. Если случайно мы выберем те 30 стран, которые действительно репрезентативны относительно всех 200, связь не обнаружится. Но тот же случай может привести нас к тому, что мы выберем такие 30 стран, для которых связь между количеством населения и уровнем образования необычайно высока, скажем 0,60. В этом случае наш подсчитанный со всей тщательностью коэффициент будет характеризовать данную выборку, но, если мы распространим эту характеристику на генеральную совокупность, наши выводы будут неверны. Зная это, конечно, необходимо отвергнуть измерение связи на основании именно этой выборки.
Проблема заключается в том, что в действительности мы не знаем глубинные параметры совокупности, например истинную степень связи признаков в ней. Безусловно, причина, по которой мы вынуждены прибегать к выборкам, прежде всего в том, что мы просто не в состоянии изучать совокупности в целом. А отсюда в свою очередь следует, что чаще всего мы будем иметь в распоряжении только те проверки связей, которые основаны на выборках. Более того, эти подсчеты будут основаны только на одной выборке. Тогда встает вопрос, насколько можно [c.412] быть уверенным в том, что проверка связей, основанная на единственной подгруппе генеральной совокупности, точно отражает глубинные характеристики этой совокупности. Задача проверки на статистическую значимость и заключается в том, чтобы дать цифровое выражение этой уверенности, измерить возможность или вероятность того, что мы делаем верные, или, наоборот, неверные обобщения.
Для того чтобы увидеть, как все это работает, давайте продолжим наш пример. Представьте, что мы сделали не одну выборку в 30 стран из всей совокупности в 200 стран, а 100 или даже 1000 отдельных и независимых выборок равного размера и что для каждой подсчитан коэффициент связи. Поскольку верный для всей совокупности коэффициент, по сути, равен 0, большинство коэффициентов в наших 100 или 1000 выборках тоже будут равны 0 или близки к этому. Они ведь, кроме всего прочего, основаны на измерении характеристик одних и тех же стран в конце концов. Некоторые комбинации из 30 стран могут показать относительно высокие значения (это если нам случайно удастся выбрать те страны, где эти переменные связаны по типу высоких или низких связей), но большинство будет близким к параметрам всей совокупности. Безусловно, чем ближе к истинному значению коэффициента, тем большее количество выборок будет его иметь. Эти распределения, по сути дела, будут всегда располагаться по нормальной кривой, которую мы упомянули ранее. Это показано на рис. 15.1, где высота кривой в любой точке представляет количество выборок, для которых коэффициент связи имеет значение, отмеченное на оси ординат.
Рис. 15.1. Кривая нормального распределения для коэффициента для выборки из 30 случаев.
Какова же тогда вероятность того, что любое значение коэффициента это просто случайное отклонение от истинного нулевого параметра? Или, другими словами, если мы возьмем выборку из какой-нибудь совокупности и выявим в этой выборке устойчивую связь, но при. этом нам не будут с определенностью известны соответствующие характеристики всей совокупности, каковы шансы того, что мы ошибемся, перенося такую сильную связь с выборки на всю совокупность? Нормальная кривая имеет некоторые особенности, которые мы не будем здесь обсуждать, не позволяющие нам ответить на этот вопрос с достаточной точностью. [c.413]
Представьте, к примеру, что мы сделали из генеральной совокупности в 200 стран выборку в 30 стран, для которых коэффициент связи равен 0,75, а глубинных параметров мы не знаем. Насколько вероятно, что соответствующий коэффициент для всей совокупности будет равен 0? Исходя из рис. 15.1, ответ должен звучать: не очень. Часть плоскости, заключенная под графиком, представляет все 100 или 1000 (собственно, любое количество) коэффициентов, при этом истинный коэффициент равен 0. Меньшая ее часть левее значения 0,75 представляет долю таких коэффициентов, которые отрицательны по направлению и более или равны 0,75 по значению. Эти случаи составляют очень маленькую часть от всех коэффициентов выборок. По этой причине шансы того, что при любой попытке сформировать выборку мы сделаем именно такую выборку, очень малы. Если в этой области лежит, например, 5% всех выборок, то только один раз из 20 может случиться так, что из всей совокупности с истинным коэффициентом, равным 0, мы сделаем выборку с коэффициентом 0,75. Тем не менее в данном случае мы имеем именно такую выборку. Другими словами, мы сделали выборку с такими характеристиками, которые имеют 5%-ную вероятность быть ошибочным отражением совокупности, где две рассматриваемые переменные не связаны друг с другом. Таким образом, если на основании этой выборки мы сделали вывод, что на самом деле эти две [c.414] переменные связаны друг с другом в генеральной совокупности (т.е. если мы интерполировали результаты, полученные на основании выборки), то следует ожидать, что на 5% мы не правы. Конечно, это же значит, что на 95% мы правы, а это неплохие шансы. И конечно, уровни статистической значимости в 0,05 (5%-ная вероятность ошибок), 0,01 (1%-ная вероятность ошибок) и 0,001 (0,1 от 1%-ной вероятности ошибок) это общепринятые стандарты в политологических исследованиях.
Если мы опять взглянем на рис. 15.1, станет ясно, что более экстремальные значения, такие, как 0,75, реже способны дать заметную ошибку при обобщениях, чем те, которые расположены ближе к центру (например, гораздо большая доля выборок из этой группы покажет коэффициенты, равные и превышающие 0,50 и т. д.). В конце концов может показаться, что никогда нельзя быть уверенным в правильности утверждения о наличии слабых связей, поскольку никогда нельзя устранить достаточно большую вероятность того, что они просто случайно появились в совокупности с истинным нулевым коэффициентом. Однако вполне возможно решить эту проблему простым увеличением размеров выборки. Если вместо 30 признаков мы включим в выборку 100 или 150, мы не только будем располагать меньшим количеством выборок для начала расчетов, но и при наличии истинного коэффициента они вероятнее всего будут располагаться вокруг нулевого значения. По сути дела, нормальная кривая будет постоянно стремиться к сжатию в середине, как изображено на рис. 15.2, пока не придет в конце концов к единственно возможному варианту истинному параметру. [c.415]
Рис. 15.2. Распределение выборки разного размера при генеральной совокупности, равной 200 случаям
По ходу дела все меньше и меньше предельных значений будут располагаться по краям кривой, пока наконец при достаточно больших выборках даже коэффициенты связи со значением 0,10 или 0,01 не покажут приемлемый уровень статистической значимости. Теперь мы можем сделать вывод, что определенные сочетания достаточно экстремальных значений и достаточно больших выборок позволяют нам уменьшить до допустимого уровня вероятность неверных обобщений по нашим данным.
Однако не всегда коэффициенты связи распределяются нормально и не все проверки статистической значимости производятся по такой же логической схеме. Но в большинстве случаев принцип тот же, и если вы поняли его, то вы поймете как необходимость, так и пользу измерения статистической значимости.
В этой главе мы также кратко обсудим наиболее распространенные способы измерения связи и значимости для каждого из трех уровней измерений. При этом если процедуры, необходимые для подсчета каждого из трех измерений будут различными, то цель в каждом случае, так же как и интерпретация результатов, окажется примерно одинаковой, поскольку любой вид коэффициента связи призван показать нам, до какой степени наши предположения относительно значений одной переменной могут определяться знанием значений (имеется в виду по тем же случаям) другой, а каждая проверка значимости говорит о том, насколько вероятно (возможно), что любые наблюдающиеся в выборке связи возникают вследствие выборочных процедур, а не являются отражением истинного положения дел в генеральной совокупности. Нигде эти двойные функции не становятся более очевидными, как в статистических измерениях базового типа номинальных.
Примеры, иллюстрирующие эту статистику, подразумевают сравнение переменных, которые используются на одном уровне измерения. Однако исследователи часто хотят найти соотношения между переменными, находящимися на разных уровнях измерения (таких, как одноуровневая независимая переменная, например, социоэкономический статус и зависимая номинальная переменная партийная принадлежность). Чтобы выбрать правильную статистику для этого случая, вам необходимо придерживаться простого правила: использовать статистику, разработанную для низшего уровня измерений, не игнорируя [c.416] при этом данные для измерений высококачественного уровня. Вполне законно вы можете применять статистику для номинальных признаков с одноуровневыми данными, но совершенно невозможно использовать одноуровневую статистику для номинальных измерений. Это означает, что, когда вы проводите сравнение переменных, которые измеряются на разных уровнях, вы должны так выбирать статистический критерий, чтобы он соответствовал нижнему из двух уровней. [c.417]
ИЗМЕРЕНИЕ СВЯЗИ И ЗНАЧИМОСТИ ДЛЯ НОМИНАЛЬНЫХ ПЕРЕМЕННЫХ
Широко используемым коэффициентом связи для номинальных переменных, из которых одна считается зависимой, а другая независимой, является λ (лямбда)3. Лямбда измеряет процентную долю того, насколько возможно угадывание значений зависимой переменной на основе знаний независимой переменной, если обе переменные представлены категориями, не содержащими ранга, интервала или направления.
Представьте, например, что мы определяем партийную принадлежность 100 респондентов и выясняем, что частотное распределение выглядит следующим образом:
|
Демократы |
50 |
|
Представьте также, что мы хотим установить партийную принадлежность каждого отдельного респондента и сделать подобные предположения для всех лиц и что мы хотим при этом совершить минимум ошибок. Наиболее очевидный путь определить моду (самую распространенную категорию); мы предполагаем, что это будут демократы. Мы окажемся правы в 50 случаях (для 50 демократов) и не правы в 50 случаях (для 30 республиканцев и 1 независимых); это не просто стоящее внимания замечание, но самое лучшее, что мы можем сделать, поскольку ни мы выберем республиканцев, то окажемся не правы 170 случаях, а если выберем независимых, то это приведет к 80 неверным предположениям. Таким образом, данная [c.417] мода обеспечивает наилучший уровень предположений для имеющейся в распоряжении информации.
Но мы можем располагать еще одним набором данных, партийной принадлежности отца каждого респондента, представленным следующим распределением:
|
Демократы |
60 |
|
Если эти две переменные связаны друг с другом, т. е. если каждый отдельный респондент вероятнее всего принадлежит к той же партии, что и ее (или его) отец, то знание партийных предпочтений отца каждого респондента может помочь нам в определении партийных предпочтений самих респондентов. Это будет так в том случае, если, определяя для каждого респондента не моду всего распределения, как мы делали прежде, а просто партийную принадлежность его (или ее) отца, мы сможем снизить количество неверных предположений до уровня более низкого, чем 50 неверно определенных нами случаев.
Чтобы это проверить, нужно построить таблицу сопряженности, подытоживающую распределение признаков по этим двум переменным. В табл. 15.1 независимая, или определяющая, переменная (партийная принадлежность отца) дана по рядам, ее итоговое распределение находится в правой части таблицы. Зависимая переменная (партийная принадлежность респондента) расположена по колонкам, и ее итоговое распределение находится в низу таблицы. Значения в таблице даны произвольно, и в действительности они, конечно, должны пересчитываться самим исследователем.
Таблица 15.1.
Определение партийности на основании партийной принадлежности отца (1)
Партийность отца |
Партийность респондента |
|||
Демократ |
Республиканец |
Независимый |
Всего |
|
Демократ |
45 |
5 |
10 |
60 |
[c.418]
По этой таблице мы можем партийные предпочтения родителей использовать для определения партийных предпочтений респондентов. Для этого мы, как и раньше, определим моду, но только внутри каждой категории независимой переменной, а не по всему набору признаков. Таким образом, получится, что для тех респондентов, чьи отцы зафиксированы как демократы, мы прослеживаем предпочтение той же партии. Мы будем правы 45 раз и не правы 15 (для 5 республиканцев и 10 независимых). Для тех, чьи отцы зафиксированы республиканцами, мы предполагаем принадлежность к республиканской партии, при этом в 23 случаях мы окажемся правы и в 7 не правы. Тех, чьи отцы зафиксированы независимыми, отнесем к независимым и будем правы в 5 из 10 случаев. Сравнив эти результаты, увидим, что теперь мы в состоянии верно предположить 73 раза и все еще ошибаемся 27 раз. Иными словами, наличие второй переменной существенно улучшило наши шансы. Для того чтобы точно определить процентную долю этого улучшения, используем общую формулу коэффициента связи.
В приведенном примере это выглядит так:
Используя партийную принадлежность отца в качестве определителя партийной принадлежности респондента, мы можем улучшить (ограничить количество ошибок) наши предположения примерно на 46%.
Формула подсчета λ, которая приведет нас к тем же результатам, хотя и несколько другим путем, такова:
,
[c.419]
где fi максимальная частота внутри каждой категории или градации независимой переменной;
Fd максимальная частота в итоговых распределениях зависимой переменной;
N количество признаков.
Лямбда изменяется в пределах от 0 до 1, где высшие (близкие к 1) значения обозначают сильную связь. Поскольку номинальные переменные не имеют направления, λ всегда будет положительной.
Следующий наш шаг определить, чем вызваны взаимосвязи, выраженные λ, истинными параметрами совокупности или просто случаем, т.е. мы должны определить, являются ли эти взаимосвязи статистически значимыми.
Для номинальных переменных тест на статистическую значимость проводится путем подсчета критерия χ2 (хи-квадрат). Этот коэффициент говорит нам о том, насколько вероятно, что номинальный тип связей, который мы только что наблюдали, является результатом случая. Это делается путем сравнения тех результатов, которые мы реально имеем, с теми, которые ожидаются тогда, когда между переменными нет никакой связи. Подсчет χ2 также начинается с таблицы взаимной сопряженности признаков, хотя и несколько отличающейся от табл. 15.1. Рассмотрим табл. 15.2.
Таблица 15.2.
Определение партийности на основании партийной принадлежности отца (2)
Партийность отца |
Партийность респондента |
|||
Демократ |
Республиканец |
Независимый |
Всего |
|
Демократ |
|
|
|
60 |
Эта таблица напоминает табл. 15.1 тем, что категории переменных те же самые, но табл. 15.2 не содержит никаких распределений в своих графах. Определение χ2 начинается с того, что мы задаем себе вопрос: какое значение мы ожидаем в каждой графе при [c.420] имеющихся итоговых распределениях, если между переменными нет связи? Для 60 респондентов, чьи отцы были демократами, например, мы можем ожидать, что половина (50/100) будут демократами, около трети (30/100) будут республиканцами и один из 5 (20/100) независимым, или, другими словами, 30 демократов, 18 республиканцев и 12 независимых.
Точно так же мы можем прикинуть ожидаемые значения для тех, у кого отцы были республиканцами или независимыми. Эти ожидаемые значения собраны в табл. 15.3.
Таблица 15.3.
Определение партийности на основании партийной принадлежности отца (3)
Партийность отца |
Партийность респондента |
|||
Демократ |
Республиканец |
Независимый |
Всего |
|
Демократ |
30 |
18 |
12 |
60 |
Тогда встает вопрос: действительно ли значения табл. 15.1 настолько отличаются от тех значений, которые можно предположить в табл. 15.3, что мы можем быть решительно уверены в надежности наших результатов? Хи-квадрат и является тем инструментом, который посредством сравнения двух таблиц даст ответ на наш вопрос. Уравнение для χ2 выглядит следующим образом:
,
где f0 частота, наблюдаемая в каждой графе (см. табл. 15.1);
fe частота, ожидаемая в каждой графе (см. табл. 15.3).
Подсчитывается χ2 путем внесения значений в каждую графу табл. 15.4. [c.421]
Таблица 15.4.
Значения, используемые для получения χ2
f0 |
fe |
f0 fe |
(f0 fe)2 |
(f0 fe)2 |
45 |
30 |
15 |
225 |
7,5 |
Порядок граф таблицы не имеет значения, но f0 из табл. 15.1 и fe из табл. 15.3 в каждой определенной строке должны относиться к одному и тому же случаю. Причина того, что разность между f0 и fe сначала возводится в квадрат и лишь потом делится на fe, та же, что в случае колебаний вокруг среднего геометрического при определении стандартного отклонения. Хи-квадрат определяется путем сложения всех цифр в последней колонке. В нашем примере он получает значение 56,07.
Прежде чем мы интерпретируем эту цифру, нам необходимо сделать еще одно вычисление подсчитать так называемые степени свободы (degrees of freedom df). Степени свободы в таблице это количество ячеек таблицы, которые могут быть заполнены цифрами, прежде чем содержание всех остальных ячеек станет фиксированным и постоянным. Формула для определения степеней свободы в любой определенной таблице такова:
df = (r 1) (c 1),
где r = количество категорий переменной в ряду;
с = количество категорий переменной в колонке.
Например, df = (3 1) (3 1) = 4.
Теперь мы готовы оценить статистическую значимость наших данных. Таблица А.4 в приложении содержит [c.422] значимые величины χ2 для различных степеней свободы на уровнях 0,001; 0,01; 0,05. Если значение χ2, которое мы подсчитали (56,07), превышает то, что указано в таблице на любом из этих уровней для таблицы с определенными степенями свободы (4), то можно сказать, что те взаимосвязи, которые мы наблюдали, на данном уровне статистически значимы. В настоящем случае, например, для того чтобы связь была значимой на уровне 0,001 (т.е. если мы допускаем, что наблюдаемая связь отражает характеристики всей совокупности, то мы рискуем ошибиться один раз из 1000), наблюдаемый χ2 должен превышать 18,467. Если это так, то мы можем быть абсолютно уверены в своих результатах. [c.423]
ИЗМЕРЕНИЕ СВЯЗИ И ЗНАЧИМОСТИ ДЛЯ ПОРЯДКОВЫХ ПЕРЕМЕННЫХ
Для порядковых переменных чаще всего используется коэффициент связи G, или гамма, работающий по тому же принципу ограничения ошибки, что и λ , но особо ценный тем, что он не просто определяет количество признаков в той или иной категории, а ранжирует их, т.е. выясняет их относительную позицию. Вопрос, решаемый с помощью G, состоит в том, какова степень, до которой ранжирование случаев одной порядковой переменной может быть определено при условии знания рангов случаев другой порядковой переменной.
Когда мы анализируем две подобные переменные, то возможны два случая зависимости. Первый, при котором случаи ранжируются в одном и том же порядке в обеих переменных (большие значения с большими, меньшие не меньшими), называется полное согласие. Второй, в котором случаи расположены в прямо противоположном порядке (большие значения одной переменной связаны с меньшими значениями другой и наоборот), называется полная инверсия. Тогда возможность предсказания (т.е.степень связи между двумя переменными) будет следствием того, насколько тесно ранги одной переменной связаны с рангами другой либо по типу “полное соответствие” (если G положительна и приближается к единице), либо но типу “полная инверсия” (если G отрицательна и приближается к 1). Значение коэффициента G, равное 0, [c.423] свидетельствует об отсутствии связи. Формула для исчисления G такова:
где fа = частота соответствий в ранжировании двух переменных;
fi = частота инверсий в ранжировании двух переменных.
G основана на относительном расположении набора случаев по двум переменным. Случаи сначала располагаются в восходящем порядке по независимой переменной. Затем это сравнивается с порядком расположения по зависимой переменной. Считается, что те переменные, для которых заданный порядок сохраняется, находятся в соответствии, а те, для которых этот порядок меняется на противоположный, связаны по типу инверсии. Недостаток места не позволяет нам рассмотреть эти процедуры детально или обсудить способы подсчета G для вариантов, когда количество признаков мало и/или между рангами не встречается одинаковых значений (параллелей). Лучше мы подробнее остановимся на процедурах, необходимых для подсчета G для более распространенных условий: когда есть параллели (более одного признака с одним и тем же рангом), а само количество признаков достаточно велико4.
Здесь, как и ранее, следует обратиться к таблице взаимной сопряженности признаков, такой, какой является табл. 15.5.
Таблица 15.5.
Обобщенная таблица взаимной сопряженности признаков
Значения независимой переменной |
Значения зависимой переменной |
||
низкие |
средние |
высокие |
|
Низкие |
a |
f |
c |
Для того чтобы измерить связь между этими двумя переменными, необходимо определить количество соответствий и инверсий, относящихся к каждой ячейке таблицы. [c.424] Соответствия расположены во всех ячейках под (по направлению к более высоким значениям независимой переменной) и справа (по направлению к более высоким значениям зависимой переменной) от любой определенной ячейки. Так, соответствия относительно случаев ячейки о включают все случаи в ячейках e, f, h и i, поскольку эти случаи имеют более высокие ранги, чем случаи ячейки a по обеим переменным. Инверсии расположены во всех ячейках под (по направлению к более высоким значениям независимой переменной) и слева (по направлению к более низким значениям зависимой переменной) от любой определенной ячейки. Так, инверсии относительно случаев ячейки с включают все случаи в ячейках d, е, g и h поскольку это случаи более высоких по сравнению с ячейкой с значений по одной переменной и более низких по другой. Частота соответствий (fа в уравнении), таким образом, для каждой ячейки есть сумма всех случаев по каждой ячейке, умноженных на количество случаев во всех ячейках ниже и справа (a[e+f+h+i]+b[f+i]+e[i]). Частота инверсий (fi в уравнении) это сумма всех случаев по каждой ячейке, умноженная на количество случаев во всех ячейках ниже и слева (b[d+g]+c[d+e+g+h]+f[g+h]). Полученные значения просто подставляются в уравнение.
fa = 45(23+5+2+5)+5(5+5)+2(2+5)+23(5) = 1575+50+14+115 = 1754
fi = 5(2+3)+10(2+23+3+2)+23(3)+5(3+2) = 25+300+69+25 = 419
Эта цифра говорит о том, что во взаимном расположении двух переменных на 61% больше соответствий, чем несоответствий. Если fi превышает fа, G будет иметь отрицательный знак, что означает наличие инверсионного типа взаимосвязей.
Проверка статистической значимости коэффициента основана на том факте, что распределение G в выборке из совокупности, где нет значимых связей, приближается к нормальному, так же как распределение гипотетического коэффициента в выборке, которую мы обсуждали раньше. Если это так, то мы можем проверить, не является ли [c.425] любое конкретное значение G следствием случайности, путем вычисления его стандартной оценки (z), определения ее расположения под нормальной кривой и оценки таким образом этой возможности. Целиком подсчет zG (стандартной оценки гаммы) здесь не будет представлен, поскольку формула сложна и ее понимание требует более детального знания статистики по сравнению с уровнем нашей книги. Некоторые сведения о формуле можно найти в книге Фримана (см. прим. 1), и ее подсчет предусмотрен такими пакетами прикладных программ, как SPSS. Достаточно сказать, что когда G превышает ±1645 (когда G удалена от медианы на 1645 единиц стандартного отклонения), G достаточна, чтобы иметь доверительный уровень в 0,05, а если zg превышает ±2326 (когда G удалена от медианы в том или ином направлении на 2326 единиц стандартного отклонения), G достигает значимости на уровне 0,01. Интерпретация этих результатов та же, что в приведенном выше, более общем примере. [c.426]
ИЗМЕРЕНИЕ СВЯЗИ И ЗНАЧИМОСТИ ДЛЯ ИНТЕРВАЛЬНЫХ ПЕРЕМЕННЫХ
Измерение связи между двумя интервальными переменными осуществляется посредством корреляции произведения моментов Пирсона (r), известной также как коэффициент корреляции. Этот коэффициент описывает силу и направление связей, используя те же принципы, что и ранее, относительное ограничение ошибки в предположениях о значениях одной переменной на основе данных о значениях другой, хотя способ, которым это делается, равно как и тип данных, для которых предназначен этот коэффициент, гораздо более сложен, чем все другие, обсуждавшиеся нами ранее. Здесь в отличие от использования среднего геометрического зависимой переменной (обозначаемой Y) для подсчета значений отдельных признаков используется ее геометрическая взаимосвязь с зависимой переменной (обозначаемой обычно X). Если точнее, мы основное внимание уделяем той помощи, которую может оказать уравнение линейной зависимости в определении значений Y на основе сведений о соответствующих значениях X.
Подсчет r начинается с изучения диаграммы рассеяния, графического изображения распределения случаев [c.426] по двум переменным, где горизонтальная линия, или ось X, шкалирована в единицах независимой переменной, а вертикальная линия, или ось У, шкалирована в единицах зависимой переменной и каждая точка представляет расположение одного случая относительно обеих переменных. Такая диаграмма представлена на рис. 15.3, где независимая переменная это возраст, зависимая переменная количество законченных лет обучения, а количество случаев равно 25. Так, заключенная в кружок точка представляет следующий случай: человек 30 лет, проучившийся 10 лет. На рисунке цифры взяты произвольно, но в практической работе значения должны определяться самим исследователем.
Рис. 15.3. Диаграмма рассеяния, показывающая взаимосвязь между возрастом и количеством лет обучения
Следующий шаг провести через это множество точек прямую, которая называется линией регрессии, так, чтобы ни одна другая линия не смогла бы пройти ближе ко всем точкам (и хотя, как мы увидим, такие линии не определяют, просто глядя на картинку, ясно, что из всех прямых на рисунке а, b и с прямая b наиболее близка к такой линии). Такая наиболее подходящая линия для двух взаимоувязанных переменных аналогична среднему геометрическому в одномерных описательных статистиках. Точно так же геометрическое представляет наиболее типичный случай в частотном распределении, линия регрессии представляет наиболее типичную связь между двумя переменными. Точно так же, как мы могли [c.427] использовать среднее геометрическое для определения значений переменной при отсутствии дополнительной информации, мы можем использовать линию регрессии для определения значений одной переменной на основании сведений о значениях другой. Если, например, нам известно значение X для данного случая, мы можем провести вертикаль от этой точки на оси до пересечения с линией регрессии, затем горизонтальную линию до пересечения с осью Y. Точка пересечения с осью Y и даст предполагаемое значение Y.
Но точно так же, как среднегеометрическое может быть единственным наиболее типичным значением, но не очень хорошо при этом отражать распределение в целом, так и линия регрессии может наилучшим образом обобщать взаимозависимость двух переменных, но не быть при этом очень полезным обобщением. И соответственно так же, как мы используем стандартное отклонение (s) в качестве меры дисперсии или близости к среднему геометрическому, мы используем коэффициент корреляции, или более полно соответствующий требованиям интерпретации этот коэффициент, возведенный в квадрат (r2), в качестве меры близости различных точек, обозначающих наши данные, к линии регрессии. По сути дела, это мера того, насколько типично отражает эта линия обобщенное распределение значений по двум переменным. В тех случаях, когда все точки лежат точно на этой линии, как на рис. 15.4а и 15.4д, она наилучшим образом описывает взаимосвязь между двумя переменными. Если точки в целом сгруппированы в направлении, обозначенном линией, но не лежат точно на ней, как на рис. 15.4б и 15.4г, то линия представляет взаимосвязи между этими переменными лишь приблизительно. И если, как на [c.428] рис. 15.4в, не существует линии, которая расположена ближе к точкам, чем любая другая, между переменными не существует связи5.
Рис. 15.4. Линии регрессии при различных значениях r
Проблема, таким образом, имеет двойственный характер: во-первых, как выглядит эта наиболее подходящая линия? И во-вторых, насколько точно она отражает данные?
Вы, должно быть, помните из курса алгебры, что любая прямая имеет формулу:
Yi = a + bXi,
где а значение Y при Х= 0,
b коэффициент наклона прямой,
Х соответствующее значение независимой переменной.
Линия регрессии (обычно обозначается Y, чтобы показать, что это лишь приблизительное отражение истинного распределения) это просто набор предполагаемых значений, выраженных в такой форме, которая является наилучшей для значения Y, основанных на знании значений X.
По причинам, которые мы здесь не будем обсуждать, коэффициент наклона прямой всегда будет выражаться формулой:
,
где Хi и Yi соответствующие значения независимой и зависимой переменных для случая i, a и соответствующие средние геометрические. Заметьте, что коэффициент b основан на разбросе отдельных случаев вокруг двух средних геометрических (т. е. на [Xi ] и [Yi ]). Применив эту формулу и используя схему, подобную той, которую мы применяли при подсчетах χ2, мы сможем определить угол наклона для любых взаимосвязей между двумя интервальными переменными. Этот способ показан в табл. 15.6 на примере данных использованных в рис. 15.3. Для этих данных= 37,08 и = 12,88. Подставив эти значения в уравнение, получим:
[c.429]
Таблица 15.6.
Значения, используемые для вычислений по уравнению регрессионной прямой
Хi |
(Хi ) |
(Хi )2 |
Yi |
(Yi ) |
(Хi)(Yi) |
30 |
7,08 |
50,13 |
10 |
2,88 |
20,39 |
При линейной зависимости, т. е. такой, которая может быть представлена прямой линией, любое определенное изменение независимой переменной всегда вызывает определенное изменение значений зависимой переменной У. Более того, при таких зависимостях норма изменения постоянна, т. е. независимо от конкретных значений X и Y каждое изменение Х на единицу вызовет некоторое определенное изменение Y, размер которого определен степенью наклона линии регрессии. Зависимости, при которых небольшие изменения Х вызывают относительно [c.430] большие изменения Y, изображаются линиями, имеющими сравнительно крутой наклон (b1). Зависимости, при которых большие изменения X вызывают меньшие изменения Y, изображаются прямыми с относительно пологим наклоном (b). Зависимости, при которых изменение Х на единицу вызывает изменение Y на единицу, изображаются прямыми, для которых b=1. Прямые, направленные вверх слева направо, как на рис. 15.4а и 15.4б, имеют положительный наклон и представляют зависимости, в которых увеличение Х вызывает увеличение Y. Прямые, направленные вниз слева направо, как на рис. 15.4г и 15.4д, имеют отрицательный наклон и представляют зависимости, в которых увеличение X вызывает уменьшение Y. Ясно, что угол наклона прямой это просто норма изменения переменной Y на единицу изменения переменной X, т.е. в нашем примере, где b=0,12, линия регрессии будет направлена вниз слева направо и, если обе переменные изображены в одном масштабе, будет относительно пологой.
Для того чтобы прийти к формуле, которую мы использовали для подсчета наклона линии регрессии, нам необходимо принять, что линия проходит через пересечение средних геометрических переменных и Y. Это разумное допущение, поскольку средние геометрические представляют основную тенденцию этих переменных и поскольку мы, в сущности, ищем обобщенную или объединенную тенденцию. Если оба геометрических средних нам известны, а значение b определено, мы легко может найти значение а (точки, в которой линия регрессии пересекает ось Y) и решить уравнение. Общее уравнение регрессии таково:
Y= a + bXi,
а в точке, где линия регрессии проходит через пересечение двух средних геометрических, оно принимает вид:
= a + bХ.
Из этого следует, что
a = b
Поскольку теперь мы знаем все нужные значения, мы можем определить, что [c.431]
а = 12,88(0,12)(37,08)= 12,88+4,45= 17,33.
Таким образом, уравнение регрессии, наилучшим образом подытоживающее распределение линии для данных, представленных на рис. 18.3, будет выглядеть так:
Y = 17,330,12Х.
Используя это уравнение, мы можем вычислить значение Y для любого конкретного значения.
Поскольку это уравнение решено, мы можем использовать коэффициент корреляции (r) для оценки репрезентативности линии регрессии. Формула rXY (коэффициента корреляции между X и Y) такова:
,
где Х каждое значение независимой переменной (знак i применялся ранее для большей наглядности);
Y каждое значение зависимой переменной;
N количество признаков.
Хотя это утверждение, безусловно, не так уж очевидно, а его алгебраическое доказательство лежит за рамками нашей книги, эта рабочая формула получена из сравнения первичной ошибки в предполагаемых значениях Y с использованием среднего геометрического частотного распределения с реальной ошибкой, получившейся в результате определения значений Y с использованием Y' (уравнения линии регрессии). Таким образом, процедура подсчета r аналогична той, которая использовалась для подсчета как l, так и G. Наилучшим образом ее дополнит построение таблицы такого типа, с которой мы уже знакомы; в ее колонках расположены значения X, Y, XY, X2 и Y2. Суммы, которые и нужны в уравнении, расположены в графе итого. Так, для данных, представленных на рис. 15.3, для которых мы уже определили линию регрессии, такой схемой будет табл. 15.7. [c.432]
Таблица 15.7
Значения, используемые при определении коэффициента корреляции (r)
х |
у |
ху |
х2 |
у2 |
30 |
10 |
300 |
900 |
100 |
Мы подставляем итоговые значения в уравнение:
Это говорит нам о том, что наклон у линии регрессии отрицательный (что мы уже, собственно, знали) и что точки [c.433] группируются вокруг нее в ступени от слабой до умеренной (поскольку г изменяется в пределах от +1 до 1 с минимальной связью при r=0).
К сожалению, сам коэффициент r интерпретировать нелегко. Можно, однако, интерпретировать r2 как степень уменьшения ошибки в определении Y на основании значений X, т. е. доля значений Y, которые определяются (или могут быть объяснены) на основе Х. r2 обычно представляют как процентную долю объясненных значений, тогда как (1 r2) долю необьясненных значений. Так, в нашем примере r значением 0,38 означает, что для тех случаев, которые мы анализируем, разброс независимой переменной составляет (0,38)2, или около 14%, значений зависимой переменной год обучения.
По причинам, которые находятся за рамками настоящего разговора, определить статистическую значимость г можно только в том случае, если обе и зависимая и независимая переменные нормально распределены. Это можно сделать, используя табл. А.5 в Приложении А, для чего нужны следующие сведения. Во-первых, сам коэффициент г, который, конечно, известен. Во-вторых, аналогично подсчету χ2 количество степеней свободы линии регрессии. Поскольку прямую определяют любые две точки (в нашем случае пресечение и первая точка, и пересечение с осью Y вторая), все другие точки, обозначающие данные, могут располагаться произвольно, так что df всегда будет равно (N2), где N количество случаев или признаков. Таким образом, для того чтобы воспользоваться таблицей, нужно определить примерное количество степеней свободы (в нашем примере N2 = 252 = 23) и желательный уровень значимости (например, 0,05) так же, как мы делали для нахождения χ2, определить пороговое значение r, необходимое для достижения данного уровня значимости, и все подсчитать. (В нашем примере это значит, что мы интерполируем значения в таблице между df=20 и df=25. Для df=23 это будут следующие значения: 0,3379; 0,3976; 0,5069; 0,6194 соответственно.) Таким образом, r=0,38 статистически значим на уровне 0,10 (он превышает 0,3379), но не на уровне 0,05 (он не превышает 0,3976). Интерпретация этого результата та же, что и в других случаях измерения статистической значимости. [c.436]
ЗАКЛЮЧЕНИЕ
В этой главе мы познакомили вас с наиболее распространенными статистическими процедурами, которые используются при изучении взаимосвязей между двумя переменными. Как и в гл. 14, мы выяснили, что для разных уровней измерения анализируемых данных подходят разные способы вычисления связи и статистической значимости. Вместе с методами, представленными ранее, рассмотренные коэффициенты снабдят исследователя некоторыми очень полезными основополагающими способами получения научных результатов. В следующей главе мы обратимся к более сложным статистическим методикам, которые обогатят наши возможности анализа и понимание того, что мы изучаем. [c.437]
Дополнительная литература
Библиографию по статистике см. к гл. 16.
ПРИМЕЧАНИЯ
1 Об определении этого понятия см.: Freeman L.C. Elementary Applied Statistics: For Students in Behavioral Science N.Y.: Wiley, 1965.
2 Полное объяснение статистической значимости требует гораздо более пространного изложения, чем мы можем позволить себе здесь. Читателю можем посоветовать обратиться к одному из изданий по статистике, перечисленных в списке дополнительной литературы к гл. 16. Наш разговор, по сути дела, будет ограничен тем, что такое ошибка первого порядка, не принимая во внимание так называемую нулевую гипотезу (гипотезу, предполагающую, что между двумя переменными не существует никакой связи).
3 Собственно, коэффициент, который мы здесь описываем, это λ или λa (ассиметричная), измерение, которое проверяет наличие связи только в одном направлении (от независимой переменной к зависимой). Тест на проверку истинной λ связи тоже возможен (см.: Freeman, p. 7176).
4 В таких условиях λ может быть ненадежна, но мы включили этот сюжет для того, чтобы облегчить понимание концепции связи в целом. Соответствующий коэффициент коэффициент Кендалла может быть более надежен, но его определение более сложная процедура для начинающих статистиков.
5 Из всего этого, таким образом, следует, что единственный тип связи, который измеряется коэффициентом r, это линейная (прямолинейная) связь. Существуют и другие статистические приемы, позволяющие измерить более сложные типы взаимосвязей (например, криволинейную связь); можно также преобразовать интервальные данные в порядковые категории и прийти, таким образом, к более простым типам взаимосвязей.
16. СТАТИСТИКА III: ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ МЕЖДУ НЕСКОЛЬКИМИ ПЕРЕМЕННЫМИ
Одномерный и двумерный статистический анализ, описанный в предыдущих главах, часто бывают совершенно необходим для понимания объекта, который мы изучаем. Однако одномерный и двумерный анализ почти никогда не обеспечивает убедительной проверки гипотез или теорий, из которых они были извлечены. Для того чтобы проверить какую-либо гипотезу, необходимо исключить главную альтернативную конкурирующую гипотезу. И хотя четко поставленные исследовательские задачи иногда позволяют нам не принимать во внимание альтернативную гипотезу, обычно предпочитают проверять справедливость конкурирующей гипотезы, опираясь на анализ данных, а не на постановку задач исследования. А это требует многомерного анализа, т.е. одновременного анализа взаимосвязей между тремя и более переменными. [c.438]
АНАЛИЗ ТАБЛИЦ
Многие из статистических методов, уже описанных нами, могут применяться в многомерном анализе1.
Для иллюстрации мы можем использовать очень упрощенный пример и предложить метод, которым таблицы корреляции и бипараметрическая статистика могут быть адаптированы для проведения многомерного статистического анализа. Предположим, что мы хотим исследовать, какая связь существует между политическим мировоззрением и получением образования в колледже. Мы можем , предположить, что обучение в колледже дает людям некую опору для поддержания статус-кво и подготавливает их к относительно хорошему функционированию в рамках существующей социоэкономической системы. Тогда возможно мы начнем с гипотезы, что те, кто окончил колледж, будут более консервативны, чем те, кто не имел такой возможности. Чтобы проверить эту гипотезу, нам надо протестировать выборку из 50 респондентов, окончивших колледж и еще 50 таковых, в колледже не учившихся. [c.438]
Таблица 16.1.
Соотношение между получением образования в колледже и политическим мировоззрением
Образование |
Мировоззрение |
||
Либералы (%) |
Консерваторы (%) |
Общее число респондентов |
|
Получили |
40 (20) |
60 (30) |
(50) |
Наши гипотетические результаты представлены в табл. 16.1. Диагональное “распределение” случаев в этой таблице показывает, что можно более или менее характеризовать как консерваторов прежде всего тех, кто учился в колледже. Подсчитав критерий “хи-квадрат” для этой таблицы, мы выясним, что отношения между посещением колледжа и политическим мировоззрением статистически значимы на уровне 0,01. Все это совпадает с нашей первоначальной гипотезой.
Тем не менее, прежде чем мы рискнем представлять полученные данные в American Political Science Review, нам необходимо проверить некоторые альтернативные конкурирующие гипотезы, чтобы удостовериться, что наши результаты обоснованны. Сделать это можно несколькими способами. Один из них это расширить наш бипараметрический анализ до многомерного анализа, который позволит нам “проконтролировать” влияние других переменных на отношение между получением образования в колледже и мировоззрением. Например, одна альтернативная конкурирующая гипотеза, достойная изучения, вытекает из наблюдения, что мужчины обычно более консервативны, чем женщины. Если в нашей выборке больше мужчин, чем женщин, то результат, представленный в табл. 16.1 может отражать различия мнений по половому признаку, а не действительное влияние образования на политические мнения.
Чтобы исследовать эту возможность, мы можем проверить отношения между образованием и воззрениями отдельно для мужчин и женщин. Тогда мы построим две табл. сопряженности 16.2 и 16.3. Если альтернативная конкурирующая гипотеза обоснованна, то статистические отношения между этими признаками, показанные в [c.439] табл. 16.1, не будут показаны в новых таблицах, так как влияние “мужского” или “женского” начала будет исключено. Такой процесс поддержки постоянного влияния третьей переменной на отношения между двумя другими переменными отсылает нас к процедуре контролирования и является важным шагом во всех формах многомерного анализа.
В нашем случае табл. 16.2 и 16.3 на самом деле показывают, что отношения между получением образования в колледже и мировоззрением по существу одинаковы и для мужчин и для женщин. Хотя женщины в нашей выборке, как и было предсказано, не так консервативны, как мужчины, “распределение” в этих двух таблицах практически одинаково, и вычисление “хи-квадрат” критерия для каждой из них показывает, что те отношения, которые они представляют, статистически значимы. В такой ситуации исследователи говорят, что первоначально предположенные отношения “проконтролированы” и что альтернативная конкурирующая гипотеза как объяснение первоначальных данных может быть “исключена”. Если отношения достаточно хорошо выдерживают такое контролирование, они принимаются как обоснованные. Важно помнить, что мы могли бы найти такой пример, когда отношения, представленные в табл. 16.1, стали бы статистически незначимыми, и тогда мы создали бы отдельные таблицы сопряженности для мужчин и женщин. В таком случае исследователь может сказать, что первоначально предложенные отношения не прошли процедуры контроля и что альтернативная конкурирующая гипотеза не может быть исключена.
Таким образом, мы провели простейший многомерный анализ, используя технику, предназначенную для бипараметрического анализа. Мы можем продолжить эту логическую цепочку и оценить другие альтернативные конкурирующие гипотезы, применив для контролирования две или более дополнительные переменные одновременно. Чтобы проиллюстрировать это, в качестве альтернативной конкурирующей гипотезы предположим, что расовые различия между белыми и небелыми (и с точки зрения политического уровня, и с точки зрения вероятности посещения колледжа) несомненно формируют указанные в табл. 16.1 отношения между посещением колледжа и мировоззрением. Чтобы одновременно проверить влияние расовых различий и различий по половому [c.440] признаку на указанные отношения, мы должны будем составить четыре таблицы сопряженности, представляющие эти отношения для: белых мужчин, белых женщин, небелых мужчин и небелых женщин.
Таблица 16.2.
Гипотетические отношения между получением образования в колледже и политическим мировоззрением для мужчин
Образование |
Мировоззрение |
||
Либералы (%) |
Консерваторы (%) |
Общее число респондентов |
|
Получили |
33 (5) |
57 (20) |
(25) |
Таблица 16.3.
Гипотетические отношения между получением образования в колледже и политическим мировоззрением для женщин
Образование |
Мировоззрение |
||
Либералы (%) |
Консерваторы (%) |
Общее число респондентов |
|
Получили |
43 (15) |
67 (10) |
(25) |
При условии правильной обработки, такой подход к многомерному анализу может очень хорошо помочь в оценке гипотез. Однако у него есть существенные ограничения. Во-первых, он очень громоздкий, и получаемые результаты трудно интерпретировать, если используемые переменные имеют много возможных уровней. Именно поэтому непрактично применять это метод для анализа интервальных переменных; его также трудно использовать для многих номинальных и одноуровневых переменных. Например, чтобы сравнить независимую и зависимую переменную, каждая из которых содержит 5 уровней, и при этом проконтролировать их с помощью третьей переменной с 10 уровнями, потребуется анализ 10 таблиц по [c.441] 25 ячеек в каждой. И хотя в нашем распоряжении может иметься исключительно большая и разнообразная выборка, множество ячеек в таблицах останется незаполненным, что может сделать невозможным вычисление некоторых мер связи и значимости. Мы могли бы попытаться избежать этого путем объединения определенных категорий переменных, чтобы уменьшить число уровней и сократить число необходимых таблиц и ячеек (как в том случае, когда мы сократили меру “годы учения” до дихотомии “менее 12 лет” и “12 лет и более”). Тем не менее, это означает, что имеющаяся в первоначальных данных часть информации, которая может оказаться важной, будет потеряна, что может привести к искажению результатов. Более того, с такой же проблемой мы можем столкнуться даже и после того, как мы объединили категории, в том случае, если мы попытаемся сразу добавить для контроля несколько переменных, чтобы проверить комбинированный эффект различных переменных. Во-вторых, даже если мы можем выполнить такой анализ, его результаты трудно будет ввести в оборот, так как модель выглядит достаточно сложно, и кроме того, не существует обобщающей статистики, позволившей бы суммировать полученные в итоге данные.
К счастью, существует ряд статистических приемов, которые предназначены специально для многомерного анализа и которые можно использовать для решения широкого круга задач; их результаты сравнительно легко интерпретируются. Они особенно ценны, так как обладают возможностями проверки гипотез (позволяют анализировать взаимосвязи двух переменных с учетом воздействия других переменных на каждую константу), но главное их достоинство заключено в тех способах, которыми они помогают нам уяснить сложную и хрупкую сеть взаимосвязей, в которую вплетены социальные явления. В этой главе мы познакомим вас с тремя наиболее часто используемыми способами многомерного анализа, с тем чтобы вы знали, когда и как применять их в своих исследованиях, и, читая научные труды, могли судить о том, как их применяют другие. Мы выбрали эти методы из всего множества возможных потому, что (1) они широко применяются, (2) они иллюстрируют некоторые основные принципы многомерного анализа и (3) все они основаны на [c.442] одних и тех же базовых математических приемах и могут быть поэтому объяснены легче, чем те, которые требуют привлечения разных математических приемов. [c.443]
МНОЖЕСТВЕННАЯ РЕГРЕССИЯ
Все, что говорилось о двумерной корреляции и регрессии в гл.15, может быть распространено на те случаи, когда вы хотите изучить взаимосвязи между одной независимой (НП) и несколькими зависимыми переменными (ЗП). Цель множественной регрессии обеспечить (1) подсчет независимого воздействия изменений в значениях каждой ЗП на значения НП и (2) эмпирический базис, чтобы предсказать значения зависимой переменной на основе знания совместного влияния НП.
Анализ начинается с составления уравнения, которое, на ваш взгляд, точно описывает исследуемые вами причинные связи. Поскольку это уравнение можно рассматривать как модель исследуемого процесса, это шаг расценивается как построение модели. Оно заключается в переводе вашей вербальной теории явления на язык математических уравнений. Общая формула множественной регрессии такова:
Y = а0 + b1X1 + b2X2… +…bnXn + e.
В ней вы можете узнать несколько расширенное уравнение двумерной регрессии, описанной в гл.15. Понимание этого уравнения может облегчить конкретный пример.
Скажем, мы заинтересованы в проверке верности заявления, что выборы в сенат США могут быть “куплены” путем вклада средств в кампанию в прессе. Для этого попытаемся объяснить процент полученных кандидатом голосов следствием (1) количества средств, вложенных в рекламу в средствах массовой информации, и (2) долей среди всех имеющих право выбора людей той же партийной принадлежности, что и кандидат. Начнем со следующей простой модели процесса выборов:
Y = а0 + b1X1 + b2X2 + e,
где Y предполагаемая доля голосов, полученных кандидатом;
а0 среднее значение Y, если каждая независимая переменная равна 0; [c.443]
b1 среднее изменение Y на единицу измерения Х (количество средств, вложенных в рекламу), когда воздействия остальных переменных постоянны;
X1 количество средств, вложенных кандидатом в рекламу (в 1000 долларов);
b2 среднее изменение Y' на единицу изменения X2 (доля выборщиков той же партийной принадлежности, что и кандидат), когда воздействия остальных переменных постоянны;
X2 доля выборщиков той же партийной принадлежности, что и кандидат;
е погрешность, означающая любое колебание Y1, не вызванное изменением независимой переменной в модели.
Можно попытаться проверить точность этой модели, собрав достоверные данные о борьбе за 100 мест в сенате США. Однако для того, чтобы применение методики множественной регрессии к этой или любой другой задаче оказалось удачным, необходимо, чтобы наша модель, а также данные, с помощью которых мы хотим проверить все это, удовлетворяли пяти требованиям, которые лежат в основе применения регрессии.
1. Модель должна точно соответствовать (точно описывать реальные исследуемые взаимосвязи). Для этого необходимо, чтобы (а) связь между переменными была линейна, (б) ни одна важная независимая переменная не была исключена и (в) ни одна не имеющая отношения к делу переменная не была включена.
2. Не должно быть ошибок в измерении переменных.
3. Переменные должны быть измерены в интервальной шкале.
4. Для погрешности необходимы следующие условия:
а) ее среднее геометрическое (предположительное значение для каждого наблюдения) равно 0;
б) погрешности для каждого наблюдения не коррелируют,
в) НП не коррелируют с погрешностью;
г) отклонение погрешности всегда постоянно для всех значений НП; это условие называется гомоскедастичностью;
д) погрешность имеет нормальное распределение.
5. Ни одна из НП не коррелирует четко с любой другой НП или с любой линейной комбинацией других НП. Если [c.444] это так, то говорят, что нет четкой мультиколлинеарности2.
Если наше исследование достаточно полно удовлетворяет этим условиям3, мы можем подставить вместо Y, X1 и X2 наши конкретные значения и решить уравнение регрессии, описывающее предположения относительно неизвестных значений a1, b1 и b2 используя метод подсчета наименьших квадратов. Вот один из гипотетических результатов такого решения:
Y = 10 + 0,1 X1 + 1 X2.
[c.445]
ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
Метод наименьших квадратов в случае множественной регрессии работает так же, как двумерная регрессия, в том смысле, что представляет собой проходящую через множество точек, которые представляют значения случаев по нескольким переменным, так чтобы уменьшить до минимума сумму квадратов расстояний от каждой точки до этой линии. Разница в том, что эта “прямая” в случае множественной регрессии есть множество математически обоснованных точек в системе, которая не может быть описана как двумерное множество точек, а, или точка пересечения, обычно представляет мало интереса, поскольку значения независимой переменной редко равны 0. Однако значение а, равное 10, в уравнении можно интерпретировать в том смысле, что, даже если кандидат не вкладывал средств в рекламу, и 0% избирателей в штате принадлежат к ее или его партии, он (или она) получит 10% голосов просто потому, что находится в избирательных списках.
Гораздо более важно понять смысл значений bi. Его обычно называют частным коэффициентом регрессии; он описывает единичный вклад каждой независимой переменной в определение значений ЗП. В нашем примере о выборах значение b1, равное 0,1, можно интерпретировать как означающее, что каждые дополнительные 1000 долларов, вложенные в рекламу, увеличивают долю голосов за кандидата на одну десятую процентной единицы, а значение b2, равное 1, будет означать, что каждому 1% увеличения доли голосов тех, кто принадлежит той же партии, [c.445] соответствует 1% увеличения доли всех голосующих за кандидата. С помощью этих коэффициентов регрессия статистически сводится к постоянному влиянию любой переменной, которая воздействует как на отдельную НП, так и на ЗП через использование следующей формулы:
Такой статистический контроль заменяет тот контроль, который мы могли бы осуществлять при экспериментальном построении; он, таким образом, ценен с двух точек зрения. Во-первых, если говорить коротко, он позволяет нам оценить относительное значение различных НП для определения значений ЗП. Во-вторых, он позволяет нам исключить альтернативную гипотезу о том, что взаимосвязи между ЗП и любой конкретной НП ложны. Если мы допустим, что все значимые причины изменений ЗП включены в нашу модель, а коэффициент частичной регрессии для любой НП при этом отличен от 0 (значим)4, мы можем сделать вывод, что наличие взаимосвязи между НП и ЗП не является ложным. Если же, однако, близок к О или статистически незначим, мы должны заключить, что непосредственной связи между НП и ЗП нет. В таком случае следует исключить НП из модели, с тем чтобы сделать ее более соответствующей изучаемому объекту. Ясно, таким образом, что множественная регрессия может быть ценным инструментом в совершенствовании и улучшении наших теорий, касающихся политических явлений.
Мы можем достичь завершенности своей теории, если обратимся к подсчету коэффициента множественной детерминации, или R2 (нечто, что можно назвать множественным R2) по формуле:
Этот коэффициент показывает, насколько близко расположены точки, обозначающие данные, вокруг “прямой”, предусмотренной нашей моделью; ее обычно называют мерой отклонений ЗП, которые могут быть объяснены колебаниями всех НП. Например, коэффициент R2, равный 0,57, можно определить как показатель того, что [c.446] независимые переменные в модели, по которой он был посчитан, объясняют 57% колебаний зависимой переменной. R2 изменяется в пределах между 0 и 1; чем ближе он к единице, тем более совершенна наша модель. Значение R2 всегда может быть увеличено путем введения в модель добавочных НП, но исследователь должен всегда задаваться вопросом, не сделает ли вновь введенная переменная модель слишком сложной и привнесет ли она что-нибудь ценное в понимание исследуемого явления. В нашем случае с выборами, например, мы, может быть, и могли бы увеличить R2 добавлением в уравнение сведений о количестве букв в фамилии кандидата, но сделать это значит забыть, что исследование имеет целью более полное и ценное понимание мира, а не состязание в наиболее впечатляющем применении статистики. [c.447]
РЕШЕНИЕ ОБЩИХ ПРОБЛЕМ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
И данные, и сама реальность не всегда подходят для построения концептуальной модели, лежащей в основе множественного регрессионного анализа. Связи не всегда линейны, в измерениях часто бывают ошибки и т.д. К счастью, математики -статистики предусмотрели некоторые пути к тому, чтобы приспособить множественную регрессию к урегулированию подобных проблем. Мы обсудим возможности решения трех из обычно возникающих проблем, с тем чтобы вы могли (1) понять, как преодолевать такие сложности в вашем конкретном случае применения множественной регрессии, и (2) получить представление о гибкости множественной регрессии как приема статистического анализа.
Неинтервальные данные. В социальных науках важные переменные часто не могут быть измерены в интервальной шкале, нарушая, таким образом, условие об интервальном уровне измерения. Однако неинтервальные данные могут быть использованы в множественной регрессии при двух условиях.
Во-первых, если измерение является дихотомией (или может быть преобразовано в нее), его можно использовать непосредственно для регрессии, попросту придав одному значению дихотомии код 1, а другому 0. Например, в изучении международной торговли товары можно [c.447] классифицировать как “иностранные” и “отечественные”, приписав значению “иностранный” код 1, а значению “отечественный” код 0. При регрессионном анализе такая схема будет восприниматься как интервальная, поскольку дихотомия имеет особые математические свойства. В результате мы можем интерпретировать частный коэффициент регрессии, посчитанный для любой закодированной дихотомически переменной, так же как мы сделали бы это в случае измерения по интервальной шкале.
Неинтервальные переменные, которые имеют много категорий, могут быть приведены к виду, необходимому для множественной регрессии, путем использования системы фиктивных переменных. Рассмотрим, например, случай, где служебное положение измеряется только в категориях “высокое”, “среднее” и “низкое” в исследовании, целью которого является определение количества политических организаций, к которым принадлежит данный индивид, как функции образования (количества лет обучения) и служебного положения. Мы сможем использовать порядковые данные о профессии для множественной регрессии, если создадим две дихотомические фиктивные переменные, представляющие переменную “служебное положение”. Уравнение примет вид:
Y' = а + b1X1 + b2X2 + b3X3 +е,
где Y количество политических организаций, в которых состоит участник;
Х1 количество лет обучения;
Х2 фиктивная переменная, принимающая значение 1, если служебное положение “низкое”, и значение 0 в остальных случаях;
Х3 фиктивная переменная, принимающая значение 1, если служебное положение “среднее”, и значение 0 в остальных случаях.
Почему для выражения не интервальной переменной с тремя категориями используются только две фиктивные переменные? Потому что значения третьей фиктивной переменной будут точной линейной функцией двух других; таким образом, нарушится условие об отсутствии прямых мультиколлинеарных связей, и однозначный подсчет различных коэффициентов станет невозможным. [c.448]
Когда бы ни использовался принцип создания фиктивных переменных, мы должны следовать правилу создания фиктивных переменных на одну меньше, чем имеется категорий в неинтервальной переменной. Судя по практике, рекомендуется обычно не брать ту категорию, в которой наименьшее количество случаев. В нашем примере фиктивная переменная не была представлена категорией “высокое служебное положение”, потому что должностей этого уровня очень мало. Значение частного коэффициента регрессии для этой исключенной градации подсчитывается путем решения уравнения регрессии. Так, в данном примере если в каком-либо случае переменная “служебное положение принимает значение “высокое”, то значения Х1, X2 должны быть равны 0 и значение частного коэффициента регрессии для категории “высокое служебное положение” будет равно значению Q5.
Эффект взаимодействия. Обычно регрессия наименьших квадратов предполагает, что воздействие различных НП на ЗП независимы друг от друга и для выяснения общего влияния комплекса переменных можно их просто просуммировать. На практике же влияния одних переменных усиливают и дополняют эффект воздействия других. В любом случае, когда воздействие одной НП зависит от значения другой НП, существует эффект взаимодействия. Возвращаясь к примеру о выборах, приведенному выше, мы могли бы оспорить тот факт, что расходы на рекламу имеют различные результаты в случае уже пребывающих в должности (они обычно хорошо известны) и претендентов (им еще предстоит убедить избирателей в своей пригодности).
Множественную регрессию можно приспособить к этой ситуации, если представить переменную “средства, вложенные в рекламу” (X1) как результат взаимодействия между ней самой и занимаемым постом. Если мы предположим, что занимаемый пост представлен фиктивной переменной (Х3), где претенденты имеют код 1, а занимающие посты 0, новая регрессионная модель будет выглядеть так:
Y' = а + b1X1 + b3(X1X3) + b2X2 + е,
где Х1Х3 переменная взаимодействия, образованная произведением Х1 на Х3. [c.449]
Этот способ позволяет нам интерпретировать b1 как однократный вклад расходов на рекламу в распределение голосования путем прекращения суммарного воздействия рекламы и должности на b3 и получить таким образом более точные данные относительно значений Y.
Мультиколлинеарность. Регрессионный анализ требует, чтобы ни одна независимая переменная не была четко скоррелирована с любой другой независимой переменной или с любой линейной комбинацией независимых переменных. Обычно соблюсти это строгое требование легко, поскольку в социальных науках редко бывает так, что значения одной переменной точно выводятся из известных значений другой или ряда других переменных. Однако многие важные переменные действительно тесно связаны друг с другом. (Возьмите урбанизацию и индустриализацию, образование и доход или партии и идеологию в Западной Европе.) Если корреляция между НП в регрессионной модели достаточно велика, подсчеты коэффициента будут неточными и мы не сможем доверять результатам регрессионного анализа. Значимая мультиколлинеарность может вызвать такие большие колебания в значении частного коэффициента регрессии, что сравнивать реальные воздействия различных НП на ЗП станет невозможно. Вдобавок коэффициенты могут не достичь статистической значимости даже в тех случаях, когда наблюдается существенная взаимосвязь, что ведет к неверной констатации отсутствия двумерной связи.
Таким образом, очень важно, чтобы исследователи предпринимали серьезные попытки установить присутствие мультиколлинеарности и необходимые действия по ее корректировке. Мультиколлинеарность обычно определяют по одному или нескольким следующим признакам:
1. Высокий коэффициент R2 в уравнении, но статистически незначимые коэффициенты регрессии (b).
2. Очень сильные колебания в значениях коэффициентов регрессии (b) для одной переменной, если из уравнения выводятся или вводятся в него другие НП.
3. Значения коэффициентов регрессии, которые значительно больше или меньше (как в абсолютных значениях, так и по отношению к коэффициентам других НП), чем можно ожидать, исходя из теории и результатов других подобных исследований. [c.450]
4. Коэффициенты регрессии с неверным знаком, т.е. отрицательные тогда, когда у нас есть все основания ожидать положительного знака, и положительные тогда, когда есть основания ожидать отрицательного знака.
Если хотя бы один из этих признаков появляется при регрессионном анализе, необходима проверка на мультиколлинеарность. Это делается путем регрессирования каждой НП на все другие НП. К примеру, мы хотим проверить уравнение
Y = а + b1X1 +b2X2 + b3X3 + е
через такие уравнения:
X1 = а + b2X2 + b3X3;
Х2 = а + b1X1 + b3X3;
Х3 = а + b1X1 + b2X2.
Если R2 для любого из этих уравнений будет выше, чем, скажем, 0,8, мы можем заключить, что имеется значимая мультиколлинеарность.
Существует несколько способов корректировки мультиколлинеарности. Если у нас есть ряд добавочных по oотношению к выборке случаев (как, например, тогда, когда мы выбираем данные из опубликованного источника и можем просто обратиться к нему еще раз и сделать довыборку), увеличение размера выборки может в какой-то степени уменьшить мультиколлинеарность. Другой путь определить, какие именно НП особенно тесно связаны друг с другом, и объединить их в единый фактор. Если, например, средства, вложенные в радио-, теле и печатную рекламу, измеряются в нашем исследовании сенатских выборов отдельно, а мы обнаружим, что они тесно взаимосвязаны, можно объединить их в один признак услады в средства массовой информации, с тем чтобы уменьшить дестабилизирующее воздействие мультиколлинеарности. Естественно, любое подобное комбинирование будет работать только в том случае, если оно теоретически обосновано. Нельзя, к примеру, решать проблему мультиколлинеарности путем объединения занимаемого кандидатом поста и регионального расположения штата, поскольку теоретически они относятся к вещам, не связанным друг с другом. И наконец, можно попробовать справиться с мультиколлинеарностью, отбросив одну или [c.451] несколько тесно связанных переменных. Это может привести к искажениям, но, убирая сначала одну, потому другую из связанных НП и сравнивая результаты регрессий, можно по меньшей мере составить представление о том, какой урон наносят искажения, а какой мультиколли-неарность.
Сравнение независимых переменных. Всегда важно знать, какая из нескольких НП оказывает наибольшее влияние на зависимую переменную. Если бы мы хотели заставить людей, к примеру, пристегивать ремни, нам понадобилось бы, наверное, узнать, какие из факторов, способных вызвать такое поведение, могут сильнее всего повлиять на решение пристегиваться, и затем действовать наиболее эффективными методами. Анализ с применением множественной регрессии очень хорошо подходит для этого, поскольку предусматривает оценку влияния каждой отдельной НП на колебания ЗП одним из своих методов частным коэффициентом регрессии. К сожалению, определение относительного влияния разных НП не тождественно простому сравнению их коэффициентов регрессии.
В тех случаях, когда НП измеряются в разных единицах (количество долларов наряду с процентом избирателей, например), коэффициенты регрессии не отражают относительного воздействия НП на ЗП. Одним из возможных путей обойти это стандартизировать переменные так, чтобы они были измерены в одних и тех же единицах, и снова произвести подсчеты коэффициента регрессии. Стандартизация измерений достигается путем преобразования числового ряда в единицы стандартного отклонения от значения среднего геометрического переменной посредством использования следующей формулы:
где звездочка означает, что переменная стандартизована;
X значение данного признака;
значение среднего геометрического этой переменной для всех признаков;
SX стандартное отклонение распределения значений переменной X (см. гл. 14). [c.452]
Когда числовые ряда заменены в уравнении регрессии на стандартизованные ряды, а выпадает, потому что стандартизация сводит его к 0, и уравнение приходит к общей формуле:
Y = а + β 1X1* + β 2X2* + β 3X3* +…+ β nXn* + е,
где β представляет частный коэффициент стандартизованной регрессии и называется бета-вес, или бета-коэффициент. Вес корректирует частный нестандартизованный коэффициент регрессии путем деления стандартного отклонения НП на стандартное отклонение ЗП и может быть посчитан по формуле:
Бета-вес может быть интерпретирован как среднее изменение стандартного отклонения переменной Y, связанное с измерением стандартного отклонения переменной Х при постоянном воздействии других НП. Таким образом, β со значением 0,5 означает, что изменение значения НП в одно стандартное отклонение вызовет изменение ЗП в половину стандартного отклонения.
Таким образом, стандартизация позволяет сравнивать влияние нескольких независимых переменных внутри одного массива. Если же нам нужно выяснить взаимосвязи переменных между массивами, этот способ может ввести в заблуждение. Если, например, нам захочется изучить влияние количества вложенных средств на успех кандидатов на выборах в Соединенных Штатах и Мексике, мы обнаружим, что в распределении (а следовательно и в стандартном отклонении) ключевых переменных были существенные различия, поскольку организация кампании в средствах массовой информации в Соединенных Штатах стоит больше, и результаты выборов зависят от этого в одной стране больше, чем в другой. Поскольку значение β является функцией вариации переменных (чем больше вариация, тем больше β при прочих равных условиях), мы можем ошибаться, думая, что вложение средств дает в одной стране больший эффект, чем в другой, просто потому, что таковы математические обусловленные значения β. Чтобы избежать такой ошибки, необходимо принять во внимание частный наклон [c.453] нестандатизованной регрессии в любом случае сравнения влияний НП в различных массивах, если вариация этой переменной значительно меняется от массива к массиву6. [c.454]
ПАТ-АНАЛИЗ*
Регрессионный анализ может быть достаточно полезен для проверки отдельных гипотез и изучения относительного влияния различных независимых переменных. Однако регрессия предлагает такую модель причинных связей, которая не всегда отражает всю сложность окружающего мира. Если нам захочется определить решающие факторы расовой сегрегации в системе общеобразовательных школ, например, мы можем предположить, что школьная сегрегация вызвана сегрегацией в системе расселения (поскольку большинство школ тяготеет к географическим регионам), а она в свою очередь расовыми различиями в доходах. Диаграмма причин, или модель взаимосвязей, построенная по схеме, предложенной в гл. 2, изображена на модели 1.
Модель 1. X1 расовые различия в доходах, Х2 жилищная сегрегация и Х3 школьная сегрегация
Эта простая диаграмма типичная модель, полученная в результате обычного регрессионного анализа; она показывает, что НП оказывают воздействие на ЗП независимо друг от друга. В реальной же социальной ситуации НП часто влияют друг на друга так же, как и на ЗП. Если вспомнить наш пример, то мало-мальские знания об объекте исследования позволят предположить, что различия в доходах влияют на жилищную сегрегацию так же, как и на школьную сегрегацию, поскольку менее дорогие и более дорогие дома обычно географически тяготеют друг к другу. Признание этого факта означало бы, что мы пересмотрели нашу модель, Можно предположить, что существует последовательное развитие, в [c.454] котором одна НП оказывает воздействие на ЗП исключительно через изменения, вызванные ею в другой НП. Это можно изобразить так:
Модель 2
Более глубокое проникновение в предмет может привести к пониманию того факта, что расовые различия в доходе влияют на школьную сегрегацию как прямо, так и через жилищную сегрегацию, поскольку более состоятельные люди могут помещать своих детей в частные школы. Эту информацию можно отразить в модели путем изображения прямых стрелок от X1 к Х3, как в модели 3.
Модель 3.
Пат-анализ это способ статистического анализа, которым можно оценить точность таких моделей путем эмпирической оценки прямых и непрямых воздействий одной переменной на другую. Его широко применяют в социальных науках, поскольку он пригоден для решения широкого круга исследовательских задач и имеет то преимущество, что с его помощью можно проверить сразу значительную долю теории, а не проверять каждую гипотезу в отдельности. Наша цель познакомить вас с основными процедурами пат-анализа и научить читать пат-диаграммы, которые могут встретиться вам в литературе. Мы не станем вникать во все детали, усвоение которых необходимо для более серьезного и глубокого применения этого метода, поэтому вы поступите мудро, если почитаете что-нибудь еще, прежде чем попытаетесь применить пат-анализ для решения сложных исследовательских задач.
Рекурсивные и нерекурсивные модели. Пат-анализ начинается с построения концептуальной модели, которая выделяет причинные связи, реально существующие, по мнению исследователя, в окружающем мире. Для пат-анализа модель 3 следует перестроить и представить как модель 4, где величина обозначает те колебания связанных с ними переменных, которые не могут быть объяснены колебаниями других переменных в модели. [c.455]
Модель 4
Затем модель представляется в виде математического уравнения. Однако любая модель, в которой НП независимы друг от друга (как в модели 1), не может быть представлена одним уравнением, ее следует описывать несколькими структурными уравнениями. Модель 4 будет представлена следующим набором уравнений:
X1 = р1uRu;
Х2 = p21X1 +p2vRv;
Х3 = p32X2 + p31X1b+ p3wRw.
p в этих уравнениях представляет пат-коэффициенты, которые подытоживают размер или силу воздействия, оказываемого одной переменной на другую при постоянных воздействиях других переменных. Общепринятый способ написания пат-коэффициента pij, что обозначает направление от переменной j к переменной i. Таким образом, набор данных уравнений говорит о том, что величина X1 целиком обусловлена факторами, лежащими за пределами модели, величина X2 обусловлена X1 и факторами вне модели, и величина X3 обусловлена X1, X2 и факторами вне модели. Такие переменные, как X2 и X3, которые хотя бы частично определены другими переменными данной модели, называются эндогенными, а переменные, полностью обусловленные внешними по отношению к модели факторами, называются экзогенными.
Модели подразделяются на рекурсивные и нерекурсивные. Модель рекурсивна тогда, когда все задействованные в ней переменные могут быть расположены так, что первая будет определяться только внешними факторами, вторая только внешними факторами и первой переменной, третья только внешними факторами и первой и второй переменными и т.д. Короче говоря, все это означает, что все причинные влияния должны осуществляться в одном направлении без “обратной связи”7. Модель 4 это пример рекурсивной модели.
Если между любыми переменными модели существует обратная связь (взаимная причинность), то она считается [c.456] нерекурсивной. Например, мы могли добавить переменную “род занятий” (X4) к модели школьной сегрегации и заявить, что раздельное обучение ведет к расовым различиям в профессиональных достижениях, а это в свою очередь вызывает различия в доходах, так что модель уже будет выглядеть как модель 5.
Модель 5. Эта модель уже не содержит переменных, целиком обусловленных внешними по отношению к ней факторами, и является нерекурсивной. Такие модели требуют особых способов анализа, что лежит за рамками данной книги8. Впрочем, рекурсивные модели вполне можно изучать методами обычной регрессии наименьших квадратов, описанной выше. Если переменные представлены в стандартизованном виде, пат-коэффициенты можно посчитать, как коэффициенты стандартизованной регрессии, производные от регрессии.
Использование пат-анализа. Можно проверить эмпирические предположения насчет верности выдвинутых в модели предположений путем подсчета серии регрессий, где каждая эндогенная переменная регрессировала со всеми переменными, которые предположительно на нее влияют. Чтобы пример был чисто гипотетический, возьмем пятипеременную рекурсивную модель, изображенную на модели 6 (остаточное влияние убрано для простоты изображения).
Чтобы проверить эту модель, мы определим регрессию X5 на X1 через X4, Х4 на X2 и X3 и X3 на X1. X1 и X3 будем считать экзогенными. Если значение любого из пат-коэффициентов (коэффициентов стандартизованной [c.457] регрессии), полученных при этих расчетах, приближается к 0 или является статистически незначимым, то это свидетельствует о том, что мы неверно построили модель, предположив в ней взаимосвязь, которой на самом деле в данных нет.
Кроме этого, можно проверить верность наших предположений относительно отсутствия взаимодействия путем вычисления регрессии между эндогенными переменными и теми, с которыми они, по нашему мнению, не связаны. Например, для проверки модели 6 нам нужно вычислить регрессию X3 на X1 и X4 на X1, чтобы выяснить, не следовало ли изобразить те стрелки, которые мы опустили. Если полученные пат-коэффициенты существенно отличны от 0 (>=0,2, например) и статистически значимы, нам придется заключить, что модель (и наша теория о тех явлениях, которые ею представлены) нуждается в пересмотре.
Одним из важнейших достоинств пат-анализа является то, что он облегчает разработку теории тем, что побуждает использовать теорию и анализ данных в плодотворном взаимодействии, где одно дополняет другое. Пат-анализ такого типа позволит судить не только о том, связаны ли переменные в нашей модели именно так, как мы предполагали, но и о том, каково относительное влияние каждой переменной на другие переменные в данной модели. Суммарное воздействие одной переменной на другую равно значению или силе прямой связи между ними плюс значение или сила непрямых связей, существующих между ними. Сила непрямой связи измеряется произведением тех прямых связей, из которых она состоит. Например, в модели 6 общее воздействие X2 на X5 равно
р52+(р42 • р54),
а общее воздействие X1 на X5 будет равно (p21 • p52) + (p21•р42• p54).
Везде, где используются коэффициенты стандартизованной регрессии, можно использовать этот способ сравнения суммарных воздействий разных переменных в рамках одной системы. Знать его крайне полезно, поскольку он может помочь как рядовым гражданам, так и руководителям направить свои усилия именно туда, где [c.458] они будут иметь наибольший эффект. Например, если мы пытаемся убедить людей в необходимости пристегивать ремни, мы можем сначала выяснить, какой из нескольких факторов, определяющих это решение, имеет наибольшее влияние, и затем направить все усилия на изменение именно этой переменной.
Пат-анализ может быть также использован для сравнения воздействия переменных в разных системах. Если вернуться к примеру о школьной сегрегации, то можно собрать данные по Антланте, Лос-Анджелесу и Детройту и проверить верность модели 4 по каждому городу. Если мы не стандартизируем данные и используем коэффициенты нестандартизованной регрессии, то мы можем сравнить, скажем, влияние жилищной сегрегации на школьную сегрегацию в каждом из этих городов, чтобы понять, как интересующие нас причинные взаимодействия изменяются от города к городу. Необходимо использовать нестандартизованные коэффициенты, поскольку стандартизация ставит значение пат-коэффициента в зависимость от вариации переменной в данном массиве. Если, например, в одном городе школьная сегрегация проявляется гораздо сильнее, чем в другом, относительный размер коэффициента стандартизованной регрессии будет отражать степень этих различий в разбросе, а не действительную разницу в относительной силе проявления этой переменной в различных городах.
Общее правило использовать стандартизованные коэффициенты при сравнении воздействий разных переменных в рамках одного массива и нестандартизованные коэффициенты при сравнении воздействий одних и тех же переменных в различных массивах9. Считается, что именно нестандартизованные коэффициенты позволяют судить о тех “причинных законах”, которые управляют общественным развитием. [c.459]
АНАЛИЗ ВРЕМЕННЫХ РЯДОВ
Многие важные социальные и политические события иногда повторяются, а не случаются лишь единожды, а социальные и политические процессы порой тянутся на протяжении нескольких лет. В результате исследователям часто приходится изучать взаимодействия объектов, разделенных во времени. Средством для этого является [c.459] анализ временных рядов. Он используется, когда нужно объяснить, что случилось в прошлом или прогнозировать события в будущем. Способы применения временных рядов сложны и требуют основательной подготовки. Они, однако, подходят для решения настолько большого круга исследовательских задач и так часто используются в разработках важных проблем, что даже начинающие должны иметь некоторое представление об их основных принципах.
Временные ряды это просто комплекс наблюдений, в которых одна и та же переменная измеряется повторно через определенные интервалы. Государственное агентство занятости может обнародовать цифры по уровню безработицы каждый месяц, международная организация может публиковать ежегодные отчеты об общем объеме международной торговли, маклерская контора может фиксировать индекс Доу-Джонса каждый день. Такие данные можно анализировать методами, основанными на тех принципах регрессии, которые обсуждались ранее. Мы начнем с обсуждения общих подходов к временным рядам и затем рассмотрим два варианта.
Регрессия временных рядов. Исследователям часто бывает необходимо объяснить наблюдаемые тренды (их еще называют секулярными трендами).
Они хотят знать, почему нечто увеличивается или уменьшается, почему оно возрастает или убывает постоянно или циклически и т.д. Например, нам нужно выяснить, насколько послевоенный (имеется в виду вторая мировая война) рост расходов на вооружения в Соединенных Штатах являлся следствием военных расходов в СССР; для этого мы строим простейшую регрессионную модель:
Y = a + bXt + et,
где Y представляет данные по военным расходам США в виде временных рядов;
а средний уровень расходов в Соединенных Штатах;
b влияние расходов в СССР на расходы в США;
Xt данные по военным расходам СССР в виде временных рядов;
et погрешность, отражающая случайные влияния на расходы в США.
Можно использовать обычную регрессию наименьших квадратов для подсчета коэффициентов в этой модели и [c.460] попытаться объявить или предположить расходы США следствием расходов СССР. Однако для того, чтобы в результате этих подсчетов получить неотклоненные или точные значения коэффициентов, погрешности, соответствующие различным временным точкам, не должны коррелировать, как уже упоминалось при перечислении условий, лежащих в основе регрессионного анализа. Фактически внешние факторы, влияющие на размер расходов США в одной временной точке, вероятно, будут влиять и в другой. Если, к примеру, перспективы заключения контракта заставили Пентагон вложить средства в дорогое оружие абсолютно помимо каких-либо действий с советской стороны, то такое воздействие скорее всего будет сохраняться из года в год; точно так же, если члены конгресса пытаются сохранить в своих военных округах военные контракты и оборудование, их влияние на уровень расходов будет постоянно проявляться. Эти влияния в модели отражены погрешностью. И в результате эти погрешности с течением времени сильно коррелируют.
Эта автокорреляция (ее еще называют серийной корреляцией) нарушает одно из условий регрессионного анализа и может привести к тому, что отклонения коэффициента а и 6 при компьютерной обработке могут быть значительно недооценены. В результате статистическая значимость этих коэффициентов будет сильно вздута, и это может привести нас к мысли, что существует взаимосвязь там, где ее на самом деле нет. По этой причине очень важно проводить тест на наличие автокорреляции и, если таковая присутствует, принять меры к устранению ее воздействия, прежде чем делать какие = либо выводы по моделям, содержащим временные ряды. Существует целый ряд статистических тестов на автокорреляцию и несколько способов ее корректировки10.
Построение временных лагов. Часто обнаруживается, что одно событие влияет на другое только по прошествии некоторого времени. В нашем примере, скажем, маловероятно, что советские военные расходы за один год повлияют на расходы США в тот же год, поскольку уровень расходов планируется заранее и уровень советских военных расходов может быть неизвестен в момент принятия решения о расходах США. Следовательно, иногда необходимо учесть в модели, изображающей влияние одной [c.461] переменной на другую, временной лаг. На простейшем уровне мы можем сделать это, сравнивая расходы США с расходами СССР за предыдущий год. Наша основная модель, таким образом, будет выглядеть вот так:
Yt = a + bXt1 + et,
где t1 означает запаздывание в один год.
Прерванные временные ряды. Часто исследователю бывает необходимо определить влияние единичного события на поведение переменной. Например, можно попытаться измерить влияние принятия закона о необходимости пристегивать автомобильные ремни на количество смертельных исходов в автокатастрофах в определенной стране. Для этого нужно собрать данные о количестве смертельных случаев, отмеченных за каждый месяц в течение нескольких лет до принятия закона и нескольких лет после (может быть, следует фиксировать количество смертей в процентах от общего количества людей, вовлеченных в автокатастрофы за месяц, с тем чтобы обеспечить реальную почву для сравнения периодов, в течение которых количество происшествий сильно менялось). Обнаружится, однако, что выяснить влияние закона простым сравнением количества смертей до закона и после его принятия довольно сложно, поскольку мы сравниваем не единичное измерение, а комплекс измерений. Значения могут существенно изменяться как до, так и после принятия закона, так что визуальное изучение данных не даст очевидного результата.
Значения переменных в любых временных рядах могут изменяться по трем основным причинам: (1) секулярные тренды (долговременные тенденции к увеличению или уменьшению); (2) циклические отклонения или сезонность (тенденции к регулярному росту или падению в течение длительного времени) и (3) случайные отклонения (изменения, являющиеся следствием единичных событий, как, например, неожиданная метель для нашего случая, или ошибок в измерении переменной, как, например, случайное отнесение телесных повреждений к числу смертных случаев). Прежде чем мы сможем определить влияние любого конкретного события на временной ряд, необходимо исключить изменения, являющиеся следствием [c.462] трендов, сезонных и случайных факторов. Кроме того, важно осознать, что в любом временном ряду такого типа, вероятно, возникнут серьезные проблемы, связанные с автокорреляцией, поскольку погрешности в разных наблюдениях обычно сильно коррелируют, делая невозможным точный подсчет коэффициентов.
К счастью, в статистике разработан способ, с помощью которого можно приспособить регрессионный анализ к такой ситуации. Этот способ называется авторегрессивные интегрированные движущиеся средние модели (АРИМА аббревиатура английского названия), они приспособлены к факторным трендам, сезонности и случайным воздействиям извне временных рядов и одновременно к автокорреляции так, что истинное влияние помех ясно видно11. Хотя мы здесь не располагаем достаточным местом, чтобы объяснить, как работают эти методики, исследователям следует знать об их существовании, поскольку они делают возможным использование прерванных временных рядов как форму квазиэксперимента, где вызывающие помехи события (революция, стихийное бедствие, расследование коррупции в государственном учреждении, введение новой технологии и т. д.) рассматриваются как стимул или НП, а значения ЗП выполняют функции контрольной группы12. Такие исследования могут позволить нам сделать некоторые ценные выводы относительно тех причин важных событий, которые не были предусмотрены при постановке задач исследования, и, следовательно, открыть путь к решению целого ряда исследовательских задач, которые иначе могли бы остаться вне сферы нашего внимания. [c.463]
ЗАКЛЮЧЕНИЕ
Мы закончим эту главу двумя оговорками. Во-первых, необходимо понимать, что мы обсудили лишь некоторые из многочисленных многомерных статистик, позволяющих анализировать как интервальные, так и неинтервальные данные. Каждая из этих методик приложима к решению различных аналитических задач. Среди наиболее распространенных методик, которые мы не обсудили здесь, следует упомянуть такие, как: дискриминантный анализ, определяющий статистически значимые различия в дихотомических группах и, таким образом, наилучшим [c.463] образом подходящий для экспериментальных и квазиэкспериментальных работ; анализ вариаций, который используется для проверки гипотез об отличиях средних геометрических в различных группах и может оказаться особенно полезным в определении влияний некоторых “воздействий” или помех на то, как отдельные случаи укладываются в концепцию; факторный анализ, который используется для определения тех факторов, которые отражают наличие связей между кажущимися независимыми переменными. Объяснения того, когда и как можно использовать эти и другие методики, можно найти в списке дополнительной литературы в конце этой главы.
Второе, о чем хотелось бы сказать, это то, что вышеизложенное на самом деле не подготовит вас к выполнению сложных видов статистического анализа. К счастью, не нужно быть статистиком, для того чтобы использовать наиболее важные методы, поскольку программы статистического анализа как для микро-, так и для персонального компьютера и ЭВМ выполнят для вас все подсчеты, если, конечно, вы знаете, как верно построить анализ. Большинство этих программ имеет хорошо скомпонованные инструктирующие учебники-самоучители, которые помогут разобраться в статистических процедурах и в необходимом программировании. Таким образом, нелюбовь к математике или статистике не должна стать непреодолимым препятствием для относительно сложных видов анализа данных и эмпирических исследований важных политических тем. [c.464]
Дополнительная литература
По статистике существует великое множество доступных книг. Войти в курс дела вам помогут кн.: Мооre D.S. Statistics, 3d ed. N.Y.: Freeman, 1991. Соuсh J.V. Fundamentals of Statistics for the Behavioral Sciences. N.Y.: St. Martin Press, 1982; Bohrnstedt G.W., Knoke D. Statistics for Social Data Analysis. Itasca (Ill.): F.E. Peacock, 1982; Tabachnick B.G., Fidell L.S. Using Multivariate Statistics. N.Y.: Harper and Row, 1983. Более углубленное изучение статистических приемов содержится в кн.: Касhigan S.K. Multivariate Statistical Analysis. N.Y.: Radius Press, 1982; Lindeman R., Merenda P.P., Gold R.Z. Introduction to Bivariate Multivariate Analysis. Dallas: Scott Foresman, 1980.
Методы анализа неинтервальных данных детально рассмотрены в кн.: Gibbons J.D. Nonparamctric Statistical Inference. N.Y.: McGraw-Hill; 1971; Heise D.R. Causal Analysis. N.Y.: Wiley, 1975. Книга Гиббонса дает прекрасное представление о пат-анализе. О многих статистических методах дают представление книги серии: Quantitative Applications in the Social Science. В большинстве этих книг даны конкретные примеры применения методик, которые в них описаны. См. также о применении статистики: Hubert M., Blalock H.M„ Jr. ed. Causal Models in the Social Sciences. N.Y.: Aldine, 1985, 2nd. ed. В книге основное внимание уделено пат-анализу; Rhodes T.L, Аrringtоn Th.S., Мundt R. Applied Political Inquiry. N.Y.: University Press of America, 1982; McCleary R., Hay R.A. Applied Time-Series Analysis for the Social Sciences. Beverly Hills, Calif.: Sage, 1980. [c.465]
ПРИМЕЧАНИЯ
1 Для уяснения логики такого анализа см.: Bohrnstedt Y.W., Кnоke D. Statistics for Social Data Analysis. Itaska (Ill.): F.F.Peacock, 1982, chap. 10.
2 Для уяснения этих условий и более глубокого понимания множественной регрессии см.: Pedhazur E.J. Multiple Regression in Behavioral Research. N.Y.: Holt, Rinehart and Winston, 1982, 2d ed.
3 Исследования редко удовлетворяют этим условиям полностью, и часто до проведения анализа нельзя сказать, удовлетворяет ли им конкретных набор данных. Исходя из этого, “достаточно полно” значит, что действие любого отклонения от этих условий может быть скорректировано или по меньшей мере подсчитано. См.: Pedhazur, op. cit.
4 По поводу расчетов значимости в регрессивном анализе см.: Касhigan S.K. Multivariate Statistical Analysis. N.Y.: Radius Press, 1982, pp. 178-179.
5 Подробнее см.: LewisBeck M.S. Applied Regression. Beverly Hills (Calif.): Sage, 1980, pp. 66-71.
6 Некоторые предостережения насчет этого правила и предложения о том, как сравнивать влияния различных переменных между массивами содержатся в кн.: Hotchkiss L. A Technique for Comparing Path Models Between Subgroups Standardized Path Coefficients. Regression Coefficients. // Sociological Methods and Research. 1976 (August). Vol. 5. P. 53-76.
* От англ. path путь, траектория
7 Другие требования к рекурсивным моделям обсуждаются в кн.: Dunсаn O.D. Introduction to Structural Equation Models. N.Y.: Academic Press, 1975.
8 О методах анализа с обратной связью см.: Berry W.D. Nonrecursive Casual Models. Beveriy Hills (Calif.): Sage, 1984.
9 См.: Асhen Ch.H. Interpreting and Using Regression. Beverly Hills (Calif.): Sage, 1992.
10 Эта тема хорошо раскрыта в кн.: Оstгоm Сh. W. Time Series Analysis. Beverly Hills (Calif.): Sage, 1978.
11 Добротное описание принципов и использования РИМА см. в кн.: Cook D.Th., Campbell D.T. Ouasiexperimentation. Chicago: Rand McNally, 1979, chap. 6.
12 См.: Cook, Campbell, chap. 5.
17. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
|
Социальные и природные события в равной степени поддаются счету, и для сведения всего в природе к законам, подобным тем, которые открыл Ньютон с помощью дифференциального исчисления, все, что нужно, это достаточное число наблюдений и развитые математические средства. Маркиз де Кондорсе, ок.1790 Различие между международной политикой в ее нынешнем состоянии и производной от нее рациональной теорией подобно различию между фотографией и живописным портретом. Фотография отображает все видимое невооруженным глазом; живописный портрет отображает не все видимое невооруженным глазом, но зато он отображает или по меньшей мере тщится отобразить одну невидимую невооруженным глазом вещь: человеческую сущность изображенного на нем лица. X. Дж. Моргентау, 1967 |
Математическая модель это упрощенный вариант действительности, используемый для изучения ее ключевых свойств. Чарльз Лейв и Джеймс Марч дают такое определение модели: “Модель это упрощенная картина реального мира. Она обладает некоторыми, но не всеми свойствами реального мира. Она представляет собой множество взаимосвязанных предположений о мире. Как и любая картина, модель проще тех явлений, которые она по замыслу отображает или объясняет”1.
За прошедшее столетие математика стала широко использоваться в социальных науках и ныне применяется фактически во всех разделах политологии от вопросов заключения контрактов на использование городского гаража до проблемы предотвращения ядерной войны.
Математическую модель можно во многих отношениях уподобить масштабной модели самолета или макету здания. У модели самолета или макета здания нет многих черт их полномасштабных прототипов: они меньше размерами, многие детали в них выполнены весьма неточно, и многие элементы внутреннего устройства настоящего [c.466] самолета или здания в модели отсутствуют. Но модель, тем не менее, очень полезна для исследователя тем, что она отражает фундаментальные свойства объекта-прототипа. Модель самолета может быть использована при испытаниях в аэродинамической трубе; картонный макет позволяет увидеть структуру здания во всех трех измерениях еще до его постройки. Модели социальных процессов выполняют похожую задачу, выявляя для изучения и экспериментирования ключевые признаки анализируемых процессов.
Первой из социальных наук в математическое моделирование оказалась сильно вовлеченной не политология, а, скорее, экономическая наука. В ней переход от словесных выражений к математическим был облегчен тем, что основной предмет ее интересов деньги уже изначально описывался с помощью чисел, и потому переход от счетоводства к математической экономической теории совершился почти без труда. Примерно тогда же и психология позаимствовала некоторые методы из биологии, которая в свою очередь переняла их у математической физики и химии. Таким образом, психология довольно рано стала пользоваться формальными методами для изучения особенностей поведения людей.
Политология шла по следам этих двух научных дисциплин, постепенно разворачиваясь в сторону количественных методик на протяжении 50 60-х годов. Ныне если судить по тексту вводных курсов математического моделирования по широте использования моделей социального поведения она уступает только экономике. Это может показаться удивительным, но политические процессы действительно обладают рядом особенностей, поддающихся математической обработке.
Начать с того, что многие политические решения содержат в себе значительный экономический компонент, а отсюда следует, что заметную роль в политологии должны играть модели, разработанные в рамках экономической науки. И экономические, и политические процессы включают в себя в качестве важной составляющей “рациональное” (т.е. целенаправленное) принятие решений в условиях неопределенности, конкретных ограничений и зачастую соперничества. Лучшим примером пересечения процессов принятия политических и экономических [c.467] решений может служить теория игр (см. ниже пример 2). Хотя политология на сегодняшний день заимствовала из экономики больше, чем экономика из политологии, разработчики экономических моделей начинают все больше осознавать необходимость введения в свои модели политических компонентов. Небезынтересно, что две Нобелевские премии по экономике были присуждены ученым (Кеннету Эрроу и Герберту Саймону), внесшим крупный вклад в развитие политической науки.
Деньги не единственная интересующая политологов переменная, которая может описываться математически. Итоги голосования на выборах также приводятся в виде чисел. Военные приготовления обычно описываются в числовом выражении (число ракет, число танков и т.д.). В опросном исследовании политические мнения выражаются в виде процентных соотношений между различными группами респондентов. Вообще использование статистики в политологии опирается на математический фундамент. Шаг от просто количественного исследования к математической модели в этой области очень невелик.
Наконец, математическое моделирование не ограничивается операциями с количествами, оно может также иметь дело и с качественными характеристиками политического процесса. Некоторые политические процессы такие, как принятие решений на выборах или распределение голосов избирателей, могут быть определены полностью в математических терминах. В подобных случаях математические модели являются средством изучения логических следствий из наблюдаемых правил, и зачастую такие процессы оказываются куда более сложными, чем это можно было ожидать.
Математические модели помогают политологам с большей легкостью изучать особенности политических процессов. В нескольких уравнениях математической модели зачастую может быть заключен огромный объем информации. Во многих случаях возможна и компьютерная имитация политического процесса. Используя математические средства, политолог оказывается в состоянии взять на вооружение многие из методов, разработанных в логике, статистике, физике, экономике и других отраслях знаний, и применить их к изучению политического поведения. И наконец, [c.468] математические модели ясны и эксплицитны по форме и не оставляют недоговоренностей в том, что касается предполагаемых связей между явлениями. [c.469]
ПРОЦЕСС МОДЕЛИРОВАНИЯ
Математическое моделирование предполагает исследовательскую стратегию, несколько отличающуюся от стратегий тех основных форм политологического исследования, которые описаны нами в других главах, поскольку оно основывается одновременно как на индукции, так и на дедукции. Сейчас мы обсудим общий процесс построения модели, в суммарном виде изображенной на рис. 17.1.
Первый шаг при построении модели индуктивный: это отбор наблюдений, относящихся к тому процессу, который [c.469] предстоит моделировать. Грубую аналогию этому шагу можно усмотреть в отборе переменных и исходной совокупности при проверке гипотезы, с той только разницей, что последняя операция обычно более формализована. Один из возможных путей представления такого начального шага состоит в формулировке проблемы, т.е. в принятии решения относительно того, что следует принимать во внимание, а чем можно пренебречь.
Это очень важно в отношении последующих мер, поскольку в том случае, если изучаемый процесс слишком сложен для методов, доступных исследователю, или если исследователь станет изучать некорректно определенные переменные, то работа по моделированию не слишком продвинется. Успех в поиске интересной, нетривиальной, неизученной и при этом решаемой проблемы зависит от сочетания различных факторов удачи, интуиции и личного опыта исследователя; этот поиск подобен поиску интересной теории в том виде, как он был описан в гл. 2. Моделирование обычно предполагает меньшее число переменных, нежели проверка гипотезы: последняя оперирует простыми процессами (например, линейной регрессией), относящимися к большому числу переменных, тогда как в моделях используются сложные процессы, относящиеся к малому числу переменных.
Второй шаг заключается в переходе от определения проблемы к собственно построению неформальной модели. Неформальная модель это набор таких инструментов, которые способны объяснить отобранные нами наблюдения, но при этом определены недостаточно строго и нельзя с точностью проверить степень их логической взаимоувязанности. К примеру, если объектом моделирования является гонка вооружений (см. пример 1), то неформальная модель могла бы выглядеть следующим образом: “Гонка вооружений происходит потому, что государства боятся вооружений, имеющихся у других государств; пределы ее ограничены стоимостью вооружений”. Это утверждение сообщает нам нечто о механизмах, движущих гонку вооружений, но для окончательного варианта модели оно недостаточно специфицировано.
На этой стадии большинство разработчиков моделей рассматривают целый ряд наборов неформальных допущений, способных объяснить одни и те же данные; тем [c.470] самым они рассматривают несколько потенциальных моделей и пытаются решить, какая из них лучше всего отображает изучаемую проблему. Иначе говоря, разработчик модели старается найти различные способы установления логического соответствия между моделью и реальным миром. Это критический момент в процессе моделирования. Если лежащая в основе модели неформальная теория несостоятельна, то ее не спасет никакое количество изощренных математических приемов.
Приобретя определенный опыт в моделировании, исследователь обычно переходит от неформальных моделей к поиску среди существующих формальных моделей такой, которая бы наиболее адекватно подходила к его наблюдениям. Формальная модель отличается от неформальной тем, что все допущения в ней сформулированы в математической форме. Существующие модели на самом деле представляют собой вполне конкретные наборы приемов, и, поскольку они уже кем-то изучались, возможные выводы из их исходных посылок уже известны, что придает определенное направление и дальнейшим разработкам.
Вместо того чтобы иметь дело с произвольным набором неформальных допущений, опытный разработчик будет стремиться рассуждать в терминах “игра с нулевой суммой”, “игра "дилемма заключенного"”, “разностное уравнение первой степени”, “модель Даунса” и других хорошо отработанных моделей. Опытный разработчик использует отработанные модели для того, чтобы от рассуждений типа “Для решения этой задачи необходимо иметь некоторое количество мелких металлических резцов, расположенных в ряд на плоскости и способных при возвратно-поступательном движении разрушать клеточную структуру древесины” перейти к рассуждениям типа “Здесь требуется пила”.
Третий шаг это перевод неформальной модели в математическую модель. Такой перевод включает в себярассмотрение словесного описания неформальной модели и поиск подходящей математической структуры, способной отобразить те же самые идеи и процессы. Это, по всей видимости, самый сложный этап во всем процессе моделирования. Именно здесь могут вкрасться многочисленные ошибки и двусмысленности, поскольку в любом процессе перевода содержание одновременно и теряется, и расширяется. [c.471]
Стадия перевода может таить в себе две опасности. Во-первых, неформальные модели имеют тенденцию быть неоднозначными, и обычно существует несколько способов перевода неформальной модели в математическую, но при этом альтернативные математические модели могут иметь совершенно различный смысл. На самом деле это одна из главных причин, изначально толкающих нас к применению математических моделей: язык математики лишен двусмысленностей и более точен, чем естественный язык, он позволяет исследовать скрытый смысл тончайших различий в формулировках, который плохо доступен исследованию посредством естественного языка.
Вторая возможная опасность заключается в добавлении к неформальной модели тех имплицитных допущений, которые сопутствуют использованию конкретных математических методов. Это оказывается особенно существенным в тех случаях, где задействованы статистические методики и дифференциальное исчисление. Важнейшие формулы теории вероятности и дифференциального и интегрального исчисления опираются на несколько простых допущений, которые чрезвычайно полезны с математической точки зрения, но совсем необязательно соответствуют условиям политической и социальной жизни. Эти допущения в общих чертах соответствуют тому, что мы наблюдаем в мире природных явлений (и поэтому дифференциальное исчисление оказалось столь пригодным для моделирования самых различных природных процессов), но в том, что касается социального поведения, они отнюдь не всегда могут быть в равной степени применимы. Даже если некоторая конкретная модель была изначально рассчитана на отображение социальных ситуаций, тем не менее, надо постоянно учитывать наличие в ней имплицитных допущений и обращаться с ними с осторожностью.
Перевод неформальной модели на язык математики это еще один элемент в моделировании, где важную роль играют личный опыт разработчика и его способность к взвешенным оценкам. Во многих случаях можно сэкономить массу времени и усилий, делая определенные допущения, позволяющие легче оперировать с моделью на стадии ее математической обработки; в других случаях те же самые допущения могут вызвать значительное отклонение модели от [c.472] исходной неформальной теории. В процессе моделирования приходится считаться с обеими этими сторонами перевода. Особенности математической модели могут подвести исследователя к подгонке под нее некоторых допущений неформальной теории. С другой стороны, если неформальная теория выглядит осмысленно, а математическая модель нет, то следует испробовать какую-то иную математическую версию данной модели.
Например, если мы примем в качестве допущения, что причина, по. которой люди участвуют в голосовании, заключается в возможности оказать какое-то воздействие на результаты выборов посредством нарушения потенциальной случайной связи, а математический анализ показывает, что вероятность случайной связи настолько мала, что большинство избирателей в большинстве выборов только из-за этого голосовать не стали бы, то факт, что люди все-таки приходят на избирательные участки, означает, что мы, возможно, недооценили какие-то другие причины участия в голосовании, например чувство гражданской ответственности или желание выразить свое мнение. С другой стороны, наше математическое определение случайной связи, возможно, чересчур строго; может быть, люди рассматривают вероятность того, что в итоге выборов разрыв между кандидатами не превысит 1% общего числа голосов, как более чем случайную связь.
Следующий этап этап математической обработки формальной модели является решающим в математическом моделировании. Именно здесь применяется весь арсенал математических методов логических, алгебраических, геометрических, дифференциальных, вероятностных, компьютерных для формального вывода нетривиальных следствий из исходных допущений модели. На стадии математической обработки мы обычно вне зависимости от сути задачи имеем дело с чистыми абстракциями и используем одинаковые математические средства, идет ли речь о гонке вооружений или о подпрыгивании мяча. Этот этап представляет собой дедуктивное ядро моделирования, заключающееся в поиске нетривиальных и непредвиденных выводов из правдоподобных допущений.
Полученные выводы проходят через еще один процесс перевода на сей раз с языка математики обратно на [c.473] естественный язык. Предосторожности, упомянутые нами в связи с переводом на язык формальной модели, сохраняют свое значение и здесь: ведь перевод с неизбежностью влечет за собой потерю и добавление какой-то информации и каких-то допущений. Этот заключительный перевод может оказаться едва ли не самым трудным этапом в процессе моделирования как часто, глядя на ряд уравнений или графов, задаешься вопросом: “Что же это все может означать?” Хотя разработчик модели в целом заинтересован в получении вполне определенного результата, имеющего вполне определенный реальный смысл, но моделирование нередко порождает и неожиданные результаты, которые могут быть даже более интересными, нежели изначально ожидавшиеся. Литература по моделированию полна примеров того, как исследователь, взяв модель, разработанную кем-то другим, получил из нее интересные, не предвиденные ее автором результаты. Например, феномен “циклического голосования” (т.е. ситуации, когда три или четыре предложения голосуются по принципу простого большинства и при этом ни одно из них не может перевесить все остальные в случае попарного голосования) был известен как математический курьез с XVIII столетия. И только в 50-х годах нашего века стало ясным его значение; это произошло после того, как Кеннет Эрроу применил его в своей “теореме невозможности”, демонстрирующей существование некоторых фундаментальных противоречий во всех демократических избирательных системах.
Далее исследователю нужно вернуться назад к первоначальным стадиям моделирования, с тем чтобы внести в модель определенные уточнения. Соответствуют ли полученные выводы тому, что от модели ожидалось изначально? Имеют ли эти выводы смысл в свете эмпирических наблюдений? Если да, то можно ли усовершенствовать модель так, чтобы получить и другие нетривиальные выводы? Можно ли ее сделать более общей? Можно ли получить те же выводы при более простом наборе исходных допущений? Если модель не несет в себе реального смысла, то, что было неверным формальная модель или же исходная концептуализация? А может быть, какие-то имплицитные допущения помешали правильному переводу с языка неформальной теории на математический язык? В процессе моделирования эти вопросы следует держать в уме постоянно. К формальному [c.474] сравнению и уточнению модели можно возвращаться много раз, прежде чем станет возможной эмпирическая проверка, которая выступает в качестве окончательного этапа моделирования, необходимого для установления степени обоснованности модели.
Эмпирическая проверка бывает нужна не всегда: в некоторых случаях исходные предположения описывают процесс исчерпывающим образом (это относится, например, к правилам избирательной процедуры), и выводы модели в проверке не нуждаются. Но обычно исходные допущения содержат факторы, в теоретической разработке модели полностью не специфицированные и нуждающиеся в оценке с опорой на фактические данные. Поскольку реально все модели социальных процессов предполагают значительный элемент случайности, эмпирические тесты помогают установить также и предсказательную силу модели. Проверка модели включает в себя те же самые этапы операционализации, измерения и статистического анализа, которые обсуждались нами в других главах, хотя для проверки математической модели нередко требуется определенная адаптация стандартных статистических методик. [c.475]
ЗАЧЕМ НУЖНЫ МОДЕЛИ?
Как указывалось выше, существует множество причин, в силу которых политологи прибегают к использованию математических моделей. Однако у данного метода есть и недостатки и преимущества. Моделирование это процесс упрощения и дедуктивного вывода. Упрощение влечет за собой потерю информации о событии. Дедуктивный вывод зачастую включает в себя сложную математическую обработку, которая, по крайней мере на первых порах, затрудняет работу с моделью. Поэтому в отношении моделирования возникает резонный вопрос: а для чего нужны все эти сложности?
Первая причина, побуждающая нас к моделированию политического поведения, состоит в том, что модель помогает формализовать происходящие в обществе события. Дело в том, что политическая жизнь достаточно регулярна, для того чтобы упрощенная неформальная модель ее могла принести определенную пользу. Большая часть того, что случается в области политики, как правило, не [c.475] является совсем уж неожиданным на самом деле наличие элемента неожиданности указывает на то, что у нас имеются априорные представления о том, как могут развиваться события, и мы в состоянии осознать факт неожиданного поворота дел. Значит, у нас в мозгу имеются своего рода ментальные модели функционирования политических систем, даже если мы ни разу не пытались выразить их эксплицитно. Математические модели как раз и помогают эксплицировать подобные неформальные модели.
В качестве примера ментальной модели можно привести следующий. Предположим, что на предстоящих президентских выборах один из кандидатов набирает 95% всех голосов. Очевидно, что это никак не противоречит ни конституции, ни устоявшимся избирательным процедурам. Однако мы будем склонны рассматривать такой факт как крайне маловероятный в силу целого ряда причин. Во-первых, мы допускаем, что со стороны каждой партии наберется достаточное число избирателей, чтобы свести к минимуму возможность чисто случайного результата голосования. Во-вторых, мы исходим из того, что ни одна партия не станет выставлять столь непопулярного кандидата, чтобы он мог собрать лишь 5% голосов. В-третьих, мы полагаем, что подсчет голосов производится без подтасовок. Можно было бы перечислять и далее, но суть в том, что относительно политической системы США у нас имеется целый ряд исходных допущений, в свете которых разбиение голосов на 5 и 95% представляется нам малоправдоподобным.
Все подобные допущения упрощают действительность. Мы не знаем, каково точное число избирателей, да нам это и не надо мы просто знаем, что оно очень велико. Мы не знаем, какие конкретно особенности кандидата делают его приемлемым для одних избирателей и неприемлемым для других, но мы исходим из того, что совсем уж непопулярные кандидаты не будут выдвинуты на голосование. Мало у кого есть личный опыт в деле подсчета голосов, достаточный для того, чтобы знать, честно ли проводятся выборы, но весь опыт прошлого дает основания считать, что фальсификации на выборах места не имеют2. Поскольку эти допущения не столь уж часто приводят нас к неверным выводам, мы можем использовать эту модель [c.476] политической системы для неформального прогнозирования будущего. В действительности те случаи, когда какой-либо кандидат получает 95% голосов, вызывают у населения сильное недоверие, иногда вплоть до требований о расследовании, так что наша модель отчасти определяет также поступки и отношения людей.
Другой причиной применения математического моделирования является необходимость эксплицитно описать механизмы, объясняющие наши неформальные прогнозы. Несмотря на то, что все индивиды знают, чего можно, а чего нельзя ожидать от данной политической системы, они зачастую не в состоянии определить точно, почему и что конкретно они от нее ожидают. Формальная модель как раз и помогает преодолеть чересчур свободные формулировки допущений неформальной модели и дать точный, а подчас и поддающийся проверке прогноз.
Вышеприведенный пример выводится из модели Даунса, которую мы будем рассматривать ниже в данной главе. Формальная модель Даунса предсказывает, что любая политическая партия в условиях альтернативных выборов будет выбирать своих кандидатов и платформу так, чтобы привлечь с их помощью как можно большее число избирателей. Это и некоторые дополнительные соображения приводят нас к заключению, что существует тенденция, в соответствии с которой политические партии должны получить на выборах примерно равное число голосов; именно такой исход обыкновенно и наблюдается на выборах в США. Таким образом, данная формальная модель предсказала не только то, что исход с распределением голосов в соотношении 95:5 является маловероятным, но и то, что ожидаемым будет распределение в соотношении 50:50, в пользу чего было приведено определенное обоснование.
Порой, кажется, что математические модели всего лишь подтверждают и так очевидные вещи. На самом деле это неотъемлемая особенность любых моделей постольку, поскольку от них ожидается, что они в той или иной степени должны воспроизводить все происходящее в каждодневной политической реальности. Однако люди, как правило, очень смутно представляют себе, что такое “очевидное”. Рассмотрение ряда противоречащих друг другу афоризмов (“волк волка чует издалека” и “крайности сходятся”, “с [c.477] глаз долой из сердца вон” и “чем дальше с глаз, тем ближе к сердцу” и т.п.) убеждает нас в том, что здравый смысл часто оказывается правильным именно потому, что он настолько расплывчат, что попросту не может быть неверным.
Строгость формальных моделей, напротив, означает как раз то, что они могут быть неверными, и в результате у модели “спортивные показатели” могут быть подчас хуже, чем у более неоднозначного здравого смысла. Однако это вовсе не слабость, а, наоборот, достоинство моделирования, ибо допущения и прогнозы модели оказываются достаточно точными, чтобы их можно было проверить, а также указать, в каком месте и как произошла возможная ошибка. Та модель, которая устояла против целого ряда попыток ее искажения, вполне вероятно, и в будущем будет давать правильные прогнозы. Модель же, которая раз за разом дает неверные предсказания, видимо, должна быть устранена из рассмотрения.
Короче говоря, модель бывает полезной только в том случае, если в принципе, возможно, продемонстрировать ее ошибочность. Если невозможно показать, что модель неверна, то невозможно также доказать, что она верна, а отсюда следует вывод о бесполезности такой модели. Неформальная интуитивная модель, позволяющая уходить от всевозможных ошибок, может быть большим тактическим подспорьем на переговорах, но она бессильна помочь нам яснее понять механизм политического поведения.
Третьим преимуществом формальных моделей, но сравнению с голой интуицией или даже с тщательно обоснованной аргументацией на естественном языке является их способность систематически оперировать с сущностями более высокого уровня сложности. Естественные языки (подобно английскому) возникли как средства общения, а не как средства логического вывода. Математика, напротив, изначально была задумана как средство логического вывода и систематического оперирования понятиями. И опыт показал, что математика в этом отношении очень полезное орудие. Политологи со своей стороны только сейчас начинают осознавать, что может дать моделирование для более углубленного понимания политического поведения, а в ряде случаев должны были развиться целые отрасли математики (самый заметный пример [c.478] теория игр), прежде чем обществоведы смогли увидеть нечто общее в разрозненных типах социального поведения. Математическое моделирование социального поведения насчитывает не более 20 лет от роду, и пока нет оснований считать, что оно уже достигло пределов своего развития.
И наконец, преимуществом математического моделирования является также то, что оно позволяет различным научным дисциплинам обмениваться своими исследовательскими средствами и приемами. Тому можно привести много примеров: в моделях, используемых в политологии, задействованы не только основные математические средства, но и масса методик, заимствованных из эконометрики, социологии и биологии. Опросное исследование представляющее собой, по сути дела, сложную математическую модель распределения общественного мнения между различными группами населения является широко распространенным методом, используемым в большинстве социальных наук. Заимствование происходит и в обратном направлении: специалисты по системотехнике, разрабатывая крупные компьютерные модели глобальных социально-демографических процессов, для уточнения политических аспектов были вынуждены обратиться к политологическим моделям, а совсем недавно математики, работающие над новой теорией хаотического поведения, обнаружили, что модель Ричардсона гонки вооружений (см. пример 1) поддается весьма продуктивному анализу с применением методов вышеупомянутой теории. Подобным же образом и теория игр была изначально разработана экономистами и политологами для анализа явления конкуренции и лишь впоследствии превратилась в раздел чистой математики.
Помимо стимулирования междисциплинарного обмена методами и идеями, математические модели полезны также тем, что позволяют увидеть глубинную однородность явлений, которые на первый взгляд не имеют между собой ничего общего. Следующий пример, сам по себе довольно тривиальный, наглядно демонстрирует такой тип обобщения.
Представим себе нехитрую игру, в которой два игрока по очереди берут со стола фишки, пронумерованные от 1 до 9:
1 2 3 4 5 6 7 8 9
[c.479]
Выигрывает тот, кто первым наберет фишек на сумму, равную 15. Играя в эту игру, вы, несомненно, обнаружите, что в ней есть свои приемы в частности, в порядке защитного приема вы можете забирать со стола именно те фишки, которые нужны второму игроку для получения окончательной суммы, однако общая стратегия игры, по-видимому, не совсем очевидна. Чтобы обобщить игру, перепишем номера фишек следующим образом:
4 |
9 |
2 |
Заметим, что в такой записи каждая строка, столбец и диагональ в сумме дает желаемый исход 15. Таким образом, для успешной игры нужно выбрать какой-то один из этих рядов чисел. В такой форме игра выглядит уже очень знакомо: это “крестики-нолики”, в которые умеет играть любой пятилетний ребенок. После того как мы представили игру в упорядоченном виде, то, что сначала нам казалось незнакомым, теперь стало выглядеть вполне узнаваемо, так что мы получили возможность использовать в новом контексте издавна известное нам решение.
Это упражнение конечно, в более сложных формах и применительно к более значимым задачам весьма характерно для процесса нахождения общих черт с использованием математических моделей. Известно множество случаев, когда математическая модель, разработанная изначально в расчете на одну какую-то проблему, оказывалась равным образом применимой и к другим проблемам. К примеру, модель Ричардсона гонки вооружений может быть использована для изучения не только международной гонки вооружений, но и динамики роста предвыборных расходов соперничающих политических партий или процесса взвинчивания участниками аукциона цены на “лакомый” товар. Игра “дилемма заключенного” применима не только к примеру позиционной войны (см. ниже), но и к случаю “войны цен” между двумя бензозаправочными станциями, а также к случаю принятия государством решения о необходимости разработки нового вида оружия. Разновидность игры “дилемма заключенного” под названием “цыпленок” берет свое начало от игр юных головорезов, носившихся в разбитых колымагах по заброшенным дорогам Калифорнийской пустыни; она теперь [c.480] применяется к изучению политики ядерного сдерживания в условиях угрозы термоядерной войны. Перечислять примеры можно было бы до бесконечности; для нас, однако, существенно, что большинство хороших математических моделей находят применения, далеко выходящие за рамки тех проблем, ради которых они первоначально разрабатывались.
Итак, математические модели имеют четыре потенциальных преимущества по сравнению с естественно-языковыми моделями. Во-первых, они упорядочивают те ментальные модели, которыми мы обычно пользуемся. Во-вторых, они лишены неточности и неоднозначности. В-третьих, математическая запись в отличие от естественно-языковых выражений позволяет оперировать на очень высоком уровне дедуктивной сложности. И, наконец, математические модели способствуют нахождению общих решений для проблем, кажущихся на первый взгляд разнородными. [c.481]
ПРИМЕРЫ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ПОЛИТИЧЕСКОГО ПОВЕДЕНИЯ
Нижеприведенные примеры отбирались нами так, чтобы лучше очертить границы применения математических моделей политического поведения, а также чтобы познакомить читателя с наиболее распространенными моделями. В каждом из этих примеров обсуждается только часть возможных следствий модели, поскольку каждой модели посвящены без преувеличения сотни исследований.
Пример 1. Гонка вооружений (модель Ричардсона)
В 1918 г. английский метеоролог Льюис Ф. Ричардсон, служивший на фронте санитаром, вернулся с первой мировой войны потрясенный размерами виденных им разрушений и насилия. Он был преисполнен решимости применить свои недюжинные математические способности и новейшие научные знания к изучению феномена войны. Поскольку первой мировой войне предшествовала гонка вооружений, Ричардсон обратился к рассмотрению этого явления. Благодаря своим занятиям физикой он был хорошо знаком с дифференциальным исчислением, используемым при моделировании динамических процессов. Гонка вооружений, рассуждал он, тоже является [c.481] динамическим процессом и может быть приблизительно описана с помощью математической модели.[c.482]
Испробовав десятки сложных математических формул, Ричардсон, в конце концов, остановился на относительно простой модели, учитывающей действие всего лишь трех факторов. Первый из них состоит в том, что государство Х ощущает наличие военной угрозы со стороны противника государства Y. Чем большим количеством вооружений располагает Y, тем больше вооружений захочет приобрести X в ответ на воспринимаемую им угрозу. Однако в то же самое время государство Х вынуждено решать и насущные социальные задачи, и не может перевести всю свою экономику на рельсы военного производства. Следовательно, чем большим количеством вооружений располагает X, тем меньше дополнительных вооружений оно сможет приобрести из-за существующего бремени расходов. И, наконец, по рассуждению Ричардсона, существуют и прошлые обиды, влияющие на общий уровень вооружений. Та же самая логика, которая применима к государству X, действует и в отношении государства Y, для которого составляется сходное уравнение. С математической точки зрения все это рассуждение сводится к двум уравнениям:
Xt+1 = kYt aXt + g,
Yt+1 = mXt bYt + b.
Члены уравнений Xt и Yt обозначают величины уровней вооружений в момент времени t, Xt+1 и Yt+1 в момент времени t+1. Коэффициенты k, т, а и b все являются положительными величинами, a g и h положительными или отрицательными в зависимости от того, насколько в целом враждебно или дружественно настроены государства X и Y по отношению друг к другу. Величина угрозы отражена в членах kYt и mXt, поскольку, чем больше эти числа, тем больше количество вооружений у противной стороны. Величина расходов отражена в членах aXt и bYt, поскольку за счет этих членов снижается уровень вооружений в следующем году. Наконец, константы g и h отражают величину прошлой обиды, которая в рамках данной модели считается неизменной.
Красота модели Ричардсона заключается в ее автономности: если вам известны значения коэффициентов и уровни вооружений государств Х и Y в одном каком-то [c.482] году, вы можете с помощью этой модели предсказать величину уровня вооружений в любом последующем году. Это придает модели способность во всяком случае, в теории прогнозировать будущее, и Ричардсон надеялся, что если политики смогут предсказывать приближение войны, то они смогут научиться и предотвращать ее.
На удивление оригинальная работа Ричардсона пребывала в безвестности в течение ряда десятилетий. Он продолжал свои исследования в области математизации международных отношений вплоть до самой пенсии, но работа его не получила признания ни в научных, ни в политических кругах. Ричардсон умер в 1953 г., будучи хорошо известен своими работами по математической метеорологии, но совершенно неизвестен в области политической науки.
Второе рождение работы Ричардсона наступило после того, как в конце 50-х годов ее обнаружила и стала всячески рекламировать группа социологов из Чикагского и Мичиганского университетов. Журнал “Journal of Conflict Resolution” посвятил Ричардсону целый выпуск. Были опубликованы две рукописи Ричардсона “Статистика непримиримых распрей” и “Вооружение и отсутствие безопасности”, и его модель стала краеугольным камнем новой области знаний математической теории международных отношений. К началу 70-х годов модель была испробована уже сотни раз на самых разных вариантах гонки вооружений.
Модель работала! Не идеально, конечно: ведь любая гонка вооружений имеет сложный комплекс причин, совокупность которых не в состоянии охватить ни одна искусственная модель. Однако модель Ричардсона в целом эффективна в случаях краткосрочных прогнозов, и что существенно лучше нее не работает никакая другая автономная модель. Касается ли это противостояния между НАТО и Организацией Варшавского Договора, ближневосточного конфликта или трагической 30-летней войны в Юго-Восточной Азии, модель Ричардсона гонки вооружений всякий раз адекватно отражает основные особенности конкретного варианта гонки вооружений. При этом эмпирически обнаружилась еще одна область применения данной модели.
Одной из важнейших характеристик модели Ричардсона является стабильность. В простейшей форме стабильность [c.483] определяется тем, какими ускоренными или замедленными темпами развивается гонка вооружений3. На рис. 17.2. показаны два примера гонки вооружений: стабильной гонки вооружений между странами НАТО и ОВД и нестабильной между Ираном и Ираком; на обеих схемах размеры военных расходов приведены согласно данным ежегодников Международного института мирных исследований в Стокгольме (SIPRI). В случае нестабильной гонки вооружений, проблема предотвращения войны была, конечно, тем главным стимулом, который с самого начала подтолкнул Ричардсона к его разработкам. Оказалось, что его модель умеет очень хорошо предсказывать войну, поскольку почти всем современным войнам предшествует нестабильная гонка вооружений. Ричардсон постулировал это в своей основополагающей работе, а впоследствии это было подтверждено другими, более систематическими исследованиями.
В конце 70-х годов Майкл Уоллес обнаружил, что нестабильность гонки вооружений тесно коррелирует с войной. Используя несколько более сложное, однако, основанное на Ричардсоновой модели определение гонки вооружений, Уоллес обнаружил, что из 28 серьезных международных конфликтов, сопровождавшихся гонкой вооружений [c.484] в период с 1816 по 1965 г., целых 23 завершились войной. А из 71 конфликта, не вовлекавшего гонки вооружений, только три перешли в войну.
Другой иллюстрацией того же положения может служить следующий пример. В 1976 г. У. Лэдд Холлист, опираясь на модель Ричардсона и данные SIPRI о военных расходах, изучал четыре случая гонки вооружений: между СССР и США, между Индией и Пакистаном, между Ираном и Ираком и между Израилем и Египтом в период с 1948 по 1973 г. Из всех четырех случаев стабильной была только гонка СССР США, что представляло своего рода проблему, и вот почему. Ведь гонки Индия Пакистан и Израиль Египет, будучи нестабильными, закончились войной, как и предсказывала модель; гонка СССР США, будучи стабильной, не перешла в войну опять же в соответствии с предсказанием модели. Однако между Ираном и Ираком велась нестабильная гонка вооружений, а войны не было. Эта неувязка разрешилась в 1980 г., четыре года спустя после публикации статьи Холлиста, когда долго тлевший конфликт между Ираном и Ираком, наконец, разразился войной. Ирано-иракская гонка вооружений была стабильной до конца 60-х годов и лишь в 70-х годах превратилась в нестабильную, что дополнительно сужает тот период времени, когда, согласно предсказанию, могла случиться война.
Модель Ричардсона это только один из представителей очень большого класса динамических моделей, т.е. таких, которые моделируют развитие некоторого процесса во времени. Многие из этих моделей реализуются в виде дифференциальных уравнений, а многие заимствуют математический аппарат из моделей демографического роста и других биологических процессов. Еще более сложными являются динамические компьютерные имитационные модели, которые моделируют сложные процессы с помощью больших систем уравнений, не поддающихся решению алгебраическими средствами. Объектами компьютерных имитационных моделей зачастую являются целые государства или глобальные политические и экономические системы, и эти модели все чаще используются для проигрывания сценариев типа “что будет, если…”, затрагивающих различные сюжеты внутренней и международной политики. [c.485]
До недавнего времени большинство динамических моделей, изучавшихся в политологии, отражали систематические, “правильные” процессы. В последнее десятилетие значительная работа проделана по “хаотическим моделям”, которые являются более сложными, чем модель Ричардсона и не имеют случайных компонентов, но во временном отношении генерируют поведение, которое кажется случайным. Динамический хаос может служить объяснением того, как постоянный политический процесс порождает в высшей степени нестандартное, “неправильное” поведение, например, гражданскую войну или парламентскую нестабильность.
Пример 2. Игра “дилемма заключенного”
Одна из наиболее развитых областей математического моделирования социального поведения называется теорией игр. “Игры” в рамках данной теории это ситуации, в которых два (или более) участника делают выбор в отношении своих действий и выигрыш каждого участника зависит от совместного выбора обоих (всех). Примерами этого типа ситуаций могут служить такие традиционные игры, как шахматы, покер и футбол, поскольку исход их зависит от совокупных действий игроков. Игры, изучаемые теорией игр, обычно более формализованы, чем традиционные, и вознаграждения в них представляют собой не просто выигрыш или проигрыш, а нечто более сложное, но принцип соревнования и здесь и там один и тот же. Теория игр была разработана во время второй мировой войны и изначально рассматривалась как секретное оружие, однако с той поры она давно превратилась в самостоятельную отрасль математики.
Теория игр первоначально разрабатывалась на материале одного из типов соревнования, который носит название игры с нулевой суммой и заключается в том, что, сколько один игрок выигрывает, столько же другой проигрывает. К этой категории принадлежит большинство обычных игр, а также некоторые из “игр”, с которыми мы встречаемся в области политики, например выборы.
Однако большая часть политических ситуаций являются играми с ненулевой суммой, или кооперативными, когда оба игрока при определенных условиях могут [c.486] оказаться в выигрыше (т.е. тот факт, что один из игроков выиграл, вовсе не означает, что другой столько же проиграл). Из кооперативных игр лучше всего изучена игра “дилемма заключенного”, вариант которой разбирается ниже.
Представим себе ситуацию позиционной войны во время первой мировой войны. Солдаты британских и германских войск сидят в окопах друг против друга, разделенные только нейтральной полосой, а снайперы на брустверах выжидают, когда какой-нибудь неосторожный солдат встанет на секунду во весь рост в обстреливаемом месте, чтобы убить его. В самом начале подобного патового положения потери обеих сторон от снайперских выстрелов велики, и обе стороны чувствуют себя скованно и неуютно, будучи полностью привязанными к окопам. Но со временем, когда одни и те же подразделения неделю за неделей привыкают друг к другу, урон от снайперских атак начинает сходить на нет, постепенно приобретая характер просто несчастного случая. Посторонние наблюдатели, посещающие линию фронта, бывают удивлены, видя, как с обеих сторон солдаты расхаживают не таясь, совершенно без всякого прикрытия и никто никого не пытается при этом убить. Это совсем непохоже на то, как изображают войну в кино, и такое положение бесит некоторых офицеров, но “сотрудничество” становится правилом, и те неопытные офицеры, которые стараются заставить солдат нарушить это правило, имеют скверное свойство погибать от несчастного случая. Надо заметить, что подобное неформальное перемирие происходит без каких-либо открытых договоренностей между враждующими сторонами.
Вышеописанное представляет собой вовсе не плод выдумки пацифиста, а реальную ситуацию. Роберт Аксельрод приводит такую цитату из мемуаров британского офицера, участвовавшего в первой мировой войне: “Я пил чай в компании, когда мы услышали крики и вышли наружу узнать, в чем дело. Мы увидели, как германские и наши солдаты стоят друг против друга на своих брустверах. Внезапно рядом разорвался снаряд, но не причинил никому вреда. Естественно, обе стороны поспрыгивали в окопы, и наши стали ругать немцев, и вдруг один смелый немец вскочил на бруствер и крикнул: "Нам очень жаль, мы надеемся, никто не пострадал. Это не наша вина, это проклятая прусская артиллерия!"”4.
Это явление может быть объяснено с помощью очень широко применяемой модели под названием игра [c.487] “дилемма заключенного”. В “дилемме заключенного” обе стороны стоят перед выбором: либо сотрудничать друг с другом, либо друг друга обманывать. В том примере, который мы привели, платежная матрица (в терминах количества человек, убиваемых ежедневно) могла бы выглядеть так, как это показано в табл. 17.1. В этой матрице выплаты приводятся в таком порядке: британская сторона, германская сторона и обозначают среднее число солдат, убиваемых за день.
Таблица 17.1
Британская сторона |
Германская сторона |
|
Сотрудничество |
Обман |
|
Сотрудничество |
Клетка 1 1, 1 |
Клетка 2 10, 0 Клетка 4 3, 3 |
Стратегия сотрудничества означает отсутствие намеренных попыток убить солдата противной стороны; стратегия обмана означает наличие таких попыток. Если обе стороны сотрудничают (клетка 1), то мы принимаем потери за величину случайную, что в среднем может выражаться в гибели одного солдата в день с каждой стороны. Если обе стороны намеренно ведут снайперский отстрел (клетка 4), то смертей будет больше, но ненамного, потому что обе стороны будут укрываться в окопах и не станут выставляться в качестве мишеней. И, наконец, если одна сторона начинает вести снайперский отстрел, в то время как другая занимается сотрудничеством (клетки 2 и 3), то та сторона, которая пытается сотрудничать, понесет значительные потери, а другая предположительно будет готова к отпору и вообще не понесет потерь в этот день.
В “дилемме заключенного” интересно то, что, чем хуже каждая из сторон думает о другой, тем скорее обе они примут стратегию обмана. Если одна из сторон выбирает сотрудничество, то наихудший исход (10 смертей) может ожидаться тогда, когда другая сторона в ответ выберет обман. Если одна из сторон выбирает обман, то неблагоприятный исход ожидается и тогда, когда другая сторона так же выберет обман, но это приведет всего лишь к трем смертям. Поэтому если выбирать из худших исходов [c.488] наилучший (это называется минимаксным решением), то надо обманывать. Но при этом следует учитывать, что если бы обе стороны сотрудничали, то обе они были бы в большем выигрыше, нежели в случае взаимного обмана (то есть теряли бы каждая по одному солдату в день). В этом заключается дилемма выбора.
Приведенный пример это всего лишь один случай из очень большого числа ситуаций, к которым применима игра “дилемма заключенного”5. Другие стандартные примеры это: обоюдный контроль над вооружениями, контроль за выполнением деловых контрактов, взаимный контроль государства и фермеров за ценами на продовольствие, соблюдение картельных соглашений, принятие решения о начале войны обычного типа и даже совместное решение студентов не готовиться особенно усердно к экзамену (поскольку требования, предъявляемые к отдельному ответу, обычно зависят от общего уровня ответов).
В отношении “дилеммы заключенного” наиболее интригующим представляется то обстоятельство, что в реальной действительности игроки чаще выбирают сотрудничество, несмотря на все факторы, подталкивающие их к обману. Для специалиста по теории игр вопрос заключается в том, почему так происходит. Вопрос этот становится особенно интересным, если учесть, что, согласно существующим исследованиям по играм с ненулевой суммой, наиболее соблазнительными для игроков свойствами обладает минимаксное решение (предполагающее обоюдный обман). В этой связи до недавнего времени оставалось неясным, каков, собственно, механизм сотрудничества (кооперации) в “дилемме заключенного”.
Ключ к решению этой проблемы лежит, по-видимому, в том, что игра носит итеративный характер т.е. повторяется много раз, что позволяет каждой из сторон многократно наказывать другую за обман. В серии весьма искусных опытов, проведенных в начале 80-х годов, Роберт Аксельрод показал, что простая стратегия игры “зуб за зуб” т.е. причинение противнику всего того, что он причинил вам в предыдущем туре игры, оказывается предпочтительной в ситуации, когда большое число игроков занято в играх типа “дилеммы заключенного”. В частности, если из двух игроков оба руководствуются стратегией “зуб за зуб”, то, начав игру с сотрудничества, они и далее [c.489] будут продолжать в том же духе. Если игрок, следующий стратегии “зуб за зуб”, встречается с игроком, склонным к обману, то это, скорее всего, приведет к их взаимному уничтожению. Следовательно, в реальной действительности, где распространены ситуации типа “дилемма заключенного”, наиболее удачливыми окажутся, скорее всего, те игроки, которые согласны сотрудничать по принципу “зуб за зуб”. В тех ситуациях, в которых не умеющие или не желающие сотрудничать игроки имеют мало шансов на выживание (как в описанной выше позиционной войне или в выполнении условий деловых контрактов), успех будет, в конечном счете, на стороне того игрока, действующего по принципу “зуб за зуб”, с которым сотрудничать вполне безопасно. Это во многом объясняет, почему сотрудничество реально существует в мире, где нет ни принуждения к выполнению контрактов, ни договоренностей между игроками и где противника, пытающегося сотрудничать, выгодно обмануть.
Приведенный пример всего лишь в общих чертах дает представление об исследованиях Аксельрода и др. и о той обширной литературе, которая посвящена игре “дилемма заключенного”. Небольшие видоизменения в этой игре позволяют, кроме всего прочего, исследовать такие проблемы, как вопрос об осмысленности применения угроз, о преимуществах, которые можно получить от прерывания сделки или переговоров (стратегия “сжигания мостов”), о важности блефования и отвлекающих маневров, о значимости случайного поведения, а также целый ряд других характерных особенностей ситуаций состязания.
Пример 3. Модель Даунса
В начале работы сессии конгресса 99-го созыва в январе 1985 г. к присяге при вступлении в должность были приведены только 434 члена палаты представителей вместо обычных 435. Одно место по 8-му избирательному округу штата Индиана оставалось незанятым ввиду того, что ситуация, сложившаяся в предвыборной борьбе между кандидатом от демократов преподобным Фрэнсисом Макклоски и его соперником-республиканцем Ричардом Ф. Макинтайром, была близка к патовой. Согласно первоначальному подсчету, Макклоски обошел соперника только на 72 голоса (из 233 тыс. поданных бюллетеней), т.е. на [c.490] 0,03%. Окончательный подсчет, предпринятый палатой и послуживший причиной демонстративного ухода с заседания одного из депутатов-республиканцев, показал отрыв в пользу Макклоски уже только в четыре голоса, т.е. 0,0017% всех поданных голосов.
Чтобы представить этот случай в истинном свете, зададимся вопросом, какова вероятность того, что 233 тыс. избирателей, каждый из которых должен опустить в избирательную урну зеленый или красный бюллетень, сделают свой выбор так, что окончательное соотношение бюллетеней разного цвета в урне лишь на 0,03% отклонится от идеального разбиения 50:50? Даже если допустить, что всем избирателям одинаково безразлично, какого цвета бюллетень опустить в урну, эта вероятность не превышает 0,0005 (огрубленно 1 шанс из 2000). Поэтому выборы, приближающиеся по результатам к игре вничью, следовало бы расценивать как крайне маловероятное событие. И, однако, в американской избирательной системе они совсем не так уж редки. Например, из семи президентских выборов три закончились с перевесом одного претендента над другим менее чем в 2% общего числа поданных голосов.
1960 г. |
Кеннеди |
34 226 731 |
|
1968 г. |
Никсон |
31 785 480 |
|
1976 г. |
Картер |
40 380 763 |
|
К этому можно было бы добавить много других примеров, относящихся к выборам в конгресс, в органы власти штатов и округов.
С точки зрения разработчика математических моделей, это довольно загадочное явление: почему столько результатов выборов оказываются между собой намного ближе, чем ожидалось бы даже при случайном распределении? В одной из своих работ по формальному моделированию в политологии Энтони Даунс предложил простой механизм объяснения этого феномена. [c.491]
Даунс использовал модель, впервые предложенную Хэролдом Хотеллингом в 1929 г. для объяснения того, почему бакалейные лавки в провинциальных городках, как правило, располагаются вблизи друг от друга. В качестве примера в рамках базовой модели Хотеллинга возьмем следующий. Допустим, что городок представляет собой шахтерский поселок в глубокой провинции, а ближайший магазин расположен от него в 50 милях. В поселок приезжают, чтобы открыть в нем магазины, два торговца-конкурента. Из опыта торговли в шахтерских поселках оба они одинаково хорошо знают, какие товары будут здесь пользоваться спросом, поэтому единственное, чем их магазины могут различаться, это месторасположение, потому что клиенты-шахтеры, очевидно, предпочтут посещать тот магазин, который находится ближе. В подобном случае существует только одно место, идеально подходящее для расположения магазина, это точка, в которой среднее расстояние от дома каждого шахтера до магазина является минимальным. Если оба владельца магазинов это осознают, то они расположат свои лавки в одном и том же месте, несмотря на то, что они окажутся впритык друг к другу, и, добавим мы, несмотря на то, что расположение лавок вдали друг от друга сократило бы время, необходимое части клиентов, чтобы дойти от дома до лавки, и притом сохранило бы возможность для владельцев лавок поровну поделить между собой объем коммерции (кстати сказать, это последнее соображение являет собой еще один пример “дилеммы заключенного”).
Логику модели Хотеллинга Даунс применил к ситуации выборов. В простейшей модели Даунса предполагается, что избиратели упорядочены соответственно своим политическим мнениям от либералов до консерваторов (как показано на рис. 17.3). Предполагается также, что каждый избиратель будет голосовать за того кандидата, который идеологически ему ближе. В подобной ситуации кандидаты будут стремиться быть идеологически как можно ближе к “золотой середине” (точка, помеченная на рисунке буквой С). Если один кандидат займет центристскую позицию (точка С), а другой кандидат займет позицию, отличную от центристской (скажем, соответствующую точке О), то последний проиграет на выборах: ведь за кандидата, занимающего точку С, проголосует более 50% [c.492] избирателей, расположенных вправо от С, затем голоса распределятся в промежутке от С до О и, таким образом, это будет означать победу данного кандидата на выборах. Это саморегулирующийся процесс: кандидат может его проигнорировать, но только ценой своего провала на выборах. Поэтому следует думать, что опытные политики те, которые уже неоднократно одерживали победу на выборах, обладают способностью вычислять или угадывать, где расположена политическая “золотая середина”.
Эта модель объясняет то важное наблюдение, что на многих выборах голоса разбиваются почти пополам: ведь опытные кандидаты будут стараться быть как можно ближе к центру голосования. Однако модель Даунса предсказывает, что у кандидатов при этом будут почти одинаковые позиции, а это вовсе не обязательно так. Кандидаты на выборах в США по большей части очень близки идеологически, но все же редко настолько близки, насколько это предполагается данной моделью. Поэтому надо посмотреть, не нуждается ли модель в каких-то дополнительных допущениях.
К этой проблеме можно подходить с разных сторон, но простое наблюдение свидетельствует о том, что в большинстве округов каждый кандидат должен пройти два тура выборов первичный и всеобщий. На первичных выборах распределение идеологических акцентов отклоняется от точки центра. Пунктирные линии на рис. 17.3 показывают гипотетическое распределение голосов в первичных турах отдельно республиканской и отдельно демократической партии: голоса на республиканских первичных выборах обычно сдвинуты сильно вправо, а на демократических сильно влево, притом, что многие центристски настроенные избиратели в первичных турах вообще не участвуют. Применяя к первичному туру модель [c.493] Даунса Хотеллинга, мы видим, что для того, чтобы победить, каждый кандидат будет стремиться занять позицию в центре голосов, отданных его партии (на рисунке точки Д и Р), и тем самым удалится от точки С.
Если бы избиратели не придавали значения постоянству позиции кандидата, то самым логичным для каждого кандидата было бы во время первичных выборов занимать позицию партийного центра, а затем немедленно переориентироваться, заняв точку общеэлекторатного центра С. Однако избиратели не столь забывчивы, поэтому кандидатам приходится, двигаясь в сторону центра, не отрываться и от своей первоначальной позиции, чтобы их не обвинили в неустойчивости взглядов. Более того, в том случае, если позиция партийного центра и позиция общеэлекторатного центра разделены значительным расстоянием, кандидат, избранный на первичных выборах, может оказаться просто не в состоянии занять выигрышную позицию на всеобщих выборах и проиграет с большим отрывом от соперника (как это случилось, например, с Барри Голдуотером в 1964 г. и с Джорджем Макговерном в 1972 г.). Но в ситуации, когда оба кандидата изначально сильно удалены от центра, они вполне могут расщепить итоги голосования почти точно надвое, выбрав соответствующие симметрично расположенные относительно точки С, но при этом несовпадающие позиции. Как на то указывает частота выборов с исходом голосования 50:50, американские политики, по-видимому, очень хорошо умеют выбирать именно такие позиции.
Представленная здесь модель являет собой всего лишь простейший вариант модели Даунса; и сам Даунс, и другие исследователи занимались разработкой более сложных вариантов, чем этот. В реальной жизни мнения избирателей не поддаются строгому упорядочению в виде колоколообразной кривой, проходящей вдоль единой фиксированной идеологической оси; вместо этого они занимают меняющиеся позиции на целом ряде осей, а по некоторым вопросам занимают сильно отличные друг от друга позиции. Однако даже столь простая модель позволяет объяснить, почему некоторые, но не все выборы кончаются с исходом голосования почти 50:50, почему кандидаты не занимают на всеобщих выборах совпадающих позиций и почему кандидаты часто меняют свои [c.494] идеологические позиции в промежутке между первичными и всеобщими выборами. [c.495]
ДРУГИЕ ТИПЫ МОДЕЛЕЙ
Приведенные в этой главе примеры могут дать лишь очень поверхностное представление о математических моделях политического поведения. Необходимо также упомянуть, по крайней мере, некоторые другие типы моделей.
Существует обширная литература по принятию решений относительно ожидаемой полезности той или иной меры; такое принятие решений является способом моделирования соответствующих ситуаций, сопряженных с риском или неопределенностью. Эти модели очень широко используются в анализе, проводимом в целях выбора той или иной государственной политики. Типичные проблемы, связанные с определением ожидаемой полезности, это, например, такие: “следует ли строить атомную электростанцию в районе с повышенной сейсмической активностью?”; “сколько песка и соли должно запасти на зиму управление строительства и эксплуатации дорог?”; “следует ли расходовать 1 млн. долларов на спрямление потенциально опасного участка автострады?”. Такие модели часто применяются в политической практике в качестве прескриптивных моделей (помогающих решить, какие меры следует предпринять), но в дескриптивном моделировании (предсказывающем, что люди будут делать на самом деле), они оказываются фактически бесполезными, поскольку большинство индивидов, принимая свои решения, этим моделям не следуют.
К моделям ожидаемой полезности близки модели оптимизации, которые по большей части были заимствованы политологией из экономической науки и инженерного дела. Почти всякое рациональное поведение включает в себя процессы своего рода минимизации и максимизации. Для определения оптимального поведения существует целый набор сложных математических приемов, которые показали свою полезность как в случаях “борьбы с природой”, когда в качестве “соперника” выступает непредсказуемое будущее, так и в ситуациях конкуренции с малым числом участников, а кроме того, в условиях рынка, когда обстановка определяется очень большим [c.495] числом участников. Ввиду того, что эти модели детально разработаны и носят весьма общий характер, они представляют собой потенциально мощные средства изучения проблем, связанных с политическим поведением.
Совсем новая область математического моделирования имеет дело с компьютерными моделями, связанными с более широкой областью компьютерного моделирования искусственного интеллекта. В то время как большая часть существующих моделей базируется на классических разделах математики логике, геометрии, алгебре и дифференциальном исчислении, компьютерные модели основываются на программировании с использованием не уравнений, а алгоритмов (строго сформулированных последовательностей инструкций). Компьютерные модели бывают особенно эффективны при изучении ситуаций, сопряженных с обработкой большого количества информации, например процессов поиска в памяти, обучения, нечисловых процессов.
Наиболее употребительной формой компьютерной модели является экспертная система, в которой используется большое количество установок типа “если ... то”. Экспертные системы проявили свои возможности в точном воспроизведении поступков людей в самых разнообразных областях и особенно привлекательны тем, что позволяют моделировать политическое поведение. Компьютерное моделирование является также основным моментом в изучении особо сложных систем, являющихся относительно новой областью. В этих моделях не только уровни переменных изменяются во времени, но также меняются и лежащие в основе математические процессы. [c.496]
СЛОЖНОСТИ, СВЯЗАННЫЕ С МОДЕЛИРОВАНИЕМ
Памятуя афоризм Найвена; “Нет такого благородного дела, к которому не пристали бы дураки”, к использованию математических моделей следует подходить с определенной осторожностью.
Первая и самая общая предосторожность вытекает из поговорки “Что посеешь то и пожнешь”: модель не может быть лучше заложенных в нее исходных допущений. В частности, и рассуждение, которое, будучи выражено на [c.496] естественном языке, не имеет смысла, не станет более осмысленным, если его перевести в математическую форму. Всегда важно помнить, что математика эффективна только как средство получения логических выводов из исходных допущений, а отсюда и валидность модели зависит не от математического аппарата, а от этих самых допущений.
Бывают случаи, когда для успешного применения той или иной мощной методики необходимо упростить исходные допущения, но даже подобное упрощение должно проходить проверку практикой и здравым смыслом. Если модель основана на ложных исходных допущениях, то это не значит, что и выводы ее будут ложными, но значит, что валидность этих выводов никоим образом не может быть отнесена на счет исходных допущений6.
Самый частый недостаток, с которым приходится сталкиваться в моделях, это сверхупрощенные исходные допущения. Эйнштейну приписывается утверждение: “Модели должны быть простыми, насколько это возможно... но не более того”. Конечно, упрощение является целью любой математической модели, но только до тех пор, покуда модель как целое продолжает отражать основные процессы, составляющие ее объект. Почти во всех случаях бывают такие ситуации, когда модель в силу своей упрощенности дает сбой. К примеру, модель Ричардсона гонки вооружений не работает в ситуациях, связанных с ядерным оружием, поскольку ядерное оружие, представляя собой весьма действенную и к тому же неограниченную угрозу для противника, не предполагает крупных экономических расходов. В таких случаях важно, чтобы разработчик модели указал, каковы ожидаемые пределы применения модели. Эти ограничения, следует отметить, носят тот же характер, что и в естественных науках: различные химические реакции происходят, согласно предписанию, только при соблюдении немалого числа условий при определенной температуре, давлении, влажности и т.п.
Модель обязательно должна проходить экспериментальную проверку, если только она не задана исчерпывающим образом с помощью своих исходных допущений. В большинстве случаев в модель входят параметры, подлежащие внешней оценке, или исходные допущения о действительности, подлежащие верификации. Здесь мы видим еще один способ проверки исходных допущений на [c.497] валидность: если модель, будучи корректной, с логической точки зрения, дает ложные результаты, то из этого следует, что ложны, должно быть, ее исходные допущения.
Наконец, выданные моделью результаты должны быть правильно переведены на естественный язык. Обычная ошибка при моделировании состоит в том, что исследователь начинает “в лоб” трактовать результаты, полученные от достаточно узкой модели, тем самым переоценивая общность ее выводов. Это распространеннейшая людская слабость чрезмерное увлечение своим творением и приписывание ему большего, нежели то, на что оно реально способно; среди математиков это явление известно как “синдром Пигмалиона”. Средства массовой информации также склонны время от времени выказывать интерес к методам моделирования, приписывая им всевозможные чудодейственные свойства. Такой обработке лет десять назад подверглась второстепенная топологическая методика, носящая название теории катастроф и претендовавшая на умение предсказывать резкие изменения в социальных и биологических системах. То же самое имело место и с узким разделом теории вероятностей, известным под названием теории размытых множеств, в рамках которого допускается описание свойств объекта в терминах “очень большой” и “маловатый”, наряду с более простыми “большой” и “маленький”. Предусмотрительному исследователю, вознамерившемуся использовать математическую модель, можно посоветовать предварительно убедиться в том, что результаты, на которые претендует данная теория, действительно выводятся из ее исходных предположений (если принять их на веру) без апелляции к каким-либо дополнительным допущениям и бездоказательным скачкам в рассуждениях. [c.498]
ЗАКЛЮЧЕНИЕ
Суммируя сказанное, констатируем, что математические модели в гораздо большей степени, чем естественный язык, помогают продвинуться в получении сложных выводов из некоторого множества исходных допущений. Кроме того, мир политики, по-видимому, достаточно регулярен, чтобы выводы, полученные от математических моделей, выдерживали эмпирическую проверку на валидность. Эта область знаний насчитывает всего несколько [c.498] десятков лет, но уже сделала за это время огромные шаги вперед, и при этом ограничения ее видятся весьма немногочисленными.
Моделировать политические и социальные явления сложно обычно намного сложнее, чем моделировать природные процессы; это обусловлено тем, что люди сложнее и непредсказуемее простых атомов. Эта сложность выливается в следующие две импликации, связанные с моделированием политического поведения.
Во-первых, моделирование начинается с более простых и регулярно наблюдаемых типов поведения и лишь затем переходит к более сложным типам. Как следствие, некоторые из моделируемых явлений могут показаться тривиальными, в то время как к “крупным вопросам” сразу подступиться бывает трудно или невозможно. В противоположность этому при интуитивном, неформальном подходе к политическому анализу мы можем в любое время обратиться к любому сколь угодно крупному вопросу. Получаемые при этом ответы, однако, оказываются часто неверными достаточно бегло припомнить, сколько в истории человечества было войн, кровопролитий, нищеты и нелепых ошибок, чтобы понять, что интуитивные модели редко бывают безупречными. Поскольку мы всегда можем, в конечном счете, прибегнуть к неформальной модели, использование формальных моделей в состоянии лишь улучшить наш политологический анализ.
Во-вторых, математические средства, необходимые для анализа политических проблем, по всей вероятности, должны быть более разнообразными и сложными, нежели те, которые применяются для решения классических естественнонаучных проблем. В частности, модели социальных процессов по сравнению с моделями природных систем, вероятно, будут связаны с большей степенью случайности, а также с обработкой большего количества информации и большего числа переменных. В то же время появление электронных вычислительных устройств позволило иметь дело с формальными системами, куда более сложными, чем те, которые поддаются “ручной” обработке, а в будущем использование компьютеров обещает политологии еще более значительный прогресс. [c.499]
Дополнительная литература
Общие работы по математическому моделированию политических процессов:
Abrams R. Foundations of Political Analysis. N.Y.: Columbia University Press, 1980, введение в моделирование внутренней политики; Ordeshook P. A Political Theory Primer. N.Y.: Rontledge, 1992, рассматривает теорию игр. Rikеr W., Ordeshook P. An Introduction to Positive Political Theory. Englewood Cliffs (NJ.): Prentice-Hall, 1973; Zinnes D.A. Contemporary Research in International Relations. N.Y.: Free Press, 1976, моделирование международных отношений (с примерами); Nichdson M. Formal Theories in International Relations. Cambr.: Cambridge University Press, 1989, работа общего методологического характера. Rapoport A. Fights, Games, and Debates. Ann Arbor: University of Michigan Press, 1974, эта книга остается классической. Вrams St. The Presidential Election Game. New Haven (Conn.): Yale University Press, 1978; ibid. Paradoxes in Politics. N.Y.: Free Press, 1976; ibid. Superpower Games. New Haven (Conn.); Yale University Press, 1985, все это учебные вводные курсы. Общий обзор литературы, изданной в последнее, время, можно найти в: Jоnsоn Р., Shгоdt Ph. Analytic Theory and Methodology. // Сrоtty W., ed. Political-Science: Looking to the Future. Evanston, Ill.: Northwestern University Press, 1992. [c.500]
Учебники по математическому моделированию с политологическим уклоном: Оliniсk M. An Introduction to Mathematical Models in the Social and Life Sciences. Reading (Mass.): Addison-Wesley, 1978; Lave Ch., March J.G. An Introduction to Models in the Social Sciences. N.Y.: Harper & Row, 1978; Bender Ed. A. An Introduction to Mathematical Modeling. N.Y.: Wiley, 1978; Вurghes D.N., Wооds A.D. Mathematical Modeling in the Social, Management, and Life Sciences. N.Y.: Halsted, 1979; Archibald G.C, Lipseу R.G. An Introduction to Mathematical Economics. N.Y.: Harper & Row, 1976, введение в математическое моделирование экономических процессов. Очень интересна книга по моделированию, представляющая примеры самых разнообразных моделей с математическими расчетами: Сasti J.L. Alternative Realities. N.Y.; Wiley, 1989.
Динамические модели политического поведения: Huckfeldt R., Kohfeld С., Likens Th. Dynamic Models: An Introduction. Beverly Hills (Calif.): Sage, 1982; Goldberg S. Introduction to Difference Equations. N.Y.: Wiley, 1958; хорошим введением в историю вопроса о хаотических моделях является книга: Devаnеу R.L. An Introduction to Chaotic Dynamical Systems. Menio Park, Calif.: Cunomings, 1986.
Работы по динамическому моделированию международных отношений: Zinnes D.A., Gillespie J.V., eds. Mathematical Models in International Relations. N.Y.: Praeger, 1976; Zinnes D.A., ed. Conflict Processes and the Breakdown of International Systems. Denver: University of Denver, 1983.
Работы, вводящие в компьютерное моделирование международных отношений: Deutsсh К.W. et al. Problems of World Modeling. Cambridge (Mass.): Ballinger, 1977; Guetzkоw H., Valdez J J., eds. Simulated International Processes: Theories and Research in Global Modeling. Beverly Hills (Calif.): Sage, 1981; Hughes B.B. World Futures: A Critical Analysis of Alternatives. Baltimore: John Hopkins University Press, 1984.
Учебные пособия по теории игр: Davis M. Game Theory: A Nontechnical Introduction. N.Y.: Basic Books, 1983; Shubik M. Game Theory in the Social Sciences. Cambridge, Massachusetts Institute of Technology Press, 1985; Myerson R. Game Theory. Cambridge, Mass.: Harvard University Press, 1991; Fudenberg D., Tirole J. Game Theory. Cambridge, Mass.: Massachusetts Institute of Technology Press, 1991; Binmоre K. Fun and Game: A Text on Game Theory. Lexington, Mass.: D.C. Heath, 1992. Luce R.D., Raiffa H. Games and Decisions. N.Y.: Wiley, 1957; Williams J. The Compleat Strategyst. N.Y.: McGraw-Hill, 1954; Ordeshook P. Models of Strategic Choice in Politics. Ann Arbor., Mich: University of Michigan Press, 1989.
Работы по теории сотрудничества: Sсhеlling Th. The Strategy of Conflict. Oxford: Oxford University Press, 1960; Micromotives and Macrobehavior. N.Y.: Norton, 1978; Ordershook P. Game Theory and Political Theory. Cambridge University Press, 1986; Dixit A., Nalebuff B. Thinning Strategically. N.Y.: Norton, 1991. Axelrod R. The Evolution of Cooperation. N.Y.: Basic Books, 1984, об игре “дилемма заключенного”.
Работы, посвященные моделированию процесса выборов и процесса коллективного принятия решений, взаимосвязям между политическим и экономическим поведением: Frohlich N., Oppenheimer J.A. Modem Political Economy. Engtewood Cliffs (NJ.): Prentice-Hall, 1978; [c.501] Nemi R., Riker W. The Choice of Voting Systems // Scientific American. 1976. Vol. 234. P. 21-27; Enelow J.M., Hinich M.J. The Spartial Theory of Voting. Cambridge: Cambridge University Press, 1984; Stevens J.B. The Economics of Collective Choice. Boulder, Colo.: Westview Press, 1993; Dunleavy P. Democracy and Choice. N.Y.: Prentice Hall, 1991.
Среди книг по компьютерному моделированию следует отметить следующие: Hudson V. (ed.) Artificial Intelligence and International Politics. Boulder, Colo.: Westview Press, 1991; Benfer R.A., Вrendt E.F., Jr., Fuгbee L. Expert Systems. Newbury Park, Calif: Sage, 1991; Anderson P.A., Arrow K.J., Pines D. (eds.) The Economy as an Evolving Complex Systems. Reading, Mass.: Addison-Wesley, 1988. [c.502]
ПРИМЕЧАНИЯ
* © 1995 by Longman Publishers USA [c.466]
1 Lave Ch., March J.G. An Introduction to Models in the Social Sciences. N.Y.: Harper & Row, 1978. Р. 3. [c.500]
2 Возможно обратное. Вот почему целые команды международных наблюдателей направляются в страны, которые не владеют выборной процедурой. Это такие страны, как Камбоджа, Гаити и Намибия. [c.500]
3 Стабильность также определяет, что происходит с гонкой вооружений, когда она достигает так называемой точки равновесия (т.е. доходит до уровня вооружений, приемлемого для обеих сторон) и что-то начинает сдвигать ее с этого значения. Стабильная гонка вооружений вернется к равновесию, а нестабильная будет удаляться от него. [c.500]
4 Ахеlrоd R. The Evolution of Cooperation. N.Y.: Basic Books, 1984. P. 84. [c.500]
5 Необычный пример c применением пары “дилемма заключенного” см. также в: Riсh R.C. A Cooperative Approach to the Logic of Collective Action: Voluntary Organizations and the Prisoners' Dilemma. // Journal of Voluntary Action Research. 1988 (July-December). Vol.17. P. 5-18. [c.500]
6 Эта посылка, кажущаяся очевидной, признается отнюдь не всеми разработчиками математических моделей. Сторонники догматов “позитивной экономической теории” Милтона Фридмена настаивают (весьма яро) на том, что сила модели производна от валидности ее выводов и что для получения валидных выводов при необходимости могут быть использованы и необоснованные исходные допущения. Хотя в пользу такого подхода существуют свои аргументы, все же читателю литературы о математическом моделировании в том, что касается эмпирической валидности исходных допущений той или иной модели, лучше строго придерживаться критерия caveat emptor (качество на риске покупателя). [c.500]
18. НЕКОТОРЫЕ ОБОБЩЕНИЯ
Итак, мы предоставили основную информацию, нужную для того, чтобы спланировать и полностью осуществить исследовательский проект. На рис. 3.6 в гл. 3 представлен обобщающий взгляд на исследовательский процесс. На протяжении всего остального текста рассматривались компоненты этого процесса. В этой заключительной главе мы рассмотрим исследовательский процесс как единое целое. Мы обратим особое внимание на то, как в действительности те последовательные шаги, которые были разделены границами глав, переплетены и взаимозависимы. Нашей целью является облегчить вам разрешение исследовательских задач через полное понимание исследовательского процесса, а не через последовательное сосредоточение на каждой стадии по мере ее достижения. Ценность такого интегрированного понимания, прежде всего в том, что можно избежать многих рабочих проблем, если исследователь осознает, в чем заключается значение принятых на одной стадии решений для последующих стадий. [c.503]
РАЗРАБОТКА ГИПОТЕЗЫ, ИЗМЕРЕНИЯ И ПРОГРАММЫ ИССЛЕДОВАНИЯ
Любое исследование начинается с постановки исследовательского вопроса о том, почему вещи таковы, какими мы их видим. Как правило, мы пытаемся объяснить наблюдаемые события. Начинать поиски этих объяснений следует с литературы по социальным наукам, имеющей общее отношение к нашему предмету. Если повезет, то литературные поиски могут увенчаться готовым рецептом в форме готовой теории, которую наши предшественники разработали для объяснения явлений, подобных тем, которые интересуют нас. Однако чаще приходится использовать литературу более творчески, с тем чтобы создать по возможности лучшее объяснение, имея в распоряжении существующую по предмету информацию. Остальная часть исследовательского процесса, таким образом, будет [c.503] посвящена проверке этого объяснения, с тем чтобы увидеть, насколько оно улучшает наше понимание исследуемых явлений.
Первым шагом такой проверки является выдвижение гипотез, которые, как подсказывает логика, должны быть правильны, если наши объяснения верны. У этих гипотез есть несколько ключевых функций. Во-первых, они обозначают этапы анализа, которые необходимо соблюсти, если мы хотим проверить наши объяснения. Во-вторых, они выделяют переменные, для которых нужно разработать показатель. И наконец, гипотезы предлагают такие способы организации изложения, которые позволят продемонстрировать надежность наших объяснений. Выдвигая гипотезы, мы всегда должны задаваться вопросом, а сможем ли мы в действительности наблюдать указанную взаимосвязь. Располагаем ли мы необходимыми данными или есть ли у нас требующийся для самостоятельного их сбора источник? Совершенно необходимо, чтобы исследователь выбирал гипотезы, которые можно проверить, исходя из наличного времени, степени своей подготовки и ресурсов. Поступать по-другому значит обречь себя на неудачу.
Далее, переменные, необходимые для работы с гипотезами, должны быть подготовлены так, чтобы можно было произвести нужные для расчетов измерения, позволяющие сделать выводы о верности наших предположений. При выборе инструментария или процедур измерения мы должны совершенно четко решить, располагаем ли мы необходимыми для их применения ресурсами. Если у нас нет достаточного времени, денег или других необходимых компонентов, мы не сможем провести процедуру измерения. Кроме того, мы должны выяснить, не изменяется ли смысл любого из объектов, задействованных в нашем исследовании, когда мы заменяем его результатами измерений, призванными представлять его. Хотя надежность анализа данных можно оценить практически всегда, вопрос о надежности следует ставить еще перед этапом сбора данных, поскольку никакой самый хитрый анализ не сделает ненадежное измерение полезным.
Уже на этапе измерения полезно подумать о той стадии, когда будет осуществляться анализ данных. Следует внимательно проверить свои гипотезы, чтобы решить, [c.504] какие именно математические и статистические тесты понадобятся для проверки их верности. Затем нужно убедиться, что выбранные способы измерения действительно подходят для этого вида данных. Главное, что нужно здесь принять во внимание, это соответствие уровня измерений, используемого при подготовке данных, уровню измерений, требующемуся для проведения статистических расчетов, которые будут использованы при проверке гипотез. Если вы планируете использовать измерение связи, для которого необходим порядковый уровень измерений, удостоверьтесь сначала, что в результате процедур измерения вы действительно получили порядковые данные. Второе, о чем следует помнить, соответствие распределения значений переменной, полученного в результате процедур измерения, распределению, удовлетворяющему тем статистическим процедурам, которые вы собираетесь применить. Если вы планируете провести тест на статистическую значимость, требующую нормального распределения, следует убедиться, что измерительные процедуры не помешают получению распределения, близкого к нормальному.
Следующий шагэто разработка программы исследования, для того чтобы наметить приложение измерительных процедур. Центральной задачей программы является гарантия нашей уверенности в том, что любая наблюдаемая взаимосвязь есть результат процессов, описанных в наших объяснениях, а не каких-либо других процессов. Программа обеспечивает эту гарантию путем предоставления возможности исключить альтернативную гипотезу. Добротная программа исследования начинается с обзора литературы. На стадии этого обзора (с помощью логического анализа положения дел) уже можно выделить основные альтернативные гипотезы, которые должны быть исключены, прежде чем мы убедимся в верности наших основных предположений о наблюдаемых явлениях.
В исследовательскую программу включаются: (1) выработка перечня процедур, необходимых для проверки гипотезы; (2) решение о том, какие нужно собрать данные (о ком или о чем, в каком порядке, какими путями, на каких условиях) для проведения этих процедур; (3) предварительная прикидка всех результатов, возможных вследствие этих процедур (отсутствие связи, положительная [c.505] связь, отрицательная связь и т.д.); (4) формулирование основных альтернативных гипотез, которые могут объяснить каждый возможный результат; (5) организация сбора дополнительных данных, которые позволят провести дополнительные операции, необходимые для исключения альтернативных гипотез, как только будут получены надежны объяснения какого-либо из результатов.
Важно, чтобы, разрабатывая программу, мы знали, какой вид статистического анализа мы собираемся применить, поскольку именно на стадии планирования принимается решение о том, какие данные необходимы для анализа. Например, если на стадии анализа данных предполагается работа со многими переменными, мы должны быть уверены, что исследовательский план предполагает получение достаточного количества случаев для такой сложной разбивки массива. Если мы хотим, чтобы партийная принадлежность оставалась неизменной при измерении силы связи между двумя основными переменными для членов каждой партии отдельно, мы должны включить достаточное количество членов каждой партии, для того чтобы подсчеты силы связи были надежными, и предусмотреть наличие информации о партийной принадлежности. Если мы планируем применить анализ временных рядов в исследовании, где используются сводные данные, мы должны быть уверены в том, что сведения о значения НП относятся к периоду более раннему, чем момент сбора данных о ЗП, если у нас есть теоретические посылки к тому, чтобы полагать, что в воздействии НП на ЗП есть запаздывание.
При планировании исследования, так же как и при выборе гипотез и основных методов, очень важно задать себе вопрос насколько посильную мы поставили задачу. Самая лучшая в мире исследовательская программа окажется бесполезной, если у исследователя нет средств к ее реализации. Вы должны очень внимательно относиться к логике сбора данных в процессе разработки исследовательской программы. [c.506]
СБОР И АНАЛИЗ ДАННЫХ
Как мы уже отметили, исследовательский процесс, сбор и анализ данных имеют целью проверку гипотез. Мы представили вам основные правила, которые следует [c.506] соблюдать при использовании различных методов сбора и анализа данных, и в гл. 2 описали процесс восхождения от эмпирических результатов к теории, что замыкает круг исследования. Нет необходимости повторять все эти рассуждения. Однако нам хотелось бы сделать два замечания, которые при изложении по главам, может быть, не были столь заметны, как нам этого хотелось бы.
Первое замечание заключается в том, что, хотя мы рассказывали о каждом способе сбора данных отдельно, их не стоит разделять в процессе исследования. По сути дела, в использовании самых разнообразных способов сбора данных в исследовании есть свои резоны. Во-первых, различные методы могут служить разным задачам. Исследователи могут, например, использовать прямое наблюдение за какой-либо политической группой для сбора общей информации, нужной для объяснения, а затем использовать опрос для сбора точных данных, которыми можно проверить это объяснение. Кроме того, использовать при сборе данных разные методы бывает полезно еще и потому, что большее количество способов измерений способно повысить доверие к надежности результатов, о чем говорилось в гл. 3. Например, при изучении изменений в качестве работы общественных служб в пригородах полезно взаимное подтверждение данных о качестве данных, полученных с помощью опросов, сводных данных, официальных сведений, интервью с официальными лицами и оценок квалифицированных экспертов. Если все эти наблюдения представляют схожие распределения в пригородах, исследователь может быть вполне уверен, что качество служб измерено точно.
Второе замечание состоит в том, что эмпирическое исследование может быть подготовительным по характеру. Мы можем использовать его не для проверки гипотез, выведенных из объяснений, а прежде всего для того, чтобы обеспечить данные, которые будут использоваться для формулирования объяснений. Фактически каждый исследовательский проект обычно поднимает новые вопросы, предлагает новые объяснения и ведет к новым исследованиям. Если вы вернетесь к рис. 3.6, то заметите, что существуют прямые связи между формулированием наблюдаемых взаимосвязей и гипотезами. Эти прямые связи суть результат приложения индуктивной логики к анализу [c.507] данных. Все это может стать важным шагом в эмпирическом исследовании, поскольку ведет к новому этапу анализа данных, который позволит исследователю усовершенствовать и тщательно обосновать объяснения в тех аспектах, которые не предполагались на стадии планирования, или даже, без дополнительных новых данных, произвести проверку объяснений, которая также ранее не предполагалась. [c.508]
КОНТРОЛЬНЫЙ БЛАНК ДЛЯ ОЦЕНКИ ИССЛЕДОВАНИЙ
При оценке чужого или планирования своего собственного исследования часто бывает полезно отступить от частностей каждого этапа и попытаться охватить исследование целиком, задаваясь вопросом, удовлетворяет ли оно некоторым общим, но ясно сформулированным требованиям, предъявляемым к глубокому эмпирическому исследованию. Чтобы облегчить вам эту задачу, мы предлагаем в табл. 18.1 перечень того, что следует проверить. Вопросы расположены примерно в той последовательности, в которой обычно встают серьезные проблемы в изложении исследования или в процессе работы. Правила, предложенные в этих вопросах, достаточно широки, и проект, выдержавший проверку по всем этим пунктам, может все же содержать более или менее крупные технические ошибки, но, если вы сможете ответить “да” на каждый из вопросов, оцениваемое исследование скорее всего свободно от тех ошибок, которые вы научились определять по этой книге, и может послужить базой для основательной работы.
Используя этот перечень вопросов, помните о трех вещах. Во-первых, не все вопросы подходят для всех исследовательских проектов. Предварительные исследования, например, могут не заниматься проверкой гипотез, а исследования, в которых применялись методы направленных опросов, иногда не требуют случайной выборки. Во-вторых, вопросы относятся скорее к техническим, чем к содержательным аспектам исследований. Исследователь может все делать правильно, но тем не менее изучать объект, не заслуживающий внимания. Исследование только тогда имеет ценность, когда оно выполнено верно технически и одновременно посвящено важной проблеме. Оценивая [c.508] исследование, необходимо задаться вопросом, добавит ли оно при условии точного выполнения полезные знания к попыткам понять важные политические явления. Иногда невысокий технический уровень оправдан актуальностью и масштабом объекта исследования. В целом тот проект, который хоть что-то добавляет к нашим знаниям о важных явлениях, более ценен, чем тот, который открывает очень много нового о незначительном событии. В-третьих, немного таких исследований, которые свободны от ограниченности. Например, иногда бывает невозможно сделать репрезентативную выборку из огромной совокупности, будучи при каком-либо исследовании ограниченным в ресурсах. Иногда приходится выбирать какую-то подгруппу (например, проводить изучение политического поведения всех американцев на основе массива по одному штату). Такие ограничения становятся ошибкой только в том случае, если исследователю не удается принять их во внимание и соответствующим образом представить результаты работы.
Контрольный лист может использоваться для оценок как своих, так и чужих исследований. В качестве исследовательского упражнения вы можете выбрать ту часть, в которой изложены результаты исследовательского проекта, и оценить ее, используя контрольный лист, приведенный в табл. 18.1, выделяя все ошибки, которые вы сможете обнаружить, и объясняя, почему они являются ошибками. Мы поместили таблицу так, чтобы облегчить ее фотокопирование.
Последний комплекс принципов оценки исследования в табл. 18.1 несколько отличается от перечисленных выше технических аспектов. Исследование можно оценивать и с точки зрения соответствия этическим требованиям. Что этично, а что нет, чаще всего решает сам исследователь, так что эти требования могут достаточно широко варьироваться. Например, во время вьетнамской войны некоторые ученые в Соединенных Штатах отказались участвовать в работах, финансируемых теми федеральными организациями, которые, по их мнению, разделяли ответственность за войну. Другие же полагали, что источник финансирования исследования не имеет отношения к его этической стороне, и оценивали исследования только с точки зрения их содержания. Кроме подобных различий, [c.509] существует целый ряд общепринятых этических требований, относящихся ко всем общественным дисциплинам. Некоторые примеры представлены в Приложении Б. Все ученые, активно работающие в области политологии, должны иметь представление о тех этических проблемах, которые иногда возникают в научном процессе1.
Таблица 18.1.
Контрольный бланк для оценки исследования
1. Достаточно ли ясно поставлена исследовательская проблема? Достаточно ли мы знаем о задачах исследования, чтобы оценить весь проект? Насколько тесно исследование связано с какой-либо политической проблемой или темой? Достоен ли выбранный объект изучения?
2. Являются ли элементы анализа четко выделенными и верно выбранными при реализации всего проекта?
3. Являются ли понятия, используемые в исследовании, ясно и четко разработанными? Имеют ли эти понятия четкое эмпирическое выражение?
4. Достаточно ли ясно, какие объяснения проверяются? Если используется теория, то верна ли она логически? Проясняет ли она, как связаны различные понятия и какие причинные процессы работают?
5. Согласуется ли теория доказательства с существующей по предмету литературой? Насколько широк обзор литературы? Достаточно ли ясно показано соотношение данной работы с предыдущими исследованиями и более общими темами в области политологии?
6. Являются ли гипотезы, нуждающиеся в проверке, четко выделенными и верно сформулированными? Следуют ли они из тех доказательств или теории, которые нужно проверить? Можно ли вообще их эмпирически проверить?
7. Если проверяется более одной гипотезы, выделены ли связи между ними? Действительно ли эти гипотезы относятся к рассматриваемой теории и выявлена ли со всей очевидностью их роль в тестировании?
8. Являются ли исследуемые переменные четко выделенными, а их статус (независимая, зависимая, промежуточная, предварительная) определенным в гипотезе?
9. Включены ли в исследование переменные, которые могут изменить предполагаемые связи? (Например, можем ли мы ожидать наличие взаимосвязей как для мужчин, так и для женщин или как для индустриальных, так и неиндустриальных стран?)
10. Достаточно ли ясно изложена операционализация понятий и достаточно ли детально описаны процедуры измерения для того, чтобы другие исследователи могли повторить их? [c.510]
11. Насколько измерения валидны и надежны? Применяются ли тесты на надежность и достаточность? Замечены ли возможные невалидность и ненадежность данных и приняты ли меры к их устранению?
12. Является ли достаточно четким план исследования и годен ли он для необходимой проверки гипотез? Сформулированы ли альтернативные гипотезы и предусматривает ли план исследования изучение этих гипотез как альтернативного объяснения? Содержит ли план глубокое логическое обоснование выводов о причинах?
13. Четко ли выделена совокупность, интересующая исследователя? Является ли используемая выборка репрезантативной по отношению к совокупности? Если нет, то осознает ли исследователь те ограничения, которые это накладывает на результаты? Хорошели описаны процедуры выборки?
14. Соответствуют ли типу исследования, этапам анализа и виду искомой информации выбранные способы сбора данных (опрос, контент-анализ и т.д.)?
15. Полностью ли описан процесс сбора данных? Достаточно ли четко обозначены другие, кроме первичных источников, данные, чтобы последующие исследователи могли обратиться к ним?
16. Полно ли описаны и проверены системы кодировки, которые могут повлиять на измерения, такие, как группы с падающим доходом среди более широких категорий или восприятие отдельных видов ответов как доказательных или недоказательных?
17. Полно ли описаны индексы и шкалы? Сохраняют ли эти суммарные измерения смысл понятий? Не являются ли они одномерными (отражающими только одну лежащую в основе идею или мысль)?
18. Был ли заранее проверен инструментарий?
19. Были ли предприняты усилия к проверке результатов? (Например, достаточно ли настойчиво опрашивались респонденты? Предпринимались ли поиски альтернативных источников или сводных данных)?
20. При изложении данных достаточно ли верно иллюстрируют таблицы и схемы то, что они должны иллюстрировать? Достаточно ли полно они описаны в тексте и выделен ли их основной смысл? Не искажают ли они каким-либо образом результаты?
21. Снабжены ли таблицы и схемы достаточно ясными пояснениями, позволяющими легко разобраться в них?
22. Верны ли интерпретации таблиц и рисунков или они искажают данные?
23. Верно ли использованы описательные статистики (такие, как среднее геометрическое и стандартное отклонение) для интерпретации данных и дополнений к таблицам и рисункам? [c.511]
24. При изучении взаимосвязей между переменными предоставляют ли исследователи сведения о силе, форме и значимости связей?
25. Изучают ли исследователи возможные воздействия предшествующей, промежуточной и скрытой переменных? Пытаются ли они проконтролировать эти воздействия при анализе данных?
26. Соответствуют ли использованные статистические методики уровню измерения переменных и целям, для достижения которых они применяются?
27. Соответствуют ли данные тем мерам, которые были предприняты для обеспечения верного применения статистических методик (случайная выборка, нормальное распределение и т.д.)? Определили ли исследователи степень, до которой данные удовлетворяют этим допущениям?
28. Являются ли измерения статистической значимости верными и правильно ли они интерпретированы?
29. Исследовались ли с помощью статистики альтернативные гипотезы? Верно ли изложены и интерпретированы результаты этого?
30. Верно ли соотнесены все фрагменты анализа данных с общими выводами исследования? Соответствуют л и интерпретации самим данным и проверяемым теории и доказательствам?
31. Содержит ли ваше исследование:
а) точное изложение целей?
б) обзор литературы, достаточный, чтобы продемонстрировать свой определенный вклад?
в) соответственно описание плана, использованных данных и методов?
г) точно и ясно сформулированные выводы?
д) четко сформулированные результаты?
32. Действительно ли подкреплены сделанные выводы представленными данными и использованным планом исследования? Верны ли заявления авторов о вкладе исследования в разработку темы или же авторы сделали слишком далеко идущие выводы из своей работы?
33. Принимал ли автор во внимание этические проблемы, вставшие в ходе исследования? [c.512]
ЗАКЛЮЧЕНИЕ
Вооружившись сведениями, почерпнутыми из этой книги, вы можете успешно осуществить очень широкий круг эмпирических исследований. Однако вы должны понимать, что этот учебник лишь слегка затронул необъятную тему эмпирических политологических исследований. Десятки других книг, перечисленных в наших [c.512] списках дополнительной литературы, должны показать вам, что об этом еще очень многое можно сказать. Есть вещи, о которых из этой книги узнать нельзя.
В процессе исследования вы можете столкнуться со многими важными вопросами, на которые вам будет трудно ответить. Даже если вы постараетесь тщательно и точно следовать всем советам и правилам, может обнаружиться, что вы не в состоянии (1) выполнить какой-либо исследовательский проект или (2) получить такие результаты, которые более опытные исследователи признают недействительными, поскольку вы сделали ошибки, о которых вас не предупредили. Если вы последуете всему, что говорилось в первых вводных главах, вы, вероятно, сделаете минимум ошибок в формулировании гипотез, выборе инструментария, поисках литературы, разработке программы исследования. Главы о выборках и организации данных, может быть, содержат меньше конкретных рекомендаций, так как эти процессы более формальны и меньше зависят от конкретной ситуации каждого отдельного исследовательского проекта. Нам также не удалось представить вам полное описание всех способов сбора и анализа данных из-за их чрезвычайного разнообразия и сложных технических аспектов, так что мы советуем вам более обстоятельно изучить эти вопросы, прежде чем заявлять о своей компетенции в эмпирическом анализе. Списки дополнительной литературы в каждой главе являются хорошей отправной точкой для приобретения необходимой информации.
Мы предоставили вам солидную базу; теперь вы можете состояться как политолог. Надеемся, что вы, как и мы в свое время, найдете это занятие захватывающим и достойным и в конце концов согласитесь: игра стоит свеч! [c.513]
Примечание
1 Понять этические вопросы, иногда встающие перед исследователями, вам поможет кн.: Beanchamp T.L. et al., eds. Ethical Issues in Social Science Research. Baltimore: Johns Hopkinks University Press.
Таблица А.1
ТАБЛИЦА СЛУЧАЙНЫХ ЧИСЕЛ
10097 |
32533 |
|
76520 |
13586 |
|
34673 |
54876 |
|
80959 |
09117 |
|
39292 |
74945 |
66065 |
74717 |
|
34072 |
76850 |
|
36697 |
36170 |
|
65813 |
39885 |
|
11199 |
29170 |
98520 |
17767 |
|
14905 |
68607 |
|
22109 |
40558 |
|
60970 |
93433 |
|
50500 |
73998 |
|
|
|
|
|
|
|
|
|
|
|
|
[c.514] |
|
65481 |
17674 |
|
17468 |
50950 |
|
58047 |
76974 |
|
73039 |
57186 |
|
40218 |
16544 |
91499 |
14523 |
|
68479 |
27686 |
|
46162 |
83554 |
|
94750 |
89923 |
|
37089 |
20048 |
61196 |
90446 |
|
26457 |
47774 |
|
51924 |
33729 |
|
65394 |
59593 |
|
42582 |
60527 |
04493 |
52494 |
|
75246 |
33824 |
|
45862 |
51025 |
|
61962 |
79335 |
|
65337 |
12472 |
|
|
|
|
|
|
|
|
|
|
|
|
[c.515] |
|
32179 |
00597 |
|
87379 |
25241 |
|
05567 |
07007 |
|
86743 |
17157 |
|
85394 |
11838 |
98086 |
24826 |
|
45240 |
28404 |
|
44999 |
08896 |
|
39094 |
73407 |
|
35441 |
31880 |
74029 |
43902 |
|
77557 |
32270 |
|
97790 |
17119 |
|
52527 |
58021 |
|
80814 |
51748 |
Таблица А.2
Размер выборки для определения уровней точности
(в процентах с доверительным интервалом в 95%, р=0,5)
Размер |
Размер выборки для следующих уровней точности |
|||||
± 1% |
± 2% |
± 3% |
± 4% |
± 5% |
± 10% |
|
500 |
+ |
+ |
+ |
222 |
83 |
|
1 000 |
+ |
+ |
+ |
385 |
286 |
91 |
1 500 |
+ |
+ |
638 |
441 |
316 |
94 |
2 000 |
+ |
+ |
714 |
476 |
333 |
95 |
2 500 |
+ |
1 250 |
769 |
500 |
345 |
96 |
3 000 |
+ |
1 364 |
811 |
517 |
353 |
97 |
3 500 |
+ |
1 458 |
843 |
530 |
359 |
97 |
4 000 |
+ |
1 538 |
870 |
541 |
364 |
98 |
4 500 |
+ |
1 607 |
891 |
549 |
367 |
98 |
5 000 |
+ |
1 667 |
909 |
556 |
370 |
98 |
6 000 |
+ |
1 765 |
938 |
566 |
375 |
98 |
7 000 |
+ |
1 842 |
959 |
574 |
378 |
99 |
8 000 |
+ |
1 905 |
976 |
580 |
381 |
99 |
9 000 |
+ |
1 957 |
989 |
584 |
383 |
99 |
10 000 |
5 000 |
2 000 |
1 000 |
588 |
385 |
99 |
15 000 |
6 000 |
2 143 |
1 034 |
600 |
390 |
99 |
20 000 |
6 667 |
2 222 |
1 053 |
606 |
392 |
100 |
25 000 |
7 143 |
2 273 |
1 064 |
610 |
394 |
100 |
50 000 |
8 333 |
2 381 |
1 087 |
617 |
397 |
100 |
100 000 |
9 091 |
2 439 |
1 099 |
621 |
398 |
100 |
→ ∞ |
10 000 |
2 500 |
1 111 |
625 |
400 |
100 |
* Доля в выборке единиц, обладающих измеренными характеристиками; для других значений р необходимый размер выборки будет меньше.
+ В этих случаях более 50% объема выборки дадут большую точность, чем требуемая. Поскольку нормальное распределение это лишь грубое приближение к гипергеометрическому распределению, где п составляет более 50% oт N, формула, используемая при этих подсчетах, не применяется.
Источник: Таrо Y. Elementary Sampling Theory. Englewood Cliffs, NJ.: Prentice-Hall, 1967. Р.398.
Таблица А.3
Размер выборки для определения уровней точности
(в процентах с доверительным интервалом в 99,7 %, р=0,5)*
Размер |
Размер выборки для следующих уровней точности |
||||
± 1% |
± 2% |
± 3% |
± 4% |
± 5% |
|
500 |
+ |
+ |
+ |
+ |
+ |
1 000 |
+ |
+ |
+ |
+ |
474 |
1 500 |
+ |
+ |
+ |
726 |
563 |
2 000 |
+ |
+ |
+ |
826 |
621 |
2 500 |
+ |
+ |
+ |
900 |
662 |
3 000 |
+ |
+ |
1364 |
958 |
692 |
3 500 |
+ |
+ |
1458 |
1003 |
716 |
4 000 |
+ |
+ |
1539 |
1041 |
735 |
4 500 |
+ |
+ |
1607 |
1071 |
750 |
5 000 |
+ |
+ |
1667 |
1098 |
763 |
6 000 |
+ |
2903 |
1765 |
1139 |
783 |
7 000 |
+ |
3119 |
1842 |
1171 |
798 |
8 000 |
+ |
3303 |
1905 |
1196 |
809 |
9 000 |
+ |
3462 |
1957 |
1216 |
818 |
10 000 |
+ |
3600 |
2000 |
1233 |
826 |
15 000 |
+ |
4091 |
2143 |
1286 |
849 |
20 000 |
+ |
4390 |
2222 |
1314 |
861 |
25 000 |
11842 |
4592 |
2273 |
1331 |
869 |
50 000 |
15517 |
5056 |
2381 |
1368 |
884 |
100 000 |
18367 |
5325 |
2439 |
1387 |
892 |
→ ∞ |
22500 |
5625 |
2500 |
1406 |
900 |
* Доля в выборке единиц, обладающих измеренными характеристиками; для других значений р необходимый размер выборки будет меньше.
+ В этих случаях более 50% объема выборки дадут большую точность, чем требуемая. Поскольку нормальное распределение это лишь грубое приближение к гипергеометрическому распределению, где п составляет более 50% oт N, формула, используемая при этих подсчетах, не применяется.
Источник: Таrо Y. Elementary Sampling Theory. Englewood Cliffs, NJ.: Prentice-Hall, 1967. Р.399.
Таблица А.4
РАСПРЕЛЕЛЕНИЕ χ2
df |
0,05 |
0,01 |
0,001 |
df |
0,05 |
0,01 |
0,001 |
1 |
3,841 |
6,635 |
10,827 |
26 |
38,885 |
45,642 |
54,052 |
6 |
12,592 |
16,812 |
22,457 |
32 |
46,194 |
53,486 |
62,487 |
11 |
19,675 |
24,725 |
31,264 |
42 |
58,124 |
66,206 |
76,084 |
16 |
26,296 |
32,000 |
39,252 |
52 |
69,832 |
78,616 |
89,272 |
21 |
32,671 |
38,932 |
46,797 |
62 |
81,381 |
90,802 |
102,166 |
Примечание. Для нечетных значений п между 30 и 70 можно взять среднее геометрическое табличных значений для df 1 и df + l. Для больших значений п можно использовать выражение как нормальное отклонение с единичным колебанием, принимая во внимание, что вероятность χ2 соответствует вероятности одного из концов нормальной кривой.
Источник: Fisher R.A., Yates F. Statistical Tables for Biological, Agricultural and Medical Research, 6th ed., published by Longman Group, Ltd., London (previously published by Oliver and Boyd, Edinburgh), Table IV.
Таблица А.5
Значения коэффициента корреляции для различных уровней значимости
df |
0,1 |
0,05 |
0,01 |
0,001 |
df |
0,1 |
0,05 |
0,01 |
0,001 |
1 |
0,98769 |
0,99692 |
0,999877 |
0,9999988 |
16 |
0,4000 |
0,4683 |
0,5897 |
0,7084 |
6 |
0,6215 |
0,7067 |
0,8343 |
0,92493 |
25 |
0,3233 |
0,3809 |
0,4869 |
0,5974 |
11 |
0,4762 |
0,5529 |
0,6835 |
0,8010 |
50 |
0,2306 |
0,2732 |
0,3541 |
0,4433 |
Источник: Fisher R.A., Frank Y. Statistical Tables for Biological, Agricultural and Medical Research, 6th ed., published by Longman Group, Ltd., London (previously published by Oliver and Boyd, Edinburgh), Table VII.
Приложение Б
ЭТИЧЕСКИЕ ПРОБЛЕМЫ В ЭМПИРИЧЕСКИХ ИССЛЕДОВАНИЯХ
Американская политологическая ассоциация всесторонне изучила этические проблемы, встающие перед политологами в их преподавательской и исследовательской деятельности. В материалах, опубликованных в итоге этой большой работы, можно найти много полезных советов специалистам. Мы воспроизводим здесь часть правил поведения, разработанных ассоциацией, прямо касающихся эмпирических исследований1.
Правило 9. Спонсоры исследования несут ответственность за действия, которые могут поставить под вопрос деятельность американских академических институтов как независимых центров обучения и исследований. Финансирование исследований не должно служить для спонсоров прикрытием для извлечения необходимой им информации.
Правило 10. Открытость в области материальной поддержки исследований основной принцип научной деятельности. Государственные и негосударственные спонсоры, вкладывая средства в исследования, должны широко оповещать о своей материальной поддержке и требовать, чтобы в любом опубликованном исследовании, получившем их поддержку, сообщалось об источниках финансирования. Если негосударственный спонсор требует анонимности и это не влечет за собой никаких осложнений для исследования, то можно просто указать на характер финансирования.
Правило 11. Политологическое исследование, получившее государственную субсидию, не должно быть засекречено.
Правило 12. После того как оказана финансовая поддержка, спонсору не следует налагать никаких ограничений или требовать каких-либо разъяснений относительно методов, хода или содержания исследования.
Правило 13. Спонсор не несет никакой ответственности за выводы и данные, полученные исследователем, не может налагать на них никаких ограничений и препятствовать их публикации. [c.521]
Правило 14. Университету или колледжу не следует создавать исследовательские фонды на основе контрактов или пожертвований, характер которых не может быть обнародован.
Правило 15. Университет или колледж, имеющие в распоряжении исследовательские фонды, созданные на основе общественных и/или частных пожертвований, должны строить свою работу так, чтобы обеспечить благоразумное и достойное использование выделенных средств.
Правило 16. Распоряжаясь исследовательскими фондами, вверенными непосредственно их заботам, университет или колледж должны стремиться к тому, чтобы обеспечить ученым максимальный доступ к исследовательским материалам, гарантировать их свободу делать собственные выводы и возможность информировать о них.
Правило 17. Обратившись в фонд за поддержкой, исследователь должен
а) четко сформулировать причины, по которым он нуждается в помощи, и не прибегать к двусмысленным уловкам, чтобы сделать свое исследование более привлекательным для финансирования;
б) указать количество времени, которое он лично планирует потратить на исследовательскую работу;
в) указать другие источники финансирования, если они есть;
г) отказаться от принятия условий, если они, по его мнению, стесняют его свободу и независимость как ученого.
Правило 18. При проведении научной работы, которая финансируется из фонда, исследователь
а) несет персональную ответственность за методы, ход и содержание исследования;
б) должен избегать любого обмана или неверного представления о причастности его самого, его респондентов, субъектов исследования к получению информации, не имеющей отношения к исследованию, или об использовании самого исследования в качестве прикрытия для извлечения такой информации;
в) должен воздерживаться от использования своего служебного положения для получения данных и исследовательских материалов для ненаучных целей; [c.522]
г) не должен получать от правительственных учреждений дополнительной помощи, если требуется провести исследование за рубежом по причинам, не оговоренным заранее.
Правило 19. Пользуясь исследовательским фондом, исследователю необходимо
а) рассчитывать свое время, соблюдать отчетность, подчиняться требованиям, выдвигаемым к проекту, тесно сотрудничать с администрацией университета для удовлетворения этих требований;
б) избегать путаницы между фондами на исследовательские проекты (государственными и персональными), фондами для одного проекта и фондами для другого.
Правило 20. Что касается публикации результатов исследования, исследователь
а) несет персональную ответственность за публикацию;
б) должен обнародовать источники финансовой поддержки; в случае когда требуется анонимность спонсора, можно ограничиться указанием на характер финансирования;
в) должен указать все условия, поставленные спонсорами или другими финансирующими лицами относительно исследования и публикации;
г) должен добросовестно проинформировать о любой дополнительной поддержке, оказанной во время проведения исследования;
д) должен твердо придерживаться любых требований, выдвинутых финансирующей организацией.
Американская социологическая ассоциация также разработала кодекс чести, которому необходимо следовать тем ученым, перед которыми в процессе исследования встают проблемы этического характера. Ниже мы предлагаем некоторые принципы этого кодекса, которые распространяются в основном на взаимоотношения между исследователем и субъектами исследования. Хотя этот кодекс создан для социологов, его правила достаточно широки, чтобы быть применимыми к любым социальным наукам, и везде вместо слова “социолог” можно читать “исследователь”2.
1. Объективность в исследования. В своей работе социолог должен придерживаться объективной реальности.
2. Целостность исследования. Социолог должен осознавать свои способности и, если требуется, обращаться за [c.523] помощью к другим специалистам; не браться за работы вне его компетенции. Не следует переоценивать свои возможности или возможности своих сотрудников в осуществлении конкретного исследовательского проекта.
3. Уважение личности исследуемого. Честь и достоинство личности обследуемого его неотъемлемое право, которое социолог должен уважать.
4. Защита обследуемых от личных посягательств. В ходе исследования социолог должен избегать нанесения личного ущерба лицам, подвергаемым обследованию.
5. Гарантия конфиденциальности исследовательских данных. Конфиденциальные данные, полученные от опрашиваемого, считаются собственностью социолога. Даже если характер информации таков, что не подлежит охране законом, социолог должен, насколько возможно, защищать своих информаторов. Обещания, данные информатору, должны быть соблюдены. Вместе с тем социолог не обязан скрывать информацию о нарушении обязательств как со стороны отдельных информаторов, так и организаций.
Если информатор или другое лицо, дававшее информацию, пожелает, он может официально освободить исследователя от обязательств конфиденциальности. Условия, изложенные в этом пункте, относятся ко всем участникам исследовательского проекта (то есть интервьюерам, кодировщикам, служащим и т.д.), и руководитель проекта обязан поставить в известность всех, принимающих в нем участие, о необходимости и важности соблюдения конфиденциальности данных. В обязанности социолога входит использование и хранение первичных данных, в которых упомянуты имена опрашиваемых. Если требуется, в публикациях нужно устранить возможность выяснения личности опрашиваемых лиц или точное название упомянутых организаций.
6. Изложение результатов исследования. Социолог должен излагать результаты своего исследования честно и без искажений. Не следует опускать те данные, которые могут способствовать появлению принципиально иной интерпретации результатов.
7. Правильное понимание роли исследователя. Социолог не должен использовать свое положение для получения информации для иных, непрофессиональных целей. [c.524]
8. Сотрудничество и помощь в ходе исследования. Социолог должен информировать о любой дополнительной помощи и сотрудничестве с другими специалистами в ходе исследования.
9. Сведения об источниках финансовой поддержки. Социолог должен полностью отчитываться обо всех источниках финансовой поддержки в публикациях исследовательских материалов и обо всех особых отношениях со спонсором, которые могут повлиять на интерпретацию результатов.
10. Давление со стороны спонсора на итоговые характер исследования. Социолог обязан публично заявить обо всех случаях давления спонсора или других финансирующих проект лиц на конечные результаты исследовательского проекта (если такое давление было).
11. К вопросу об этике научных контактов. Социолог не должен принимать пожертвований, воздерживаться от контактов или условий, которые, по его мнению, не соответствуют вышеизложенным принципам, и обязан открыто заявить о прекращении работ или отказаться участвовать в проекте, если он обнаружит подобные посягательства и не найдет возможностей к их устранению.
Американская ассоциация изучения общественного мнения также имеет свой собственный кодекс чести3, которому должны следовать в своей практической деятельности и политологи, и социологи. [c.525]
ПРИМЕЧАНИЯ
1 См. в Ethical Problems of Academic Political Scientists. Washington, D.Q: American Political Association, 1968, pp. 1819.
2 См. в: Toward a Code of Ethics for Sociologists. “The American Sociologist”, 3 (November 1968), p. 318.
3 См. в Code of Professional Ethics and Practices Courtesy of the American Assosiation for Public Opinion Research.
СЛОВАРЬ ТЕРМИНОВ
Аддитивный индекс (additive index) параметр, образуемый посредством сложения показателей, характеризующих различные аспекты одного и того же понятия.
Анализ временного (динамического) ряда (time-series analysis) метод анализа данных, основанный на построении регрессии и ставящий целью установление причинных связей (зависимостей) с помощью упорядочения данных.
Анкета (questionnaire) опросный инструмент, предназначенный для использования в ходе интервью.
Антецедентная переменная (antecedent variable) переменная, которая вызывает изменения в другой переменной, рассматриваемой в рамках данной гипотезы как независимая.
Бета-вес, или бета-коэффициент (beta weight or beta coefficient) стандартизованный коэффициент частной регрессии, применяемый для сравнения результатов влияния различных независимых переменных на зависимую переменную.
Бесплановый (unscheduled) в свободной форме, не обусловленный применением какого-либо определенного инструмента исследования (в интервью, наблюдениях и т.п.).
Бланк интервью (interview schedule) вопросник, используемый в очных интервью.
Валндность (обоснованность) (validity) степень соответствия меры (показателя) тому понятию, которое она (он) призвана отражать.
Взаимоисключаемость (mutual exclusivity) свойство мер (показателей), в соответствии с которым каждый данный случай может быть приписан лишь к одной категории.
Взвешенный индекс (weighted index) индекс, в котором оценки, выставляемые в рамках одной переменной, стандартизируются относительно оценок, выставляемых в рамках какой-то другой переменной, что позволяет проводить обоснованное сравнение между оценками данного индекса для различных случаев.
Внешняя валидность (обоснованность) (external validity) вид теоретической валидности, выражающийся в корреляции некоторого показателя (меры) исходного понятия с показателями (мерами) других понятий, согласно теории связанных с исходным.
Внутренняя валидность (обоснованность) (internal validity) вид теоретической валидности, выражающийся в корреляции нескольких показателей (мер) одного и того же понятия. [c.526]
Вопрос с закрытым набором возможных ответов (closed-ended question) вопрос, ответ на который респонденту предлагается выбирать из заданного списка.
Вопрос с открытыми возможностями для ответа (open-ended question) вопрос, допускающий ответ в свободной форме.
Вторичный анализ (secondary analysis) анализ данных, собранных когда-то в прошлом другим исследователем.
Выборка (sample) подгруппа случаев, представляющая более крупную группу, откуда они взяты.
Гамма-коэффициент (G) (gamma) коэффициент связи между двумя порядковыми переменными.
Генерализуемость (generalizability) возможность распространения результатов анализа ограниченного числа случаев (признаков) на большее количество случаев (признаков).
Генеральная совокупность (larger population) совокупность, из которой взята данная выборка.
Гетерогенность (heterogeneity) степень различия членов некоторой совокупности между собой.
Гипотеза (hypothesis) утверждение, предсказывающее существование некоторой зависимости (некоторых зависимостей) между переменными.
Гистограмма (histogram) столбиковая диаграмма, на которой показано распределение значений некоторой переменной.
Гомогенность (homogenity) степень сходства членов некоторой совокупности между собой.
Данные (data) результаты наблюдений или информация, о действительности получаемая в ходе исследования.
Двумерная статистика (bivariate statistics) статистика, обобщенно отражающая зависимость между двумя переменными.
Двусторонняя столбиковая диаграмма (bilateral bar chart) график, на котором столбики изображают варьирование переменной выше или ниже некоторой нормы.
Дедукция (deduction) рассуждение, которое движется от абстрактных утверждений об общих соотношениях к конкретным утверждениям об отдельных процессах.
Демографическая группа (demographic group) группа индивидов, выделяемая на основании какого-либо личностного признака, свойственного всем ее членам.
Диаграмма рассеяния (scatter diagram) график, в суммарном виде отражающий распределение признаков относительно двух переменных с использованием пунктира для обозначения результатов наблюдений.
Динамическая модель (dynamic model) математическая модель, описывающая развитие процесса во времени. [c.527]
Днскриминантная валидность (обоснованность) (discriminant validity) свойство некоторого показателя (меры) обладать валидностью по отношению лишь к какому-то одному понятию в противовес к другим понятиям.
Единица анализа (unit of analysis) минимальный компонент или элемент анализа, относительно которого делаются те или иные обобщения.
Зависимая переменная (dependent variable) переменная, меняющая свое значение в соответствии с изменениями значений другой переменной.
Значение (value) характеристика или оценка определенного признака в пределах данной переменной.
Игра “дилемма заключенного” (prisoner's dilemma game) математическая игра, в которой игрокам выгоднее сотрудничать, а не обманывать друг друга, несмотря на наличие побудительного стимула к обману.
Игра с нулевой суммой (zero-sum game) математическая игра, в которой платежи сорганизованы таким образом, что один игрок выигрывает столько же, сколько другой проигрывает.
Измерение (measurement) применение инструментария для подсчета или любого другого способа количественной характеристики результатов наблюдений над действительностью.
Измерение разброса (дисперсии) (measure of dispersion) показатель того, как колеблются (варьируют) значения признаков вокруг средней тенденции, т.е. показатель ее репрезентативности.
Имитационная модель (simulation) математическая компьютерная модель, в которую введены определенные динамические элементы.
Индекс (index) результат объединения двух или более связанных показателей в один более объемлющий показатель.
Индукция (induction) рассуждение, в котором выводы о том, что наблюдалось, переносятся на то, что не наблюдалось, т.е. рассуждение, в котором на основании конкретного опыта строится абстрактная теория.
Инструментализация (instrumentation) спецификация процедур, необходимых при ведении наблюдения; уточнение измерительных приемов или инструментария исследования.
Интервальное измерение (interval measurement) измерение, классифицирующее и упорядочивающее объекты, после того как они измерены на интервальном уровне, а также показывающее, насколько большим или меньшим количеством измеряемого свойства по сравнению с другими объектами они характеризуются. [c.528]
Каузальная модель (causal model) модель, графически изображающая множество зависимостей между понятиями (или переменными), когда изменение в одном (или более) из них предшествует или вызывает изменение в другом (других).
Каузальные отношения (causal relationships) зависимость между переменными или понятиями, при которой изменение в одной (или более) переменной или понятии влечет за собой изменение в другой (других).
Квазиэкспериментальное исследование (quasi-experimental design) исследование, в котором методы сбора и анализа данных по степени контроля максимально приближены к экспериментальному исследованию.
Квантиль (quantile) показатель (мера) позиции внутри распределения.
Квантильный ранг (quantile range) показатель (мера) дисперсии для порядковых переменных.
Квотная выборка (quota sample) выборка, члены которой отобраны так, чтобы они в совокупности укладывались в заранее данное распределение признаков.
Кластерная (гнездовая) (cluster sample) выборка см.: многоступенчатая случайная районированная выборка.
Ключ (key) объяснение символов, использованных в некотором графическом изображении.
Ключевое слово или ключевая фраза (key word or key phrase) слово или фраза, содержательно связанное(ая) с данным понятием и используемое(ая) при библиографическом поиске.
Книга кодов (codebook) перечень переменных и других величин с указанием кодов, приписанных им в данном исследовании.
Ковариационные отношения (covariational relationships) зависимость, при которой два или более понятия или переменные проявляют тенденцию изменяться одновременно.
Когортное обследование (cohort study) обследование, основанное на повторяющихся в разное время опросах определенной группы населения (например, людей, родившихся в определенном году).
Кодирование (coding) средство, с помощью которого информации придается форма связного и продолжительного сообщения.
Кодировальный бланк (coding sheet) структурированный формуляр для фиксации данных.
Кодировщик (coder) сотрудник, приписывающий определенное количество баллов каждому ответу или случаю (обычно в рамках контент-анализа). [c.529]
Компьютерная имитация (computer simulation) математическая модель, оперирующая сложной системой динамических уравнений и реализованная на ЭВМ.
Компьютерная модель (computational model) математическая модель, оперирующая нечисленными алгоритмами и реализованная на ЭВМ.
Конвергентная валидность (обоснованность) (convergent validity) свойство нескольких показателей (мер) одного м того же понятия приводить к одному и тому же результату.
Конкурирующая гипотеза (alternative rival hypothesis) альтернативное объяснение результатов исследования, которое с логической точки зрения не может быть верным, если верна исходная гипотеза.
Конструктная теоретическая валидность (обоснованность) (construct validity) свойство некоторого показателя (меры) вести себя так, как ожидается в соответствии с теорией.
Контент-анализ (content-analysis) методика, используемая при изучении коммуникативно значимых материалов и поведения.
Контроль (control) ограничение факторов, влияющих на переменную, над которой ведется наблюдение (в эксперименте); поддержание значений некоторой переменной на постоянном уровне при изучении зависимости (зависимостей) между двумя (и более) другими переменными (в анализе данных).
Контроль за частотным распределением (frequency distribution control) процедура, при которой экспериментальные и контрольные группы приравниваются друг к другу посредством объединения в группы лиц, сопоставимых по совокупности своих признаков.
Контрольная группа (control group) лица, участвующие в эксперименте и находящиеся вне сферы действия независимой переменной (опытного события).
Контрольное тестирование (posttest) измерение (в эксперименте), проводящееся после наступления проверяемого события.
Косвенная каузацня (indirect causation) явление, при котором одна переменная оказывает причинное воздействие на другую только посредством изменения значений некоторой третьей переменной (переменных), которая (которые) затем непосредственно влияет(ют) на вторую.
Коэффициент вариации (variation ratio) мера (показатель) дисперсии для номинальных переменных.
Коэффициент корреляции (r) (correlation coefficient) коэффициент связи между двумя интервальными переменными, служащий показателем точности подбора экспериментальных точек относительно линии регрессии. [c.530]
Коэффициент связи (coefficient of association) показатель степени и направления связи (ассоциации) между двумя переменными.
Q-сортнровка (Q-sort) методика, используемая в контент-анализе для измерения силы оценочных суждений.
Линия регрессии (regression line) линия, которая точнее всего отражает распределение экспериментальных точек на диаграмме рассеяния и крутизна наклона которой характеризует зависимость между двумя интервальными переменными.
Линейная диаграмма (line diagram) график, на котором соответствующие результатам наблюдений точки соединены между собой линиями, что позволяет отражать направление развития или другую зависимость.
Лонгнтюдный опрос (longitudinal survey) опрос, позволяющий сравнивать элементы поведения или признаки данного множества случаев, взятые в разные моменты времени.
Лямбда-коэффициент (λ) (lambda coefficient) коэффициент связи (ассоциации) между двумя номинальными переменными.
Маргинальное распределение (marginal) распределение частот в том виде. в каком оно появляется в итоговых колонках таблицы взаимной сопряженности признаков.
Математическая модель (mathematical model) упрощенное описание процесса или ситуации в математических выражениях.
Медиана (median) мера средней тенденции для порядковых переменных.
Мнимое отношение (spurious relationship) зависимость, при которой две переменные коварьируют только в силу случайности или в силу воздействия какой-то другой переменной.
Многомерная статистика (multivariate statistics) статистика, относящаяся к зависимостям между более чем двумя переменными.
Многомерный (multidimensional) имеющий несколько сторон или элементов.
Многоступенчатая случайная районированная выборка (multistage random area sample) выборка, в которой для анализа отобраны не индивиды, а скорее географические единицы или их аналоги.
Множественная регрессия (multiple regression) статистическая процедура изучения зависимости, существующей между зависимой переменной и несколькими независимыми переменными.
Множественная обусловленность (multiple causation) обычное положение в социальных науках, когда некоторое следствие является результатом более чем одной причины. [c.531]
Множественные показатели (multiple indicators) две и более меры одной и той же переменной, используемые для усиления валидности показателей.
Мода (mode) мера средней тенденции для номинальных переменных.
Модель (model) упрощенное представление действительности.
Модель ожидаемой полезности (expected utility model) математическая модель, основанная на предположении, что человек принимает решения, исходя из суммы возможных платежей, помноженных на вероятности их выплаты (т.е. на вероятности наступления соответствующих исходов).
Модель оптимизации (optimization model) математическая модель, характеризующаяся предположением, что некоторые переменные в данном процессе или ситуации максимизируются или минимизируются.
Момент наблюдения (observation point) время наблюдения или измерения.
Мультиколлинеарность (multicollinearity) положение, при котором одна или более независимых переменных, входящих в уравнение регрессии, являются точными линейными функциями от одной или более других независимых переменных того же уравнения.
Мультипликативный индекс (multiplicative index) единая мера, составленная из комбинации мер разных, но связанных между собой понятий.
Наблюдение (observation) (в науке) применение инструмента для приписывания анализируемым случаям определенных значений показателей.
Надежность (reliability) ~ степень постоянства, с которой данный измерительный инструмент позволяет приписывать различным случаям определенные значения.
Надежность интеркодирования (intercoder reliability) соответствие, достигнутое относительно значений, приписываемых одному и тому же или сходным признакам разными независимыми наблюдателями.
Направленное интервьюирование (elite interviewing) сбор данных с помощью интервьюирования, имеющий целью получение от респондента специфической информации.
Научное исследование (scientific research) это метод проверки теорий и гипотез путем применения определенных правил анализа к данным, полученным в результате наблюдений и интерпретации этих наблюдений в строго заданных условиях.
Независимая переменная (independent variable) переменная, изменение значений которой влияет на значения некоторой другой переменной. [c.532]
Необработанные данные (raw data) результаты нестандартизованных или еще не обработанных наблюдений.
Непосредственное (прямое) наблюдение (direct observation) метод, используемый главным образом при изучении группового поведения.
Неформальная модель (informal model) упрощенное описание процесса или ситуации в терминах естественного языка.
Номинальное измерение (nominal measurement) измерение, которое просто классифицирует случаи безотносительно к их рангу или к расстояниям между ними.
Нормальное распределение (normal distribution) симметричное одновершинное распределение с максимумом в середине, в котором мода, медиана и средняя принимают одно и то же значение.
Нормативный (normative) относящийся или характеризуемый предпочтениями или оценочными суждениями.
Объяснительное исследование (explanatory research) исследование, использующее результаты наблюдений над действительностью для проверки теории или для углубления представлений о моделях поведения в рамках некоторой теории.
Одномерная статистика (univariate statistics) статистика, относящаяся к/или описывающая одну переменную.
Операционализация (operationalization) процесс преобразования абстрактных понятий в конкретные термины.
Описательное исследование (descriptive research) исследование, занимающееся измерением какого-либо аспекта действительности, скорее ради него самого, нежели ради развития или проверки некоторой теории.
Опрос (survey research) метод, используемый для изучения мнений, отношений или поведения индивидов.
Отрицательное отношение (negative relationship) такое отношение, когда соответствующие друг другу значения двух разных переменных изменяются в противоположных направлениях.
Очевидная валидность (обоснованность) (face validity) свойство показателя (меры), придающее ему интуитивно ощущаемую достоверность.
Очное интервьюирование (in-person interview) тип опроса, в ходе которого итнтервьюер получает непосредственно от респондента ответы на свои вопросы.
Ошибка выборки (sampling error) несоответствие между признаками выборки и признаками генеральной совокупности.
Ошибка измерения (measurement error) неточности в наблюдениях над действительностью; расхождения между действительностью и зарегистрированными результатами наблюдений над нею. [c.533]
Панельное обследование (panel study) обследование, в котором проводится серия наблюдений в разные моменты времени над одной и той же группой изучаемых объектов.
Параметр (parameter) любой признак совокупности (в отличие от признака выборки).
Пат-анализ (path analysis) статистический метод, позволяющий оценить степень взаимовлияния переменных в причинно-следственной модели.
Перекрестное обследование (cross-sectional survey) обследование, при котором сравниваются единовременно полученные данные различных случаев.
Переменная (variable) признак, принимающий разные значения для различных случаев или для различных моментов времени в рамках одного случая.
Перечневая таблица (enumerative table) простой перечень данных исследований в виде таблицы.
Перфоратор (keypunch) устройство, переводящее цифры, буквы и другие языковые символы в комбинации проколов (перфораций), доступных для обработки на ЭВМ.
Пилотажное исследование (pilot study) мелкомасштабная проверка мер и процедур исследования, преследующая цель заблаговременно выявить все слабые места в его плане или инструментарии.
Поисковое исследование (exploratory research) исследование, ориентированное на обнаружение тех факторов, которые следует учитывать в теории данного предмета.
Показатель (indicator) мера, специфичная для некоторой переменной.
Полевой эксперимент (field experiment) частичное осуществление эксперимента в условиях реальной действительности (в противоположность лабораторным условиям).
Положительное отношение (positive relationship) такое отношение, когда соответствующие друг другу значения двух разных переменных изменяются в одном и том же направлении.
Понятие (concept) слово или фраза, символизирующие некоторое представление или явление.
Порядковое измерение (ordinal measurement) измерение, классифицирующее и упорядочивающее случаи безотносительно к расстояниям между ними.
Построение модели (model specification) отбор переменных для включения их в модель регрессии и определение связей, существующих между этими переменными.
Почтовый опрос (mail survey) тип опроса, в ходе которого респондент отвечает на вопросы интервьюера, отправленные ему по почте. [c.534]
Прагматическая валидность (обоснованность) (pragmatic validity) свойство показателя (меры) некоторого понятия, проявляющееся в возможности использования его для предсказания значений показателей других понятий.
Предварительное тестирование (pretest) (в эксперименте) измерение, проводящееся до наступления проверяемого события.
Преобразование данных (data transformation) видоизменение данных, направленное на выполнение тех условий, которых требует определенный метод анализа.
Прикладное исследование (applied research) исследование, первичной целью которого является изучение или решение конкретных политических проблем.
Принцип максимального различия систем (most-different-systems design) стратегия сравнительно-политологического исследования, при которой признаки, различающие анализируемые объекты, исключаются из объяснения элементов сходства, имеющихся между этими объектами.
Принцип максимального сходства систем (most-similar-systems design) стратегия сравнительно-политологического исследования, при которой изучаются сходные объекты, чтобы при рассмотрении различий между ними общие для них признаки можно было считать константой.
Пробный вопрос (contingency question) фильтрующий прием, используемый при опросе с целью удостовериться в правомерности задать следующий вопрос.
Прогностическая валидность (обоснованность) (predictive validity) свойство показателя (меры), позволяющее с определенной долей точности предсказывать будущие события.
Проект, основанный на анализе временного (динамического) ряда (time-series design) план обследования, ставящий целью установление причинных связей (зависимостей) с помощью анализа данных во времени.
Проект, основанный на контролируемом анализе временного (динамического) ряда (controlled time-series design) исследовательский проект, использующий контрольные группы для оценки степени воздействия некоторого события.
Промежуточная переменная (intervening variable) переменная, влияющая на воздействие некоторой независимой переменной на некоторую зависимую переменную.
Рабочая гипотеза (working hypothesis) утверждение, предсказывающее существование некоторой зависимости между показателями.
Рандомизация (randomization) такая процедура отбора признаков для исследования (или получения сопоставимых групп в эксперименте), когда каждый признак из некоторой совокупности и каждая комбинация признаков заданного размера имеет равные с другими шансы на попадание в выборку. [c.535]
Реактивность (reactivity) способность изучаемых субъектов реагировать на те или иные обстоятельства, сопутствующие исследовательскому процессу.
Регистрационный бланк (recording form) бланк, используемый для перевода сводных данных с документа-источника в пригодную для ввода в ЭВМ форму.
Резюме (abstract) краткое изложение содержания отчета или доклада.
Репрезентативная выборка (representative sample) это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности.
Репрезентативность (представительность) (representativeness) степень сходства между относительно малой совокупностью случаев и большой (генеральной) совокупностью, из которой взята малая.
Респондент (respondent) лицо, отвечающее на вопросы интервью или анкеты.
Сводные данные (aggregate data) данные, относящиеся к целому ряду признаков или совокупностей.
Связь (association) соотношение двух и более переменных, при котором они коварьируют.
Секторная диаграмма (pie diagram) график, на котором результаты наблюдений представлены в виде кругов, разбитых на сектора.
Систематическая случайная выборка (systematic random sample) выборка, в которой признаки отбираются из генеральной совокупности путем случайного отбора первого признака и применения некоторого выборочного интервала для отбора последующих признаков.
Систематические ошибки (systematic errors) ошибки измерения, проявляющиеся при каждом случае применения инструмента и лишающие показатели их валидности.
Системный показатель (syntality indicator) мера какого-либо свойства или признака группы в целом.
Совокупная исчерпаемость (collective exaustivity) характеристика измерений, благодаря которому все случаи могут быть отнесены как минимум к одной категории.
Совокупность (population) множество случаев, относительно которого делаются те или иные выводы.
Случайная выборка (random sample) выборка, члены которой отбираются из некоторой совокупности в соответствии с процедурой рандомизации (т.е. по случайностному принципу). [c.536]
Случайные ошибки (random errors) несистематические ошибки измерения, превращающие показатель в ненадежную и лишенную валидности меру данного понятия.
Содержательный контент-анализ (substantive content analysis) анализ, уделяющий основное внимание содержанию коммуникаций.
Специализированное интервьюирование (specialized interviewing) интервьюирование, при котором для успешного общения с респондентом требуется применение нестандартных процедур.
Спецификация данных (data specifications) детализированное описание данных, подлежащих регистрации в каждом отдельном случае и для каждой переменной.
Среднее арифметическое (mean) мера средней тенденции для интервальных переменных.
Средняя тенденция (central tendency) способ определения такой средней величины или оценки, которая лучше всего представляет некоторое множество признаков данной переменной.
Стандартизовать (standardize) измерять в единой или в сравнимых единицах измерения.
Стандартная оценка (z) (standard score (z)) мера расположения в интервальном распределении, выражаемая в единицах стандартного отклонения относительно средней.
Стандартная оценка гаммы (ZG) (standard score of gamma (ZG) критерий статистической значимости связи между двумя порядковыми переменными.
Стандартное отклонение (s) (standard deviation (s)) мера дисперсии для интервальных переменных.
Статистика (statistics) числа, в суммарном виде отражающие распределение значений переменных или зависимости между переменными; признаки выборки, соответствующие определенным параметрам генеральной совокупности.
Статистическая значимость (statistical significance) вероятность того, что связь между двумя переменными, обнаруженная в ходе анализа выборки, носила случайный характер и не существует в генеральной совокупности.
Степени свободы (degrees of freedom) число ячеек в таблице или число точек на линии регрессии, которые могут заполняться независимо от предшествующих заполнений.
Стимул (stimulus) независимая переменная в эксперименте.
Столбиковая диаграмма (bar chart) график, на котором результаты наблюдений изображаются в виде столбиков. [c.537]
Стратифицированная (районированная) выборка (stratified sampling) процедура, при которой из совокупности сначала отбираются подгруппы по признаку наличия у их членов одного или более общих свойств, а затем из каждой из этих подгрупп по отдельности берется выборка.
Структурный контент-анализ (structural content analysis) анализ, уделяющий основное внимание форме коммуникации.
Суммарный показатель (summative indicator) мера группового признака, образуемая посредством объединения индивидуальных признаков членов группы.
Таблица взаимной сопряженности признаков (contingency table) обобщенное изображение зависимости (зависимостей) между двумя и более переменными в виде таблицы.
Теория (theory) одно из возможных объяснений наблюдаемых явлений, представляющее собой некоторое множество логически увязанных между собой допущений и пропозиций (суждений).
Теория игр (game theory) сфера математики, имеющая дело с анализом ситуаций, исходы которых обусловлены совместным согласованным поведением индивидов.
Теория измерений (measurement theory) теория, объясняющая, почему с изменением значения некоторой переменной следует ожидать и изменений в значениях отражающего ее показателя.
Территориальная группа (areal group) группа людей, проживающих на определенной географической территории.
Тест-эффект (test effect) любое расхождение между результатами предварительного и окончательного теста, обусловленное всецело ответной реакцией изучаемого субъекта на предварительный тест.
Точный подбор соответствий (precision matching) процедура, при которой экспериментальные и контрольные группы приравниваются друг к другу посредством отбора сравнимых индивидов.
Трендовое обследование (trend study) анализ, основанный на сравнении данных, полученных от одной и той же генеральной совокупности в разные моменты времени.
Уровень измерения (level of measurement) количество или качество получаемой информации, обеспечиваемое данным инструментарием.
Формальная модель (formal model) модель, заданная на математическом или любом другом формализованном языке.
Фундаментальное исследование (basic research) исследование, первичной целью которого является развитие или проверка научной теории. [c.538]
Хи-квадрат χ2 (chi-scuare) критерий статистической значимости связи между двумя номинальными переменными.
Частный коэффициент регрессии (partial regression coefficient) статистическая мера, обозначающая степень влияния независимой переменной на зависимую в ситуации, когда взаимовлияние всех остальных переменных в модели находится под контролем исследователя.
Частотное распределение (frequency distribution) упорядоченный подсчет количества признаков по каждому значению переменной.
Шкала (scale) ряд показателей, которые можно упорядочить таким образом, чтобы экспериментальные случаи оказались расположенными в порядке, соответствующем степени выраженности в них измеряемого понятия.
Шкалирование путем парного сравнения (pair-comparison scaling) метод, используемый в контент-анализе для измерения силы оценочных суждений.
Шкальная оценка (scale score) единая мера того количества измеряемого данной шкалой признака, которым обладает тот или иной субъект.
Эквивалентность (равнозначность) (equivalence) сопоставимость групп (в эксперименте); сопоставимость мер в разных культурах (в сравнительном исследовании).
Эквивалентная мера (equivalent measure) использование одних и тех же понятий для исследования различных объектов.
Экологическая ошибка (ecological fallacy) некорректное использование сводных данных с целью получения выводов относительно свойств отдельных случаев или групп.
Эксперимент ex post facto (ex post facto experiment) исследование, при котором контроль за ходом эксперимента имитируется при анализе данных.
Экспертная выборка (judgemental sample) выборка, состоящая из намеренно отобранных случаев (признаков).
Экспериментальная группа (experimental group) лица, подвергающиеся воздействию независимой переменной (экспериментального стимула).
Экспериментальное исследование (experimental design) исследование, при котором зависимости между данным стимулом, событием или другой переменной и наблюдаемым поведением рассматриваются обособленно.
Эмпирический (empirical) относящийся к/или характеризуемый наблюдениями над реальной действительностью или ее описаниями.
Эмпирический референт (empirical referent) наблюдаемый объект (или событие), соответствующий некоторому понятию. [c.539]