Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

жесткие статистические методы опросах в исследованиях политических и культурных элит и даже при отборе

Работа добавлена на сайт samzan.net:


Русский Гуманитарный Интернет Университет

Библиотека

Учебной и научной литературы

WWW.I-U.RU


Глава 7. Построение выборки социологического исследования

Выборочный метод: определение и истоки

Задача построения выборки возникает всякий раз, когда необходимо собрать информацию о некоторой группе или большой совокупности людей. Выборку в той или иной форме используют в ориентированных на «жесткие» статистические методы опросах, в исследованиях политических и культурных элит и даже при отборе «случаев» для включенного наблюдения и качественного анализа.

Статистические (или квазистатистические) обследования населения и ресурсов, судя по всему, зародились одновременно с первыми формами централизованной социальной и политической организации: развитые аграрные общества и древние города-государства нуждались в такой информации и использовали ее при решении разнообразнейших управленческих задач — от фискальной политики до строительства общественных бань. Эти обследования иногда принимали форму сплошных переписей населения. (Об одной такой переписи, имевшей, правда, самые печальные последствия, рассказывает нам книга пророка Самуила: когда царь Давид (X в. до н. э.) осуществил перепись населения древнего Израиля, в стране разразилась страшная эпидемия (2 Цар. 24). Однако значительно чаще приходилось довольствоваться сведениями о какой-то части совокупности: об урожайности судили по пробному обмолоту, о партии товара — по образцу, а о прихожанах — по их духовному наставнику.

Выборка — это подмножество заданной совокупности (популяции), позволяющее делать более или менее точные выводы относительно совокупности в целом. Зачем нужно строить выборки? Прежде всего, из практических соображений, так как выборка экономит силы и средства исследователей. Проведение полномасштабной переписи или сплошного опроса населения требует значительных финансовых и трудовых затрат, которые к тому же могут пропасть впустую в случае, если в разработке методики исследования были допущены принципиальные просчеты.

Другая причина заинтересованности в выборках связана с тем, что выборочная процедура представляет собой удобную и экономичную форму индуктивного вывода1. Третья причина заключается в том, что эта процедура реализует фундаментальный принцип рандомизации, т. е. случайного отбора (от англ. random — случайный, выбранный наугад).

Представление о том, что отбор наблюдений должен носить случайный, непредумышленный характер, в общем соответствует нашему интуитивному знанию об условиях вынесения объективного и непредвзятого суждения. Однако строгая, т. е. математико-статистическая, теория случайной выборки вплоть до конца XIX — начала XX вв. не пользовалась популярностью в среде профессиональных статистиков. Многим исследователям казалось, что в основе отбора должна лежать не «игра случая», а поиск типичных, характерных наблюдений. Это убеждение препятствовало применению в массовых обследованиях методов теории вероятности, достигшей высочайшего уровня развития уже в XVIII— первой половине XIX вв. Применимость выборочного метода для изучения случайно распределенных признаков, например дохода или размера семьи, была впервые обоснована в работах норвежца А. Киэра, англичан А. Боули и К. Пирсона, а также русского статистика А. И. Чупрова2.

Следующим принципиально важным шагом в развитии выборочного метода стала осуществленная Р. Фишером разработка техники рандомизации в эксперименте и выборочном наблюдении3. О роли рандомизации в планировании эксперимента говорится в главе 4. Что же касается выборочного обследования, то оно часто используется как «замена» экспериментального метода. Нельзя провести эксперимент, в котором людям в случайном порядке присваиваются определенные значения переменных «пол» или «цвет кожи». Однако применение выборочного метода и статистического анализа, как мы увидим в дальнейшем, позволяет справляться с этими ограничениями и делать выводы о взаимосвязях между самыми разными переменными, включая вышеупомянутые. Но для того, чтобы такие выводы были обоснованы, нужно устранить любое систематическое влияние «посторонних», смешивающих факторов на изучаемые переменные. Единственным средством для достижения этой цели является абсолютно случайный характер отбора наблюдений. Лишь равенство шансов попадания в выборку для каждого наблюдения, т. е. отбор «наугад», гарантирует от намеренных или ненамеренных искажений. Пусть, например, в ходе опроса мы изучаем влияние пола и рода занятий респондента на его отношение к планированию семьи и ограничению рождаемости. Если используемая нами выборочная процедура ведет к тому, что работающие женщины имеют несколько меньшие шансы стать респондентами, чем домохозяйки и пенсионерки (последних, как известно, проще застать дома), наши результаты наверняка окажутся смещенными.

Поэтому наилучшей моделью отбора считается вероятностная, или случайная, выборка4, в которой строго соблюдается принцип равенства шансов попадания в выборку и для всех единиц изучаемой совокупности, и для любых последовательностей таких единиц.

Именно с рассмотрения разных подходов к построению вероятностной выборки мы и начнем наше обсуждение, чтобы в дальнейшем перейти к не столь совершенным видам целевого, т. е. не основанного на вероятностях отбора, и их роли в практике социологических исследований.

Выше мы определили, что такое выборка. Сейчас нам необходимо строго определить еще несколько элементарных понятий. Переписью называют процедуру сбора информации о каждом члене изучаемой группы или популяции. Все члены интересующей исследователя группы (популяции) составляют генеральную совокупность. Выборочная процедура обеспечивает обоснованность и «законность» выводов о генеральной совокупности, сделанных на основании небольшой выборки.

Типы вероятностных выборок и их реализация

Первым шагом в построении любой модели отбора, включая вероятностную, является определение генеральной совокупности. Решение этой задачи далеко не всегда бывает очевидным. Прежде всего, генеральная совокупность, т. е. множество интересующих социолога объектов исследования, может быть задана и описана лишь на основе каких-то содержательных представлений. Если, например, нас интересуют политические пристрастия избирателей, естественно включить в генеральную совокупность лишь тех, кто уже достиг 18-летнего возраста. Изучение факторов, влияющих на формирование семейного бюджета горожан, потребует иного определения генеральной совокупности: интересующая исследователя популяция в данном случае будет состоять из городских семей.

Полезно также помнить о том, что идеальная генеральная совокупность, задаваемая теоретическим описанием предмета исследования, почти никогда не будет полностью совпадать с реальной совокупностью. Реальная генеральная совокупность подвержена постоянным колебаниям: «взрослое население города Воронежа на 00 час 15 ноября 1996 года» будет отличаться от «взрослого населения города Воронежа на 00 час 16 ноября 1996 года». Некоторые люди за день уедут из города, попадут в больницу, некоторые — вернутся домой из командировки и т. п. Поэтому столь важно при описании изучавшейся в исследовании генеральной совокупности указывать время и место проведения исследования. Следует также помнить, что идеальная генеральная совокупность — это теоретическая абстракция, более или менее совпадающая с реальной совокупностью. Выборка осуществляется из реальной популяции, переход от которой к идеальной совокупности обеспечивается не только правилами статистического вывода, но и некоторой долей теоретического воображения.

Если исследователь построил выборку, которая представляет интересующую его совокупность с приемлемой степенью точности, то полученная выборка является репрезентативной (представительной). В противоположном случае можно говорить о наличии существенной выборочной ошибки. Более строго выборочную ошибку определяют как расхождение между оценкой некоторого показателя, получаемой на основании исследования выборки, и истинным значением этого показателя в генеральной совокупности.

К счастью, существуют точные методы для учета и оценки случайной выборочной ошибки, связанной с не носящими систематического характера колебаниями изучаемой переменной в разных подвыборках из одной и той же генеральной совокупности. Подробнее эти методы мы будем обсуждать ниже (в частности, формулы для расчета случайной ошибки выборки будут рассмотрены в главе 8). Значительно более серьезную проблему создает наличие систематических смещений, возникающих в результате нарушения случайного характера выборочной процедуры. Результаты такого «не вполне случайного» отбоpa могут выглядеть более или менее правдоподобно, однако сами по себе он: никогда не позволят обнаружить смещение или оценить его величину.

Последнее утверждение можно проиллюстрировать на примере классического опыта с рулеткой. Если нам скажут, что вчера десять раз подряд выпало «красное», мы сможем назвать такую серию событий крайне маловероятной. Однако этот субъективно подозрительный результат сам по себе не дает оснований для каких-то суждений о величине и характере ошибок, порождаемых выборочной процедурой, т. е. об исправности механизма самой рулетки.

Систематическая ошибка выборки не обязательно является результатом злого умысла. Например, в США во время войны во Вьетнаме (до введения контрактной системы набора на армейскую службу) правительство проводило специальные лотереи для отбора призывников. Фактически случайно отбирались даты рождения: все годные к несению строевой службы юноши, родившиеся в день, который определялся в ходе такого «розыгрыша», призывались в армию. В 1970 г. результаты отбора были подвергнуты острой критике. Проведенное специальной комиссией расследование показало, что в выборочной процедуре действительно присутствовало смещение. Билетики с напечатанными датами были заключены в специальные капсулы, которые затем опускали в лотерейный барабан в порядке следования месяцев, начиная с января. Из-за недостаточного перемешивания капсул внутри барабана капсулы с ноябрьскими и декабрьскими датами концентрировались в верхней части и, естественно, выпадали с заметно большей частотой5.

Самым знаменитым примером смещенной выборочной процедуры в истории социологии стал предвыборный опрос, проведенный американским журналом «The Literary Digest» в 1936 г. Результаты опроса показывали, что Ф. Д. Рузвельт получит 40,9% голосов и уступит президентское кресло республиканцу А. Ф. Лэндону. В действительности Рузвельт получил 60,2% голосов избирателей. Расхождение в 19,3% в значительной степени объяснялось характером выборочной процедуры. Дело в том, что на практике для построения любой выборки используют какой-то список всех членов изучаемой совокупности, называемый основой выборки. В опросе, проведенном «The Literary Digest», в качестве основы выборки использовались телефонные справочники, а также регистрационные списки владельцев автомобилей6. Во второй половине 1930-х гг. такие списки включали в себя почти исключительно представителей экономически благополучных классов. Беднейшие слои населения, избирательная активность которых, кстати, существенно увеличилась в годы Великой Депрессии, оказались недостаточно представлены в выборке, что и послужило причиной столь значительной ошибки. (Интересно отметить, что объем выборки в описываемом случае был просто огромным — свыше двух миллионов человек!)

Существует несколько типов вероятностной выборки, различающихся характером выборочной процедуры. Мы рассмотрим лишь пять: простую случайную, систематическую, стратифицированную, кластерную и многоступенчатую.

Процедура построения простой случайной выборки включает в себя следующие шаги.

Во-первых, нужно получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки.

Таблица 7.1

Таблица случайных чисел7

Номер столбца Номер строки

1

2

3

4

5

6

7

8

9

10

1

98

08

62

48

26

45

24

02

84

04

2

33

18

51

62

32

41

94

15

09

49

3

80

95

10

04

06

96

38

27

07

74

4

79

75

24

91

40

71

96

12

82

96

5

18

63

33

25

37

98

14

50

65

71

6

74

02

94

39

02

77

55

73

22

70

7

54

17

84

56

11

80

99

33

71

43

8

11

66

44

98

83

52

07

98

48

27

9

48

32

47

79

28

31

24

96

47

10

10

69

07

49

41

38

87

63

79

19

76

11

09

18

82

00

97

32

82

53

95

27

12

90

04

58

54

97

51

98

15

06

54

13

73

18

95

02

07

47

67

72

52

69

14

75

76

87

64

90

220

97

18

17

49

15

67

35

86

33

26

50

10

39

42

61

Во-вторых, следует определить предполагаемый объем выборки, т. е. ожидаемое число опрошенных.

В-третьих, нужно извлечь из таблицы случайных чисел (см. табл. 7.1) столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел.

В-четвертых, нужно выбрать из списка-основы (см. выше) те наблюдения, номера которых соответствуют выписанным случайным числам8.

Прежде чем мы перейдем к обсуждению возникающих на этом пути практических затруднений, рассмотрим упрощенный пример реализации описанной процедуры.

Пусть нам предстоит построить случайную выборку объемом в 12 человек из совокупности, содержащей 60 членов. Можно предположить, что мы хотим оценить калорийность ежедневного рациона питания 60 студентов-социологов, обучающихся на втором курсе университета, чтобы исследовать возможное влияние энергетической ценности рациона на академическую успеваемость. Для этого можно пронаблюдать за питанием небольшой выборки, состоящей из двенадцати студентов. В качестве основы выборки мы используем список всех 60 студентов. Присвоим всем студентам в списке двузначные номера — от «01» до «60» (если бы максимальный номер в списке был трехзначным, мы бы присваивали трехзначные номера, используя нули в отсутствующих разрядах — например, «067», «003»). Далее нам предстоит последовательно выписать двенадцать двузначных чисел из таблицы случайных чисел (см. табл. 7.1). Отметим, что таблицы случайных чисел фактически состоят из случайных цифр, которые обычно сгруппированы для удобства в блоки, состоящие из двузначных либо пятизначных чисел. Объединение цифр в последовательности и блоки условно и не имеет особого статистического смысла. Поэтому в случаях, когда нужны, например трехзначные числа, а таблица состоит из пятизначных, пользуются каким-то несложным правилом, скажем, используют только три первые цифры каждого пятизначного числа, а оставшиеся две игнорируют. Соответственно двузначные числа можно объединять.

Чтобы решить, с какого места в таблице начинать отсчет номеров, достаточно задаться произвольными номерами строки и столбца. В нашем примере мы начнем с пересечения второй строки и третьего столбца. Первым номером в нашем списке окажется 51. Далее можно двигаться по любому правилу: подряд, через строку, через два столбца и т. п. Мы будем выписывать нужные нам двенадцать двузначных номеров подряд по строке, двигаясь по горизонтали и переходя при необходимости на следующую строку.

Если при этом будут попадаться числа, превосходящие по величине самый большой номер в нашем списке (60), мы будем их пропускать. То же относится и к повторяющимся числам. В результате мы получим последовательность:

51, 32, 41, 15, 09, 49, 10, 04, 06, 38, 27, 07.

Нам остается выписать из списка-основы фамилии, стоящие под этими номерами. Если вы располагаете персональным компьютером, то вместо таблицы можно воспользоваться «генератором случайных чисел», имеющимся в большинстве статистических программ.

Простая случайная выборка — это не только наглядное воплощение идеи случайного отбора, но и своего рода эталон, с которым сравниваются другие вероятностные процедуры. Здесь необходимо заметить, что вопреки часто высказываемому и неверному мнению простую случайную выборку не следует рассматривать как самую примитивную форму вероятностного отбора. Напротив, более сложные модели случайных выборок используют в тех случаях, когда простую нельзя применить из-за практических или финансовых ограничений. О качестве этих более сложных процедур отбора также судят посредством сравнения с простой случайной выборкой.

Самые очевидные ограничения для использования простой выборки возникают в случае большого объема генеральной совокупности. Прежде всего исследователь сталкивается с проблемами поиска полной и несмещенной основы выборки. При обследованиях небольших групп и первичных коллективов эти проблемы обычно легко решаются: достаточно воспользоваться членскими списками, списками личного состава и т. п., внеся в них необходимые уточнения. В широкомасштабных опросах общественного мнения и социологических обследованиях чаще применяют другие основы: переписные листы, списки избирателей, домовые книги, карточки паспортных столов милиции (а также картотеки РЭУ, ДЭЗ и т. п.), нехозяйственные книги сельских советов. Все эти «готовые» основы выборки обладают определенными преимуществами и недостатками9. Решая практическую задачу планирования выборочного исследования, социолог обычно оценивает возможные основы по нескольким параметрам.

Во-первых, списки, пригодные для составления основы выборки, могут храниться либо централизованно, либо децентрализованно, «вразброс», в различных территориальных органах власти, статистических учреждениях и т.п. Естественно, что в первом случае затраты на получение доступа к основе будут значительно ниже, чем во втором. Фактически при децентрализованном хранении исследователь должен самостоятельно составить единый список-основу, собрав необходимые данные в результате обхода (или объезда) всех соответствующих институций.

Во-вторых, используемые в качестве основы выборки списки могут обладать различной степенью точности. Точность списка, в свою очередь, зависит от его полноты, частоты его обновления. Эти качества (полнота списка и высокая частота его пересмотра) редко встречаются одновременно. Как правило, самыми полными оказываются именно те основы, которые реже всего обновляются. Таковы, конечно, данные переписей или эпизодически составляемые именные распределительные списки (типа списков на получение приватизационных чеков). К сожалению, чем больше времени отделяет планируемое вами исследование от последней переписи, тем больше вероятность возникновения ошибок и смещений в основе выборки.

Очень существенными достоинствами обладают списки паспортных столов милиции, жилищно-эксплуатационных контор и других местных административных органов.

Качество основы выборки оценивают уже на стадии планирования исследования. Особое внимание уделяют таким потенциальным угрозам валидности, как неполнота выборочной основы, «склеивание» единиц отбора, «пустые» элементы в списке. О неполноте говорят в тех случаях, когда список, используемый для построения выборки, не содержит в себе некоторые единицы, безусловно относящиеся к целевой совокупности. Например, списки жильцов могут не содержать сведений о тех жильцах, которые еще не зарегистрировались по новому месту жительства. В некоторых случаях проблему неполной основы можно решить за счет использования дополнительных основ. В нашем примере со списками жильцов такой дополнительной основой могут стать «листки прибытия-убытия», которые хранятся в паспортных столах отделений милиции (с помощью последних ведется учет прописки граждан). Примером «склеивания» может служить ситуация, когда генеральная совокупность, определяемая объектом исследования, состоит из индивидов, а реальной основой отбора служит список квартир или домовладений, содержащий лишь сведения об ответственных квартиросъемщиках либо о собственниках недвижимости. «Пустые» цементы в основе выборки встречаются в тех случаях, когда исходный список содержит имена или адреса, за которыми не стоят реально существующие (или практически доступные) выборочные единицы. Эта проблема часто возникает при использовании устаревших списков, содержащих информацию о временно уехавших, выбывших, умерших и т. п.10

Описанные выше трудности составления валидной, т.е. соответствующей объекту исследования (целевой совокупности), основы выборки носят и статистический, и «экономический» характер. Довольно часто исследователь сталкивается с ситуацией, когда временные и финансовые затраты на осуществление простой случайной выборки становятся неприемлемо высокими. Наиболее разумным выходом здесь является использование других, «компромиссных», процедур случайного отбора.

Систематическая выборка по качеству часто приближается к простой случайной. Систематическая выборка, как и простая случайная, требует полного списка или заданного упорядочения совокупности (см. ниже). Техника осуществления систематического отбора элементарна: сначала случайным образом отбирается первая единица, затем отбору подлежит каждый kэлемент. Число k в данном случае называют шагом отбора. Можно, например, отбирать каждый 25-й или каждый 200-й элемент. Чтобы определить шаг отбора, нужно поделить известный объем генеральной совокупности (N) на предполагаемый объем выборки (n).

Пусть, например, нужно отобрать 200 человек из 20000 владельцев телефонов:

1) определим шаг отбора: N/n = 20000 : 200 = 100;

2) с помощью таблицы случайных чисел найдем первую выборочную единицу. Если, скажем, выпал номер «053», то из списка владельцев телефонов выпишем того, кто значится под этим номером;

3) с установленным шагом отбираем номера: 153, 253, 353, 453 и т. д. до исчерпания списка.

Иногда генеральная совокупность (и соответственно основа выборки) слишком велика либо исследователю известен не полный список, а лишь правило упорядочения элементов в генеральной совокупности. Предположим, что мы хотим составить представление о весе и формате книг, содержащихся в некой библиотеке, при том, что мы не располагаем полным каталогом, а лишь видим, как книги расставлены на стеллажах. При условии, что объем библиотечного собрания нам приблизительно известен, мы можем воспользоваться процедурой систематического отбора и отобрать, скажем, каждую 55-ю книгу. Очень важно отобрать «стартовую» единицу сугубо случайным образом. Именно в этом пункте кроется основная слабость систематического отбора. Если в способе упорядочения единиц совокупности имеет место некая цикличность, т. е. неизвестная нам «система» (систематический паттерн), а случайность в выборе «старта» должным образом не обеспечена, то полученная выборка может также оказаться смещенной (если о систематическом паттерне мы знаем заранее, то он не представляет собой угрозы валидности и может быть учтен в ходе отбора). Если воспользоваться примером с отбором книг в библиотеке, то легко представить себе такую гипотетическую ситуацию: исследователь выбирает в качестве стартовой первую книгу на нижней полке ближайшего стеллажа и далее двигается с шагом 250 единиц. Если на каждом стеллаже размещается около 500 книг, то приблизительно половина его выборки будет взята с нижних полок. Однако известно, что на нижних полках многих библиотек нередко размещают книги больших форматов — художественные альбомы, атласы и т. п. Если в нашем примере это правило упорядочения будет соблюдено хотя бы в половине случаев (т. е. половина нижних полок будет отведена под «неформатные» издания, под так называемые фолио), любые выборочные оценки «направленности» библиотечного собрания или формата представленных в нем книг окажутся невалидными. Аналогией примеру с библиотечными книгами может служить случай систематической выборки городских квартир. Если в результате осуществляемого непосредственно «в поле» интервьюерами систематического отбора в выборке будут сверхпредставлены квартиры, расположенные на первых и последних этажах, возникнет систематическая выборочная ошибка. На первых и последних этажах в российских городах часто живут люди из групп, имеющих более низкий социально-экономический статус и соответственно ограниченные финансовые ресурсы: квартиры, расположенные на «крайних» этажах и соприкасающиеся с системами коммунального водо- и теплоснабжения, обычно стоят дешевле, так как названные системы в России традиционно являются источником неприятностей и дисфункций в структуре жизнеобеспечения.

Стратифицированный отбор и соответственно стратифицированная выборка используются в тех случаях, когда из каких-то содержательных соображений важно обеспечить представительность вероятностной выборки по каким-то конкретным важным для исследовательских целей критериям. В литературе существует определенная путаница вокруг проблемы стратификации («страта» — это социальная, возрастная или иная группа, буквально «слой»).

Применительно к стратифицированному отбору часто высказывают все те неверные и предрассудочные мнения, которые в начале XX века высказывались относительно квотной выборки (см. ниже) и ее воображаемых преимуществ перед случайным отбором. В действительности стратифицированный отбор имеет определенные практические преимущества до тех пор, пока сохраняется его вероятностный, случайный характер. Как только стратифицированная выборка превращается в более или менее специально отобранную квотную выборку, воспроизводящую некоторые известные пропорции генеральной совокупности (например, 51% женщин, 30% горожан и т. п.), любые статистические, т. е. строгие, оценки параметров генеральной совокупности становятся невозможными.

Стратификацией, строго говоря, называют процедуру, при которой отбор осуществляют как бы из нескольких «параллельных» подсовокупностей, заданных на одной и той же генеральной совокупности. Это абстрактное определение можно прояснить с помощью примера. Пусть у нас есть генеральная совокупность взрослых горожан, относительно которой мы располагаем какой-то существенной с точки зрения исследовательских гипотез информацией. Наличие такой предварительной информации — необходимое условие стратифицированного отбора. Предположим, мы знаем, что в генеральной совокупности 60% рабочих и 40% служащих. Это соотношение может оказаться весьма существенным с точки зрения наших исследовательских гипотез, если оно задает одну из независимых переменных, как, например, при изучении влияния рода занятий на частоту посещения футбольных матчей. Даже при отсутствии значительной систематической погрешности небольшие смещения в реализации случайной выборочной процедуры могут привести к ситуации, когда в нашей конкретной выборке соотношение рабочих и служащих будет существенно (на 5—7%) отклоняться от ожидаемой «правильной» пропорции, имеющей место в генеральной совокупности (см. обсуждение нормальной кривой и индуктивного статистического вывода в гл. 8). Соответственно под угрозой окажется точность наших оценок взаимосвязи между главной независимой переменной (профессиональным статусом) и интересом к футболу. Такого рода неточность может быть устранена при использовании еще одной случайной выборки из генеральной совокупности, но здесь вступают в силу экономические соображения, так как исследовательский бюджет обычно ограничен. В описанной ситуации желательно заранее обеспечить представленность обеих интересующих нас групп, т. е. страт, сохранив вероятностный характер отбора. Этого можно добиться, если осуществить некую независимую процедуру случайного отбора для каждой социальной группы в отдельности (в нашем примере для рабочих и служащих) и затем объединить полученные случайные подвыборки в одну (заметьте, что для нашего примера объем подвыборки рабочих, в согласии с заранее известной пропорцией, будет в 1,5 раза больше объема подвыборки служащих). Полученная в результате выборка будет и стратифицированной (по профессиональному статусу), и вероятностной.

На практике две случайные процедуры отбора в подвыборки-страты можно технически объединить в одну, если мы располагаем априорной информацией о принадлежности каждой выборочной единицы к той или иной страте. Для этого достаточно вести параллельный отбор из списка-основы в несколько подвыборок (по числу страт). Собственно выборочная процедура может быть и простой случайной, и систематической (соответственно мы получим либо простую, либо систематическую стратифицированную выборку).

Рассмотрим эту процедуру на примере составления систематической выборки населения, стратифицированной по этнической принадлежности. Пусть мы осуществляем выборку взрослых жителей небольшого промышленного центра, при этом полученная выборка должна отражать существующую этнодемографическую ситуацию: 80% русских, 10% украинцев и 10% представителей других национальностей. Основываясь на информации, хранящейся в паспортных столах милиции (или на избирательных списках), мы в идеальном случае можем составить полный список-основу, включающий 100000 известных административным органам постоянных жителей. Если предварительно мы предполагаем включить в нашу выборку около 1000 человек, нам нужно отобрать из картотек паспортных столов (или избирательных списков) каждого сотого. То есть доля генеральной совокупности f, включенная в выборку, составит 1/100:  

f = объем выборки (и) / объем целевой совокупности (N).

Выборка объемом в 1000 человек будет включать в себя 800 русских, 100   украинцев и 100 представителей других национальностей. Причем шаг систематического отбора (К) для всех трех подсовокупностей будет равен 100.

Определение шага отбора (К):

80000 человек в «русской» страте: 800 русских в выборке = 100;

10000 человек в «украинской» страте: 100 украинцев в выборке = 100;

10000 человек в страте «другие национальности»: 100 представителей других национальностей в выборке = 100.

Таким образом, мы будем выписывать из реальных картотек (списков) каждого сотого русского, каждого сотого украинца и т.п. (естественно, украинцы и представители других национальностей будут встречаться в списках в среднем в 10 раз реже русских)11.

Выборка в описанном нами примере является пропорциональной, так как она представляет все страты в той пропорции, в которой они содержатся в генеральной совокупности. Пропорциональный стратифицированный отбор особенно важен для целей дескриптивной, описательной статистики, т. е. когда перед исследователем стоит задача, основываясь на выборке, описать, как распределены те или иные параметры в разных группах генеральной совокупности. Именно так обычно можно сформулировать цель предвыборного опроса, маркетингового исследования покупательских предпочтений и т. п. Еще одним преимуществом стратифицированного вероятностного отбора является уменьшение такого источника общей ошибки измерения, как дисперсия выборки. Не вдаваясь здесь в статистические тонкости, заметим, что стратификация уменьшает так называемую стандартную ошибку (определение и формулу для стандартной ошибки см. в главе 8) лишь в том случае, если интересующая исследователя переменная значительно варьирует между стратами, т. е. когда заранее выделенные страты (например, возрастные группы) сильно отличаются по уровню измеряемой переменной (например, по частоте посещения дискотек). При этом различия внутри страт должны быть относительно невелики, т. е. межгрупповой разброс значений переменной должен значительно превосходить внутригрупповой.

Иногда, однако, основной задачей исследования является сравнение различных, обычно важных с точки зрения некоторой теории, групп внутри выборки с целью описания некоторого соотношения, имеющего место в генеральной совокупности. Некоторые из таких «теоретически релевантных» групп могут быть весьма малочисленными. Для того чтобы сделать такие малочисленные группы-субпопуляции статистически сопоставимыми с другими группами и, следовательно, получить статистически значимые выводы о существующих (несуществующих) межгрупповых различиях, можно использовать два метода.

Первый метод заключается в увеличении объема выборки. В этом случае пропорционально возрастает объем «редкой» страты, но столь же быстро (а иногда и быстрее) растут расходы на проведение исследования. Если, например, пожилые люди старше 85 лет составляют лишь 1/20 часть целевой совокупности горожан-пенсионеров, то в исследовании эффективности социальной работы с пожилыми людьми нам понадобится выборка объемом 4000 пенсионеров, чтобы получить 200 наблюдений, относящихся к редкой подсовокупности тех, кто старше 85.

Другой, более дешевый, метод заключается в непропорциональной стратификации, т. е. в непропорциональном отборе из различных подсовокупностей. Нередко возникает необходимость сделать «распространенные» и «редкие» страты равно представленными в выборке. Если вернуться к обсуждавшемуся выше примеру исследования городского населения, можно, в частности, представит; ситуацию, когда необходимо сравнить кулинарные предпочтения русских и украинцев. Очевидно, не вполне корректно сравнивать 800 русских и 100 украинцев. В этом случае можно прибегнуть к непропорциональному систематическому отбору из названных страт: если отбирать каждого 200-го русского и каждого 25-го украинца, мы получим две вполне сопоставимые, равные по объему, — 400 и 400 человек — подвыборки (однако эти равные подвыборки будут непропорционально репрезентировать доли соответствующих подсовокупностей, в чем можно убедиться, самостоятельно произведя подсчеты по описанным выше формулам).

Выбор между пропорциональной и непропорциональной стратификацией исследователь осуществляет, исходя из содержательных и экономических соображений. Нужно, однако, иметь в виду некоторые «послевыборочные» последствия непропорционального отбора, с которыми социологи сталкиваются на стадии анализа12. В частности, для получения более точных оценок распределения исследуемых переменных иногда приходится применять так называемое взвешивание (иногда употребляют термин «перевзвешивание»). Взвешивание используют также для того, чтобы исключить влияние некоторых типов систематического смещения в основе выборки и других типов систематической ошибки измерения (см. гл. 6). Например, взвешивание полезно для исключения смещений, возникающих из-за дублирования в списке-основе или, наоборот, из-за наличия систематических «пропусков» для какой-то одной группы (скажем, если в списке пропущено много пожилых людей, постоянно проживающих с детьми, но прописанных по другому адресу). Так как необходимость взвешивания чаще всего вызвана нарушением исходных соотношений, пропорций между входящими в целевую совокупность группами, мы опишем общую идею этой процедуры на примере непропорционального стратифицированного отбора.

Напомним, что к непропорциональной стратифицированной выборке прибегают в тех случаях, когда точность оценок для выборки в целом или для отдельных подгрупп (субпопуляций) внутри выборки оказывается недостаточной. В этом случае доли генеральной совокупности (f) будут различны для разных страт. Последнее утверждение равносильно признанию разной вероятности попадания в выборку для единиц, принадлежащих к разным стратам. Как совместить неравные вероятности отбора с данным нами выше определением вероятностной (случайной) выборки, в котором подчеркивалось равенство шансов попадания в выборку для всех входящих в генеральную совокупность единиц-«случаев»? Некоторые статистики считают предложенное нами выше определение не вполне точным и предпочитают говорить о вероятностной выборке как о выборке, где каждая единица отбора имеет «известную, ненулевую вероятность быть включенной в выборку»13, хотя шансы для различных единиц не обязательно равны. Существующее многообразие определений вероятностной выборки восходит к давней дискуссии о правомерности выводов, основанных на априорных («до») и апостериорных («после испытания») вероятностях. Мы, однако, сохраним наше определение случайной выборки, внеся в него некоторое уточнение: когда шансы попадания в выборку неравны, как при непропорциональном отборе из страт, они могут быть выровнены при помощи взвешивания на стадии анализа, т.е. на собственно послевыборочной стадии исследования (конечно, если отбор внутри страт сохраняет свой случайный и равновероятный характер). Для этого нужно внести определенные поправки в полученные данные, а именно — приписать некоторым наблюдениям (классам наблюдений) больший «вес», компенсирующий меньшие шансы попадания в выборку (и наоборот).

Результатом приписывания веса каждому наблюдению является увеличение точности оценок для исследуемых параметров. Вес каждой единицы (респондента) в kстрате равен отношению числа таких элементов в генеральной совокупности к объему выборки для k-й страты14, т.е.:

При расчете среднего или других параметров (см. гл. 8) каждое наблюдавшееся значение просто умножается на весовой коэффициент «своей» страты.

В частности, среднее значение какого-то параметра совокупности (например, средний доход или среднее количество хронических заболеваний) будет равняться просто взвешенной сумме средних значений для отдельных страт:

Формула расчета стандартной ошибки (см. гл. 8) для стратифицированной выборки также включает в себя весовые коэффициенты, w:

Стандартные компьютерные программы, используемые при статистическом анализе данных, всегда содержат элементарные процедуры взвешивания.

Вернемся к нашему примеру с непропорциональным стратифицированным отбoром русского и украинского населения. Предположим, мы выяснили, что в среднем каждая украинская семья заготавливает на зиму 50 кг варенья, тогда как среднее значение для русской страты составило 40 кг. Для украинской страты весовой коэффициент составит:

wукр. = 10000 : 400 = 25.

Соответственно для русского населения:

wрусск. = 80000 : 400 = 200.

С учетом этих весовых коэффициентов уточненная оценка среднего запаса варенья в выборке составит:

х = 25 • 50 • 400 + 200 • 40 • 400 /100000 = 37 кг.

Если бы мы не учли в своих расчетах сверхпредставительность украинцев в нашей непропорциональной стратифицированной выборке, то оценка среднего запаса варенья для всей совокупности оказалась бы завышенной (45 кг).

Четвертый тип вероятностной выборки, используемой социологами, — это кластерная выборка. «Кластеры» (дословно с англ. — гроздья) — это естественные группировки единиц наблюдения. Например, популяция избирателей имеет тенденцию жить в городах и деревнях, генеральная совокупность военнослужащих естественным образом группируется по воинским частям и подразделениям, а совокупность студентов — по университетам, институтам и колледжам. Способность к образованию локальных группировок, которую обнаруживают генеральные совокупности, изучаемые социологами, при соблюдении ряда условий позволяет уменьшить расходы на получение единицы информации.

Цель использования кластерной выборки таким образом заключается в повышении эффективности затрат на проведение исследования. При фиксированном бюджете и объеме выборки социолог получает возможность снизить общие расходы на проведение личных интервью преимущественно за счет уменьшения транспортных расходов15.

В общем случае кластерная выборка основана на первоначальном отборе группировок (кластеров) и затем — на изучении всех единиц внутри кластеров. Возможными примерами кластеров, используемых в больших общенациональных опросах, являются сельские районы, городские квартиры, избирательные участки. При изучении специфических популяций используются иные кластеры: больницы — при изучении пациентов, школы — при изучении школьников и т. п.

Корректное применение кластерной процедуры основано на неукоснительном соблюдении четырех необходимых условий16:

1) кластеры должны быть однозначно и явно заданы: каждый член генеральной совокупности должен принадлежать к одному (и только одному) кластеру;

2) число членов генеральной совокупности, входящих в каждый кластер, должно быть известно или поддаваться оценке с приемлемой степенью точности;

3) кластеры должны быть не слишком велики и географически компактны, иначе кластерная выборка теряет всякий финансовый смысл;

4) выбор кластеров должен быть осуществлен таким способом, который минимизирует рост выборочной ошибки (последний процесс, в свою очередь, является неизбежным следствием кластеризации).

Для того чтобы уяснить, как именно кластерная процедура влияет на рост выборочной ошибки, рассмотрим ее на простейшем примере. Допустим, мы изучаем труд и занятость жителей небольшого сельского района. Для того чтобы составить полный список-основу для случайной выборки, нам пришлось бы предварительно посетить все сельские советы, а в некоторых случаях — и весьма отдаленные деревни. Располагая ограниченными ресурсами, мы решаем использовать имеющуюся в нашем распоряжении карту района, на которой отмечены все населенные пункты, включая самые небольшие хутора. Известна и численность населения для каждого пункта. Естественными границами кластеров-поселений являются шоссе и проселочные дороги. Составив список всех 40 деревень и хуторов, мы можем теперь без труда осуществить простую случайную выборку кластеров. Для отдельного поселения вероятность попадания в выборку составит 1/40. Если, например, мы собираемся опросить 200 человек, нам, скорее всего, потребуется отобрать 1—2 кластера-поселения. Отметим здесь, что естественные различия в величине кластеров17 никак не влияют на процедуру кластерного отбора.

Что при этом происходит с выборочной ошибкой и, следовательно, с получаемыми в нашем исследовании статистическими параметрами генеральной совокупности сельского населения района (т. е. с оценками возраста, дохода и т. п.)? Чтобы ответить на этот вопрос, мы должны ввести еще одно статистическое понятие «независимых наблюдений» (степеней свободы).

Предположим, мы хотим оценить соотношение работающих и пенсионеров в обследуемом нами районе. Мы отобрали, условно, три деревни по 30 домовладений каждая (итого 90 домовладений). Однако в ходе опроса выясняется, что в двух деревнях, не входящих ни в одно сельхозобъединение или кооператив, живут исключительно старики-пенсионеры, а в одной, построенной недавно для переселенцев из Средней Азии, живут только молодые семьи с детьми. Таким образом, каждая деревня является населенной либо только работающими семейными парами, либо исключительно «пенсионерской». В результате мы можем заранее предсказать результат обследования каждой деревни (кластера), посетив лишь один дом. Если в первом доме интервьюер обнаружит чету пенсионеров, во всех остальных домах тоже будут жить пенсионеры. Если в первом доме живут люди трудоспособного возраста, посещение остальных 29 домовладений приведет к тому же результату. Фактически для каждой деревни мы будем располагать одним независимым наблюдением и, посетив 90 семей в трех деревнях, получим лишь три независимых, информативных наблюдения относительно распределения работающих и пенсионеров в выборке. Соответственно наши оценки величины данного соотношения в генеральной совокупности окажутся более неточными, чем в случае 90 независимых наблюдений. Причина возникающей ошибки заключается в том, что использованные вами кластеры (деревни) оказались гомогенными, однородными по исследуемому признаку трудовой занятости, хотя по другим признакам, например, по политической активности, они вполне могут быть гетерогенными, неоднородными. В принципе можно показать, что рост выборочной ошибки для кластерной выборки (в сравнении с простой случайной) является функцией двух нерешенных — величины кластеров и гомогенности исследуемого признака внутри каждого кластера18.

Ясно, что оценка гомогенности часто становится важной практической задачей в планировании кластерной выборки. Основная проблема здесь заключается в том, что соответствующими данными о распределении признаков внутри кластеров исследователь располагает после завершения собственно полевой стадии. Практически при проектировании выборки обычно основываются на уже существующих данных предыдущих исследований, переписей и т. п.

Таблица 7.2

Значения мер гомогенности р для кластеров, состоящих из домовладений (для основных социально-демографических параметров)

Параметр

Значение р для кластера, имеющего средний размер п

п = 3

п = 9

n = 27

n = 62

Доля домовладений: — находящихся в личной собственности;         

,170

,171

,161

,096

— наемных, с низкой квартплатой;

,235

,169

,107

,062

— наемных, с высокой квартплатой;

,430

,349

,243

,112

Среднее количество жильцов

,230

,186

,142

,066

Доля среди жильцов:

— белых мужчин

,100

,088

,077

,058

— безработных мужчин

,060

,070

,045

,034

— мужчин в возрасте 25—34 лет

,045

,026

,018

,008

Мера гомогенности  р ведет себя так же, как соответствующий коэффициент корреляции. Величина р — это корреляция между значениями признака для всех возможных парных сочетаний элементов, входящих в кластер. Эта величина обычно положительна и возрастает с ростом гомогенности элементов внутри кластера. Если наблюдения внутри кластера абсолютно независимы (как в примере случайного распределения между разными кластерами), то р = 0. При использовании территориальной кластерной выборки городского населения, например при отборе кварталов или многоэтажных домов, р для признаков экономического статуса может быть весьма высоким из-за «пороговых» эффектов: в престижном кооперативном доме маловероятно встретить семьи с очень низкими доходами (верхний порог) и, наоборот, лишь немногие состоятельные люди обитают в коммуналках, подобно герою «Золотого теленка» Александру Ивановичу Корейко (нижний порог).

Ориентировочное представление о типичных значениях р и их изменении для кластеров разной величины для общенационального выборочного исследования дает табл. 7.2. В таблице показаны величины р для имеющих разные размеры кластеров, составленных из соседних городских домовладений (квартир и домов). Данные таблицы основаны на выборке городского населения США (N> 100000)19.

Еще одной немаловажной практической проблемой в планировании кластерной либо стратифицированной выборки является сравнение эффективности затрат на исследование при разных среднем размере кластера и количестве кластеров (заметим, что и кластеры, и страты часто обозначают общим термином — «первичные единицы отбора»). Функция, описывающая зависимость расходов от вышеперечисленных двух переменных, выглядит так:

Сt = ас1 + пс2,

где Ctобщая стоимость исследования,

а — количество «первичных единиц отбора»,

с1 — средние затраты на обследование первичной единицы отбора, планируемые для данного исследования,

n — общий размер планируемой выборки,

с2средние затраты на проведение одного интервью20.

Дальнейшим обобщением идей случайного отбора из субпопуляций и естественных группировок, лежащих в основе, соответственно стратифицированной и кластерной выборок, является многофазная (многоступенчатая) выборка. Построение такой выборки представляет собой довольно сложную статистическую задачу, подходы к решению которой мы рассмотрим лишь в самом обобщенном виде.

В простейшем случае многофазная выборка состоит из двух фаз случайного отбора. На первой — как при кластерном отборе — выбираются «первичные единицы отбора», например, районы, избирательные участки, предприятия. На второй фазе производится случайный отбор единичных членов генеральной совокупности — отдельных респондентов, семей и т. п. Так как «первичные единицы отбора» могут существенно отличаться по величине (как, например, отличаются друг от друга городские квартиры или дома с разной численностью проживающих), то результатом первой фазы может стать неравная вероятность попадания в выборку для членов генеральной совокупности, относящихся к разным «первичным единицам отбора». В этом случае исследователь имеет возможность выравнивания вероятностей на последующих фазах (например, из «первичной единицы отбора», где проживает 1000 семей, он выберет 10, а из «первичной единицы», где живет 500 семей, будет отобрано 20).

Рассмотрим многофазную процедуру на простейшем примере с равной вероятностью отбора.

Пусть нам необходимо осуществить выборку размером 2000 человек из генеральной совокупности населения крупного города, где проживает 4 млн. человек. Каждая «первичная единица отбора» — городской квартал — содержит 1000 единиц (т. е. отдельных респондентов). На первой фазе мы отберем из 100000 кварталов («первичных единиц отбора») 400, так что для каждого квартала вероятность попадания в выборку составит:

400:100000 = 0,004.

На следующей стадии из 1000 жителей каждого квартала мы отберем 50, так что для каждого респондента суммарная накопленная вероятность попадания в двухфазную выборку составит:

0,004 X (50:1000) = 0,0002.

Решение об использовании многофазной выборки обычно принимается после анализа «баланса» затрат и приобретений. Снижение затрат на сбор данных. достигаемое в этом случае, сопровождается увеличением сложности выборочной процедуры. С ростом числа фаз (в больших общенациональных обследованиях нередко используют 4 или 5 «ступенек» отбора — от области до квартала) точность получаемых оценок имеет тенденцию снижаться. Поэтому исследователям нередко приходится сочетать многофазный отбор со стратификацией на завершающих стадиях выборочной процедуры, что обычно ведет к улучшению характеристик выборки21. Отсюда понятно, почему многофазная выборка в значительной мере остается «прерогативой» крупных исследовательских организаций, которые обладают значительными финансовыми ресурсами и могут воспользоваться услугами профессионалов-статистиков при проектировании выборки.

Размер вероятностной выборки

Вопрос об оптимальном размере вероятностной выборки всегда был спорным и, в значительной мере, остается таковым. Мы обсудим лишь основные принципы, лежащие в основе современного подхода к оптимизации размера выборки.

Решение относительно размера выборки принимают с учетом целого ряда факторов, среди которых самую существенную роль играют два: 1) ценность и новизна получаемой в результате опроса информации и 2) затраты на проведение опроса (включая временные) при заданном размере выборки.

Некоторые исследователи полагают, что принятие решения о размере выборки может основываться на сугубо статистическом подходе22. При этом в расчет принимают допустимую величину ошибки в оценке исследуемого параметра (например, дохода). Существуют статистические формулы, связывающие размер выборки с вероятностью ошибки и величиной доверительного интервала, задающего пределы этой ошибки (два последних понятия подробнее обсуждаются в гл. 8). Так как использование этих формул требует принятия определенных предположений о том, как распределена интересующая исследователя величина, возникает необходимость в предварительной информации, относящейся к тому самому параметру, который мы решили изучить. Трудности, возникающие при использовании классического статистического подхода к определению размера вероятностной выборки, можно описать одной фразой, принадлежащей известному специалисту по массовым опросам С. Судману: «Очевидно, что формула, описывающая зависимость размера выборки от предполагаемой ширины доверительного интервала и приемлемой вероятности ошибки, попросту заменяет проблему определения размера выборки другой, не менее трудной проблемой — определения ширины доверительного интервала»23.

Во многих важных случаях можно руководствоваться сложившейся практикой, т.е. размером выборки, использовавшейся в аналогичных исследованиях. Кроме того, нужно помнить о простейших «правилах левой руки» для определения размера выборки.

Размер выборки растет

— при необходимости опубликовать данные для отдельных подгрупп (размеры подвыборок при этом суммируются, и выборка в целом растет пропорционально числу подгрупп);

— при проведении общенациональных обследований, когда велика генеральная совокупность (заданная доля генеральной совокупности/будет определять тем больший объем выборки, чем больше генеральная совокупность);

— если уже имеющаяся информация по ключевым вопросам (например, о намерениях избирателей голосовать за ту или иную партию) явно недостаточна, и степень неопределенности значительна

Размер выборки уменьшается

— при исследовании организаций, институтов и прочих «первичных единиц отбора», если сравнительно невелика величина генеральной совокупности, из которой производится отбор (например, совокупности сотрудников рекламных агентств, школьников, пациентов и т. п.);

— при проведении локальных и региональных исследований;

— если уже существующая информация относительно полна, и все еще остающаяся степень неопределенности незначительна.

«Типичные» размеры выборок для общенациональных опросов варьируют в пределах 1000—2500 респондентов (в зависимости от числа анализируемых подгрупп), для региональных опросов и опросов специальных популяций — от 200 до 500 (при анализе многочисленных подгрупп размер региональной или специальной выборки обычно возрастает как минимум до 1000 человек). Указанные значения, разумеется, могут служить лишь самым общим ориентиром для определения оптимального размера выборки.

Целевой отбор

Иногда социологи вынуждены применять не основанные на вероятностях выборки. Отбор в этом случае базируется не на принципе рандомизации, а на следовании тем или иным субъективным критериям — доступности, типичности, равного представительства и т. п. Многие из этих критериев при систематическом использовании позволяют добиться достаточно высокого качества социологических данных. Часто такой отбор называют целевым, так как он в большой степени определяется целями исследования. Кроме того, в конкретной исследовательской ситуации может оказаться, что осуществление случайной выборки — это практически невыполнимое или экономически неэффективное мероприятие (затраты на построение выборки превышают ценность получаемой в результате исследования информации). Наконец, использование вероятностного отбора лишено всякого смысла, если речь идет об исследовании уникальных событий, групп или ситуаций — полетов на Луну, войн или любовных историй (об этнографическом методе, применяемом в такого рода исследованиях, говорится в гл. 2).

Основной недостаток неслучайных процедур отбора связан с тем, что не существует строгих статистических методов, позволяющих обобщить результаты, полученные в ходе исследования выборки. Оценка точности и валидности этих результатов (и основанных на них выводов) остается делом субъективного суждения, опыта, теоретических предпочтений.

Самый распространенный тип не основанной на вероятности выборки — это выборка доступных случаев. Такого рода выборка может считаться корректной лишь тогда, когда используется в экспериментальном (или квазиэкспериментальном) исследовании. Так, в большинстве психологических экспериментов испытуемыми являются студенты. Это позволяет экономить скудные финансовые ресурсы, отпускаемые на сугубо академические изыскания. Для того чтобы исключить влияние посторонних, смешивающих факторов, экспериментатор в случайном порядке распределяет выборку доступных случаев (т. е. доступных испытуемых) по двум группам — экспериментальной и контрольной. В нашем обсуждении роли рандомизации в эксперименте (гл. 4) подчеркивалось ее значение для получения точных и обоснованных выводов. Однако случайное приписывание испытуемых-добровольцев к экспериментальной и контрольной группам, строго говоря, не является достаточным основанием для обобщения результатов эксперимента для всей генеральной совокупности, из которой осуществлялась выборка доступных случаев. Точнее, в ситуации отбора доступных случаев невозможно с полной уверенностью сказать, что, собственно, являлось генеральной совокупностью в процессе исследования, так как последняя не была определена с самого начала. Поэтому, в частности, шутливое определение предмета психологии гласит, что это наука, изучающая студентов-второкурсников гуманитарных факультетов. В социологии выборкой доступных случаев чаще всего приходится довольствоваться при изучении таких специальных популяций, которые практически не поддаются локализации. Речь идет, прежде всего, об относительно малочисленных группах, находящихся вне сферы институционального (например, административного) контроля. Для таких групп трудно найти какую-то основу выборки — скажем, посетители стрелковых тиров едва ли состоят на каком-нибудь государственном учете. «Просеивание» большой случайной выборки из генеральной совокупности с целью рекрутирования сколько-нибудь значительного числа респондентов в специальную выборку требует непомерных затрат. Поэтому социологам иногда приходится уподобляться орнитологам и отбирать членов экзотических популяций в местах их «естественного обитания» или вероятного скопления. Многие исследования посетителей массовых библиотек проводятся в библиотеках, посетителей выставок — в музеях, ветеранов войны — в клубах ветеранов и т. п. В этой ситуации исследователю приходится прилагать дополнительные усилия для получения высококачественной информации. Следует заметить, что некоторая статистическая «небезупречность» получаемых таким образом результатов, при должной методической культуре исследователей, иногда окупается, и мы узнаем нечто принципиально новое об относительно «закрытых» областях человеческого поведения24. Однако если целью исследования является описание распределения признаков во вполне определенной генеральной совокупности (покупателей зубной пасты, избирателей, читателей газет), то социолог, использующий выборку доступных случаев, понапрасну тратит деньги заказчика (и пренебрегает профессиональной этикой). Квалифицированному заказчику в этом случае также не стоит принимать всерьез рассуждения о принципиально новых, нестатистических и даже «мягких» методах проведения массовых опросов.

Значительно реже социологи используют две другие разновидности целевого отбора — отбор «критических случаев» и отбор «типичных случаев». В обоих случаях исследователь полагается на какие-то теоретические представления или предыдущий опыт, чтобы отобрать ограниченное число «симптоматических», характерных наблюдений, позволяющих сделать более широкие обобщения и предсказания. Иногда это удается, но следует помнить о том, что опыт и теоретические суждения обычно бывают субъективны. В печально знаменитых президентских выборах 1948 г. в Америке (Г. Трумэн против Т. Дьюи) ошибочные прогнозы сделали все знаменитые институты опросов общественного мнения. При этом некоторые из них избрали в качестве «типичного» случая население штата Мэн, так как прежде жители этого штата всегда «угадывали» будущего президента. В описываемом случае «нетипично» (т.е. за проигравшего выборы Дьюи) проголосовали только два штата — Мэн и Вермонт. Поэтому поговорку «Как голосует Мэн, голосует вся Америка» пришлось перефразировать: «Как голосует Мэн, так голосует Вермонт»25.

Метод «снежного кома» — это еще один (наряду с выборкой доступных случаев) интересный подход к отбору из «редких» совокупностей. Его идея такова: первоначально идентифицированная небольшая группа членов интересующей социолога совокупности служит источником сведений о других членах этой совокупности, так что выборка постепенно разрастается вширь подобно снежному кому, катящемуся с горы. Этот метод использовал, например, П. Лазарсфельд с коллегами в исследовании «влиятельных людей» и неформальных связей. Помимо властвующих элит данный метод применяют в изучении других групп, также избегающих широкой известности, — например, наркоманов или коллекционеров антиквариата. Для этого метода существуют определенные приемы оценки систематической ошибки, однако они слишком сложны, чтобы обсуждаться здесь.

К выборкам, не основанным на случайном отборе, относится и квотная выборка, когда-то чрезвычайно популярная даже среди профессиональных статистиков и практически не используемая сейчас. Идея квотной выборки проста: изучаемая совокупность разбивается на такие социально-демографические группы, которые исследователь почему-либо считает важными. Обычно критериями разбивки становятся пол, возраст, национальная принадлежность, место жительства и т. п. Далее, основываясь на уже известных (обычно из официальной статистики) пропорциях этих групп в генеральной совокупности, социолог составляет полевые задания для интервьюеров, указывая, сколько женщин, мужчин, лиц с высшим образованием и т. п. нужно опросить. Например, интервьюер получает задание опросить десять женщин старше 50 лет, восемь мужчин 35 — 45 лет и трех восемнадцатилетних девушек, проживающих в г. Санкт-Петербурге. В результате должна получиться выборка, представляющая все заданные пропорции групп в генеральной совокупности.

Основная проблема квотного отбора заключается в том, что он носит неслучайный характер и осуществляется лично интервьюером. Последний выбирает респондентов, в конечном счете, по собственному усмотрению. Хотя число мужчин или женщин, рабочих или пенсионеров, которых следует опросить в данном районе или местности, задано заранее, интервьюер решает, в какую квартиру ему удобнее позвонить, с кем из членов семьи провести интервью, куда вернуться вторично, если на звонок никто не ответил, и т. п. Это неизбежно ведет к систематическим смещениям в процессе отбора, причем не существует никаких методов для оценки величины возникающей систематической ошибки.

Еще один очевидный недостаток квотного отбора связан с тем, что обычно невозможно даже приблизительно оценить количество отказов от участия в опросе. Если интервьюер сталкивается с человеком, не желающим отвечать на вопросы, или просто недоброжелательным, или вызывающим у него антипатию, интервьюер всегда волен попрощаться и попытать счастья в соседней квартире.

По указанным причинам квотные выборки «вышли из моды» среди социологов, несмотря на свою относительную дешевизну.

Оценивая полезность и применимость вышеописанных «неслучайных» методов отбора в исследовательской практике, следует, прежде всего, сказать, что в определенных обстоятельствах никакой другой альтернативы просто не существует. В ситуации нехватки денег, персонала, времени либо первичной информации о генеральной совокупности социологи использовали и будут использовать впредь выборки доступных случаев, метод «снежного кома» и даже (к сожалению) квотную выборку. При этом профессиональный долг социолога заключается в том, чтобы оценить, пусть даже очень приблизительно, величину и источники возникающей выборочной ошибки.

Безусловно, разумно использовать целевые выборки в пилотажных исследованиях, в экспериментах, в том числе методических (т. е. нацеленных на проверку и отработку анкет, опросников, шкал и т. п.).

Однако всегда следует помнить о том, что возможность обобщения любых оценок, полученных на целевой выборке, для генеральной совокупности в целом, т. е. внешняя валидность результатов исследования, чаще всего оказывается сомнительна26.

Дополнительная литература

Кокрен У. Методы выборочного обследования. М.: Статистика, 1976.

Петренко Е. С., Ярошенко Т. М. Социально-демографические показатели в социологических исследованиях. М.: Статистика, 1979.

Территориальная выборка в социологических исследованиях. М.: Наука, 1980.

Чурилов Н. Н. Проектирование выборочного социального исследования. Киев: Наукова думка, 1986.

Глава 8. Анализ данных

Виды анализа данных

Методы, применяемые социологами для анализа данных, многообразны. Выбор конкретного метода зависит, в первую очередь, от характера исследовательских гипотез, т. е. от того, на какие вопросы мы хотим получить ответ. Если целью является описание одной характеристики выборки в определенный момент времени, разумно ограничиться одномерным анализом, т. е. описанием распределения наблюдений («случаев») вдоль оси интересующего нас признака. Разнообразные техники многомерного анализа позволяют одновременно исследовать взаимоотношения двух и более переменных и в той или иной форме проверять гипотезы о причинных связях между ними. Различия между этими методами — точнее, классами методов — неабсолютны. В реальном исследовании каждое уточнение исходных гипотез или выдвижение новой гипотезы в ходе анализа результатов приводит к необходимости выбора новой техники анализа данных. Так, если изначальная модель взаимоотношения двух переменных (скажем, профессии и дохода) не позволяет выявить определенную закономерность в собранных данных, исследователь выбирает одну из статистических техник, позволяющих контролировать влияние какой-то третьей переменной, например пола, на интересующее его отношение.

Помимо характера исследовательских гипотез на выбор методов статистического анализа влияет и природа полученных социологом данных. Мы уже говорили о том, что разные уровни измерения социологических переменных определяют возможности и ограничения анализа. Для того чтобы охарактеризовать распределение в выборке такого номинального признака, как «пол», мы не можем воспользоваться его среднеарифметическим значением и, следовательно, нам потребуются какие-то другие приемы компактного и точного представления полученной информации.

Методы, используемые для анализа связи между двумя номинальными переменными, также будут отличаться от методов анализа связи между номинальной переменной и переменной, измеренной на интервальном уровне. Таким образом, выбор той или иной статистики будет зависеть и от целей анализа, и от уровня измерения исследуемых переменных.

Существует два основных класса задач, решаемых с помощью статистических методов анализа. Задачей дескриптивной (описательной) статистики является описание распределения переменной-признака в конкретной выборке. Методы дескриптивной статистики позволяют также анализировать взаимосвязь между различными переменными. Другой класс задач, связанный с необходимостью вывести свойства большой совокупности, основываясь на имеющейся информации о свойствах выборки из этой совокупности, решается с помощью методов индуктивной статистики, или теории статистического вывода, основанной на вероятностном подходе к принятию решений. Воспользовавшись какой-то моделью для анализа полученных выборочных данных, социолог обычно также применяет некоторые методы статистического вывода, позволяющие определить, выполняются ли обнаруженные им при анализе данных отношения на уровне большой совокупности, из которой была извлечена выборка.

В этой главе мы уделим основное внимание использованию дескриптивной статистики в анализе социологических данных. Нашей целью здесь будет скорее качественное, содержательное понимание сути этих методов, основанное лишь на самых элементарных математических представлениях и, в некоторых случаях, на интуитивном понимании «физического смысла» статистических моделей. Такое понимание может служить определенным фундаментом для более глубокого изучения прикладной статистики. Кроме того, оно совершенно необходимо для того, чтобы самостоятельно формулировать задачи анализа данных и ориентироваться в существующем разнообразии методов и техник, используемых другими исследователями при решении этих задач.

Одномерный анализ: табулирование и представление данных

Результаты измерения любой переменной могут быть представлены с помощью распределения наблюдений («случаев») по отдельным категориям данной переменной. Категория, в которую попадают одинаковые наблюдения, может быть номинальной («православный», «протестант» и т.п.) либо иметь числовое значение. В любом случае результатом такого упорядочения наблюдений будет их группировка. Работать с упорядоченными данными значительно проще, чем с исходным «сырым» массивом: в «сырых» данных, конечно, содержатся сведения о том, как много в выборке, например, пенсионеров, однако для получения нужной цифры придется перебрать все наблюдения «случай» за «случаем». Если данные сгруппированы, достаточно посмотреть, какова абсолютная частота, т. е. число наблюдений в данной выборке, попадающих в интересующую нас категорию. Для переменных, имеющих не произвольную метрику, т. е. измеренных на ординальном или интервальном уровне (см. гл. 6), нередко используется еще одна процедура, делающая представление данных более компактным и удобным в работе при сохранении заданного уровня точности. Предположим, что в каком-то исследовании 22,0782% опрошенных поддержали государственную программу приватизации, а исследование, проведенное месяц спустя, дало иное значение — 22,1327%. Даже если теоретический конструкт «поддержка программы приватизации» можно представить как непрерывный ряд числовых значений, на практике исследовательской переменной будет соответствовать некоторый набор дискретных числовых величин (категорий). Кроме того, тысячные или сотые доли процента едва ли будут существенны для интерпретации полученных результатов. Поэтому в представлении данных обычно используют процедуру округления. Определив необходимую степень точности — и соответственно приемлемый уровень неточности, — исследователь может округлить все полученные числовые значения до десятых долей или, скажем, до целых процентов. Так, в нашем примере округление до целого числа даст цифру 22%. В дальнейшем каждое последующее наблюдение, дающее числовое значение в интервале между 21,5% и 22,5%, будет попадать в класс «22% поддержки приватизации». В результате процедуры округления исследователь фактически устанавливает границы классов, объединяющих значения переменной в заданном интервале, и середины (центры) классов, т. е. усредненные значения для каждого интервала.

Необходимость объединить значения переменной в 10—15 крупных классов-категорий часто возникает и при работе со «слишком хорошо измеренными» признаками, соответствующими шкалам интервалов или отношений (возраст, доход и т. п.). Во-первых, чрезмерное количество градаций переменной препятствует ее компактному представлению — табличному или графическому. Во-вторых, для конечной выборки обычно соблюдается следующая закономерность: число градаций (категорий) признака обратно пропорционально их заполненности. Переменная с огромным числом градаций, содержащих по 2—3 наблюдения, часто создает серьезные проблемы в статистическом анализе и оценивании (хотя для некоторых методов анализа — корреляция, регрессия и т. п. — эти проблемы, как мы увидим дальше, несущественны). Самым целесообразным выходом обычно оказывается перекодирование, «сжатие» исследовательской переменной. Здесь существует два основных подхода:

1) исходные градации объединяются в более крупные классы на основании каких-то содержательных соображений, причем полученные классы имеют приблизительно равную ширину (например, данные о возрасте часто перекодируют в более широкие «десятилетние» категории — 20—29 лет, 30—39 лет и т. п.);

2) решение о способе «сжатия» переменной принимают, основываясь на распределении наблюдений («случаев») по оси переменной, например, границы между «низким», «средним» и «высоким» доходом устанавливают так, чтобы в каждую категорию попало 33% наблюдений.

Стремление к компактности и «читабельности» данных не должно вести к крайностям. Руководствуясь соображениями здравого смысла, исследователь должен избегать ситуаций, когда перегруппировка ведет к тому, что полученная переменная оказывается слишком грубым средством классификации наблюдений, не позволяющим выявить существенные для анализа различия. Важно также следить за тем, чтобы объединение категорий или числовых градаций переменной-признака не привело к искусственному созданию отношений и взаимосвязей, которые в действительности отсутствуют в данных.

Независимо от того, какие статистические методы и модели собирается использовать исследователь, первым шагом в анализе данных всегда является построение частотных распределений для каждой изучавшейся переменной. Полученные результаты принято представлять в виде таблицы частотного распределения (или просто — таблицы распределения) для каждой существенной переменной. Примером табличного представления может служить приведенная ниже таблица 8.1, в которой представлены гипотетические данные выборочного опроса 500 владельцев домашних телефонов.

Таблица 8.1

Частотное распределение ежемесячных расходов на международные телефонные переговоры

Интервал класса (расходы в руб.)

Абсолютная частота,

чел.

Относительная частота,

%

до 3000

51

11,0

3000—5999

40

8,6

6000—8999

135

29,0

9000—11999

80

17,2

12000—14999

65

14,0

15000—19999

49

10,5

20000—23999

37

8,0

свыше 24000

8

1,7

Всего

N = 465

100% (= 465)

не ответили

35

(35) 

Иногда в таблице распределения указывают лишь относительные частоты, опуская абсолютные. Но и в этом случае в правом нижнем углу таблицы должны быть указаны абсолютное число ответивших (база для вычисления процентов) и число неответивших.

Помимо табличного представления частотных распределений обычно используют и различные методы графического представления. Самый распространенный метод графического представления одномерных распределений это гистограмма, или столбиковая диаграмма. Каждый столбик соответствует интервалу значений переменной, причем его середина совмещается с серединой данного интервала. Высота столбика отражает частоту (абсолютную или относительную) попадания наблюдавшихся значений переменной в определенный интервал. При построении гистограмм часто приходится использовать некоторые конвенции, основанные на сугубо практических соображениях. Так, используя при группировке значений переменной неравные интервалы либо оставляя крайние градации открытыми («старше 65 лет», «свыше 24000 рублей» и т. д.), мы все же отображаем эти интервалы на гистограмме с помощью столбиков, имеющих одинаковую ширину. Другое практическое правило позволяет сделать гистограмму визуально уравновешенной, т. е. более привлекательной: масштаб шкалы обычно выбирают так, чтобы общая высота гистограммы составляла приблизительно 40—60% ее ширины. Пример гистограммы для данных из таблицы 8.1 приведен на рисунке 14.

Интервал класса (расходы в рублях)

Рис. 14. Гистограмма для данных о расходах на

телефонные переговоры

Если просто соединить между собой точки, соответствующие абсолютным или относительным частотам (ось ординат) для середин интервалов, мы получим так называемый полигон распределения. Эта операция, разумеется, будет иметь какой-то смысл лишь для количественных переменных, которые мы в принципе можем представить себе как непрерывные. На рисунке 15 изображен полигон распределения для экспертных оценок телегеничности политического лидера (50 экспертов оценивали политика в процентах по отношению к некоторому абсолютному эталону телегеничности).

Рис. 15. Полигон распределения для оценок телегеничности политического лидера

Еще один популярный способ графического представления, обычно используемый для качественных данных (т. е. для номинальных или ординальных измерений), — это круговая диаграмма. Каждый сектор круговой диаграммы представляет дискретную категорию переменной. Величина сектора пропорциональна частоте категории для данной выборки. На рисунке 16 приведена круговая диаграмма, иллюстрирующая распределение подростков, страдающих вялотекущей формой шизофрении, по возрасту на момент начала («дебюта») заболевания27.

Рис. 16. Заболеваемость вялотекущей формой шизофрении

у подростков мужского пола по возрастам, %

Какую бы форму представления данных мы ни избрали, полученное частотное распределение все еще содержит «слишком много» деталей, не отвечая при этом на весьма важные для содержательного анализа вопросы о самых типичных значениях признака и диапазоне разброса отдельных наблюдений. Для облегчения работы с частотными распределениями, а также для обобщенного представления их характеристик, обычно используют определенные числовые значения — статистики. Дело в том, что специалисты по статистике используют последний термин в двух значениях: как название своей дисциплины и как обозначение какой-либо числовой функции, описывающей результаты наблюдений. Наибольшее практическое значение имеют две группы статистик: меры центральной тенденции  и меры изменчивости (разброса).

Меры центральной тенденции указывают на расположение среднего, или типичного, значения признака, вокруг которого сгруппированы остальные наблюдения. Понятие среднего, центрального, значения в статистике, как и в повседневной жизни, подразумевает нечто «ожидаемое», «обычное», «типичное». Способность среднего значения давать некую обобщенную информацию о распределении вытекает из того соотношения, которое связывает среднее значение с другими «особыми» точками распределения — минимумом и максимумом: зная среднее значение, мы можем утверждать, что наименьшее наблюдаемое значение полученного распределения — например, распределения веса или интеллекта — было не больше среднего, а наибольшее зафиксированное значение— не меньше среднего.

Отличие статистической трактовки среднего значения (или, точнее, мер центральной тенденции) от его «житейской» трактовки заключается прежде всего в том, что в статистике, в отличие от повседневной жизни, понятие среднего значения может быть строго задано лишь для одномерного распределения переменной-признака. Мы можем, например, указать на семью со средним душевым доходом, но при этом не следует ожидать, что данная семья будет средней или типичной в каких-то других отношениях, т. е. будет иметь средний размер, среднюю жилплощадь и т. п. В повседневном общении мы приписываем понятию среднего куда более широкий и менее точный смысл. В этом нет большой беды, пока мы не смешиваем «житейскую» и «статистическую» интерпретации. Мы действительно получаем полезную информацию, узнав, что окружающие говорят о ком-то как о «человеке средних способностей», но будет ошибкой заключить, что некто X, имеющий средний показатель интеллекта, наверняка имеет средние успехи в учебе или посредственно сочиняет стихи. Именно поэтому популярные газетные образы «среднего российского подростка» или «среднего читателя», в сущности, лежат за пределами корректного использования статистики.

Самой простой из мер центральной тенденции является мода (Мо). Для номинальных переменных мода — это единственный способ указать наиболее типичное, распространенное значение. Разумеется, исследователь может пользоваться модальным значением и для характеристики распределения переменных, измеренных на более высоком уровне, если для этого существуют содержательные основания (например, описывая распределение ответов на вопрос о количестве подписываемых журналов). Мода — это такое значение в совокупности наблюдений, которое встречается чаще всего. Например, если в выборке содержится 60% православных, 30% мусульман и 10% представителей других конфессий, то модальным значением будет «православный». У моды как меры центральной тенденции есть определенные недостатки, ограничивающие ее интерпретацию. Во-первых, в распределении могут быть две и более моды (соответственно оно является бимодальным или мультимодальным). Скажем, если в группе из десяти человек четверо не имеют автомобиля (0), четверо имеют один автомобиль, один человек имеет две машины и еще один — три, то нам придется указать два модальных значения — 0 и 1. Кроме того, мода чрезвычайно чувствительна к избранному способу группировки значений переменной. Объединяя категории ответа, мы резко увеличиваем число наблюдений в отдельных категориях. Это открывает широкий простор для манипулирования данными (не всегда добросовестного). Поэтому «правилом хорошего тона» при вычислении модального значения для сгруппированных количественных данных является выравнивание ширины для всех интервалов класса. Еще одно важное правило касается случаев, когда частоты для всех наблюдаемых значений почти равны. Здесь лучше воздержаться от вычисления моды, так как в этом случае она просто не может быть интерпретирована как мера центральной тенденции. Если, скажем, 48% болельщиков поддерживают сборную Италии, а 49% — сборную Бразилии, модальное значение «поддерживает бразильцев» будет не очень модальным. И все же во многих случаях вычисление моды и необходимо, и полезно. Например, для архитектора, занимающегося планированием жилых домов, знание модального значения для размера семьи в данной местности, может оказаться весьма важным.

Другая мера центральной тенденции — медиана — обычно используется для ординальных переменных, т. е. таких переменных, значения которых могут быть упорядочены от меньших к большим. Пример вычисления медианы рассматривался нами в главе 6. Напомним, что медиана (Md) — это значение, которое делит упорядоченное множество данных пополам, так что одна половина наблюдений оказывается меньше медианы, а другая — больше. Иными словами, медиана — это 50-й процентиль распределения. Как мы уже видели, при работе с большим массивом данных удобнее всего искать медиану, построив на основании частотного распределения распределение накопленных частот (или построив распределение накопленных процентов на основании распределения процентов). Для того чтобы найти медианное значение для маленького массива наблюдений, достаточно упорядочить наблюдения от меньших значений переменной к большим: то значение, которое окажется в середине, и будет медианным. Например, для ряда: 17 баллов, 18 баллов, 20 баллов, 21 балл, 22 балла, медианой будет значение 20 баллов. Если число значений в группе наблюдений четное, то медианой будет среднее двух центральных значений. Медиану иногда называют «позиционным средним», так как она указывает именно среднюю позицию в упорядоченном ряду наблюдений. Медиана может совпадать или не совпадать с модой. При этом медиана лучше всего соответствует нашему интуитивному представлению о середине упорядоченной последовательности чисел. Некоторые исследователи даже полагают, что медиана — лучше и «справедливее» среднеарифметического при описании таких величин, как, скажем, доход семьи. Ведь семьи, имеющие доход ниже среднего, могут составить и 60, и 70% населения. Когда же мы говорим, например, что медианный доход составил 10 млн. рублей в год, то не более 50% семей окажутся «ниже среднего уровня». На медиану не влияют величины «крайних» очень больших или малых значений.

И все же для количественных переменных самой важной и распространенной является другая мера центральной тенденции среднее арифметическое, которое чаще всего называют просто средним (и обозначают как ). Процедура определения среднего общеизвестна: нужно просуммировать все значения наблюдений и разделить полученную сумму на число наблюдений. В общем случае:

где Х1 ... Xiнаблюдаемые значения,

n — число наблюдений,

— знак арифметической суммы.

В таблице 8.2 показано, как вычислить средний возраст для выборки из 20 посетителей библиотеки. Заметьте, что каждое значение просто умножается на свою абсолютную частоту.

Приведенный нами пример (см. табл. 8.2) показывает, насколько среднее уязвимо для «крайних» значений. Фактически для нашей небольшой выборки молодых людей прибавление одного — восьмидесятилетнего — читателя заметно увеличило средний возраст. Следует, однако, помнить о том, что степень «возмущения» среднего под влиянием единичных очень больших или малых значений уменьшается в прямом соответствии с ростом объема выборки. Заметим также, что при расчете среднего для сгруппированных, данных частоты умножаются на значение, соответствующее середине интервала группировки.

Таблица 8.2

Вычисление среднего возраста посетителей библиотеки

Возраст

абсолютная частота, fi

Xi x fi

18

5

90

 

(где i = 1...7 — число различных значений)

19

2

38

21

4

84

22

6

132

30

1

30

35

1

35

80

1

80

Всего

Среднее обладает рядом важных свойств. В частности, если сложить все значения отклонений от среднего значения, т. е. разности между X и X1 X2 ... Xi (которые могут быть и положительными, и отрицательными), то сумма отклонений будет равна нулю. Кроме того, сумма квадратов отклонений наблюдаемых значений от их арифметического среднего меньше суммы квадратов отклонений от любой другой точки28. Эти свойства среднего определяют его уникальную роль в решении ряда статистических задач, о которых мы будем говорить ниже. Сейчас достаточно отметить то обстоятельство, что при использовании среднего в качестве «представителя» (т. е. статистической оценки) каждого из наблюдаемых значений, ошибка, определяемая как сумма квадратов отклонений, будет минимальной. Не стоит, однако, забывать о том, что и минимальная ошибка может быть достаточно большой. Так, для малых выборок, имеющих более чем одну моду, любая мера центральной тенденции, включая среднее, будет недостаточно хороша. Центральной тенденции в таком распределении просто не существует.

Выбирая меру центральной тенденции, нужно руководствоваться знанием ее свойств, общей формой распределения и, наконец, здравым смыслом. Если при взгляде на гистограмму исследователь обнаруживает, что имеет дело с унимодальным симметричным распределением (половины гистограммы слева и справа от модального значения зеркально совпадают), то среднее, медиана и мода будут равны между собой. Если речь идет о выборке из большой совокупности, где интересующая исследователя переменная-признак распределена нормально (т.е. большие и малые крайние значения встречаются редко, а средние — часто), наилучшим показателем будет среднее. Если в унимодальном распределении встречаются крайние значения, могущие значительно повлиять на среднее (см. пример с возрастом, табл. 8.2), нужно отдать предпочтение медиане.

Вопрос о сравнимости средних значений не так тривиален, как это может показаться. Сравнение значений средних показателей для различных выборок или для одной и той же выборки в разные моменты времени — весьма распространенный способ анализа результатов. Не только в научных журналах, но и в газетах мы постоянно находим сведения о сравнительной величине душевого дохода в разных регионах, о различиях в среднем числе автомобилей, приходящихся на одну семью и т. п. Следует, однако, помнить о том, что заведомо некорректны сравнения различных мер центральной тенденции, например медианы и среднего. Причина здесь в том, что различные меры описывают разные характеристики распределения: медиана — среднее положение, мода — самое часто встречающееся значение и т. д. Кроме того, даже две одинаковые меры центральной тенденции не всегда сравнимы. Средние двух распределений имеет смысл сравнивать лишь в том случае, если во всех других отношениях распределения одинаковы, имеют сходную форму. Если исследователь говорит о равенстве средних значений, забыв упомянуть о том, что одно распределение симметрично, а другое — скошено вправо или влево из-за присутствия очень больших либо очень малых значений в его «хвостовых» частях, то он подталкивает читателя к заведомо неверному выводу о том, что анализируемая переменная распределена в двух выборках совершенно одинаково. Среднее распределения с очень длинным правым «хвостом» может оказаться равным среднему распределения, скошенного влево, где встречаются крайне малые значения признака. Но этим сходство будет исчерпываться: что общего (кроме величины среднего) у группы, включающей много людей с очень низким доходом, коэффициентом интеллекта и т. п., с другой группой, включающей много наблюдений с очень высокими значениями переменной-признака?

Очевидно, важно не только знать, что типично для выборки наблюдений, но и установить, насколько выражены отклонения от типичных значений. Чтобы определить, насколько хорошо та или иная мера центральной тенденции описывает распределение, нужно воспользоваться какой-либо мерой изменчивости, разброса. 

Самая грубая мера изменчивости — размах (диапазон) значений. Эта мера не учитывает индивидуальные отклонения значений, описывая лишь диапазон их изменчивости. Под размахом понимают разность между максимальным и минимальным наблюдаемым значением. Если количество карманных денег в группе из десяти субъектов варьирует от 100 рубл. (1 человек) до 100000 рубл. (2 человека), размах будет равен 100000-100 = 99900.

Еще одна грубая мера разброса значений — это коэффициент вариации (V), который определяется просто как процент наблюдений, лежащих вне модального интервала, т. е. процент (доля) наблюдений, не совпадающих с модальным значением. Если от модального отличаются 60% значений, то V = 60% (или V = 0,6).

Рассказывая о процедуре построения шкалы Терстоуна, мы описали, как вычислить междуквартилъный размах — очень удобный показатель разброса значений для ординальной переменной. Напомним, что нижний, первый, квартиль (Q1) отсекает 25% наблюдений, а ниже третьего квартиля (Q3) лежат уже 75% случаев. Полумеждуквартилъный размах равен половине расстояния между третьим и первым квартилями:

Если распределение приблизительно симметрично, то можно считать, что полумеждуквартильный размах указывает границы, в которых лежит 50% данных по обе стороны медианы или среднего.

Все эти меры изменчивости, как уже говорилось, можно считать скорее грубыми и приблизительными. Ни одна из них не уделяет должного внимания информации об отклонениях каждого отдельного наблюдаемого значения от среднего, хотя эта информация в большинстве случаев может быть получена из анализа распределения. Информацию о вариации некоторой совокупности значений относительно среднего несут значения отклонений от среднего, о которых мы уже говорили. Однако, просуммировав все значения отклонения (), мы получим нуль. Положительные и отрицательные отклонения будут взаимоуничтожаться. Если же мы возведем в квадрат каждое отклонение и просуммируем квадраты отклонений, то мы получим хорошую меру рассеяния, которая будет маленькой, когда данные однородны, и большой, когда данные неоднородны. Чтобы суммы квадратов отклонений для выборок разного размера можно было сравнивать, нужно поделить каждую из них на N, где N— объем выборки29.

Рис. 17. Распределение, скошенное вправо

Именно так и получают важнейшую меру рассеяния — дисперсию (s2). Если среднее,  X1, Х2... Хпиндивидуальные значения измеряемой переменной X в данной совокупности, а N — объем выборки30:

Для того чтобы вычислить значение дисперсии, нужно вычесть из каждого наблюдаемого значения среднее, возвести в квадрат все полученные отклонения, сложить квадраты отклонений и разделить полученную сумму на объем выборки.

Стандартные отклонения

Рис. 18. Определение площади нормальной кривой для разных значений стандартного отклонения

Величина, равная квадратному корню из дисперсии, называется стандартным отклонением (sx ), т.е.:

Совершенно очевидной интерпретацией стандартного отклонения является его способность оценивать «типичность» среднего: стандартное отклонение тем меньше, чем лучше среднее суммирует, «представляет» данную совокупность наблюдений.

Еще одно важное применение стандартного отклонения связано с тем, что оно, наряду со средним арифметическим, позволяет определить самые существенные характеристики нормального распределения. Графически нормальному распределению частот наблюдений соответствует, как известно, симметричная колоколообразная кривая. Свойства нормального распределения прекрасно изучены, что позволяет делать важные выводы относительно самых разных распределений, не обязательно нормальных. В частности, известно, что 68% наблюдений (точнее, 68% общей площади) будет заключено в пределах ±1 стандартное отклонение от среднего значения. Если, скажем, среднее нормального распределения равно 200, а стандартное отклонение — 4, то можно заключить, что не менее 68% наблюдений лежит между значениями 196 и 204 (т. е. 200 ±4). Соответственно не менее 32% случаев будут лежать за этими пределами, в левом и правом «хвостах» распределения. Из теории вероятности известно также, что в пределах ±3 стандартных отклонений окажется около 99,73% общего числа наблюдений (см. рис. 18).

Для любого унимодального симметричного распределения, даже если оно отличается от нормального, не менее 56% наблюдений будут попадать в промежуток ±1 стандартное отклонение от среднего арифметического значения, для ±3 стандартных отклонений внутри указанного интервала окажутся не менее 95% наблюдений.

Очевидно, что стандартное отклонение — это прекрасный показатель положения любого конкретного значения относительно среднего, поэтому часто возникает необходимость выразить «сырые» оценки (баллы теста, величины дохода и т. п.) в единицах стандартного отклонения от среднего. Получаемые в результате оценки называют стандартными, или Z-оценками. Для любой совокупности из N наблюдений распределение со средним X и стандартным отклонением 5 можно преобразовать в распределение со средним, равным 0, и стандартным отклонением, равным 1. Преобразованные таким образом индивидуальные значения будут непосредственно выражаться в отклонениях «сырых» значений от среднего, измеренных в единицах стандартного отклонения. Чтобы осуществить такое преобразование, нужно из каждого значения X вычесть среднее и разделить полученную величину на стандартное отклонение, т. е. Z-оценки получают по простой формуле:

Использование Z-оценок не сводится к описанию положения некоторого значения относительно среднего в масштабе единиц стандартного отклонения. Стандартные оценки позволяют перейти от множества «сырых» значений к произвольной шкале с удобными для расчетов характеристиками среднего и стандартного отклонения. Домножая Z на константу с, мы можем получить распределение со стандартным отклонением (sx). Множество данных можно расположить на любой шкале с удобным средним (например, равным 100, как во многих тестах интеллекта) и стандартным отклонением. Другие применения Z-оценок связаны со сложными методами анализа данных, о которых мы будем говорить в дальнейшем.

Описанные процедуры анализа одномерного распределения относятся к дескриптивной статистике. Если мы стремимся обобщить данные, полученные на отдельных выборках, чтобы описать свойства исходной генеральной совокупности, необходимо, как уже говорилось, обратиться к методам индуктивной статистики, к теории статистического вывода. Переход от числовых характеристик выборки к числовым характеристикам генеральной совокупности называется оцениванием. При одномерном анализе данных чаще всего решают задачу интервального оценивания.

Если переменная измерена на уровне не ниже интервального (доход, продолжительность образования и т. п.), мы легко можем получить выборочную оценку среднего. Но как узнать, насколько близка наша выборочная оценка, например, дохода, к истинному значению этого параметра, которое мы получили бы, располагая возможностью обследовать всю совокупность? Если наша выборка была случайной, на этот вопрос можно ответить. Чтобы перейти от выборочной оценки (статистики) к характеристике генеральной совокупности (параметру), можно, в частности, определить числовой интервал, в который с заданной вероятностью «укладывается» интересующий нас параметр. Чтобы понять идею интервального оценивания, достаточно вспомнить о том, что оценки, получаемые для множества выборок из одной совокупности, будут также распределены нормально, т. е. большая их часть будет попадать в область, близкую к истинному среднему, и лишь немногие окажутся в «хвостах» распределения, отклоняясь от этого значения. Для любой отдельно взятой выборки шансы оказаться близко к параметру совокупности значительно выше вероятности оказаться в «хвосте». Чтобы оценить степень этой близости, используют очень важную величину — стандартную ошибку средней. Стандартную ошибку обозначают как SМ,

где sх — это стандартное отклонение,

а N — объем выборки.

Подсчитав эту величину для наших данных, мы всегда можем определить с заданной вероятностью, в каких пределах будет лежать среднее совокупности. Совершенно аналогично приведенным выше рассуждениям для среднего отклонения можно сказать, что 95% выборочных средних будет лежать в пределах ±2 стандартные ошибки среднего генеральной совокупности (т. е. для 95 выборок из 100 выборочное среднее попадет в указанный интервал). Следовательно, любая конкретная единичная выборка, использованная в данном исследовании, с 95%-й вероятностью даст оценку, лежащую в интервале ±2 стандартных ошибок среднего совокупности. Заданный таким образом интервал для выборочных оценок называется доверительным интервалом, а та вероятность, с которой мы «попадаем» в этот интервал (например, 95% или 99%), называется доверительной вероятностью. Если, например, мы рассчитали, что для случайной выборки горожан средняя квартирная плата составляет 20000 рублей, а стандартная ошибка — 500 рублей, то можно с 95-процентной уверенностью утверждать, что для всех горожан средняя квартплата окажется в интервале 19000—21000 рублей. Задав интервал в 3 стандартные ошибки, мы сможем достичь уровня доверительной вероятности, равного 99,73% (см. рис. 18). Полезно помнить о том, что чем больше используемая выборка (чем больше N), тем меньше будет sm (см. формулу) и, следовательно, тем уже будет доверительный интервал.

Задачу интервального оценивания можно решить и для тех переменных, уровень измерения которых ниже интервального. Для этого в статистике используют свойства другого распределения — биноминального. Здесь мы не будем анализировать эти свойства. Достаточно отметить, что биномиальным называют распределение исхода событий, которые могут случиться или не случиться, т.е. в общей форме могут быть классифицированы как положительные или отрицательные. При этом наступление одного события автоматически означает, что другое не случилось. Степень интенсивности события (признака) просто не принимается в расчет. Классический пример — бросание монеты, которая может выпасть «орлом» или «решкой». Чтобы использовать это распределение для интервального оценивания, нужно превратить анализируемую переменную в дихотомическую, имеющую две категории (если, конечно, она таковой не являлась с самого начала). Примеры дихотомических переменных — пол, голосование «за» или «против» и т. п. Для дихотомической переменной стандартную ошибку можно вычислить по формуле:

где Sbinстандартная ошибка для биномиального распределения, Р — процент наблюдений в первой категории, Qпроцент наблюдений во второй категории, N — объем выборки.

Если, например, нас интересует, насколько близок к истинному значению для генеральной совокупности тот процент ответов, который мы получили при опросе некоторой выборки, мы снова можем использовать интервальную оценку. Пусть, например, в выборке объемом 1000 человек 60% высказались против призыва студентов на воинскую службу, а 40% — за. Стандартная ошибка составит:

Если добавить (и отнять) 2 стандартные ошибки31 к полученной выборочной оценке, можно построить доверительный интервал, в который интересующая нас величина попадет с 95%-й вероятностью (т. е. вероятность ошибки не превысит 5%). С вероятностью 95% доля противников обязательного призыва студентов составит 60±3,1%.

Анализ связи между двумя переменными

Хотя результаты одномерного анализа данных часто имеют самостоятельное значение, большинство исследователей уделяют основное внимание анализу связей между переменными. Самым простым и типичным является случай анализа взаимосвязи (сопряженности) двух переменных. Используемые здесь методы задают некоторый логический каркас, остающийся почти неизменным и при рассмотрении более сложных моделей, включающих множество переменных. Устойчивый интерес социологов к двумерному и многомерному анализу данных объясняется вполне понятным желанием проверить гипотезы о причинной зависимости двух и более переменных. Ведь утверждения о причинных взаимосвязях составляют фундамент не только социальной теории, но и социальной политики (по крайней мере, так принято считать). Так как возможности социологов проверять причинные гипотезы с помощью эксперимента, как уже говорилось, ограниченны, основной альтернативой является статистический анализ неэкспериментальных данных.

В общем случае для демонстрации причинно-следственного отношения между двумя переменными, скажем, X и Y, необходимо выполнить следующие требования:

1) показать, что существует эмпирическая взаимосвязь между переменными;

2) исключить возможность обратного влияния Y на Х;

3) убедиться, что взаимосвязь между переменными не может быть объяснена зависимостью этих переменных от какой-то дополнительной переменной (или переменных).

Первым шагом к анализу взаимоотношений двух переменных является их перекрестная классификация, или построение таблицы сопряженности. Речь идет о таблице, содержащей информацию о совместном распределении переменных. Допустим, в результате одномерного анализа данных мы установили, что люди сильно различаются по уровню заботы о своем здоровье: некоторые люди регулярно делают физические упражнения, другие — полностью пренебрегают зарядкой. Мы можем предположить, что причина этих различий — какая-то другая переменная, например, пол, образование, род занятий, доход и т. п.

Пусть мы располагаем совокупностью данных о занятиях физзарядкой и образовании для выборки горожан. Для простоты мы предположим, что обе переменные имеют лишь два уровня: высокий и низкий. Так как данные об образовании исходно разбиты на большее количество категорий, нам придется их перегруппировать, разбив весь диапазон значений на два класса. Предположим, мы выберем в качестве граничного значения 10 лет обучения, так что люди, получившие неполное среднее и среднее образование, попадут в «низкую» градацию, а остальные — в «высокую». (Это, конечно, большое огрубление, но мы используем его из соображений простоты.) Для занятий физическими упражнениями мы соответственно воспользуемся двумя категориями — «делают физзарядку» и «не делают физзарядку». Таблица 8.3 показывает, как могло бы выглядеть совместное распределение этих двух переменных.

Таблица 8.3

Взаимосвязь между уровнем образования и занятиями физкультурой

Занятия физкультурой

Уровень образования

Всего

низкий

высокий

делают зарядку

50

200

250

не делают зарядку

205

45

250

всего

255                      

245

500

В таблице 8.3 два столбца (для образования) и две строки (для занятий физкультурой), следовательно, размерность этой таблицы 2x2. Кроме того, имеются дополнительные крайний столбец и крайняя строка (маргиналы таблицы), указывающие общее количество наблюдений в данной строке или в столбце. В правом нижнем углу указана общая сумма, т. е. общее число наблюдений в выборке. Не давшие ответа уже исключены (для реальных данных их число также стоит указать, но не в таблице, а в подтабличной сноске). Заметим здесь, что многие исследователи при построении таких таблиц пользуются неписаным правилом: для той переменной, которую полагают независимой, отводится верхняя строка (горизонталь), а зависимую располагают «сбоку», по вертикали (разумеется, соблюдение этого правила не является обязательным и ничего с точки зрения анализа не меняет).

Обычно характер взаимоотношений между переменными в небольшой таблице можно определить даже «на глазок», сравнивая числа в столбцах или строках. Еще легче это сделать, если вместо абсолютных значений стоят проценты. Чтобы перевести абсолютные частоты, указанные в клетках таблицы, в проценты, нужно разделить их на маргинальные частоты и умножить на 100. Если делить на маргинал столбца, мы получим процент по столбцу. Например, %, т. е. 19,6% имеющих низкий уровень образования делают зарядку (но не наоборот!). Если делить на маргинал строки, то мы получим другую величину — процент по строке. В частности, можно заметить, что 80% делающих зарядку, составляют люди с высоким уровнем образования Деление на общую численность выборки дает общий процент. Так, всего в выборке 50% людей, делающих зарядку.

Так как вывод о наличии взаимосвязи между переменными требует демонстрации различий между подгруппами по уровню зависимой переменной, при анализе таблицы сопряженности можно руководствоваться простыми правилами. Во-первых, нужно определить независимую переменную и, в соответствии с принятым определением, пересчитать абсолютные частоты в проценты. Если независимая переменная расположена по горизонтали таблицы, мы считаем проценты по столбцу; если независимая переменная расположена по вертикали, проценты берутся от сумм по строке. Далее сравниваются процентные показатели, полученные для подгрупп с разным уровнем независимой переменной, каждый раз внутри одной категории зависимой переменной (например, внутри категории делающих зарядку). Обнаруженные различия свидетельствуют о существовании взаимосвязи между двумя переменными. (В качестве упражнения примените описанную процедуру к таблице 8.3, чтобы убедиться в наличии связи между уровнем образования и занятиями физкультурой.)

Отметим специально, что элементарная таблица сопряженности размерности 2x2 — это минимально необходимое условие для вывода о наличии взаимосвязи двух переменных. Знания о распределении зависимой переменной недостаточно. Нельзя, например, утверждать, будто из того, что 75% детей-первенцев имеют интеллект выше среднего, а 25% — средний и более низкий, следует зависимость между порядком рождения и интеллектом. Необходимо проанализировать и распределение показателей интеллекта для детей-непервенцев. Варьировать должна не только зависимая, но и независимая переменная. 

Для таблиц размерности 2 х 2 и более можно рассчитать специальные показатели (статистики), дающие суммарное выражение степени взаимосвязи, ассоциации между двумя переменными. Таких мер связи довольно много. Для случая двух номинальных переменных существуют два основных подхода к подсчету коэффициентов взаимосвязи. Проанализировав их общую логику, мы получим возможность ориентироваться в многообразии конкретных показателей, предлагаемых прикладными программами анализа данных. Первый подход базируется на статистике, называемой «хи-квадрат». На ее основе можно рассчитать несколько коэффициентов взаимосвязи. Рассмотрим в качестве примера коэффициент «фи» (греч.), формула для которого была впервые предложена сэром Карлом Пирсоном в 1901 году специально для того, чтобы сделать возможным анализ взаимосвязи между двумя переменными, измеренными на неколичественном уровне.

Таблица 8.4

Общая форма таблицы сопряженности размерности 2x2

Переменная Y

Переменная X

0

1

Всего

1

А

b

a + b

0

С

d

c + d

Всего

а + с

b + d

N

Предположим, мы располагаем таблицей сопряженности для двух переменных-признаков X и Y, каждая из которых принимает лишь два значения, которые мы условно обозначим как «0» и «1». В каждой из четырех клеток таблицы содержатся абсолютные частоты, т. е. число случаев для каждого из возможных сочетаний значений признаков (т. е. для сочетаний «0—1», «1—1», «0—0», «1—0»). Обозначим частоты в каждой из клеток таблицы латинскими буквами а, b, с и d. В такой общей форме таблица сопряженности для двух дихотомических признаков будет выглядеть как на таблице 8.4.

Для расчета коэффициента сопряженности «фи» используют формулу:

Эта простая в вычислительном отношении формула получается в результате ряда преобразований исходной формулы для вычисления величины «хи-квадрат» (2). Эта исходная формула позволяет лучше понять общую идею оценки связи качественных признаков, которую мы опишем, не вдаваясь в статистические детали. Исходная формула для величины «хи-квадрат» выглядит так:

Понятно, что наблюдаемые частоты мы можем найти в клетках таблицы сопряженности. Но что понимается под ожидаемыми, точнее, теоретически ожидаемыми частотами? Ожидаемые частоты — это те частоты, которые должны были бы стоять в клетках той же таблицы сопряженности, если бы две интересующие нас переменные были бы независимы, т. е. расслоение наблюдений по одному признаку оставалось бы пропорциональным для разных подгрупп, выделенных по другому признаку.

Пусть, например, данные относительно участия в парламентских выборах для 1000 опрошенных позволили построить таблицу 8.5.

Таблица 8.5

Участие в выборах и пол

Участие в выборах

Женщины

Мужчины

Всего

Участвовали

200

500

700 (70%)

не участвовали

200

100

300 (30%)

Всего

400

600

1000(100%)

Для приведенных в таблице 8.5 данных гипотеза (или модель) независимого поведения признаков предполагала бы, что в мужской и женской подгруппах пропорция участия и неучастия в выборах должна была бы сохраняться такой же, как и для всей выборки в целом (разумеется, в пределах выборочной ошибки). Например, для женщин число участвовавших в выборах, с учетом их доли в выборке (равной 400/1000) составило бы   , т. е. 280 проголосовавших. Отсюда автоматически следует, что до избирательных участков не дошли бы 120 дам (т. е. 400 280). Ожидаемая частота голосования для мужчин составила бы   Соответственно не проголосовали бы 180 мужчин. Для модели независимости признаков таблица сопряженности выглядела бы так:

Таблица 8.6

Ожидаемые частоты для распределения участия в

выборах по полу (рассчитанные в соответствии с моделью независимости признаков)

Участие в выборах

Женщины

Мужчины

Всего

участвовали

280

420

700

не участвовали

120

180

300

Всего

400

600

1000

Сравнив таблицы 8.5 и 8.6, мы видим, что многое во второй из них «осталось как было». Маргиналы таблицы, т. е. общее количество мужчин и женщин, проголосовавших и не проголосовавших, остались, естественно, неизменными. Отличаются лишь теоретически ожидаемые частоты в клетках таблицы 8.6. «Хи-квадрат» как раз и оценивает суммарную величину отклонения наблюдаемых значений от ожидаемых («взвешенную» относительно ожидаемых частот). Для данных таблицы 8.5 величина «хи-квадрат» составит 136,128 (проверьте самостоятельно, используя данные табл. 8.6). Это явно много, но, чтобы оценить существенность, значимость полученной величины, следует воспользоваться специальными таблицами32. Отметим, что для того чтобы найти табличное значение, нужно определить так называемое число степеней свободы. В рассматриваемом примере оно равно единице, так как все теоретически ожидаемые частоты в таблице 8.5 — при заданных маргиналах — можно получить, вычислив лишь одну из них. Если бы размерность таблицы была бы 4x4 (по четыре номинальные градации для каждого признака), то оценка «хи-квадрат» производилась бы для (4 1)(4 1) = 9, т. е. 9 степеней свободы. Обсуждавшийся выше коэффициент — это просто квадратный корень нормированного относительно численности выборки «хи-квадрата». Удобства коэффициента  очевидны: его легче вычислить, не прибегая к расчету ожидаемых частот, к тому же его величина меняется в пределах от 0 до 1 . (Попробуйте рассчитать значение для данных таблицы 8.5.) Существуют и другие коэффициенты взаимосвязи (сопряженности) признаков, основанные на величине «хи-квадрат», например, V Крамера, Т Чупрова.

Таблица 8.7

Взаимосвязь правонарушения и решения суда

Правонарушение

Приговор

Всего

штраф

условный приговор

тюремное заключение

автомобильная кража

5

30

5

40

кража со взломом

0

30

20

50

подделка денег

5

0

5

10

Всего

10

60

30

100

Другой тип коэффициентов взаимосвязи номинальных (и не только номинальных) переменных называют мерами «пропорционального уменьшения ошибки». Все они основаны на следующем предположении (или модели): если две переменные взаимосвязаны, мы можем предсказать значение одной переменной для данного наблюдения (случая), зная, какое значение принимает другая переменная. Степень соответствия такого предсказания действительности и используется в качестве коэффициента взаимосвязи. Любой коэффициент взаимосвязи, основанный на модели «пропорционального уменьшения ошибки» («ПУО»), имеет общую структуру, задаваемую формулой:

где Е1количество ошибок в предсказаниях значений зависимой переменной, с деланных без учета распределения по второй, независимой, переменной, а Е2 — количество ошибок в предсказаниях значений зависимой переменной, сделанных на основе значений независимой переменной. Конкретные коэффициенты, основанные на «ПУО», будут различаться в зависимости от того, что мы считаем ошибкой и как подсчитывается количество ошибок. В качестве примера можно рассмотреть «may-коэффициент» Гудмана-Краскела33. Ошибкой в данном случае считается просто ошибочная классификация наблюдения, отнесение его в «неправильную» категорию. Рассмотрим таблицу сопряженности для приводимого Мюллером и соавторами примера34 гипотетических данных о влиянии типа правонарушения на характер решения суда (см. табл. 8.7).

Ошибка предсказания зависимой переменной (приговор), сделанного исключительно на основе ее собственного распределения, т. е. без учета распределения независимой переменной, определяется следующим образом. Мы знаем (см. маргиналы столбцов в нижней строчке таблицы), что в 60 случаях из 100 приговор был условным, но нам неизвестно, в каких именно шестидесяти случаях он был условным. Точно так же мы знаем, что в десяти случаях судья ограничился денежным штрафом, но мы наверняка неоднократно ошибемся, наугад определяя для каждого случая из 100, считать ли его одним из десяти «штрафных». Если бы каждому случаю соответствовала карточка с надлежащей надписью, которую мы с завязанными глазами помещали бы в одну из трех стопок, то при угадывании мы могли бы руководствоваться лишь значениями маргиналов по столбцам: в конечном счете в первой стопке должно оказаться 10 карточек, во второй — 60, а в третьей — 30.

Если мы наугад поместим во вторую стопку «условных приговоров» 60 карточек, то для каждой отдельной карточки (для каждого наблюдения) вероятность ошибки будет равна вероятности попадания туда карточки «штраф» или «тюремное заключение», т. е. 10/100 + 30/100 = 40/100. Иными словами, в среднем мы сделаем   ошибки для категории «условный приговор». Для первой категории («штраф») мы в среднем сделаем 10 х (60/100 + 30/100) = 9 ошибок. Для категории «тюремное заключение» (30 карточек) мы можем ожидать, что сделаем 21 ошибку. Суммарное значение числа ошибок предсказания Е1 (если в расчет принимается только распределение зависимой переменной) составит сумму этих трех значений:

Е1 = 24 + 9 + 21 = 54 ошибки.

Представим теперь, что распределяя карточки по трем категориям приговора, мы располагаем сведениями о том, каково значение второй переменной — «характер преступления» — для каждой карточки, т. е. для каждого наблюдения. Пусть, например, кто-нибудь каждый раз сообщает нам, каким было в данном случае правонарушение, предоставляя нам возможность самостоятельно предсказать приговор суда. Мы также знаем заранее, что 5 (12,5%) автомобильных краж из 40 повлекли за собой штраф, 30 (75%) — условный срок, а еще 5(12,5%) — тюремное заключение.

Нам, однако, предстоит угадать, какие именно из этих 40 случаев автомобильных краж попали в каждую из трех описанных категорий приговора. Процесс подсчета числа ошибок при таком угадывании сходен с вышеописанным. Зная, каково распределение наблюдений в строке «автомобильные кражи», мы можем оценить ожидаемые ошибки. Ожидаемая ошибка при случайном помещении 5 карточек с автомобильными кражами (из 40) в категорию «штраф» составит  ошибки; при случайном размещении 30 карточек с автомобильными кражами в категорию «условный приговор» мы ожидаем, что ошибок предсказания в среднем будет  ошибки и т. д. Размещая 5 фальшивомонетчиков из 10 в стопку «штрафов», мы сделаем   ошибки. Проведя аналогичные подсчеты для всех трех строк таблицы 8.7 и просуммировав все ожидаемые ошибки, мы получим величину Е2, т. е. ожидаемое число ошибок в предсказаниях приговора суда, сделанных с учетом информации о характере преступления (независимой переменной). Для данных, приведенных в таблице 8.7, величина Е2 составит 45,25. Отсюда,

Таблица 8.8

Ранги четырех школьниц по привлекательности (X) и популярности(Y)

Случай

Переменная X (ранг по привлекательности)

Переменная F (ранг по популярности)

Ольга

1

1

Светлана

2

3

Марьяна

3

2

Наташа

4

4

Для простейшего случая таблицы сопряженности 2 x 2 существует более простая в вычислительном отношении формула:

где a, b, с, dчастоты в клетках таблицы (см. табл. 8.4)35.

Отметим здесь, что направление связи далеко не всегда очевидно, т. е. не всегда можно уверенно утверждать, какая из переменных является зависимой. Если исследователь решит, что независимой является переменная, расположенная по горизонтали (а не по вертикали, как в нашем примере), он сможет подсчитать другую величину «тау-коэффициента», на этот раз идя «от строк» и выполнив все операции в обратном порядке. (Для четырехклеточных таблиц величины «тау» по строкам и по столбцам будут равны.)

Примером ПУО-коэффициента, специально предназначенного для измерения связи двух ординальных (т. е. измеренных на порядковом уровне) переменных, может служить коэффициент «гамма». «Гамма» измеряет относительное уменьшение ошибки предсказания ранга конкретного наблюдения по зависимой переменной. Для того чтобы вручную рассчитать значение «гаммы» для небольшой выборки, нужно упорядочить наблюдения по независимой и зависимой переменным, как это показано в таблице 8.8 для данных о внешней привлекательности (экспертные оценки) и популярности школьниц (данные опроса одноклассников).

Далее нужно сравнивать случаи (т. е. школьниц) попарно, определяя, сходится или расходится порядок расположения двух этих случаев по двум переменным. Если упорядочения сходятся, пара называется согласованной, если они не сходятся, то пару нужно считать несогласованной. Результаты анализа для данных таблицы 8.8 представлены в таблице 8.9.

Предполагается, что если согласованных (т. е. правильно предсказывающих порядок по зависимой переменной) пар больше, чем несогласованных, связь между переменными велика. Если несогласованных пар больше, то связь отрицательна (чем выше ранг по одной переменной, тем ниже ранг по другой). Если же различие между числом согласованных и несогласованных пар невелико, то связь между переменными просто отсутствует. Поэтому формула для «гаммы» такова:

где Nsчисло согласованных пар,

Nr — число несогласованных пар.

Таблица 8.9

Попарные сравнения рангов по переменным X и Y

Пара

Порядок по

X*

Порядок по Y*

Знак пары

(«+» — согласованная,

«» — несогласованная)

Ольга — Светлана

O > C

O > C 

+

Ольга — Марьяна

O > M

O > M

+

Ольга — Наташа

О > Н

О > Н

+

Светлана — Марьяна

С М

М > С

Светлана — Наташа

С Н

С > Н

+

Марьяна — Наташа

М > Н

М > Н

+

* Примечание. Здесь использованы лишь начальные буквы имен, т. е. «О > С» означает, что ранг Оли выше ранга Светы.

Для данных, используемых в нашем примере:

О том, как измерить связь (корреляцию) количественных переменных, мы поговорим немного позже, сделав одно важное отступление.

Метод уточнения в анализе связи между переменными

Обнаружив наличие взаимосвязи между двумя переменными и оценив интенсивность этой связи с помощью какого-либо коэффициента, исследователь стремится проинтерпретировать эту взаимосвязь в терминах причин и следствий. Иными словами, конечной целью измерения взаимосвязи между переменными является подтверждение (или опровержение) каких-то содержательных предположений, касающихся причинного механизма, порождающего найденную взаимосвязь. Однако, как уже говорилось, само по себе наличие связи между двумя переменными еще не доказывает, что эта связь может быть описана моделью «причина — следствие». (А нулевой коэффициент сопряженности — еще не свидетельство отсутствия всякой причинной зависимости.)

Необходимо, во-первых, найти подтверждения того, что связь не является обратной. Если, например, мы обнаружили высокую корреляцию между полученным образованием и престижностью профессии или между алкоголизмом у родителей и алкоголизмом у детей, то таким подтверждением служит естественная упорядоченность событий: обучение обычно предшествует работе, а проблемы родителей — проблемам детей. Во-вторых, нужно исключить альтернативные объяснения обнаруженной взаимосвязи. Во многих случаях существуют вполне правдоподобные гипотезы, объясняющие найденную зависимость воздействием третьей переменной (или нескольких переменных). Возможно, например, что на избирательную активность влияет не столько пол избирателя, сколько его доход. Так как оплата труда женщин в среднем ниже, чем мужчин, женщины реже проявляют политическую активность. Соответственно сравнение женщин, имеющих высокооплачиваемую работу, и мужчин в этом случае не выявит никаких различий в отношении к выборам.

Рис. 19. Модель «ложной взаимосвязи»

Возьмем другой пример. В исследовании было показано, что существует сильная взаимосвязь между престижностью учебного заведения, где было получено высшее образование, и престижностью работы. Значит ли это, что при найме на работу потенциальные работодатели принимают во внимание рейтинг вуза, в котором проходил обучение соискатель? Вполне возможно. Но даже основываясь исключительно на здравом смысле, легко найти и другие объяснения обнаруженному факту. Может быть, шансы окончить престижное учебное заведение во многом зависят от социально-экономического статуса родителей? Не исключено также, что при устройстве на работу «папины связи» играют столь же существенную роль. В этом случае исходная простая модель «престижное образование престижная работа» требует уточнения и дополнения: и качество образования, и успешность карьеры зависят от социально-экономического статуса родителей. Заметьте, что такое уточнение вовсе не отменяет исходного факта — эмпирической взаимосвязи между образованием и карьерой, — оно лишь вводит более сложную модель причинной связи, показывая механизм воздействия третьей переменной (статуса родителей).

Классический подход к анализу взаимосвязи с введением дополнительных, контрольных переменных в социологии и сопредельных дисциплинах получил название метода уточнения. Метод уточнения был детально разработан в 1940—1950-е гг. П. Лазарсфельдом, С. Стауффером, П. Кендалл и их сотрудниками для анализа элементарных таблиц сопряженности и взаимосвязей номинальных признаков36. Однако общая логика этого подхода используется, как мы увидим позднее, и в более сложных техниках статистического анализа, и при изучении количественных данных.

Для того чтобы произвести уточнение причинной модели, нужно сделать какие-то содержательные предположения о том, является ли контрольная (третья) переменная предшествующей либо опосредующей. Если контрольная переменная предшествует во времени и независимой и зависимой переменным, то она воздействует на них как общая причина, порождая эмпирическую взаимосвязь между переменными. Эта взаимосвязь, однако, не является причинной связью, так как объясняется влиянием третьей, контрольной переменной. Причинная модель для этого случая, часто обозначаемого как «ложная взаимосвязь», приведена на рисунке 19.

Таблица 8.10

Зависимость общего самочувствия от лечения при контроле хронической заболеваемости (N = 1000 чел.), %

Самооценка

общего самочувствия

Больные

Здоровые

регулярно посещают врача

редко посещают врача

регулярно посещают врача

редко посещают врача

хорошее

плохое

20%

18%

88%

87%

80%

82%

12%

13%

Предположим, что нам удалось установить, что 79% людей, регулярно посещающих врача, оценивают свое самочувствие как «плохое», тогда как среди людей, посещающих врача реже одного раза в год, доля оценивших таким образом свое самочувствие составила 15%. Если принять установленную взаимосвязь за собственно причинную, мы придем к несколько необычному выводу: чем чаще человек посещает докторов, тем хуже он себя чувствует. Предположим, однако, что мы имеем возможность проверить альтернативную гипотезу: люди, страдающие хроническими болезнями, и чаще обращаются за медицинской помощью, и больше подвержены плохому самочувствию. Для того чтобы узнать, сохранится ли исходная взаимосвязь «регулярные посещения врача плохое самочувствие» при введении контрольной переменной, нам нужно построить так называемые условные (иногда — частные) таблицы сопряженности, где разные группы сравнивались бы при одном (постоянном) уровне объясняющего фактора. Иными словами, нужно построить одну условную таблицу «посещение х самочувствие» для людей, страдающих хроническими болезнями, и другую таблицу — для здоровых. В каждой из этих таблиц объясняющая переменная будет поддерживаться на постоянном уровне. Пусть, например, мы получим две частные таблицы, объединенные в таблицу 8.10.

Анализ этих двух частных таблиц показывает, что частота посещений врача не оказывает сколько-нибудь заметного влияния на общую оценку самочувствия. Иными словами, метод уточнения в данном примере позволил продемонстрировать, что исходно установленная эмпирическая сопряженность признаков является ложной и может получить объяснение при введении контрольной переменной.

В том случае, когда контрольная переменная опосредует исходное взаимоотношение37 двух переменных, метод уточнения позволяет выявить собственно механизм влияния независимой переменной на зависимую (см. рис. 20).

Рис. 20. Модель с опосредующей переменной

В таких случаях говорят о том, что контрольная переменная интерпретирует исходную взаимосвязь. Например, исследователь, установивший влияние образовательного уровня родителей на успехи детей в учебе, должен показать, каков механизм такого влияния. В частности, он может предположить, что образованные родители внимательнее следят за интеллектуальным развитием своих детей, активнее стимулируют любые успехи в этой сфере. Если же сравнить учебные успехи тех детей, родители которых занимают «активно-стимулирующую» позицию, то различия в успеваемости между детьми более образованных и менее образованных родителей будут несущественными. Заметим, однако, что здесь исходное отношение не исчезает (как в случае ложной взаимосвязи), а лишь проясняется, получает дополнительную интерпретацию в терминах опосредующей переменной. Для «стимулируемых» детей учебные успехи не зависят от уровня образования родителей. То же отношение верно и для «нестимулируемых» детей.

Иногда в результате уточнения исходной модели в одной из частных таблиц сохраняется высокий уровень взаимосвязи двух переменных, а в другой таблице взаимосвязь уменьшается или исчезает, т. е. коэффициент сопряженности приближается к нулю. В этом случае говорят о спецификации исходной модели: введение третьей переменной позволяет определить специфические условия, при которых наблюдается установленное ранее отношение двух переменных. Например, исследователь может обнаружить, что в центральноафриканских деревенских общинах частота коллективных жертвоприношений местным духам зависит от среднемесячного количества осадков. Очевидное объяснение заключается в том, что люди тем чаще обращаются за помощью к сверхъестественным силам, чем больше они нуждаются в дожде. Можно также предположить, что исходная взаимосвязь «засуха — коллективные жертвоприношения» будет менее значительной для тех традиционных сообществ, которые располагают устойчивыми ресурсами пресной воды (например, водой из близлежащей реки или озера) и, следовательно, не испытывают столь сильной зависимости от атмосферных осадков. В этом случае частная таблица сопряженности для деревенских общин, живущих вдали от постоянных источников пресной воды, покажет исходный или более высокий уровень взаимосвязи между засухами и жертвоприношениями, тогда как во второй частной таблице, построенной для речных или приозерных деревень, эта взаимосвязь окажется нулевой.

Анализ таблиц сопряженности и метод уточнения — это наглядные и достаточно эффективные средства, используемые в проверке гипотез о взаимозависимости переменных. Однако этим подходам присущи определенные ограничения. Самые существенные из таких ограничений связаны, во-первых, с тем, что проводя перегруппировку количественных переменных в номинальные или ординальные (т. е. разбивая доход на «высокий» и «низкий», а интеллект — на «средний» и «выше среднего»), мы теряем существенную информацию о вариации признака внутри качественных градаций, внутри клеточек таблицы сопряженности, хотя эта информация содержится в «сырых» данных. Кроме того, для уточнения исходной причинной модели нам может потребоваться не одна, а две или четыре дополнительные переменные. Однако с введением новых контрольных переменных число частных таблиц сопряженности будет возрастать по степенному закону. Даже если все наши переменные будут иметь лишь две градации, общее количество клеток в частных таблицах сопряженности будет возрастать как степень двух, т. е., скажем, при четырех контрольных дихотомических переменных нам придется иметь дело с 64-клеточной общей таблицей сопряженности. Соответственно число наблюдений, «случаев», приходящихся на каждую клетку таблицы, будет уменьшаться, а получаемые нами результаты окажутся более подверженными влиянию случайной ошибки выборки.

По этим причинам многие исследователи используют несколько более сложные статистические методы анализа, свободные от описанных ограничений.

Корреляция, частная корреляция, регрессия

При анализе связи между переменными, измеренными на интервальном уровне, часто используют графическое представление такой связи, называемое диаграммой рассеивания. На диаграмме рассеивания каждое наблюдение, т. е. каждый «случай», изображается точкой в двухмерной системе координат. Значение независимой переменной для данного наблюдения определяет положение соответствующей точки относительно оси X, а значение зависимой переменной задает вторую координату точки — по оси Y. Иными словами, перпендикуляр, опущенный из точки-«случая» на ось X, соответствует измеренному уровню независимой переменной, тогда как перпендикуляр, опущенный на ось Y, будет точно соответствовать наблюдавшемуся уровню зависимой переменной.

Пусть, например, мы располагаем данными о бюджетах 10 партий и о числе полученных этими партиями мест в парламенте. Исходя из гипотезы о влиянии размера партийного бюджета (X) на полученное в результате выборов число депутатских мандатов (Y), мы можем построить диаграмму рассеивания, подобную изображенной на рисунке 21.

Рис. 21. Диаграмма рассеивания, отражающая связь величины партийного бюджета в млн. руб. (X) с количеством

мест в парламенте (Y) для 10 политических партий

Каждая точка на рисунке соответствует одной из десяти партий. Невзирая на некоторые «аномальные» случаи, подобные обведенным кружками, диаграмма довольно ясно показывает, что всякое приращение в размерах партийной кассы (сдвиг вправо по оси Х) влечет за собой увеличение парламентского представительства (сдвиг вверх по оси ординат). Между переменными X и Y существует линейное отношение: если одна переменная возрастает по величине, то это же происходит и с другой. Помимо указания на природу отношения двух переменных, диаграмма на рисунке 21 позволяет также сделать некоторые предположения об интенсивности, силе этого отношения. Очевидно, что чем более компактно, «скученно» располагаются точки-наблюдения вокруг пунктирной прямой линии (описывающей идеальное линейное отношение X и Y), тем сильнее зависимость. На рисунке 22 приведены еще три диаграммы рассеивания.

Рис. 22. Диаграммы рассеивания для гипотетических данных

Очевидно, что на рисунке 22а какая-либо связь между X и Y попросту отсутствует. На рисунке 226 воображаемая прямая линия (отмечена пунктиром) пересекла бы диаграмму сверху вниз, из левого верхнего в правый нижний угол. Иными словами, линейная связь в этом случае имеет обратное направление: чем больше X, тем меньше зависимая переменная Y. Заметим также, что «кучность» расположения точек вдоль воображаемой прямой на рисунке 226 не очень велика, а значит и связь (корреляция) между переменными не только обратная, отрицательная, но еще и не очень сильная, умеренная. Наконец, на рисунке 22в зависимую и независимую переменную связывает явно нелинейное отношение: воображаемый график нисколько не похож на прямую линию и напоминает скорее параболу38. Отметим, что методы анализа, о которых сейчас пойдет речь, не годятся для этого нелинейного случая, так как обычная формула для подсчета коэффициента корреляции даст нулевое значение, хотя связь между переменными существует.

Существует обобщенный показатель, позволяющий оценить, насколько связь между переменными приближается к линейному функциональному отношению, которое на диаграмме рассеивания выглядит как прямая линия. Это коэффициент корреляции, измеряющий тесноту связи между переменными, т. е. их тенденцию изменяться совместно. Как и в рассмотренных выше мерах связи качественных признаков, коэффициент корреляции позволяет оценить возможность предсказания значений зависимой переменной по значениям независимой. Общая формула для вычисления коэффициента корреляции Пирсона включает в себя величину ковариации значений X и Y. Эта величина (Sxy) характеризует совместное изменение значений двух переменных. Она задается как сумма произведений отклонений наблюдаемых значений X и Y от средних  соответственно, т. е.  деленная на количество наблюдений. Чтобы понять «физический смысл» ковариации, достаточно обратить внимание на следующее свойство: если для какого-то объекта  i  в выборке оба значения i и i    окажутся высокими, то и произведение  на  будет большим и положительным. Если оба значения (по Х  и по Y ) низки, то произведение двух отклонений, т.е. двух отрицательных чисел, также будет положительным. Таким образом, если линейная связь Х и Y  положительная и велика, сумма таких произведений для всех наблюдений также будет положительна. Если связь межу Х и Y  обратная, то многим положительным отклонениям по Х будет соответствовать отрицательные отклонения по Y, т.е. сумма отрицательных произведений отклонений будет отрицательной.

Наконец, при отсутствии систематической связи произведения будут иногда положительными, иногда отрицательными, а их сумма (и, следовательно, ковариация Х и Y) будет, в пределе, равная нулю. Таким образом, ковариация показывает величину и направление связи, совместного изменения Х и Y. Если разделить ковариацию Sxy  на стандартные отклонения Sx и Sy (чтобы избавиться от влияния масштаба шкал, в которых измеряются Х и Y ), то мы получим искомую форму коэффициента корреляции Пирсона (rxy):

 Более удобная для практических вычислений расчетная формула выглядит так:

Несмотря на несколько устрашающий вид, расчетная формула очень проста. Для «ручного» вычисления rху вам понадобятся лишь пять величин: суммы значений по Х и Y      суммы квадратов значений по X и Y    суммы произведений Х и Y по всем объектам-«случаям» . В таблице 8. 11 приведены данные о максимальных дневных и ночных температурах, зарегистрированных в 10 городах39.

Просуммировав значения в столбцах, мы получим     и  Возведя каждое из значений X и Y в квадрат и просуммировав, мы найдем, что   и  Сумма попарных произведений Xi  и Yi.   составит 4359. Вы можете самостоятельно убедиться в том, что подстановка всех значений в расчетную формулу даст (надеюсь) величину rxy = 0,91. Иными словами, корреляция между дневными и ночными температурами воздуха очень высока, но все же отлична от 1,0 (коэффициент корреляции может меняться в пределах от 1,0 до +1,0). Это отличие, вероятно, объясняется влиянием других факторов (продолжительность дня и ночи, облачность, географическое положение и т. п.). Судя по полученной величине корреляции, знание дневных температур позволяет предсказывать ночные температуры с очень высокой точностью, но не безошибочно.

Величина, которая равна квадрату коэффициента корреляции Пирсона, т. е. r2, имеет ряд интересных статистических свойств. Отметим сейчас, что r2 является ПУО-мерой связи, подобной обсуждавшимся выше. Можно показать, что она характеризует ту долю дисперсии значений Y, которая объясняется наличием корреляции между Х и Y. (Естественно, величина r2 будет всегда положительной и не может превзойти по абсолютной величине коэффициент корреляции)40. Та часть разброса в значениях Y, которая не может быть предсказана по значениям X,— это дисперсия ошибки нашего прогноза, т. е. 1  r2. Необъясненный разброс в значениях Y присутствует в том случае, когда при равных уровнях X (ср., например, дневные температуры в Варшаве и Бонне из таблицы 8.11) сохраняются различия в значениях Y.

Таблица 8.11

Максимальные дневные и ночные температуры воздуха в некоторых городах

Город

Дневная температура воздуха (X)

Ночная температура воздуха (Y)

Лондон

16

11

Париж

21

12

Стокгольм

20

12

Варшава

25

14

Бонн

25

16

Рим

36

23

Тель-Авив

31

23

Анкара

32

15

Каир

36

22

Москва

16

8

N=10

Коэффициент корреляции позволяет оценить степень связи между переменными. Однако этого недостаточно для того, чтобы непосредственно преобразовывать информацию, относящуюся к одной переменной, в оценки другой переменной. Допустим, мы выяснили, что коэффициент корреляции между переменными «величина партийного бюджета» и «число мест в парламенте» равен 0,8. Можем ли мы теперь предсказать, сколько мест в парламенте получит партия, годовой бюджет которой равен 100 млн. рублей? Похоже, что знание величины коэффициента корреляции нам здесь не поможет. Однако мы можем вспомнить, что коэффициент корреляции — это еще и оценка соответствия разброса наших наблюдений той идеальной модели линейного функционального отношения, которое на рассмотренных выше диаграммах рассеивания (см. рис. 21—22) представлено пунктирными прямыми. Эти линии называют линиями регрессии.

Если бы все наблюдения аккуратно «укладывались» на линию регрессии, то для предсказания значения зависимой переменной достаточно было бы восстановить перпендикуляр к оси Y из той точки прямой, которая соответствует известному значению X.

На рисунке 23 показано, как можно было бы графически определить ожидаемые значения Y для гипотетического примера с партийной кассой и местами в парламенте. (Разумеется, найти искомое значение Y можно и без линейки, с помощью вычислений, если известен угол наклона регрессионной прямой и точка пересечения с осью ординат).

Рис. 23. Предсказание значения Y по значению Х для гипотетических данных

Как говорилось выше, линия регрессии не обязательно должна быть прямой, но мы ограничимся рассмотрением самого простого случая линейной зависимости (нелинейные связи во многих случаях также могут быть приближенно описаны линейными отношениями).

Существуют специальные статистические процедуры, которые позволяют найти регрессионную прямую, максимально соответствующую реальным данным. Регрессионный анализ, таким образом, дает возможность предсказывать значения Y по значениям X с минимальным количеством ошибок. В общем виде уравнение, описывающее прямую линию регрессии Y по X, выглядит так:

где то предсказываемое значение по переменной Y (в только что рассмотренном примере — количество мест в парламенте), а — это точка, в которой прямая пересекает ось Y (т. е. значение Y  для случая, когда Х = 0), и bкоэффициент регрессии, т. е. наклон прямой. Часто удобно измерять обе переменные не в «сырых» шкалах, а в единицах отклонения от среднего. Процедура стандартизации, т. е. перевода исходной шкалы в стандартные Z-оценки, вам уже известна. Преимущество использования стандартизированных переменных в регрессионном анализе заключается в том, что линия регрессии в этом случае проходит через начало координат. Стандартизованный коэффициент регрессии (наклон прямой) обозначают обычно греческой буквой (либо лат. b*). Правда, в отличие от b-коэффициента, не позволяет прямо заключить, на какое количество исходных единиц возрастет Y при увеличении X на одну единицу (например, насколько увеличится число депутатских мандатов при увеличении бюджета на 1 млн. рублей или насколько увеличивается заработная плата при увеличении стажа работы на один год). С другой стороны, позволяет сопоставить влияние на независимую переменную контрольных переменных, измеренных в разных шкалах.

Социологи обычно осуществляют регрессионный анализ, используя возможности распространенных прикладных пакетов компьютерных программ (например, SPSS). В этом случае для нахождения линии регрессии, лучше всего соответствующей данной выборке наблюдений, которая представлена точками на диаграмме рассеивания, используют метод минимизации взвешенной суммы квадратов расстояний между этими точками и искомой прямой41.

Хотя здесь не место для обсуждения статистических деталей, мы все же сделаем несколько замечаний, относящихся к осмысленному (или бессмысленному) использованию техники линейной регрессии.

Во-первых, как и в ранее обсуждавшихся примерах анализа связи, наличие координации, согласованности в изменениях двух переменных еще не доказывает, что обнаруженное отношение носит собственно каузальный характер. Проверка альтернативных причинных моделей, иначе объясняющих эмпирическую сопряженность переменных-признаков, может основываться только на содержательных теоретических представлениях.

Далее, нужно помнить о том, что регрессионные коэффициенты в общем случае асимметричны. Если мы решим, что это Y, а не X является независимой переменной, то вполне можем рассчитать другую по величине пару коэффициентов — аху и bху. (Заметьте, что порядок букв в подстрочном индексе значим: первой всегда идет предсказываемая переменная, а второй — предсказывающая.) Разумеется, при выборе кандидатов в зависимые и независимые переменные также важны не статистические, а содержательные соображения.

Если вернуться к затронутой выше взаимосвязи между линейной регрессией и корреляцией, то здесь мы можем сделать следующие дополнения. Пусть все точки-наблюдения аккуратно размещены на регрессионной прямой. Перед нами почти невероятный случай абсолютной линейной зависимости. Зная, например, что коэффициент b (нестандартизованный) равен 313, мы можем утверждать, что именно такова величина воздействия переменной X на зависимую переменную Y. Кроме того, мы можем точно сказать, что единичная прибавка в величине X вызовет увеличение Y на ту же величину, 313 (если, допустим, Xстаж работы, а Y — зарплата, то с увеличением стажа на год зарплата растет на 313 рублей). В этом случае коэффициент корреляции будет равен в точности 1,0, что свидетельствует о сильном, «абсолютном», характере связи переменных. Различие между предсказанными и наблюдаемыми значениями в этом случае отсутствует. Корреляция как мера точности прогноза показывает, что ошибок предсказания просто нет.

В действительности, однако, из-за влияния других переменных и случайной выборочной ошибки точки-наблюдения обычно лежат выше или ниже прямой, которая, как говорилось, является лишь наилучшим приближением реальных данных. Коэффициент корреляции Пирсона r и величина r2 по-прежнему служат оценкой точности прогноза, основанного на линии регрессии. Вполне возможны ситуации, когда коэффициент регрессии очень велик, воздействие X на Y просто громадно, но корреляция низка и, следовательно, точность прогноза невелика. Нет ничего необычного и в обратной ситуации: воздействие X на Y относительно мало, а коэффициент корреляции и объясненная дисперсия очень велики. Посмотрев на приведенные выше диаграммы рассеивания, можно легко уяснить себе смысл отношения между корреляцией и регрессией: первая имеет прямое отношение к «разбросанности» точек наблюдения (чем выше «разбросанность», тем ниже r2 и ненадежнее прогноз), тогда как коэффициент регрессии описывает наклон, «крутизну» линии. Однако существующее здесь различие не стоит и преувеличивать: регрессионный коэффициент (наклон прямой) для стандартизованных данных в точности равен коэффициенту корреляции Пирсона r42.

Предположим, что исследователь изучает зависимость между образованием матери (X) и образованием детей (Y). Обе переменные измерены как количество лет, затраченных на получение образования. Найдя достаточно высокую корреляцию между Xи Yскажем, равную 0,71, — он также находит коэффициенты регрессии а и b и устанавливает, что r2 (называемый также коэффициентом детерминации) в данном случае приближенно равен 0,5. Это значит, что доля вариации в значениях переменной Y (образование детей), объясненная воздействием переменной-предиктора X (материнское образование), составляет около 50% общей дисперсии предсказываемой переменной. Коэффициент корреляции между переменными достаточно велик и статистически значим даже для не очень большой выборки. Следовательно, обнаруженная взаимосвязь переменных не может быть объяснена случайными погрешностями выборки. В пользу предложенной исследователем причинной гипотезы говорит и то обстоятельство, что альтернативная гипотеза — образование детей влияет на образовательный статус родителей — крайне неправдоподобна и может быть отвергнута на основании содержательных представлений о временной упорядоченности событий. Однако все еще не исключены те возможности, которые мы обсуждали в параграфе, посвященном методу уточнения. Иными словами, нам следует считаться с вероятностью того, что какая-то другая переменная (или несколько переменных) определяют и образование родителей и образование детей (например, финансовые возможности либо интеллект). Чтобы проверить такую конкурирующую гипотезу, следует рассчитать так называемую частную корреляцию. Логика расчета частной корреляции совпадает с логикой построения частных таблиц сопряженности при использовании метода уточнения. Построить частные таблицы сопряженности для различных уровней контрольной переменной в случае, когда переменные измерены на интервальном уровне, — это практически неразрешимая задача. Чтобы убедиться в этом, достаточно подсчитать, каким должно быть количество таблиц уже при десяти-двенадцати категориях каждой переменной. Расчет коэффициента частной корреляции — это простейшее средство уточнения исходной причинной модели при введении дополнительной переменной. Интерпретация коэффициента частной корреляции не отличается от интерпретации частных таблиц сопряженности: частной корреляцией называют корреляцию между двумя переменными, когда статистически контролируется, или «поддерживается на постоянном уровне», третья переменная (набор переменных).

Если, предположим, при изучении корреляции между образованием и доходом нам понадобится «вычесть» из полученной величины эффект интеллекта, предположительно влияющего и на образование, и на доход, достаточно воспользоваться процедурой вычисления частной корреляции. Полученная величина будет свидетельствовать о чистом влиянии образования на доход, из которого «вычтена» линейная зависимость образования от интеллекта.

Мюллер и соавторы43 приводят интересный пример использования коэффициента частной корреляции. В исследовании П. Риттербэнда и Р. Силберстайна изучались студенческие беспорядки 1968—1969 гг. Одна из гипотез заключалась в том, что число нарушений дисциплины и демонстраций протеста в старших классах учебных заведений связано с различиями показателей академической успеваемости учащихся. Корреляция между частотой «политических» беспорядков и средней успеваемостью оказалась отрицательной (хуже успеваемость — больше беспорядков) и статистически значимой (r = 0,36). Однако еще более высокой была корреляция между частотой беспорядков и долей чернокожих учащихся (r = 0,54). Исследователи решили проверить, сохранится ли связь между беспорядками и успеваемостью, если статистически проконтролировать влияние расового состава учащихся. Коэффициент частной корреляции частоты беспорядков и успеваемости при контроле расового состава учащихся оказался равным нулю. Исходная корреляция между беспорядками и успеваемостью в данном случае может быть описана причинной моделью «ложной взаимосвязи» (см. рис. 19): наблюдаемые значения этих двух переменных скоррелированы лишь потому, что обе они зависят от третьей переменной — доли чернокожих в общем количестве учащихся. Чернокожие студенты, как заметили исследователи, оказались восприимчивее к предложенным самыми активными «политиканами» образцам участия в политических беспорядках. Кроме того, их успеваемость, помимо всяких политических событий, была устойчиво ниже, чем средняя успеваемость белых.

Коэффициент частной корреляции между переменными X и Y при контроле дополнительной переменной Z (т. е. при поддержании Z «на постоянном уровне») обозначают как rхy.z. Для его вычисления достаточно знать величины наблюдаемых попарных корреляций между переменными X, Y и Z  (n. e. простых корреляций — rxy , ryz , rxz):

Как всякая выборочная статистика, коэффициент корреляции подвержен выборочному разбросу. Существует некоторая вероятность того, что для данной выборки будет получено ненулевое значение коэффициента корреляции, тогда как истинное его значение для генеральной совокупности равно нулю. Иными словами, существует задача оценки значимости полученных значений корреляций и коэффициентов регрессии, относящаяся к области теории статистического вывода. Описание соответствующих статистических методов выходит за рамки этой книги, поэтому мы рассмотрим лишь самые общие принципы, позволяющие решать описанную задачу в простых случаях и интерпретировать соответствующие показатели при использовании стандартных компьютерных программ.

Прежде всего вероятностная оценка коэффициента корреляции подразумевает оценку отношения к его случайной ошибке. Удобная, хотя и не вполне надежная формула для вычисления ошибки коэффициента корреляции (mr) выглядит так44:

Всегда полезно вычислить отношение полученной величины r к его ошибке (т. е. rr). В использовавшемся нами примере данных о погоде коэффициент корреляции оказался равен 0,91, а его выборочная ошибка составляет:

Отношение r к тr обозначаемое как t, составит  Разумеется, коэффициент, превосходящий свою случайную ошибку почти в 16 раз, может быть признан значимым даже без построения доверительных интервалов.

Когда значение r не столь близко к единице и выборка невелика, нужно все же проверить статистическую гипотезу о равенстве r нулю в генеральной совокупности. Для этого нужно определить t по формуле:

где tэто величина так называемого t-критерия Стьюдента (см. также главу 4), rвыборочный коэффициент корреляции, п — объем выборки. Для установления значимости вычисленной величины t-критерия пользуются таблицами t-распределения для (n  2) степеней свободы (см. табл. 4.1). Во многих пособиях по статистике можно найти и готовые таблицы критических значений коэффициента корреляции r для данного уровня значимости . В этом случае отпадает необходимость в каких-либо вычислениях t: достаточно сравнить полученную величину коэффициента корреляции с табличным значением45. (Например, величина коэффициента корреляции r = 0,55 будет существенной на уровне значимости р = 0,01 даже для выборки объемом 105, так как критическое значение составляет 0,254.)

Множественная регрессия и путевой анализ

Выше описывалась модель линейной регрессии для двух переменных. В действительности социолог довольно редко сталкивается со столь простыми моделями данных. Влияние одного фактора обычно может объяснить лишь часть разброса наблюдаемых значений независимой переменной. Метод частной корреляции позволяет нам проконтролировать эффекты воздействия любых других контрольных переменных, которые мы в состоянии измерить. (Стоит снова подчеркнуть здесь, что статистические методы изучения причинных взаимосвязей, в отличие от экспериментальных, позволяют нам контролировать лишь те источники вариации, которые мы способны концептуализировать и измерить.) Однако еще более интересной задачей является контроль одновременного воздействия нескольких независимых на одну зависимую переменную, а также сравнение эффекта воздействия разных независимых переменных и предсказание «отклика» независимой переменной. Именно эти задачи решают методы анализа, о которых пойдет речь в данном параграфе. Наше изложение будет неполным, так как более детальное обсуждение требует дополнительной математической подготовки. Мы будем ориентироваться на сравнительно скромные цели понимания общей логики и интерпретации результатов соответствующих статистических процедур.

Уравнение множественной регрессии — это определенная модель порождения данных. Важные допущения, принимаемые в этой модели, касаются уже известного вам требования линейности, а также аддитивности суммарного эффекта независимых переменных. Последнее означает, что воздействия разных независимых переменных просто суммируются, а не, скажем, перемножаются (мультипликативный эффект, в отличие от аддитивного, имеет место тогда, когда величина воздействия одной независимой переменной на зависимую, в свою очередь, находится под влиянием другой независимой переменной, т. е. независимые переменные взаимодействуют друг с другом).

Множественная регрессия во многом аналогична простой (бивариантной) регрессии. Отличие состоит в том, что регрессия осуществляется по двум и более независимым переменным одновременно, причем каждая из них входит в регрессионное уравнение с коэффициентом, позволяющим предсказать значения зависимой переменной с минимальным количеством ошибок (критерием здесь снова является метод наименьших квадратов). Частные коэффициенты в уравнении множественной регрессии показывают, какой будет величина воздействия соответствующей независимой переменной на зависимую при контроле влияния других независимых переменных. Если воспользоваться простейшей системой обозначений, то уравнение множественной регрессии для трех независимых переменных можно записать как:

где  это предсказываемое значение зависимой переменной, X1 ... Х3 независимые переменные, а b1, ... b3частные коэффициенты регрессии для каждой из зависимых переменных.

Коэффициенты b могут быть интерпретированы как показатели влияния каждой из независимых переменных на зависимую при контроле всех других независимых переменных в уравнении. В отличие от коэффициентов частной корреляции коэффициенты регрессии обладают размерностью. Они показывают, на сколько единиц изменится зависимая переменная при увеличении независимой на одну единицу (при контроле всех остальных переменных модели). Пусть, например, мы построили уравнение множественной регрессии, описывающее зависимость дохода от интеллекта (X1) и стажа работы 2). Если величина b1 оказалась равной 100, это означает, что каждый дополнительный балл по шкале интеллекта увеличивает доход на 100 рублей. Значение b2 = 950 говорит нам, что год стажа прибавляет 950 рублей. Однако «сырые» оценки интеллекта и стажа измерены в разных единицах. Для определения сравнительной значимости независимых переменных, входящих в уравнение множественной регрессии, мы должны подвергнуть все переменные стандартизации (т. е. перевести их в Z-оценки, см. выше). Стандартизованные коэффициенты множественной регрессии, которые удобнее всего обозначать как b* (либо греч. «бета» — ), меняются в пределах от 1,0 до +1,0. Они сохраняют свою величину при изменении масштаба шкалы: переход от измерения возраста в годах к измерению в днях не изменит соответствующий b*.

Стандартизованные коэффициенты позволяют оценить «вклад» каждой из переменных-предикторов в предсказание значений независимой переменной. Если в примере с влиянием интеллекта и стажа работы на доход окажется, что b1* = 0,25, а b2* = 0,30, то можно заключить, что сравнительная значимость «веса» интеллекта и стажа в предсказании дохода различаются незначительно. Если же для одной переменной b1* = 0,80, тогда как b2* = 0,40, мы можем сказать, что эффект воздействия второй переменной в два раза меньше эффекта первой.

Чтобы определить ожидаемые значения зависимой переменной для отдельных индивидов, достаточно подставить в уравнение множественной регрессии соответствующие значения переменных-предикторов и вычисленных коэффициентов b. Пусть, например, мы хотим рассчитать прогнозное значение величины дохода для человека, чей коэффициент интеллекта равен 110, а стаж работы — 20 годам. Если b1, как в вышеприведенном примере, составляет 100, b2 = 950, а слагаемое а = 50000, то мы получим:

ожидаемый доход = 50000 +100 х 110 + 950 х 20 = 80000 руб.

Множественную регрессию можно использовать и для предсказания средних групповых значений, например среднего дохода мужчин-врачей. Единственное различие в данном случае заключается в использовании средних значений независимых переменных для подстановки в уравнение множественной регрессии. В качестве независимой переменной множественной регрессии могут использоваться и дихотомические переменные, которым приписывают значения 0 и 1 (например, пол). Для того чтобы включить в уравнение номинальную переменную с более чем двумя категориями, нужно создать соответствующее число новых, «фиктивных» переменных, каждая из которых будет кодироваться как 0 или 1 в зависимости от наличия или отсутствия категории-признака. Скажем, состоящую из трех категорий переменную «цвет глаз» можно представить с помощью трех переменных: Х1«голубые глаза», Х2«карие глаза», Х3«зеленые глаза». (Человек с голубыми глазами получит 1 по X1 и 0 по двум другим переменным.)

Метод множественной регрессии очень популярен среди социологов. Вот, например, как выглядели результаты его применения в исследовании Л. Бэрона и М. Строса, изучавших факторы, влияющие на статистику изнасилований46. Использованная в планировании этого исследования матрица данных включала в себя в качестве объектов («случаев») различные штаты США. Признаками, по которым описывались штаты, служили около десятка независимых и собственно контрольных переменных, предположительно воздействующих на зависимую переменную, — количество зарегистрированных полицией изнасилований на 100000 населения в год для данного штата (по данным ежегодных статистических отчетов ФБР). Предполагалось, что существующие различия между штатами в уровне изнасилований можно будет объяснить различиями в уровнях независимых переменных. Нужно отметить, что разброс «случаев» по зависимой переменной был весьма велик — от 71,9 на Аляске до 8,2 в Северной Дакоте (1979). Из десятка переменных, включенных в уравнение множественной регрессии, девять оказались статистически значимы. Основные результаты регрессионного анализа для семи переменных представлены в таблице 8.12.

Таблица 8.12

Множественный регрессионный анализ статистики изнасилований, 1979 г.47

Независимая переменная

Коэффициент

b

Коэффициент

b*

Р<

Индекс   совокупного  тиража  порнографических журналов (SMCX)

6,99

0,52

0,001

Показатель числа убийств и непредумышленных убийств

1,70

0,55

0,001

Показатель   числа   публичных    оскорблений    с угрозой применения физической силы

0,04

0,32

0,001

Индекс положения женщин (SWX)

0,43

0,27

0,014

Число грабежей

0,03

0,25

0,052

Процент черного населения

0,41

0,38

0,001

Процент  живущих   ниже   федерального   уровня бедности

1,11

0,29

0,011

Из таблицы видно, что индекс совокупного тиража порнографических журналов (интегральный показатель, учитывающий уровни продаж восьми популярных изданий) имеет коэффициент регрессии 6,99. Это означает, что рост индекса на единицу в среднем увеличивает количество изнасилований почти на 7 случаев (в расчете на 100000 населения). Весьма значительно и влияние числа убийств, что особенно заметно при сравнении стандартизованных коэффициентов (b*), не зависящих от шкалы измерения признака. Фактически количество убийств вносит самый значительный «вклад» в предсказание значений зависимой переменной (b* = 0,55). Интересно отметить, что одна из независимых переменных в описываемом исследовании — индекс положения женщин, рассчитанный на основании 22-х политических, экономических и социальных индикаторов, — при анализе простых взаимосвязей продемонстрировала практически нулевую корреляцию с количеством изнасилований (r = 0,17), причем результаты анализа диаграмм рассеивания также не дали никаких свидетельств в пользу гипотезы о нелинейной связи. Множественная регрессия позволила уточнить первоначальные выводы: при контроле прочих переменных модели, чем выше статус женщин, тем выше уровень изнасилований (результат, которому довольно трудно найти теоретическое объяснение). Использование девяти независимых переменных позволило объяснить 83% дисперсии в показателях количества изнасилований (квадрат коэффициента множественной корреляции r2 составил 0,83).

При интерпретации результатов множественной регрессии стандартизованные коэффициенты, как уже говорилось, используют в качестве показателей значимости, «вклада» соответствующих переменных. Эта трактовка верна лишь в определенных пределах. При нарушении некоторых условий сравнение абсолютных величин стандартизованных коэффициентов может вести к неверным выводам. Дело в том, что коэффициенты регрессии подвержены влиянию случайных ошибок измерения. Использование ненадежных индикаторов «сдвигает» регрессионные коэффициенты к нулю48. Иными, словами, более надежные индикаторы дают более высокие оценки коэффициентов. Пусть, например, для предсказания риска сердечно-сосудистых заболеваний использовались две независимые переменные индивидуального уровня — «ориентация на достижения» и «склонность подавлять агрессию», — причем шкала для измерения первой обладала более высоким коэффициентом надежности. Если стандартизованный коэффициент регрессии для достиженческой мотивации окажется выше, чем для подавления агрессии, это может рассматриваться как следствие таких содержательных различий между переменными, которые важны с точки зрения теории психосоциальных факторов заболеваемости. Но нельзя исключить и альтернативное объяснение, связывающее более высокий регрессионный коэффициент первой переменной с побочными эффектами методов измерения: влияние ориентации на достижения не превосходит влияния, оказываемого на риск инфаркта склонностью подавлять агрессию, а наблюдаемые различия регрессионных коэффициентов связаны лишь с ненадежностью использованных индикаторов склонности к подавлению.

Другая проблема, требующая некоторой осторожности в интерпретации коэффициентов регрессии, возникает вследствие того, что модель множественной регрессии не обязывает нас ни к каким строгим предположениям о причинных связях между независимыми переменными. Регрессионное уравнение, образно говоря, не делает никаких различий между собственно независимыми, т. е. теоретически специфицированными, переменными и дополнительными — контрольными, опосредующими и т.п.— факторами, вводимыми в модель с целью уточнения. В тех случаях, когда теоретическая гипотеза, проверяемая в ходе исследования, допускает: 1) существование взаимосвязей между независимыми переменными, 2) наличие прямых и косвенных (опосредованных) влияний, а также 3) использование нескольких индикаторов для каждого латентного фактора, могут понадобиться более совершенные статистические методы. Одна из возможностей здесь — это использование путевого анализа.

Путевой анализ — один из основных способов построения и проверки причинных моделей в социологии. Многие более продвинутые статистические техники основаны на сходной исследовательской методологии.

Важным достоинством путевого анализа является то, что он позволяет оценить параметры каузальных моделей, причем в расчет принимаются не только прямые, но и непрямые (опосредованные) влияния. Если, например, в результате корреляционного или регрессионного анализа мы обнаружили, что интеллект (измеренный как IQ) лишь умеренно влияет на доход, нам не следует торопиться с общими выводами. Мы оставили неучтенной возможность того, что интеллект может иметь существенное влияние на образование, которое, в свою очередь, воздействует на последующий доход. Таким образом, нам нужно принять во внимание то, что интеллект — помимо прямого эффекта — может иметь еще и опосредованное, непрямое влияние на доход посредством влияния на образование. Методы, рассматривавшиеся нами до сих пор, описывали только прямые эффекты.

Путевой анализ включает в себя технику представления прямых и косвенных причинных влияний при помощи специальных диаграмм (потоковых графов). Эти диаграммы часто называют просто причинными (структурными) моделями.

Последовательно «считывая» такую модель, можно легко определить все пути влияния одной переменной на другую и соответственно оценить величину чистого эффекта. Во многих разделах этой книги причинные модели уже использовались для представления сравнительно сложных причинных гипотез, поэтому общая логика их построения не требует детального обсуждения. Порядок представления переменных на диаграмме отражает предполагаемое направление причинной связи, а диапазон включенных в диаграмму переменных и отношения между ними зависят от принятых исследователем теоретических гипотез. Так называемые путевые коэффициенты, описывающие связи между переменными (связям соответствуют стрелочки на диаграмме), равны стандартизованным коэффициентам множественной регрессии (b*)49.

Обычно путевую диаграмму рисуют слева направо — от самых «ранних» по порядку следования независимых переменных до зависимой. Путевые коэффициенты часто обозначают латинскими «p» с подстрочными индексами 21это путевой коэффициент для связи между переменными Х1  Х2). На рисунке 24 в качестве примера изображена путевая диаграмма, отражающая гипотетические отношения между интеллектом (Х1), образованием 2), социально-экономическим статусом (Х3), доходом (Х4) и размерами сбережений (Х5).

Специальные правила позволяют перевести отношения, изображенные на диаграмме, в совокупность структурных уравнений, описывающих механизмы прямого и опосредованного воздействия одних переменных на другие. На рисунке 24, в частности, видно, что не существует пути для прямого воздействия интеллекта на размеры сбережений, однако общий эффект воздействия интеллекта будет включать в себя совокупность непрямых эффектов: Х1 воздействует на Х5 и через образование 2), и через достигнутый статус (Х3), и через доход 4). Иными словами, хотя и нельзя утверждать, что склонность откладывать деньги «в кубышку» зависит от умственных способностей, последние влияют и на возможность получения образования, и на статус, и на доход. В свою очередь, люди с определенным социальным и экономическим статусом обнаруживают склонность иметь сбережения.

                      Р21                                                             Р32                       Р32

                           Р31                                                                                Р53

                          Р41                                          Р43                                                Р34                    

Puc. 24. Путевая диаграмма для примера со сбережениями

В общем случае, полный эффект влияния переменной равен сумме ее непосредственного эффекта и всех косвенных эффектов влияния. Величины возмущений 2 — е4) на рисунке позволяют оценить, насколько хорошо работает модель, показывая, какая часть дисперсии соответствующей переменной осталась необъясненной. В результате путевой анализ позволяет пересматривать и уточнять исходную теоретическую модель, сравнивать «эффективность» нескольких конкурирующих теорий для объяснения существующей совокупности эмпирических наблюдений. Существуют даже компьютерные программы, осуществляющие автоматический поиск наилучшей структурной модели, т.е. процедуру, сходную с отбором из нескольких существующих теорий такой, которая максимально соответствовала бы полученным в исследовании данным50. Важно, однако, осознавать, что сами по себе результаты применения регрессионных методов и причинных моделей (регрессионные коэффициенты, линии регрессии, путевые диаграммы) решают прежде всего задачу обобщенного описания уже полученных эмпирических данных. Они могут служить надежной основой для интерполяции, оценки положения гипотетических «точек» в пределах ряда наблюдавшихся значений, однако их использование в целях экстраполяции и прогноза может вести к существенным ошибкам в тех случаях, когда такой прогноз не подкреплен более широкой теорией, не сводимой к отдельной модели для конечной совокупности данных. (Достаточно указать в качестве примера на многочисленные ошибочные прогнозы в экономике — науке, где количество эмпирических данных и описывающих их структурных моделей многократно превзошло количество существующих теорий).

Путевой анализ, как и множественная регрессия, сегодня является частью большинства стандартных статистических программ для компьютера. Не стоит, однако, забывать о том, что при любом уровне прогресса в компьютерном обеспечении задать причинную модель, т.е. совокупность содержательных гипотез, подлежащих статистическому оцениванию, может только сам исследователь.

Дополнительная литература

Вайнберг Дж., Шумекер Дж. Статистика. М.: Финансы и статистика, 1979.

Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.: Прогресс, 1976.

Интерпретация и анализ данных в социологическом исследовании. М.: Наука, 1987.

Татарова Г.Г. Типологический анализ в социологии. М.: Наука, 1993.

Типология и классификация в социологических исследованиях. М.: Наука, 1982.

Толстова Ю.Н. Логика математического анализа социологических данных. М.: Наука, 1991.

Хейс Д. Причинный анализ в статистических исследованиях. М.: Финансы и статистика, 1981.

Флейс Дж. Статистические методы для изучения таблиц долей и пропорций. М.: Финансы и статистка, 1989.

Ядов В.А. Социологические исследование: методология, программа, методы. 2-е изд. М.: Наука, 1987. Гл. 5.

1 Напомним, что под индуктивным выводом обычно понимают рассуждение по схеме «от частных наблюдений — к общей эмпирической закономерности».

2 Более детальные сведения о развитии выборочного метода можно найти, в частности, в интересной и доступной книге: Дружинин Н. К. Выборочное наблюдение и эксперимент. М.: Статистика, 1979.

3 См.: Fisher R. A. The Design of Experiment. 3rd ed. L.: Oliver & Boyd, 1942.

4 В дальнейшем мы будем использовать термины «случайная выборка» и «вероятностная выборка» как взаимозаменяемые.

5 RouncefieldM., Holmes P. Practical Statistics. Basingstoke: Macmillan Education Ltd, 1989. P. 122.

6 Gallup G. A. Guide to Public Opinion Polls. Princeton: Princeton University Press, 1948.

7 Составлено на основе таблицы: Appendix С: Random Numbers // Zeller R. A., Carmines E. G. Statistical Analysis of Social Data. Chicago: Rand McNally, 1978. P. 364—367.

8 Здесь и далее речь идет о случайной безвозвратной выборке, так как выборка с возвращением отобранной единицы в совокупность на каждом шаге отбора не очень удобна практически (хотя и обладает рядом статистических преимуществ).

9 В отечественной литературе сравнительный анализ разных основ и их применения в конкретных исследованиях осуществлен, например, в книге: Арутюнян Ю. В., Дробижева Л. М., Кондратьев В. С., Сусоколов А. А. Этносоциология: цели, методы и некоторые результаты исследования. М.: Наука, 1984. Гл. IV.

10 Подробнее об источниках смещений в основе выборки и некоторых способах борьбы со смещениями см.: Kish L. Survey sampling. N. Y.: J. Wiley, 1965. P. 53—59.

11 В действительности нам понадобится как минимум 20%-й запас карточек с именами и адресами для замещения тех респондентов, которые окажутся недоступными даже 2—3 посещений. Доля «недоступных» в исследовании специфических популяций (например, зубных врачей или читателей «Вопросов литературы») может составить 40—50%, включая и длительно отсутствующих, и отказавшихся от сотрудничества и т. п. Соответственно в последнем случае «запас» должен составлять 40—50% от первоначально запланированного объема выборки.

12 Обсуждение «послевыборочных» последствий различных процедур отбора можно найти, в частности, в книге: Henry G. T. Practical sampling (Appl. Research Methods Series. Vol. 21). Newbury Park etc.: Sage, 1990. Ch. 8.

13 Henry G. T. Op. cit. P. 25.

14 Подробнее см.: Sudman S. Applied sampling. N. Y.: Academic Press, 1975. P. 126—130.

15 Соответственно использование кластерной процедуры отбора лишено смысла при проведении почтовых опросов, централизованных телефонных интервью и локальных обследований.

16 Sudman S. Op. cit. P. 70.

17 В нашем случае так называемой территориальной кластерной выборки таковыми являются различия в численности населения отдельных деревень и хуторов.

18 См.: Sudman S. Op. cit. P. 73—78.

19 Источник: Hansen M., Hurwitz W. N., Madav W. G. Sample Survey Methods and Theory. N. Y.: Wiley and Sons, 1953. 2 vols. (Vol. 1. P. 264. Table 3). Знаки «0» перед запятой опущены.

20 См.: Sudman S. Op. cit. P. 78—79; Hansen M., Hurwitz W. N.. Madow W. G. Op. cit.

21 Примером многофазной (многоступенчатой) стратифицированной выборки может служить выборка «Всесоюзного этносоциологического исследования» (рук. Ю. В. Арутюнян, 1971—1976 гг.). См. подробнее: Арутюнян Ю. В., Дробижева Л. М., Кондратьев В. С., Сусоколов А. А. Цит. соч. С. 111—123. Отметим также, что впервые в отечественной социологии многоступенчатая территориальная вероятностная выборка использовалась в исследовании читателей газеты «Правда», проводившемся В. Э. Шляпентохом в 1970-е гг.

22 См.: Кокрен У. Методы выборочного исследования. М.: Статистика, 1976.

23 Sudmап S. Op. cit. P. 89.

24 В отечественной литературе примеры очень интересных исследований, основанных на целевом отборе, особенно многочисленны (причиной чему, очевидно, является хроническая недостаточность финансирования социологических исследований). Общее представление об используемых в них методах повышения качества информации можно составить, ознакомившись с несколькими хорошими работами, например: 47 пятниц. Функционирование общественного мнения в условиях города (программы и документы исследования). М.: ССА, 1969. Вып. 1.; Шубкин В. Н. Начало пути. М.: Молодая гвардия, 1919; Клявина Т. А., Хршановская С. П. В поисках зрителя (итоги опроса руководителей театров РСФСР) // Социологические исследования. 1988. № 3. С. 47—53.

25 Henry G. Т. Op. cit. P. 21.

26 Предвыборные опросы общественного мнения, проводившиеся различными российскими исследовательскими центрами в первой половине 1990-х гг., изобилуют столь многочисленными подтверждениями этой истины, что трудно выбрать один «негативный пример» для критического рассмотрения. Систематический анализ просчетов в организации выборки таких опросов содержится в работах: Шляпентох В. Э. Предвыборные опросы 1993 г. в России (критический анализ) // Социологические исследования. 1995. № 10. С. 3—10; Мансуров В. А., Петренко Е. С. Изучение общественного мнения в России и СССР // Социология в России. М.: На Воробьевых, 1996. Богатый эмпирический материал, относящийся к ошибочным прогнозам итогов выборов в Думу 1995 г., см. в статье: Рубинов А. Социология сказала... // Лит. газета. 1995. 13 дек.

27 Источник данных: Личко А.Е. Шизофрения у подростков. М.: Медицина, 1989. С. 6.

28 Доказательства этих свойство см. в книге: Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.: Прогресс, 1976. С. 6465.

29 Для небольших выборок (N< 100) лучше делить на (N-1).

30 Для сгруппированных данных более точной формулой дисперсии будет:


где k — количество разных значений (k< n),    а       

31 Для больших выборок биномиальное распределение практически не отличается от нормального. Если Р и Q не слишком различны по величине, достаточно и не очень большой выборки.

32 См., например, приложение 5 в книге: Дружинин Н. К. Логика оценки статистических гипотез. М.: Статистика, 1973.

33 См.: Mueller J. H., Schuessler К. F., Costner H. L Statistical Reasoning in Sociology. 3rd ed. Boston: Haughton Mifflin Co., 1977. P. 196—205.

34 Ibid. P. 197.

35 Желательно не путать обсуждаемый здесь коэффициент сопряженности «тау» Гудмана-Краскела с коэффициентом ранговой корреляции «тау», предложенным Кендаллом. Отметьте также, что  = 2.

36 См.: Stouffer S. A. et al. The American Soldier. Princeton: Princeton University Press, 1949. Vol. 1; Kendall P. L., Lazarsfeld P. F. Problems of Survey Analysis // Merton R. K., Lazarsfeld P. F. (eds.) Continuities in Social Research: Studies in the Scope and Method of the «American Soldier». N. Y.: Free Press, 1950. P. 133—196. Существенные дополнения см. в: Rosenberg M. The Logic of Survey Analysis. N. Y.: Basic Books, 1968; Ядов В. А. Социологическое исследование: методология, программа, методы. М.: Наука, 1987. С. 190—195.

37 Это исходное взаимоотношение иногда называют отношением нулевого порядка, а модели, получаемые при введении второй, третьей и т.д. контрольных переменных, — отношениями, второго, третьего и т.д. порядка.

38 Именно так обычно выглядит зависимость между благожелательностью установки по отношению к некоторому объекту (X) и интенсивностью установки (Y): люди, занимающие крайне благожелательную или крайне неблагожелательную позицию в каком-то вопросе, обычно оценивают свои убеждения как более выраженные и интенсивные, чем те люди, чьи установки лежат в области середины, «нейтральных» значений шкалы.

39 Погода (Гидрометцентр Рф) //Сегодня. 1994. 23. авг.

40 Подробный анализ можно найти в большинстве руководств по прикладной статистике. Здесь мы ограничимся обсуждением общей логики оценки объясненной дисперсии.

41 Более детальные сведения можно найти в статистической литературе. Очень доступно проблема излагается, в частности, в кн.: Гласс Дж., Стенли Дж. Указ. соч. С. 123—141. Для тех же, кто захочет осуществить «ручную» регрессию для какого-либо из использованных примеров, просто приведем формулы для вычисления нестандартизированных коэффициентов (обозначения те же, что и выше):  

42 Легко понять, что при измерении в единицах стандартного отклонения максимальная связь (β = 1,0) соответствует ситуации, когда сдвигу от начала координат в 1 ед. стандартного отклонения по X соответствует увеличение Y также на 1 ед. стандартного отклонения. Важно заметить, что в случае стандартизированных переменных (и только в этом случае) коэффициенты регрессии Y по X и X по Y будут совпадать.

43 Mueller J., Schuessler К., Costner H. Statistical Reasoning in Sociology. 3rd ed. Boston: Haighton Mifflin Co, 1977. P. 279—281.

44 См.: Дружинин Н.К. Логика оценки статистических гипотез. М.: Статистика, 1973. С. 112114.

45 См., в частности: Ликеш И., Ляга Й. Основные таблицы математической статистики. М.: Финансы и статистика, 1985. (Табл. 14.)

46 Baron L, Strauss M. A. Sexual Stratification, Pornography, and Rape in the United States // Malamuth N., Donnerstein E. (eds.) Pornography and Sexual Aggression. Orlando et al.: Academic Press, 1984. P. 185—209.

47 Таблица приводится в сокращении по источнику: Baron L, Strauss V. A. Sexual Stratification, Pornography, and Rape.

48  Явление называют аттенюацией. Существуют специальные методы внесения поправок на аттенюацию, но здесь они обсуждаться не будут.

49 В оценивании также используется метод наименьших квадратов.

50 Подробнее см.: И.Ф. Девятко. Диагностическая процедура в социологии: очерк истории и теории. М.: Наука, 1993. С. 121136.




1. статья Автор составитель- Авдеева Елена Анатольевна учительлого
2. РЕФЕРАТ дисертації на здобуття наукового ступеня кандидата філологічних наук3
3. Business English Учебное пособие для студентов 1 курса экономических специальностей
4. Тема 6 РЕКЛАМНЫЕ СРЕДСТВА И ИХ ПРИМЕНЕНИЕ 6
5. Этапы развития вычислительной техники и программного обеспечения
6. Социально-педагогическая деятельность по формированию здорового образа жизни среди учащихся Амгинской педагогической гимназии
7. Тема- Работа начальной школы по реализации стандартов второго поколения.
8. Газеты Известия Комсомольская правда Наш Красноярский край могут быть объединены в группу по А
9. Тема- Расчёт времени простоя автомобиля в пунктах погрузки и разгрузки
10. Государственный долг РФ- проблемы и перспективы
11. Менеджмент як орган апарат управління організацією
12. правовым актам систем взаиморасчетов и других современных достижений в области информационных технологий
13. виражати; 2. виявляти; seine Meinung ~u~ern; den Wunsch ~u~ern; Misstruen ~u~ern
14. Тема курсового проекту
15. Тема занятия- СРЕДСТВА ДЛЯ НАРКОЗА
16. РЕФЕРАТ диссертации на соискание ученой степени доктора экономических наук Санк
17. Садака Аллаху Азым Сказал истину Аллах после прочтения Корана является бида
18. Задание 1 Провести с группой студентов ознакомление с техникой стоек и перемещений в нападении
19. Терроризм как социальное и правовое явление
20. Vолодые ветра 2001 Инопланетен 2003