Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

а Калинин А

Работа добавлена на сайт samzan.net: 2016-06-09

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 21.5.2024

Калинин А.А., Кедич С.И.

ПРОСТЕЙШИЕ МЕТОДЫ АНАЛИЗА ДАННЫХ

В ПСИХОЛОГИИ

Учебно-методическое пособие

Санкт-Петербург

2004


Рецензенты:

Благинин А.А., доктор медицинских наук, профессор (Военно-медицинская академия, Санкт-Петербург)

Маклаков А.Г., доктор психологических наук, профессор, (Ленинградский государственный университет им. А.С. Пушкина)

Калинин А.А., Гусева С.И. Простейшие методы анализа данных в психологии. Учеб.-метод. пособие. СПб: ЛГУ им. А.С. Пушкина, 2004

Пособие представляет собой практическое руководство для студентов при статистическом обосновании научных и практических выводов курсовых и дипломных работ. Принцип отбора методов – ясность и простота. Методы рассматриваются на реальных примерах и сопровождаются алгоритмами.

Все они могут быть использованы для быстрой обработки данных.

Руководство предназначено для студентов и практических психологов образовательных учреждений.

ISSN 5-8290-0456-5


ВВЕДЕНИЕ

Одной из наиболее важных особенностей развития познания в ХХ веке является математизация всех наук, включая естественные и гуманитарные. Не стала исключением и психология: переход от описания явления к его измерению и активное экспериментирование способствовали внедрению математических методов  обработки данных в практику психологов даже несколько ранее, чем это произошло в  других гуманитарных науках. Более того, целый ряд широко используемых в гуманитарных и естественных науках статистических методов нашел свое распространение именно благодаря исследованиям психологов.

Современная культура экспериментального исследования в любой области знаний требует убедительных статистических подтверждений. Математические методы применяются в психологии в первую очередь для правильного описания, обобщения и представления получаемых результатов. Математическая обработка данных позволяет выявить и в обобщенном виде описать закономерности психологических явлений, нередко способствует пониманию их сути и, самое главное, повышает доказательность выводов. Математический аппарат статистических исследований универсален: психологи используют математические методы, разработанные для решения задач экономики, биологии, геологии, в то же время методы, разработанные для решения собственно психологических задач, успешно применяются специалистами в области естественных наук.

Любому психологу-практику следует иметь представление о той математике, которая лежит в основе психологической диагностики, чтобы математически правильно понимать и интерпретировать результаты тестирования. Первичные результаты любого психологического теста практически бессмысленны без дополнительных данных. Сказать, что кто-то правильно решил 10 задач теста, опознал 24 слова в лексическом тесте или собрал тестовый объект из элементов за 52 секунды - это практически ничего не сообщить о том, как у этого объекта исследований развита соответствующая функция. Точно так же, если мы приведем не абсолютные, а процентные показатели, например, выполнения заданий - 65% правильных ответов по одному тесту, 28% по другому, 80% по третьему, то мы опять же не дадим практически никакой новой информации, поскольку мы не знаем сложности выполненного задания. Любые первичные данные могут быть истолкованы только в рамках какой-либо четко заданной единой системы отсчета. В психологии результаты тестов чаще всего интерпретируется путем их сравнения с нормами выполнения, установленными опытным путем. Решить, как соотносятся результаты исследования с нормативными показателями (различаются значимо, незначимо, либо не отличаются) - это задача, решаемая с применением методов математической статистики. Методы математической статистики позволяют сравнить показатели двух обследуемых групп между собой, установить, значимо ли изменились показатели одного обследуемого или целой группы после воздействия какого-либо внешнего фактора, установить наличие или отсутствие согласованности изменения двух и более величин. Математическая статистика позволяет оценить, насколько можно доверять тому или иному выводу исследователя, но при этом ни в коем случае не служит его доказательством.

Математический аппарат статистических исследований, описанных в настоящем пособии, как правило, совсем несложен и ограничивается четырьмя арифметическими действиями и возведением в степень, что делает материал доступным даже для студентов, считающих себя абсолютно неспособными к математике. В рамках курса использованы наиболее простые примеры, что облегчает понимание сути метода. Все расчеты при решении задач могут быть выполнены с помощью калькулятора. Как правило, в распоряжении современного исследователя есть компьютер, для которого написано множество программ расчета статистических характеристик. В практической работе в дальнейшем, в том числе при выполнении курсовых и дипломных работ, для работы с большими выборками данных можно и нужно использовать возможности их компьютерной обработки. В пособии указаны статистические критерии, расчет которых можно провести с помощью программы Microsoft Excel.

1. ШКАЛЫ

Перед тем, как приступить к обработке данных, надо привести эти данные в соответствующий вид. Математическая обработка данных - это оперирование со значениями  какого-либо признака, полученными в результате психологического исследования. Это могут быть, к примеру, время решения задачи, или количество допущенных ошибок при чтении текста, или количество родителей, поддержавших введение новой школьной программы и множество других переменных. То есть математическая обработка данных - это исследование результатов измерения признаков. Под измерением признака понимается приписывание объектам или событиям числовых форм в соответствии с определенными правилами. С.Стивенс выделил 4 способа измерения признаков, которые он назвал шкалами: это шкалы наименований (синонимы - «номинативная» и «номинальная»), рангов (она же порядковая шкала), интервалов и отношений. Первые две шкалы - наименований и рангов - относятся к неметрическим шкалам, поскольку непосредственно чисел они явлениям не приписывают. Две другие шкалы - интервалов и отношений - относятся к шкалам метрическим.

Шкала наименований, она же номинативная или номинальная шкала. Понятно, что наименование не измеряется количественно, оно лишь позволяет отличить один предмет (явление) от другого. Номинативная шкала - это способ распределения объектов или явлений по классификационным ячейкам. Например, проголосовал «за» - проголосовал «против», или «русский» - «иностранец», или ответил на вопрос «да» или «нет». В простейшем случае номинативная шкала состоит из двух ячеек («да - нет»), и она называется дихотомической. Более сложный вариант номинативной шкалы - классификация из трех и более ячеек («за» - «против» - «воздержался», ездит на работу автобусом - трамваем - троллейбусом - метро и т.д.). Исследователь постоянно сталкивается с номинативной шкалой при обработке результатов социологических и социально-психологических опросов и анкет. Испытуемый, выбирая один из возможных ответов, относит себя к тому или иному классу (категории) людей, причем категории являются взаимоисключающими. Категории можно называть буквами - А, Б, В, или, к примеру, по цвету - красный, синий, зеленый, или цифрами - номерами вопросов. Но номер вопроса в анкете - это только имя класса ответов, он не имеет метрического значения (мы не можем говорить, что «5 больше 3», а «2 в два раза больше 1»). Только распределив объекты или реакции испытуемых по ячейкам классификации и сосчитав количество наблюдений в каждой из ячеек, то есть частоту встречаемости того или иного признака, мы получаем возможность перейти от наименований к числам. Таким образом, при использовании шкалы наименований единицей измерения является «одно наблюдение».

Другая шкала - это шкала рангов (или порядковая шкала), которая классифицирует объекты по принципу «больше»- «меньше». Здесь мы группируем объекты в три или более классов, придавая, обычно, объектам с наименее выраженными свойствами наименьшее значение ранга (класса) - 1, с  несколько более выраженными свойствами  - 2, и так далее по возрастающей. Например, шкала рангов «подходит на должность директора фирмы» - «подходит при определенных условиях» - «не подходит» имеет три ранга - 3, 2 и 1 соответственно. Мы не знаем истинных отношений между классами, может быть классы 3 и 2 очень близки к друг другу, а класс 1 контрастно отличается, но знаем их последовательность от меньшего к большему. И, переходя от классов к обозначающим их числам, мы получаем возможность математической обработки данных. Естественно, чем больше выделено классов, тем шире эти возможности.

Все психологические методы, основанные на ранжировании, используют шкалу порядка. Например, распределяя 10 ценностей по их значимости лично для него, испытуемый совершает так называемое принудительное ранжирование, и количество рангов соответствует количеству ранжируемых объектов (субъектов). Разные ранги, таким образом, будут получать довольно близкие по своей ценности объекты. Например, в тесте при приеме на работу задается вопрос, что для Вас важнее - высокая зарплата, дружный коллектив, близость места работы к дому, свободный график работы и так далее. И хотя поступающему на работу может быть одинаково важно наличие дружного коллектива и близость к дому, но он вынужден задать эти двум категориям разные ранги. Бывает наоборот, что большое количество испытуемых или понятий надо «втиснуть» в 3-4 класса, при этом, разумеется, одинаковые ранги получит целая группа испытуемых, возможно, значительно различающихся между собой.

В порядковой шкале (шкале рангов) единица измерения - 1 класс (ранг). Расстояние между классами нам неизвестно, оно может быть одинаковым, может быть различным.

Шкала интервалов классифицирует объекты или явления по признакам «больше (меньше) на какое-то количество единиц», то есть основывается на предположении о равенстве разности степени выраженности какого-либо психологического свойства  двух объектов разности двух чисел, приписываемых этим объектам для характеристики свойства.

Шкала отношений классифицирует объекты или субъекты пропорционально степени выраженности измеряемого свойства, то есть предполагает равенство отношения степени выраженности какого-либо психологического свойства двух объектов отношению двух чисел, приписываемых этим объектам для характеристики свойства. Принципиальная разница между шкалами интервалов и отношений заключается в том, что в интервальной шкале нет абсолютного нуля (нулевая точка ставится условно), в шкале отношений такая точка есть. По шкале отношений мы можем представить, во сколько раз свойство одного испытуемого превосходит свойство другого. Лучше всего представить себе разницу между шкалами интервалов и отношений на примере температурной шкалы. Шкала Цельсия - интервальная, разница температуры между -10С и -20С такая же, как между 150С и 140С. Но на шкале интервалов нет естественного нуля - значение 0С по Цельсию выбрано произвольно, как точка замерзания воды. В абсолютной шкале Кельвина точка 0К обозначает температуру, ниже которой значений быть не может. Следовательно, здесь есть абсолютный ноль, и шкала Кельвина является шкалой отношений. К этому же типу относятся измерения длины объектов. Может быть длина нулевая (нет объекта), но не может быть отрицательных значений. Шкала отношений - высшая форма измерений, с данными, измеренными в шкале отношений можно осуществлять все виды математических операций. Шкала отношений используется, в основном, при психофизиологических исследованиях явлений, измеряемых в физических единицах (метры, граммы, секунды и т.д.). Для большинства психологических явлений шкала отношений не применяется: трудно представить себе полное отсутствие у испытуемого какого-либо психологического свойства - например, абсолютную глупость. Итоговая оценочная шкала большинства опросников - интервальная, где точкой отсчета - условным нулем - является ноль набранных баллов.

При математической обработке данных в случае необходимости всегда можно перейти к шкале более низкого порядка - от шкалы интервалов, например, к шкале рангов или наименований. В то же время переход к шкале более высокого порядка (от шкалы наименований, к примеру, к шкале рангов) невозможен без дополнительных исследований.

2. СЛУЧАЙНОЕ СОБЫТИЕ

Случайным событием называется событие, которое может произойти либо не произойти, либо произойти в той или иной степени. Численными мерами появления случайного события являются абсолютная частота, относительная частота и вероятность.

Абсолютная частота - это просто количество событий, интересующих исследователя. Абсолютную частоту принято обозначать символом fi.

Относительная частота - это абсолютная частота, отнесенная к общему количеству событий в некотором опыте.

Вероятность - это то значение, к которому стремится относительная частота при бесконечном увеличении числа опытов. Выражается она в виде положительного числа, большего нуля и меньшего 1 (либо от 0 до 100%), и является понятием идеальным, поскольку на практике количество опытов всегда ограничено. Вероятность равна 0, если событие абсолютно невероятно, и равна 1 (или 100%) если событие неизбежно. Определяя вероятность какого-либо события как 1/2 или 50% («вероятность дождя завтра 50%») мы выражаем свою точку зрения с наименьшей степенью уверенности. Если же мы скажем, что вероятность дождя 75% (а того, что дождя не будет, соответственно, 25%) мы проявляем большую степень уверенности -  вероятность дождя в три раза выше вероятности того, что дождя не будет. Вероятность принято обозначать буквой «р».

События А, В, С, ... могут быть совместными и несовместными, зависимыми и независимыми. Совместными называются события, которые могут произойти одновременно в одном и том же опыте (длинный и зеленый, или, например, экстраверт-невротик). Несовместными будут события, которые одновременно произойти не могут (в одном опыте испытуемый не может быть сразу экстра- и интровертом, монета может упасть или «орлом», или «решкой»). Полной группой событий называется множество несовместных событий, одно из которых произойдет обязательно: испытуемый будет лицом женского или мужского пола, он будет старше 40 лет или не старше этого возраста.

Зависимыми называются события, появление одного из которых оказывает влияние на вероятность другого. Ребенок достиг семи лет, и он идет в школу. Ученик окончил первый класс, и он умеет писать буквы. Если такое влияние отсутствует, то события являются независимыми.

Суммой событий называется событие S, заключающееся в том, что произойдет или одно, или другое, или третье и т.д. событие, т.е. S=А+В+С+.... Произведением событий называется событие W, заключающееся в том, что произойдет и первое, и второе, и третье и т.д. событие: W=AxBxCx... . Для сумм и произведений событий выполняются следующие правила:

  1.  Вероятность суммы несовместных событий равна сумме вероятностей этих событий  Р(A+B+C+...) = P(A)+P(B)+P(С)+...P(Z). Например, нам известно, что среди студентов ВУЗа 40% сангвиников, 20% холериков, 24% флегматиков и 16% меланхоликов. Вероятность того, что первый встреченный нами студент окажется флегматиком составляет 24%, холериком или сангвиником 20+40=60%, меланхоликом или флегматиком 24+16=40%, а того, что он не окажется меланхоликом 84% (20+40+24%).
  2.  Вероятность произведения независимых событий равна  произведению вероятностей этих событий Р(ABC... Z) = P(A)P(B)P(С) ... P(Z). К примеру, отвечая на вопросы экзаменационного тестирования, абитуриент уверен в правильности ответа на первый вопрос на 90%, на второй - на 100%, на третий - на 50%, на четвертый - на 60%. В этом случае вероятность полностью правильного выполнения теста Р= 0,91,0 0,5 0,6 = 0,27 или 27%.

3. СЛУЧАЙНАЯ ВЕЛИЧИНА

3.1 Распределение случайной величины

Случайной величиной называется такая переменная величина, которая принимает значения из некоторого множества. Принято выделять дискретные и непрерывные случайные величины. Дискретная случайная величина принимает свои значения из множества целых чисел - например, количество учеников в классе, количество несчастных случаев на производстве и так далее. Непрерывная случайная величина принимает свои значения из множества действительных чисел. Ряд психологических явлений непрерывен по своей природе. Это относится, например, к интеллекту, эмоциональности, тревожности, воображению и т.д. Чтобы описать и измерить такие явления, мы разбиваем числовую ось на равные интервалы. Например, возраст мы измеряем, как правило, интервалами, равными одному году. Время принято измерять интервалами, равными секунде, минуте, часу, суткам и т.д. Операция разбиения числовой оси на равные интервалы называется квантованием, а полученные интервалы - интервалами квантования.

Основной способ описания случайной величины - построение ее распределения. Для дискретной величины подсчитывают количество случаев, приходящихся на каждое значение (абсолютная частота), и затем строят гистограмму (столбчатую диаграмму), наглядно представляющую особенности распределения. На гистограмме по оси «Х» откладывается значение случайной величины, а по оси «Y» - абсолютная частота  (Рис.1).

Рис 1. Гистограмма распределения количества посещений медицинского кабинета учениками школы в течение учебного года.

Для описания непрерывной случайной величины либо большого количества измерений дискретной случайной величины данные предварительно следует сгруппировать по интервалам квантования. Прежде всего, надо составить таблицу частотного распределения. Данные группируются по интервалам квантования, и подсчитывается число попаданий в каждый из интервалов. Полученное таким образом число (количество случаев) и есть частота соответствующего интервала. Сумма всех частот интервалов равняется N, то есть общему числу случаев. Отношение частоты к общему числу случаев называется относительной частотой интервала (Таблица 1).

Пример: Результаты тестирования 14 учеников учеников 10 класса одной из школ Ленинградской области (по результатам ШТУР субтест: способность обобщения):

7; 10; 11; 11; 12; 13; 13; 14; 16; 16; 18; 18; 20; 25; 28.

Таблица 1

Способность обобщения учеников 10 класса

одной из школ Ленинградской области (по результатам ШТУР)

Вариант А

Вариант Б

Интервал квантования

Абсолютная частота

Относительная частота (%)

Интервал квантования

Абсолютная частота

Относительная частота (%)

[6 - 8]

1

7

[6-10]

2

13

[9 - 11]

3

20

[11-15]

6

40

[12-14]

4

26

[16-20]

5

33

[15-17]

2

13

[21-25]

1

7

[18-20]

3

20

[26-30]

1

7

[21-23]

0

0

[24-26]

1

7

[27-29]

1

7

На практике наиболее удобно, чтобы количество интервалов (столбцов) было не меньше 5, но не больше 15. Формировать интервалы можно различным образом, начиная либо с наименьшей, либо наибольшей величины, важно, чтобы расстояние между границами интервалов было одинаковым. При подготовке данных для построения гистограммы рекомендуется не ограничиваться лишь одной попыткой квантования: нередко изменение числа групп и границ интервалов помогает выявить скрытые неоднородности распределения случайной величины (рис.1).

Подсчитав частоту для каждого интервала, строим гистограмму. Чтобы подчеркнуть непрерывность изменения случайной величины, столбцы гистограммы следует располагать вплотную друг к другу. На оси «Х» графика принято обозначать или границы, или середины интервалов квантования. По оси «Y» указывается абсолютная частота. Результаты построения можно представить не только в виде столбчатой диаграммы, но также в виде полигона. На полигоне частот число испытуемых указывается точкой, расположенной над серединой интервала на высоте, соответствующей его частоте, а сами точки последовательно соединены прямолинейными отрезками (рис.2). Полигон по своему назначению полностью аналогичен гистограмме.

Рис. 2. Гистограмма (слева) и полигон  распределения случайной величины (способности обобщения) по данным таблицы 1, с выделением 8 (А) и 5 (Б)  интервалов квантования. По оси Х указаны середины интервалов.

При характеристике распределения некоторой непрерывной случайной величины число подразделений по горизонтальной шкале теоретически является бесконечным, а значение каждого интервала - бесконечно малым. В этом случае полигон частот примет вид кривой распределения частоты встречаемости случайной величины.

3.2 Параметры распределения

Распределение случайной величины характеризуется параметрами распределения, которые объединены в четыре группы характеристик:

  •  характеристики положения,
  •  характеристики рассеивания,
  •  характеристики асимметрии,
  •  характеристики эксцесса.

Естественно, что параметры распределения определяются только для данных, представленных либо в интервальной шкале, либо в шкале отношений.

Из характеристик положения рассмотрим моду, медиану и среднее арифметическое значение. По-другому эти параметры называются мерами центральной тенденции.

Мода (М0) - наиболее часто встречающееся значение; его называют также модальным значением. Кроме модального значения используется также понятие модального интервала - так именуется интервал, куда попадает наибольшее количество значений. Нередко модальное значение оказывается как раз в модальном интервале. Распределение величины может быть унимодальным и полимодальным: если мода в распределении одна - то распределение унимодальное, если более - то полимодальное.

Среднее арифметическое значение Мх рассчитывается по формуле:

где хi - это сумма всех значений случайной величины от первого х1 до последнего xN, а N - это общее число значений случайной величины.

Медиана (Ме) - это такое значение случайной величины, которое делит упорядоченную (в порядке возрастания или убывания величины) выборку пополам, то есть справа и слева от медианы находится равное количество значений случайной величины. При нечетном количестве измерений за медиану принимается непосредственно центральное значение, справа и слева от него располагается по (n-1)/2 значений. Так, в выборке из 15 упорядоченных значений это будет восьмое значение, а в выборке из 23 значений - двенадцатое и т.д.

Рис.3. Соотношение между мерами центральной тенденции в асимметричном частотном распределении.

Если число значений случайной величины в выборке четное, то медиана оказывается между двумя значениями; в этом случае значение медианы рассчитывается как среднее между ними. На кривой распределения значение медианы всегда располагается между значениями моды и среднего арифметического (рис.3).

Квантили - это такие значения случайной величины, которые делят распределение на равные части. Есть несколько разновидностей квантилей:

  •  Квартили делят распределение на 4 равных части по 25%, соответственно квартилей три Q1, Q2, Q3.
  •  Квинтили - их 4 (К1 ....К4), они делят распределение на 5 частей по 20% в каждой.
  •  Децили. Девять децилей (D1 ... D9) делят распределение на 10 частей по 10%.
  •  Процентили в количестве 99 (Р1....Р99) делят распределение на 100 частей по 1%.

Все остальные квантили можно выражать через процентили: так, первый квинтиль - это двадцатый процентиль или второй дециль. Второй квартиль - это 50 процентиль, или пятый дециль, или медиана.

Процентили нельзя ни в коем случае путать с процентными показателями.  Процентные показатели - это первичные показатели, определяющие количество правильно выполненных заданий, а процентиль - показатель производный, указывающий на долю от общего числа членов группы. Первичный результат, который ниже любого показателя в выборке получает нулевой процентиль Ро, а результат, превышающий все другие показатели группы -  получает процентильный ранг 100 - Р100. Эти процентили не означают ни нулевого, ни 100-процентного выполнения теста.

Среди характеристик рассеивания рассмотрим:

  •  размах d
  •  дисперсию 2 или D 
  •  среднеквадратическое (стандартное) отклонение
  •  коэффициент вариации V.

Размах d - это разность между максимальным и минимальным значениями случайной величины:

d = хmax - хmin

Дисперсия 2 (или D) характеризует разброс значений случайной величины вокруг среднего арифметического значения, т.е. насколько плотно значения случайной величины группируются вокруг среднего арифметического Мх. Чем больше разброс, тем сильнее варьируют результаты испытуемых в данной группе, тем больше различия между испытуемыми.

На первый взгляд может показаться, что было бы проще взять не квадрат значений отклонения от среднего, а просто отклонения значений от среднего. Но легко убедиться, что сумма таких отклонений будет равна нулю. Возведение же отклонений от среднего в квадрат позволяет избежать отрицательных чисел. На практике расчета дисперсии наряду с указанной формулой используется и расчет «способом моментов» по формуле

где (xi)2 - сумма квадратов значений Х.

Дисперсия имеет «квадратную размерность», то есть, если какая-то величина измерена в сантиметрах, то размерность дисперсии - сантиметры в квадрате, а если в баллах - то дисперсия - в «баллах в квадрате». Это не всегда удобно, большую наглядность в отношении разброса величины имеет среднеквадратическое или стандартное отклонение (греческая буква «сигма»). Размерность этого параметра совпадает с размерностью случайной величины.

Среднеквадратическое отклонение используется очень широко в математической статистике. Малое значение стандартного отклонения указывает, что наблюдения хорошо группируются около среднего арифметического значения. Большое значение стандартного отклонения говорит о том, что наблюдения широко рассеяны относительно среднего значения и имеют слабую тенденцию к централизации.

Коэффициент вариации размерности не имеет, он служит для сравнения вариативности, то есть изменчивости случайных величин, имеющих различную природу. Рассчитывается коэффициент вариации по формуле:

Если коэффициент вариации меньше 40%, то коэффициент вариации признается низким, то есть изменчивость величины невелика.

Характеристики асимметрии. В случаях, когда по тем или иным причинам более часто встречаются значения с показателями ниже или выше среднего, то появляются асимметричные распределения величины. Основная мера асимметрии - это коэффициент асимметрии As, рассчитываемый по формуле:

Коэффициент асимметрии изменяется от минус до плюс бесконечности. Асимметрия бывает левосторонняя или положительная, если As>0 (на рисунке 2 справа), и правосторонняя или отрицательная, если коэффициент асимметрии меньше 0 (слева на рис.2). При левосторонней асимметрии чаше встречаются значения по величине меньшие среднего арифметического (то есть медиана, и мода на графике находятся слева от среднего арифметического), при правосторонней асимметрии, соответственно, чаще встречаются значения, по величине превосходящие среднее арифметическое. Для симметричных распределений коэффициент асимметрии равен нулю, мода, медиана и среднее арифметическое совпадают между собой.

Характеристики эксцесса: Коэффициент  эксцесса (или островершинности) рассчитывается по формуле

Распределения с острой вершиной будут характеризоваться положительным эксцессом, а сглаженные либо с понижением в центральной части - отрицательным.  Пример расчета параметров распределения приведен в таблице 2:

Таблица 2

Расчет параметров распределения

Х

Отклонение от среднего

(Xi - Mx) 

(Xi - Mx) 2

(Xi - Mx) 3

(Xi - Mx) 4

48

8

64

512

4096

47

7

49

343

2401

43

3

9

27

81

41

1

1

1

1

41

1

1

1

1

40

0

0

0

0

38

-2

2

-8

16

36

-4

16

-64

256

34

-6

36

-216

1296

32

-8

64

-512

4096

Х=400

Mx=40

(Xi - Mx) 2 =

=244

(Xi - Mx) 3=84

(Xi - Mx)4=

=12244

Модальное значение - 41, поскольку оно встречается дважды. Медиана - 40.5 (пять чисел меньше этой величины, пять больше). Среднее арифметическое равно 400/10=40.

Дисперсия 2 =244/9=27.11

Стандартное отклонение  =5.207.

Коэффициент асимметрии As = 0.011

Коэффициент эксцесса Ex = -1.334

При работе на компьютере параметры распределения можно рассчитать, используя встроенные функции Microsoft Excel. Для этого надо войти в раздел «Анализ данных» из меню «Сервис», где выбрать подраздел «Описательная статистика». На экране при этом высвечивается меню «Описательная статистика», в котором задаются входной интервал переменной и выходной интервал для вывода результатов расчета. Входной интервал переменной задается через двоеточие, например интервал «a1:a24» включает в себя 24 значения переменной в столбце A с 1 по 24 ячейку. Можно рассчитывать параметры распределения сразу нескольких переменных, если они представляют собой единый массив данных. Так, входной интервал a1:c25 включает в себя три переменных по 25 значений в каждой: a1:a25, b1:b25 и c1:c25. Если в первой строке интервала находится заголовок столбца (строки), то это следует указать в специальном окошке меню. В окне «Выходной интервал» следует указать номер левой верхней ячейки выходного интервала. Выходные данные включают среднее арифметическое значение, стандартную ошибку среднего, медиану, моду, стандартное отклонение, дисперсию выборки, коэффициенты эксцесса и асимметрии, размах выборки (обозначен как «Интервал»), минимальное и максимальное значения («Минимум» и «Максимум»), сумму всех значений и количество значений переменных («Счет»). Следует учесть, что в Microsoft Excel коэффициенты асимметрии и эксцесса рассчитываются по формулам, несколько отличающимся от приведенных выше.

3.3 Нормальное распределение

Нормальным называется распределение, относительные частоты f0 которого выражаются формулой:

По этой формуле при различных значениях среднего арифметического и стандартного отклонения получается семейство нормальных кривых. Нормальное распределение характеризуется тем, что крайние значения признака встречаются относительно редко, а близкие к среднему арифметическому - относительно часто. Кривая нормального распределения имеет колоколообразную форму - это одномодальное распределение, значения медианы, моды и среднего арифметического которого совпадают между собой, коэффициенты асимметрии и эксцесса равны нулю.

Рис. 4. Кривая нормального распределения.

Кривая ассимптоматически приближается к оси Х, то есть может принимать сколь угодно малые значения по ординате при стремлении Х к плюс или минус бесконечности. В зависимости от величины стандартного отклонения кривая может растягиваться или сжиматься по оси Х, а в зависимости от значения среднего арифметического она будет перемещаться влево или вправо.

Назвали распределение нормальным потому, что оно очень часто встречалось при естественнонаучных исследованиях, и его считали нормой всякого массового случайного проявления признаков. Считается, что нормальное распределение  характеризует такие случайные величины, на которое воздействует большое количество факторов, причем сила воздействия одного отдельно взятого фактора значительно меньше суммы воздействия остальных факторов. По нормальному закону распределены многие биологические параметры - например, вес, рост человека. По нормальному закону распределяется и ряд психологических свойств, качеств человека - показатели интеллекта, агрессивности, тревожности и другие. Из этой предпосылки исходят при разработке и стандартизации тестовых методик.

Особое место среди нормальных распределений занимает так называемое стандартное или единичное нормальное распределение.  Такое распределение получается при условии, что среднее арифметическое равно нулю, а стандартное отклонение - единице: Мх = 0, = 1. Стандартное распределение удобно тем, что к нему может быть сведено любое другое нормальное распределение путем операции стандартизации. Операция стандартизации заключается в следующем: из каждого индивидуального значения параметра вычитается среднее арифметическое значение (это называется центрированием), а полученная разность делится на значение стандартного отклонения (нормирование). Стандартизированное значение принято обозначать символом z:

Стандартизация позволяет анализировать любые нормальные распределения на основе знания характеристик единичного нормального распределения, которые приведены в таблице (Таблица1 Приложения). В этой таблице указана кумулятивная (накопленная) вероятность - то есть доля площади под кривой слева от заданной точки от общей площади (общая площадь под кривой принята равной 1.000). Зная параметры распределения величины Мх и , мы можем оценить вероятность появления наблюдений с тем или иным значением.

Например, количество прочитанных первоклассниками печатных знаков в единицу времени после обучения их по новой методике составляет: среднее значение Мх=142 знака в минуту при стандартном отклонении =47. Какова вероятность того, что при случайном выборе ученика для контроля нам попадется ученик, читающий 30 знаков или менее?

                           

По таблице значений кумулятивной функции распределения стандартного отклонения находим, что кумулятивная вероятность выбора такого ученика равна 0.0082 (то есть 0,8%).

Какова же вероятность выбора ученика, читающего менее 200 знаков?

                           

По таблицам находим, что кумулятивная вероятность такого выбора составляет 0.8849, то есть вероятность получения данной величины равна 0.8849 (примерно 88.5%). Соответственно, вероятность  выбора ученика, читающего более 200 знаков, будет 1- 0.8849 = 0.1151, то есть чуть более 10%.

Чтобы подсчитать вероятность выбора ученика, читающего от 150 до 200 знаков, надо рассчитать кумулятивную вероятность для 200 (она равна 0.8849) и для 150 (0.5793) и взять разность между этими значениями. Мы получаем величину 0.3056, то есть примерно 30%.

Зная характеристики нормального распределения, установлено, что примерно 2/3 наблюдений, а именно 68.3%, сгруппированы в интервале  среднее арифметическое плюс-минус стандартное отклонение Мх   ; в интервале Мх  2 находятся 95.4% наблюдений; а в интервале Мх  3   99.7% всех наблюдений.

Поскольку операция стандартизации нормального распределения сводит любое нормальное распределение к стандартному нормальному, не имеющему размерности, то тем самым появляется возможность сравнивать между собой нормальные распределения величин, измеренных в разных единицах (метры с килограммами, баллы с градусами и так далее).

4. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА

Любая психодиагностическая методика предназначена для обследования некоторой большой категории индивидуумов. Например, методика исследования интеллекта Векслера подразумевает возможность исследования взрослого населения всей страны. Есть тесты, предназначенные для определения уровня развития школьников, и они предусматривают возможность обследования всех школьников определенного года обучения. Именно это множество потенциально возможных объектов исследования называется генеральной совокупностью. Чтобы определить степень выраженности того или иного свойства у определенного человека, надо знать, как распределено это качество во всей генеральной совокупности. Обследовать всю генеральную совокупность с помощью какой-либо методики практически невозможно, поскольку число испытуемых будет определяться сотнями тысяч и миллионами. Для того чтобы составить представление о распределении значений какого-либо показателя, прибегают к извлечению из генеральной совокупности выборки - некоторой представительной части генеральной совокупности. Именно представительность, ее называют еще репрезентативностью, и является основным требованием к выборке. В выборке, как в капле воды, должны отражаться все свойства генеральной совокупности. Обеспечить абсолютно точное соблюдение данного требования невозможно, можно лишь приблизиться  к идеалу с помощью некоторых способов.

Основными способами являются следующие:

  •  случайная выборка
  •  моделирование выборки по свойствам генеральной совокупности.

Случайная выборка предполагает, что испытуемые попадут в нее случайным образом, и предпринимаются меры, чтобы исключить появление каких-либо закономерностей при отборе. Для этого используются способы жеребьевки, отбор по таблицам случайных чисел, устанавливается правило отбора - каждый третий из списка, или каждый десятый или другие методы.

При моделировании выборки сначала выбираются те свойства, которые могут повлиять на результаты тестирования (обычно это демографические показатели пола, возраста, и т.д.), внутри которых выделяются градации (интервалы возрастов, уровень образования и т.д.). По этим данным строится матричная модель генеральной совокупности, в каждой из которых записывают количество людей, обладающих этим свойством. Это можно сделать по данным переписи населения, по другим статистическим данным. Выборка извлекается пропорционально по отношению к каждой клетке матрицы. Например, если по данным переписи населения относительный процент мужчин в возрасте от 18 до 30 лет со средним образованием составляет 20%, то и в выборке их должно быть 20%. Более простым случаем является так называемая стратифицированная выборка, когда для модели берется только одно свойство с соответствующими градациями. Например, если соотношение мужчин и женщин в городе составляет 47% и 53%, то и в выборке соблюдается это отношение.

При организации выборки важным является вопрос о достаточном количестве испытуемых. При техническом контроле качества продукции и в ряде других исследований, связанных с порчей или уничтожением исследуемых образцов, используются специальные методики расчета минимально допустимого объема выборки, который позволит получить ответ на поставленный вопрос с заданной степенью точности. При психологических исследованиях вопрос об объеме выборки, может, и не является столь острым, но остается весьма существенным. Малое количество испытуемых не обеспечит точности результата. Большое количество увеличит время и стоимость исследования. Поэтому при подготовке выборки, как правило, руководствуются эмпирическими соображениями. Отечественные исследователи стандартизируют методики на выборках от 200 до 800 человек.

5. СТАНДАРТИЗАЦИЯ ПСИХОДИАГНОСТИЧЕСКИХ МЕТОДОВ

При разработке любой психодиагностической методики подразумевается, что она будет использоваться  не разово, а многократно. Чтобы методика, результаты которой выражаются в том или ином числовом виде, могла быть применена впоследствии широким кругом специалистов-психологов, она должна быть стандартизирована. Стандартизацией психодиагностических методов называется  процедура получения шкалы, позволяющей сравнивать  индивидуальный результат по тесту с результатами большой группы испытуемых.  Итогом такой работы являются так называемые тестовые нормы или таблицы пересчета первичных («сырых») данных в стандартные. В качестве точки отсчета, по отношению к которой можно оценивать степень выраженности того или иного психологического свойства, берется средний результат по большой группе испытуемых.

Обычная последовательность стандартизации психодиагностической методики состоит в следующем:

  •  Определяется генеральная совокупность, для которой предназначена методика, и из нее извлекается выборка.
  •  По результатам исследования выборки строится эмпирическое распределение, которое проверяется на соответствие его нормальному виду с помощью статистических критериев (например, критерия  Пирсона или Колмогорова-Смирнова, о которых речь пойдет ниже).
  •  Если распределение нормальное, то строится стандартизированная шкала. Если же у нас распределение отличается от нормального контрастно, то следует либо изменить формулировки вопросов теста, либо более строго определить границы генеральной совокупности и выборки, либо принять другие меры, чтобы приблизить распределение полученных результатов к нормальному.
  •  Согласно полученной стандартизированной шкале выборка разбивается на группы, про которые известно, какой процент выборки они включают. Впоследствии каждый новый индивидуальный результат можно быстро отнести в одну из групп и точно определять, степень выраженности психологического свойства у испытуемого.

Наиболее распространенной является шкала Z-оценки (или Z-показателя, о котором уже было сказано выше).

В z-шкале центральным является среднее значение, а от него вправо и влево откладываются значения через интервалы, пропорциональные величине стандартного отклонения (обычно интервалы равны 1). Количество групп может быть 5 или 7. При 5 группах «средними» считаются результаты Z от -1 до 1 (группа 3, куда попадает 68.26% испытуемых) (Таблица), результаты Z от 1 до 2 называются «выше среднего» (группа 4 - 13.59% испытуемых), при Z выше 2 - «высокими» (группа 5 - 2.28% испытуемых), при Z от -1 до -2 - «ниже среднего» (группа 2 - 13.59% испытуемых), Z  ниже -2 - «низкими» (группа 1 - 2.28% испытуемых).

Таблица 3.

Номер группы

1

2

3

4

5

Границы группы

от - до

Мх-2

от Мх-2 до Мх-

от Мх- до Мх+

от Мх- до Мх-2

от Мх+2 до +

Z-показатель

- -2

-2   -1

-1 +1

+1 +2

+2  

Процент испытуемых в группе

2.28

13.59

68.26

13.59

2.28

Правая граница в процентилях

2.28

15.87

84.13

97.72

100.00

Результатом стандартизации являются таблицы пересчета «сырых» оценок в стандартные, где указываются границы групп в тех единицах, в которых непосредственно проводились тестовые измерения. Например, по некоторой методике оценивается скорость реакции водителя, результат представляется в баллах. В исследованной выборке Мх составляет 80, а стандартное отклонение равно 12. Границы выделенных групп получаются равными 56, 68, 92, 104.

Таблица 4.

Номер группы

1

2

3

4

5

Интерпретация результата

Низкий

Ниже среднего

Средний

Выше среднего

Высокий

Принцип отнесения в группу (если испытуемый набирает ... баллов)

<56

56-67

68-92

93-104

>104

В дальнейшем, при использовании методики, испытуемый набирает, к примеру, 95 баллов, глядя на таблицу, мы сразу же определяем, что это результат группы выше среднего. При необходимости мы можем рассчитать Z-оценку испытуемого Z=(95-80)/10=1.5 и по таблице нормального распределения хуже него группы выполняют тест  примерно 93.3% испытуемых, а лучше - лишь 6.7%.

Один из недостатков Z-шкалы - наличие отрицательных и дробных Z-показателей, что неудобно в работе. Для удобства Z-шкалу преобразуют по формуле y = az+b, где у- оценки новой шкалы, а и b - назначаемые новые стандартное отклонение и среднее. Наиболее популярна Т-шкала Мак-Колла, где а = 10, b = 50. Для перехода к Т-шкале надо рассчитать Z-оценки и перевести их в Т-шкалу по формуле T=10z+50. По этой шкале среднее арифметическое равно 50, границы групп 30, 40, 60, 70.

Используется также шкала Векслера, коэффициенты a и b в которой равны соответственно 15 и 100: IQ = 15z + 100. Кроме того, известна шкала Амтхауэра A=10z+100.

Другой недостаток шкалы Z-оценок и производных от нее шкал - то, что получается очень большое количество средних значений, а в крайние группы попадают совсем немногие испытуемые. Чтобы избежать этого недостатка, увеличивают число групп (шкалы стенов, станайнов, квантильные шкалы).

Название шкалы стенов происходит от английского словосочетания «standard ten» - стандартная десятка. По данной шкале выборка делится на 10 групп испытуемых, которым присваиваются баллы от 1 до 10. Среднее арифметическое принимается равным 5.5, стандартное отклонение примерно равно 2. Формула перехода к шкале стенов St=5.5+2z. Ось Х делится на интервалы, равные 0.5. С учетом приведенных среднего арифметического и можно рассчитать процент испытуемых, попадающий в каждую группу:

Таблица 5.

Стен

1

2

3

4

5

6

7

8

9

10

Процент испытуемых в группе

2.28

4.40

9.19

14.98

19.15

19.15

14.98

9.19

4.40

2.28

Правая граница группы в процентилях

2.28

6.68

15.87

30.85

50.0

69.15

84.13

93.32

97.72

100

Шкала станайнов («стандартной девятки) по своей идее близка к шкале стенов. В целом, она строится аналогично шкале стенов, но взято число групп 9, чтобы избежать появления двузначных цифр (это удобно при машинной обработке данных).

Наряду со шкалой z-оценок и производных от нее шкал используются квантильные шкалы. Квантильная шкала получается путем разбиения выборки на равные по количеству испытуемых части. Чаще используется деление на 5 или 10 частей, то есть в выборке определяются квинтили или децили. В этом случае границы групп в долях сигмы можно подобрать по таблицам нормального распределения (Таблица 1 Приложения). При использовании квантильных шкал ось Х делится на части, равные по количеству испытуемых, но непропорциональные величине стандартного отклонения.

6. СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ

Гипотезой называется предположение, имеющее вероятностный характер, обладающее неопределенностью в отношении своей истинности. Гипотезы формулируются для того, чтобы представить в четком, лаконичном виде представления автора о том или ином факте, о его причинах.

В статистике гипотезы формулируются по поводу характеристик распределений, частот событий, положения событий относительно друг друга в ранжированном порядке и так далее. Подход к гипотезе в статистике четкий и в значительной мере формальный. Принято выделять статистические гипотезы двух основных видов - нулевую и альтернативную. Нулевая гипотеза, обозначаемая Н0,  формулируется как гипотеза об отсутствии отличий: о сходстве двух распределений, о равенстве средних арифметических двух выборок и т.п. Нулевой она называется потому, что содержит 0: Х12=0, где Х1 и Х2 - значения признаков. Нулевая гипотеза утверждает, к примеру, что результаты выполнения задания экспериментальной группой и контрольной не различаются. Альтернативная гипотеза Н1 противоположна по смыслу нулевой, она утверждает наличие отличий в выборках, в параметрах их распределений и так далее (результаты экспериментальной группы значимо отличаются от результатов контрольной группы).

Две гипотезы  - нулевая и альтернативная - образуют группу несовместных событий, то есть, если принимается одна из них, то другая отклоняется: принимая гипотезу об отсутствии различий Н0, мы отклоняем альтернативную гипотезу Н1, утверждающую, что различия есть, и, соответственно, наоборот.

Кроме этого, статистическая гипотеза может быть направленной или ненаправленной. Ненаправленная гипотеза фиксирует только наличие или отсутствие различий:

Н1 - ненаправленная альтернативная гипотеза: результаты экспериментальной группы значимо отличаются от контрольной,

Н0 - ненаправленная нулевая гипотеза: результаты экспериментальной группы значимо не отличаются от контрольной.

Направленная гипотеза говорит о наличии или отсутствии различий в определенном направлении:

Н1 - направленная альтернативная гипотеза: результаты экспериментальной группы выше (или, наоборот, ниже) результатов контрольной группы,

Н0 - направленная нулевая гипотеза: результаты экспериментальной группы не превышают результаты контрольной.

Общая схема классификации гипотез представляется в следующем виде:

Проверка гипотез производится с помощью статистических критериев. Статистический критерий - это правило, которое позволяет принимать истинную и отклонять ложную гипотезу с высокой степенью вероятности. Математически критерий представляет собой формулу,  по которой мы рассчитываем некоторое число. Есть много разных видов статистических критериев, каждый из них разработан для решения определенного круга задач: так, по одному из них можно доказывать значимость различий средних арифметических значений двух выборок, по другому - согласованность изменения параметров двух распределений и так далее. Как правило, по формуле рассчитывается числовое значение критерия  для имеющейся в нашем распоряжении выборки данных (полученное число называется эмпирическим значением критерия), и эмпирическое значение сравнивается с критическими значениями критерия, приведенными в таблицах. Различие между эмпирическим и критическим значениями критерия позволяет нам принять одну из статистических гипотез (нулевую или альтернативную) и отклонить другую.

Все статистические критерии делятся на параметрические и непараметрические. Параметрическими называются критерии, в формулу расчета которых входят параметры распределения (чаще всего это среднее арифметическое и стандартное отклонение). Непараметрические критерии, соответственно, параметры распределение в формулу расчета не включают, они оперируют только частотами или рангами. Каждая группа критериев имеет свои возможности, свои преимущества и недостатки, свои ограничения в использовании, которые будут рассмотрены при описании каждого из критериев. Параметрические методы следует применять при достаточно больших выборках (на практике обычно это означает больше 15 - 20 испытуемых), когда исследуемое распределение относится к нормальному типу. При небольшом количестве испытуемых, а также, если исследуемое распределение значимо отличается от нормального, следует воспользоваться непараметрическими методами. Непараметрические методы в психологии используются весьма широко, поскольку набрать достаточное количество испытуемых представляется возможным далеко не всегда.

В статистике за основной вариант принимается вариант рассмотрения истинности нулевой и ложности альтернативной гипотезы в генеральной совокупности. Применяя определенный критерий для принятия той или иной гипотезы по результатам обследования выборки, исследователь оказывается в следующей ситуации:

Таблица 6.

Действия

исследователя

Состояние нулевой гипотезы

Истинное

Ложное

Принимается Н0

Принято правильное решение (р=1-)

Совершена ошибка 2-го рода (р= )

Отклоняется Н0

Совершена ошибка 1-го рода (р=)

Принято правильное решение (р= 1-)

Такая ситуация складывается, потому что исследование проводится на выборке, а вывод делается об истинности гипотезы в генеральной совокупности. Понятно, что пока не изучена вся генеральная совокупность, дать окончательный ответ нельзя, а до того можно говорить лишь о большей вероятности одной гипотезы и меньшей другой и при этом указывать вероятность ошибки сделанного вывода.

Например, все признаки свидетельствуют о том, что должен пойти дождь. Нулевая гипотеза говорит нам об отсутствии различий между характеристикой сегодняшней погоды и характеристикой дождливого дня (низкое давление, низкая плотная облачность, высокая влажность). Альтернативная гипотеза утверждает, что различия есть, следовательно, дождя не будет.

Таблица 7.

Действия

В действительности

Н0: дождь будет

Н1: дождя не будет

Брать зонт

Правильное решение (1-)

Ошибка 2-го рода ()

Не брать зонт

Ошибка 1-го рода ()

Правильное решение (1-)

Как мы видно из таблицы, ошибка первого рода состоит в том, что мы отклонили нулевую гипотезу, которая на самом деле верна. Вероятность ошибки 1-го рода обозначается , соответственно вероятность правильного решения будет 1-. Вероятность 1- называется доверительной вероятностью. В каждом исследовании указывают вероятность ошибки (либо доверительную вероятность 1-) или в виде десятичной дроби (=0.05), или в процентах (=5%)

Ошибкой второго рода называется принятие по результатам выборочного исследования нулевой гипотезы, в то время как верна альтернативная. Обозначается вероятность ошибки второго рода , соответственно, вероятность правильного решения в данном случае 1-. Эта вероятность 1- называется мощностью критерия. Мощность критерия характеризует его способность отклонять ложную гипотезу.

Уровень ошибки первого рода исследователь, как правило, задает самостоятельно, либо ее можно рассчитать. Вероятность ошибки второго рода обычно остается неизвестной, только в некоторых случаях она может быть оценена примерно. Оба вида ошибок тесно связаны между собой: если отклоняется истинная нулевая гипотеза, то принимается ложная альтернативная, или, если принимается ложная нулевая гипотеза, то отклоняется истинная альтернативная. Задавая низкий уровень вероятности ошибки , мы тем самым резко увеличиваем вероятность ошибки второго рода , и наоборот, повышая вероятность ошибки , мы уменьшаем вероятность ошибки . В каждом конкретном случае следует проанализировать, какая из ошибок несет в себе меньшую опасность, и после этого задать тот или иной уровень доверительной вероятности. При использовании статистических методов в психологии обычно ориентируются на вероятность = 0.05 (доверительная вероятность 95%, то есть ошибка вероятна лишь в одном случае из 20), считая его пограничным для принятия или отклонения альтернативной гипотезы. Если требуется принять альтернативную гипотезу с большей степенью надежности, то принимается = 0.01 (доверительная вероятность 99%). А если мы хотим принять нулевую гипотезу с высокой степенью надежности, то нужно задать = 0.10 или даже 0.20 (доверительная вероятность 90 или 80%), при этом вероятность ошибки второго рода  понизится; в этом случае следует задать низкий уровень доверительной вероятности. Например, для ситуации с зонтом, как правило, более безболезненно пройдет ошибка второго рода  - зонт возьмем, а дождя не случится.

7. МАТЕМАТИЧЕСКИЙ АППАРАТ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Порядок математической обработки данных с использованием статистических критериев включает следующие стадии:

  1.  Подготовка данных и выбор критерия 

На этой стадии требуется:

  •  Определить частоты встречаемости признаков, проверить выборку на наличие аномальных или «выскакивающих» значений», свести результаты измерений в таблицы, рассчитать параметры распределения (среднее арифметическое Мх, дисперсия 2, стандартное отклонение , медиану и межквартильное отклонение).
  •  проверить, соответствует ли исследуемое распределение нормальному.
  •  определить, являются ли выборки зависимыми или независимыми. Зависимыми являются выборки с одними и теми же испытуемыми, признаки которых измерены в различных условиях, например до тренинга и после него, в утреннее и вечернее время, или до начала опробования программы обучения, в середине и после. Независимыми будут выборки, в которых одни и те же признаки измерены в разных группах испытуемых, например, в экспериментальной группе и в контрольной.
  •  выбрать критерий для решения поставленной задачи.

Формулирование нулевой и альтернативной гипотез.

Расчет эмпирического значения критерия по соответствующим формулам.

Определение числа степеней свободы (при использовании параметрического критерия). Число степеней свободы, обозначаемое греческой буквой «», отражает число независимых источников информации. Оно равно числу классов вариационного ряда минус число условий, при которых этот ряд был сформирован. Другими словами это разность между числом наблюдений в выборке и числом параметров, которые следует оценить по выборочным данным. Как правило, формулы расчета статистических критериев сопровождаются правилом определения числа степеней свободы, например, «=n-1» или  «=n-2».

Определение критического значения критерия по таблицам критических значений, сравнение с ним эмпирического значения и принятие нулевой или альтернативной гипотезы, либо решения о статистической значимости связи. Таблицы критических значений критериев составлены, как правило, для четырех уровней ошибки 0.10, 0.05, 0.01 и 0.001, что соответствует доверительным вероятностям 0.90, 0.95, 0.99 и 0.999, либо для двух наиболее употребительных в практике = 0.05, 0.01 (доверительная вероятность 0.95, 0.99). Кроме того, выбирая критическое значение из таблицы, следует различать, двусторонний и односторонний критерии. Если в ходе исследования проверяется направленная гипотеза, то есть отклонение от Но только в положительную или только в отрицательную сторону, то используется односторонний критерий. Если же проверяется ненаправленная гипотеза, то есть равно возможны отклонения как в ту, так и в другую стороны, значит, используется двусторонний критерий. По результатам сравнения эмпирического значения с критическим принимается либо нулевая, либо альтернативная гипотеза.

Формулирование вывода. Вывод должен сопровождаться указанием на принятый уровень доверительной вероятности или ошибки первого рода.

7.1. Подготовка данных

7.1.1 Порядок выявления аномальных значений

Аномальные или «выскакивающие» значения - это единичные значения, сильно отличающиеся от основной массы. Выскакивающие значения могут появиться в случае ошибки при переписывании данных, при введении информации в компьютер, или, к примеру, если кто-то из испытуемых отнесся к исследованию психолога несерьезно и сообщил ложные данные, и еще во многих других случаях. «Выскакивающие» значения из дальнейших расчетов следует исключить.

Порядок проверки статистической гипотезы с помощью различных статистических критериев следующий:

  1.  Выборка упорядочивается в порядке возрастания вариант (то есть значений случайной величины).
  2.  Для проверки на аномальность (Ашмарин И.П. и др., 1971) наименьшего значения рассчитывается параметр

то есть частное от деления разности между наименьшей вариантой выборки и следующей за ней по величине |Х1- X2| на размах выборки (Xn-X1). Полученное эмпирическое значение сравнивается по абсолютной величине с критическим, приведенным в таблице 2 Приложения для требуемого уровня достоверности. Если эмпирическое значение превышает критическое, либо равно ему по абсолютной величине, то наименьшую варианту следует признать аномальной и из дальнейших расчетов ее надо исключить.

Аналогично следует проверить на аномальность и наибольшую варианту. В этом случае рассчитывается

то есть частное от деления разности между наибольшей вариантой и предшествующей ей по величине (Хn- Xn-1) на размах выборки (Xn-X1), и полученное эмпирическое значение сравнивается с критическим (табл.). Если эмпирическое значение превышает критическое либо равно ему по абсолютной величине, то наибольшую варианту следует из дальнейших расчетов исключить как аномальную.

Например, имеется выборка, включающая следующие результаты испытуемых (данные упорядочены, то есть выписаны в порядке увеличения значений):

14, 19, 21, 23, 24, 25, 26, 27, 29, 31, 34, 36, 39, 54.  

Проверка на наличие выскакивающих значений:

Минимальное значение:

а =

14-19

=

5

=

0,125

54-14

40

Критическое значение а для 14 испытуемых равно 0.3501 (р=0.05). Эмпирическое значение а меньше критического, следовательно, значение 14 аномальным не является.

Максимальное значение:

а =

54-39

=

15

=

0,375

54-14

40

Эмпирическое значение больше критического 0.350 (р=0.05), то есть значение 54 является аномальным и его следует из дальнейших расчетов исключить.

Все приведенные ниже в задачах данные проверены на наличие аномальных значений.

7.1.2 Проверка эмпирического распределения на его соответствие нормальному распределению

Есть целый ряд методик, позволяющих проверить, значимо ли отличается исследуемое эмпирическое распределение от нормального. Эти методы описаны в специальной литературе по математической статистике. Представляется, что наиболее быстро и достаточно надежно можно сопоставить эмпирическое распределение с нормальным, выполнив следующие шаги:

  1.  построить полигон (или гистограмму) распределения и убедиться, что он напоминает колоколообразную кривую;
  2.  сравнить эмпирическое распределение с нормальным с помощью критерия 2 Пирсона по формуле

где fi - эмпирическая частота для интервала квантования,  ft - теоретическая частота для того же интервала. Критерий Пирсона позволяет сопоставлять значимость отличия эмпирической частоты интервалов квантования с теоретической частотой для тех же интервалов.

Из свойств стандартного нормального распределения известно, какая часть испытуемых должна попадать в тот или иной интервал z-оценок в случае нормального распределения параметра. Можно подобрать граничные значения z, которые будут делить стандартное нормальное распределение на равные части; удобно, если таких частей будет 5 или 4. Так, интервалы z-оценок от - до -0.85, от -0.85 до -0.25, от -0.25 до +0.25, от +0.85 до +0.25 и +0.85 до + делят стандартное нормальное распределение на 5 частей по 20% значений в каждой(N/5, где N - общее количество испытуемых) (таблица2 Приложения). Величина N/5 представляет собой теоретическую (ожидаемую) частоту ft для интервалов квантования. Рассчитав z-оценки испытуемых исследуемой выборки, мы можем узнать, сколько испытуемых фактически имеют z-оценки от - до -0.85, сколько от -0.85 до -0.25, сколько от -0.25 до +0.25, сколько от +0.25 до +0.85 и сколько  испытуемых попадает в интервал z-оценок от +0.85 до +. Полученные 5 чисел представляют собой эмпирическую частоту fi для каждого из интервалов квантования. Зная fi и ft можно рассчитать эмпирическое значение параметра 2.

Порядок действий при сравнении эмпирического распределения с нормальным следующий:

  1.  Рассчитать среднее арифметическое Мх и среднеквадратическое отклонение выборки .
  2.  Рассчитать z-оценки испытуемых по формуле

  1.  Подсчитать количество испытуемых, имеющих z-оценки от - до -0.85, от -0.85 до -0.25, от -0.25 до +0.25, от +0.25 до +0.85 и от +0.85 до +..
  2.  Рассчитать теоретическую частоту для интервалов квантования ft=N/5.
  3.  Сформулировать нулевую и альтернативную гипотезы:

Н0: Распределение случайной величины не отличается значимо от нормального распределения.

Н1: Распределение случайной величины значимо отличается от нормального распределения.

  1.  Рассчитать эмпирическое значение критерия 2 и сравнить его с критическим значением, взятым из таблицы с учетом числа степеней свободы =k-3, где k - число интервалов квантования (в нашем случае k=5). При =2 и доверительной вероятности 95% 2кр=5.99, при доверительной вероятности 90% 2кр = 4.61, а при 1- = 80% 2кр=3.22 (Таблица 3 Приложения). Поскольку при сравнении эмпирического распределения с нормальным исследователь заинтересован  не допустить ошибку второго рода , то для повышения надежности вывода следует принимать по возможности более низкий уровень доверительной вероятности. Если эмпирическое значение оказывается меньше критического, то принимается нулевая гипотеза: распределение признается не отличающимся значимо от нормального и для него можно использовать параметрические критерии.

Задача: Можно ли использовать для приведенной ниже выборки данных, характеризующих уровень социальной активности студентов в группе, состоящей из 26 человек, параметрические критерии?

14, 17, 26, 9, 21, 12, 17, 18, 11, 20, 18, 17, 25, 19, 15, 29, 16, 18, 24, 17, 16, 10, 11, 26, 14, 16.

Гистограмма для данной выборки имеет следующий вид (взяты интервалы [8-10], [11-13], [14-16], [17-19] и т.д.):

Рис. 5. Гистограмма распределения уровня социальной активности студентов.

Среднее арифметическое значение выборки 17.54, дисперсия 27.138, стандартное отклонение 5.209. Расчет стандартизированных значений приводится в таб. 8.

Таблица 8.

Х

Х-Мх

(Х-Мх)2

Z=(Х-Мх)/

Х

Х-Мх

(Х-Мх)2

Z=(Х-Мх)/

9

-8,54

72,905

-1,64

17

-0,54

0,290

-0,10

10

-7,54

56,828

-1,45

17

-0,54

0,290

-0,10

11

-6,54

42,751

-1,26

18

0,46

0,213

0,09

11

-6,54

42,751

-1,26

18

0,46

0,213

0,09

12

-5,54

30,675

-1,06

18

0,46

0,213

0,09

14

-3,54

12,521

-0,68

19

1,46

2,136

0,28

14

-3,54

12,521

-0,68

20

2,46

6,059

0,47

15

-2,54

6,444

-0,49

21

3,46

11,982

0,66

16

-1,54

2,367

-0,30

24

6,46

41,751

1,24

16

-1,54

2,367

-0,30

25

7,46

55,675

1,43

16

-1,54

2,367

-0,30

26

8,46

71,598

1,62

17

-0,54

0,290

-0,10

26

8,46

71,598

1,62

17

-0,54

0,290

-0,10

29

11,46

131,367

2,20

Сформулируем нулевую и альтернативную гипотезы:

Н0: Распределение случайной величины не отличается значимо от нормального распределения.

Н1: Распределение случайной величины значимо отличается от нормального распределения.

В интервале от - до -0.85 фактически находится 5 стандартизированных значений, в интервал от -0.85 до -0.25 попадает 6 значений, интервал от -0.25 до +0.25 включает 7 значений, в интервале от +0.25 до +0.85 мы имеем 3 значения и, наконец, в интервал от +0.85 до + попадает 5 значений. Теоретическая частота для каждого интервала равна 26/5=5.2.

Значение

2эмп

=

(5-5,2)2+(6-5,2)2+(7-5,2)2+(3-5,2)2+(5-5,2)2

=

1,692

5,2

Критическое значение критерия 2 при =0.20 составляет 3.22 (таблица 3 Приложения), эмпирическое значение 1.692 меньше критического, то есть мы можем принять нулевую гипотезу (=0.20). Ответ задачи можно сформулировать следующим образом: «Использовать параметрические критерии для исследуемой выборки возможно, поскольку распределение случайной величины не отличается значимо от нормального (=0.20)».

Проверкой распределения на соответствие его нормальному типу посуществу заканчивается стадия подготовки данных. Результатом такой подготовки должна явиться таблица исходных данных, сопровождаемая параметрами распределения. Для распределений, близких к нормальному, внизу таблицы указываются среднее арифметическое, дисперсия и (или) стандартное отклонение. Если распределение отличается значимо от нормального, то следует указать медиану Ме и межквартильное отклонение q, которые более полно характеризуют центральную тенденцию и рассеивание таких распределений. Межквартильное отклонение q, рассчитывается по формуле

где Q1 и Q3 - соответственно первый и третий квартиль.

Далее, в зависимости от

  •  характера поставленной задачи,
  •  объема выборок,
  •  типа выборок (зависимые или независимые),
  •  свойств распределений (нормальное или отличное от него)

выбирается критерий для ее решения. Параметрические критерии следует использовать только при достаточном объеме (более 15-20 испытуемых) и нормальном распределении обоих выборок. Во всех остальных случаях лучше использовать непараметрические методы.


Таблица 9.

Классификация задач и рекомендуемые методы их решения

Вид задачи

Условия

Метод

решения

Ограничения использования

метода

Выявление сходства- различия в уровне исследуемого признака

Две независимые выборки испытуемых

t - критерий Стьюдента

  1.   Признак должен быть измерен в шкале отношений или интервалов,
  2.  Распределение признака должно относиться к нормальному типу (см. 2 --критерий Пирсона)
  3.  Дисперсии выборок должны быть равны (см. F-критерий Фишера)
  4.  Необходимо достаточно большое количество испытуемых в каждой выборке (рекомендуется не менее 16).

U - критерий Манна-Уитни*

1.  Выборки должны относиться к сходному типу распределения (см. 2 - критерий Пирсона),

  1.  Количество испытуемых в каждой выборке от 3 до 60,

Признак может быть измерен в шкале рангов, интервалов или отношений

три или более независимых выборок

Т-критерий Вилкоксона для множественных сравнений

1. Количество испытуемых в группе от 3 до 25, количество групп от 3 до 10

Признак может быть измерен в шкале рангов, интервалов или отношений

Сравнение уровня признака в выборке со средним значением генеральной совокупности или с нормативным значением

одна выборка испытуемых

t - критерий Стьюдента

1. Признак должен быть измерен в шкале отношений или интервалов

Установление сходства-различия дисперсий признака

Две независимые выборки испытуемых

F - критерий Фишера

Признак должен быть измерен в шкале отношений или интервалов

Оценка сдвига значений исследуемого признака

два замера на одной и той же выборке испытуемых

t- критерий Стьюдента

  1.  Признак должен быть измерен в шкале отношений или интервалов.
  2.  Распределение признака должно быть нормальным (см.2 - критерий Пирсона)
  3.  Достаточное количество испытуемых (рекомендуется не менее 16).

Т - критерий Вилкоксона для попарных сравнений

1.  Количество испытуемых от 5 до 50

Признак может быть измерен в шкале рангов, интервалов или отношений

три и более замеров на одной и той же выборке

L - критерий тенденций Пейджа

  1.  Количество испытуемых от 2 до 12, количество замеров от 3 до 6
  2.  Признак может быть измерен в шкале рангов, интервалов или отношений.

Выявление различий в распределении признаков

Сопоставление эмпирического распределения с нормальным.

2 - критерий Пирсона

1. Признак должен быть измерен в шкале отношений или интервалов.

Сопоставление эмпирического распределения равномерным

2 - критерий Пирсона

1. Признак может быть измерен в шкале рангов, интервалов или отношений

Сопоставление двух эмпирических распределений между собой

- критерий Колмогорова-Смирнова

1. Оба признака должны быть измерены в шкале рангов, либо в метрических шкалах (шкале интервалов или отношений).

Два признака, измеренные в шкале наименований

2 - критерий Пирсона

Два признака, измеренные в шкале отношений или в интервальной шкале

rxy - коэффициент линейной корреляции Пирсона

  1.  Распределение обоих признаков должно относится к нормальному типу,
  2.  Количество измерений должно быть достаточно большим (рекомендуется не менее 16)

Исследование взаимосвязи признаков

Признаки измерены в шкале рангов, либо в шкале интервалов, ли-бо в шкале отношений

rs - коэффициент ранговой корреляции Спирмена

Один из признаков измерен в дихотомической шкале, а другой - в шкале отношений или в интервальной шкале

rpb - точечно-бисериальный коэффициент корреляции

  1.  Распределение признака, измеренного в шкале отношений или в интервальной шкале, должно относиться к нормальному типу
  2.  Количество измерений признака должно быть достаточно большим (рекомендуется не менее 16)

Корреляция иерархий признаков

Два профиля (две иерархии) признаков в шкале рангов

rs - коэффициент ранговой корреляции Спирмена


* - курсивом выделены непараметрические методы


7.2 Сравнение среднего значения некоторой выборки со средним значением генеральной совокупности или с нормативным значением

Для решения задачи такого рода используется один из вариантов t-критерия Стьюдента. Формула t-критерия в этом случае имеет следующий вид:

где Мх - среднее значение для исследуемой выборки, - среднее значение для генеральной совокупности, - стандартное отклонение и N - количество измерений в выборке. Число степеней свободы определяется по формуле = N-1. Если tэмп< t кр, то принимается нулевая гипотеза об отсутствии значимых различий между средними арифметическими значениями выборки и генеральной совокупности, а если

 t эмп> t кр, то принимается альтернативная гипотеза.

Задача: Для проверки знаний учащихся по иностранному языку использован специальный тест. Полученные нами результаты - 13, 17, 15, 23, 27, 29, 18, 27, 20, 24. Нормативное значение для данного теста составляет 18 баллов (данное значение является средним арифметическим значением генеральной совокупности, имеющей нормальное распределение). Можно ли признать выполнение теста группой в целом успешным?

Сумма значений выборки равна 213, среднее арифметическое 21.3, дисперсия D=30.46, стандартное отклонение =5.52. Проверяемая нулевая гипотеза Н0 заключается в том, что среднее значение  выборки значимо не выше нормативного. Альтернативная направленная гипотеза Н1: количество баллов, набранных учащимися значимо выше нормативного.

Эмпирическое значение t-критерия равно

= 1.890

Полученный результат t=1.890 превышает табличное критическое значение, соответствующее 9 степеням свободы и =0.05 для одностороннего критерия (tкр=1.83). Это значит, что мы можем принять альтернативную гипотезу и признать, что результаты выполнения теста группой выше нормативных.

Ответ: работу преподавателя английского можно признать успешной, поскольку результаты, показанные его учениками выше нормативных (=0.05).

7.3 Сравнение уровня признака в независимых выборках

Сравнение уровня признака в двух независимых выборках можно выполнить с помощью t-критерий Стьюдента (параметрический метод), либо с помощью критерия Манна-Уитни (непараметрический метод).

По t-критерию Стьюдента производится сравнение средних арифметических значений, то есть уровня признака, в двух независимых выборках с равной дисперсией и распределением случайной величины, соответствующим нормальному типу, Используется следующая формула t-критерия (здесь и ниже приводятся формулы критериев для малых выборок, то есть выборок с числом испытуемых менее 30):

где nx и ny - количество испытуемых в 1 и 2 выборках, Мх и Му - средние арифметические значения, х и у - стандартные отклонения соответственно в первой и второй выборках. Число степеней свободы = nx+ ny - 2.

Равенство дисперсий проверяется по F-критерию Фишера:

                                                       F=12/22

За 12 принимается большее из двух значений дисперсии, поэтому значение  Fэмп. всегда больше 1. Полученное значение Fэмп сравнивается с критическим (Таблица 4 Приложения). При пользовании таблицей 4 1=n1-1, 2=n2-1, критическое значение берется из клетки, находящейся на пересечении соответствующих строки и столбца. Если эмпирическое значение меньше критического, то различие дисперсий признается статистически незначимым.

Критическое значение tкр определяется по таблицам (Таблица 5 Приложения) с учетом того, что критерий является двусторонним. Если t эмп t кр, то принимается альтернативная гипотеза.

В программе Microsoft Excel расчет эмпирического значения критерия Стьюдента выполняется с использованием встроенного «Двухвыборочного t-теста с одинаковыми дисперсиями». Для того чтобы воспользоваться встроенной функцией Microsoft Excel надо войти в раздел «Анализ данных» из меню «Сервис», где и выбрать «Двухвыборочный t-тест с одинаковыми дисперсиями». На экране высвечивается меню «Двухвыборочного t-теста с одинаковыми дисперсиями», в котором задаются интервалы обеих переменных, вероятность ошибки первого рода Альфа и выходной интервал (номер левой верхней ячейки выходного интервала). Входной интервал переменной задается через двоеточие, например интервал «a1:a24» включает в себя 24 значения переменной в столбце A с 1 по 24 ячейку. Если в первой строке интервала находится заголовок столбца (строки), то это следует указать в специальной ячейке меню. Гипотетическая средняя разность равна нулю по умолчанию. Выходные данные включают средние арифметические значения переменных в выборках, значения дисперсии, количество наблюдений в выборках, величину объединенной дисперсии, число степеней свободы, эмпирическое значение t-критерия и критические значения для одностороннего и двустороннего критериев.

Задача: В одной из школ Ленинградской области ученики 10 и 11 класса выполнили задания ШТУР (Школьный тест умственного развития). Различаются ли ученики 10 и 11 класса по уровню общей осведомленности?

Н0: показатели осведомленности учеников 10 и 11 класса значимо не различаются.

Н1: показатели осведомленности учеников 10 и 11 класса различаются значимо.

Таблица 10.

Сравнение показателей осведомленности по ШТУР учеников 10 и 11 классов одной из школ Ленинградской области (по t-критерию Стьюдента).

Результат ШТУР

z-оценка

испытуемого

fэмп. по интервалам z

Результат ШТУР

z-оценка

испытуемого

fэмп. по интервалам z

20

1,369194

20

1,632993

20

1,369194

18

1,020621

19

1,039268

18

1,020621

3

19

1,039268

4

17

0,714435

18

0,709341

17

0,714435

18

0,709341

16

0,408248

18

0,709341

16

0,408248

4

18

0,709341

15

0,102062

17

0,379415

15

0,102062

17

0,379415

6

14

-0,20412

3

16

0,049489

1

13

-0,51031

1

15

-0,28044

11

-1,12268

14

-0,61036

11

-1,12268

14

-0,61036

10

-1,42887

14

-0,61036

9

-1,73506

4

14

-0,61036

5

13

-0,94029

13

-0,94029

10

-1,93007

10

-1,93007

4

Среднее арифметическое Мх=15.85

Дисперсия  2=9,19

Стандартное отклонение =3,031

Среднее арифметическое Мх=14,67

Дисперсия  2=10,67

Стандартное отклонение =3,266

Проверка распределений результатов ШТУР на соответствие нормальному распределению:

2эмпир.= (4-4.00)2 + (6-4.00)2 +(1-4.00)2  + (5-4.00)2 +

                4.00         4.00           4.00          4.00

+ (4-4.00)2  = 3.50

   4.00

2эмпир.(3.50) < 2кр.(5.99), следовательно, распределение не отличается значимо от нормального (=0.05), и к нему могут быть применены параметрические критерии.

2эмпир.= (3-3.00)2 + (4-3.00)2 +(3-3.00)2  +(1-3.00)2+

                 3.00         3.00         3.00          3.00

+ (4-3.00)2  = 2.00

   3.00

2эмпир.(2.00) < 2кр.(5.99), следовательно, распределение не отличается значимо от нормального (=0.05), и к нему могут быть применены параметрические критерии.

Проверка равенства дисперсий: Fэмп=10.67/9.19=1.161.         Fкр.=2.32 при =0.05

Fэмп<Fкр. может быть использован критерий Стьюдента для двух выборок с равными дисперсиями.

= 1.106        =33.    tкр.= 2.03 (=0.05)

t эмп. < t кр. принимается нулевая гипотеза Н0.

Ответ: уровень осведомленности учеников 11 класса не отличается значимо от такового у учеников 10 класса (=0.05).

Применение критерия Стьюдента связано с целым рядом ограничений - соответствие обоих распределений нормальному типу, равенство дисперсий распределений, достаточные объемы выборок. Если для решения поставленной задачи использовать параметрический критерий Стьюдента нельзя, то следует воспользоваться его непараметрическим аналогом - критерием Манна-Уитни. Для применения непараметрического критерия Манна-Уитни требуется лишь, чтобы оба распределения относились к сходному, а не обязательно к нормальному типу, кроме того, признак может быть измерен не только в шкале отношений или интервалов, но и в шкале рангов.

Что особенно ценно, критерий Манна-Уитни применим при малых количествах наблюдений в выборках: в каждой выборке должно быть не менее 3 наблюдений. Допускается также, чтобы в одной из выборок было 2 наблюдения, но при этом в другой их должно быть не менее 5. Максимальное число наблюдений в выборках 60, для большего числа наблюдений нет таблиц критических значений. Но уже когда число наблюдений свыше 20 в каждой выборке, расчет критерия становится достаточно трудоемким для расчетов на калькуляторе.

Порядок действий при расчете эмпирического значения критерия следующий:

  1.  Проранжировать все измерения, объединив результаты двух выборок. Правила ранжирования следующие:
  •  Наименьшему значению из всех присваивается ранг 1, наибольшему - n1+n2.   
  •  Если два или большее количество значений равны, то для них рассчитывается средний ранг. Например, если три наименьших значения в выборке равны, то их средний ранг был бы (1+2+3)/3=2. А если равны 10 и 11 значения, то их средний ранг (10+11)/2=10.5.
  1.  Подсчитать сумму рангов отдельно для первой (R1) и для второй (R2) выборки. Проверить, совпадает ли общая сумма рангов с расчетной по формуле R1+R2=N(N+1)/2, где N= n1+n2 - общее число ранжируемых значений.
  2.  Рассчитать эмпирические значения критерия Манна-Уитни для выборок:

U1= n1.n2+ n1 (n1+1)/2 - R1 

U2 = n1.n2 + n2(n2+1)/2 - R2

  1.  Проверить правильность расчета с помощью выражения U1+U2= n1.n2.

Эмпирическим значением является меньшее из двух рассчитанных значений. Оно сопоставляется с критическими значениями, приведенными в таблице 6 Приложения для =0.05 и =0.01. Чем меньше значение U, тем выше достоверность различий, а значит, если UэмпUкрит, то принимается нулевая гипотеза Н0, если Uэмп<Uкрит, то принимается альтернативная гипотеза.

Задача: В одной из школ Ленинградской области ученики 10 и 11 класса выполнили задания ШТУР (Школьный тест умственного развития).

Результаты тестирования

10 класс:  20, 21, 20, 14, 14, 20, 11, 17, 14, 15, 10, 6, 7, 10, 10.

11 класс:  23, 23, 20, 23, 23, 20, 22, 21, 19, 16, 15, 14, 17, 21, 16, 14, 13, 12, 12, 16.

Различаются ли ученики 10 и 11 класса по способности классификации?

Н0: способности классификации учеников 10 и 11 класса значимо не различается.

Н1: показатели способности классификации учеников 10 и 11 класса различаются значимо.

Таблица 11

Сравнение способности классификации по результатам ШТУР у юношей – учеников 10 и 11 классов (по критерию Манна-Уитни)

10 класс

11 класс

Исходные данные

Ранг

Исходные данные

Ранг

6

1

7

2

10

4

10

4

10

4

11

6

12

7,5

12

7,5

13

9

14

12

14

12

14

12

14

12

14

12

15

15,5

15

15,5

16

18

16

18

16

18

17

20,5

17

20,5

19

22

20

25

20

25

20

25

20

25

20

25

21

29

21

29

21

29

22

31

23

33,5

23

33,5

23

33,5

23

33,5

Сумма

197

433

Проверка: Общая сумма рангов 197+433=630.

N (N+1)/2=35х36.3=630, т.е. ранжирование выполнено верно.

U1=20х15+15x16/8-197=223

U2=20x15+20х21/2-433=77

Проверка: U1+U2=300. n1x n2=300

Uэмп. = 77; Uкр.= 80. Uэмп.< Uкр. принимается альтернативная гипотеза Н1 .

Ответ: способность к классификации (по результатам ШТУР) у учеников 11 класса отличается значимо от таковой у учеников 10 класса.

Иногда исследователю приходится сравнивать не две, а несколько выборок: три, четыре и более. В таких случаях возможно попарное сравнение всех выборок по критерию Стьюдента или Манна-Уитни, но быстрее и проще использовать достаточно простой непараметрический критерий, представляющий собой одну из модификаций критерия Вилкоксона - Т-критерий Вилкоксона для множественных сравнений. Критерий может использоваться при количестве условий (то есть сравниваемых выборок) от 3 до 10, количество испытуемых в каждой выборке от 3 до 25. Важно, чтобы выборки были равными по численности. Если исходные выборки различаются по численности, то их следует уравнять, отбросив случайным образом из больших по объему выборок «лишние» значения.

Порядок расчета эмпирического значения критерия следующий:

  1.  Проранжировать все измерения, объединив результаты выборок. Наименьшему значению из всех присваивается ранг 1, наибольшему - N = n1+n2+.... Если два или большее количество значений равны, то для них рассчитывается средний ранг, как это делали, рассматривая критерий Манна-Уитни.
  2.  Подсчитать сумму рангов отдельно для первой (R1), второй (R2) третьей (R3)  и других  выборок. Проверить, совпадает ли общая сумма рангов с расчетной по формуле R1+R2+R3+ +...=N(N+1)/2, где N= n1+n2+n3+... - общее число ранжируемых значений.
  3.  Рассчитать эмпирические значения критерия Вилкоксона для множественных значений. За эмпирические значения принимаются разности сумм рангов между всеми выборками попарно. Результаты удобно представить в виде матрицы. В заголовках строк и столбцов такой матрицы находятся названия выборок и суммы рангов для каждой из них, а на пересечении строк и столбцов матрицы указываются абсолютные значения разностей, показывающие, насколько отличаются суммы рангов соответствующих выборок. Матрица получается симметричной относительно главной диагонали, в ячейки главной диагонали нули можно не записывать.
  4.  Сравнить эмпирические значения критерия с критическими, приведенными в соответствующей таблице (Таблица 7 Приложения). Если эмпирическое значение больше ли равно критическому, то принимается альтернативная гипотеза, если меньше - то нулевая.  

Задача: В одной из школ Ленинградской области ученики 10 и 11 класса выполнили задания ШТУР (Школьный тест умственного развития). Различаются ли ученики - юноши и девушки из 10 и 11 классов по уровню общей осведомленности?

Н0: уровень общей осведомленности у юношей и девушек из 10 и 11 классов значимо не различается.

Н1: показатели уровня общей осведомленности у юношей и девушек из 10 и 11 классов различаются значимо.

Таблица 12

Сравнение уровня общей осведомленности юношей и девушек 10 и 11 классов одной из школ Ленинградской области

(По критерию Вилкоксона для множественных сравнений)

Юноши, 11 класс*

Девушки, 11 класс*

Юноши, 10 класс

Девушки, 10 класс*

Общая осведомленность

Ранг

Общая осведомленность

Ранг

Общая осведомленность

Ранг

Общая осведомленность

Ранг

18

49

17

42,5

19

55

5

1,5

15

33,5

13

23,5

17

42,5

7

4,5

10

13

13

23,5

16

37,5

8

6,5

17

42,5

15

33,5

17

42,5

9

9

17

42,5

19

55

17

42,5

10

13

15

33,5

12

19,5

19

55

10

13

12

19,5

19

55

16

37,5

10

13

20

59,5

19

55

12

19,5

11

16,5

11

16,5

17

42,5

14

28

13

23,5

20

59,5

15

33,5

10

13

14

28

14

28

9

9

9

9

14

28

19

55

19

55

7

4,5

14

28

17

42,5

13

23,5

12

19,5

15

33,5

18

49

15

23,5

6

3

18

49

18

49

8

6,5

5

1,5

18

49

Ме=17

q=2

Ме=15

q=3

Ме=14

q=4

Ме=11

q=2.5

Суммы рангов по группам:

592,5

501

410,5

316

* - для данных групп использованы случайные выборки по 15 человек из имеющихся результатов ШТУР.

                                                                       Таблица 13

Эмпирические значения Т (Тэмп=Ra-Rb)

Юноши, 11 класс

Девушки, 11 класс

Юноши, 10 класс

Девушки, 10 класс

Юноши, 11 класс

0

91,5

182

276,5

Девушки, 11 класс

91,5

0

90,5

185

Юноши, 10 класс

182

90,5

0

94,5

Девушки, 10 класс

276,5

185

94,5

0

Tкр.=246 (=0.05)

Т эмп > Tкр только в одном случае (девушки 10 класса и юноши 11 класса).

Ответ: различия в уровне общей осведомленности значимы между девушками 10 класса и юношами 11 класса (=0.05). 

7.4 Сравнение уровня признака в зависимых выборках

При сопоставлении уровня результатов в двух зависимых выборках, когда измерения производятся на одних и тех же испытуемых в различных условиях X и Y, следует учитывать взаимозависимость результатов у каждого отдельного испытуемого.

Формула t-критерия Стьюдента при решении задачи такого рода имеет вид

где di = xi - yi, т.е. разности значений признака для каждого испытуемого. Следует различать (di2) - сумму квадратов di - и ( di) 2 - квадрат суммы di.

Количество степеней свободы определяется по формуле

= N-1 

Корректное применение t-критерия предполагает, что распределение признака относится  к  нормальному  типу.  Альтернативная   гипотеза  принимается, если t эмп t кр. Задача сравнения результатов двух зависимых выборок предполагает направленное изменение результатов в ту или иную сторону, поэтому критические значения t кр берутся из колонки для одностороннего критерия.

В программе Microsoft Excel расчет эмпирического значения критерия Стьюдента  для зависимых выборок выполняется   с  использованием   встроенного «Парного  двухвыборочного t-теста для средних». Чтобы воспользоваться встроенной функцией Microsoft Excel надо войти в раздел «Анализ данных» из меню «Сервис», где и выбрать  «Парный двухвыборочный t-тестдля средних». На экране высвечивается меню «Парного двухвыборочного t-теста для средних», в котором задаются интервалы обеих переменных, вероятность ошибки первого рода Альфа и выходной интервал (номер левой верхней ячейки выходного интервала). Гипотетическая средняя разность равна нулю по умолчанию. Выходные данные включают средние арифметические значения переменных в выборках, значения дисперсии, количество наблюдений в выборках, коэффициент линейной корреляции Пирсона, число степеней свободы, эмпирическое значение t-критерия и критические значения для одностороннего и двустороннего критериев.

Задача: Учащиеся старших классов выполняли тест ADOR в десятом, а затем через год в одиннадцатом классе. Увеличился ли за это время показатель враждебности к матери у девушек-учениц  данной школы?

Н0: уровень враждебности к матери у девушек в 11 классе значимо не выше такового в 10 классе.

Н1: показатели уровня враждебности к матери у девушек в 11 классе выше уровня враждебности, который был за год до этого - в 10 классе.

                          Таблица 14

Оценка значимости изменения показателя враждебности к матери по тесту ADOR для учениц одной из школ Ленинградской области (по t-критерию Стьюдента)

Результат по тесту ADOR

в 11классе

в 10 классе

d

d2

11

11

0

0

12

11

1

1

13

7

6

36

5

4

1

1

13

13

0

0

19

8

11

121

12

3

9

81

11

9

2

4

11

4

7

49

9

9

0

0

17

2

15

225

4

2

2

4

0

6

-6

36

14

8

6

36

7

5

2

4

3

1

2

4

11

9

2

4

17

6

11

121

9

6

3

9

17

7

10

100

13

2

11

121

4

3

1

1

10

12

-2

4

0

6

-6

36

4

1

3

9

10

4

6

36

8

2

6

36

7

11

-4

16

12

3

9

81

14

3

11

121

4

10

-6

36

5

7

-2

4

4

5

-1

1

13

9

4

16

di =114

(di2) =1354

Мх =  9.50

= 4.937

Мх =  6.15

= 3.421

(di)2/34 = 382,2

=3,603

t кр.=2.44 (=0.01)

tэмп.>tкр. принимается альтернативная гипотеза.

Ответ: враждебность девушек в 11 классе по отношению к матери (по тесту ADOR) значимо выше, чем она была у них за год до этого (р=0.01).

Если измерения проводились на двух зависимых выборках, но распределение признака хотя бы в одной из них оказалось отличным от нормального, либо недостаточным является объем выборок, то для оценки значимости изменений в этом случае используется непараметрический Т-критерий Вилкоксона для попарных сравнений. Т-критерий Вилкоксона применяется для признаков, измеренных в шкалах рангов, интервалов или отношений в двух различных условиях на одной и той же группе испытуемых. Критерий используется при минимальном количестве испытуемых 5 человек, а максимальное количество - 50 испытуемых (это ограничение связано с тем, что для большего числа испытуемых критические значения критерия не рассчитаны).

Вычисления производятся в следующей последовательности:

  1.  Находится разность результатов для каждого испытуемого: из результата при условии 2 вычитается результат при условии 1.
  2.  Полученные разности ранжируются от наименьшего к наибольшему по абсолютной величине. Нулевые разности не учитываются.
  3.  Отдельно записываются ранги положительных и отрицательных разностей и суммируются отдельно. Правильность подсчета суммы рангов проверяется так же, как в критерии Манна-Уитни.
  4.  В качестве эмпирического значения принимается наименьшая сумма рангов.
  5.  Эмпирическое значение Т-критерия сравнивается с табличными значениями критических значений для =0.05 и =0.01 (Таблица 8 Приложения) и числа испытуемых в исходной выборке.  Нулевая  гипотеза  отклоняется,  если Тэмп    Ткрит. 

Аналогично приведенным выше задачам, если нас интересует только сам факт наличия изменений в выборке, то используются критические значения для двустороннего критерия, а если нам важна направленность изменений (при использовании Т-критерия Вилкоксона это случается чаще), то берутся критические значения для одностороннего критерия.

Задача: Учащиеся старших классов (юноши) выполняли тест ADOR в десятом, а затем через год в одиннадцатом классе. Увеличился ли за это время показатель враждебности к отцу у юношей - учеников  данной школы?

Н0: уровень враждебности к отцу у юношей в 11 классе не выше такового в 10 классе.

Н1: показатели уровня враждебности к отцу у юношей в 11 классе значимо выше уровня враждебности, который был за год до этого - в 10 классе.

Таблица 15

Оценка значимости изменения показателя враждебности к отцу по тесту ADOR для учеников одной из школ Ленинградской области

11 класс

10 класс

Разность

Абс.значение разности

Ранговый номер

7

1

6

6

7

4

12

-8

8

9,5

12

6

6

6

7

1

2

-1

1

1,5

12

12

0

2

8

-6

6

7

8

5

3

3

4

3

3

0

5

3

2

2

3

8

7

1

1

1,5

10

2

8

8

9,5

5

1

4

4

5

14

5

9

9

11

Me= 7

q=3.75

Me=5

q=2.75

Сумма

66

T(+) =

48

T(-) =

18

Т эмп.=18.   Ткр.=19 (при =0.01)

Т эмп.< Ткр. (при =0.01) принимается альтернативная гипотеза.

Ответ:  показатель враждебности к отцу у учеников 11 класса значимо выше, чем он был за год до этого (р=0.01).

L-критерий Пейджа по своему назначению схож с Т-критерием Вилкоксона, с той разницей, что он применяется для сопоставления трех и более показателей, измеренных на одной и той же выборке испытуемых. При этом он не только  констатирует наличие изменений, но и указывает их направление. Критерий позволяет проверить наши предположения об определенной возрастной или ситуативной динамике. Таблицы критических значений критерия рассчитаны лишь для небольших выборок (от 2 до 12 испытуемых)  и ограниченное количество сопоставляемых замеров (до 6).

Порядок действий при использовании L-критерия Пейджа следующий:

  1.  Проранжировать индивидуальные значения, полученные  в первом, втором, третьем и т.д. замерах для каждого из испытуемых. Самому низкому значению  присвоить ранг 1, самому высокому - наивысший, согласно числу замеров.

Просуммировать ранги по условиям, при которых выполнялись замеры. Проверить совпадение общей суммы рангов с расчетной по формуле R=nc(c+1)/2, где n - число испытуемых, с - число замеров.

  1.  Расположить условия в таблице в порядке возрастания ранговых сумм.
  2.  Определить значение L  по формуле

L=(Tj.j),

где Tj- сумма рангов по данному условию, а j - порядковый номер, приписанный данному условию в упорядоченной последовательности условий.

  1.  По таблицам критических значений (Таблица 9 Приложения) определить критические значения L для данного количества испытуемых N и для данного количества условий с. Если L равен критическому значению или превышает его, то тенденция достоверна.

Задача: Изменяется ли уровень тревожности испытуемых в течение дня?

                                                     Таблица 16

Утром

Днем

Вечером

1

8

7

8

2

4

6

8

3

5

11

10

4

4

6

9

5

4

3

8

6

3

5

13

7

6

6

7

Н0: уровень тревожности в течение дня значимо не изменяется.

Н1: уровень тревожности в течение дня значимо повышается.

                                                                                              Таблица 17.

Утром

Ранг

Днем

Ранг

Вечером

Ранг

1

8

2.5

7

1

8

2.5

2

4

1

6

2

8

3

3

5

1

11

3

10

2

4

4

1

6

2

9

3

5

4

2

3

1

8

3

6

3

1

5

2

13

3

7

6

1.5

6

1.5

7

3

Сумма рангов

10

12.5

19.5

Результаты ранжирования по строкам и суммы рангов для каждого из условий приведены в таблице. Проверка по формуле R = n c(c+1)/2=42 подтверждает правильность ранжирования. Колонки расположены в порядке возрастания ранговых сумм, поэтому колонка «утро» получает номер 1, колонка «день» номер 2 и «вечер» - номер 3. Теперь можно рассчитать эмпирическое значение L-критерия: Lэмп=10х1+12.5х2+19.5х3 = 93.5. Эмпирическое значение критерия Lэмп больше критического Lкр=93 для уровня доверительной вероятности 95%, поэтому можно принять альтернативную гипотезу.

Ответ: тенденция увеличения уровня тревожности в течение дня является достоверной (=0.05).

7.5 Оценка сходства-различия распределений признаков

Для установления сходства - различия между эмпирическим и теоретическим распределениями (равномерным, нормальным или каким-то иным) используется 2- критерий Пирсона

где fi - эмпирическая частота для интервала квантования, ft - теоретическая (ожидаемая) частота для того же интервала. Сравнение эмпирического распределения с нормальным уже рассмотрено ранее. При сравнении эмпирического распределения с равномерным теоретическая (ожидаемая) частота интервала квантования находится по простой формуле:

Количество степеней свободы для сравнения эмпирического распределения с равномерным определяется по формуле  

= k-1 

где k - число  групп или интервалов квантования.

Задача: определить, равномерно ли распределяется число полученных учениками неудовлетворительных оценок по месяцам учебного года.

Подсчитав по классному журналу «двойки» учеников, получили следующие результаты:

Таблица 18.

Месяц

Сен

Окт

Нояб

Дек

Янв

Фев

Март

Апр

Май

Кол-во «двоек»

10

20

15

12

14

12

20

18

14

Общее число «двоек» N=135. Если бы все они были распределены равномерно по 9 месяцам учебного года (k=9), то каждый месяц ученики получали бы 135/9=15 двоек. Это число 15  является теоретической частотой ft для расчета величины 2. Значения эмпирической частоты fi даны в условии задачи (таблица).

Н0: Распределение неудовлетворительных оценок по месяцам учебного года не отличается значимо от равномерного.

Н1: Распределение неудовлетворительных оценок по месяцам учебного года значимо отличается от равномерного.

Рассчитываем критерий 2 Пирсона:

       

Критическое значение критерия 2 определяется по таблицам (Таблица 3 Приложения), в нашем случае при =9-1=8 и =0.05 оно будет равным 15.51, при =0.10

2кр. =13.36, и при =0.20 2кр. =11.03.

Ответ: мы должны принять нулевую гипотезу и признать, что распределение двоек по месяцам статистически значимо не отличается от равномерного (=0.20).

Непараметрический критерий Колмогорова-Смирнова можно использовать для сравнения двух любых распределений, между собой. Критерий основан на сравнении накопленных частот в двух распределениях, упорядоченных по тому или иному принципу.  Порядок применения критерия для сравнения двух эмпирических распределений следующий:

  1.  Упорядочить распределения по одному и тому же основанию (принципу). Например, рассматривая темперамент учащихся двух классов, мы в первый интервал заносим данные меланхоликов, затем во второй интервал - флегматиков, потом сангвиников и, наконец, холериков как в первой, так и во второй выборках.
  2.  Для каждого интервала распределения рассчитать относительную частоту

 

 где fi - абсолютная частота интервала, а n - объем соответствующей выборки.

  1.  Рассчитать накопленные частоты, сложив fотн каждого интервала с относительными частотами всех предшествующих интервалов. Накопленная частота последнего интервала равна 1.00.
  2.  Рассчитать разность накопленных частот соответствующих интервалов двух распределений. Наибольшая по абсолютной величине (то есть без учета знака) из рассчитанных разностей используется для расчета эмпирического значения

где (f1/n1 - f2/n2)max - наибольшая разность накопленных частот, а n1 и n2 -  объем выборок.

  1.  Сформулировать нулевую и альтернативную гипотезы:

Н0: Распределение 1 значимо не отличается от распределения 2.

Н1: Распределение 1 значимо отличается от распределения 2.

  1.  Сравнить эмпирическое значение с критическим. Критические значения составляют:

                                                                                        Таблица 19.

Доверительная вероятность

0.80

0.90

0.95

0.99

0.999

Критическое значение

1.07

1.22

1.36

1.63

1.95

Если эмпирическое значение больше критического, то принимается альтернативная гипотеза, если меньше, то нулевая.

Задача: Сопоставить профили распределения результатов ШТУР учениц 11 класса, показавших наилучший и наихудший результаты:

Таблица 20

Разделы ШТУР

Баллы «лучшей» ученицы

Относи-тельная частота

Накопленная частота

Баллы «худшей» ученицы

Относи-тельная частота

Накопленная частота

Разность накопленных частот

общая осведомленность

20

0,1626

0,163

15

0,2727

0,273

0,110

частная осведомленность

20

0,1626

0,325

9

0,1636

0,436

0,111

способности классификации

22

0,1789

0,504

6

0,1091

0,545

0,041

способности поиска аналогии

20

0,1626

0,666

8

0,1455

0,691

0,025

способности обобщения

29

0,2358

0,902

16

0,2909

0,982

0,080

способности выполнения счетных операций

12

0,0976

1,000

1

0,0182

1,000

0,000

Сумма

123

55

Н0: Профили распределения результатов ШТУР лучшей и худшей учениц значимо не отличаются друг от друга.

Н1: Профили распределения результатов ШТУР лучшей и худшей учениц различаются значимо.

Максимальное значение разности накопленных частот 0,111.

эмп. = 0,1116,165 = 0.684. эмп.< кр.(при доверительной вероятности 0.95), следовательно, принимается нулевая гипотеза.

Ответ: Профили распределения результатов  ШТУР «лучшей» и «худшей» учениц не различаются значимо.

8. ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ ПСИХОЛОГИЧЕСКИХ ЯВЛЕНИЙ

8.1 Меры связи явлений, измеренных в номинативных шкалах

Коэффициент четырехклеточной сопряженности. Когда объекты классифицированы по двум или нескольким свойствам, то результат такой классификации можно представить в виде таблиц, в которых строки будут иметь заголовки одного свойства, а столбцы - другого, а сочетания всех свойств будут рассматриваться попарно. Такие таблицы называются таблицами сопряженности. В заголовки столбцов выносятся свойства Х1, Х2 и т.д. до Xi, в заголовки строк У1, У2 и т.д. до Yj. В клетки таблицы заносим частоту - то есть количество случаев сочетания Х1 и У1 (записывается Х1 и У1), Х1У2, Х1У3 и т.д. до Х1Уj в первой строке, Х2У1, Х2У2 ..... X2Yj во второй строке, и так по всей таблице вплоть до нижней правой клетки, где будет XiУj.

Силу связи между двумя явлениями, измеренными в дихотомической номинативной шкале, оценивают с помощью коэффициента четырехклеточной сопряженности Пирсона :

В данной формуле a, b, c, d - это количество случаев в каждой ячейке таблицы: a, b - в верхней строке справа налево, c и d - в нижней строке. Коэффициент  может изменяться от -1 до 1. Если он равен нулю, то связь отсутствует, если близок к нулю - связь слабая, а если приближается к 1 (или -1) или равен ей, то  связь сильная.

С помощью коэффициента 4-х-клеточной сопряженности Пирсона можно непосредственно сравнивать между собой силу связи по двум и более таблицам сопряженности - коэффициент четырехклеточной сопряженности указывает, что в таблице А связь сильнее, чем в таблице Б. Статистически же точный ответ, значимо ли отличается коэффициент от нуля, то есть значима ли  связь между явлениями, можно получить с помощью критерия 2 Пирсона.

где fi - эмпирическая частота, а ft - теоретическая частота для ячейки таблицы. Эмпирическая частота - это те значения абсолютной частоты, которые приведены в таблице сопряженности. Теоретическая частота - это та частота, которая значилась бы в данной ячейке при равномерном распределении характеристик. Теоретическая частота рассчитывается согласно правилу вероятности произведения случайных независимых событий по формуле:

где f(xi)- сумма по соответствующей строке, f(yj) - сумма по соответствующему столбцу, а N- общее число испытуемых.

Знак суммы в формуле критерия Пирсона говорит о том, что сложение проводится для всех клеток таблицы.

Число степеней свободы определяется по формуле

= (n-1)(m-1)

где n - число строк в таблице, а m - число столбцов, т.е. для четырехклеточных таблиц =1. Если эмпирическое значение критерия 2 оказывается больше (или равно) критического при заданном уровне доверительной вероятности, то отличие коэффициента от нуля признается статистически значимым.

       Для четырехклеточных таблиц с числом испытуемых меньше 30 рекомендуется использовать формулу с учетом поправки Йетса на непрерывность:

 

Задача: Есть ли связь между результатами сдачи зачета, посещением лекций и местом проживания? Какая из этих связей более сильная?

А. Связь «посещаемость - сдача зачета»:

(здесь и ниже: цифра слева вверху ячейки - эмпирическая частота, справа внизу - теоретическая частота)

Таблица 21

У1 - посещал лекции

У2 - не посещал лекции

Сумма по строке

Х1 - сдал зачет с 1-го раза

18

12.87

3  

8.13

21

Х2-не сдал зачет с 1-го раза

1

6.13

9

3.87

10

Сумма

по столбцу

19

12

Всего 31

= 0.727

Статистическую значимость отличия коэффициента от нуля проверим по критерию 2 Пирсона:

2эмп=  (18-12.87)2  +  (3-8.13)2  +  (1-6.13)2  +  (9-3.87) 2   =  16.375       

               12.87           8.13           6.13            3.87

2кр=6.635 (=0.01)

2эмп > 2кр связь «посещаемость - сдача зачета» статистически значима (0.01).

Б. Связь «место проживания - сдача зачета»:

Таблица 22.

У1 - живет дома

У2- живет в общежитии

Сумма по строке

Х1 - сдал зачет с 1-го раза

11  

  10.29

7   

  7.71

18

Х2-не сдал зачет с 1-го раза

5   

  5.71

5   

  4.29

10

Сумма по столбцу

16

12

Всего 28

=0.107

Статистическая значимость связи «место проживания - сдача зачета» проверяется по критерию 2 с учетом поправки Йетса, так как число испытуемых меньше 30:

2эмп= (11-10.29-0.5)2 + (|7-7.71|-0.5)2  + (|5-5.71|-0.5)2 + (5-4.29-0.5)2  = 0.028

                 10.29                 7.71                    5.71                   4.29

    

2кр=3.841 (=0.05)

2эмп < 2кр связь «место проживания - сдача зачета» статистически незначима (0.05).

Ответ: Коэффициент четырехклеточной сопряженности для зависимости «посещаемость - сдача зачета» выше, чем для зависимости «место проживания - сдача зачета», следовательно, в первой зависимости связь сильнее.

Если таблицы описывают свойства, измеренные в недихотомической шкале наименований, то они называются таблицами многоклеточной сопряженности.

Для анализа многоклеточных таблиц используются коэффициенты многоклеточной сопряженности Кч - коэффициент Чупрова и - коэффициент Пирсона. Коэффициенты рассчитываются по формулам:

С - коэффициент многоклеточной сопряженности Пирсона:

 

где N - общее количество испытуемых, 2- критерий Пирсона.

Кч - коэффициент Чупрова:

 

где n-число строк, m - число столбцов, N - общее количество испытуемых.

Непосредственно по коэффициентам многоклеточной сопряженности К и С, как и в случае с четырехклеточными таблицами, можно сравнивать силу связи между изучаемыми характеристиками в разных таблицах. Статистическая значимость связи и отличия от нуля коэффициентов Чупрова и Пирсона оценивается по критерию 2 Пирсона аналогично четырехклеточным таблицам (с учетом поправки Йетса при количестве измерений менее 30).

Задача: При исследовании связи между удовлетворенностью профессиональной деятельностью, уровнем образования и социальным положением испытуемых получены результаты, приведенные в таблицах. Какие выводы можно сделать о силе связи между этими характеристиками? 

Таблица 23.

Удовлетворенность профессиональной деятельностью

Уровень образования

Суммы по строкам

Высшее

Ср. техн.

Среднее

А1

А2

А3

Высокая

В1

20  

12.21

10

  10.89

3   

 9.90

33

Средняя

В2

11

 16.28

15  

14.52

18

13.20

44

Низкая

В3

6  

  8.51

8

 7.59

9  

 6.90

23

Сумма

по столбцам

37

33

30

Всего: 100

Критерий 2эмп= (20-12.21)2  + (10-10.89)2 + (3-9.90)2 + (11-16.28)2+ (15-14.52)2+

                               12.21            10.89            9.90  16.28           14.52      

     

+ (18-13.20)2 + (6-8.51)2 + (8-7.59)2 + (9-6.90)2  = 14.74

      13.20            8.51    7.59           6.90

.Число степеней свободы =(3-1)(3-1)=4. Критическое значение критерия при 95% доверительной вероятности составляет 9.49, при 99% - 13.28. Поскольку 2эмп >2кр, то зависимость между уровнем образования и удовлетворенностью работой статистически значима (=0.01).

Рассчитав эмпирическое значение критерия 2, можно рассчитать коэффициенты Чупрова и Пирсона:

= 0.358,

= 0.271.

Исследование связи между удовлетворенностью профессией и социальным положением испытуемых дало следующие результаты:

Таблица 24

Удовлетворенность профессиональной деятельностью

Социальное положение испытуемого

Суммы по строкам

Предпри-ниматели

Гос. служащие

Рабочие

Тружени-ки села

А1

А2

А3

А4

Высокая

В1

14

      10.25

13

10.66

6  

11.48

8

8.61

41

Средняя

В2

7  

 7.75

4  

 8.06

14

13.20

6

8.68

31

Низкая

В3

4  

 7.00

9  

 7.28

8  

 7.84

7

5.88

28

Сумма по столбцам

25

26

28

21

Всего:100

Критерий 2эмп= (14-10.25)2  + (13-10.66)2 + (6-11.48)2 + (8-8.61)2 +

                               10.25            10.66           11.48          8.61

+ (7-7.75)2 + (4-8.06)2  +(14-13.20)2 + (6-8.68)2 + (4-7.00)2 + (9-7.28)2 +

7.75      8.06           13.20           8.68         7.00           7.28

+ (8-7.84)2 + (7-5.88)2  = 9.447

     7.84          5.88

Число степеней свободы =(4-1)(3-1)=6. Критическое значение критерия при 95% доверительной вероятности составляет 12.592. Поскольку 2эмп <2кр, то связь между удовлетворенностью профессией и социальным положением испытуемых статистически незначима (=0.05).

= 0.293,

= 0.196.

Коэффициент многоклеточной сопряженности Пирсона С для зависимости «удовлетворенность профессией - образование» выше, чем для зависимости «удовлетворенность профессией - социальное положение», следовательно, в первой зависимости связь более тесная, чем во второй. Аналогичный вывод можно сделать и по коэффициенту Чупрова К.

Следует иметь также в виду, что с помощью рассмотренных коэффициентов и критериев доказывается только отличие распределения цифр в таблице от равномерного. Для описания же характера связи между явлениями следует использовать другие методы, о некоторых из них речь пойдет ниже.

8.2 Корреляционная связь

Корреляционная связь - это согласованное изменение двух или более признаков. Корреляционная связь означает, что изменчивость одного признака находится в некоторой связи с изменениями другого признака. Например, количество знаний человека, оцененное по какой-либо шкале, будет закономерно расти с увеличением его возраста. Количество ошибок при чтении текста или при решении задач будут закономерно уменьшаться при увеличении количества выполненных тренировочных упражнений. В зависимости от величины нагрузки на тренировках будут изменяться спортивные показатели спортсменов и так далее.   Используется также термин корреляционная зависимость, который означает, что направленные изменения одного признака приводят к направленным изменениям другого. Термины корреляционная связь и корреляционная зависимость не являются синонимами, поскольку два признака, изменяющиеся согласованно, могут зависеть не друг от друга, а от какого-либо третьего признака. Например, количество церквей в городе и количество баров-ресторанов изменяются согласованно - в том городе, где много церквей, там много и баров. Связь же здесь не прямая, а опосредованная: больше памятников старины (церквей), следовательно, больше туристов, поэтому в городе больше баров и ресторанов. То есть корреляционная связь не является свидетельством причинно-следственной связи, а только показывает, что изменениям одного признака, как правило, соответствуют изменения другого. При корреляционной зависимости изменение одного признака непосредственно влияет на изменение другого: между количеством памятников старины в городе и количеством туристов есть корреляционная зависимость. Но в целом, если нет уверенности в причинно-следственной зависимости между двумя или более явлениями, то лучше пользоваться термином «корреляционная связь».

Корреляционные связи характеризуются формой, направлением и силой. По форме различаются связи прямолинейные и криволинейные. Прямолинейной может быть связь между количеством правильно решенных задач и количеством выполненных тренировочных заданий. А вот, например, связь между уровнем мотивации и эффективностью выполнения задачи криволинейная: эффективность выполнения задачи возрастает только до определенного, так называемого оптимального уровня мотивации, а затем начинает снижаться.

По направлению корреляционная связь может быть положительной (прямой) либо отрицательной (обратной). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака, соответственно более низкие другого. При отрицательной связи более высоким значениям одного признака соответствуют более низкие другого. Так, связь между количеством тренировочных заданий и количеством правильно решенных задач прямая (положительная), а между количеством тренировочных заданий и количеством допущенных ошибок - обратная (отрицательная).  

Сила связи характеризует, насколько строго выполняется зависимость. Чем сильнее связь между явлениями, тем более сильно оказывается вытянутым облако точек на графике. Степень вытянутости облака оценивается с помощью коэффициента корреляции. Коэффициент корреляции изменяется от минус до плюс единицы. Знак показывает, является ли связь положительной или отрицательной, а абсолютная величина коэффициента корреляции - силу связи. Если коэффициент близок к нулю, то связь отсутствует, если близок к единице, то связь значима.

При классификации силы связи пользуются двумя шкалами. Общая шкала ориентирована на абсолютное значение коэффициента корреляции:

  •  сильная (тесная) связь    ÷ r÷ >0.70
  •  средняя связь     0.50< ÷ r÷ <0.69
  •  умеренная связь    0.30< ÷ r÷ <0.49
  •  очень слабая связь (отсутствие связи) ÷ r÷ <0.29   

      

Рис.6. Возможные варианты расположения облака точек на графике и соответствующие им коэффициенты корреляции.

Частная классификация учитывает объем выборки и оценивает достоверность наличия корреляционной связи:

  •  высокая значимая корреляция  при r, соответствующем уровню статистической значимости p<0.01
  •  значимая корреляция - при r, соответствующем уровню статистической значимости p<0.05
  •  тенденция достоверной связи при r, соответствующем уровню статистической значимости p<0.10
  •  корреляция незначима при r, не достигающим уровня статистической значимости.

Поскольку даже высокий коэффициент корреляции при малом объеме выборки может оказаться незначимым статистически, а при больших объемах выборки слабая связь статистически значима, то лучше пользоваться второй классификацией.

8.2.1 Меры связи для явлений, измеренных в ранговых шкалах

С помощью коэффициента ранговой корреляции Спирмена можно определить силу и направление связи между двумя признаками или двумя профилями (иерархиями) признаков. Формула в общем случае имеет следующий вид:

где d - разность между рангами каждой из переменных (ранжирование производится раздельно для каждой из переменных), а N - количество ранжируемых значений (или переменных, образующих иерархию). Полученное эмпирическое значение rs  сравнивается с критическими значениями, приведенными в таблицах (Таблица 10 Приложения). Если эмпирическое значение коэффициента ранговой корреляции больше критического или равно ему, то связь признается значимой.

Задача: По результатам тестирования учеников 10 класса одной из школ Ленинградской области оценить корреляцию между двумя иерархиями ценностей - шкалой важности ценностей и шкалой ценностей, которые легче достигнуть.

                                                                                         Таблица 25.

Оценка корреляционной связи между шкалой важности ценностей и шкалой ценностей, которые легче достигнуть, по результатам тестирования учеников 10 класса одной из школ Ленинградской области

№№ ценностей

Ранги важности ценностей (X)

Ранги доступности ценностей (Y)

di=Xi-Yi

di2

1

10

7

3

9

2

3

9

-6

36

3

8

8

0

0

4

11

10

1

1

5

2

2

0

0

6

5

11

-6

36

7

4

1

3

9

8

6

3

3

9

9

9

5

4

16

10

7

4

3

9

11

1

6

-5

25

12

12

12

0

0

150

=0,476

rs крит.=0.50 (р=0.10). rs < rs крит  связь между шкалой ценностей, которые важнее, и шкалой ценностей, которые легче достигнуть, незначима.

При исследовании связи между различными признаками у одних и тех же испытуемых нередко два или более значений переменных получают один и тот же ранг. В этом случае в формулу коэффициента ранговой корреляции Спирмена вводятся поправки, и она  принимает вид:

где Тa,b - поправки, рассчитываемые по формулам

                                            

соответственно для первого (а) и  второго (b) признака (второй иерархии). «a» и «b» - объем каждой группы одинаковых рангов: например, если два ранжируемых значения признака совпадают, то объем группы равен 2; если 3 значения совпадают - объем группы равен трем и т.д. При малых объемах групп поправка несущественна, при совпадении большого количества рангов она становится уже заметной.

Задача: Есть ли связь между  способностью классификации и осведомленностью по тесту ШТУР у учениц 10 класса одной из школ Ленинградской области?

Таблица 26.

Оценка связи между способностью классификации и осведомленностью по тесту ШТУР у учениц 10 класса одной из школ Ленинградской области

Осведомленность

Ранг

Способность классификации

Ранг

di2

16

25,5

23

34

72,25

17

31

15

23,5

56,25

18

34

13

13,5

420,25

17

31

13

13,5

306,25

16

25,5

9

6

380,25

15

19,5

18

32,5

169

17

31

10

9

484

17

31

8

3,5

756,25

16

25,5

16

28

6,25

10

7

18

32,5

650,25

16

25,5

14

18

56,25

10

7

17

30,5

552,25

17

31

8

3,5

756,25

15

19,5

11

11

72,25

9

5

13

13,5

72,25

13

12,5

13

13,5

1

8

3,5

14

18

210,25

12

9,5

16

28

342,25

15

19,5

14

18

2,25

15

19,5

14

18

2,25

16

25,5

15

23,5

4

16

25,5

14

18

56,25

13

12,5

9

6

42,25

12

9,5

10

9

0,25

15

19,5

15

23,5

16

15

19,5

15

23,5

16

14

15,5

16

28

156,25

8

3,5

7

2

2,25

14

15,5

17

30,5

225

13

12,5

10

9

12,25

13

12,5

6

1

132,25

10

7

9

6

1

7

1,5

15

23,5

484

7

1,5

15

23,5

484

Сумма:

7000

=40

=54

= - 0.072

rs крит.= 0.44 (0.01)             rs < rs крит 

Ответ корреляционная связь между способностью классификации и осведомленностью по тесту ШТУР у учениц 10 класса незначима.

8.2.2 Меры связи для явлений, измеренных в разных шкалах

Для изучения связей между явлениями, одно из которых измерено в шкале интервалов или отношений, а второе - в дихотомической номинативной шкале, используется точечно-бисериальный коэффициент корреляции rpb.

где Мх(А) - среднее значение х для объектов, имеющих «А» по шкале наименований, Мх(В) - среднее х для объектов, имеющих «В» по шкале наименований, х - среднеквадратическое отклонение всех объектов (то есть объединенной выборки!), nА - число объектов, имеющих «А» в шкале наименований, nВ - число объектов, имеющих «В» в шкале наименований, N- общее количество наблюдений. Точечно-бисериальный коэффициент корреляции может быть использован вместо t-критерия Стьюдента для выявления значимости различий в уровне признака в двух независимых выборках.

Точечно-бисериальный коэффициент корреляции варьирует от -1 до 1. Если коэффициент близок к нулю - связь отсутствует, если по абсолютной величине приближается к 1, связь есть. Знак значения не имеет. Проверить статистическую значимость точечно-бисериального коэффициента корреляции можно, воспользовавшись таблицами критических значений коэффициента линейной корреляции Пирсона (Таблица 11 Приложения) (коэффициент корреляции следует признать статистически значимым, если он превышает табличное критическое значение или равен ему) или с помощью критерия Стьюдента для мер связи по формуле:

где N - количество испытуемых, а r - коэффициент корреляции. Число степеней свободы = N-2 (связь признается значимой, если tэмп. больше или равно tкрит.). Пример решения задачи на расчет точечно-бисериального коэффициента корреляции приведен в таблице 27.

Если явления измерены у объектов одно в ранговой, а другое в номинативной шкалах, то есть каждый испытуемый отнесен к одному из двух классов шкалы наименований, и ему присвоен какой-то ранг по другому качеству, то используется рангово-бисериальный коэффициент  корреляции rrb:

где МRA - среднее значение рангов по х для объектов, имеющих «А» по шкале наименований (ранги рассчитываются для объединенной выборки, затем расписываются на относящиеся к А и к В), МRВ - среднее значение рангов  для объектов, имеющих «В» по шкале наименований. Рангово-бисериальный коэффициент корреляции может быть использован вместо критерия Манна-Уитни для выявления значимости различий в уровне признака в двух независимых выборках.

Задача: Зависит ли способность ученика к обобщению (по ШТУР) от года обучения в школе (сопоставляются результаты учеников 10 и 11 классов)?

Таблица 27


Оценка зависимости между способностью обобщения и годом обучения в школе у учениц одной из школ Ленинградской области
(по точечно-бисериальному коэффициенту корреляции)

11 класс

10 класс

29

20

24

10

28

20

19

9

24

27

23

9

28

25

20

8

30

18

25

21

30

10

17

6

28

22

21

7

29

16

26

12

33

24

22

10

31

24

23

8

20

15

14

8

29

18

21

17

13

22

19

17

11

13

14

21

29

26

16

17

18

19

16

24

15

18

11

18

19

19

14

21

9

11

30

16

9

19

17

Среднее                            21,40

15,76

Общее среднее                            18,97

Общее стандартное отклонение   6,782

Общая дисперсия выборки          46,00

=0.414

rPb > rкр (rкр=0,283 при =0.01)

Ответ: между способностью к обобщению по ШТУР и годом обучения в школе есть высокая значимая связь (=0.01).

Аналогично точечно-бисериальному коэффициенту корреляции, рангово-бисериальный коэффициент изменяется от -1 до 1, знак значения не имеет. Проверка значимости проводится с помощью таблиц критических значений для коэффициента корреляции Пирсона (Таблица 11 Приложения), либо с применением t-критерия Стьюдента для мер связи.

Задача: Зависит ли способность ученика выполнять счетные операции (по ШТУР) от года обучения в школе: сопоставить результаты учеников 10 и 11

классов.

Таблица 28.

Оценка зависимости выполнения счетных операций по результатам ШТУР от года обучения у юношей одной из школ Ленинградской области(по рангово-бисериальному коэффициенту корреляции)

Результат ШТУР

Ранг

Результат ШТУР

Ранг

3

2

3

2

4

4

3

2

5

6

5

6

6

8

5

6

8

10

8

10

9

16,5

8

10

9

16,5

9

16,5

9

16,5

9

16,5

9

16,5

9

16,5

9

16,5

9

16,5

9

16,5

10

24

10

24

10

24

10

24

11

28,5

10

24

11

28,5

11

28,5

12

32

11

28,5

12

32

12

32

13

34,5

13

34,5

Сумма рангов

391

207

Средний ранг

19,55

13,80

rrb=(2/35).(19.55-13.80)=0.329.

rкр=0,334 (=0.05) > rrb > rкр=0,284 (=0.10)  

Ответ: между выполнением счетных операций по ШТУР и годом обучения есть тенденция достоверной связи (р=0.10).

8.2.3 Меры связи для явлений, измеренных

в шкале интервалов или отношений

Для  явлений, измеренных в интервальных шкалах или в шкале отношений, наиболее распространенным является использование коэффициента линейной корреляции Пирсона, обозначаемого rxy.

где xi, yi - значения случайных величин, измеренных на i-том объекте, Мх, Му, х, у - средние арифметические и стандартные отклонения соответствующих случайных величин, N – количе-ство испытуемых. Коэффициент корреляции может принимать как положительные, так и отри-цательные значения от -1 до 1. Если значения близки к нулю, то корреляция отсутствует, значе-ния близки к 1 или -1 - корреляция сильная. Проверить достоверность отличия от нуля получен-ного значения коэффициента корреляции можно непосредственно по таблицам критических значений коэффициента линейной корреляции Пирсона (Таблица 11 Приложения) (коэффици-ент корреляции следует признать статистически значимым, если он превышает табличное критическое значение или равен ему) или с помощью критерия Стьюдента для мер связи.

Задача: Есть ли связь между способностью классификации и поиска аналогии по тесту ШТУР у учениц 10 класса одной из школ Ленинградской области?

                                                                                                Таблица 29

Оценка зависимости между показателями способностей классификации и поиска аналогии по тесту ШТУР у учеников 11 класса

способности классификации (х)

способности поиска аналогии (у)

Х-Мх

У-Му

(Х-Мх)(У-Му)

23

18

5

2,9

14,5

23

11

5

-4,1

-20,5

20

18

2

2,9

5,8

23

14

5

-1,1

-5,5

23

15

5

-0,1

-0,5

20

12

2

-3,1

-6,2

22

17

4

1,9

7,6

21

18

3

2,9

8,7

19

19

1

3,9

3,9

16

18

-2

2,9

-5,8

15

14

-3

-1,1

3,3

14

17

-4

1,9

-7,6

17

16

-1

0,9

-0,9

21

18

3

2,9

8,7

16

15

-2

-0,1

0,2

14

13

-4

-2,1

8,4

13

11

-5

-4,1

20,5

12

14

-6

-1,1

6,6

12

12

-6

-3,1

18,6

16

12

-2

-3,1

6,2

Среднее        18

15,1

Сумма   66.0

Стандартное

отклонение

3,934

2,673

 

= 0.330

r кр.=0,444 (0.05)

и 0,378 (0,10)

rxy < r кр связь между показателями способностей классификации и поиска аналогии по тесту ШТУР у учеников 11 класса незначима.

Коэффициенты линейной корреляции Пирсона можно рассчитать с помощью встроенной функции Microsoft Excel. Для того чтобы воспользоваться встроенной функцией сначала необходимо переменные, между которыми будут рассчитываться коэффициенты корреляции, представить в виде единого массива, то есть расположить их в соседних столбцах таблицы данных. Затем следует войти в раздел «Анализ данных» из меню «Сервис», где выбрать  подраздел «Корреляция». На экране высвечивается меню подраздела «Корреляция», в котором задаются входной интервал переменных и выходной интервал (номер левой верхней ячейки выходного интервала). Входной интервал переменных задается в виде единого массива, например «a1:b24» при двух переменных по 24 значения в каждой из выборок. Но с помощью встроенной функции Microsoft Excel можно рассчитать коэффициенты корреляции сразу между несколькими переменными. Если, к примеру, задать массив «a1:d16», то будут рассчитываться коэффициенты корреляции между четырьмя переменными по 16 значений в каждой: a1:a16, b1:b16, c1:c16  d1:d16. Выходные данные представляют собой матрицу коэффициентов корреляции между переменными.

8.3 Корреляционный анализ

Корреляционный анализ дает возможность оценки степени согласованности изменений (варьирования) большого числа признаков и выделить группы взаимокоррелирующих признаков. Результаты вычисления корреляций для некоторого набора признаков записываются в виде квадратной матрицы. В заголовки строк и столбцов выносятся названия или номерами признаков, в клетки таблицы заносятся коэффициенты корреляции каждого признака с каждым. Испытуемые и их порядковые номера в корреляционной матрице не представлены. Понятно, что по главной диагонали матрицы будут располагаться единицы, поскольку коэффициент корреляции любой величины с собой будет равен единице. Корреляционная матрица является симметричной относительно главной диагонали: коэффициенты корреляции признака Х с признаком У и признака У с признаком Х равны между собой. Поэтому, как правило, заполняется и используется только верхняя половина матрицы.

По приведенным в таблице 12 Приложений результатам ШТУР, показанным девушками- ученицами 10 класса одной из школ Ленинградской области (n=34), рассчитаны следующие коэффициенты корреляции :

                                                                                       Таблица 30.

Коэффициенты корреляции результатов учениц 10 класса

по различным разделам теста ШТУР

Столбец 1

Столбец 2

Столбец 3

Столбец 4

Столбец 5

Столбец 6

Столбец 1

1,00

Столбец 2

0,47

1,00

Столбец 3

0,26

0,00

1,00

Столбец 4

0,40

0,25

0,12

1,00

Столбец 5

0,54

0,23

-0,05

0,16

1,00

Столбец 6

0,08

0,04

-0,11

0,02

0,44

1,00

Примечание к таблицам 30-31: 1- общая осведомленность; 2- частная осведомленность; 3- способности классификации; 4- способности поиска аналогии; 5- способности обобщения; 6- способности выполнения счетных операций

Далее в таблице надо выделить коэффициенты корреляции, величина которых превышает критические значения для разных уровней достоверности, как правило, 90%, 95% и 99%. Такие значения выделяются либо шрифтом, либо подчеркиванием, либо цветом. Критические значения коэффициента корреляции Пирсона рассчитываются по критерию t-Стьюдента или берутся из таблицы критических значений с учетом числа испытуемых. Например, значения r, превышающие уровень достоверности 90% будем выделять подчеркиванием (но в нашей таблице таковых не оказалось), 95% - курсивом, 99%- жирным шрифтом. Значения, не отличающиеся значимо от нуля можно опустить. В окончательном виде матрица корреляций принимает следующий вид:

Таблица 31.

Коэффициенты корреляции результатов учениц 10 класса

по различным разделам теста ШТУР

Столбец 1

Столбец 2

Столбец 3

Столбец 4

Столбец 5

Столбец 6

Столбец 1

1

Столбец 2

0,47

1

Столбец 3

1

Столбец 4

0,40

1

Столбец 5

0,54

1

Столбец 6

0,44

1

По полученным данным строится так называемый корреляционный граф. Корреляционный граф - это фигура, состоящая из вершин и соединяющих их линий. В вершинах фигуры располагаются признаки, которые могут обозначаться их полными наименованиями, сокращениями либо цифрами. Линии, соединяющие вершины, характеризуют корреляционную связь между этими признаками. Тип линии отражает знак и достоверность отличия от нуля соответствующего коэффициента корреляции. Отсутствие линии, соединяющей признаки, говорит, что коэффициент корреляции данных признаков не отличается значимо от нуля. Форму корреляционного графа исследователь задает самостоятельно. Если признаков так много, что их трудно отобразить на одном корреляционном графе, то граф разделяется на части, которые называются корреляционными плеядами. Для нашей корреляционной матрице мы можем построить достаточно простой корреляционный граф, состоящий из одной плеяды (цифры в кружках соответствуют номерам признаков в таблице 31).

Рис.7. Корреляционный граф для результатов ШТУР учениц 10 класса.

Ниже аналогичным образом обработаны данные, характеризующие внимание, память и некоторые другие характеристики школьников(n=40):

Таблица 32.

Исходная корреляционная матрица:

№ переменной

1

2

3

4

5

6

7

8

9

1

Устойчивость внимания

1,00

0,92

0,76

0,17

0,02

0,68

0,64

0,57

-0,21

2

Объем внимания

0,92

1,00

0,82

0,19

0,02

0,74

0,67

0,55

-0,36

3

Память

0,76

0,82

1,00

-0,06

0,07

0,77

0,49

0,63

-0,39

4

Конфликтность

0,17

0,19

-0,06

1,00

0,64

0,21

0,13

0,18

-0,24

5

Агрессивность

0,02

0,02

0,07

0,64

1,00

0,00

-0,11

0,10

0,11

6

Абстрактность мышления

0,68

0,74

0,77

0,21

0,00

1,00

0,70

0,85

-0,50

7

Успеваемость

0,64

0,67

0,49

0,13

-0,11

0,70

1,00

0,53

-0,26

8

Креативность мышления

0,57

0,55

0,63

0,18

0,10

0,85

0,53

1,00

-0,47

9

Ригидность мышления

-0,21

-0,36

-0,39

-0,24

0,11

-0,50

-0,26

-0,47

1,00

Таблица 33.

Окончательный вид корреляционной матрицы:

№ переменной

1

2

3

4

5

6

7

8

9

1

Устойчивость внимания

1,00

0,92

0,76

0,68

0,64

0,57

2

Объем внимания

1,00

0,82

0,74

0,67

0,55

-0,36

3

Память

1,00

0,77

0,49

0,63

-0,39

4

Конфликтность

1,00

0,64

5

Агрессивность

1,00

6

Абстрактность мышления

1,00

0,70

0,85

-0,50

7

Успеваемость

1,00

0,53

8

Креативность мышления

1,00

-0,47

9

Ригидность мышления

1,00

Рис.6. Корреляционный граф для результатов исследования психологических характеристик школьников.

Интерпретация результатов корреляционного анализа заключается в объяснении наличия и силы связей (или их отсутствия) на основе теоретических положений и здравого смысла. Так, интерпретируя полученные данные, следует обсудить причины появления  тесной положительной связи характеристик внимания учащихся (устойчивость и объем внимания) и мышления (абстрактность и креативность мышления) между собой, а также с их памятью и успеваемостью; объяснить, почему ригидность мышления с большинством из перечисленных характеристик обнаруживает отрицательную корреляцию,  а такие характеристики учащихся, как конфликтность и агрессивность, тесно связанные между собой, не проявляют связи с особенностями умственной деятельности и успеваемости.

При интерпретации результатов следует помнить, что наличие корреляционной связи не говорит о причинно-следственной зависимости между признаками. Поэтому иногда могут появиться такие связи, которые не удается объяснить без дополнительных исследований.

Более полный и математически обоснованный анализ корреляционных связей признаков выполняется на ЭВМ методами факторного анализа и главных компонент, которые выходят за рамки курса. Расчеты методами главных компонент и факторного анализа выполняются по программе MathCadStatistics») или любой другой современной программе. Описание методов и рекомендации по их применению легко найти в литературе по предмету.


Список использованной литературы:

Анастази А. Психологическое тестирование. Кн.2. М., 1982

Ашмарин И.П., Васильев Н.Н., Амбросов В.А. Быстрые методы статистической обработки и планирование экспериментов. Изд. ЛГУ, Ленинград, 1971.

Дэвис С. Дж. Статистический анализ данных в геологии. т.1. М., «Недра», 1990.

Еремеев Б.А. Статистические процедуры при психологическом изучении текста. Учебное пособие. СПб, «Образование», 1996.

Машков В.Н. Основы дифференциальной психологии. Спб, изд. СПбГУ, 1998.

Сидоренко Е.В. Методы математической обработки в психологии. СПб., 1996

Тарасов С.Г. Математические методы в психологии. Учебно-методические указания. СПб.,1998, 56 с.

Дополнительная литература:

Гласс Дж., Стенли Дж. Статистические методы в педагогике и психологии. М., 1976.

Иберла К. Факторный анализ. М., 1980.

Суходольский Г.В. Основы математической статистики для психологов. Л., 1972.

Суходольский Г.В. Математическая психология. СПб., 1997.


Приложение 1. Таблицы критических значений.

Таблица 1.

Значения кумулятивной функции распределения 

стандартного нормального распределения

Стандартное отклонение от среднего значения

Кумулятивная вероятность

Стандартное отклонение от среднего значения

Кумулятивная вероятность

Стандартное отклонение от среднего значения

Кумулятивная вероятность

-3.0

0.0014

-0.9

0.1841

1.1

0.8643

-2.9

0.0019

-0.8

0.2119

1.2

0.8849

-2.8

0.0026

-0.7

0.2420

1.3

0.9032

-2.7

0.0035

-0.6

0.2743

1.4

0.9192

-2.6

0.0047

-0.5

0.3085

1.5

0.9332

-2.5

0.0062

-0.4

0.3446

1.6

0.9452

-2.4

0.0082

-0.3

0.3821

1.7

0.9554

-2.3

0.0107

-0.2

0.4207

1.8

0.9641

-2.2

0.0139

-0.1

0.4602

1.9

0.9713

-2.1

0.0179

0.0

0.5000

2.0

0.9773

-2.0

0.0228

0.1

0.5398

2.1

0.9821

-1.9

0.0287

0.2

0.5793

2.2

0.9861

-1.8

0.0359

0.3

0.6179

2.3

0.9893

-1.7

0.0446

0.4

0.6554

2.4

0.9918

-1.6

0.0548

0.5

0.6915

2.5

0.9938

-1.5

0.0668

0.6

0.7257

2.6

0.9953

-1.4

0.0808

0.7

0.7580

2.7

0.9965

-1.3

0.0968

0.8

0.7881

2.8

0.9974

-1.2

0.1151

0.9

0.8159

2.9

0.9981

-1.1

0.1357

1.0

0.8413

3.0

0.9986

-1.0

0.1587


Таблица 2.

Таблица критических значений параметра «а» для исключения выскакивающих значений

а

а

N

Уровень достоверности 95%

Уровень достоверности 99%

3

0.941

0.988

4

0.765

0.889

5

0.642

0.780

6

0.560

0.698

7

0.507

0.637

8

0.468

0.590

9

0.437

0.555

10

0.412

0.527

11

0.392

0.502

12

0.376

0.482

15

0.338

0.438

20

0.300

0.391

24

0.281

0.367

30

0.260

0.341

Таблица 3.

Таблица критических значений критерия 2 Пирсона

Число степеней свободы

0,05

0,01

Число степеней свободы

0,05

0,01

1

3,841

6,635

19

30,144

36,191

2

5,991

9,210

20

31,410

37,566

3

7,813

11,341

21

32,671

38,932

4

9,488

13,277

22

33,924

40,289

5

11,070

15,086

23

35,172

41,638

6

12,592

16,812

24

36,415

42,980

7

14,067

18,475

25

37,652

44,314

8

15,507

20,090

26

38,885

45,642

9

16,919

21,666

27

40,113

46,963

10

18,307

23,209

28

41,337

48,278

11

18,675

24,725

29

42,557

49,588

12

21,026

26,217

30

43,773

50,892

13

22,362

27,688

40

55,76

63,69

14

23,685

29,141

50

67,50

76,15

15

24,996

30,578

60

79,08

88,38

16

26,296

32,000

70

90,53

100,43

17

27,587

33,409

80

101,88

112,33

18

28,869

34,805

90

113,15

124,12

100

124,34

135,81


Таблица 4.

Критические значения F-критерия Фишера 

с 1 и 2 степенями свободы при =0.05

1=n1-1

2=n2-1

9

10

12

15

20

24

9

3.18

3.14

3.07

3.01

2.94

2.90

2.86

10

3.02

2.98

2.91

2.84

2.77

2.74

2.70

11

2.90

2.85

2.79

2.72

2.65

2.61

2.57

12

2.80

2.75

2.69

2.62

2.54

2.51

2.47

13

2.71

2.67

2.60

2.53

2.46

2.42

2.48

14

2.65

2.60

2.53

2.46

2.39

2.35

2.31

15

2.59

2.54

2.48

2.40

2.33

2.29

2.25

16

2.54

2.49

2.42

2.35

2.28

2.24

2.19

17

2.49

2.45

2.38

2.31

2.23

2.19

2.15

18

2.46

2.41

2.34

2.27

2.19

2.15

2.11

19

2.42

2.38

2.31

2.23

2.16

2.11

2.07

20

2.39

2.35

2.28

2.20

2.12

2.08

2.04

21

2.37

2.32

2.25

2.18

2.10

2.05

2.01

22

2.34

   2.30

2.23

2.15

2.07

2.03

1.98

23

2.32

2.27

2.20

2.13

2.05

2.01

1.96

24

2.30

2.25

2.18

2.11

2.03

1.98

1.94

25

2.28

2.24

2.16

2.09

2.01

1.96

1.92

26

2.27

2.22

2.15

2.07

1.99

1.95

1.90

27

2.25

2.20

2.13

2.06

1.97

1.93

1.88

28

2.24

2.19

2.12

2.04

1.96

1.91

1.87

29

2.22

2.18

2.10

2.03

1.94

1.90

1.85

30

2.21

2.16

2.09

2.01

1.93

1.89

1.84

40

2.12

2.08

2.00

1.92

1.84

1.79

1.74

60

2.04

1.99

1.92

1.84

1.75

1.70

1.65

120

1.96

1.91

1.83

1.75

1.66

1.61

1.55

1.88

1.83

1.75

1.67

1.57

1.52

1.46


Таблица 5

Таблица критических значений t-критерия Стьюдента.

Число степеней

Уровень значимости

свободы

Односторонний критерий

=0,05

0,025

0,01

0,005

0,001

0,0005

Двусторонний критерий

=0,10

0,05

0,02

0,01

0,002

0,001

1

6,314

12,71

31,82

63,66

318,3

636.6

2

2,920

4,303

6,965

9,925

22,33

31,60

3

2,353

3,182

4,541

5,841

10,21

12,92

4

2,132

2,776

3,747

4,604

7,173

8,610

5

2,015

2,571

3,365

4,032

5,893

6,869

6

1,943

2,447

3,143

3,707

5,208

5,959

7

1,895

2,365

2,998

3,499

4,785

5,408

8

1,860

2.306

2,896

3,355

4,501

5,041

9

1,833

2,262

2,821

3,250

4,297

4,781

10

1,812

2,228

2,764

3,169

4,144

4,587

11

1,796

2,201

2,718

3,106

4,025

4,437

12

1,782

2.179

2,681

3,055

3,930

4,318

13

1,771

2,160

2,650

3,012

3,852

4,221

14

1,761

2,145

2,624

2,977

3,787

4,140

15

1,753

2,131

2,602

2,947

3,733

4,073

16

1,746

2,120

2,583

2,921

3,686

4,015

17

1,740

2,110

2,567

2,898

3,646

3,965

18

1,734

2,101

2,552

2,878

3,610

3,922

19

1,729

2,093

2,539

2,861

3,579

3,883

20

1,725

2,086

2,528

2,845

3,552

3,850

21

1,721

2,080

2,518

2,831

3,527

3,819

22

1,717

2,074

2,508

2,819

3,505

3,792

23

1,714

2,069

2,500

2,807

3,485

3,767

24

1,711

2.064

2,492

2,797

3,467

3,745

25

1,708

2,060

2,485

2,787

3,450

3,725

26

1,706

2,056

2,479

2,779

3,435

3,707

27

1,703

2,052

2,473

2,771

3,421

3,690

28

1,701

2,048

2,467

2,763

3,408

3,674

29

1,699

2,045

2,462

2,756

3,396

3,659

30

1,697

2,042

2,457

2,750

3,385

3,646

1,645

1,960

2,326

2,576

3,090

3,291


Таблица 6.

Таблица критических значений критерия Манна-Уитни

(при доверительной вероятности 0.99 - верхняя цифра, 0.95 - нижняя цифра)

N

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

2

0

0

0

0

0

0

1

1

0

0

0

1

1

1

1

2

2

3

3

3

3

4

4

4

3

0

0

1

1

1

2

2

2

3

3

4

4

4

5

0

0

1

2

2

3

4

4

5

5

6

7

7

8

9

9

10

11

4

0

1

1

2

3

3

4

5

5

6

7

7

8

9

9

10

0

1

2

3

4

5

6

7

8

9

10

11

12

14

15

16

17

18

5

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

0

1

2

4

5

6

8

9

11

12

13

15

16

18

19

20

22

23

25

6

1

2

3

4

6

7

8

9

11

12

13

15

16

18

19

20

22

0

2

3

5

7

8

10

12

14

16

17

19

21

23

25

26

28

30

32

7

0

1

3

4

6

7

9

11

12

14

16

17

19

21

23

24

26

28

0

2

4

6

8

11

13

15

17

19

21

24

26

28

30

33

35

37

39

8

0

2

4

6

7

9

11

13

15

17

20

22

24

26

28

30

32

34

1

3

5

8

10

13

15

18

20

23

26

28

31

33

36

39

41

44

47

9

1

3

5

7

9

11

14

16

18

21

23

26

28

31

33

36

38

40

1

4

6

9

12

15

18

21

24

27

30

33

36

39

42

45

48

51

54

10

1

3

6

8

11

13

16

19

22

24

27

30

33

36

38

41

44

47

1

4

7

11

14

17

20

24

27

31

34

37

41

44

48

51

55

58

62

11

1

4

7

9

12

15

18

22

25

28

31

34

37

41

44

47

50

53

1

5

8

12

16

19

23

27

31

34

38

42

46

50

54

57

61

65

69

12

2

5

8

11

14

17

21

24

28

31

35

38

42

46

49

53

56

60

2

5

9

13

17

21

26

30

34

38

42

47

51

55

60

64

68

72

77

13

0

2

5

9

12

16

20

23

27

31

35

39

43

47

51

55

59

63

67

2

6

10

15

19

24

28

33

37

42

47

51

56

61

65

70

75

80

84

14

0

2

6

10

13

17

22

26

30

34

38

43

47

51

56

60

65

69

73

3

7

11

16

21

26

31

36

41

46

51

56

61

66

71

77

82

87

92

15

0

3

7

11

15

19

24

28

33

37

42

47

51

56

61

66

70

75

80

3

7

12

18

23

28

33

39

44

50

55

61

66

72

77

83

88

94

100

16

0

3

7

12

16

21

26

31

36

41

46

51

56

61

66

71

76

82

87

3

8

14

19

25

30

36

42

48

54

60

65

71

77

83

89

95

101

107

17

0

4

8

13

18

23

28

33

38

44

49

55

60

66

71

77

82

88

93

3

9

15

20

26

33

39

45

51

57

64

70

77

83

89

96

102

109

115

18

0

4

9

14

19

24

30

36

41

47

53

59

65

70

76

82

88

94

100

4

9

16

22

28

35

41

48

55

61

68

75

82

88

95

102

109

116

123

19

1

4

9

15

20

26

32

38

44

50

56

63

69

75

82

88

94

101

107

4

10

17

23

30

37

44

51

58

65

72

80

87

94

101

109

116

123

130

20

1

5

10

16

22

28

34

40

47

53

60

67

73

80

87

93

100

107

114

4

11

18

25

32

39

47

54

62

69

77

84

92

100

107

115

123

130

138


Таблица 7.

Таблица критических значений Т-критерия Вилкоксона для множественных сравнений

k (число условий)

N

1-

3

4

5

6

7

8

9

10

3

0.95

15

23

30

37

45

52

60

68

0.99

17

27

36

44

52

61

70

79

4

0.95

24

35

46

57

69

80

92

105

0.99

27

42

54

67

80

94

107

121

5

0.95

33

48

63

79

96

112

129

146

0.99

39

58

76

94

112

130

149

168

6

0.95

43

63

83

104

125

147

169

191

0.99

51

76

99

123

147

171

196

221

7

0.95

54

79

105

131

158

185

213

241

0.99

68

96

125

154

183

215

246

278

8

0.95

66

96

128

160

192

226

260

294

0.99

82

117

152

188

225

263

301

339

9

0.95

79

115

152

190

229

269

310

351

0.99

98

139

181

225

268

313

358

404

10

0.95

92

134

178

223

268

315

362

410

0.99

115

163

212

263

314

366

420

473

11

0.95

106

155

205

257

309

363

418

473

0.99

132

188

243

303

362

423

484

546

12

0.95

121

176

233

292

352

414

476

539

0.99

150

214

278

345

413

481

531

621

13

0.95

136

199

263

329

397

466

537

608

0.99

169

241

314

389

465

542

621

700

14

0.95

152

222

294

368

444

521

599

679

0.99

189

269

351

434

519

606

694

782

15

0.95

169

246

326

408

492

577

665

753

0.99

210

298

389

481

576

672

769

868

16

0.95

186

271

359

449

542

636

732

829

0.99

231

328

428

530

634

740

847

956

17

0.95

203

296

393

492

593

696

802

908

0.99

253

359

468

580

694

810

928

1047

18

0.95

221

323

428

536

646

759

873

989

0.99

275

391

510

632

756

883

1011

1140

19

0.95

240

350

464

581

700

822

947

1072

0.99

298

424

553

685

820

957

1096

1236

20

0.95

259

378

501

627

756

888

1022

1158

0.99

322

458

597

740

886

1033

1182

1335

21

0.95

278

406

538

674

814

953

1100

1246

0.99

346

492

642

796

953

1112

1273

1436

22

0.95

298

435

577

723

872

1024

1179

1336

0.99

371

528

689

853

1021

1192

1365

1540

23

0.95

319

463

617

773

932

1095

1260

1428

0.99

396

564

736

912

1092

1274

1459

1646

24

0.95

340

496

657

824

994

1167

1343

1522

0.99

422

601

784

972

1163

1358

1555

1754

25

0.95

361

527

699

875

1056

1240

1428

1618

0.99

449

639

834

1033

1237

1443

1653

1365


Таблица 8.

Таблица критических значений Т-критерия Вилкоксона для попарных сравнений

N

0,05

0,025

0,01

0,005

N

0,05

0,025

0,01

0,005

5

0

28

130

116

101

91

6

2

0

29

140

126

110

100

7

3

2

0

30

151

137

120

109

8

5

3

1

0

31

163

147

130

118

9

8

5

3

1

32

175

159

140

128

10

10

8

5

3

33

187

170

151

138

11

13

10

7

5

34

200

182

162

148

12

17

13

9

7

35

213

195

173

159

13

21

17

12

9

36

227

208

185

171

14

25

21

15

12

37

241

221

198

182

15

30

25

19

15

38

256

235

211

194

16

35

29

23

19

39

271

249

224

207

17

41

34

27

23

40

286

264

238

220

18

47

40

32

27

41

302

279

252

233

19

53

46

37

32

42

319

294

266

247

20

60

52

43

37

43

336

310

281

261

21

67

58

49

42

44

353

327

296

276

22

75

65

55

48

45

371

343

312

291

23

83

73

62

54

46

389

361

328

307

24

91

81

69

61

47

407

378

345

322

25

100

89

76

68

48

426

396

362

339

26

110

98

84

75

49

446

415

379

355

27

119

107

92

83

50

466

434

397

373


Таблица 9.

 Таблица критических значений L-критерия Пейджа

n

с (количество условий)

3

4

5

6

2

-

-

28

-

60

58

109

106

103

178

173

166

0,001

0,01

0,05

3

-

42

41

89

87

84

160

155

150

260

252

244

0,001

0,01

0,05

4

56

55

54

117

114

111

210

204

197

341

331

321

0,001

0,01

0,05

5

70

68

66

145

141

137

259

251

244

420

409

397

0,001

0,01

0,05

6

83

81

79

172

167

163

307

299

291

499

486

474

0,001

0,01

0,05

7

96

93

91

198

193

189

355

346

338

577

563

550

0,001

0,01

0,05

8

109

106

104

225

220

214

403

393

384

655

640

625

0,001

0,01

0,05

9

121

119

116

252

246

240

451

441

431

733

717

701

0,001

0,01

0,05

10

134

131

128

278

272

266

499

487

477

811

793

777

0,001

0,01

0,05

11

147

144

141

305

298

292

546

534

523

888

869

852

0,001

0,01

0,05

12

160

156

153

331

324

317

593

581

570

965

946

928

0,001

0,01

0,05


Таблица 10.

Таблица критических значений  коэффициента корреляции Спирмена

N

Уровень значимости

N

Уровень значимости

N

Уровень значимости

0.10

0,05

0.01

0.10

0,05

0.01

0.10

0,05

0.01

5

0,80

0,90

17

0,41

0.48

0.62

29

0,31

0,37

0,48

6

0,77

0,83

18

0,40

0,47

0,60

30

0,30

0,36

0,47

7

0,68

0,75

0,94

19

0,39

0,46

0,58

31

0,36

0,46

8

0,62

0,72

0,88

20

0,38

0,45

0,57

32

0,36

0,45

9

0,58

0,68

0,83

21

0,37

0,44

0,56

33

0,34

0,45

10

0,55

0,64

0,79

22

0,36

0,42

0,54

34

0,34

0,44

11

0,53

0,61

0,76

23

0,35

0,42

0,53

35

0,33

0,43

12

0,50

0,58

0,73

24

0,34

0,41

0,52

36

0,33

0,43

13

0,48

0,56

0,70

25

0,34

0,40

0,51

37

0,33

0,42

14

0,46

0,54

0,68

26

0,33

0,39

0,50

38

0,32

0,41

15

0,44

0,52

0,66

27

0,32

0,38

0,49

39

0,32

0,41

16

0,43

0,50

0,64

28

0,32

0.38

0,48

40

0,31

0,40

Таблица 11.

Таблица критических значений коэффициента корреляции Пирсона

Число   степеней свободы

=N-2

Уровень значимости

Число   степеней свободы

=N-2

Уровень значимости

0,05

0,01

0,001

0,05

0,01

0,001

1

0,99692

0,9998

0,99999

16

0,468

0,590

0,708

2

0,9500

0,9900

0,9990

17

0,456

0,575

0,693

3

0,878

0,9587

0,9911

18

0,444

0,561

0,679

4

0,811

0,9172

0,9741

19

0.433

0,549

0,665

5

0,754

0,875

0,9509

20

0.423

0.537

0,652

6

0,707

0,834

0,9249

25

0,381

0,487

0,597

7

0,666

0,798

0,898

30

0,349

0,449

0,554

8

0,632

0,765

0,872

35

0,325

0,418

0,519

9

0,602

0,735

0,847

40

0,304

0,393

0,490

10

0,576

0,708

0,823

45

0,288

0,372

0,465

11

0,553

0,684

0,801

50

0.273

0,354

0,443

12

0,532

0,661

0,780

60

0,250

0,325

0,408

13

0,514

0,641

0,760

70

0,232

0,302

0,380

14

0,497

0,623

0,742

80

0,217

0,283

0,357

15

0,482

0,606

0,725

90

0,205

0,267

0,338

100

0,195

0,254

0,321


Приложение 2

. Результаты ШТУР, использованные при составлении задач настоящего методического пособия

Таблица 12.

Результаты ШТУР, показанные учащимися

11 класса одной из школ Ленинградской области

пол

1*

2

3

4

5

6

Сумма

пол

1

2

3

4

5

6

Сумма

1

м

18

19

23

18

35

13

126

34

ж

16

17

21

16

19

12

101

2

м

19

18

23

11

31

10

112

35

ж

16

16

22

18

13

11

100

3

м

18

18

20

18

28

9

112

36

ж

18

18

18

9

29

8

100

4

м

19

18

23

14

25

11

110

37

ж

15

19

19

18

17

10

98

5

м

13

17

23

15

30

12

110

38

ж

15

20

18

19

16

10

98

6

м

19

19

20

12

26

12

108

39

ж

18

16

19

17

18

9

97

7

м

17

18

22

17

21

11

106

40

ж

17

19

19

16

19

6

96

8

м

15

13

21

18

16

9

102

41

ж

15

17

16

16

21

9

94

9

м

15

20

19

19

18

10

101

42

ж

16

15

12

11

30

9

93

10

м

13

14

16

18

28

9

98

43

ж

17

18

16

15

19

6

91

11

м

19

17

15

14

22

8

95

44

ж

15

14

15

16

20

10

90

12

м

17

20

14

17

20

6

94

45

ж

16

17

16

14

20

7

90

13

м

15

15

17

16

17

10

90

46

ж

12

9

16

14

27

10

88

14

м

19

16

21

18

17

9

90

47

ж

11

15

19

14

25

4

88

15

м

12

14

16

15

24

9

90

48

ж

13

14

18

14

18

10

87

16

м

15

14

14

13

24

4

84

49

ж

17

13

20

17

10

9

86

17

м

12

10

13

11

14

5

75

50

ж

13

12

13

16

22

10

86

18

м

8

14

12

14

12

13

73

51

ж

17

12

16

14

16

9

84

19

м

9

10

12

12

18

9

70

52

ж

16

15

11

13

24

5

84

20

м

13

13

16

12

10

3

67

53

ж

10

12

16

15

24

6

83

21

ж

20

20

22

20

29

12

123

54

ж

16

14

19

12

15

5

81

22

ж

20

19

20

20

28

12

119

55

ж

13

17

12

12

18

9

81

23

ж

20

19

22

20

24

13

118

56

ж

18

15

17

11

13

6

80

24

ж

19

17

23

14

28

12

113

57

ж

17

14

16

12

17

3

79

25

ж

15

19

23

14

30

12

113

58

ж

14

17

11

12

14

10

78

26

ж

17

20

22

13

30

11

113

59

ж

8

10

14

13

26

6

77

27

ж

17

20

23

18

28

7

113

60

ж

12

13

14

14

18

6

77

28

ж

18

19

21

18

29

8

113

61

ж

12

10

16

14

24

8

74

29

ж

18

12

23

17

33

9

112

62

ж

8

12

13

16

11

11

71

30

ж

17

14

20

15

31

12

109

63

ж

14

14

9

9

19

4

69

31

ж

19

18

21

17

20

12

107

64

ж

5

10

9

13

9

10

58

32

ж

14

16

16

12

29

9

105

65

ж

15

9

6

8

16

1

55

33

ж

18

17

22

19

17

7

102

* Примечание: в таблицах 12 и 13 цифры в заголовках столбцов: 1- общая осведомленность; 2- частная осведомленность; 3- способности классификации; 4- способности поиска аналогии; 5- способности обобщения; 6- способности выполнения счетных операций


.      Результаты ШТУР, показанные учащимися                      Таблица 13

10 класса одной из школ Ленинградской области

пол

1

2

3

4

5

6

Сум

1

м

19

20

20

15

25

10

109

2

м

17

17

21

15

18

11

99

3

м

16

17

20

13

20

10

96

4

м

17

18

14

13

28

9

99

5

м

17

18

14

9

18

8

84

6

м

19

16

20

10

13

3

81

7

м

16

15

11

15

11

11

79

8

м

12

16

17

12

16

5

78

9

м

14

15

14

12

14

3

72

10

м

10

14

15

7

13

9

68

11

м

9

10

10

8

16

8

61

12

м

7

13

6

10

12

9

57

13

м

12

11

7

10

10

5

55

14

м

6

9

10

6

11

12

54

15

м

5

11

10

8

7

9

50

16

ж

18

16

23

16

24

11

108

17

ж

15

17

15

12

19

13

91

18

ж

18

18

13

12

23

6

90

19

ж

13

17

13

11

20

15

89

20

ж

15

16

9

14

25

9

88

21

ж

17

15

18

11

17

10

88

22

ж

18

17

10

10

21

12

87

23

ж

14

17

8

12

26

10

87

24

ж

11

16

16

10

22

10

85

25

ж

14

10

18

12

23

7

84

26

ж

18

16

14

14

14

8

84

27

ж

9

10

17

10

21

15

82

28

ж

14

17

8

12

22

7

80

29

ж

16

15

11

15

11

11

79

30

ж

14

9

13

10

21

11

78

31

ж

16

13

13

14

16

4

76

32

ж

12

8

14

13

19

10

76

33

ж

10

12

16

12

15

10

75

34

ж

9

15

14

13

18

3

72

35

ж

14

15

14

12

14

3

72

36

ж

14

16

15

10

11

5

71

37

ж

9

16

14

11

9

8

67

38

ж

8

13

9

8

17

10

65

39

ж

8

12

10

15

10

9

64

40

ж

10

15

15

10

9

5

64

41

ж

10

15

15

10

9

5

64

42

ж

7

14

16

11

8

7

63

43

ж

8

8

7

9

21

10

62

44

ж

10

14

17

10

6

4

61

45

ж

5

13

10

13

7

10

58

46

ж

7

13

6

10

12

9

57

47

ж

6

10

9

11

10

9

55

48

ж

10

7

15

10

8

5

53

49

ж

10

7

15

10

8

5

53

Калинин А.А., Гусева С.И.

ПРОСТЕЙШИЕ МЕТОДЫ АНАЛИЗА ДАННЫХ

В ПСИХОЛОГИИ

Учебно-методическое пособие

Редакторы: Романова Е.В., Фурштатова В.Л., Захарова Т.Т.

Технические редакторы:

Беляева А.Л., Ильина Е.С, Михляева Е.Л.

Оригинал-макет: Ильиной Е.С.

Лицензия № 020123 от 23.12.96

Формат 60x84 1/16. Гарнитура Арнал. Печать офсетная.

Бумага офсетная. Усл. печ. л. 13,5.

Подписано в печать 27.03.2001. Тираж 200 экз. Заказ № 115.

Ленинградский государственный областной

университет им. А.С. Пушкина

189620, г. Пушкин, Петербургское шоссе, 10

РТП ЛГОУ. 197136, Санкт-Петербург, Чкаловский пр., 25а

1 Критическое значение рассчитано по данным таблицы. Для 12 испытуемых критическое значение 0.376, для 15 - 0.338, т.е. изменение критического значения при увеличении количества испытуемых на три (15-12) составляет 0.338-0.376=-0.038. Таким образом, поправка критического значения на каждого испытуемого на данном интервале составляет -0.038/3=-0.013. Критическое значение параметра а для 14 испытуемых составляет 0.376-0.013 х 2=0.350.

PAGE  68




1. журналистика разнообразно как и сфера её применения
2. Пути решения проблем в электроэнергетике
3.  Эффективная защита прав и свобод граждан в сфере исполнительной власти требует четкого правового закрепле
4. Профилактика лесных пожаров.html
5. Рынок труда в Северодвинске
6. Экономические агенты
7. Формы демократии Партии и избирательные системы
8. Задание на проектирование.html
9. д В каждой из этих групп он занимает определенное положение обладает неким статусом к нему предъя
10. Порядок расчета основных статистических показателей
11. реферат дисертації на здобуття наукового ступеня кандидата медичних наук Київ ~6
12. koobru Стив Андреас Коннира Андреас Сердце разума Практическое использование методов НЛП Ог
13. Развитие патологической физиологии в России
14. Курсовая работа- Методика і техніка складання фінансової звітності
15. Тема 1 Предмет и метод экономической теории Сущность общественного производства и его две стороны Э
16. Центр развития ребенка ~ детский сад2 Человек получает права когда появляется на свет
17. Земли особо охраняемых территорий
18. частая проблема педагогов
19. первых спасибо Всем за интерес к моей деятельности
20. закрепляют совокупность имущественных и неимущественных прав подлежащих удостоверению уступке и безусло