Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

на тему- Дисперсионный анализ Выполнили- студентки 2 курса группы ОРМб121Колотилина Анастасия

Работа добавлена на сайт samzan.net: 2015-07-05

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 16.5.2024

Реферат

на тему:

«Дисперсионный анализ»

Выполнили:

студентки 2 курса,

группы ОРМб-121,
Колотилина Анастасия,
Куликова Мария,
Моторина Виктория,
Лестюхина Елена.

Волгоград 2013

Содержание:

1.Постановка задачи дисперсионного анализа

2. Однофакторный дисперсионный анализ

3. Двухфакторный дисперсионный анализ

4. Трехфакторный дисперсионный анализ. План «латинский квадрат»

  1.  Постановка задачи дисперсионного анализа.

Дисперсионный анализ – статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Метод был разработан биологом Р. Фишером в 1925 году и применялся первоначально для оценки экспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии, педагогике, медицине и др.

Целью дисперсионного анализа  является проверка значимости различия между средними с помощью сравнения дисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации1.

При истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии.

При проведении исследования рынка часто встает вопрос о сопоставимости результатов. Например, проводя опросы по поводу потребления какого-либо товара в различных регионах страны, необходимо сделать выводы,  на сколько данные опроса отличаются или не отличаются друг от друга. Сопоставлять отдельные показатели не имеет смысла и поэтому процедура сравнения и  последующей оценки производится по некоторым усредненным значениям и отклонениям от этой усредненной оценки. Изучается вариация признака. За меру вариации может быть принята дисперсия. Дисперсия σ2 – мера вариации, определяемая как средняя из отклонений признака, возведенных в квадрат.

На практике часто возникают задачи более общего характера – задачи проверки существенности различий средних выборочных нескольких совокупностей. Например, требуется оценить влияние различного сырья на качество производимой продукции, решить задачу о влиянии количества удобрений на урожайность с/х продукции.

Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей (дисперсии этих совокупностей одинаковы по предположению; если дисперсионный анализ покажет, что и математические ожидания одинаковы, то в этом смысле совокупности однородны). Однородные же совокупности можно объединить в одну и тем самым получить о ней более полную информацию, следовательно, и более надежные выводы2.

Таким образом, дисперсионный анализ (в зарубежной литературе именуется ANOVA – «Analisis of Variance») – анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов.

Из математической статистики известно, что самой известной мерой разброса количественного признака является его дисперсия:

(напомним, что в знаменателе величина объема выборки уменьшается на единицу для того, чтобы сделать соответствующую точечную выборочную оценку дисперсии несмещенной; – среднее квадратическое отклонение). Ясно, что эта статистика может быть формально адекватной только для интервальных шкал (хотя бы потому, что только при этом условии разумно использование среднего арифметического).

Для порядковых шкал обычно используют какие-либо разницы между квантилями. Например, употребительной мерой является квартильный размах: Q3 - Q1. Но, строго говоря, это некорректно, поскольку для порядковой шкалы разности между шкальными значениями не являются осмысленными.

Представляется, что прежде, чем переходить к описанию мер разброса для номинальных признаков, необходимо пояснить, каков “физический” смысл таких мер3.

С помощью дисперсионного анализа исследуют влияние одной или нескольких независимых переменных на одну зависимую переменную (одномерный анализ) или на несколько зависимых переменных (многомерный анализ). В обычном случае независимые переменные принимают только дискретные значения (и относятся к номинальной или порядковой шкале); в этой ситуации также говорят о факторном анализе. Если же независимые переменные принадлежат к интервальной шкале или к шкале отношений, то их называют ковариациями, а соответствующий анализ - ковариационным.

Дисперсионный анализ может выполняться в рамках двух подходов:

  •  при помощи традиционного "классического" метода по Фишеру

Данный подход сводится к разложению по методу наименьших квадратов (МНК); в однофакторном случае совокупная дисперсия всех наблюдаемых значений раскладывается на дисперсию внутри отдельных групп и дисперсию между группами. В основе обобщенной линейной модели напротив, лежит, корреляционный или регрессионный анализ.

  •  при помощи нового метода "обобщенной линейной модели"4.

Обобщенно задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака выделить три частные вариативности:

- Вариативность, обусловленную действием каждой из исследуемых независимых переменных.

- Вариативность, обусловленную взаимодействием исследуемых независмых переменных.

- Вариативность случайную, обусловленную всеми неучтенными обстоятельствами.

Вариативность, обусловленная действием исследуемых переменных и их взаимодействием соотносится со случайной вариативностью. Показателем этого соотношения является F – критерий Фишера.

 FэмпА = Вариативность, обусловленная действием переменной А / Случайная вариативность

FэмпБ = Вариативность, обусловленная действием переменной Б / Случайная вариативность

FэмпАБ = Вариативность, обусловленная взаимодействием А и Б / Случайная вариативность

 В формулу расчета критерия F взодят оценки дисперсий, и, следовательно, этот метод относится к разряду параметрических. Чем в большей степени вариативность признака обусловлена исследуемыми переменными или  их  взаимодействием,  тем выше эмпирические значения критерия F.

 В отличие от корреляционного анализа, в дисперсионном исследователь исходит из предположения, что одни переменные выступают как влияющие (именуемые факторами или независимыми переменными), а другие (результативные признаки или зависимые переменные) – подвержены влиянию этих факторов. Хотя такое допущение и лежит в основе математических процедур расчета, оно, однако, требует осторожности рассуждений об источнике и объекте влияния.

Например, если мы выдвигаем гипотезу о зависимости успешности работы должностного лица от фактора Н (социальной смелости по Кэттелу), то не исключено обратное: социальная смелость респондента как раз и может возникнуть (усилиться) вследствие успешности его работы – это с одной стороны. С другой: следует отдать себе отчет в том, как именно измерялась «успешность»? Если за ее основу взяты были не объективные характеристики (модные нынче «объемы продаж» и проч.), а экспертные оценки сослуживцев, то имеется вероятность того, что «успешность» может быть подменена поведенческими или личностными характеристиками (волевыми, коммуникативными, внешними проявлениями агрессивности etc.)   Представим смысл дисперсионного анализа графически.

   В примере иллюстрируется исследование зависимости учебной успеваемости школьников от развития кратковременной памяти. В качестве фактора рассматривался уровень развития кратковременной памяти, а в качестве результативных признаков – успеваемость по предмету. Видно, например, что фактор, по-видимому, оказывает существенное влияние при  обучении иностранному языку, и незначим для чистописания, что, впрочем, вполне согласуется со здравым смыслом.

Приведенный пример обращает внимание также и на то, какими именно должны быть факторы?

Здесь фактор имел градации, то есть его величина изменялась при переходе от одной градации к другой. Следует знать, что такое условие отнюдь не обязательно: фактор может иметь градации, никак не связанные между собой количественным отношением, и может быть представлен хоть в номинальной шкале. В общем (и это точнее) говорят не о градациях фактора, а о различных условиях его действия. Возможность количественной градации фактора, таким образом, лишь частный случай.

В качестве иллюстрации этого положения скажем, что если отыщется исследователь, желающий определить зависимость яйценоскости от цвета курицы, то ничто не помешает ему применить дисперсионный анализ, и в качестве условий действия фактора «цвет» избрать, скажем, черных, белых и пестрых кур.

 Формулировка гипотез в дисперсионном анализе.

Нулевая гипотеза: «Средние величины результативного признака во всех условиях действия фактора (или градациях фактора) одинаковы».

Альтернативная гипотеза: «Средние величины результативного признака в разных условиях действия фактора различны».

Виды дисперсионного анализа.

Дисперсионный анализ схематически можно подразделить на несколько категорий. Это деление осуществляется, смотря по тому, сколько,  во-первых, факторов принимает участие в рассмотрении,

во-вторых, - сколько переменных подвержены действию факторов,

в-третьих, - по тому, как соотносятся друг с другом выборки значений.

 

задачу в условиях тишины, вторая – в шумной комнате. (В этом случае, к слову, нулевая гипотеза звучала бы так: «среднее время решения задач такого-то типа будет одинаково в тишине и в шумном помещении», то есть не зависит от При наличии одного фактора, влияние которого исследуется, дисперсионный анализ именуется однофакторным, и распадается на две разновидности:

- Анализ несвязанных (то есть – различных) выборок. Например, одна группа респондентов решает фактора шума.)

- Анализ связанных выборок. То есть: двух замеров, проведенных на одной и той же группе респондентов в разных условиях. Тот же пример: в первый раз задача решалась в тишине, второй – сходная задача – в условиях шумовых помех. (На практике к подобным опытам следует подходить с осторожностью, поскольку в действие может вступить неучтенный фактор «научаемость», влияние которого исследователь рискует приписать изменению условий, а именно, - шуму.)

В случае, если исследуется одновременное воздействие двух или более факторов, мы имеем дело с многофакторным дисперсионным анализом, который также можно подразделить по типу выборки.

Если же воздействию факторов подвержено несколько переменных, - речь идет о многомерном анализе.

Ограничения дисперсионного анализа и подготовка данных.

Дисперсионный анализ следует применять тогда, когда известно (установлено), что распределение результативного признака является нормальным.

Для проверки следует провести расчеты ассимметрии и эксцесса по следующим формулам:

 A = Σ (xi – xср)3 / ns3

mA= √6/n

E = (Σ (xi – xср)4 / ns4 ) - 3

mE= 2√6/n ,

где А и Е – ассимметрия и эксцесс, а mA  и  mE – их ошибки репрезентативности.  После подстановки значений не должно оказаться так, чтобы ассимметрия и эксцесс превышали более, чем втрое свои ошибки репрезентативности. При соблюдении этого требования, распределение можно считать нормальным.

Будем называть данные, относящиеся к одному условию действия фактора (к одной градации) дисперсионным комплексом.

Дисперсионный анализ требует также, чтобы между комплексами соблюдалось равенство дисперсий. В литературе по этому вопросу предлагается (и доказана правомочность предложения) удовлетворять такое требование уравниванием числа значений в каждом из комплексов. Иными словами, если в тихой аудитории  решали задачу 10 человек, то и в шумную мы должны посадить столько же; если белых кур набралось 100, черных – 80, а пестрых – 70, - мы обязаны взять только по 70 кур каждого цвета. Причем, отбор следует осуществлять случайным образом.

В итоге, дисперсионный анализ включает в себя проверку гипотез, связанных с оценкой выборочной дисперсии. Можно выделить три основных вида гипотез:

1.  (значимо ли различие между двумя дисперсиями?)

2.  (одна дисперсия значимо больше другой?)

3.  (значимо ли различие между несколькими дисперсиями?)

Дисперсия вычисляется из случайных величин, и поэтому сама также является случайной величиной. Напомним, что дисперсии, в отличие от средних, подчиняются распределению 

Первые две гипотезы дисперсионного анализа проверяются с помощью критерия Фишера. Причем 1-я гипотеза - с помощью двустороннего критерия, а вторая - с помощью одностороннего. Строго говоря, эти критерии не равны, но в общем случае разницей можно пренебречь. Проверка производится по следующей формуле:

С 3-й гипотезой (сравнение нескольких дисперсий или проверка однородности дисперсий) дело обстоит сложнее. Попарно сравнивать дисперсии некорректно (например, какой вывод нужно сделать, если из трех дисперсий дисперсии 1, 2 и 1, 3 различаются незначимо, а дисперсии 2, 3 - значимо?). В дисперсионном анализе для сравнения нескольких дисперсий существует два критерия:

1. Критерий Бартлетта

Критерий Бартлетта включает в себя довольно сложные вычисления. Тестовая статистика сравнивается с процентной точкой распределения.

Плюсы: нет требования равенства числа степеней свободы дисперсий, критерий выявляет отклонения как в наибольшую, так и в наименьшую стороны.

Минусы: сложность вычислений, число степеней свободы любой дисперсии должно быть больше трех, критерий очень чувствителен к нарушению нормального закона распределения исходных данных.

2. Критерий Кохрена

Проверка однородности дисперсий включает вычисление доли максимальной дисперсии среди всех дисперсий:

которая затем сравнивается с критическим значением G(p,m,f), где f - число степеней свободы каждой дисперсии (должно быть одинаковым у всех дисперсий), m - число дисперсий, p - доверительная вероятность.

Плюсы: простота вычислений

Минусы: ограничение на число степеней свободы дисперсий, критерий выявляет отклонения только в большую сторону.

Сравнивая плюсы и минусы критериев Бартлетта и Кохрена, можно увидеть, что они являются взаимодополняющими и должны использоваться совместно.

  1.  Однофакторный дисперсионный анализ

     Однофакторный дисперсионный анализ используется в тех случаях, когда есть в распоряжении три или более независимые выборки, полученные из одной генеральной совокупности путем изменения какого-либо независимого фактора, для которого по каким-либо причинам нет количественных измерений.

Для этих выборок предполагают, что они имеют разные выборочные средние и  одинаковые выборочные дисперсии. Поэтому необходимо ответить на вопрос, оказал ли этот фактор существенное влияние на разброс выборочных средних или разброс является следствием случайностей, вызванных небольшими объемами выборок. Другими словами если выборки принадлежат одной и той же генеральной совокупности, то разброс данных между выборками (между группами) должен быть не больше, чем разброс данных внутри этих выборок (внутри групп).
     На практике дисперсионный анализ применяют, чтобы установить, оказывает ли существенное влияние некоторый качественный фактор
F, который имеет p уровней F1, F2,…., Fp на изучаемую величину Х. Например, если требуется выяснить, какой вид удобрений наиболее эффективен для получения наибольшего урожая,  то фактор F – удобрение, а его уровни – виды удобрений.
    Основная идея дисперсионного анализа состоит в сравнении «факторной дисперсии», порождаемой воздействием фактора, и «остаточной дисперсии», обусловленной случайными величинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на Х, в этом случае, средние наблюдаемых значений на каждом уровне (групповые средние) различаются также значимо.
5 

Пусть   – – элемент  (  )   -выборки (  ), где m – число выборок, nk – число данных в  -выборке. Тогда   – выборочное среднее  -выборки определяется по формуле

 .

          Общее среднее вычисляется по формуле

  , где  

 

          Основное тождество дисперсионного анализа имеет следующий вид:

 ,

где Q1 – сумма квадратов отклонений выборочных средних   от общего среднего   (сумма квадратов отклонений между группами); Q2 – сумма квадратов отклонений наблюдаемых значений   от выборочной средней   (сумма квадратов отклонений внутри групп); Q – общая сумма квадратов отклонений наблюдаемых значений  от общего среднего  .

       

   Расчет этих сумм квадратов отклонений осуществляется по следующим формулам:

 

В качестве критерия необходимо воспользоваться критерием Фишера:

 

 .

 

Если расчетное значение критерия Фишера будет меньше, чем табличное значение   – нет оснований считать, что независимый фактор оказывает влияние на разброс средних значений, в противном случае, независимый фактор оказывает существенное влияние на разброс средних значений (λ– уровень  значимости, уровень риска, обычно для экономических задач λ=0,05).

Недостаток однофакторного анализа: невозможно выделить те выборки, которые отличаются от других. (Для этой цели необходимо использовать метод Шеффе или проводить парные сравнения выборок.)6

 

Пример1. Три группы продавцов продавали штучный товар, расфасованный в различные упаковки. После окончания срока распродажи был произведен тестовый контроль над случайно отобранными продавцами из каждой группы. Были получены следующие результаты (табл).

 

Т а б л и ц а

 

Номер

группы

Число продаж, которые сделали продавцы, 

Общее

количество

продаж

Количество продавцов, nk

1

1 3 2 1 0 2 1

10

7

2

2 3 2 1 4 -  -

12

5

3

4 5 3 -  - -  -

12

3

 

 

Если число выборок m=3, число продаж во всех выборках n=15, то:

 

          Если 

 ,

 ,

тогда

Q=104–15·2,226 2=26,93 ,

Q1=91,074–15·2,226 2=14,01,

Q2=QQ1=26,93–14,01=12,92 .

 Вычислим критерий Фишера

          Сравнивая это значение с табличным F0,05;2;12 =3,885

Делаем вывод, что упаковка влияет на количество распродаж.

  1.  Двухфакторный дисперсионный анализ

Пусть случайная величина  зависит от двух признаков (факторов)  и .
Обозначим , , , — уровни факторов  и , соответственно. 
Результаты измерения случайной величины  представлены в таблице

 

1

2

3

...

1

...

2

...

...

...

...

...

...

...

...

В каждой клетке таблицы –  при каждом сочетании  уровней факторов проведено по одному наблюдению (измерению). Тогда общее число наблюдений . 
Обозначим через  математическое ожидание  при уровне , ; через  — математическое ожидание  при уровне ,.
Если при изменении фактора  сохраняется равенство , то естественно считать, что величина  не зависит от фактора , принимается  нулевая гипотеза . В противном случае,   зависит от фактора . 
Аналогично определяется зависимость от фактора , нулевая гипотеза  
При решении задачи будем предполагать, что выполняются следующие условия:
наблюдения при различных сочетаниях уровней факторов независимы и 
при всех сочетаниях уровней факторов случайная величина  нормально распределена с одной и той же дисперсией .
Изменчивость наблюдаемых факторов при переходе от одной клетки таблицы к другой может быть обусловлена как изменением уровней факторов, так и случайными неконтролируемыми факторами. 
Изменчивость, вызванная случайными неконтролируемыми факторами, называется остаточной.
Вычислим общую среднюю результатов измерений по формуле
.
Эту величину можно представить в другой форме, использующей групповые средние  и :
, .
Точка  в индексе величины  означает, что суммирование ведется по i-й строке, а точка в индексе величины  означает, что суммирование ведется по j-му столбцу.
В этих обозначениях средняя результатов измерений вычисляется по формуле
 или .
Средняя изменчивость, вызванная фактором , вычисляется по формуле 
.
Аналогично для изменчивости, вызванной фактором : 
.
Для характеристики изменчивости, обусловленной случайными факторами, вычисляем
.
Общую изменчивость величины  характеризуют величиной 
.
Доказано, что .
Проверка гипотезы  основывается на сравнении величин  и  .
Если гипотеза  верна, то величина  имеет распределение Фишера со степенями свободы  и .
Зададимся уровнем значимости  и найдем правостороннюю критическую точку  — решение уравнения .
Если  значение , вычисленное по результатам измерений удовлетворяет неравенству , то гипотеза  принимается. 
В противном случае – отвергается и можно заключить, что изменение фактора  влияет на изменение величины .
Мерой этого влияния является коэффициент детерминации , который показывает, какая доля общей изменчивости величины обусловлена увеличением фактора .
Аналогично проверяется гипотеза  основывается на сравнении величин  и  . 
Если гипотеза  верна, то величина   имеет распределение Фишера со степенями свободы  и .
При уровне значимости  правосторонняя критическая точка  — решение уравнения .
Если  значение , вычисленное по результатам измерений удовлетворяет неравенству ,
то гипотеза  принимается. 
В противном случае гипотеза  отвергается и можно заключить, что изменение фактора   влияет на изменение величины .
Мерой этого влияния является коэффициент детерминации , который показывает, какая доля общей изменчивости величины обусловлена увеличением фактора .
В рамках двухфакторного дисперсионного анализа можно получить более конкретное представление о случайной величине .
Ее модель на -м уровне фактора A и на j-м уровне фактора  B имеет вид
, ,  ,
Где a  —  генеральное среднее случайной величины , 
 — слагаемое, которое описывает эффект влияния фактора A на случайную величину  на  i-м уровне фактора A,
 — слагаемое, которое описывает эффект влияния фактора B на случайную величину  на  j-м уровне фактора  B,
 — слагаемое, которое описывает эффект влияния случайных факторов.
Величины  — независимые случайные величины, имеющие одинаковое нормальное распределение .
Если гипотезы  и  не отвергаются, то в рассмотренной модели  параметры
 и .
Величина  является оценкой параметра , а величина  — несмещенная оценка параметра .
Если гипотезы  и  отвергаются, то: оценка параметра a равна , оценка параметра  равна ,  оценка параметра  равна , 
а величина  служит несмещенной оценкой параметра .
7

4.Трехфакторный дисперсионный анализ. План «Латинский квадрат»

Рассмотренную схему проведения дисперсионного анализа можно применять и

для большего числа факторов. Однако с ростом числа факторов резко повышается тре-

буемый объём измерений случайной величины. В связи с этим иногда отказываются от

полного факторного плана и применяют тот план эксперимента, который позволяет со-

кратить число измерений. Рассмотрим одним из таких планов – план «латинский квад-

рат», применяемый в трёхфакторноманализе.

Имеется случайная величина X, на которую, возможно, влияют три фактора A, B и

C. Пусть каждый фактор имеет n уровней. Тогда для реализации полного факторного

плана потребуется неменее чемn3

измерений. Идея плана «латинский квадрат» состоит в

следующем. Измерения делаются по такой схеме, в которой каждая пара уровней раз личных факторов встречается только один раз.

     Рассмотрим трехфакторный дисперсионный анализ при одинаковом числе уровней n для каждого фактора. Полный перебор сочетания уровней факторов требует N опытов:

N=n3

Число опытов значимо сократить, если воспользоваться ДФЭ по схеме латинского квадрата, введенного впервые Фишером. Латинский квадрат n×n – это квадратная таблица, составленная из n элементов (чисел или букв) таким образом, что каждый элемент повтряется в каждой строке и каждом столбце только один раз. Из трех элементов образуется латинский квадрат 3×3:

ABCBCACAB

Из четырех элементов – латинский квадрат 4×4:

ABCDBCDACDABDABC

Стандартными или каноническими латинскими квадратами называют такие квадраты, у которых первая строка и первый столбец построены в алфавитном порядке (элементы квадрата – буквы) или в порядке натурального ряда (элементы квадрат – числа). Построены эти квадраты путем одношаговой циклической перестановки: вторая строка строится перестановкой в конец строки первого элемента первой строки, третья строка – перестановкой в конец первого элемента второй строки и т.д. Одношаговая циклическая перестановка – это наиболее простой способ построения латинского квадрата. В общем случае n×n латинский квадрат может быть построен при n-1 одношаговых циклических перестановках. Число ла

тинских квадратов зависит от размера квадрата и для n>3 оно достаточно велико. Так, имеется 576 латинских квадратов 4×4, 161280 латинских квадратов 5×5.

К планированию эксперимента по схеме латинского квадрата прибегают при исследовании влияния на процесс трех факторов А, В и С. При этом факторы могут быть связаны с самим исследованием. а в качестве фактора С рассматривается неоднородный материал. Все три фактора имеют одинаковое число уровней (ai, bi, ci).

Латинский квадрат является частью плана – по схеме латинского квадрата введен в планирование третий фактор С. Однако весь этот план принято называть латинским квадратом. В латинском квадрате каждый элемент повторяется только один раз в каждой строке и в каждом столбце. поэтому каковы бы ни были нарушающие свойства элемента квадрата, они в равной степени скажутся при подсчете средних по столбцам и по строкам.

Результаты наблюдений, полученного по полному факторному эксперименту, можно представить в виде следующей модели:

yijq=μ+αi+βj+γq+αiβj+αiγq+βjγq+αiβjγq+εijq (1.83)

В модель помимо линейных эффектов входят три эффекта парного и один тройной эффект взаимодействия. Сокращение числа опытов в дробной реплике приводит к тому, что линейные эффекты оказываются смешанными с эффектами взаимодействия:

- эффект А с ВС взаимодействием;

- эффект В с АС взаимодействием;

- эффект С с АВ взаимодействием. 

При применении латинского квадрата обычно исходят из предложения , что эффекты взаимодействия между факторами незначимы. Тогда результаты эксперимента можно представить в виде линейной модели:

yijq=μ+αi+βj+γq+εijq (1.84)

Таблицы №6.

Латинский квадрат 3×3.




А


В


Итоги


b
1


b
2


b
3


а
1


c
1

y
1


c
2

y
2


c
3

y
3


А
1


а
2


c
2

y
4


c
3

y
5


c
1

y
6


А
2


а
3


c
3

y
7


c
1

y
6


c
2

y
9


А
3


Итоги


В
1


В
2


В
3




В таблице приведен план эксперимента по схеме латинского квадрата 3×3.

Латинский квадрат 3×3 со структурной точки зрения можно рассматривать как 1/3 реплику от полного факторного эксперимента 33. В общем случае латинский квадрат n×n можно рассматривать как реплику 1/n от ПФЭ n3.

При проведении дисперсионного анализа латинского квадрата без повторных опытов удобно использовать следующий алгоритм расчета. Для этого определяют: 1. итоги по срокам Ai, столбцам Bj и латинским буквам Сq. Например, для приведенного в таблице №6 латинского квадрата 3×3 итоги по строкам

A1=y1+y2+y3; A2=y4+y5+y6; A3=y7+y8+y9;

итоги по столбцам:

B1=y1+y4+y7; B2=y2+y5+y8; B3=y3+y6+y9;

итоги по латинским буквам

С1=y1+y6+y8; С2=y2+y4+y9; С3=y3+y5+y7;

2. сумму квадратов всех наблюдений

SS1=i=1nj=1nyij2 (1.85)

3. сумму квадратов итогов по строкам, деленную на число наблюдений в строке,

SS2=1ni=1nAi2 (1.86)



4. сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце,

SS3=1nj=1nВj2 (1.87)

5. сумму квадратов итогов по латинским буквам, деленную на число наблюдений, соответствующей каждой букве

SS4=1nq=1nCq2 (1.88)

6. квадрат общего итоги, деленный на число всех наблюдений (корректирующий член)

SS5=1n2(i=1nAi)2=1n2(j=1nBj)2=1n2(q=1nCq)2 (1.89)

7. сумму квадратов для строки

SSA=SS2-SS5 (1.90)

8. сумму квадратов для столбца

SSВ=SS3-SS5 (1.91)

9. сумму квадратов для латинской буквы

SSС=SS4-SS5 (1.92)

10. общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом

SSобщ=SS1-SS5 (1.93)

11. остаточную сумму квадратов

SSост=SSобщ-SSA-SSB-SSC=SS1-SS5-SS2+SS5-SS3+SS5-SS4+SS5=SS1-SS2-SS3-SS4+2SS5 (1.94)

Остаточная сумма квадратов складывается из дисперсии, обусловленной ошибкой опыта, и дисперсии, обусловленной взаимодействием факторов, если такие имеются;

12. дисперсию sA2

sA2=SSA(n-1) (1.95)

13. дисперсию sВ2

sВ2=SSВ(n-1) (1.96)

14. дисперсию sС2

sС2=SSС(n-1) (1.97)

15. дисперсию sош2

sош2=SSостn-1(n-2) (1.98)

Результаты расчета приведены в таблице дисперсионного анализа

Дисперсионный анализ латинского квадрата (без повторных опытов).


Источник

дисперсии


Число степеней свободы


Сумма 

квадратов


Средний

квадрат


Математическое ожидание среднего квадрата


А


n-1


SSA=SS2-SS5 


sA2=SSA(n-1)


nσA2+σош2


В


n-1


SSВ=SS3-SS5 


sВ2=SSВ(n-1)


nσВ2+σош2


С


n-1


SSС=SS4-SS5


sС2=SSС(n-1)


nσС2+σош2


Остаток (ошибка)


(n-1)(n-2)


SS
ост=SS1-SS2-SS3-SS4+2SS5 


sош2=SSостn-1(n-2) 



σош2


Общая сумма


n
2-1


SSобщ=SS1-SS5 





Значимость линейных эффектов проверяются по критерию Фишера. Если дисперсионное отношение удовлетворяет неравенствам:

sА2sош2<F1-p(f1,f2)

sВ2sош2<F1-pf1,f2

sС2sош2<F1-p(f1,f2) (1.99)

где,

р – уровень значимости;

f1, f2 – число степеней свободы, равные f1=n-1; f2=(n-1)(n-2), принимаются нулевые гипотезы: αi=0; βi=0; γi=0.

Если какое-нибудь дисперсионное отношение оказывается больше табличного, соответствующая нулевая гипотеза отвергается и влияние фактора считается незначимым. Приняв гипотезу о значимости влияния фактора, т.е. гипотезу о значимости различия в средних. обычно выясняют, какие именно средние значимо различаются между собой при помощи критерия Стьюдента или множественного рангового критерия Дункана. Если же согласно условиям задачи один или два фактора являются источниками неоднородностей, влияние которых надо исключить при подсчете главного эффекта (это обеспечивается планированием по схеме латинского квадрата), то средние по источникам неоднородностей не подсчитывается и не проверяется значимость их различия по статистическим критериям.

Планирование эксперимента по латинскому квадрату позволяет ввести в исследование три фактора. Для четырех факторов хорошими свойствами обладает план эксперимента по схеме греко-латинского квадрата. Задача состоит в том, чтобы к трем исследуемым факторам, не имея общего числа опытов n2, добавить четвертый фактор D. Это удается сделать, если найти место такое расположение уровней факторов C и D, при котором в каждой строке и в каждом столбце имеются все nуровней фактора С и все n уровней фактора D и ВТО же время никакие два уровня факторов C и D не встречаются во всей таблице больше одного раза. Расположение такого типа называется латинскими квадратами второго порядка, который получается комбинацией двух ортогональных латинских квадратов.

Рассмотрим следующие два латинских квадрата, составленных соответственно из латинских и греческих букв:



I II

^ ABCDECDEABEABCDBCDEADEABC αβγδεδεαβγβγδεαεαβγδγδεαβ (1.100)

Если наложить эти два квадрата один на другой и составить третий квадрат, каждая клетка которого содержит как латинскую, так и греческую букву соответствующих клеток исходных квадратов, то получим:

^ AαBβCγDδEεCδDεEαAβBγEβAγδBCεDαBεCαDβEγAδDγEδAεBαCβ (1.101) 

В полученном квадрате каждая буква одного квадрата связана один и только один раз с каждой буквой другого квадрата. Такие два латинских квадрата называются ортогональными. Полученный квадрат второго порядка называют также греко-латинским квадратом. Задача о нахождении ортогональных латинских квадратов в комбинированной математике ещё полностью не решена. Доказано существование ортогональных латинских квадратов для n=3, 4, 5, 7, 8 и 9. Известно, что их нет для n=6. Для n=6 поэтому можно построить обычный латинский квадрат и нельзя построить квадрат второго порядка. Латинский квадрат n=10 не исследован. Если имеется k=n-1попарно ортогональных латинских квадратов, то они образуют так называемую полную систему ортогональных латинских квадратов. Показано, что существую полные системы латинских квадратов для n=p (р- простое число) и n=pα (степени простого числа). Полную систему ортогональных латинских квадратов для n=p (р – простое число) можно построить, использую поля Галуа. 

Планирование эксперимента по схеме греко-латинского квадрата применяется для четырех факторов. Число уровней для всех факторов должно быть одинаково. 



Греко-латинский квадрат является частью четырех факторного плана – по схеме греко-латинского квадрата вводят в план эксперимента фактора C и D. Однако принято греко-латинским квадратом называть весь четырехфакторный план.

В греко-латинском квадрате имеется n2 различных комбинаций уровней факторов вместо n4 комбинаций полного четырехфакторного эксперимента. Поэтому греко-латинский квадрат представляет собой 1/n2 реплику от полного факторного эксперимента.

Дисперсионный анализ греко-латинского квадрата проводится также, как и анализ обычного латинского квадрата, с учетом четвертого фактора D (греческая буква). Сумма квадратов для греческой буквы имеет число степеней свободы n-1. Число степеней свободы остаточной суммы. Определяемой, как и ранее, в виде разности между общей суммой квадратов и суммами квадратов всех факторов, равна (n-1)(n-3). Если наложить друг на друга три ортогональных латинских квадрата, получим латинский квадрат третьего порядка, n ортогональных квадратов – латинский квадрат n-го порядка. Полученные квадраты называют также гипер-греко-латинскими квадратами.

При n уровнях в план можно ввести n+1 фактор. Число степеней свободы остаточной суммы при этом будет равно нулю. Такие планы называются насыщенными. 

Основным допущением, лежащим в основе применения греко-латинского квадрата и квадратов высших порядков, является предположение об отсутствии взаимодействия между факторами. Проверить адекватность принятой лишенной модели, как и при применении латинских квадратов, можно только при наличии параллельных опытов.

Список литературы:

1. Кремер Н.Ш. «Теория вероятности и математическая статистика». М.: Юнити – Дана, 2002. - 343с.

2. Гмурман В.Е.  «Теория  вероятностей  и  математическая  статистика». – М.: Высшая школа, 2003. - 523с.

3. Толстова Ю.Н. «Анализ социологических данных. Методология, дескриптивная статистика, изучение связей между номинальными признаками». - Москва : Научный мир. - 2000. С. 154.

4. Гурман В. Е., «Теория вероятностей и математическая статистика». М: Высшее образование.2006. 478с.

5. Лисьев В.П., «Теория вероятностей и математическая статистика»

6. http://tempus2010.usm.md/SPSS10/17.pdf

7. http://cdo.bseu.by/stat1/lab2_1.htm

8. http://mcimeer.narod.ru/data/t6/t6_2.html

1 Кремер Н.Ш. Теория вероятности и математическая статистика. М.: Юнити – Дана, 2002. - 343с.

2 Гмурман В.Е.  Теория  вероятностей  и  математическая  статистика. – М.: Высшая школа, 2003. - 523с.

3 Толстова Ю.Н. Анализ социологических данных. Методология, дескриптивная статистика, изучение связей между номинальными признаками. - Москва : Научный мир. - 2000. С. 154.

4 http://tempus2010.usm.md/SPSS10/17.pdf 

5 В.Е.Гурман, «Теория вероятностей и математическая статистика». М: Высшее образование.2006. 349с.

6 http://cdo.bseu.by/stat1/lab2_1.htm

7 http://mcimeer.narod.ru/data/t6/t6_2.html

PAGE   \* MERGEFORMAT 36




1. Synthetic обеспечивает отличную работу даже в самых тяжёлых условиях эксплуатации
2. реферат дисертації на здобуття наукового ступеня доктора сільськогосподарських наук Київ
3. реферату- Енергетична оцінка важкості праціРозділ- БЖД Енергетична оцінка важкості праці У будьякій труд
4. х классов 14 декабря 2013 года Предмет Класс Груп
5. Они путешествуют чтобы видеть другие страны и континенты чтобы обнаружить различные способы жизни встре
6.  20 г
7. исторической деятельности культуры; наиболее общая характеристика означающая родовую принадлежность жив
8. Введение Расторжение брака отличается от признания брака недействительным тем что при разводе брак пре
9.  Опис типу виробництва та визначення обсягу партії 2
10. Известно что в индустриально развитых странах мира прикладная наука финансируется в основном за счет комме
11. тазчасть телакоторая ограничена тазовыми костямикрестцомкопчиком и связками и содержит в себе конечные
12. Вятский государственный гуманитарный университет ВятГГУ Филиал ВятГГУ в г
13. і Тілге жа~сы немесе жаман норма~а жатады не жатпайды деген сынды ~~ымдарды ~олдану~а болмайды
14. I ОБЩИЕ ПОЛОЖЕНИЯ
15. Выясните у руководства проверяемой организации какова ее политика в отношении задолженности покупателей.html
16. рада божиим зволением и пречистыа его матере приведени быша нуждею писати церкви Печерьскиа во дни благовъ
17. и М2х2; у2- C Уравнения прямой проходящей через точки М13; 2 и М25; 4- B x4y110
18. Тема- СОЦІАЛЬНОПСИХОЛОГІЧНА ХАРАКТЕРИСТИКА СПІЛКУВАННЯ Спілкування як проблема соціальної психолог
19. МЕТОДЫ И СРЕДСТВА ЗАЩИТЫ ОТ ПРОИЗВОДСТВЕННОЙ ВИБРАЦИИ Увеличение скоростных и силовых параметров сов
20. Тема- Преобразование логических выражений