Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
вопрос7. Структурные средние величины. Мода и медиана
Для характеристики структуры статистической совокупности применяются показатели, которые называют структурными средними. К ним относятся мода и медиана.
Мода (Мо) чаще всего встречающийся вариант.
Модой называется значение признака, которое соответствует максимальной точке теоретической кривой распределений.
Мода представляет наиболее часто встречающееся или типичное значение. Мода применяется в коммерческой практике для изучения покупательского спроса и регистрации цен.
В дискретном ряду мода это варианта с наибольшей частотой. В интервальном вариационном ряду модой считают центральный вариант интервала, который имеет наибольшую частоту (частность). В пределах интервала надо найти то значение признака, которое является модой.
где x0 нижняя граница модального интервала;
h величина модального интервала;
fm частота модального интервала;
fm -1 частота интервала, предшествующего модальному;
fm+ 1 частота интервала, следующего за модальным.
Мода зависит от величины групп, от точного положения границ групп.
31б Мода число, которое в действительности встречается чаще всего (является величиной определенной), в практике имеет самое широкое применение (наиболее часто встречающийся тип покупателя).
Медиана (Me) это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая большие.
Медиана это элемент, который больше или равен и одновременно меньше или равен половине остальных элементов ряда распределения.
Свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины.
Применение медианы позволяет получить более точные результаты, чем при использовании других форм средних.
Порядок нахождения медианы в интервальном вариационном ряду следующий: располагаем индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находим медианный интервал:
Медиана делит численность ряда пополам, следовательно, она там, где накопленная частота составляет половину или больше половины всей суммы частот, а предыдущая (накопленная) частота меньше половины численности совокупности.
Вопрос6. Способы выборки.
При составлении выборки можно поступать двумя способами: после того как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В соответствии со сказанным выборки подразделяют на повторные и бесповторные.
Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.
Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.
На практике обычно пользуются бесповторным случайным отбором.
Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной) .
В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.
На практике применяются различные способы отбора. Принципиально эти способы можно подразделить на два вида:
1. Отбор, не требующий расчленения генеральной совокупности на части. Сюда относятся: а) простой случайный бесповторный отбор; б) простой случайный повторный отбор.
2. Отбор, при котором генеральная совокупность разбивается на части. Сюда относятся: а) типический отбор;б) механический отбор; в) серийный отбор.
Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности и после обследования не возвращают (бесповторный отбор) или возвращают ( повторный отбор) в генеральную совокупность.
Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типической» части. Например, если детали изготовляют на нескольких станках, то отбор производят не из всей совокупности деталей, произведенных всеми станками, а из продукции каждого станка в отдельности.
Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях генеральной совокупности. Например, если продукция изготовляется на нескольких машинах, среди которых есть более и менее изношенные, то здесь типический отбор целесообразен.
Механическим называют отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект. Например, если нужно отобрать 20% изготовленных станком деталей, то отбирают каждую пятую деталь; если требуется отобрать 5% деталей, то отбирают каждую двадцатую деталь, и т. д. Следует указать, что иногда механический отбор может не обеспечить репрезентативности выборки.
Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Например, если изделия изготовляются большой группой станков-автоматов, то подвергают сплошному обследованию продукцию только нескольких станков. Серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.
Подчеркнем, что на практике часто применяется комбинированный отбор, при котором сочетаются указанные выше способы.
Вопрос 1.Способы статистического наблюдения
Основанием для регистрации фактов могут служить либо документы, либо высказанное мнение, либо хронометражные данные. В связи с этим различают наблюдение:
непосредственное (сами измеряют),
документально (из документов),
опрос (со слов кого-либо).
В статистике применяются следующие способы сбора информации:
корреспондентский (штат добровольных корреспондентов),
экспедиционный (устный, специально подготовленные работники)
анкетный (в виде анкет),
саморегистрация (заполнение формуляров самими респондентами),
явочный (браки, дети, разводы) и т.д.
Вопрос 2Графическое изображение рядов распределения
Наглядно ряды распределения представляются при помощи графических изображений.
Ряды распределения изображаются в виде:
Полигона
Гистограммы
Кумуляты
Огивы
Полигон
При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) частоты или частости.
Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.Домохозяйства, состоящие из: одного человека двух человек трех человек 5 или более всего
Число домохозяйств в % 19,2 26,2 22,6 20,5 100,0
6.1. Распределение домохозяйств по размеру
Условие: Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача: Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение:
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.Тарифный
разряд Xi Число
работников fi
1 3
2 5
3 4
4 6
5 3
6 4
Итого: 25
Полигон используется для дискретных вариационных рядов.
Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака варианты, а по оси ординат частоты или частости.
Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.
Статистическая таблица
Условие: Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача: Построить интервальный вариационный ряд с равными интервалами.
Решение:
Исходная совокупность состоит из 20 единиц (N = 20).
По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
Вычислим величину равного интервала: i=(152 2) /5 = 30 тыс.руб
Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
Результаты группировки представим в таблице:Размер вкладов
тыс.руб Xi Число вкладов
fi Число вкладов в % к итогу
Wi
2 32 11 55
32 62 4 20
62 92 2 10
92 122 1 5
122 152 2 10
Итого: 20 100
При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.
Гистограмма
Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).
На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.Все население В том числе в возрасте
до 10 10-20 20-30 30-40 40-50 50-60 60-70 70 и старше Всего
Численность населения 12,1 15,7 13,6 16,1 15,3 10,1 9,8 7,3 100,0
Рис. 6.2. Распределение населения России по возрастным группам
Условие: Приводится распределение 30 работников фирмы по размеру месячной заработной платыРазмер заработной платы
руб. в месяц Численность работников
чел.
до 5000 4
5000 7000 12
7000 10000 8
10000 15000 6
Итого: 30
Задача: Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение:
Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 2000 = 3000 руб.
Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
Эти отрезки служат нижним основанием, а соответствующая частота (частость) высотой образуемых прямоугольников.
Построим гистограмму:
Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.
Кумулята
Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.
Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат накопленные частоты или частости (рис. 6.3).
Рис. 6.3. Кумулята распределения домохозяйств по размеру
4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.Размер заработной платы
руб в месяц Xi Численность работников
чел. fi Накопленные частоты
S
до 5000 4 4
5000 7000 12 16
7000 10000 8 24
10000 15000 6 30
Итого: 30 -
При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:
Огива
Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака на оси ординат.
Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат накопленные значения доли (в процентах) по объему признака.
Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.
6.4. Кривая концентрации
Вопрос 3Нормальный закон распределения (кроме этого названия, в литературе встречаются и такие названия: «кривая ошибок», «вероятностная кривая», «кривая Гаусса», «кривая Лапласа», «колоколообразная кривая») так же широко применим, как и экспоненциальный закон. Нормальное распределение возникает тогда, когда на исследуемую величину действует сумма многих случайных факторов, каждый из которых вносит незначительный вклад в суммарное значение отклонения величины от ее среднего значения. Размах распределения зависит от вызвавшей его системы факторов. Этому закону подчиняется большинство непрерывных случайных величин, зависящих от большого числа факторов: например, изнашивание многих деталей под действием сил трения, отклонения в размерах деталей, ошибки измерений, наработка на отказ, рассеивание снарядов, размеры пузырьков газа при флотации и т. п.
Рассмотренные законы распределения времени возникновения отказов в большинстве случаев характеризуют надежность сложной системы лишь на ограниченных участках времени ее работы. Так, например, время возникновения отказов на участке приработки может подчиняться Y-распределению, или закону Вейбулла, на участке нормальной работы экспоненциальному закону, а на участке старения нормальному закону
.вопрос4 Пусть в (статистическом) эксперименте доступна наблюдению случайная величина X, распределение которой неизвестно полностью или частично. Тогда любое утверждение, касающееся называется статистической гипотезой. Гипотезы различают по виду предположений, содержащихся в них:
Статистическая гипотеза, однозначно определяющая распределение , то есть , где какой-то конкретный закон, называется простой.
Статистическая гипотеза, утверждающая принадлежность распределения к некоторому семейству распределений, то есть вида , где семейство распределений, называется сложной.
На практике обычно требуется проверить какую-то конкретную и как правило простую гипотезу H0. Такую гипотезу принято называть нулевой. При этом параллельно рассматривается противоречащая ей гипотеза H1, называемая конкурирующей или альтернативной.
Выдвинутая гипотеза нуждается в проверке, которая осуществляется статистическими методами, поэтому гипотезу называют статистической. Для проверки гипотезы используют критерии, позволяющие принять или опровергнуть гипотезу.
В большинстве случаев статистические критерии основаны на случайной выборке фиксированного объема из распределения . В последовательном анализе выборка формируется в ходе самого эксперимента и потому её объем является случайной величиной (см. Последовательный статистический критерий).
[править]
Пример
Пусть дана независимая выборка из нормального распределения, где μ неизвестный параметр. Тогда , где μ0 фиксированная константа, является простой гипотезой, а конкурирующая с ней сложной.
[править]
Этапы проверки статистических гипотез
Формулировка основной гипотезы H0 и конкурирующей гипотезы H1. Гипотезы должны быть чётко формализованы в математических терминах.
Задание уровня значимости α, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы. Он равен вероятности допустить ошибку первого рода.
Расчёт статистики ϕ критерия такой, что:
её величина зависит от исходной выборки ;
по её значению можно делать выводы об истинности гипотезы H0;
сама статистика ϕ должна подчиняться какому-то известному закону распределения, так как сама ϕ является случайной в силу случайности .
Построение критической области. Из области значений ϕ выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство . Это множество и называется критической областью.
Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику ϕ и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы H0.
[править]
Виды критической области
Выделяют три вида критических областей:
Двусторонняя критическая область определяется двумя интервалами , где находят из условий .
Левосторонняя критическая область определяется интервалом , где xα находят из условия P(ϕ < xα) = α.
Правосторонняя критическая область определяется интервалом , где x1 − α находят из условия P(ϕ < x1 − α) = 1 − α.
Вопрос8Полный факторный эксперимент (ПФЭ) совокупность нескольких измерений, удовлетворяющих следующим условиям:
Количество измерений составляет 2n, где n количество факторов;
Каждый фактор принимает только два значения верхнее и нижнее;
В процессе измерения верхние и нижние значения факторов комбинируются во всех возможных сочетаниях.
Преимуществами полного факторного эксперимента являются
простота решения системы уравнений оценивания параметров;
статистическая избыточность количества измерений, которая уменьшает влияние погрешностей отдельных измерений на оценку параметров.
Планируя эксперимент на первом этапе всегда стремятся получить линейную модель. Для двух факторов модель представляют в виде выражения (4.28). Однако не всегда экспериментатор имеет гарантии, что в выбранных интервалах варьирования процесс описывается линейной моделью. Часто встречающийся вид нелинейности связан с эффектом взаимодействия между факторами. ПФЭ позволяет оценить кроме коэффициентов при линейных эффектах коэффициенты взаимодействия. Для этого перемножают соответствующие столбцы. Тогда уравнение принимает вид
Вопрос 13С ростом количества факторов k число точек плана в ПФЭ растет по показательной функции 2k. Планы ПФЭ позволяют получить несмещенные оценки градиента функции отклика в центральной точке, но в случае применения линейного полинома оказываются недостаточно эффективными по количеству опытов при большом числе независимых переменных, так как остается слишком много степеней свободы на проверку адекватности модели. Например, при k = 5 на проверку адекватности линейной модели остается 26 степеней. Хотя большое количество опытов и приводит к существенному снижению погрешности в оценке коэффициентов, все же такое число степеней свободы для проверки адекватности является чрезмерным.
Таким образом, в случаях, когда используются только линейные приближения функции отклика, количество опытов следует сократить, используя для планирования так называемые регулярные дробные реплики от ПФЭ, содержащие подходящее число опытов и сохраняющие основные свойства матрицы планирования. Реплика, включающая только половину экспериментов ПФЭ, называется полурепликой, включающая четвертую часть опытов четвертьрепликой и т. д. Краткое обозначение указанных дробных реплик 2k 1, 2k2 соответственно.
Построение регулярной дробной реплики или проведение дробного факторного эксперимента (ДФЭ) типа 2kp предусматривает отбор из множества k факторов kp основных, для которых строится план ПФЭ. Этот план дополняется р столбцами, которые соответствуют остальным факторам. Каждый из этих столбцов формируется по специальному правилу, а именно, получается как результат поэлементного умножения не менее двух и не более kp определенных столбцов, соответствующих основным факторам. Иначе говоря, в дробных репликах p линейных эффектов приравнены к эффектам взаимодействия. Но именно такое построение матрицы планирования и позволяет обеспечить ее симметричность, ортогональность и нормированность.
Вопрос21
Применяется везде, где требуется проведение анализа точности и стабильности процесса, наблюдение за качеством продукции, отслеживание существенных показателей производства. Гистограмма - один из инструментов статистического контроля качества. Японский союз ученых и инженеров в 1979 г. включил гистограммы в состав семи методов контроля качества.
Цель метода
Контроль действующего процесса и выявление проблем, подлежащих первоочередному решению.
Суть метода
Один из наиболее распространенных методов, помогающих интерпретировать данные по исследуемой проблеме.
Благодаря графическому представлению имеющейся количественной информации, можно увидеть закономерности, трудно различимые в простой таблице с набором цифр, оценить проблемы и найти пути их решения.
План действий
1. Собрать данные для измеряемых (контролируемых) параметров действующего процесса.
2. Построить гистограмму.
3. Проанализировать гистограмму:
определить тип распределения данных (нормальное, несимметричное, бимодальное и т. д.);
выяснить вариабельность процесса;
при необходимости осуществить анализ нормального распределения с использованием математического аппарата.
4. Ответить на вопрос: "Почему распределение именно такое, и о чем это говорит?"
Особенности метода
Для осмысления качественных характеристик изделий, процессов, производства (статистических данных) и наглядного представления тенденции изменения наблюдаемых значений применяют графическое изображение статистического материала, т. е. строя гистограмму распределения.
Гистограмма - один из вариантов столбиковой диаграммы, позволяющий зрительно оценить распределение статистических данных, сгруппированных по частоте попадания в определенный (заранее заданный) интервал.
Порядок построения гистограммы
Собрать данные, выявить максимальное и минимальное значения и определить диапазон (размах) гистограммы.
Полученный диапазон разделить на интервалы, предварительно определив их число (обычно 5-20 в зависимости от числа показателей) и определить ширину интервала.
Все данные распределить по интервалам в порядке возрастания: левая граница первого интервала должна быть меньше наименьшего из имеющихся значений.
Подсчитать частоту каждого интервала.
Вычислить относительную частоту попадания данных в каждый из интервалов.
По полученным данным построить гистограмму - столбчатую диаграмму, высота столбиков которой соответствует частоте или относительной частоте попадания данных в каждый из интервалов:
наносится горизонтальная ось, выбирается масштаб и откладываются соответствующие интервалы;
затем строится вертикальная ось, на которой также выбирается масштаб в соответствии с максимальным значением частот.
Гистограмма (нормальное распределение)
Дополнительная информация:
Структуру вариаций легче увидеть, когда данные представлены графически в виде гистограммы.
Прежде чем сделать выводы по результатам анализа гистограмм, убедитесь, что данные представительны для существующих условий процесса.
Не делайте выводов, основанных на малых выборках. Чем больше объем выборки, тем больше уверенность в том, что три важных параметра гистограммы - ее центр, ширина и форма - представительны для всего процесса или группы продукции.
Для каждой структуры вариаций (типа распределения) существуют свои интерпретации.
Интерпретация гистограммы - это всего лишь теория, которая должна быть подтверждена дополнительным анализом и прямыми наблюдениями за анализируемым процессом.
Достоинства метода
Наглядность, простота освоения и применения.
Управление с помощью фактов, а не мнений.
Позволяет лучше понять вариабельность, присущую процессу, глубже взглянуть на проблему и облегчить нахождение путей ее решения.
Недостатки метода
Интерпретация гистограммы, построенная по малым выборкам, не позволяет сделать правильные выводы.
Ожидаемый результат
Собранные данные служат источником информации в процессе анализа с использованием различных статистических методов и выработке мер по улучшению качества процессов
рандамизация
Чтобы исключить влияние систематических ошибок, вызванных внешними условиями (переменой температуры, сырья, лаборанта и т. д.), рекомендуется случайная последовательность при постановке опытов, запланированных матрицей. Опыты необходимо рандомизировать во времени. Термин «рандомизация» происходит от английского слова random случайный
. 7. ПРОВЕРКА АДЕКВАТНОСТИ УРАВНЕНИЯ
Корреляционное отношение служит только оценкой тесноты корреляционной зависимости и никак не связано с ее формой. Проверка того, хорошо ли согласуется подобранная теоретическая линия регрессии с экспериментальными данными, называется проверкой адекватности уравнения регрессии.
Уравнение регрессии считается адекватным, если расхождение между эмпирической и теоретической линиями регрессии можно объяснить ошибками в определении условных средних, вызванных разбросом (дисперсией) случайных результатов эксперимента.
Для проверки адекватности условия используется критерий Фишера:
где остаточная дисперсия;
число коэффициентов в уравнении регрессии;
ордината линии регрессии в точке xi;
дисперсия воспроизводимости средних, равная исправленной внутренней дисперсии, деленной на число экспериментов m, по которым вычислялись условные средние :
Величина Fэмп имеет распределение Фишера с числами степеней свободы (n число задаваемых экспериментатором значений величины X, m число проводимых опытов, l число коэффициентов в уравнении регрессии).
По заданному уровню значимости a = 0,05 и числам степеней свободы из таблицы критических точек распределения Фишера находим Fкрит.
Если Fэмп < Fкрит, уравнение регрессии адекватно.
Если Fэмп > Fкрит, расхождение между теоретической и эмпирической линиями регрессии значимо, уравнение неадекватно, следует взять многочлен более высокого порядка.
Вопрос 28 Теперь наша цель состоит в том, чтобы для каждого фактора выбрать два уровня, на которых он будет варьироваться в эксперименте.
Интервалом варьирования факторов называется некоторое число (свое для каждого фактора), прибавление которого к основному уровню дает верхний, а вычитание нижний уровни фактора. Другими словами, интервал варьирования это расстояние на координатной оси между основным и верхним (или нижним) уровнем. Таким образом, задача выбора уровней сводится к более простой задаче выбора интервала варьирования.
Заметим еще, что для упрощения записи условий эксперимента и обработки экспериментальных данных масштабы по осям выбираются так, чтобы верхний уровень соответствовал +1, нижний 1, а основной нулю. Для факторов с непрерывной областью определения это всегда можно сделать с помощью преобразования
,
где
кодированное значение фактора;
натуральное значение фактора;
натуральное значение основного уровня;
интервал варьирования;
номер фактора.
Для качественных факторов, имеющих два уровня, один уровень обозначается +1, а другой 1; порядок уровней не имеет значения.
На выбор интервалов варьирования накладываются естественные ограничения сверху и снизу. Интервал варьирования не может быть меньше той ошибки, с которой экспериментатор фиксирует уровень фактора. Иначе верхний и нижний уровни окажутся неразличимыми. С другой стороны, интервал не может быть настолько большим, чтобы верхний или нижний уровни оказались за пределами области определения. Внутри этих ограничений обычно еще остается значительная неопределенность выбора, которая устраняется с помощью интуитивных решений.
Обратите внимание, что при решении задачи оптимизации мы стремимся выбрать для первой серии экспериментов такую подобласть, которая давала бы возможность для шагового движения к оптимуму. В задачах же интерполяции интервал варьирования охватывает всю описываемую область.
Выбор интервалов варьирования задача трудная, так как она связана с неформализованным этапом планирования эксперимента. Возникает вопрос, какая априорная информация может быть полезна на данном этапе? Это сведения о точности, с которой экспериментатор фиксирует значения факторов, о кривизне поверхности отклика и о диапазоне изменения параметра оптимизации. Обычно эта информация является ориентировочной (в некоторых случаях она может оказаться просто ошибочной), но это единственная разумная основа, на которой можно начинать планировать эксперимент. В ходе эксперимента ее часто приходится корректировать.
Точность фиксирования факторов определяется точностью приборов и стабильностью уровня в ходе опыта. Для упрощения схемы принятия решений мы введем приближенную классификацию, полагая, что есть низкая, средняя и высокая точности. Можно, например, считать, что поддержание температуры в реакторе с погрешностью не более 1% соответствует высокой, не более 5% средней, а более 10% низкой точности.
Источником сведений о кривизне поверхности отклика могут служить уже упоминавшиеся графики однофакторных зависимостей, а также теоретические соображения. Из графиков сведения о кривизне можно получить визуально. Некоторое представление о кривизне дает анализ табличных данных, так как наличию кривизны соответствует непропорциональное изменение параметра оптимизации при равномерном изменении фактора. Мы будем различать три случая: функция отклика линейна, функция отклика существенно нелинейна и информация о кривизне отсутствует.
Наконец, полезно знать, в каких диапазонах меняются значения параметра оптимизации в разных точках факторного пространства. Если имеются результаты некоторого множества опытов, то всегда можно найти наибольшее или наименьшее значения параметра оптимизации. Разность менаду этими значениями будем называть диапазоном изменения параметра оптимизации для данного множества опытов. Условимся различать широкий и узкий диапазоны. Диапазон будет узким, если он не существенно отличается от разброса значений параметра оптимизации в повторных опытах (этот разброс определяет ошибку опыта). В противном случае будем считать диапазон широким. Учтем также случай, когда информация отсутствует. Итак, для принятия решений используется априорная информация о точности фиксирования факторов, кривизне поверхности отклика и диапазоне изменения параметра оптимизации. Каждое сочетание градаций перечисленных признаков определяет ситуацию, в которой нужно принимать решение. При принятых градациях возможно З3 = 27 различных ситуаций. Они представлены на рис. 3, 4, 5 в виде кружочков, цифры в которых соответствуют порядковым номерам ситуаций.
Теперь мы приблизились к принятию решения о выборе интервалов варьирования. Для интервалов также введем градацию. Будем рассматривать широкий, средний и узкий интервалы варьирования, а также случай, когда трудно принять однозначное решение. Размер интервала варьирования составляет некоторую долю от области определения фактора. Можно, например, условиться о следующем: если интервал составляет не более 10% от области определения, считать его узким, не более 30% средним, и в остальных случаях широким. Это, конечно, весьма условно, и в каждой конкретной задаче приходится специально определять эти понятия, которые зависят не только от размера области определения, но и от характера поверхности отклика и от точности фиксирования факторов.
Перейдем к рассмотрению блок-схем принятия решений. На первой схеме (рис. 3) представлены девять ситуаций, имеющих место при низкой точности фиксирования факторов. При выборе решений учитываются информация о кривизне поверхности отклика и о диапазоне изменения параметра оптимизации. Типичное решение широкий интервал варьирования, узкий интервал варьирования совершенно не используется, что вполне понятно при низкой точности.
Средний интервал варьирования в этой схеме выбирается дважды, причем в девятой ситуации как редко применяемая альтернатива. Здесь отсутствует информация об обоих признаках и выбор широкого интервала представляется более естественным.
Наибольшие трудности возникают, когда поверхность отклика нелинейна. Появляется противоречие между низкой точностью фиксирования факторов и кривизной. Первая требует расширения интервала, а вторая сужения. Решение оказывается неоднозначным. Как поступить? Приходится рассматривать дополнительные рекомендации (см. блок-схему). Прежде всего, нужно выяснить, нельзя ли увеличить точность эксперимента либо за счет инженерных решений, либо за счет увеличения числа повторных опытов. Если это возможно, то решения принимаются на основе блок-схемы (рис. 4) для средней точности фиксирования факторов. Если это невозможно, то для принятия решения нет достаточных оснований и оно становится интуитивным.
Эта блок-схема, как и последующие, служит весьма грубым приближением к действительности. На практике учитывается ещё масса обстоятельств. Например, решения, принимаемые по каждому фактору в отдельности, корректируются при рассмотрении совокупности факторов.
Вопросс30 Теория предполагает, что эксперимент может быть пассивным и активным.
При пассивном эксперименте информация об исследуемом объекте накапливается путем пассивного наблюдения, то есть информацию получают в условиях обычного функционирования объекта. Активный эксперимент проводится с применением искусственного воздействия на объект по специальной программе.
При пассивном эксперименте существуют только факторы в виде входных контролируемых, но неуправляемых переменных, и экспериментатор находится в положении пассивного наблюдателя. Задача планирования в этом случае сводится к оптимальной организации сбора информации и решению таких вопросов, как выбор количества и частоты измерений, выбор метода обработки результатов измерений.
Наиболее часто целью пассивного эксперимента является построение математической модели объекта, которая может рассматриваться либо как хорошо, либо как плохо организованный объект. В хорошо организованном объекте имеют место определенные процессы, в которых взаимосвязи входных и выходных параметров устанавливаются в виде детерминированных функций. Поэтому такие объекты называют детерминированными. Плохо организованные или диффузные объекты представляют собой статистические модели. Методы исследования с использованием таких моделей не требуют детального изучения механизма процессов и явлений, протекающих в объекте.
Примером пассивного эксперимента может быть анализ работы схемы, которая не имеет входов, только выходы, и повлиять на ее работу невозможно.
Хорошим примером пассивного эксперимента с диффузным объектом являются измерения метеорологических параметров (температуры, скорости ветра и т.д.) при природных катаклизмах.
Активный эксперимент позволяет быстрее и эффективнее решать задачи исследования, но более сложен, требует больших материальных затрат и может помешать нормальному ходу технологического процесса. Иногда отсутствует возможность проведения активного эксперимента (например, при исследовании явлений природы). Тем не менее, учитывая преимущества активного эксперимента, тогда, когда это возможно, предпочтение отдают ему.
При активном эксперименте факторы должны быть управляемыми и независимыми.
Активный эксперимент предполагает возможность воздействия на ход процесса и выбора в каждом опыте уровней факторов. При планировании активного эксперимента решается задача рационального выбора факторов, существенно влияющих на объект исследования, и определения соответствующего числа проводимых опытов. Увеличение числа включенных в рассмотрение факторов приводит к резкому возрастанию числа опытов, уменьшение - к существенному увеличению погрешности опыта. Фактор считается заданным только тогда, когда при его выборе указывается его область определения совокупность значений, которые может принимать данный фактор. В эксперименте используется ограниченная часть области определения, задаваемая обычно в виде дискретного множества уровней. Выбранные факторы должны быть однозначно управляемыми и операциональными, то есть поддающимися регулированию с поддержанием на заданном уровне в течение всего опыта при соблюдении последовательности необходимых для этого действий. Должна быть назначена также точность измерения факторов в выбранном диапазоне измерения.
Совокупности факторов должны отвечать требованиям совместимости и независимости. Соблюдение первого требования означает, что все комбинации факторов осуществимы и безопасны, второго - возможность установления фактора на любом уровне независимо от уровней других факторов.