Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

тематической статистики изучающий рациональную организацию измерений подверженных случайным ошибкам

Работа добавлена на сайт samzan.net:


Планирование эксперимента

Планирование эксперимента, раздел математической статистики, изучающий рациональную организацию измерений, подверженных случайным ошибкам. Обычно рассматривается следующая схема П. э. Со случайными ошибками измеряется функция f (q, x), зависящая от неизвестных параметров (вектора q) и от переменных x, которые по выбору экспериментатора могут принимать значения из некоторого допустимого множества X. Целью эксперимента является обычно либо оценка всех или некоторых параметров q или их функций, либо проверка некоторых гипотез о параметрах q. Исходя из цели эксперимента, формулируется критерий оптимальности плана эксперимента. Под планом эксперимента понимается совокупность значений, задаваемых переменным х в эксперименте. Как правило, оценки параметров q ищут по наименьших квадратов методу, а гипотезы о параметрах q проверяют с помощью F-критерия Фишера (см. Дисперсионный анализ) ввиду оптимальных свойств этих методов. В обоих случаях при этом оказывается естественным выбирать в качестве критерия оптимальности плана с заданным числом экспериментов некоторую функцию от дисперсий и коэффициентов корреляции оценок методом наименьших квадратов. Отметим, что в случае, когда f (q, x) линейно зависит от q, оптимальный план часто можно построить до проведения эксперимента, в других случаях уточнение плана эксперимента происходит по ходу эксперимента.

Для иллюстрации рассмотрим определение весов q1, q2, q3 трёх грузов на весах с двумя чашками, если результат m-го эксперимента есть разность веса содержимого второй и первой чашки плюс случайная ошибка åт со средним 0 и дисперсией s2, т. е.

,

если i-й груз был на kim-й чашке в m-м эксперименте, и x = 0, если i-й груз не взвешивался в m-м эксперименте. Взвесив каждый груз отдельно п раз (3n экспериментов), мы оценим его вес по методу наименьших квадратов величиной

с дисперсией s2/n. При n = 8 той же точности мы достигнем после взвешивания по одному разу всех 8 различных комбинаций грузов, в которых каждый из них лежит либо на одной, либо на другой чашке, причём оценка по методу наименьших квадратов даётся формулой

i = 1, 2, 3.

Начало П. э. положили труды английского статистика Р. Фишера (1935), подчеркнувшего, что рациональное П. э. даёт не менее существенный выигрыш в точности оценок, чем оптимальная обработка результатов измерений. Можно выделить следующие направления П. э.

Исторически первое из них, факторное, было связано с агробиологическими применениями дисперсионного анализа, что нашло отражение в сохранившейся терминологии. Здесь функция f (q, х) зависит от вектора х переменных (факторов) с конечным числом возможных значений и характеризует сравнительный эффект значений каждого фактора и комбинаций разных факторов. Алгебраическими и комбинаторными методами были построены интуитивно привлекательные планы, одновременно и сбалансированным образом изучающие влияние по возможности большого числа факторов. Впоследствии было доказано, что построенные планы оптимизируют некоторые естественные характеристики оценок метода наименьших квадратов.

Следующим под влиянием приложений в химии и технике развивалось П. э. по поиску оптимальных условий протекания того или иного процесса. По существу эти методы являются модификацией обычных численных методов поиска экстремума с учётом случайных ошибок измерений.

Специфическими методами обладает планирование отсеивающих экспериментов, в которых нужно выделить те компоненты вектора х, которые сильнее всего влияют на функцию f (s, x), что важно на начальной стадии исследования, когда вектор х имеет большую размерность.

В 60-х гг. 20 в. сложилась современная теория П. э. Её методы тесно связаны с теорией приближения функций и математическим программированием. Построены оптимальные планы и исследованы их свойства для широкого класса моделей. Разработаны также итерационные алгоритмы П. э., дающие во многих случаях удовлетворительное численное решение задачи П. э.

История

Планирование эксперимента возникло в 20-х годах XX века из потребности устранить или хотя бы уменьшить систематические ошибки в сельскохозяйственных исследованиях путем рандомизации условий проведения эксперимента. Процедура планирования оказалась направленной не только на уменьшение дисперсии оцениваемых параметров, но также и на рандомизацию относительно сопутствующих, спонтанно изменяющихся и неконтролируемых переменных. В результате удалось избавится от смещения в оценках.

С 1918 г. Р. Фишер начал свою известную серию работ на Рочемстедской агробиологической станции в Англии. В 1935 году появилась его монография «Design of Experiments», давшая название всему направлению. В 1942 году А. Кишен рассмотрел планирование эксперимента по латинским кубам, которое явилось дальнейшим развитием теории латинских квадратов. Затем Р. Фишер независимо опубликовал сведения об ортогональных гипер-греко-латинских кубах и гипер-кубах. Вскоре после этого в 1946 г. Р. Рао рассмотрел их комбинаторные свойства. Дальнейшему развитию теории латинских квадратов посвящены работы Х. Манна (1947—1950 гг).

Первое глубокое математическое исследование блок-схемы выполнено Р. Боузом в 1939 г. Вначале была разработана теория сбалансированных неполноблочных планов (BIB-схемы). Затем Р. Боуз, К. Нер и Р. Рао обобщили эти планы и разработали теорию частично сбалансированных неполноблочных планов (РBIB-схемы). С тех пор изучению блок-схем уделяется большое внимание как со стороны специалистов по планированию эксперимента (Ф. Йетс, Г. Кокс, В. Кохрен, В. Федерер, К. Гульден, О. Кемптгорн и другие), так и со стороны специалистов по комбинаторному анализу (Боуз, Ф. Шимамото, В. Клатсворси, С. Шрикханде, А. Гофман и др.).

Исследования Р. Фишера знаменуют начало первого этапа развития методов планирования эксперимента. Фишер разработал метод факторного планирования. Йетс предложил для этого метода простую вычислительную схему. Факторное планирование получило широкое распространение. Особенностью факторного эксперимента является необходимость ставить сразу большое число опытов.

В 1945 г. Д. Финни ввел дробные реплики от факторного эксперимента. Это позволило сократить число опытов и открыло дорогу техническим приложениям планирования. Другая возможность сокращения необходимого числа опытов была показана в 1946 г. Р. Плакеттом и Д. Берманом, которые ввели насыщенные факторные планы.

Г. Хотеллинг в 1941 г. предложил находить экстремум по экспериментальным данным с использованием степенных разложений и градиента. Следующим важным этапом было введение принципа последовательного шагового экспериментирования. Этот принцип, высказанный в 1947 г. М. Фридманом и Л. Сэвиджем, позволил распространить на экспериментальное определение экстремума — итерацию.

Чтобы построить современную теорию планирования эксперимента, не хватало одного звена — формализации объекта исследования. Это звено появилось в 1947 г. после создания Н. Винером теории кибернетики. Кибернетическое понятие «черный ящик», играет в планировании важную роль.

В 1951 г. работой американских ученых Дж. Бокса и К. Уилсона начался новый этап развития планирования эксперимента. В ней сформулирована и доведена до практических рекомендаций идея последовательного экспериментального определения оптимальных условий проведения процессов с использованием оценки коэффициентов степенных разложений методом наименьших квадратов, движение по градиенту и отыскание интерполяционного полинома в области экстремума функции отклика (почти стационарной области).

В 1954—1955 гг. Дж. Бокс, а затем П. Юл. показали, что планирование эксперимента можно использовать при исследовании физико-химических процессов, если априори высказаны одна или несколько возможных гипотез. Направление получило развитие в работах Н. П. Клепикова, С. Н. Соколова и В. В. Федорова в ядерной физике.

Третий этап развития теории планирования эксперимента начался в 1957 г., когда Бокс применил свой метод в промышленности. Этот метод стал называться «эволюционным планированием». В 1958 г. Г. Шиффе предложил новый метод планирования эксперимента для изучения физико-химических диаграмм состав — свойство под названием «симплексной решетки».

Развитие теории планирование эксперимента в СССР отражено в работах В. В. Налимова, Ю. П. Адлера, Ю. В. Грановского, Е. В. Марковой, В. Б. Тихомирова.

Постановка задачи

Многие исследования, проводимые в физике, химии и металлургии, сводятся к решению экстремальных задач, направленных на отыскание оптимальных условий протекания процессов или на оптимальный выбор состава многокомпонентных систем. Например, при разработке новых химико-технологических процессов задача исследования часто формулируется так: нужно получить максимально возможный выход реакции, варьируя температуру, давление и соотношение реагентов. В металлургии одной из типичных задач является выбор соотношения легирующих компонент для получения сплава с максимальным значением какой-либо интересующей исследователя характеристики – ударной вязкости, коррозионной устойчивости и пр. С аналогичными многофакторными экстремальными задачами приходится сталкиваться и в технической физике – при получении сверхчистых металлов, изготовлении сложных приборов или при выборе оптимальных условий протекания процессов. Часто такие задачи формулируются как задачи на условный экстремум: нужно найти условия, обеспечивающие максимальный выход продукта при заданном уровне чистоты и пр.

Существуют два различных подхода к решению задач подобного рода. Можно потребовать, чтобы решению экстремальных задач предшествовало всестороннее исследование как механизма процесса, так и свойств вещества. Основываясь на результатах такого исследования, можно создать теорию процесса, с помощью которой будут решаться все экстремальные задачи. Опыт показывает, что подход такого рода сравнительно редко применяется при решении технических задач. Как правило, системы, подлежащие оптимизации, оказываются столь сложными, что не поддаются теоретическому изучению в разумные сроки. В большинстве случаев экстремальные задачи решаются экспериментально, при неполном знании механизма явлений.

Методы эмпирического поиска оптимальных условий протекания процессов долгое время оставались неформализованными.

Экспериментатор выбирал тот или иной путь исследования, базируясь только на своем опыте и интуиции. Лишь совсем недавно, на протяжении последних десяти лет, стала развиваться математическая теория экстремальных экспериментов, позволяющая выбирать оптимальную стратегию исследования при неполном знании процесса. Эффективность нового метода исследований тем выше, чем сложнее изучаемая система. Существенным здесь является также то, что при новом подходе к решению экстремальных задач исследователь получает математическую модель процесса. Эта модель может быть использована при переходе к автоматическому управлению.

На математическом языке задача формулируется следующим образом: нужно получить некоторое представление о функции отклика

η = φ (x1, x2, ..., xk),

где η – параметр процесса, подлежащий оптимизации, x1, x2, ..., xk – независимые переменные, которые можно варьировать при постановке экспериментов.

Назовем переменные x1, x2, ..., xk факторами, а координатное пространство с координатами x1, x2, ..., xkфакторным пространством. Геометрический образ, соответствующий функции отклика, назовем поверхностью отклика.

Будем рассматривать самый общий случай, когда исследование поверхности отклика ведется при неполном знании механизма изучаемых явлений. Естественно считать, что в этом случае аналитическое выражение функции отклика неизвестно. Поэтому приходится ограничиваться представлением её полиномом

с коэффициентами регрессии βo, βi, βij,βii, ... Разложение функции в степенной ряд эквивалентно представлению ее рядом Тейлора:


Пользуясь результатами эксперимента, можно определить только выборочные коэффициенты регрессии bo, bi, bij, bii, которые являются лишь оценками для теоретических коэффициентов регрессии[1] βo, βi, βij,βii,. Уравнение регрессии, полученное на основании опыта, запишется так:

где  – значение выхода, предсказанное уравнением ( – выборочная оценка для η).

Еще Ньютон умел представлять функции степенными рядами, а Гаусс предложил метод наименьших квадратов для оценки коэффициентов регрессии по результатам наблюдений. Но только за последние годы была создана последовательная и достаточно строгая теория регрессионного анализа, базирующаяся на современных теоретико-вероятностных представлениях [194]. Эта теория позволила значительно глубже понять и оценить результаты, получаемые методом наименьших квадратов.

Классический регрессионный анализ базируется на обработке результатов так называемых «пассивных экспериментов». Предполагается, что исследователь ведет наблюдение за некоторым неуправляемым спонтанно изменяющимся процессом (типичная ситуация: астроном – галактика) или ставит эксперименты каким-то произвольным образом, выбирая экспериментальные точки в факторном пространстве, основываясь на интуиции или на каких-либо случайных, привходящих обстоятельствах (удобство экспериментирования в данной ситуации).

Опыт показал, что классический регрессионный анализ, несмотря на хорошо разработанную теорию, не нашел сколько-нибудь широкого применения для решения экстремальных задач в физике, химии и металлургии. При решении подобного рода задач приходится иметь дело с очень большим числом независимых переменных. В этом случае метод становится крайне громоздким. Здесь возникают практически непреодолимые трудности, связанные, с одной стороны, с необходимостью ставить очень большое количество экспериментов, с другой стороны – трудности, связанные с интерпретацией уравнения регрессии (все коэффициенты регрессии оказываются корреляционно связанными между собой).

В самое последнее время специалисты по автоматизации делали попытки вернуться к классическому регрессионному анализу для математического описания сложных химических процессов по результатам пассивного наблюдения за работой действующих цехов. Однако в литературе не появилось публикаций, подтверждающих эффективность такого подхода к математическому моделированию достаточно сложных процессов. Исходя из общетеоретических представлений, легко показать бесперспективность такого подхода к решению экстремальных задач в химии, металлургии и технической физике.

Существенно новые возможности открылись после того, как в регрессионный анализ были привнесены идеи планирования эксперимента. Планирование эксперимента было предложено Р.Фишером в тридцатых годах для решения агробиологических задач. Фишер положил начало новому разделу математической статистики – дисперсионному анализу, позволяющему оценивать вклад, вносимый отдельными факторами в суммарную дисперсию. Позднее, особенно после второй мировой войны, планирование эксперимента стало применяться в химии, технической физике и металлургии для решения широкого круга задач. Дисперсионный и регрессионный анализы, базирующиеся на планировании эксперимента, переплелись весьма сложным образом, и сейчас трудно провести четкую границу между этими разделами математической статистики.

Планирование эксперимента – это новый подход к исследованию, в котором математическим методам отводится активная роль. Основываясь на априорных сведениях об изучаемом процессе, исследователь выбирает некоторую оптимальную стратегию для управления экспериментом. Процесс исследования обычно разбивается на отдельные этапы. После каждого этапа исследователь получает новую информацию, позволяющую ему изменять стратегию исследования.

На математическом языке задача планирования эксперимента формулируется так: на каждом этапе исследования нужно выбрать оптимальное, в некотором смысле, расположение точек в факторном пространстве, для того чтобы получить некоторое представление о поверхности отклика. Выбор критерия оптимальности в значительной степени произволен. Здесь приходится учитывать как постановку задачи экспериментатором, так и ту реальную ситуацию, в которой приходится решать данную задачу. При постановке экстремальных экспериментов естественно на первом этапе исследования задачу формулировать так: нужно найти направление движения к той области, где условия протекания процесса оптимальны. Для решения этой задачи достаточно исследовать поверхность отклика на небольшом участке, ограничиваясь линейным приближением. Иначе формулируется задача после достижения той области, где находится оптимум. Здесь исследователю нужно получить значительно более полное представление о поверхности отклика, аппроксимируя ее полиномами второго, а иногда даже и третьего порядка. Во многих случаях исследования приходится начинать с постановки так называемых отсеивающих экспериментов, цель которых – выделить доминирующие эффекты среди очень большого числа потенциально возможных. Совсем особые требования возникают при постановке экспериментов в производственных условиях; здесь нужно суметь выделить интересующие исследователя эффекты при очень высоком уровне помех, в условиях, когда независимые переменные можно варьировать лишь в узком интервале.

Опыт показывает, что успех нового подхода к решению экстремальных задач в значительной степени зависит от того, насколько хорошо удалось сформулировать критерий оптимальности планирования для решения того или иного класса задач. Формулировка критерия оптимальности всегда должна находиться в хорошем согласии с интуитивными представлениями исследователя. По-видимому, нельзя построить некоторой общей универсальной системы критериев оптимальности.

В настоящее время имеется ряд хорошо сформулированных критериев оптимального планирования для различных ситуаций и для них разработаны алгоритмы, пользуясь которыми исследователь может располагать экспериментальные точки в факторном пространстве и производить обработку результатов наблюдений. Опыт показал, что, пользуясь такими методами, можно находить математическое описание для очень сложных и малоизученных систем. При этом, правда, повышаются требования к технике эксперимента: в ряде случаев возникает необходимость в создании управляемых («пилотных») установок, на которых легко можно реализовать заранее разработанные схемы планирования эксперимента и получать достаточно воспроизводимые результаты.

Основная идея нового метода – возможность оптимального управления экспериментом при неполном знании – родственна тем предпосылкам, на которых базируется кибернетика. Появление кибернетики – науки об управлении, включающей рассмотрение и таких сложных объектов как биологическая система, — стало возможным лишь после того, как было понято, что возможно оптимальное управление при неполном знании.


[1] Здесь имеются в виду те коэффициенты регрессии, которые можно было бы получать для некоторой гипотетической генеральной совокупности, состоящей из всех мыслимых опытов. Согласно существующей традиции параметры генеральной совокупности обозначают греческими буквами, их выборочные оценки – латинскими буквами.




1. Реферат- Тверская область
2. 22 23 Класифікація основ і фундаментів мілкого закладення
3. 00 ~ 8.00 ~ Ранкова зустріч дітей ігри.html
4. ВАРИАНТ 7 Задача 1 Исходные данные для расчетов- Показатель.1
5. Национальный исследовательский Томский политехнический Университет Институт электронного об
6. Первый казахский ученый просветитель - Чокан Валиханов
7. Государственный образовательный стандарт- понятие и значение
8. отношение средневзвешенных цен одного периода к средневзвешенным ценам базового периода
9. КОНТРОЛЬНАЯ РАБОТА ПО ИНФОРМАЦИОННЫМ ТЕХНОЛОГИЯМ В ЮРИДИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ Вариант 2 Выполните следую
10. Курсовая работа- Факторы возникновения непонимания в семейных отношениях
11.  Транспортноэксплуатационные характеристики дорог На условия и безопасность движения в районах проложе
12. РЕФЕРАТ дисертації на здобуття наукового ступеня кандидата юридичних наук Харків ~ Дисерта
13. Статья- Избирательные системы и их виды- мажоритарная, пропорциональная, смешанная
14. Отчет по контрольной работе Предмет- Экономическая информатика Студентки 2 курса заочной форм
15. Тема- 6 Сучасна світова філософія План 1
16. I. Si se le encuentr culpble el cstigo ser~ conden perpetu que en Sud~fric signific un m~nimo de 25 ~os de c~rcel
17. тематичка Аллочка уходила в декрет
18. тема профвідбору так як одержувані абітурієнтом на екзаменах оцінки не можуть бути критерієм профпридатнос
19. Культ давних славянских богов Рода и Рожениц
20. Круговорот веществ и поток энергии в экосистемах