Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

тематической статистики изучающий рациональную организацию измерений подверженных случайным ошибкам

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 4.6.2024

Планирование эксперимента

Планирование эксперимента, раздел математической статистики, изучающий рациональную организацию измерений, подверженных случайным ошибкам. Обычно рассматривается следующая схема П. э. Со случайными ошибками измеряется функция f (q, x), зависящая от неизвестных параметров (вектора q) и от переменных x, которые по выбору экспериментатора могут принимать значения из некоторого допустимого множества X. Целью эксперимента является обычно либо оценка всех или некоторых параметров q или их функций, либо проверка некоторых гипотез о параметрах q. Исходя из цели эксперимента, формулируется критерий оптимальности плана эксперимента. Под планом эксперимента понимается совокупность значений, задаваемых переменным х в эксперименте. Как правило, оценки параметров q ищут по наименьших квадратов методу, а гипотезы о параметрах q проверяют с помощью F-критерия Фишера (см. Дисперсионный анализ) ввиду оптимальных свойств этих методов. В обоих случаях при этом оказывается естественным выбирать в качестве критерия оптимальности плана с заданным числом экспериментов некоторую функцию от дисперсий и коэффициентов корреляции оценок методом наименьших квадратов. Отметим, что в случае, когда f (q, x) линейно зависит от q, оптимальный план часто можно построить до проведения эксперимента, в других случаях уточнение плана эксперимента происходит по ходу эксперимента.

Для иллюстрации рассмотрим определение весов q1, q2, q3 трёх грузов на весах с двумя чашками, если результат m-го эксперимента есть разность веса содержимого второй и первой чашки плюс случайная ошибка åт со средним 0 и дисперсией s2, т. е.

,

если i-й груз был на kim-й чашке в m-м эксперименте, и x = 0, если i-й груз не взвешивался в m-м эксперименте. Взвесив каждый груз отдельно п раз (3n экспериментов), мы оценим его вес по методу наименьших квадратов величиной

с дисперсией s2/n. При n = 8 той же точности мы достигнем после взвешивания по одному разу всех 8 различных комбинаций грузов, в которых каждый из них лежит либо на одной, либо на другой чашке, причём оценка по методу наименьших квадратов даётся формулой

i = 1, 2, 3.

Начало П. э. положили труды английского статистика Р. Фишера (1935), подчеркнувшего, что рациональное П. э. даёт не менее существенный выигрыш в точности оценок, чем оптимальная обработка результатов измерений. Можно выделить следующие направления П. э.

Исторически первое из них, факторное, было связано с агробиологическими применениями дисперсионного анализа, что нашло отражение в сохранившейся терминологии. Здесь функция f (q, х) зависит от вектора х переменных (факторов) с конечным числом возможных значений и характеризует сравнительный эффект значений каждого фактора и комбинаций разных факторов. Алгебраическими и комбинаторными методами были построены интуитивно привлекательные планы, одновременно и сбалансированным образом изучающие влияние по возможности большого числа факторов. Впоследствии было доказано, что построенные планы оптимизируют некоторые естественные характеристики оценок метода наименьших квадратов.

Следующим под влиянием приложений в химии и технике развивалось П. э. по поиску оптимальных условий протекания того или иного процесса. По существу эти методы являются модификацией обычных численных методов поиска экстремума с учётом случайных ошибок измерений.

Специфическими методами обладает планирование отсеивающих экспериментов, в которых нужно выделить те компоненты вектора х, которые сильнее всего влияют на функцию f (s, x), что важно на начальной стадии исследования, когда вектор х имеет большую размерность.

В 60-х гг. 20 в. сложилась современная теория П. э. Её методы тесно связаны с теорией приближения функций и математическим программированием. Построены оптимальные планы и исследованы их свойства для широкого класса моделей. Разработаны также итерационные алгоритмы П. э., дающие во многих случаях удовлетворительное численное решение задачи П. э.

История

Планирование эксперимента возникло в 20-х годах XX века из потребности устранить или хотя бы уменьшить систематические ошибки в сельскохозяйственных исследованиях путем рандомизации условий проведения эксперимента. Процедура планирования оказалась направленной не только на уменьшение дисперсии оцениваемых параметров, но также и на рандомизацию относительно сопутствующих, спонтанно изменяющихся и неконтролируемых переменных. В результате удалось избавится от смещения в оценках.

С 1918 г. Р. Фишер начал свою известную серию работ на Рочемстедской агробиологической станции в Англии. В 1935 году появилась его монография «Design of Experiments», давшая название всему направлению. В 1942 году А. Кишен рассмотрел планирование эксперимента по латинским кубам, которое явилось дальнейшим развитием теории латинских квадратов. Затем Р. Фишер независимо опубликовал сведения об ортогональных гипер-греко-латинских кубах и гипер-кубах. Вскоре после этого в 1946 г. Р. Рао рассмотрел их комбинаторные свойства. Дальнейшему развитию теории латинских квадратов посвящены работы Х. Манна (1947—1950 гг).

Первое глубокое математическое исследование блок-схемы выполнено Р. Боузом в 1939 г. Вначале была разработана теория сбалансированных неполноблочных планов (BIB-схемы). Затем Р. Боуз, К. Нер и Р. Рао обобщили эти планы и разработали теорию частично сбалансированных неполноблочных планов (РBIB-схемы). С тех пор изучению блок-схем уделяется большое внимание как со стороны специалистов по планированию эксперимента (Ф. Йетс, Г. Кокс, В. Кохрен, В. Федерер, К. Гульден, О. Кемптгорн и другие), так и со стороны специалистов по комбинаторному анализу (Боуз, Ф. Шимамото, В. Клатсворси, С. Шрикханде, А. Гофман и др.).

Исследования Р. Фишера знаменуют начало первого этапа развития методов планирования эксперимента. Фишер разработал метод факторного планирования. Йетс предложил для этого метода простую вычислительную схему. Факторное планирование получило широкое распространение. Особенностью факторного эксперимента является необходимость ставить сразу большое число опытов.

В 1945 г. Д. Финни ввел дробные реплики от факторного эксперимента. Это позволило сократить число опытов и открыло дорогу техническим приложениям планирования. Другая возможность сокращения необходимого числа опытов была показана в 1946 г. Р. Плакеттом и Д. Берманом, которые ввели насыщенные факторные планы.

Г. Хотеллинг в 1941 г. предложил находить экстремум по экспериментальным данным с использованием степенных разложений и градиента. Следующим важным этапом было введение принципа последовательного шагового экспериментирования. Этот принцип, высказанный в 1947 г. М. Фридманом и Л. Сэвиджем, позволил распространить на экспериментальное определение экстремума — итерацию.

Чтобы построить современную теорию планирования эксперимента, не хватало одного звена — формализации объекта исследования. Это звено появилось в 1947 г. после создания Н. Винером теории кибернетики. Кибернетическое понятие «черный ящик», играет в планировании важную роль.

В 1951 г. работой американских ученых Дж. Бокса и К. Уилсона начался новый этап развития планирования эксперимента. В ней сформулирована и доведена до практических рекомендаций идея последовательного экспериментального определения оптимальных условий проведения процессов с использованием оценки коэффициентов степенных разложений методом наименьших квадратов, движение по градиенту и отыскание интерполяционного полинома в области экстремума функции отклика (почти стационарной области).

В 1954—1955 гг. Дж. Бокс, а затем П. Юл. показали, что планирование эксперимента можно использовать при исследовании физико-химических процессов, если априори высказаны одна или несколько возможных гипотез. Направление получило развитие в работах Н. П. Клепикова, С. Н. Соколова и В. В. Федорова в ядерной физике.

Третий этап развития теории планирования эксперимента начался в 1957 г., когда Бокс применил свой метод в промышленности. Этот метод стал называться «эволюционным планированием». В 1958 г. Г. Шиффе предложил новый метод планирования эксперимента для изучения физико-химических диаграмм состав — свойство под названием «симплексной решетки».

Развитие теории планирование эксперимента в СССР отражено в работах В. В. Налимова, Ю. П. Адлера, Ю. В. Грановского, Е. В. Марковой, В. Б. Тихомирова.

Введение

Содержательный анализ проблем моделирования, определяемых соотношением между реальным экспериментом, модельным экспериментом и теорией, свидетельствует о постоянном внимании исследователей к поиску возможных стратегий моделирования с учетом особенностей исходной информации. Развитие этих подходов связано с применением ИС и стремительно растущей производительности вычислительных средств.

Формальные процедуры, лежащие в основе функционирования ИС, предполагают широкое использование измерительной информации и методов математического моделирования. Решение прикладных задач анализа и прогноза поведения динамического объекта в ИС ведется статистическими методами с привлечением теории планирования эксперимента. Информация, получаемая от датчиков динамических измерений в процессе нормальной эксплуатации объекта представляет собой данные пассивного эксперимента. Активный эксперимент используется только на этапе тестирования и адаптации ИС. При использовании данных активного эксперимента проблема выбора наилучшего математического описания может быть решена классическими методами планирования. В случае пассивного эксперимента эта проблема требует специальных подходов, учитывающих адекватность описания, дисперсию оценок и вычислительные трудности из-за вырождения информационной матрицы [1-11]. Для обратных задач математической физики в ИС типичными являются ситуации, когда наблюдение реализуется не “в точке”, а “на функционале”, что приводит к задачам с бесконечной областью планирования.

Ниже содержится анализ подходов к планированию измерительного эксперимента и поиску эффективных процедур обработки информации на основе опыта разработки бортовых ИС, функционирующих в реальном масштабе времени.

1. Особенности планирования эксперимента

Возникающие при практическом использовании ИС задачи планирования эксперимента часто выходят за рамки классического подхода и требуют специального обобщения с учетом особенностей рассматриваемых проблем. В реальных измерениях ресурсы могут быть существенно ограничены, а априорная информация недостаточна для несмещенной оценки функции регрессии. В этих условиях приходится считаться не только со случайной ошибкой приближения, но и с систематической ошибкой, вызванной неадекватностью принятой модели. Выбор пространства, в котором ищется оценка, приходится осуществлять совместно с планом эксперимента и методом оценивания.

Понимая под планом эксперимента вероятностную меру на области планирования U с конечным носителем sup = {h U, (h) 0} и обозначая через H1 конечномерное подпространство некоторого пространства H (H1 H), которому принадлежит функция регрессии, будем считать, что по условиям реального эксперимента могут быть использованы только планы из допустимого множества [4-7]

JN := {  JN : card(sup )  n},

где n – число, характеризующее ограниченность ресурсов.

Выбор пространства оценивания H1=H и оператора оценивания S=S обеспечивает при фиксированном плане JN нахождение наилучшего в метрике пространства H приближения к произвольному элементу из H. При этом пространство оценивания H должно обеспечивать построение оценки неизвестного элемента H.

Задача выбора процедуры =(, H1, S) восстановления из H на множестве допустимых процедур является двухкритериальной. В этих условиях поиск оптимальной процедуры * удобно вести на основе решения задачи оптимизации с приоритетом, учитывающим систематическую ошибку.

* = Arg inf B(), (1)

где – вероятностная мера, используемая для осреднения систематической ошибки B(, H1, S)

S – оператор, с помощью которого производится оценка неизвестного элемента H.

Для характеристики случайной ошибки используют функционал (,H1,S) от корреляционного оператора оценки (определитель , след tr или другие критерии), и тогда

(2)

где – множество процедур *, являющихся решением задачи (1).

Задача (2) на множестве процедур

рассматривается в предположении, что носитель плана sup определен однозначно из решения задачи (1), но имеется свобода в выборе весов наблюдений Pj (j = 1, m). Это позволяет минимизировать случайную ошибку при следующих условиях

*(P):=(h,..., h ,P1,...,Pm);

P*=Arg inf [D*(P)],

где P := {P Rm; Pj > 0, j=1,m, };

D*(P)– корреляционный оператор, определяемый как D = (M – информационный оператор).

В прикладных задачах планирования эксперимента важное значение приобретает интерпретация таких свойств как ортогональность и ротатабельность. При равноточных измерениях эти свойства приводят к независимости коэффициентов регрессии (их одинаковой точности), что принципиально в поисковых процедурах Бокса-Уилсона при экстремальном планировании.

2. Выбор оптимальных условий эксперимента

Задача выбора оптимальных условий эксперимента в ИС определяет надежную оценку характеристик динамического объекта и параметров внешней среды и связана с построением нормированного дискретного плана для динамического объекта, развивающегося во времени и пространстве. Пассивная стратегия планирования такого эксперимента характеризуется тем, что объект функционирует в режиме нормальной эксплуатации. ИС на основе анализа ситуации выбирает моменты времени и координаты точек, в которых следует производить измерения. Выполнив серию опытов при некоторых фиксированных значениях исследуемого фактора в различные моменты времени и имея модель системы, можно подсчитать нормированную информационную матрицу [2]

(3)

для дискретного плана эксперимента

(4)

где P – веса наблюдений.

Синтез D-оптимальных планов измерений осуществляется на основе итерационной процедуры с использованием функции

(,)=sup[M-1()M()] (5)

Особым случаем идентификации динамических систем является планирование измерений в частотной области. Управление процессом измерений на основании методов планирования эксперимента позволяет свести задачу к поиску дискретного оптимального плана

(6)

с нормированной информационной матрицей

(7)

где – частота спектрального разложения стационарной случайной функции (входного процесса); P – ординаты непрерывного спектра этой функции; звездочкой (*) помечены комплексно сопряженные частотные характеристики.

При однократных наблюдениях вместо (7) имеем

M()=1/2 [*(i)T(i)+(i)*T(i)] (8)

Выражения (6)-(8) позволяют построить функцию

(,)=sup[M-1()M()], (9)

лежащую в основе алгоритмов синтеза D–оптимальных планов эксперимента.

Интервал, на котором определена вероятностная мера, порожденная нормированной спектральной плотностью, характеризуется выражением

 = [-k, +k] (10)

где [-k, +k] – диапазон частот, определяющий полосу пропускания исследуемого динамического объекта.

Спектр плана в этом случае представляет собой совокупность значений частот, а дисперсии гармоник являются весами.

3. Оптимальная структура моделей

В условиях эксплуатации ИС функционируют в реальном масштабе времени, и значительное усложнение используемых математических моделей приводит к громоздким алгоритмам преобразования измерительной информации, затрудняющим процедуру адаптации на выделенном временном интервале.

Рассмотрим в качестве исходной математической модели зависимость

Y = X + (11)

E() = 0, cov() = 2 I

где X – (N k) – матрица наблюдений регрессоров xj; – вектор-столбец значений неизвестных коэффициентов размерности (k+1); – вектор-столбец значений регрессионной ошибки размерности (k+1); Y – вектор-столбец выходной переменной; E – оператор математического ожидания; I – единичная матрица; N – объем выборки; k – число регрессоров; 2 – дисперсия воспроизводимости.

Точность прогноза модели (11) определяется дисперсией ошибки предсказания. Для (N+1) наблюдения по адекватной модели эта дисперсия равна

(12)

где XN+1,k – вектор-строка размерности (1 k).

Для сопоставления дисперсий моделей с “недобором” и “перебором” регрессионных переменных относительно истинной зависимости выражение (12) преобразуется к виду [10]:

(13)

где k – параметр нецентральности t-распределения с N-k степенями свободы

– выборочная дисперсия переменной xk; – выборочный коэффициент множественной корреляции переменной xk с остальными независимыми переменными x1, ... , xk-1, вычисленный по данным матрицы наблюдений X.

Дисперсия ошибки прогноза с "недобором" и "перебором" будет равна

(14)

(15)

Здесь k – значение коэффициента при k-ой неучтенной переменной xk; xN+1,k – значение (N+1)-го наблюдения k-ой переменной; – регрессия переменной на остальные переменные ; – вектор-столбец коэффициентов размерности (k-1) 1.

На практике приходится избегать переусложнения модели за счет включения дополнительных регрессоров, так как

что следует из сопоставления (12) и (15). При этом равенство дисперсий достигается только при .

Процедура построения оптимальной регрессионной структуры была протестирована при обработке данных физического эксперимента, проведенного во время натурных испытаний ИС на морских судах различного назначения (табл.1)

Выбор наилучшего уравнения поверхности отклика может быть произведен также с использованием базисных функций [3]. В этом случае используют модель вида

где k – k-й коэффициент регрессии; fk(u) – k-ая базисная функция (f1(u) 1); u = (u1, ..., uM)T – вектор факторов пассивного эксперимента; M – число факторов; K – общее число слагаемых. При этом факторы кодированы, а модель наблюдения имеет вид Y =  + .

Табл.1

Характеристики различных способов формирования регрессионной структуры.

Вид

Рассматриваемые критерии

модели

D[YN+1]

Rj

S0

1

0.27

0.85

0.90

0.46 10-2

2

0.38

0.76

0.73

0.58 10-2

3

0.35

0.78

0.80

0.55 10-2

1 – полная адекватная модель; 2 – модель с “недобором”; 3 – модель с “перебором”

S0 – остаточная сумма квадратов

Системный анализ задачи выбора наилучшей полиномиальной регрессии [11] позволяет сформулировать подход к определению степени mopt алгебраического многочлена Pm(c,x), наиболее точно аппроксимирующего заданную экспериментальную зависимость {yn, xn}. Суть его состоит в дополнении классического метода (выбор в качестве mopt величины m, доставляющей минимальное значение сумме квадратов отклонений) описанием способа измерения экспериментального массива {yn}

yn = g(G(xn) + n)

где G(xn) – некоторая функция; n – случайные ошибки (n=1,N).

4. Особенности вычислительной технологии

Вычислительные трудности при реализации алгоритмов обработки измерительной информации пассивного эксперимента связаны с процедурой обращения матрицы XTX системы нормальных уравнений [1,6,7]

(XTX)-1 = XTy (16)

Как показывают результаты вычислений, обусловленность информационной матрицы XTX существенно хуже, чем матрицы X. Если max и min – наибольшее и наименьшее сингулярные числа матрицы X, а и – матрицы XTX, то при небольшом N число может иметь порядок, сравнимый с порядком погрешностей. В результате матрица XTX становится почти вырожденной, тогда как матрица X таким свойством не обладает.

При решении плохообусловленных задач МНК используют методы псевдообращения, обеспечивающие работу вычислительных процедур в условиях вырожденности. Псевдообратная матрица X* существует для любой матрицы X, и для любого вектора

является вектором с минимальной нормой среди всех векторов, минимизирующих сумму квадратов отклонений .

Сравнительный анализ экспериментальных данных с помощью различных подходов обращения матриц позволяет выделить прямой метод Гревилла [1], позволяющий работать непосредственно с матрицей X. Эта матрица лучше обусловлена, чем матрица XTX. В результате существенно повышается устойчивость к погрешностям округления.

В случае использования нелинейных по параметрам моделей возникает проблема оценок коэффициентов регрессии. При некомпактности априорного множества параметров такая оценка может вообще не существовать (не достигается минимум суммы квадратов отклонений).

Алгоритмы минимизации суммы квадратов, основанные на методе Ньютона-Гаусса, сводятся к линейной аппроксимации функции регрессии

Заключение

Планирование измерительного эксперимента в ИС реального времени связано с выбором оптимальных условий измерений, обеспечивающих надежную оценку характеристик динамического объекта и параметров внешней среды и с организацией процедурной компоненты базы знаний ИС и соответствующего алгоритмического и программного обеспечения. Для эффективной реализации измерительного процесса необходима разработка информационной технологии, обеспечивающей оперативный контроль состояния динамического объекта и прогноз его поведения в различных условиях эксплуатации, в том числе и в экстремальных ситуациях. Конкретное наполнение знаниями прикладной области экспертизы определяется структурой измерительного процесса и номенклатурой решаемых задач с учетом поставленных целей и наложенных ограничений




1. воспалительные заболевания у животных и человека.html
2. Задание на курсовую работу и график ее выполнения
3. а совокупность работ по документированию управленческой деятельности учреждений и по организации в них док
4. темалу и весь Белиз
5. ТЕМАТИКА ЛЕКЦИИ МК 5 Ряды
6. Как слово наше отзовется 1
7. І Новікова Відомий просвітительпедагог другої половини XVIII століття Микола Іванович Новіков 17441818 вихо
8. Развитие алгоритмического мышления младших школьников на уроках информатик
9. Что такое цивилизация История возникновения данного понятия
10. на тему- Проектирование системы автоматического регулирования давления топлива Выполнил- Курсант IV
11. Королевская власть опираясь на горожан сломила мощь феодального дворянства и создала крупные в сущности о
12. Экологические проблемы озера Байкал
13. музыка живопись своими средствами както отражают окружающий нас мир пытаясь воссоздать ассоциации перед
14. Н Информационное обеспечение науки государственной планирующей системы
15.  Формулировка проблемы
16. Тематический план Номер и наименование темы Всего часов
17. Институт почетных мировых судей округа Омской судебной палаты
18. Лабораторная работа 2 1 Маршрут обработки зубчатой рейки Вид заготовки ~ поковка
19. исследование социальных объектов отношений процессов направленное на получение новой информации и выявл
20. User environments n operting system is required to control terminl opertions on shred ccess bsis s only one user cn ccess the system t ny moment of time