Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

тема курсовой работы- Математическая модель метода главных компонент

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 24.11.2024

Министерство высшего образования Российской Федерации

Кубанский государственный университет

Кафедра численного анализа

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

к курсовой работе по предмету

статистический анализ в экономике

 

тема курсовой работы:

«Математическая модель метода главных компонент».

  

                                                               Выполнил : студент гр. 42

                                                                                  

                                                                                       

 

                                              Руководитель : доц. каф. численного анализа

                                                                                   

Краснодар

2001

РЕФЕРАТ

Курсовая работа содержит   14 страниц, 1 рисунок,

                                              3 источника, 1 приложение.

МОДЕЛЬ, ГЛАВНАЯ КОМПОНЕНТА, КОРРЕЛЯЦИЯ, СОБСТВЕННЫЙ ВЕКТОР, ХАРАКТЕРНЫЙ ПРИЗНАК.

Целью работы являлось составление программы, реализующей выделение в данном факторном пространстве исходных признаков m главных компонент, или обобщенных признаков. Характерной особенностью пространства главных компонент является его ортогональность.

В результате выполнения курсовой работы была изучена математическая модель процесса поиска главных компонент, а также приемы программной реализации этого метода на языке программирования Turbo Pascal 7.0.

СОДЕРЖАНИЕ

Введение ……………………………………………………….4

  1.  Краткие теоретические сведения…………………………..5

  1.  Описание программной реализации……………………….7

Заключение……………………………………………………..9

Приложение А – Текст программы метода главных компонент………………………………………………………10

ВВЕДЕНИЕ

Из числа методов, позволяющих обобщать значения элементарных признаков, метод главных компонент выделяется простой логической конструкцией и в то же время на его примере становятся понятными общая идея и целевые установки многочисленных методов факторного анализа.

Метод главных компонент дает возможность по mчислу исходных признаков выделить m главных компонент, или обобщенных признаков. Пространство главных компонент ортогонально.

Математическая модель метода главных компонент базируется на логичном допущении, что значения множества взаимосвязанных признаков порождают некоторый общий результат.

  1.  Краткие теоретические сведения

Решение задачи методом главных компонент сводится к поэтапному преобразованию матрицы исходных данных X (рисунок 1.1):

Рисунок 1.1 – Схема математических преобразований

На рисунке обозначено: Xматрица исходных данных размерностью n*m (nчисло объектов наблюдения, mчисло элементарных аналитических признаков); Zматрица центрированных и нормированных значений признаков, элементы матрицы вычисляют по формуле: ; Rматрица парных корреляций: R = (1/n)*Z’*Z.

Если предварительнаястандартизация данных не проводилась, то на данном шаге получают матрицу S = (1/n)*X’*X, элементы матрицы X для расчета будут центрированными величинами.

Опишем дальнейшие шаги вычислений для метода главных компонент и объясним математический смысл полученных результатов.

Λдиагональная матрица собственных (характеристических) чисел.

Множество решений λj находят решением характеристического уравнения |R - λE| = 0. λj – это характеристики вариации, точнее, показатели дисперсии каждой главной компоненты. Суммарное значение Σλj равно сумме дисперсий элементарных признаков Xj. При условии стандартизации исходных данных, эта сумма равна числу элементарных признаков m.

Решив характеристическое уравнение, находят его корни λj. После этого вычисляют собственные векторы матрицы R. Реально это означает решение m систем линейных уравнений для каждого λj при j = 1..m. В общем виде система имеет вид:

(1.1)

Приведенная система объединяет однородные линейные уравнения, и так как число ее уравнений равно числу неизвестных, она имеет бесконечное множество решений. Конкретные значения собственных векторов при этом можно найти, задавая произвольно по крайней мере величину одной компоненты каждого вектора.

Aматрица факторного отображения, ее элементы arjвесовые коэффициенты. Вначале A имеет размерность m*mпо числу элементарных признаков Xj, затем в анализе остается r наиболее значимых компонент, r ≤ m. Вычисляют матрицу A по известным данным матрицы собственных чисел Λ и нормированных собственных векторов V по формуле A = VΛ1/2.

Fматрица значений главных компонент размерностью r*n, F = A-1Z’. Эта матрица в общем виде записывается:

                                                  (1.2)

  1.  Описание программной реализации

Программа для реализации метода главных компонент была написана на языке Turbo Pascal 7.0. Все вычисления выполнены в последовательности, представленной на рисунке 1.1. Обозначения программных переменных и массивов по возможности соответствуют изложенным выше. Программа является в достаточной степени универсальной, т.к. приспособлена для обработки массивов данных любой размерности (их размер ограничен только объемом доступной памяти). Однако в программе не предусмотрен ввод данных с клавиатуры. Размерность массивов задана константами, а массив исходных данных инициализируется также в теле программы. При необходимости ввода других данных можно легко скорректировать исходный текст программы.

Отдельной процедурой в программе описан вывод на экран матрицы m*m. В программе часто приходится проделывать эту операцию, поэтому она оформлена как процедура out.

Первой процедурой является центрирование и нормирование исходных данных. Оно выполняется в соответствии с описанными выше формулами.

Далее запрограммировано нахождение коэффициентов характеристического уравнения для корреляционной матрицы R. Оно производится в соответствии с рекуррентными соотношениями Фаддеева, т.е по следу матриц, производных из R, по формулам:

Ai-1=ABi-2;   Pi-1=1/(m-1)trAi-1;   Bi-1=Ai-1-Pi-1E;  i=1,2..m.   (2.1)

После вычисления рекуррентных соотношений находится характеристический полином:

                Pm(λ)= λm - P1 λm-1 - P2 λm-2 -…- Pm.                      (2.2)

Известно, что при m > 4 (2.2) не имеет общего решения. Однако мы знаем, что это уравнение имеет все вещественные корни, и что их число равно m. Для их нахождения используется итерационный метод Ньютона, поскольку исследуемая функция – полином и нет затруднений в вычислении ее производной. Итерационная формула Ньютона для i-й точки имеет вид:

                        ,                             (2.3)

где jномер итерации.

Далее в соответствии с (1.1) находим собственные векторы матрицы R. Для решения систем уравнений применялся метод Гаусса. Однако предварительно необходимо было исключить одно неизвестное. Для этого переменным umj были присвоены единичные значения, последний столбец перенесен в правую часть с обратным знаком, а последнее уравнение исключено из рассмотрения.

После получения матрицы собственных векторов U было проведено ее нормирование, в результате чего была получена матрица нормированных собственных векторов V.

Затем вычисляется матрица факторного отбражения A в соответствии с правилами умножения матриц.

Далее находится матрица, обратная к A, методом m-кратного пересчета элементов [3,с.358] по рекуррентным формулам:

                          

где kномер итерации, k=1..m. На заключительном этапе A-1 = -A(k).

После нахождения матрицы, обратной A, находим матрицу Fматрицу факторного отображения и выводим ее на экран в транспонированном виде в соответствии с (1.2). На этом расчеты по методу главных компонент завершены.

ЗАКЛЮЧЕНИЕ

В данной курсовой работе была построена математическая модель и программная реализация метода главных компонент. Следует отметить, что в работе не была рассмотрена методика отсева несущественных факторов, и поэтому результирующая модель, выдаваемая программой на экран, содержит число компонент, равное числу исходных элементарных признаков m. К достоинствам разработанной программы можно отнести то, что она может работать с массивами исходных данных достаточно большой размерности.

ЛИТЕРАТУРА

  1.  Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шебер М. Многомерный статистический анализ в экономике: Учеб. Пособие для вузов/Под ред. проф. Тамашевича. – М.: ЮНИТИ-ДАНА, 1999. –598с.
  2.  А. Епанешников, В. Епанешников. Программирование в среде Turbo Pascal 7.0. –3-е изд., стер. –М.: “ДИАЛОГ-МИФИ”, 1997. –288с.
  3.  Жуков Л.А., Стратан И.П. Установившиеся режимы сложных электрических сетей и систем: Методы расчетов. –М.: Энергия, 1979. – 416 с.

ПРИЛОЖЕНИЕ А

Текст программы метода главных компонент

Program gl_komp;

const

 m=3;{число признаков}

 n=4;{число объектов}

type

 matrix=array[1..m,1..m]of real;

var

 x,z:array[1..n,1..m]of real;

 f:array[1..m,1..n]of real;

 a_,b_,_a_,_b_:matrix;{для алгоритма Фаддеева}

 c:array[1..m-1,1..m-1]of real;

 d:array[1..m-1]of real;

 l,r,u,a,a_1,v:matrix;

 p:array[0..m]of real;

 i,j,k,q:integer;

 s,x_,b,_b,w:real;

{-------процедура вывода на экран матрицы m*m----------}

procedure out(t:matrix);

var

 i1,j1:integer;

begin

 for i1:=1 to m do

 begin

   for j1:=1 to m do

     write('  ',t[i1,j1]:3:3,'  ');

   writeln

 end

end;

{===================================================================}

Begin

writeln('ПРОГРАММА РАСЧЕТА ГЛАВНЫХ КОМПОНЕНТ ПО ЗАДАННОМУ РАСПРЕДЕЛЕНИЮ');

writeln;

x[1,1]:=2;x[1,2]:=1.3;x[1,3]:=0.55;x[2,1]:=4;x[2,2]:=1.42;x[2,3]:=5.1

x[3,1]:=1.1;x[3,2]:=5.3;x[3,3]:=0.55;x[4,1]:=2.14;x[4,2]:=5.12;x[4,3]:=1.9;

{------стандартизуем значения признаков-----------}

 for j:=1 to m do

 begin

   {----находим среднее и сигму-----}

   s:=0;x_:=0;

   for i:=1 to n do

     s:=s+x[i,j];

   x_:=s/n;s:=0;

   for i:=1 to n do

     s:=s+(x[i,j]-x_)*(x[i,j]-x_);

   s:=sqrt(s/n);

   {------нормируем-------}

   for i:=1 to n do

     z[i,j]:=(x[i,j]-x_)/s

 end;

 {---------находим матрицу парных корреляций R=(1/n)*Z'*Z----------}

 for j:=1 to m do

   for i:=1 to m do

   begin

     s:=0;

     for k:=1 to n do

       s:=s+z[k,j]*z[k,i];

     r[j,i]:=s/n

   end;

 {-------------выводим матрицу R------------}

 writeln('Матрица парных корреляций R:');

 out(r);

 {-------=====находим собственные числа матрицы R======----------}

 {-----приравниваем R и _a_-------}

 for i:=1 to m do

   for j:= 1 to m do

     _a_[i,j]:=r[i,j];

 p[1]:=3;{т.к на главной диагонали единицы}

 for i:=1 to m do

   for j:=1 to m do

     if i<>j

     then

       _b_[i,j]:=_a_[i,j]

     else

       _b_[i,j]:=-2;

 for q:=2 to m do

 {----вычисляем p[q] и определитель-----}

 begin

   {----вычисляем A[q]----}

   for i:=1 to m do

     for j:=1 to m do

     begin

       s:=0;

       for k:= 1 to m do

         s:=s+r[i,k]*_b_[k,j];

       a_[i,j]:=s

     end;

   {------вычисляем p[q]-------}

   s:=0;

   for i:=1 to m do

     s:=s+a_[i,i];

   p[q]:=s/q;

   {----вычисляем B[q]-----}

   for i:=1 to m do

     for j:=1 to m do

       if i<>j

       then

         b_[i,j]:=a_[i,j]

       else

         b_[i,j]:=a_[i,j]-p[q];

   {----присваиваем предыдущим переменным значения текущих-----}

   for i:= 1 to m do

     for j:=1 to m do

     begin

       _a_[i,j]:=a_[i,j];

       _b_[i,j]:=b_[i,j]

     end

 end;

 {---------===решаем характеристическое уравнение===----------}

 p[0]:=1;

 for i:=1 to m do

   p[i]:=-p[i];

 for i:=1 to m do

   for j:=1 to m do

     l[i,j]:=0;

 {------задаем начальные приближения------}

 for i:=1 to m do

   l[i,i]:=-p[i]/p[i-1];

 {------выполняем итерационный процесс по методу Ньютона--------}

 repeat

   w:=0;

   for i:=1 to m do

   begin

     b:=0;_b:=0;

     {-----вычисляем значение полинома в i-й точке-------}

     for j:=0 to m do

     begin

       s:=1;

       for k:=0 to m-j-1 do

         s:=s*l[i,i];

       b:=b+p[j]*s

     end;

     {------находим максимальную невязку-------}

     if b>w then

       w:=b;

     {------вычисляем значение производной в i-й точке------}

     for j:=0 to m-1 do

     begin

       s:=1;

       for k:=0 to m-j-2 do

         s:=s*l[i,i];

       _b:=_b+(m-j)*p[j]*s

     end;

     {------вносим поправку для i-й точки-------}

     l[i,i]:=l[i,i]-(b/_b)

   end

   {----выходим из процесса при достижении требуемой точности----}

 until w<0.0001;

 {-------выводим собственные числа на экран---------}

 writeln('Собственные числа матрицы R:');

 for i:=1 to m do

   writeln('L[',i,'] := ',l[i,i]:3:3);

 {-----======находим матрицу собственных векторов u======---------}

 {-----последним компонентам придаем единичные значения-----}

 for i:= 1 to m do

   u[m,i]:=1;

 {------==решаем m систем уравнений==------}

 for q:=1 to m do

 begin

   {----заполняем левые части-----}

   for i:=1 to m-1 do

     for j:=1 to m-1 do

       if i=j

       then

         c[i,j]:=1-l[q,q]

       else

         c[i,j]:=r[i,j];

   {----заполняем правые части-----}

   for i:=1 to m-1 do

     d[i]:=-r[i,m]*u[m,i];

   {---------решаем систему методом Гаусса-----------}

   i:=1;

   {-------------прямой ход---------------}

   repeat

     {---нормируем элементы i-й строки---}

     d[i]:=d[i]/c[i,i];

     for j:=m-1 downto i do

       c[i,j]:=c[i,j]/c[i,i];

     {----делаем нули под ведущим элементом----}

     for k:=i+1 to m-1 do

     begin

       d[k]:=d[k]-d[i]*c[k,i];

       for j:=m-1 downto i do

         c[k,j]:=c[k,j]-c[i,j]*c[k,i]

     end;

     i:=i+1

   until i=m;

   {------------обратный ход-------------}

   u[m-1,q]:=d[m-1];

   for i:=m-2 downto 1 do

   begin

     u[i,q]:=d[i];

     for j:=i+1 to m-1 do

       u[i,q]:=u[i,q]-u[j,q]*c[i,j]

   end

 end;

 {------нормируем собственные векторы - находим матрицу v---------}

 for j:=1 to m do

 begin

   s:=0;

   for i:=1 to m do

     s:=s+u[i,j]*u[i,j];

   for i:=1 to m do

     v[i,j]:=u[i,j]/sqrt(s)

 end;

 {--выводим нормированную матрицу собственных векторов на экран---}

 writeln('Матрица нормированных собственных векторов V:');

 out(v);

 {---------находим матрицу факторного отображения a----------}

 for i:=1 to m do

   for j:=1 to m do

   begin

     s:=0;

     for k:=1 to m do

       s:=s+v[i,k]*sqrt(l[k,j]);

     a[i,j]:=s

   end;

 {--------выводим матрицу факторного отображения---------}

 writeln('Матрица факторного отображения A:');

 out(a);

 {===находим матрицу, обратную a, методом m-кратного пересчета===}

 for k:=1 to m do

 {-----цикл пересчета-----}

 begin

   for i:=1 to m do

     for j:=1 to m do

       if (i=k) or (j=k)

       then

         if i=j

         then

           a_1[i,j]:=-1/a[i,j]

         else

           a_1[i,j]:=-a[i,j]/a[k,k]

       else

         a_1[i,j]:=a[i,j]-a[i,k]*a[k,j]/a[k,k];

   for i:=1 to m do

     for j:=1 to m do

       a[i,j]:=a_1[i,j]

 end;

 for i:=1 to m do

   for j:=1 to m do

     a_1[i,j]:=-a[i,j];

 {------===находим матрицу значений главных компонент F===-------}

 for i:=1 to m do

   for j:=1 to n do

   begin

     s:=0;

     for k:=1 to m do

       s:=s+a_1[i,k]*z[j,k];

     f[i,j]:=s

   end;

 {-------выводим матрицу F на экран в транспонированном виде-------}

 writeln('Матрица значений главных компонент F:');

 for i:=1 to n do

   begin

     for j:=1 to m do

       write('  ',f[j,i]:3:3,'  ');

     writeln

   end;

 writeln;

 readln;

End.


X

R(S)

Λ

U

V

A

F

    n1       n2   …     nn

Объекты

       F1

       F2

F =

      …

      Fr




1. Фр новинка 1 шт
2. 850412
3. тема международных отношений в Европе
4. Семья как источник возникновения страхов у детей.html
5. Государственная поддержка молодых семей Ярославской области в приобретении строительстве жилья в 2006 год
6. Реферат- Культура Руси XIV - XVII веков
7. Theme 6- THE MRKETS FOR THE FCTORS OF PRODUCTION 1
8.  Генеральная уборка должна проводиться- А
9. татарским завоеванием и одновременной экспансией со стороны немецких шведских датских венгерских литовс
10. Градостроительная экология
11. Как купить и забронировать тур Вы можете самостоятельно подобрать себе тур воспользовавшись формой по
12. 13 Истоки ближневосточного конфликта Б
13. 1 Охрана земель от воздействия предприятия Территория является невозобновляемым природным ресурсом и и
14. Зоны субдукции и столкновения литосферных плит
15. Годен до Питание и БАДы OL Гейн Болик 6000 банка 4000г шоколад
16. 14 14 10 Генетика
17. НА ТЕМУ- СОНЯЧНІ І МІСЯЧНІ ЗАТЕМНЕННЯ
18. Социальная работа 1 сессия 20
19. Введение Методы определения концентрации Неравновесные носители заряда
20. Афанасий Афанасьевич Фет родился в усадьбе Новоселки Мценского уезда в ноябре 1820 года