Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

Подписываем
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Предоплата всего
Подписываем
Образцы решения контрольной работы
Пример 1. По семи предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн. руб) от объема капиталовложений (X, млн руб).
Y |
64 |
56 |
52 |
48 |
50 |
46 |
38 |
X |
64 |
68 |
82 |
76 |
84 |
96 |
100 |
Требуется:
3. Составить свободную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
4. Рассчитать прогнозные значения результативного признака по лучшей модели, если объем капиталовложений составит 89,573 млн руб.
5. Результаты расчетов отобразить на графике.
Р е ш е н и е. 1. Построение линейной модели парной регрессии.
Определим линейный коэффициент парной корреляции по следующей формуле
.
Можно сказать, что связь между объемом капиталовложений X и объемом выпуска продукции Y обратная, достаточно сильная связь.
Уравнение линейной регрессии имеет вид: .
Значение параметров a и b линейной модели определим, используя данные таблицы 1.
i |
y |
x |
y × x |
x × x |
|||||||
1 |
64 |
64 |
4096 |
4096 |
13,43 |
180,36 |
-17,4 |
303,8 |
60,2 |
3,84 |
6,000 |
2 |
56 |
68 |
3808 |
4624 |
5,43 |
29,485 |
-13.4 |
180,36 |
58,0 |
-1,96 |
-3,500 |
3 |
52 |
82 |
4264 |
6724 |
1,43 |
2,0449 |
0,57 |
0,3249 |
50,3 |
1,74 |
3,346 |
4 |
48 |
76 |
3648 |
5776 |
-2,57 |
6,6049 |
-5,43 |
29,485 |
53,6 |
-5,56 |
-11,583 |
5 |
50 |
84 |
4200 |
7056 |
-0,57 |
0,3249 |
2,57 |
6,6049 |
49,2 |
0,84 |
1,680 |
6 |
46 |
96 |
4416 |
9216 |
-4,57 |
20,885 |
14,57 |
212,28 |
42,6 |
3,44 |
7,478 |
7 |
38 |
100 |
3800 |
10000 |
-12,6 |
158,0 |
18,57 |
344,84 |
40,4 |
-2,36 |
-6,211 |
Итого среднее значение дисперсии |
354 50.57 56.8 |
570 81.43 154.0 |
28232 4033.14 |
47.492 6784.57 |
0.01 |
397.71 |
1077 |
-0.02 |
39.798 5.685 |
Таблица 1
Уравнение линейной регрессии имеет вид:
С увеличением объема капиталовложений на 1 млн руб. объем выпускаемой продукции уменьшится в среднем на 550 тыс. руб. Это свидетельствует о неэффективности работы предприятий и необходимо принять меры для выяснения причин и устранения этого недостатка.
Рассчитаем коэффициент детерминации: R2 = r2Y X = 0,822.
Вариации результата Y (объема выпуска продукции) на 82,2% объясняется вариацией фактора X (объемом капиталовложений).
Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера
.
F < Fтабл = 6,61 для α=0,05; .
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F < Fтабл.
Определим среднюю относительную ошибку:
.
В среднем расчетные значения для линейной модели отличаются от фактических значений на 5,585%..
2. Построение степенной модели парной регрессии
Уравнение степенной модели имеет вид:
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
Таблица 2
Y(t) |
Lg(Y) |
X(t) |
Lg(x) |
|
1 |
64 |
1.806 |
64 |
1.806 |
2 |
56 |
1.748 |
68 |
1.833 |
3 |
52 |
1.716 |
82 |
1.914 |
4 |
48 |
1.681 |
76 |
1.881 |
5 |
50 |
1.699 |
84 |
1.924 |
6 |
46 |
1.663 |
96 |
1.982 |
7 |
38 |
1.58 |
100 |
2 |
28 |
354 |
11.893 |
570 |
13.340 |
Сред.зн. |
50.5714 |
1.699 |
81.429 |
1.906 |
Обозначим , , .
Тогда уравнение примет вид : линейное уравнение регрессии.
Рассчитаем его параметры, используя данные таблицы 3.
Таблица 3
y |
Y |
x |
X |
YX |
X2 |
Ei |
E2i |
|||
1 |
64 |
1.8062 |
64 |
1.8062 |
3.2623 |
3.2623 |
61.294 |
2.706 |
4.23 |
7.322 |
2 |
56 |
1.7482 |
68 |
1.8325 |
3.2036 |
3.3581 |
58.066 |
-2.066 |
3.69 |
4.270 |
3 |
52 |
1.716 |
82 |
1.9138 |
3.2841 |
3.6627 |
49.133 |
2.867 |
5.51 |
8.220 |
4 |
48 |
1.6812 |
76 |
1.8808 |
3.1621 |
3.5375 |
52.58 |
-4.58 |
9.54 |
20.976 |
5 |
50 |
1.699 |
84 |
1.9243 |
3.2693 |
3.7029 |
48.088 |
1.9120 |
3.82 |
3.657 |
6 |
46 |
1.6628 |
96 |
1.9823 |
3.2960 |
3.9294 |
42.686 |
3.314 |
7.2 |
10.982 |
7 |
38 |
1.5798 |
100 |
2.0000 |
3.1596 |
4.0000 |
41.159 |
-3.159 |
8.31 |
9.98 |
итого |
354 |
11,8931 |
13,3399 |
22,637 |
25,4528 |
0,51 |
42,32 |
65,407 |
Уравнение регрессии будет иметь вид:
Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения.
Получим уравнение степенной модели регрессии
Определим индекс корреляция:
Связь между показателем у и фактором х можно считать достаточно сильной.
Коэффициент детерминации равен 0,836:
R2=ρ2YX=0.9142=0.836
Вариация результата Y (объема выпуска продукции) на 83,6% объясняется вариацией фактора X (объемом капиталовложений).
Рассчитаем F-критерий Фишера
F < Fтабл=6,61 для α=0,05; k1=m=1, k2=n-m-1=5
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F < Fтабл
Определим среднюю относительную ошибку:
В среднем расчетные значения для степенной модели отличаются от фактических значений на 6,04%.
3.Построение показательной функции.
Уравнение показательной модели имеет вид:
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
Обозначим , , .
Тогда уравнение примет вид : линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 4.
Уравнение регрессии будет иметь вид:
Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения:
Определим индекс корреляция:
Связь между показателем у и фактором х можно считать достаточно сильной.
Коэффициент детерминации равен 0,828:
R2=ρ2YX=0.912=0.828
Вариация результата Y (объема выпуска продукции) на 82,8% объясняется вариацией фактора X (объемом капиталовложений).
Таблица 4
y |
Y |
x |
Yx |
x2 |
()2 |
Ei |
|||||||
1 |
64 |
1,8062 |
64 |
115,6 |
4096 |
0,1072 |
0,0115 |
-17,43 |
303,76 |
60,6 |
11,464 |
3,3859 |
5,29 |
2 |
56 |
1,7482 |
68 |
118,88 |
4624 |
0,0492 |
0,0024 |
-13,43 |
180,33 |
58 |
3,9632 |
-1,991 |
3,555 |
3 |
52 |
1,716 |
82 |
140,71 |
6724 |
0,017 |
0,0003 |
0,57 |
0,33 |
49,7 |
5,4221 |
2,3285 |
4,478 |
4 |
48 |
1,6812 |
76 |
127,77 |
5776 |
-0,017 |
0,0003 |
-5,43 |
29,47 |
53,1 |
25,804 |
-5,08 |
10,583 |
5 |
50 |
1,699 |
84 |
142,71 |
7056 |
0,00 |
0,00 |
2,57 |
6,61 |
48,6 |
2,0031 |
1,4153 |
2,831 |
6 |
46 |
1,6628 |
96 |
159,62 |
9216 |
-0,036 |
0,0013 |
14,57 |
212,33 |
42,5 |
11,933 |
3,4544 |
7,509 |
7 |
38 |
1,5798 |
100 |
157,98 |
10000 |
-0,119 |
0,0142 |
18,57 |
344,9 |
40,7 |
7,3132 |
-2,704 |
7,117 |
итого |
354 |
11,8931 |
570 |
963,28 |
4749 |
0,03 |
1077,7 |
67,903 |
0,8093 |
41,363 |
|||
Ср.зн. |
50,57 |
1,699 |
81,4 |
137,61 |
6785 |
5,909 |
Рассчитаем F-критерий Фишера
F < Fтабл=6,61 для α=0,05; k1=m=1, k2=n-m-1=5
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F < Fтабл
Определим среднюю относительную ошибку:
В среднем расчетные значения для показательной модели отличаются от фактических значений на 5,909%.
4.Построение гиперболической функции.
Уравнение степенной модели имеет вид:
Для построения этой модели необходимо произвести линеаризацию переменных путем замены Х=1/х.
В результате получим линейное уравнение
Рассчитаем его параметры по данным таблицы 5.
Уравнение регрессии будет иметь вид:
Определим индекс корреляция:
Связь между показателем у и фактором х можно считать достаточно сильной.
Коэффициент детерминации равен 0,835:
R2=ρ2YX=0.9142=0.835
Вариация результата Y (объема выпуска продукции) на 83,5% объясняется вариацией фактора X (объемом капиталовложений).
Рассчитаем F-критерий Фишера
Таблица 5
y |
x |
X |
yX |
X2 |
()2 |
Ei |
()2 |
||||
1 |
64 |
64 |
0,0156 |
1 |
0,0002441 |
13,43 |
180,33 |
61,5 |
2,489 |
6,1954 |
3,889 |
2 |
56 |
68 |
0,0147 |
0,8235 |
0,0002163 |
5,43 |
29,47 |
58,2 |
-2,228 |
4,9647 |
3,978 |
3 |
52 |
82 |
0,0122 |
0,6341 |
0,0001487 |
1,43 |
2,04 |
49,3 |
2,74 |
7,5089 |
5,27 |
4 |
48 |
76 |
0,0132 |
0,6316 |
0,0001731 |
-2,57 |
6,61 |
52,7 |
-4,699 |
22,078 |
9,789 |
5 |
50 |
84 |
0,0119 |
0,5952 |
0,0001417 |
-0,57 |
0,3265 |
48,2 |
1,777 |
3,1591 |
3,555 |
6 |
46 |
96 |
0,0104 |
0,4792 |
0,0001085 |
-4,57 |
20,9 |
42,9 |
3,093 |
9,5648 |
6,723 |
7 |
38 |
100 |
0,01 |
0,38 |
0,0001 |
12,57 |
158,04 |
41,4 |
-3,419 |
11,69 |
8,997 |
итого |
354 |
0,088 |
4,5437 |
0,0011325 |
397,71 |
354,2 |
-0,246 |
65,159 |
42,202 |
||
Ср.зн. |
50,57 |
0,0126 |
0,6491 |
0,0001618 |
6,029 |
F < Fтабл=6,61 для α=0,05; k1=m=1, k2=n-m-1=5
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F < Fтабл
Определим среднюю относительную ошибку:
В среднем расчетные значения для гиперболической модели отличаются от фактических значений на 6,029%.
Для выбора лучшей модели построим сводную таблицу 6 результатов
Таблица 6
Модель |
Коэффициент детерминации |
Критерий Фишера |
Индекс корреляции |
Средняя относительная ошибка |
Линейная |
0,822 |
23,09 |
0,907 |
5,685 |
Степенная |
0,828 |
24,06 |
0,910 |
6,054 |
Показательная |
0,828 |
24,06 |
0,910 |
5,909 |
гиперболическая |
0,835 |
25,3 |
0,914 |
6,029 |
Все модели примерно одинаковы, но большее значение F-критерия Фишера и большее значение коэффициента детерминации имеет гиперболическая модель. Ее можно взять в качестве лучшей модели для построения прогноза.
Расчет прогнозного значения результативного показателя:
Прогнозное значение результативного признака(объема выпуска продукции) определим по уравнению гиперболической модели, подставив в него планируемую (заданную по условию) величину объема капиталовложений:
Построение парной нелинейной регрессии можно получить при осуществлении расчетов в Excell.
Пример 2. Задача состоит в построении модели для предсказания объема реализации одного из продуктов фирмы.
Объем реализации - это зависимая переменнаяY(млн руб.). В качестве независимых переменных выбраны: время- X1 , расходы на рекламу X2 (тыс. руб.), цена товара X3 (руб.), средняя цена у конкурентов X4 (руб), индекс потребительских расходов X5(%)
Требуется:
1. Осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.
7.Отразить результаты расчетов на графике.
Выполнение задач отразить в аналитической записке, приложить компьютерные распечатки расчетов.
Статистические данные по всем переменным приведены в таблице 7. В этом примере n = 16, m = 5.
Таблица 7
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
126 137 148 191 274 370 432 445 367 367 321 307 331 345 364 384 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
4.0 4.8 3.8 8.7 8.2 9.7 14.7 18.7 19.8 10.6 8.6 6.5 12.6 6.5 5.8 5.7 |
15.0 14.8 15.2 15.5 15.5 16.0 18.1 13.0 15.8 16.9 16.3 16.1 15.4 15.7 16.0 15.1 |
17.0 17.3 16.8 16.2 16.0 18.0 20.2 15.8 18.2 16.8 17.0 18.3 16.4 16.2 17.7 16.2 |
100.0 98.4 101.2 103.5 104.1 107.0 107.4 108.5 108.3 109.2 110.1 110.7 110.3 111.8 112.3 112.9 |
В таблице 8 приведены промежуточные результаты при вычислении коэффициента корреляции
Таблица 8
t |
Y |
X2 |
|||||
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
126 137 148 191 274 370 432 445 367 367 321 307 331 345 364 384 |
4.0 4.8 3.8 8.7 8.2 9.7 14.7 18.7 19.8 10.6 8.6 6.5 12.6 6.5 5.8 5.7 |
-180,813 -169,813 -158,813 -115,813 -32,8125 63,1875 125,1875 138,1875 60,1875 60,1875 14,1875 0,1875 24,1875 38,1875 57,1875 77,1875 |
32693,16 28836,29 25221,41 13412,54 1076,66 3992,66 15671,91 19095,79 3622,535 3622,535 201,2852 0,035156 585,0352 1458,285 3270,41 5957,91 |
-5,29375 -4,49375 -5,49375 -0,59375 -1,09375 0,40625 5,40625 9,40625 10,50625 1,30625 -0,69375 -2,79375 3,30625 -2,79375 -3,49375 -3,59375 |
28,02379 20,19379 30,18129 0,352539 1,196289 0,165039 29,22754 88,47754 110,3813 1,706289 0,481289 7,805039 10,93129 7,805039 12,20629 12,91504 |
957,1762 763,0849 872,4762 68,76367 35,88867 25,66992 676,7949 1299,826 632,3449 78,61992 -9,84258 -0,52383 79,96992 -106,686 -199,799 -277,393 |
4909 |
148,7 |
0 |
158718,4 |
0 |
362,0494 |
4896,381 |
|
Ср.зн. |
306,81 |
9,294 |
0 |
Использование инструмента Корреляция (Анализ данных в Excell).
Для проведения корреляционного анализа выполните следующие действия:
Результат корреляционного анализа
Таблица 9
Объем реализации |
Время |
Реклама |
Цена |
Цена конкурента |
Индекс потреб. расходов |
|
Объем реализации |
1 |
|||||
Время |
0,678 |
1 |
||||
Реклама |
0,646 |
0,106 |
1 |
|||
Цена |
0,233 |
0,174 |
-0,003 |
1 |
||
Цена конкурента |
0,226 |
-0,051 |
0,204 |
0,698 |
1 |
|
Индекс потреб. расходов |
0,816 |
0,960 |
0,273 |
0,235 |
0,03 |
1 |
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем реализации имеет тесную связь с индексом потребительских расходов (ryx5=0.816), с расходами на рекламу (ryx2=0.646) и со временем (ryx1=0.96). Однако факторы Х2 и Х5 тесно связаны между собой (rx1x5=0.96) , что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х5- индекс потребительских расходов. В этом примере n=16, m=5, после исключения незначимых факторов n=16, k=2.
2. Выбор вида модели и оценка параметров.
Оценка параметров регрессии осуществляется по методу наименьших квадратов по формуле
, используя данные приведенные в таблице 10:
Таблица 10
Y |
X0 |
X1 |
X2 |
Объем реализации |
Реклама |
Индекс потреб.расходов |
|
126 137 148 191 274 370 432 445 367 367 321 307 331 345 364 384 |
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 |
4.0 4.8 3.8 8.7 8.2 9.7 14.7 18.7 19.8 10.6 8.6 6.5 12.6 6.5 5.8 5.7 |
100.0 98.4 101.2 103.5 104.1 107.0 107.4 108.5 108.3 109.2 110.1 110.7 110.3 111.8 112.3 112.9 |
Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:
у=-1471,314+9,568х1+15,754х2
Расчетные значения у определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого наблюдения.
Применение инструмента Регрессия(Анализ данных в Excell).
Для проведения регрессионного анализа выполните следующие действия:
Результат регрессионного анализа содержится в следующих таблицах:
Регрессионная статистика
Таблица 11
№ |
Наименования в отчете Excel |
Принятые наименования |
Формула |
1 |
Множественный R |
Коэффициент множественной корреляции, индекс корреляции |
|
2 |
R-квадрат |
Коэффициент детерминации |
|
3 |
Нормированный R-квадрат |
Скорректированный R-квадрат |
|
4 |
Стандартная ошибка |
Стандартная ошибка оценки |
|
5 |
Наблюдения |
Количество наблюдений |
n |
Таблица 12
Регрессионная статистика |
|
Множественный R R-квадрат Нормированный R-квадрат Стандартная ошибка Наблюдения |
0,927 0,859 0,837 41,473 16,000 |
Дисперсионный анализ
Таблица 13
Df- число степеней свободы |
SS- сумма квадратов |
MS |
F-критерий Фишера |
|
Регрессия |
k=2 |
|||
Остаток |
n-k-1=13 |
n−k−1 |
||
Итого |
n-1=15 |
Таблица 14
Дисперсионный анализ |
||||
df |
SS |
MS |
F |
|
Регрессия Остаток Итого |
2 13 15 |
136358,334 22360,104 158718,438 |
68179,167 1720,008 |
39,639 |
Таблица 15
Коэффициенты |
Стандартная ошибка |
t-статистика |
|
Y-пересечение Реклама Индекс потр. расходов |
-1471,31 9,568 15,753 |
259,766 2,266 2,467 |
-5,664 4,223 6,386 |
Во втором столбце данной таблицы содержатся коэффициенты уравнения регрессии а0,а1,а2. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии, а в четвертом- t- статистика, используемая для проверки значимости коэффициентов уравнения регрессии.
Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:
У=-1471,314+9,568х1+15,754х2
В таблице 16 приведены вычисленные по модели значения Y и значения остаточной компоненты.
Таблица 16
Вывод остатка |
||
Наблюдение |
Предсказанное |
Остатки |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
142,25 124,7 159,24 242,35 247,02 307,06 361,20 416,80 424,18 350,32 345,37 334,72 386,79 352,05 353,23 361,73 |
-16,25 12,30 -11,24 -51,35 26,98 62,94 70,80 28,20 -57,18 16,68 -24,37 -27,72 -55,79 -7,05 10,77 22,27 |
Проверку независимости проведем с помощью d критерия Дарбина-Уотсона
В качестве критических табличных уровней при N=16, двух объясняющих факторах при уровне значимости в 5% возьмем величины d1=0.98 и d2=1,54.
Так как расчетное значение попало в интервал от d1 до d2 , то нельзя сделать окончательный вывод по этому критерию. Для определения степени автокорреляции вычислим коэффициент автокорреляции и проверим его значимость при помощи критерия стандартной ошибки. Стандартная ошибка коэффициента автокорреляции рассчитывается так:
Коэффициенты автокорреляции случайных данных обладают выборочным распределением, приближающимся к нормальному с нулевым математическим ожиданием и средним квадратичным отклонением, равным
Если r1 находится в интервале 1,96×0,25≤ r1×1,96≤0,25, то можно считать что данные не показывают наличие автокорреляции первого порядка, т.к. -0,49≤ r1=0,309≤0,49, и свойство независимости выполняется.
Вычислим для модели коэффициент детерминации:
0.859
Он показывает долю вариации результативного признака под действием изучаемых факторов. Следовательно, около 86% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера:
Табличное значение F-критерия при доверительном вероятности 0,95 при V1=k=2 и V2=n-k-1=16-2-1=13 составляет 3,81. Табличное значение критерия можно найти с помощью функции FРАСПОБР.
Поскольку Fрас < Fтабл уравнение регрессии следует признать адекватным.
Значимость коэффициентов уравнения регрессии а0 ,а1 , а2 оценим с использованием t-критерия Стьюдента.
b11=39.2314
b22=0.00299
b33=0.00354
ta0=-1471.314/259.766= -5.664
ta1=9.5684/2.2659=4.223
ta2=15.7529/2.4669=6.3858
Табличное значение t-критерия Стьюдента можно найти с помощью функции СТЬЮДРАСПОБР.
Табличное значение t-критерия при 5% уровне значимости и степенях свободы(16-3-1) составляет 2,16. Так как tрасч< tтабл, то коэффициенты а1, а2 существенны (значимы).
5.Проанализировать влияние факторов на зависимую переменную по модели (для каждого коэффициента регрессии вычислить коэффициент эластичности, β-коэффициент).
Учитывая , что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, используем коэффициент эластичности (Э), β-коэффициент, которые соответственно рассчитываются по формулам:
Э1=9,568×9,294/306,813=0,2898
Э2=15,7529×107,231/306,813=5,506
βi=αi×Sxi:Sy
β1=9,568×4,913/102,865=0,457
β2=15,7529×4,5128/102,865=0,691
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на 1% .
β-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных. Это означает, что при увеличении затрат на рекламу в нашем примере на 4,91 тыс. руб. объем реализации увеличится на 47 тыс. руб. (0,457×102,865).
Прогнозные значения Х1,17, Х2,17 и Х1,18, Х2,18 можно определить с помощью методов экспертных оценок, с помощью средних абсолютных приростов или вычислить на основе экстраполяционных методов.
Пример 3. Пять производственных объектов характеризуются двумя признаками: объемом продаж и среднегодовой стоимостью основных производственных фондов.
Объект |
1 |
2 |
3 |
4 |
5 |
Объем продаж |
1 |
3 |
6 |
13 |
12 |
Среднегодовая стоимость основных производственных фондов |
9 |
10 |
8 |
5 |
7 |
Проведем классификацию этих объектов с помощью принципа «ближайшего соседа». Найдем расстояние между объектами по формуле . Заполним таблицу.
Объекты |
1 |
2 |
3 |
4 |
5 |
1 |
0 |
2,24 |
5,10 |
12,65 |
11,18 |
2 |
0 |
3,61 |
11,18 |
9,49 |
|
3 |
0 |
7,62 |
6,08 |
||
4 |
0 |
2,24 |
|||
5 |
0 |
Поясним, как заполняется таблица.
На пересечении строки «i» и столбца «j» указанно расстояние (результат округляем до двух цифр после запятой). Например, на пересечении строки «1» и столбца «3» указано расстояние , а на пересечении строки «3» и столбца «5» указано расстояние .
Так как , то нижнюю часть таблицы можно не заполнять.
Применим принцип «ближайшего соседа». Находим в таблице наименьшее из расстояний (если таких несколько, то выбираем любое из них). Это .
Пусть . Тогда мы можем объединить в одну группу объекты 4 и 5, то есть в объединенном столбце «4 и 5» будет наименьшее из соответствующих чисел столбцов «4» и «5» первоначальной таблицы расстояний. Аналогично поступаем со строками «4» и «5».
Получим новую таблицу.
Объекты |
1 |
2 |
3 |
4 и 5 |
1 |
0 |
2,24 |
5,10 |
11,18 |
2 |
0 |
3,61 |
9,49 |
|
3 |
0 |
6,08 |
||
4 и 5 |
0 |
Находим в полученной таблице наименьшее из расстояний (если таких несколько, то выбираем любое из них): . Тогда мы можем объединить в одну группу объекты 1 и 2, то есть в объединенном столбце «1 и 2» будет наименьшее из соответствующих чисел столбцов «1» и «2» предыдущей таблицы расстояний. Аналогично поступаем и со строками «1» и «2».
Получим новую таблицу.
Объекты |
1 и 2 |
3 |
4 и 5 |
1 и 2 |
0 |
3,61 |
9,49 |
3 |
0 |
6,08 |
|
4 и 5 |
0 |
Находим в полученной таблице наименьшее из расстояний (если таких несколько, то выбираем любое из них): . Тогда мы можем объединить в одну группу объекты 1, 2, 3, то есть в объединенном столбце «1, 2, 3» будет наименьшее из соответствующих чисел столбцов «1 и 2» и «3» предыдущей таблицы расстояний. Аналогично поступаем и со строками «1 и 2» и «3».
Получим новую таблицу.
Объекты |
1, 2, 3 |
4 и 5 |
1, 2, 3 |
0 |
6,08 |
4 и 5 |
0 |
Мы получили два кластера: (1, 2, 3) и (4, 5).
На дендрограмме указаны порядок выбора элементов и соответствующие минимальные расстояния .