Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

тематической статистике ~ вероятностная или статистическая зависимость не имеющая вообще говоря строго фун

Работа добавлена на сайт samzan.net: 2016-03-13

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 21.5.2024

                                      Лекция 4

                 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

                        4.1. Основные понятия

       Корреляция – термин, применяемый в различных областях науки и техники для обозначения взаимозависимости, взаимного соответствия, соотношения понятий, предприятий, предметов, функций.

     Корреляция в математической статистике – вероятностная или статистическая зависимость, не имеющая вообще говоря строго функционального характера. В отличие от функциональной зависимости, корреляционная зависимость возникает тогда, когда один из признаков зависит не только от данного второго признака, но и от ряда других случайных факторов, или же тогда, когда среди условий, от которых зависят и тот и другой признаки, имеются общие для них условия. Пример такого рода зависимости -  корреляционная таблица, в которой, например, отражена зависимость производительности ПК от его стоимости.

     Корреляционный анализ. В основе корреляционного анализа лежит допущение о том, что исследуемые явления подчинены определённым вероятностным закономерностям. Зависимость между двумя случайными событиями проявляется в том, что условная вероятность одного из них при наступлении другого отличается от безусловной вероятности.

     Корреляционный анализ – совокупность математических методов обнаружения корреляционной зависимости между двумя случайными признаками.

     Технология корреляционного анализа включает в себя следующие этапы.   

Построение корреляционного поля.

Составление корреляционной таблицы.

Определение нормальности.

Выбор метода корреляционного анализа.

Вычисление количественных характеристик.

Оценка значимости (существенности) связи.

Вид зависимости можно определить по результатам регрессионного анализа.

(Весь этот абзац – 32 строки с очень небольшими изменениями заимствован из БСЭ т.13 стр. 210 – 211.)

   Рассмотрим предложенную технологию подробно.

  4.2. Корреляционное поле. Корреляционная таблица

    Корреляционное поле и корреляционная таблица являются вспомогательными средствами наглядного анализа собранных статистических данных. Их достоинство простота построения и наглядность. По ним можно сделать предварительные выводы о форме зависимости случайных величин.

    При нанесении выборочных точек на координатную плоскость получают корреляционное поле. По корреляционному полю можно, например, установить, что один признак в среднем возрастает, или убывает при возрастании другого признака.

   По корреляционному полю с помощью группировки можно построить корреляционную таблицу. В каждой клетке корреляционной таблицы записывается количество пар признаков, которые попадают в соответствующие интервалы группировки по каждому признаку. Рассмотрим зависимость ВВП РФ (таблица 4.2.1) от численности персонала, занятого исследованиями и разработками (таблица 4.2.2) по регионам РФ. Таблицы 4.2.1 и 4.2.2 заимствованы из Статистического ежегодника РФ за 2012 год.

              Таблица 4.2.1. Объёмы ВВП по регионам РФ

Всего, млн. руб.

На душу населения1), руб.

2000

2005

2006

2007

2008

2009

2010

2000

2005

2006

2007

2008

2009

2010

Валовой внутренний продукт Российской Федерации в рыночных ценах

7305646

21609766

26917201

33247513

41276849

38807219

45172748

49835

150571

188167

232817

289170

271787

316226

в том числе валовая добавленная стоимость в  основных ценах

6472199

18517666

22977344

28484471

35182698

33831324

38871057

44150

129026

160625

199464

246477

236938

272112

из нее валовой региональный продукт по субъектам Российской Федерации (валовая добавленная стоимость в основных ценах) - всего

5753672

18034385

22492120

27963956

33908757

32007228

37398520

39532

125659

157233

195819

237552

224163

261804

Центральный
федеральный округ

1841499

6278360

7965170

10208918

12674395

11405183

13363655

48205

164888

208807

267272

331472

297793

348100

Белгородская
область

42074

144988

178846

237013

317656

304345

397070

27970

95911

118211

156225

208548

199046

259173

Брянская область

24650

66692

82100

102706

125834

126477

144264

17414

49923

62188

78519

96885

98015

112623

Владимирская
область

33018

86927

112842

146663

175396

185825

218712

21073

58261

76185

99683

119942

127815

151311

Воронежская
область

49524

133587

166177

222812

287072

301729

328771

20365

56535

70493

94850

122591

129113

140810

Ивановская область

16900

44415

55090

74752

86980

87062

98209

14240

40039

50272

68866

80709

81287

92306

Калужская область

23903

70954

86150

111869

150395

154946

184581

22438

69192

84317

109790

147930

152612

182375

Костромская
область

16662

44685

54351

65700

81041

78921

92291

21985

63304

78227

95687

119072

116856

137817

Курская область

30168

86625

104036

128799

167866

161571

192442

23678

72995

88949

111348

146276

141834

170255

Липецкая область

48068

145194

179057

209822

259532

226662

254738

39051

121376

150197

176535

219136

192165

216884

Московская область

176694

708062

934329

1295650

1645753

1519446

1796536

26688

104738

137092

188565

237596

217340

254279

Орловская область

22161

53182

64802

77101

96670

90624

102450

25168

64180

79342

95387

120531

113849

129788

Рязанская область

27957

84383

105492

121305

150151

153634

173526

22070

70666

89011

102983

128212

131891

150002

Смоленская область

28141

65526

79043

95703

121601

125349

149091

25798

63687

77367

94432

121013

125743

150910

Тамбовская область

23387

63615

79766

106040

120836

136324

139017

19134

55574

70416

94533

108653

123512

126994

Тверская область

35341

96897

127364

156035

192283

197687

218644

23073

68049

90518

112022

139216

144258

161039

Тульская область

42061

116221

142240

174111

231731

214925

237208

24292

71587

88476

109226

146466

136852

152301

Ярославская
область

41756

131252

153252

186578

214946

212684

234246

29828

99335

117309

143936

166712

165758

183644

г. Москва

1159034

4135155

5260233

6696259

8248652

7126972

8401859

115631

381997

477873

601147

734242

628930

733042


Продолжение табл.4.2.1

Всего, млн. руб.

На душу населения1), руб.

2000

2005

2006

2007

2008

2009

2010

2000

2005

2006

2007

2008

2009

2010

Северо-Западный федеральный округ

578505

1799780

2198608

2770191

3388222

3415871

3905154

40565

130846

160591

202974

248743

251018

286828

Республика Карелия

28215

77125

84228

104603

115208

105924

127734

38539

112950

125613

157959

175466

162649

197838

Республика Коми

59473

171307

218491

241151

291812

302629

352335

56620

176075

229054

256586

314252

329967

389064

Архангельская
область

61807

166433

215933

268672

289756

323607

355884

44797

128965

169458

212908

231493

260585

289058

в том числе
Ненецкий
автономный округ

11924

44718

67248

97838

91476

130178

145750

Вологодская
область

69195

193966

201939

243336

294926

213397

252063

53433

156380

164130

199003

242348

176179

209220

Калининградская
область

23290

81838

103139

143928

179267

169520

195063

24309

87123

110255

153964

191533

180797

207464

Ленинградская
область

56002

205417

265260

309029

383255

430396

502126

33265

122024

157122

182658

226011

252891

293342

Мурманская область

55135

132870

158127

191585

213734

202235

234649

59158

156653

190124

233766

263756

251957

294445

Новгородская
область

20966

63848

74924

86665

115141

117710

127271

29347

95286

113246

132335

177472

183197

200033

Псковская область

16179

40583

51465

61562

73283

74648

84345

20545

55773

72029

87457

105449

108798

124663

г. Санкт-Петербург

188243

666393

825102

1119660

1431840

1475805

1673684

39811

141796

174433

235410

299436

306455

343951

Южный
федеральный округ

329696

936057

1195195

1577083

2001112

1994912

2293686

23418

67566

86428

114086

144634

144046

165579

Республика Адыгея

5520

17029

21132

29085

36134

41512

46149

12315

38515

48050

66366

82378

94437

104921

Республика
Калмыкия

6213

9686

12844

17226

20790

23948

24344

20184

33018

43797

58925

71451

82587

84150

Краснодарский край

137125

372930

483951

648211

803834

861603

1008152

26714

72794

94244

125700

155104

165555

193055

Астраханская
область

28116

70128

85112

100359

147549

134418

145430

27815

69814

84950

99999

146391

133019

143924

Волгоградская
область

63767

203232

252143

331767

416679

377514

437414

23341

76741

95683

126313

159002

144303

167538

Ростовская область

88955

263052

340013

450435

576126

555917

632197

20004

60575

78642

104603

134137

129626

147710

Северо-Кавказский
федеральный округ

105178

352069

457118

573221

728231

786670

887606

13803

39051

50434

62724

78922

84494

94465

Республика
Дагестан

20921

90443

124154

156929

216277

257833

285279

8490

33840

45742

56813

77034

90543

98662

Республика
Ингушетия

2619

7419

9034

16812

19173

18953

21537

6668

17435

21922

41341

47002

46174

52131

Кабардино-Балкарская
Республика

14081

36833

43310

48909

58093

65660

76056

15949

42253

50225

57012

67731

76451

88470

Карачаево-Черкесская
Республика

5462

16724

23260

27470

35714

38584

43324

12404

36972

50779

59201

76277

81759

91094

Республика Северная Осетия - Алания

8363

31182

43341

52805

57708

64081

74845

11965

44127

61230

74357

81097

90041

105104

Чеченская
Республика

22899

32344

48056

66274

64308

69676

20038

27831

40573

54742

51981

55188

Ставропольский край

53732

146569

181675

222240

274992

277251

316889

19604

53415

66136

80715

99503

99995

113923

Приволжский
федеральный округ

1036787

2799036

3513341

4330426

5324051

4922532

5660130

32792

91574

115728

143366

176879

163958

189071

Республика
Башкортостан

145125

381647

505206

590054

743133

647912

757570

35246

93683

124440

145544

183169

159429

186121

Республика
Марий Эл

11208

33351

43664

55069

65765

69272

82426

15115

46590

61413

77919

93512

98889

118184

Республика
Мордовия

17553

44267

57974

77049

94058

90862

104327

19220

50983

67310

90139

110877

107903

124760

Республика
Татарстан

186154

482759

605912

757401

926057

885064

1004690

49139

128227

161046

201172

245629

234206

265372

Удмуртская
Республика

53307

139995

164849

205647

243136

230938

264464

33489

90316

106891

133905

158851

151269

173675

Чувашская
Республика

22995

69392

93172

123453

155032

139910

152490

17277

54002

73147

97529

122980

111300

121682

Пермский край

124142

327273

383770

477794

607363

539832

630755

43273

119654

141865

178097

227719

203364

238823

Кировская область

35795

79801

97047

118155

151117

146321

166219

23166

55727

68958

85144

110128

107680

123516

Нижегородская
область

105056

299724

376180

473307

588791

547223

646676

29090

87355

110663

140298

175587

164072

194945

Оренбургская
область

76343

213138

302808

370881

430023

413396

454993

34585

101110

145533

179882

209770

202332

223390

Пензенская область

25219

74363

88805

119104

147853

147185

158214

16900

52164

62720

84558

105477

105487

113970

Самарская область

140407

401812

487713

584969

699296

584000

692928

42759

124575

151239

181530

217090

181298

215321

Саратовская
область

63068

170930

204291

252867

321747

326370

369630

23315

65657

79127

98570

126086

128474

146252

Ульяновская
область

30415

80584

101950

124676

150680

154247

174748

21412

59805

76475

94376

114808

118180

134828

Продолжение табл.4.2.1

Всего, млн. руб.

На душу населения1), руб.

2000

2005

2006

2007

2008

2009

2010

2000

2005

2006

2007

2008

2009

2010

Уральский
федеральный округ

866133

3091363

3720616

4236326

4815668

4360451

5087786

69327

254078

307374

350767

398807

360909

420920

Курганская область

18705

50246

68435

81076

106223

107915

115223

17759

51724

71739

86224

114237

117059

126106

Свердловская
область

156077

475576

653908

820793

923551

825267

1033748

34215

108697

150549

189763

213922

191415

240247

Тюменская область

570790

2215584

2551355

2758813

3121401

2870284

3292883

176918

673208

773076

831305

934230

852920

970771

в том числе:

Ханты-Мансийский автономный округ - Югра

403822

1399336

1594097

1728340

1937159

1778637

1976224

Ямало-Ненецкий автономный округ

117101

441722

546366

594679

719397

649640

771769

Челябинская
область

120561

349957

446918

575644

664493

556985

645932

33012

99160

127443

164798

190566

159901

185681

Сибирский
федеральный округ

687072

1951300

2442999

2990665

3442210

3391089

4093589

33682

99628

125749

154702

178421

175846

212440

Республика Алтай

2738

8806

11609

15109

18701

19912

21636

13505

43592

57555

74634

91713

97112

105050

Республика Бурятия

21575

74913

91712

107442

124738

121188

136374

21555

77313

94965

111354

129145

125173

140500

Республика Тыва

3594

11663

15147

19384

23871

26922

30601

11749

38430

50052

63959

78381

87890

99442

Республика Хакасия

17418

41727

53689

63722

72309

81020

93709

31333

77865

100828

119953

136024

152205

175975

Алтайский край

46737

135686

173811

223563

259343

265613

299715

17661

53812

69852

90760

106020

109089

123642

Забайкальский край

30025

69647

90732

110822

140302

148588

162100

25320

61741

81066

99545

126362

133974

146357

Красноярский край

214663

439737

585882

734155

737951

749195

1050158

71281

152389

205042

258394

260318

264479

370952

Иркутская область

103014

258096

330834

402655

438852

458775

539246

39115

102904

133414

163588

178988

187689

221531

Кемеровская
область

88728

295378

342211

437790

575902

512408

622513

30048

104765

122394

157302

207286

184674

224969

Новосибирская
область

72013

235382

296064

365531

453575

425400

482027

26472

88476

111679

138199

171430

160210

180939

Омская область

46028

220686

262507

296005

347760

336260

371218

21643

108971

130614

148129

174710

169328

187458

Томская область

40539

159579

188801

214487

248906

245808

284292

38386

155365

184434

209320

241911

237293

272208

Дальневосточный
федеральный округ

308802

826420

999073

1277126

1534868

1730520

2106914

44932

127161

155389

200069

241574

273411

334306

Республика Саха
(Якутия)

81960

183027

206845

242657

309518

328202

384726

85376

191896

216536

253424

322922

342520

401468

Камчатский край

18141

43974

56120

66077

77854

94643

101677

49109

129241

168173

200610

238405

291954

315364

Приморский край

62089

186623

215934

259041

316582

368997

464325

29140

92504

108099

130632

160417

187556

236978

Хабаровский край

64795

161194

194260

231293

269178

276895

351261

44171

116258

141995

170398

198952

205081

260956

Амурская область

26315

76861

95091

111761

131564

151119

179509

28317

88597

111116

131888

156330

180572

215812

Магаданская
область

13010

27168

31203

35314

42054

47896

58174

65705

157799

185018

213450

258848

299404

368734

Сахалинская
область

34777

121014

166105

286273

333582

392380

492730

61596

230298

321109

559774

657783

779943

987418

Еврейская
автономная область

3784

14204

17977

23726

23977

25320

32538

19485

77319

99578

132505

134378

142388

183930

Чукотский
автономный округ

3931

12355

15538

20984

30559

45068

41974

65963

237135

295107

396907

582270

872422

826865

Таблица 4.2.2. Численность персонала, занятого исследованиями и разработками, по регионам РФ (человек)

2000

2005

2006

2007

2008

2009

2010

2011

Российская Федерация

887729

813207

807066

801135

761252

742433

736540

735273

Центральный федеральный округ

455985

408330

411958

415522

396272

385392

381795

380363

Белгородская область

1953

1289

1297

1314

1189

1185

1189

1198

Брянская область

2611

1927

1770

1950

2010

1352

790

1172

Владимирская область

9499

7913

7640

7453

7075

6638

4871

5131

Воронежская область

13140

13806

14144

14984

14651

14677

13184

14106

Ивановская область

1557

1105

918

892

732

774

749

644

Калужская область

11881

10413

10708

10920

10386

10374

10091

10422

Костромская область

305

147

139

137

146

134

116

109

Курская область

2016

1571

3469

3377

3185

2955

2944

3128

Липецкая область

547

362

417

352

353

369

323

326

Московская область

100601

88681

91062

88114

84375

83653

84574

86130

Орловская область

1900

920

1082

1006

936

844

797

844

Рязанская область

3637

3311

3461

3584

3555

3064

2373

2265

Смоленская область

1102

944

1170

1094

1031

964

873

760

Тамбовская область

2933

2800

2285

2282

2038

1964

1665

1807

Тверская область

5978

5499

5430

5340

5505

5089

4851

4625

Тульская область

10241

9959

10359

7544

5754

5521

4992

3759

Ярославская область

9259

6608

6660

7190

6739

6358

6187

6311

г. Москва

276825

251075

249947

257989

246612

239477

241226

237626

Северо-Западный
федеральный округ

116812

104752

103635

103864

99556

97633

95826

97221

Республика Карелия

1307

935

867

945

951

907

934

978

Республика Коми

2170

2047

2049

2089

2105

1889

1806

1748

Архангельская область

1316

1496

3065

3011

2971

1473

1148

1064

в том числе Ненецкий
автономный округ

22

24

24

31

43

81

75

58

Вологодская область

424

464

561

469

483

466

482

410

Калининградская область

2533

2075

2023

1961

1897

1799

1859

1990

Ленинградская область

6246

6388

6422

6467

6374

6463

6477

6431

Мурманская область

2765

2345

2195

2102

2071

2057

2097

2102

Новгородская область

1253

861

876

849

820

873

892

982

Псковская область

427

280

287

262

230

276

318

516

г. Санкт-Петербург

98371

87861

85290

85709

81654

81430

79813

81000

Продолжение табл.4.2.2

2000

2005

2006

2007

2008

2009

2010

2011

Южный федеральный округ

31752

28875

29290

30458

27492

27695

28109

27738

Республика Адыгея

168

163

361

361

320

327

330

357

Республика Калмыкия

205

221

227

217

214

199

203

190

Краснодарский край

7332

7000

7324

6997

6452

6379

6256

6059

Астраханская область

1669

1621

1444

1859

1047

942

917

966

Волгоградская область

4797

4157

4017

4553

3657

3965

4001

3988

Ростовская область

17581

15713

15917

16471

15802

15883

16402

16178

Северо-Кавказский
федеральный округ

5670

5655

5920

6256

6141

6051

6053

8585

Республика Дагестан

1776

1827

1882

1910

1778

1658

1642

1628

Республика Ингушетия  

-

23

26

87

83

95

95

112

Кабардино-Балкарская Республика

732

682

730

725

678

727

677

704

Карачаево-Черкесская Республика

592

569

546

522

507

497

491

506

Республика Северная Осетия - Алания

642

549

572

684

686

608

643

685

Чеченская Республика

271

276

351

333

361

412

639

Ставропольский край

1928

1734

1888

1977

2076

2105

2093

4311

Приволжский федеральный округ

150046

140592

134188

126903

120644

117000

116285

111579

Республика Башкортостан

10290

8415

8047

8281

8005

7543

7655

8052

Республика Марий Эл

1835

1011

520

475

201

206

170

190

Республика Мордовия

1393

1100

1089

1068

1316

1204

901

926

Республика Татарстан

16243

14352

14227

13289

12940

12783

13175

13258

Удмуртская Республика

2506

2102

1972

1594

1692

1438

1525

2000

Чувашская Республика

1809

1406

1069

745

1158

1008

942

943

Пермский край

12729

13229

11506

10510

9740

9877

9739

9899

Кировская область

2009

2038

1937

2044

1973

1815

1615

1707

Нижегородская область

48251

49797

46989

44400

42832

40909

40636

39902

Оренбургская область

1337

919

949

1039

1065

1048

947

914

Пензенская область

7858

7103

7119

7194

6611

6082

6220

6413

Самарская область

25857

24506

24856

23390

20462

20627

20189

15666

Саратовская область

9610

6677

6317

5811

5414

5099

4982

4828

Ульяновская область

8319

7937

7591

7063

7235

7361

7589

6881

Уральский федеральный округ

50803

49670

49377

47562

43695

42276

42672

43586

Курганская область

1927

1267

945

924

828

717

644

706

Свердловская область

27565

25076

24755

23859

21357

20390

20379

20906

Тюменская область

4935

5488

6147

7605

6883

6923

7160

6750

в том числе:

Ханты-Мансийский автономный
округ - Югра

1085

2269

2192

3266

2634

2641

1958

1876

Ямало-Ненецкий автономный округ

209

98

111

100

85

4

16

46

Челябинская область

16376

17839

17530

15174

14627

14246

14489

15224

Сибирский федеральный округ

62477

60986

58647

56427

53956

53463

53024

52794

Республика Алтай

90

111

132

168

173

156

158

172

Республика Бурятия

1209

1231

1003

985

954

969

952

1144

Республика Тыва

285

327

332

416

414

425

416

415

Республика Хакасия

128

282

205

198

193

166

149

148

Алтайский край

3427

2732

2775

2731

2267

2054

1955

2182

Забайкальский край

680

509

608

520

512

335

322

313

Красноярский край

7196

7102

6846

6685

6287

6299

6475

6748

Иркутская область

5295

4829

4557

4910

4897

4919

4912

5075

Кемеровская область

2090

1476

1511

1496

1327

1336

1258

1231

Новосибирская область

25168

24791

23438

22561

21597

21622

21615

21569

Омская область

8872

9367

8983

7246

6961

6622

6125

5002

Томская область

8037

8229

8257

8511

8374

8560

8687

8795

Дальневосточный
федеральный округ

14184

14347

14051

14143

13496

12923

12776

13407

Республика Саха (Якутия)

2662

2573

2450

2537

2359

2258

2249

2379

Камчатский край

993

1293

1333

1232

1193

1207

1154

1152

Приморский край

6225

6471

6458

6296

5965

5548

5493

5590

Хабаровский край

1683

1536

1390

1737

1700

1635

1500

1627

Амурская область

1013

890

807

778

774

819

830

824

Магаданская область

567

599

617

603

575

566

572

638

Сахалинская область

912

865

883

858

834

794

901

869

Еврейская автономная область

71

72

74

65

60

60

60

309

Чукотский автономный округ

58

48

39

37

36

36

17

19

По данным таблиц 4.2.1 и 4.2.2 для регионов Центрального, Северо-западного и Приволжского округов составим корреляционную таблицу 4.2.3 и корреляционное поле, приведённое на рис.4.2.1. Средние значения ВВП, вычисленные по градациям аргумента таблицы 4.2.3, прорисованы на рис. 4.2.1 красным цветом.

Таблица 4.2.3. -  Корреляционная таблица

 ВВП

Кол.

До 100

До 150

До 200

До 250

До 300

До 350

До 400

До 800

Кол.

Ср.

кол.

Ср.

ВВП

До 500

-

3

-

2

-

-

-

-

5

281.8

161.4

До 1000

1

4

3

1

-

-

-

-

9

874.3

150.3

До 2000

-

2

1

1

2

-

1

-

7

1523

224.1

До 4000

-

1

1

-

1

-

-

-

3

2471

204.7

До 8000

-

3

5

-

1

-

-

-

9

5977

169.1

До 16000

-

1

1

1

1

-

-

-

4

11547

206.8

До 32000

-

-

-

1

-

-

-

-

1

20189

215.0

До 64000

-

-

1

-

-

-

-

-

1

40636

195.0

До 128000

-

-

-

-

1

1

-

-

2

82194

299.0

До 256000

-

-

-

-

-

-

-

1

1

241226

733.0

                                                                          Итого: 42 региона

                     Центрального, Северо-западного и Приволжского регионов

 350                                                   •

    ВВП на душу населения в тыс. руб.                                                                                                                     •

 

300                                                                                                                                                              

                                                         •

                                                                          •                                        •

 250                                           •                                         •                                                                                 •

                                                                                                                   •                            

                                      •                                                                                                                                                                             

 200      •    •                             •                                                                                                                                                                           

                                                                                            •     •                   •                                                                                                                                                                                                                                                                                                                   

                                       •                                              •                                                                                

 150                •        •                          •                    •  •

   •                                                                                                               •       

           •                  •     ••           ••                  •                •         •

 100•                     •                                                             •                                             

               0.5         •      1.0                 2.0                 4.0                 8.0               16.0               32.0              64.0       128

                                                                            Количество исследователей и разработчиков в тысячах человек

 Рис.4.2.1. – Корреляционное поле зависимости объёма ВВП на душу

населения от количества разработчиков и исследователей

        Республика Коми при количестве разработчиков и исследователей – 1748 имеет ВВП – 389064 рубля на душу населения, что вводит некоторую флуктуациюв рис.4.2.1.

   По рис.4.2.1 и таблице 4.2.3 можно сделать вывод о наличии общей тенденции повышения ВВП при увеличении количества исследователей и разработчиков. Корреляционная зависимость между этими признаками имеет нелинейный колебательный характер. Можно надеяться, что при увеличении количества анализируемых регионов корреляционная зависимость будет приближаться к линейной и пропадёт выявленный колебательный процесс.  

          4.3. Выбор метода корреляционного анализа

      Из 14 используемых на практике методов установления наличия связи между случайными величинами [10] сформулируем рекомендации по их вы-бору в зависимости от вида переменных, которые могут быть количествен-ными, или качественными, ранжируемыми, или неранжируемыми, ограни-ченными по количеству градаций, или неограниченными, подчиняющимися нормальному закону, или произвольному закону. В соответствии с выше-сказанными условиями составим таблицу методов 4.3.1.

       Таблица 4.3.1. Основные методы корреляционного анализа.

Коэф.

оценки

Фактор

Отклик

Ранжиру-

емость

Нормаль-

ность

Линей-

ность

Наличие кол.

показ.сущест.

Средства

реализации

1.Биссериаль-

ный

Колич.

Качест.

2 град. по

отклику

Не треб.

Не треб.

Не имеется

2.Фехнера

Колич.

Колич.

Не треб.

Не треб.

Не треб.  

Не имеется

3.Ранг. Спир-

мена

Колич. и

качест.

Колич. и качест.

Треб.Кол.

не огран.

Требуется

Не треб.

Имеется

4.Ранг. Кен-

дала

Колич. и

качест.

Колич. и

качест.

Треб.Кол.

не огран.

Не треб.

Не треб.

Не имеется

5.Ассоциации

Качест.

Качест.

Треб. 2

градации

Не треб.

Не треб.

Не имеется

6.Континген-

тности

Качест.

Качест.

Треб. 2

градации

Не треб.

Не треб.

Не имеется

7.Коэф. лине-йной коррел.

Колич.

Колич.

Не треб.

Требуется

Требу-

ется

Имеется

8.Корреляци-

онное отнош.

Колич.

Колич.

Не треб.

Не треб.

Не треб.

Не имеется

9.Пирсона-

Чупрова

Качест.

Качест.  

Треб. 2

градации

Не треб.

Не треб.

Имеется

10.Пирсона-

Чупрова 1

Качест.

Качест.  

Треб. 2

градации

Не треб.

Не треб.

Имеется

11.Пирсона-

Чупрова 2

Качест.

Качест.  

Треб. 2

градации

Не треб.

Не треб.

Имеется

12.Конкорда-ции

Качест.

Качест.  

Треб.

Не треб.

Не треб.

Имеется

13.Множеств.детерминаци

Колич.

Колич.  

Не треб.

Треб.

Треб.

Имеется

14.Множеств.

корреляции

Колич.

Колич.  

Не треб.

Треб.

Треб.

Имеется

    Существенность вычисленных показателей корреляционной связи можно оценить по шкале Чеддока, приведённой в таблице 4.3.2.

           Таблица 4.3.2. Шкала Чеддока

 

 4.4. Биссериальный коэффициент корреляции

        Биссериальный коэффициент корреляции позволяет изучить связь меж-ду качественным результативным (откликом) и количественным факторным признаком. Для его вычисления исследуемые объекты разбиваются на две группы. Биссериальный коэффициент корреляции вычисляется по формуле:

                                            (4.4.1)

   где      среднее значение отклика в первой группе;

               среднее значение отклика во второй группе;

               p1  -  удельный вес (вероятность) первой группы в совокупности;

               p2  -  удельный вес (вероятность) второй группы в совокупности;

               σyсреднее квадратическое отклонение отклика;

               Z1  -  табличное значение  Z-распределения в зависимости от p1.

       Значение Zi  для рi  можно взять из соответсвующей таблицы, либо вычислить по формуле:

                                                  (4.4.2)

      Если вычисленное значение r ≥0,3 то корреляционная связь считается существенной.

       Пример 4.4.1

      Требуется оценить связь между семейным положением женщины – качественным признаком (откликом) и уровнем оплаты её труда количественным признаком (фактором). Исходные статистические данные обследования представлены в виде таблицы 4.4.1.

     Таблица 4.4.1. Исходные данные для примера 4.4.1

Семейное

Уровень

оплаты

труда

в тыс. руб.

Всего

положение

До 8

8 - 16

16 -24

Более 24

человек

   Среднее

   значение

    7

  12

  20

   25

Замужем

  98

  86

  42

   24

250

Не замужем

  37

  46

  78

   89

250

Итого

135

 132

 120

  113

500

   Проведём вычисления.

   Средняя зарплата замужних женщин:

    Средняя зарплата незамужних женщин:

    Средняя зарплата замужних и незамужних женщин:

    Стандартное отклонение заработной платы:

   Вероятность учёта замужних женщин:

     Вероятность учёта незамужних женщин:

    Значение Z-распределения:

     Биссериальный коэффициент корреляции:

      

     Так как r=0,38>0,3 делаем заключение, что связь между семейным положением женщин и их заработанной платой имеется, но  превышение r над 0,3 сравнительно невелико, то её следует отнести к умеренной.

     4.5. Непараметрический показатель связи – коэффициент Фехнера

      Простейшим непараметрическим показателем связи является коэффициент Фехнера. Коэффициент Фехнера не требует нормальности распределений случайных величин. В основе его вычисления лежит принцип сопоставления  отклонений признаков от своих средних значений.  Его применение основано на допущении, что отклонения отклика от своей средней величины должно соответствовать отклонению фактора от своей средней величины. Коэффициент Фехнера вычисляется по формуле:

                                                                                (4.5.1)

   где  С – число совпадений знаков отклонений;

          Н – число несовпадений знаков отклонений.

    Коэффициент Фехнера может принимать значения от -1 до +1. При Kf=±1

связь между признаками х и у функциональная (не случайная). При Kf=0 связь между признаками х и у отсутствует. Промежуточные значения Kf характеризуют степень связи между между признаками х и у.

    Пример 4.5.1. Оценить связь объёмов продаж с затратами на рекламу по данным, приведённым в таблице 4.5.1. Средние значения признаков вычислены по следующим формулам:   

                       (4.5.2)

Результаты вычислений сведены в таблицу 4.5.1.

Таблица 4.5.1. Исходные данные и вычисление коэффициента Фехнера

Календарный

интервал - i

Затраты на

рекламу - xi

Объём продаж - yi

Совпадение

отклонений +

1

194

60.7

2560

233.9

      +

2

186

52.7

1945

-381.1

       -

3

52

-81.3

1450

-876.1

           +

4

78

-55.3

1120

-1206.1

      +

5

145

11.7

2389

62.9

      +

6

178

44.7

4590

2263.9

      +

7

130

-3.3

3460

1133.9

       -

8

189

55,7

2378

51.9

      +

9

89

-44.3

1580

-746.1

      +

10

92

-41.3

1789

-537.1

      +

    Итого:

133.3

2326.1

8 совпадений;

2 несовпадения

    По формуле (4.5.1) вычислим коэффициент Фехнера:

      

     Связь между объёмом продаж и затратами на рекламу можно считать прямой и умеренной.

    Недостатком коэффициента Фехнера является равенство различных по абсолютной величине отклонений физических значений признаков от средних значений без учёта величины разницы.

            4.6. Коэффициенты корреляции рангов

    Коэффициенты корреляции рангов можно вычислять как между количественными, так и между качественными признаками при условии, что их можно ранжировать. К ним относятся коэффициенты корреляции рангов Спирмена и Кендалла.  

                   Коэффициент корреляции рангов Спирмена 

     Для определения тесноты связи как между количественными, так и между качественными признаками, при условии, что они представляют однородные объекты и могут быть ранжированы по одному и тому же принципу можно использовать коэффициент корреляции рангов Спирмена, вычисляемый по формуле:

                                           (4.6.1)

      где diразность между величинами рангов аргумента (фактора) и функции (отклика) iго варианта;  

            n - количество вариантов.        

      Если количество вариантов сравнительно велико и  их распределение подчиняется нормальному закону, то значимость коэффициента рангов Спирмена можно оценить по критерию Стьюдента по формуле:     

                                                    (4.6.2)

       По статистическим таблицам находится критическое значение критерия Стьюдента  tкрит  для рекомендуемого  уровня значимости α=0,05 при количестве степеней свободы k=n-2. Если  tвыч ≥  tкрит то связь между переменными считается существенной. При сравнительно небольших выборках для установления существенности связи между переменными  используют специальную таблицу критических значений коэффициента корреляции рангов Спирмена [10].

        Пример 4.6.1

       Для примера применения коэффициента корреляции рангов Спирмена используем значения затрат на рекламу и объёма продаж, представленные в таблице 4.5.1, введём по ним ранги  по возрастанию их значений. Результаты ранжирования представим в таблице 4.6.1.

        Таблица 4.6.1.  Значения объёмов продаж и затрат на рекламу  

Календарный

нтервал - i

Затраты на

рекламу - xi

Ранг -

Rxi

Объём продаж

- yi

Ранг -

Ryi

di=

Rxi - Ryi

di2

1

194

10

2560

8

2

4

2

186

8

1945

5

3

9

3

52

1

1450

2

-1

1

4

78

2

1120

1

1

1

5

145

6

2389

7

-1

1

6

178

7

4590

10

-3

9

7

130

5

3460

9

-4

16

8

189

9

2378

6

3

9

9

89

3

1580

3

0

0

10

92

4

1789

4

0

0

              

           Так как количество вариантов п=10 сравнительно не велико, то для оценки существенности связи воспользуемся специальной статистической таблицей [10], по которой найдём, что при п=10 и рекомендуемом уровне значимости α=0,05 критическое значение ρкрит=0,634. Так как вычисленное значение    ρвыч  превышает критическое значение   ρкрит , то связь между переменными при принятых условиях признаем существенной. Если, например, уменьшить уровень значимости до  α=0,02 то критическое значение ρкрит=0,733. Так как вычисленное значение  ρвыч  при принятых условиях  не превышает критическое значение   ρкрит, то связь между переменными при принятых условиях признаем несущественной.

         При допущении о нормальности распределения переменных вычислим критерий Стьюдента:

     По статистическим таблицам найдём критическое значение критерия Стьюдента для рекомендуемого значения уровня значимости α=0,05 и количестве степеней свободы п-2: tкрит=2,31. Так как вычисленное значение критерия Стьюдента превышает критическое, то будем считать связь между переменными существенной.

                       Коэффициент корреляции рангов Кендалла 

     Для определения тесноты связи как между количественными, так и между качественными признаками, характеризующие однородные объекты и ранжированные по одному и тому же принципу можно использовать коэффициент корреляции рангов Кендалла, вычисляемый по формуле:

                                           (4.6.3)

   где Рi – количество случаев для i-го варианта (календарного интервала),

                 ранг которых превышает   i-е значение;    

          Qi   -  количество случаев для i-го варианта (календарного интервала),

                 ранг которых не превышает   i-е значение;    

         n -  количество вариантов.

        Существенность коэффициента корреляции рангов Кендалла, при условии нормальности распределений случайных величин, проверяют по формуле:

                                              (4.6.4)

         Критическое значение критерия Стьюдента находится по статистическим таблицам [10] для рекомендуемого значения уровня значимости α=0,05 и количества степеней свободы п-2.

Пример 4.6.2

   Подсчитаем коэффициент корреляции рангов Кендалла для примера 4.5.1. Проведём ранжирование вариантов по рангу Rxi  по данным таблицы 4.5.1 и вместе с проведёнными расчётами составим таблицу 4.6.2.

          Таблица 4.6.2. Значения объёмов продаж и затрат на рекламу  

Календарный

нтервал

  - i

Затраты на

рекламу

- xi

Ранг -

Rxi

Объём

продаж

- yi

Ранг -

Ryi

Pi

Qi

Pi -Qi

3

52

1

1450

2

8

1

8

4

78

2

1120

1

8

0

8

9

89

3

1580

3

7

0

7

10

92

4

1789

4

6

0

6

7

130

5

3460

9

1

4

-3

5

145

6

2389

7

2

2

0

6

178

7

4590

10

0

3

-3

2

186

8

1945

5

2

0

2

8

189

9

2378

6

1

0

1

1

194

10

2560

8

0

0

0

 

    Вычислим коэффициент корреляции рангов:

                 

     Вычисленное значение положительно и превышает рекомендуемое значение 0,50, что указывает на наличие существенной зависимости между переменными.

              При допущении о нормальности распределений исходных данных существенность коэффициента корреляции рангов Кендалла проверим по формуле (4.6.4):

                  

         Критическое значение критерия Стьюдента находится по статистическим таблицам  для рекомендуемого значения уровня значимости α=0,05 и количества степеней свободы п-2 [10]: tкрит=2,31.

        Так как τвыч = τкрит  то делаем заключение о наличии существенной связи между переменными.

          

          4.7. Коэффициенты ассоциации и контингенции

      Коэффициенты ассоциации и контингенции можно использовать для оценки тесноты связи двух качественных признаков, каждый из которых состоит только из двух градаций. Для проведения расчётов строится таблица сопряжённости 4.7.1.

        Таблица 4.7.1. Таблица сопряжённости двух признаков        

1-е значение

2-е значение

Сумма

1-й признак

a

b

a+b

2-й признак

c

d

c+d

Сумма

a+c

b+d

a+b+c+d

     По таблице сопряжённости вычисляются коэффициент ассоциации:

                                                      (4.7.1)

и коэффициент контингенции:

                (4.7.2)

     Связь считается существенной, если Ka ≥0.5 и  Kk ≥0.3.    (4.7.3)

      Пример 4.7.2. Установить тесноту связи между наличием вклада и семейным положением клиентов сбербанка по результатам таблицы 4.7.2.

Таблица 4.7.2. Таблица сопряжённости наличия вклада и семейного       

                         положения клиентов сбербанка        

Семейное положение

Число клиентов со сбережениями

Число клиентов со сбережениями

Сумма

Одинокие

250

150

400

Семейные

800

450

1250

Сумма

1050

600

1650

 

     По формулам (4.7.1), (4.7.2) вычислим коэффициенты ассоциации и контингенции:

   

   

Ввиду того, что вычисленные значения коэффициентов ассоциации и контингенции не удовлетворяют условию (4.7.3) делаем заключение, что наличие вкладов в сбербанке не зависит от семейного положения клиентов.

4.8. Коэффициенты оценки связи качественных  

признаков, представленных несколькими градациями

Если каждый из двух качественных признаков состоит из более чем двух градаций, то для определения тесноты связи возможно применение коэффициента сопряжённости Пирсона-Чупрова и двух его модификаций. Коэффициент сопряжённости Пирсона-Чупрова вычисляется по формулам:

                            (4.8.1)

               (4.8.2)

где φ2 – показатель взаимной сопряжённости;

     К1 число градаций первого признака: 

          К2 - число градаций второго признака.

Коэффициент взаимной сопряжённости вычисляется по формуле:

                            (4.8.3)                    

где nij – число сотрудников по i-ой градации первого признака и  j-ой

            градации второго признака; 

     ni  - общее количество сотрудников по  i-ой градации первого признака; 

     nj  - общее количество сотрудников по   j-ой градации второго признака.

    Пример 4.8.1. Требуется проанализировать зависимость распределения сотрудников строительной фирмы по должностям (второй признак) от их уровня образования (первый признак). Исходные данные представлены в таблице 4.8.1.

       Должность

Образование

Руководители

Служащие

Рабочие

Итого

Высшее

10

30

5

45

Неполн. высшее

7

25

10

42

Среднее специальное

2

15

50

67

Среднее общее

1

10

25

36

Итого

20

80

90

190

  

По (4.8.3) по данным таблицы 4.8.1 вычислим показатель взаимной сопряжённости:

φ2= (102/20+302/80+52/90)/45+(72/20+252/80+102/90)/42+

     +(22/20+152/80+502/90)/67+(12/20+102/80+252/90)/36-1=0.326.

      Вычислим коэффициенты взаимной сопряжённости:

    По значения вычисленных коэффициентов сопряжённости определяем наличие связи, которую следует считать умеренной.

    На практике используются две модификации коэффициента взаимной сопряжённости Чупрова. Первая из них требует вычисления   по формуле:

                                       (4.8.4)

где  χ2 – критерий Пирсона;

       n  - общее количество градаций по первому и второму признакам.

  Критерий Пирсона вычисляется по формуле:

                                                  (4.8.5)

По второй модификации коэффициент сопряжённости вычисляется по формуле:

                  (4.8.6)

Продемонстрируем применение модифицированных коэффициентов сопряжённости на рассмотренном ранее примере по данным таблицы 4.8.1.

Вычислим значение критерия Пирсона:

Вычислим коэффициенты сопряжённости Чупрова по первой и второй модификации:

  По значения вычисленных коэффициентов сопряжённости по первой и второй модификации определяем наличие связи, которую следует считать средней.

4.9. Коэффициенты корреляции количественных признаков

        В качестве количественной меры оценки  взаимосвязи между случайными величинами используются коэффициент линейной корреляции и эмпирическое корреляционное отношение. Оба показателя введены Пирсоном.

      Коэффициент линейной корреляции  используется в случае нормальности распределений случайных величин х и у и наличия линейной зависимости между ними. Он вычисляется по n экспериментальным данным   по следующей формуле:

                                            (4.9.1)

       В формуле  (4.9.1) оценки математических ожиданий  переменных х, у и их произведения  вычисляются по формулам:

              (4.9.2)                                         

         Оценки вторых начальных моментов требуются для вычисления средних квадратических отклонений. Для этого используются следующие формулы:

                                                 (4.9.3)

                                              (4.9.4)   

         Если коэффициент линейной корреляции близок к  1, то корреляционная связь между переменными положительная, близкая к линейной (рис.4.9.1). Если коэффициент линейной корреляции близок к  -1, то корреляционная связь между переменными отрицательная, близкая к линейной (рис.4.9.2). Если коэффициент линейной корреляции близок к 0, то  между переменными имеется слабая корреляционная связь (рис.4.9.3). Для независимых переменных коэффициент линейной корреляции равен нулю.

 

Рис.4.9.1. Графики зависимости между случайными переменными при

              различных значениях коэффициента линейной корреляции                       

     Оценить существенность коэффициента  линейной корреляции между случайными переменными по критерию Стьюдента можно при условии, что распределения этих случайных величин подчиняется нормальному закону и что они имеют совместное двумерное нормальное распределение.

Коэффициент линейной корреляции является случайной величиной, и поэтому для него может быть вычислена стандартная ошибка

                                  .                                             (4.9.5)

По  статистическим таблицам находим  критическое значение коэффициента линейной  корреляции.

        .                                                 (4.9.6)

       В случае, если значение коэффициента линейной  корреляции, вычисленное по (4.9.1),   по абсолютной величине не меньше 0,8, то можно ожидать наличие между переменными линейной зависимости и в уравнения регрессии вводить сами факторы в первой степени.  Если значение коэффициента линейной корреляции по абсолютной величине лежит в диапазоне от критического значения до 0,8, то  в уравнения регрессии рекомендуется вводить сравнительно несложные функции от факторов. Рекомендуется использовать следующие функции от факторов  xi; :  для увеличения масштаба фактора х относительно результативного показателя эффективности  у; - для уменьшения масштаба фактора х относительно результативного показателя эффективности  у; - для отображения обратной связи  между фактором х и  результативным показателем эффективности  у. Если значение коэффициента линейной корреляции по абсолютному значению  меньше критического, то такие факторы рекомендуется не включать в уравнения регрессии.

          Эмпирическое корреляционное отношение вычисляется по формуле

                                                             (4.9.7)

где  δ* – оценка межгруппового среднего квадратического отклонения;

      σу*оценка среднего квадратического отклонения результативного

               признака.

        .                                  (4.9.8)

     Эмпирический коэффициент детерминации в долях от 1 показывает на сколько изменение  результативного признака объясняется изменением факторного признака, Он вычисляется по формуле:

                                                                 (4.9.9)

     Пример 4.9.1

     Вычислим коэффициент линейной корреляции и эмпирическое корреля-ционное отношение для оценки тесноты связи между оборотным капиталом предприятий и их прибылью, Статистические данные по указанным признакам для 25 предприятий приведены в таблице 4.9.1.

     Таблица 4.9.1. Исходные данные для примера 4.9.1

 предприятия 

    -  i

Оборотный капитал

 - хi   в тыс. руб.

Прибыль

- yi  в тыс. руб.

1

634

127

2

536

86

3

726

184

4

510

82

5

656

137

6

547

110

7

809

193

8

732

190

9

807

184

10

766

189

11

664

135

12

751

175

13

556

115

14

836

210

15

739

169

16

846

215

17

934

264

18

927

241

19

851

235

20

678

167

21

832

275

22

748

157

23

717

164

24

944

314

25

959

286

 

    Для наглядности вычислений добавим в таблицу 4.9.1 ещё три вспомогательных столбца со значениями: хi2, yi2, xi yi  и поместим полученные результаты в таблицу 4.9.2.

         Таблица 4.9.2. Предварительные расчёты для примера 4.9.1

Номер  предпри-

ятия   -  i

Оборотный

капитал- хi   

Прибыль

- yi  

xi2

yi2   

 xi yi   

1

634

127

401956

16129

80518

2

536

86

287296

7396

46096

3

726

184

527076

33856

133584

4

510

82

260100

6724

41820

5

656

137

430336

18769

89872

6

547

110

299209

12100

60170

7

809

193

654481

37249

156137

8

732

190

535824

36100

139080

9

807

184

651249

33856

148488

10

766

189

586756

35721

144774

11

664

135

440896

18225

89640

12

751

175

564001

30625

131425

13

556

115

309136

13225

63940

14

836

210

698896

44100

175560

15

739

169

546121

28561

124891

16

846

215

715716

46225

181890

17

934

264

872356

69696

246576

18

927

241

859329

58081

223407

19

851

235

724201

55225

190985

20

678

167

459684

27889

11326

21

832

275

692224

73625

228800

22

748

157

559504

24649

117436

23

717

164

514089

26896

117588

24

944

314

891`136

98596

296416

25

959

286

919681

81796

274274

Итого

18705

4604

14401233

937314

3625593

Оценки

моментов

18705/25=

 =748,2

4604/25=

=184,16

14401233/25=

  =576049,32

937314/25=

=37492,56

3625593/25=

=145023,72

Вычислим средние квадратические отклонения:

        

      

Вычислим коэффициент линейной корреляции.

Вычислим критическое значение коэффициента линейной корреляции:

 Значение tкрит=2,0687 находим по статистическим таблицам для

рекомендуемого уровня значимости α=0.05 и количества степеней свободы:

п-2=25-2=23.

 Ввиду того, что вычисленное значение коэффициента линейной корреля-

ции превышает критическое значение, то анализируемую связь будем счи-тать существенной, а ввиду того что оно превышает 0,8, то делаем заключе-ние, что эта связь  положительная и близкая к линейной.

Для вычисления эмпирического корреляционного отношения сгруппи-

руем предприятия и результаты группировки представим в таблице 4.9.3.

    Таблица 4.9.3. Исходные данные для вычисления корреляционного     

                            отношения

Номер

интервала - i

Границы

интервала

Кол. предпри-

ятий   - ni

Середина ин-

тервала -  xi

Средняя прибыль - уi                               

  1

510-600

 4

 555

 98,25

  2

600-690

 4

 645

141,50

  3

690-780

 7

 735

175,43

  4

780-870

 6

 825

218,67

  5

879-960

 4

 915

276,25

Вычислим оценку межгрупповой дисперсии:

 =((98,25-184,16)2×4+(141,5-184,16)2×4+

+ (175,43-184,160)2×7+(218,67-184,16)2×6+(276,25-184,16)2×4)/25=3136,12.

   Вычислим общую дисперсию результативного признака:

   Вычислим эмпирическое  корреляционное отношение:

    

    Вычислим эмпирический коэффициент детерминации:

     Эмпирический коэффициент детерминации показывает, что более 87% изменения результативного признака объясняется изменением факторного признака, что позволяет сделать заключение о наличии существенной связи между ними.

Возможность применения линейной функции для представления

зависимости y=f(x) можно оценить по величине ω, вычисляемой по формуле:

        

Ввиду того, что вычисленное значение ω2 по абсолютному значению

меньше критического значения критерия Фишера Fкрит=3,1, найденного по статистическим таблицам для рекомендуемого значения уровня значимости α=0,05 и двух степенях свободы: k1=k-2=5-2=3 и  k2=n-k=25-5=20, то делаем заключение о сильной близкой к линейной связи результативного признака у с факторным признаком х.  

    Вычислим коэффициенты линейного уравнения регрессии y=b0+b1;

     

    

     Таким образом, получили линейное уравнение:

    

     Вычислим коэффициент эластичности, который показывает на сколько процентов изменится результативный признак при изменении факторного признака на один процент:

    

            Вычислим β-коэффициент, который показывает на сколько процентов изменится среднее квадратическое отклонение результативного признака  при изменении среднего квадратического отклонения факториного признакана   один процент:

  

     Пример 4.9.2

     Провести корреляционный анализ показателей нефтегазодобывающей отрасли России, представленных в таблице 4.9.4.

Таблица 4.9.4. Исходные данные для примера 4.9.2

Показатель

Код

1996 г.

1977 г.

1998 г.

1999 г.

2000 г.

2001 г.

2002 г.

Добыча нефти

в млн. тонн

y

269,91

270,94

264,70

268,53

281,29

301,73

341,60

Разведочное бурение

в тыс. метрах

x1

1026,4

1006,7

789.0

824,9

1013,7

1145,1

1410,4

Эксплуатацион-

ное бурение

в тыс. метрах

x2

6762,2

6997,7

4697,7

4872,5

8286,7

9011,0

10024,5

Всего бурение

в тыс. метрах

x3

7788,6

8004,4

5486,7

5697,4

9300,4

10156,1

11434,9

Кол. добываю-

щих скважин

x4

106645

101224

97557

101937

109939

114883

113672

Кол. простаива-

ющих скважин

x5

37396

35958

34131

32932

31940

31479

34228

Всего скважин

x6

144041

137182

131688

134869

141879

146362

147900

Ввод новых

скважин

x7

3419

3001

2376

2552

3405

4023

3901

Закуплено бе-

тонита в тыс. т.

x8

78,94

86,66

60,25

56,41

70,97

67,32

73,00

       По данным таблицы 4.9.4 аналогично предыдущему примеру вычислены коэффициенты линейной корреляции между всеми переменными и результаты вычислений помещены в таблицу 4.9.5.

   Таблица 4.9.5. Коэффициенты линейной корреляции для переменных   

                           примера 4.9.2

Коды

y

x1

x2

x3

x4

x5

x6

x7

x8

y

1

0,932

0,850

0,862

0,865

-0,242

0,765

0,758

0,099

x1

0,932

1

0,937

0,948

0,831

-0,015

0,894

0,880

0,426

x2

0,830

0,937

1

0,999

0,916

-0,229

0,911

0,944

0,423

x3

0,862

0,948

0,999

1

0,913

-0,210

0,915

0,944

0,425

x4

0,865

0,831

0,916

0,913

1

-0,399

0,947

0,961

0,157

x5

-0,242

-0,015

-0,299

-0,210

-0,388        

1

-0,071

-0,174

0,613

x6

0,765

0,894

0,911

0,915

0,947

-0,071

1

0,979

0,383

x7

0,758

0,882

0,944

0,944

0,961

-0,174

0,979

1

0,391

x8

0,099

0,426

0,423

0,425

0,157

0,613

0,383

0,391

1

Вычислим критическое значение коэффициента линейной корреляции:

 Значение tкрит=2,5706 находим по статистическим таблицам для

рекомендуемого уровня значимости α=0.05 и количества степеней свободы:

п-2=7-2=5. 

      Проведём анализ результатов, приведённых в таблице 4.9.5. Так как коэффициенты линейной корреляции /ryx5/=0,242<rкрит и /ryx8/=0,099<rкрит, то связь результативного показателя у с факторами х5 и х8 является несущественной и поэтому эти факторы не будем включать в уравнение регрессии. Для решения вопроса о включении в уравнение регрессии других факторов будем последовательно рассматривать имеющиеся факторы попарно.

    Сначала проверим выполнение  неравенств для результативного показателя у и факторов х1   и х2.

        ryx1>rx1x2;  0,932<0,937; не выполняется.

        ryx2>rx1x2;  0,850<0,937; не выполняется.

     Оба неравенства не выполняются, Это указывает на то, что связь между факторами х1 и х2 является более существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии фактор, у которого коэффициент линейной корреляции больше. Так как         rx1=0,932>rx2=0,850, то для включения в уравнение регрессии оставляем фактор х1. 

     Проверим выполнение  неравенств для результативного показателя у и факторов х1   и х3.

        ryx1>rx1x3;  0,932<0,948; не выполняется.

        ryx3>rx1x3;  0,862<0,948; не выполняется.

     Оба неравенства не выполняются. Это указывает на то, что связь между факторами х1 и х3 является более существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии фактор, у которого коэффициент линейной корреляции больше. Так как         ryx1=0,932>rуx3=0,862, то для включения в уравнение регрессии оставляем фактор х1. 

             Проверим выполнение  неравенств для результативного показателя у и факторов х1   и х4.

        ryx1>rx1x3;  0,932>0,785;  выполняется.

        ryx3>rx1x3;  0,865>0,785;  выполняется.

     Оба неравенства выполняются. Это указывает на то, что связь между факторами х1 и х3 является менее существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии оба фактора: х1  и  х4.

           Проверим выполнение  неравенств для результативного показателя у и факторов х1   и х6.

        ryx1>rx1x6;  0,932>0,894;  выполняется.

        ryx6>rx1x6;  0,765<0,894; не выполняется.

     Первое неравенство  выполняется, а второе не выполняется. Это ещё раз подтверждает что связь между фактором х1 и результативным показателем у  является  существенной. Не выполнение второго неравенства позволяет не включать фактор х6 в уравнение регрессии, но для большей убедительности при принятии такого решения проверим выполнение  неравенств для результативного показателя у и факторов х4   и х6.

        ryx4>rx4x6;  0,865<0,947; не выполняется.

        ryx6>rx4x6;  0,765<0,947; не выполняется.

     Оба неравенства не выполняются. Это указывает на то, что связь между факторами х4 и х6 является более существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии фактор, у которого коэффициент линейной корреляции больше. Так как         ryx4=0,865>rуx6=0,765, то для включения в уравнение регрессии оставляем фактор х4. 

                   Проверим выполнение  неравенств для результативного показателя у и факторов х1   и х7.

        ryx1>rx1x7;  0,932>0,882;  выполняется.

        ryx7>rx1x7;  0,758<0,882; не выполняется.

     Первое неравенство  выполняется, а второе не выполняется. Это ещё раз подтверждает что связь между фактором х1 и результативным показателем у  является  существенной. Не выполнение второго неравенства позволяет не включать фактор х7 в уравнение регрессии, но для большей убедительности при принятии такого решения проверим выполнение  неравенств для результативного показателя у и факторов х4   и х7.

        ryx4>rx4x7;  0,865<0,961; не выполняется.

        ryx7>rx4x7;  0,758<0,961; не выполняется.

     Оба неравенства не выполняются. Это указывает на то, что связь между факторами х4 и х7 является более существенной чем между этими факторами и результативным показателем у. В этом случае рекомендуется оставить для включения в уравнение регрессии фактор, у которого коэффициент линейной корреляции больше. Так как         ryx4=0,865>rуx7=0,758, то для включения в уравнение регрессии оставляем фактор х4. 

      Таким образом, проведённый статистический анализ позволил обосновать целесообразность включения в уравнение регрессии двух факторов: х1 и  х4. Решение о не включении в уравнение регрессии факторов: х5 и х8 принято ввиду несущественности их связи с результативным показателем у. а других факторов: х2, х3, х6, и х7 принято ввиду наличия существенной корреляционной связи между ними с факторами х1 и х4.

      Пример 4.9.3

     Вычислить коэффициенты линейной корреляции между результативными показателями социально-экономическеого состояния населения города Елабуга – уj;  и расходными статьями бюджета - хi; и по вычисленным значениям построить столбчатые диаграммы. Перечень переменных, отобранных для исследования представлен в таблице 4.9.6.

   Таблица 4.9.6. Перечень переменных для примера 4.9.3

Код

Наименование переменной

x1

Статья бюджета “Общегосударственные вопросы” (тыс. руб.)

x2

Статья бюджета “Национальная безопасность и правоохранительная деятельность” (тыс. руб.)

x3

Статья бюджета “Национальная экономика” (тыс. руб.)

x4

Статья бюджета “Жилищно-коммунальное хозяйство” (тыс. руб.)

x5

Статья бюджета “Культура, кинематография и средства массовой информации” (тыс. руб.)

x6

Статья бюджета “Образование” (тыс. руб.)

x7

Статья бюджета “Здравоохранение. Спорт и физическая культура” (тыс. руб.)

x 8

Статья бюджета “Социальная политика” (тыс. руб.)

x 9

Статья бюджета “Межбюджетные трансферты” (тыс. руб.)

z1

Численность населения (тыс. чел.)

z2

Численность населения трудоспособного возраста (тыс. чел.)

z3

Численность работающих на крупных предприятиях (тыс. чел.)

z4

Уровень безработицы (%)

z5

Объем промышленной продукции (млн. руб., до 1997г. – млрд. руб.)

z6

Среднемесячная заработная плата (руб., до 1997г. – тыс. руб.)

z7

Прожиточный минимум на члена семьи (руб., до 1997г. – тыс. руб.)

z8

Стоимость набора из 25 основных продуктов питания (руб., до 1997г. – тыс. руб.)

z9

Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.)

z10

Ввод жилых домов (кв. м. общ. пл.)

z11

Объем реализации платных услуг в расчете на 1 жителя (руб., до 1997г. – тыс. руб.)

z12

Объем реализации бытовых услуг в расчете на 1 жителя (руб., до 1997г. – тыс. руб.)

z13

Оборот розничной торговли на душу населения (руб., до 1997г. – тыс. руб.)

z14

Оборот общественного питания на душу населения (руб., до 1997г. – тыс. руб.)

z15

Обеспеченность населения больничными койками (на 1000 чел.)

z16

Обеспеченность населения врачами (на 1000 чел.)

z17

Обеспеченность населения средним медицинским персоналом (на 1000 чел.)

z18

Общая раскрываемость преступлений (%)

z19

Потребление чистой воды (млн. куб. л.)

z20

Выброс вредных веществ в атмосферу (кг)

z21

Количество автомобилей (шт.)

z22

Отходы животноводческие (тыс. т.)

z23

Отходы бытовые (тыс. т.)

z24

Отходы промышленные (тыс. т.)

y1

Средняя продолжительность жизни (лет)

y2

Рождаемость (тыс. чел.)

y3

Смертность (тыс. чел.)

y4

Естественный прирост (чел.)

y5

Количество зарегистрированных браков (шт.)

y6

Количество расторгнутых браков (шт.)

y7

Разница между заключенными и расторгнутыми браками (тыс. шт.)

y8

Число умерших детей в возрасте до 1 года (на 1000 чел.)

y9

Заболеваемость туберкулезом (на 100 тыс. чел)

y10

Заболеваемость онкологическими заболеваниями (на 100 тыс. чел)

y11

Заболевания органов дыхания (на 1000 чел.)

y12

Заболеваемость системы кровообращения (на 1000 чел.)

y13

Общее количество преступлений (тыс. шт.)

y14

Количество особо тяжких преступлений (тыс. шт.)

y15

Количество тяжких преступлений (тыс. шт.)

y16

Количество преступлений средней тяжести (тыс. шт.)

y17

Количество преступлений небольшой тяжести (тыс. шт.)

y18

Количество умышленных убийств (тыс. шт.)

y 19

Количество причинений вреда здоровью (тыс. шт.)

y20

Количество умышленных причинений тяжкого вреда здоровью (тыс. шт.)

y21

Количество краж (тыс. шт.)

y22

Количество мошенничеств (тыс. шт.)

y23

Количество грабежей (тыс. шт.)

y24

Количество разбоев (тыс. шт.)

y25

Количество вымогательств (тыс. шт.)

y26

Количество неправомерных завладений автомототранспортом (тыс. шт.)

y27

Количество хулиганств (тыс. шт.)

      Коэффициент линейной корреляции вычисляется по формуле:                   

        

        Критическое значение коэффициента линейной корреляции вычисляется по формуле:

        ,

    где tкрит =2.0181 – критическое значение критерия Стьюдента, найдено по статистическим таблицам [11] при  n-2 = 44-2=42 степенях свободы и рекомендуемого уровня значимости α=0.05.

     Коэффициенты линейной корреляции между результативными показателями и бюджетными факторами представлены в таблице 4.8.7. Таблица 4.9.7. Коэффициенты линейной корреляции между переменными

             примера 4.9.3

х1

x2

x3

x4

x5

x6

x7

x8

x9

y1

-0,35

-0,12

0,44

-0,15

-0.25

-0,49

0,20

-0,27

-0,60

y2

0,46

0,44

-0,31

0,05

0,48

0,62

-0,21

0,57

0,26

y3

0,09

-0,00

-0,34

0,10

0,04

0,25

-0,19

0,09

0,21

y4

-0,43

-0,49

0,05

0,03

-0,50

-0,47

0,06

-0,55

-0,10

y5

0,41

0,20

-0,18

0,01

0,29

0,46

0,08

0,33

0,40

y6

0,11

0,02

-0,02

0,17

0,07

0,08

0,15

0,05

0,39

y7

0,36

0,21

-0,18

-0,16

0,27

0,45

-0,05

0,34

0,08

y8

-0,63

-0,51

0,17

0,08

-0,59

-0,69

-0,05

-0,61

-0,37

y9

-0,60

-0,54

-0,01

0,37

-0,56

-0,60

-0,16

-0,61

-0,09

y10

0,12

-0,19

-0,55

0,20

-0,05

0,30

-0,29

-0,02

0,59

y11

-0,16

-0,01

0,21

-0,25

-0,06

-0,17

0,08

-0,09

-0,34

y12

0,37

0,54

0,34

0,06

0,52

0,22

0,28

0,46

-0,08

y13

0,48

0,33

-0,13

0,18

0,42

0,45

0,07

0,43

0,31

y14

0,24

0,05

-0,07

0,36

0,12

0,15

0,17

0,08

0,35

y15

-0,10

-0,17

-0,04

0,36

-0,14

-0,14

0,04

-0,17

0,13

y16

0,71

0,56

-0,19

-0,06

0,65

0,76

0,03

0,71

0,41

y17

0,56

0,41

-0,26

0,09

0,50

0,62

-0,05

0,54

0,44

y18

0,42

0,48

0,18

-0,01

0,43

0,27

0,35

0,51

-0,05

y19

0,38

0,33

-0,05

0,29

0,38

0,40

0,08

0,40

0,36

y20

0,51

0,36

-0,01

-0,05

0,41

0,44

0,28

0,45

0,23

y21

0,53

0,36

-0,13

-0,01

0,45

0,51

0,08

0,49

0,24

y22

0,43

0,29

-0,13

-0,04

0,36

0,41

0,06

0,40

0,16

y23

0,42

0,49

0,08

0,02

0,50

0,39

0,10

0,54

0,06

y24

0,86

0,64

-0,16

0,04

0,75

0,86

0,21

0,79

0,52

y25

0,32

0,14

-0,24

0,03

0,21

0,32

-0,03

0,20

0,34

y26

0,27

-0,03

-0,22

0,03

0,07

0,26

0,10

0,12

0,25

y27

0,04

0,11

-0,04

-0,11

0,09

0,09

-0,07

0,09

0,02

Приведем диаграммы коэффициентов корреляции для наиболее важных результативных показателей условий жизни на рис. 4.9.2 – рис.4.9.4.

Рис. 4.9.2. Диаграмма коэффициентов корреляции для переменной y2

Рис. 4.9.3. Диаграмма коэффициентов корреляции для переменной y10

Рис. 4.9.4. Диаграмма коэффициентов корреляции для переменной у13

        4.10. Множественная корреляция

      Для определения тесноты связи между откликом и несколькими факторами на практике используются следующие коэффициенты: конкордации, множественной корреляции и множественной детерминации.

       Коэффициент конкордации – определяет тесноту связи между произвольным количеством признаков, которые могут быть качественными или количественными. Требуется, чтобы они были проранжированными.

     Коэффициент конкордации вычисляется по следующей формуле:

                                             (4.10.1)

    где mколичество признаков;

           n –  общее количество наблюдений;

          S -  отклонение суммы квадратов рангов от средней квадратов рангов которое вычисляется по формуле:

                                            (4.10.2)

        где  nобщее количество наблюдений; 

               siсумма рангов всех признаков по  i-ой строке.

      Сила связи определяется по критерию Пирсона, вычисляемого по формуле:

                                              (4.10.3)

   Пример 4.10.1

    Вычисление коэффициента конкордации продемонстрируем на примере определения тесноты связи между уставным капиталом, числом акций, выставленных на продажу, и уставным капиталом. Исходные данные и результаты предварительных расчётов представлены в таблице 4.10.1.

     Таблица 4.10.1. Исходные данные примера 4.10.1

Устав.

кап. -х

Число

акций –у

Число рабо-тников -  z

Ранг

х

Ранг

у

Ранг

z

Сумма

строк

Квадр.

сумм

1

29540

856

119

9

7

1

17

289

2

16050

930

125

1

9

2

12

144

3

41020

1563

132

10

10

3

23

529

4

23500

682

141

6

5

4

15

225

5

26250

616

150

7

3

5

15

225

6

17950

495

165

4

2

6

12

144

7

28130

815

178

8

6

7

21

441

8

17510

858

181

3

8

8

19

361

9

17000

467

201

2

1

9

12

144

10

22640

661

204

5

4

10

19

361

Итого

165

2863

           

   Вычислим отклонение суммы квадратов рангов от среднего значения квадратов рангов:

     S= 2863-1652/10=140.5.

    По (4.10.1) вычислим коэффициент конкордации:

    W=12·140.5/(32(103-10))=0.19.

    По (4.10.2) вычислим значение критерия Пирсона:

    χ2=12·140.5/(3·10·(10-1))=6.24.

    По статистической таблице [2] находим критическое значение критерия Пирсона для рекомендуемого уровня значимости α=0.05 и количества степеней свободы n-1=10-1=9:   χ2крит=16.919.  Ввиду того, что вычисленное значение критерия Пирсона не превышает критическое значение делаем заключение об отсутствии связи между откликом – уставным капиталом и двумя факторами: количеством акций, выставленных на продажу, и количеством работников на предприятиях.                  

      Коэффициенты множественной детерминации и корреляции требуют наличия линейной зависимости между откликом и всеми факторами и нормальности всех переменных, используемых в вычислениях. К достоинствам этих коэффициентов относится наличие возможности оценки их существенности.  

       Эти показатели как правило используются для оценки качества уравне-ний регрессии в стандартных процедурах регрессионного анализа. Они  так-же могут использоваться и для самостоятельных расчётов по определению силы связи между случайными переменными. Вычисления являются матрич-ными и поэтому при проведении вычислений без применения компьютеров  сложными.

     Для вычисления коэффициента множественной детерминации требуется первоначально вычислить парные коэффициенты линейной корреляции между  всеми переменными, т.е. откликом и всеми факторами и составить соответствующую матрицу. Коэффициент множественной детерминации –

R2y,x1,x2,…xm  делением определителя матрицы Δ* на определитель матрицы Δ.

        ryx1      ryx2      …   ryxm         0

       1        rx1x2    …   rx1xm         rx1y 

Δ*=

 rx2x1     1        …   rx2xm         rx2y                                         (4.10.4)                                                                         

          

           rxmx1  rxmx2    …    1          rxmy

  

       1        rx1x2    …   rx1xm         

Δ  =

 rx2x1     1       …   rx2xm                                                        (4.10.5)                                                                   

          

           rxmx1  rxmx2    …    1          

  

R2yx1x2…xm  = Δ*/ Δ.                                                    (4.10.6)

Rкор,yx1x2…xm  = √Δ*/ Δ.                                               (4.10.7)

    По статистическим таблицам [11] находим критические значения коэффициентов множественной детерминации и корреляции для рекомендуемого уровня значимости α=0.05 и количества степеней свободы равного количеству наблюдений минус 1, и если вычисленные по (4.10.6) и (4.10.7) значения превышают критические, то корреляционная связь между откликом и факторами считается существенной.                                           

        Для простоты приведём пример вычисления коэффициентов детермина-ции и корреляции для результативного показателя у – добычи нефти  и двух наиболее существенно влияющих на неё факторов: х1разведочного бурения и х2количества добывающих скважин.

       Пример 4.10.2

     Провести корреляционный анализ показателей нефтегазодобывающей отрасли России, приведённых в таблице 4.10.2, полученные по таблице 4.9.4. Для упрощения формул фактор х4 таблицы 4.9.4 переименован в фактор  х2.

Таблица 4.10.2. Исходные данные для примера 4.10.2

Показатель

Код

1996 г.

1977 г.

1998 г.

1999 г.

2000 г.

2001 г.

2002 г.

Добыча нефти

в млн. тонн

y

269,91

270,94

264,70

268,53

281,29

301,73

341,60

Разведочное бурение

в тыс. метрах

x1

1026,4

1006,7

789.0

824,9

1013,7

1145,1

1410,4

Кол. добываю-

щих скважин

х2

106645

101224

97557

101937

109939

114883

113672

       По данным таблицы 4.10.2 вычислены коэффициенты линейной корре-ляции между всеми переменными и результаты вычислений помещены в таблицу 4.10.3.

   Таблица 4.10.3. Коэффициенты линейной корреляции для переменных   

                           примера 4.10.2

Коды

y

x1

x2

y

1

0,932

0,865

x1

0,932

1

0,831

x2

0,865

0,831

1

Коэффициент множественной детерминации вычисляется по формуле:

                                       (4.10.8)

Коэффициент множественной корреляции вычисляется по формуле:

                   (4.10.9)   

     Проведём вычисления по формулам (4.10.8) и (4.10.9):

   

           

   По шкале Чеддока коэффициент множественной корреляции попадает в диапазон значений от 0.5 до 0.7 и следовательно корреляционная связь меж-ду  результативным показателем у – добычи нефти  и двух  влияющих на неё факторов: х1разведочного бурения и х4количества добывающих скважин должна быть отнесена к заметным.  

     Полезно бывает вычислить и частные коэффициенты корреляции, кото-рые исключают влияние всех факторов кроме одного,  по следующим формулам:

                              (4.10.10)

                               (4.10.11)

    Естественно, что влияние фактора х1 на  х2 без учёта влияния результатив-ного показателя у такое же как влияние фактора х2 на  х1 без учёта влияния результативного показателя у:

                  (4.10.12)

          По формулам (4.10.10) – (4.10.12) вычислим частные коэффициенты корреляции.  

  

 

      Частные коэффициенты линейной корреляции уменьшают значения коэффициентов линейной корреляции за счёт исключения совместного влияния  переменных, что не противоречит здравому смыслу.     




1. Составление уравнений окислительно-восстановительных реакций
2. задание по специальности [5] 4
3. Cure
4. идентификаторы программы 9
5. Гуманистическое направление в воспитании и образовании в деятельности ВА Сухомлинского
6. тема показателей характеризующих финансовое состояние предприятия и методы их расчета
7. статья- Античные Олимпийские игры Олимпийские игры Древней Греции представляли собой религиозный и спорти
8. Контрольная работа По дисциплине- Английский язык
9. Охорона праці. Назвіть основні етапи розвитку охоро
10. 664018-6126219 Діагностика та лікування ендокринної неплідності у жінок в залежності від стану
11. колесом. Способствовать развитию координации ловкости
12. политичесикх процесса- либеральная оппозиция приближалась к реальной власти но в то же время все громче за
13. .Дитині 7 р. батьки відзначають блідість шкіри і біль в поперековій ділянці головний біль
14. Деятельность социального педагога по профилактике склонности к наркомании старших подростков
15. Формирование ролевой игры у умственно отсталых детей дошкольного возраста в условиях детского сада
16. Организация адвокатуры
17. на тему- Проявление симметрии в различных формах материи Выполнен студентом- Коше
18. Особливості системи контролю за навчально-виховним процесом у сучасній загальноосвітній школі
19. ВНЕШНЯЯ ОБОРОННАЯ ПОЛИТИКА РФ ДИПЛОМАТИЧЕСКАЯ СЛУЖБА Ю
20. Дойл Союз рыжих Это было осенью прошлого года