Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Кировская государственная медицинская академия Методы статистического анализа в медицине

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 23.11.2024

PAGE  1

Федеральное агентство по здравоохранению и социальному развитию

ГОУ ВПО «Кировская государственная медицинская академия»

Методы статистического анализа в медицине

Учебное пособие

для студентов медицинских вузов

Киров 2006

Методы статистического анализа в медицине

Методы статистического анализа в медицине

УДК 614.1(075.8)

ББК51.1(2)

М42

Печатается по решению Редакционно-издательского совета Кировской государственной медицинской академии.

Методы статистического анализа в медицине: Учебное пособие для студентов медицинских вузов / сост. И.В. Шешунов, Б.А. Петров, Д.С. Симкин, Е.И. Дорманчева, Б.Б. Нилов; Кировская государственная медицинская академия - Киров, 2006. - 112 с.

Рецензенты:

Кича Д.И., доктор медицинских наук, профессор, заведующий кафедрой гигиены, общественного здоровья и здравоохранения Российского университета дружбы народов.

Комаров Г.А. , доктор медицинских наук, профессор, заведующий кафедрой общественного здоровья и здравоохранения Московского медико-стоматологического университета.

Рекомендуется Учебно-методическим объединением по медицинскому и фармацевтическому образованию вузов России в качестве учебного пособия для студентов медицинских вузов.

©  Шешунов  И.В.,   Петров Б.А.,   Симкин  Д.С.,   Дорманчева  Е.И.. Нилов Б.Б - Киров, 2006

© Оформление Нилов Б.Б. - Киров, 2006

© КГМА, Кафедра общественного здоровья и здравоохранения.

Методы статистического анализа в медицине

ОГЛАВЛЕНИЕ

НАИМЕНОВАНИЕ

СТР.

Раздел 1.

Введение. Определение статистики. Разделы медицинской статистики, задачи.

6

Раздел 2

Основные понятия в статистике

7

2. 1

Статистическая совокупность

7

2. 2

Единица наблюдения и учетные признаки

8

2. 3

Виды статистической совокупности

8

2.4

Понятие о репрезентативности

9

2.4.1

Способы формирования выборочной совокупности

9

2.4.2

Необходимая численность выборки

9

Раздел 3

Организация статистического исследования

10

3.1

1этап

11

3.1.1

Цель и задачи исследования

11

3.1.2

Программа сбора материала

11

3.1.3

Программа разработки полученных данных

11

3.1.3.1

Виды статистических таблиц

11

3.1.3.2

Виды статистического наблюдения

12

3.2

II этап

13

3.3

III этап

13

3.4

IV этап

13

3.4.1

Виды графических изображений

13

3.5

V этап

15

3.6

Контрольные вопросы к разделам 1, 2, 3

16

Раздел 4

Относительные величины

16

4.1

Экстенсивные показатели

17

4.2

Интенсивные показатели

17

4.3

Показатели соотношения

18

4.4

Показатели наглядности

18

4.5

Динамические ряды

19

4.5.1

Типы динамических рядов

20

4.5.2

Выравнивание уровней динамических рядов

20

4.5.2.1

Укрупнение интервалов

20

4.5.2.2

Вычисление групповой средней

20

4.5.2.3

Расчет скользящей средней

20

4.5.3

Показатели динамического ряда

21

4.6

Задача - эталон

23

4.7

Контрольные вопросы

24

4.8

Задачи для самостоятельного решения

24

Раздел 5

Средние величины

26

5.1

Вариационный ряд и методика его составления

26

5.2

Виды средних величин, методика их вычисления

28

5.3

Методы оценки разнообразия признака в статистической
совокупности

31

5.3.1

Критерии, характеризующие границы совокупности (лимит, амплитуда)

31

5.3.2

Критерии характеризующие внутреннюю структуру совокупности

31

5.3.2.1

Расчет среднеквадратического отклонения

32

5.3.2.2

Расчет коэффициента вариации

33

5.4

Контрольные вопросы

34

5.5

Задачи для самостоятельного решения

34

Раздел 6.      

Статистическая оценка достоверности результатов

35

6.1

Определение ошибки репрезентативности

36

6.2

Определение доверительных границ генеральной совокупности

37

6.3

Оценка достоверности разности результатов исследования

38

6.4

Типичные ошибки, допускаемые при применении методов
оценки и достоверности результатов исследования

40

6.5

Задачи-эталоны

40

6.6

Контрольные вопросы

41

6.7

Задачи для самостоятельного решения

41

Раздел 8

Методы стандартизации

41

8.1

Прямой метод стандартизации

42

8.2

Косвенный метод стандартизации

45

8.3

Обратный метод стандартизации

46

8.4

Контрольные вопросы

47

8.5

Задачи для самостоятельного решения

47

Раздел 9

Корреляционный анализ

48

9.1

Вычисление корреляционной зависимости методом квадратов

49

9.2

Вычисление корреляционной зависимости методом рангов

50

9.3

Контрольные вопросы

52

9.4

Задачи для самостоятельного решения

52

Литература

54

Методы статистического анализа в медицине

РАЗДЕЛ 1

ВВЕДЕНИЕ. ОПРЕДЕЛЕНИЕ СТАТИСТИКИ.

ВИДЫ МЕДИЦИНСКОЙ СТАТИСТИКИ.

Слово «статистика» происходит от латинского слова «status» - состояние, положение. Впервые это слово при описании состояния государства в середине XVIII века применил немецкий ученый Ахенваль. Как наука статистика возникла в Англии в XVIII веке в трудах «политических арифметиков». В настоящее время слово «статистика» употребляется в трех значениях.

Первое значение: статистика - это общественная наука, которая изучает количественную сторону общественных, массовых явлений в неразрывной связи с их качественной стороной.

Второе значение: статистика - это сбор цифровых, статистических данных, характеризующих то или другое общественное явление или процесс (статистическая технология).

Третье значение: статистика - это сами цифры, характеризующие эти явления и процессы.

Таким образом, «статистические данные», или «данные статистики» -цифры, которые характеризуют количественные аспекты массовых явлений, процессов, состояний. Как наука статистика включает в себя общую теорию статистики, статистику народного хозяйства и различные отраслевые статистики. Как каждая наука, статистика имеет свой предмет исследования - массовые явления и процессы общественной жизни, свои методы исследования - статистические, математические, разрабатывает системы и подсистемы показателей, в которых отражаются размеры и качественные соотношения общественных явлений.

Статистика изучает количественные уровни и соотношения общественной жизни в неразрывной связи с их качественной стороной. Статистика имеет и свои собственные методы. Это методы массового наблюдения, группировок, таблиц и графиков. Главная задача статистики, как и всякой другой науки, заключается в установлении закономерностей изучаемых явлений.

Статистические методы широко применяют в различных областях знаний: в математике, физике, астрономии, биологии, медицине и т.д.

Статистика — наука, изучающая количественную сторону массовых явлений в неразрывной связи с их качественной стороной. В зависимости от того, какую сторону явлений жизни изучает данная отрасль статистики, она получает специальное название. Так, существует промышленная, сельскохозяйственная, коммунальная, судебная статистика и другие.

Медицинская статистика рассматривает человека как социально обусловленное существо, занимается изучением не только показателей здоровья, но и факторов ею определяющих.

Статистический метод позволяет

- познать действительность, выявить закономерности, установить связь между явлениями

- дать объективную оценку существующего положения

- составить прогноз, предвидеть развитие здравоохранения и показателей здоровья людей

Медицинская статистика делится на два основных раздела:

- статистика здоровья населения

- статистика здравоохранения

Статистика здоровья населения изучает

- санитарное состояние населения, т е   здоровье населения с помощью показателей   заболеваемость и травматизм, инвалидность, физическое развитие, естественное движение населения (рождаемость, смертность,
естественный  прирост населения, средняя  продолжительность  предстоящей жизни, брачность и др.)

- причины, которые приводят к отклонениям в состоянии здоровья людей (санитарная этиология)

-    необходимость  проведения  лечебно-профилактических  и  социально-оздоровительных мероприятий

- санитарное состояние населения — это комплексная характеристика здоровья

Статистика здравоохранения изучает

- сеть медицинских учреждений: их достаточность, профилизацию по отдельным специальностям, качество работы,

- кадры медицинских работников, качество их деятельности,

- вопросы планирования, финансирования и экономики здравоохранения.

В медицине статистические приемы используют при клинико-гигиеническом нормировании факторов производственной среды, оценке эффективности примененных методов профилактики или лечения тех или иных заболеваний, при расчете доз лекарственных препаратов, определении стандартов физического развития и т. д. Статистический анализ позволяет обосновать ту или иную тактику врача в предупреждении или лечении заболеваний

Таким образом, каждый врач должен хорошо знать теоретические основы статистики, уметь правильно использовать статистические методы и оценивать информацию, накопленную в различных областях его деятельности

Методы статистического анализа в медицине

2.2 Единица наблюдения и учетные признаки

Единица наблюдения — каждый первичный элемент, составляющий статистическую совокупность.

Например, перед нами поставлена задача — изучить исходы лечения больных с гипертонической болезнью за год. За единицу наблюдения будет взят больной гипертонической болезнью, прошедший курс лечения в этом году.

Каждая единица наблюдения имеет много признаков, однако учитываются только те из них, которые необходимы для достижения поставленной цели и решения конкретных задач исследования.

Учетные признаки - признаки, подлежащие регистрации в ходе статистического исследования (пол, возраст, профессия, стаж работы и т.п.)

Классификация учетных признаков

Учетные признаки

атрибутивные (описательные) 

Количественные

(выражены числом) 

пол, профессия, нозологические формы, исходы лечения, вредные привычки, место жительства и т.д. 

рост, масса тела, число дней лечения, количество гемоглобина, количество белка в моче и т.д. 

факторные 

результативные 

факторные 

результативные 

методы профилактики лечения, профессия и т.д. 

исход заболевания (выздоровление инвалидность, смерть) 

возраст 

рост, масса тела, количество белка в моче и т.д. 

          Атрибутивные (качественные) учетные признаки выражены словесно (имеют описательный характер). К атрибутивным признакам относятся пол, профессии, нозологические формы, исходы лечения, место жительства и др.

         Количественные учетные признаки выражены числом. К количественным признакам относят рост, массу тела, число дней лечения, количество белка в крови, количество гемоглобина и др.

         Врачом должно быть выявлено влияние отдельных признаков на изучаемое явление, поэтому по роли признаков в совокупности различают факторные и результативные.

       Факторные признаки — признаки, под влиянием которых изменяются другие, зависящие от них результативные признаки

       Результативные признаки — признаки, зависящие от факторных.

Приняты определенные обозначения этих признаков:

X — факторный признак

У — результативный признак

В зависимости от полноты охвата факторных и результативных признаков можно выделить четыре типа исследований:

1 тип — изучение влияния одного фактора на один результативный показатель (например, влияние курения на развитие рака легких)

Х→У

2 тип — изучение влияния комплекса факторов на один результативный показатель (например, влияние социально-гигиенических факторов на развитие рака легких)

∑ Х→У

3 тип — изучение влияния одного фактора на комплекс результативных показателей (например, влияние курения на здоровье населения)

                                                      Х→∑ У

4 тип — изучение влияния комплексных факторов на комплекс результативных показателей (например, влияние социально-гигиенических факторов на здоровье населения)

  ∑Х→∑У

2.3 Виды статистической совокупности

Статистическая совокупность может быть генеральной и выборочной.

Генеральная совокупность — состоит из всех единиц наблюдения, которые могут быть к ней отнесены в зависимости от цели исследования.

Выборочная совокупность — часть генеральной совокупности, отобранная специальным методом.

Она должна отвечать определенным требованиям: взятая для исследования часть должна быть репрезентативной всей генеральной совокупности, всему изучаемому явлению.

  1.  Понятие о репрезентативности

Репрезентативность выборочной совокупности — количественная и качественная представительность (типичность) всех составляющих ее признаков по отношению к признакам генеральной совокупности.

Для обеспечения репрезентативности выборочной совокупности к ней предъявляют два основных требования:

- она должна обладать характерными чертами генеральной совокупности,

 - взятая часть должна быть минимально достаточной по объему.

Репрезентативность выборки зависит от способа формирования выборочной совокупности, т. е. от способа отбора единиц наблюдения.

2.4.1 Способы формирования выборочной совокупности

Выборки подразделяются в зависимости от правил формирования на:

  •  случайную
  •  механическую
  •  типическую
  •  серийную
  •  комбинированную

Случайная выборка формируется путем отбора единиц наблюдения наугад (по начальной букве фамилии, дню рождения и т. д.)

Механическая выборка формируется с помощью механического (арифметического) подхода к отбору единиц наблюдения. Например, из всей совокупности берется для изучения каждая 5-ая или 10-ая единица наблюдения.

Типическая (или типологическая) выборкаэто выборка, при формировании которой генеральная  совокупность предварительно разбивается на типы с последующим отбором единиц наблюдения из каждой типической группы. Так, например, предварительно можно разделить исследуемую группу по возрасту, полу, профессии, образованию, отобрать из нее необходимое число единиц наблюдения.

Серийная выборка формируется с помощью отбора не отдельных единиц наблюдения, а целых групп, серий или гнезд. Отбор серий осуществляется с помощью случайной или механической выборки.

Комбинированная выборка предполагает использование нескольких способов выборки.

Необходимая численность выборки

После того как определен способ отбора единиц наблюдения для выборочной совокупности, определяют объем выборки, т.е. число единиц в выборке, которое обеспечит достоверность и надежность результатов.

Непременным условием обоснованного расчета необходимого числа наблюдений в опыте или исследовании является определение возможной ошибки, т.е. максимально допустимого отклонения результатов выборочного исследования от генеральных значений.

Так, например, основным показателем, характеризующим здоровье детей изучаемых районов, выбран процент неболевших детей. По данным литературы он равен приблизительно 10. Какую предельную ошибку можно допустить, чтобы интервал колебания показателя был, допустим для оценки? Такую ошибку примем равной ± 5%, т.е. показатель в выборке может быть 10 + 5% и 10 - 5% (от 5 до 15%).

Математическая статистика предлагает следующую формулу для определения предельной ошибки показателя

где А - предельная ошибка показателя, р - величина показателя (для изучаемого признака), q (1-р) или (100 — р) в зависимости от того, в каких величинах выражается показатель, n - число наблюдений, t - коэффициент, показывающий, какова вероятность (надежность), что действительные размеры показателя не будут выходить за границы предельной ошибки. Обычно t берется равным 2, что обеспечивает высокую достоверность будущего результата (95% вероятность безошибочного прогноза).

Исходя их формулы предельной ошибки, можно вывести формулу необходимого числа единиц наблюдения:

отсюда

n =

t2pq

∆2

Вычисляем:

n =

t2pq

=

22х10х90

= 144

∆2

52

Допуская предельную ошибку будущего показателя равной 5%, определяем, что должно быть, отобрано 144 ребенка в группу наблюдения. Увеличив точность исследования, а значит, уменьшив предельную ошибку до 2%, получим:

n =

t2pq

=

22х10х90

= 900

∆2

22

Если известна величина генеральной совокупности для расчета необходимого числа наблюдений, используют формулу бесповторного отбора:

n =

Nt2pq

∆2N +t2pq

n =

t22

∆2N + t22

  или    

где N – численность генеральной совокупности (т.е. весь имеющийся .материал),

n - необходимое число наблюдений в выборке,

— среднее квадратическое отклонение.

Первая формула используется для показателей, вторая для средней величины.

Когда изучаются количественные признаки (физическое развитие, длительность заболевания, содержание веществ в крови, тканях, воздухе, воде и т.д.), при расчете необходимого числа наблюдений применяют формулу предельной ошибки средней величины:

 ∆ =

t

√n

   отсюда

n =

t22

∆2

Для расчета объема выборки в этом случае следует знать вариабельность признака () из предыдущих исследований или получить ее путем проведения пробных выборок, а также определить допустимую ошибку (∆).

Например, основным результативным признаком должна быть жизненная емкость легких. Из предыдущих исследований известно, что ее размеры 4000 мл при = 500 мл. Ошибка, которая может быть допущена, равна 100 мл, т.е. средняя величина будет, возможно не 4000 мл, а колебаться в пределах ошибки (±100 мл), т.е. от 3900 до 4100 мл, тогда

n =

t22

=

22х5002

= 100

∆2

1002

Для того чтобы можно было судить о величине жизненной емкости легких с предусмотренной ошибкой, необходимо обследовать 100 детей. Выборочный метод наблюдения - научно обоснованный прием статистического исследования. Он позволяет достаточно точно и надежно изучать явления на основе не всей совокупности, а лишь ее части.

Для массовых исследований, охватывающих большое число наблюдений, предварительно рекомендуется провести пробное исследование на более ограниченном материале. Пробное исследование позволяет проверить на практике программу наблюдения, документ регистрации, выявить организационные трудности наблюдения и тем самым будет способствовать совершенствованию исследования.

РАЗДЕЛ 3

ОРГАНИЗАЦИЯ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ

Социально гигиенические исследования проводятся в несколько этапов:

I этап — Составление программы и плана статистического исследования.

II этап — Организация и проведение сбора необходимых данных, предусмотренных программой исследования.

III этап — Осуществление обработки собранных данных (контроль, группировка, шифровка, вычисление статистических показателей, сводка в статистические таблицы).

IV этап — Анализ результатов статистического исследования.

V этап — Внедрение результатов в практику и оценка эффективности.

Каждый из указанных этапов статистического исследования состоит из ряда компонентов, имеет свои особенности и требует тщательного выполнения, так как любая небрежность или ошибка может исказить или осложнить выполнение всей работы.

3.1 Первый этап — составление программы и плана статистического исследования.

Этот этап представляет важный раздел работы, который можно правильно осуществить только при наличии глубоких знаний по изучаемому вопросу и четкого представления о цели исследования.

3.1.1 Цель и задачи исследования

Цель исследования должна быть актуальной для медицинской науки и практики здравоохранения. Цель должна быть сформулирована четко и недвусмысленно. В программе указывают не только цель, но и задачи исследования.

Задача исследования — это конкретизированное и уточненное определение цели.

Программа статистического исследования предусматривает решение следующих вопросов:

Составление программы сбора материалов;

Составление программы разработки материала;

Составление программы анализа собранного материала.

К составлению программы предъявляются определенные требования:

- единица наблюдения должна включать все признаки, подлежащие изучению,

- программа исследования должна содержать четкую формулировку вопросов,

- при составлении программы необходимо знание состояния изучаемой проблемы по литературным данным.

3.1.2 Программа сбора материала

Программа сбора материала представляет документ с перечнем вопросов, на которые необходимо получить ответы при проведении данного исследования, это может быть как специально составленный исследователем опросной лист, анкета, карта, так и официальный документ (история болезни, карта выбывшего из стационара, листок нетрудоспособности и др.)

При составлении учетного документа необходимо соблюдать следующие правила:

- документ должен иметь четкое заглавие, в котором сформулирована единица наблюдения,

- вопросы должны быть четкими, краткими, соответствовать цели и задачам исследования,

- на каждый вопрос (если это возможно) следует предусмотреть варианты ответов в соответствии с принятой группировкой изучаемых признаков.

3.1.3.  Программа разработки полученных данных

Программа разработки полученных данных предусматривает группировку признаков и составление макетов статистических таблиц. Под группировкой понимается распределение совокупности единиц наблюдения на однородные группы по одному или нескольким признакам.

Виды группировки различают в зависимости от признака, положенного в основу классификации.

Группировка, произведенная по атрибутивным (качественным) признакам называется типологической или атрибутивной, по количественному признаку — вариационной,

Учетный материал может быть сгруппирован по социально-демографическим признакам (возраст, семейное положение), по климато-географическим признакам (место жительства, сезон), по социально-экономическим признакам (профессия, должность, образование), по состоянию здоровья (группы риска, группы диспансерного наблюдения), по типам учреждений (поликлиника, стационар, диспансер) и т. п.

Программа разработки материала предусматривает также и составление макетов статистических таблиц.

3.1. 3.1. Виды статистических таблиц

К статистической таблице предъявляют определенные требования, а именно: таблица должна иметь четкое заглавие, которое должно полностью отражать содержание таблицы; таблицы не должны быть очень громоздкими, наличие итоговых данных как по горизонтали, так и по вертикали и т. д. В таблицах различают подлежащее и сказуемое.

Статистическое подлежащее это то, о чем говорится в таблице, это основной признак изучаемого явления.

Статистическое сказуемое — то, что характеризует подлежащее с помощью различных признаков.

Простая статистическая таблицатаблица, позволяющая анализировать данные по сказуемому, имеющему лишь один признак.

Число больных, признанных инвалидами, работающие на химическом комбинате по классам болезней в данном году

Класс болезней 

Количество больных 

  1.  Болезни нервной системы 
  2.  

 2. Злокачественные новообразования

 3. Психические расстройства

 4. Болезни системы кровообращения

 5. Болезни органов дыхания

                                    Итого:

Групповая таблица — таблица, позволяющая анализировать данные по сказуемому, имеющему два и более признаков, не связанных между собой.

Распределение       больных,        признанных       инвалидами,       работающие химическом комбинате по классам болезней, полу, возрасту в данном году

Класс болезней

пол 

Возраст 

М 

Ж 

до 20

21-29

 

30-39

40-49

50 и старше

итого

1. Болезни нервной системы 

2. Злокачественные новообразования 

3. Психические расстройства 

4. Болезни системы кровообращения 

5 Болезни органов дыхания 

                       Итого: 

 

           Комбинационная таблица — таблица, позволяющая анализировать данные по сказуемому, имеющему два и более признаков, связанных между собой.

Распределение        больных,        признанных        инвалидами,        работающие на химическом комбинате по классам болезней, полу, возрасту в данном году

 

Класс болезней

       Возраст

До 20

21-29

 30-39

 40-49

 50 и старше

итого

м

ж

М

Ж

М

Ж

М

ж

М

ж

1. Болезни нервной системы

2. Злокачественные новообразования

3. Психические расстройства

4. Болезни системы кровообращения

5. болезни органов дыхания

Итого

Проведение социально-гигиенических исследований и получение объективных результатов в значительной степени зависит от качества организационного плана. Организационный план — документ, в котором представлены вопросы организации и проведения статистического исследования с указанием конкретных сроков. В организационном плане указываются этапы статистического исследования, детали каждого этапа, сроки выполнения и условия при которых каждая конкретная задача может быть выполнена. В организационном плане должны найти свое отражение такие вопросы, как обеспечение информационными материалами, финансовыми и техническими средствами, кадрами.

3.1.3.2 Виды статистического наблюдения

Важнейшее место на этапе организации исследования принадлежит выбору вида наблюдения и метода формирования статистической совокупности. Различают два вида наблюдения:

Текущее (или постоянное)

Единовременное (или одномоментное)

Текущее наблюдение — когда регистрация проводится постоянно (например, каждый случай рождения, смерти, обращения в лечебное учреждение и т. д.)

Единовременное наблюдение — когда изучаемые явления фиксируются на какой-либо определенный момент (например, перепись населения, состав коечного фонда стационара и т. д.).

В зависимости от степени охвата объекта исследования принято различать:

- сплошное статистическое исследование,

- несплошное статистическое исследование.

Сплошным называют такое статистическое исследование, при котором изучаются все единицы наблюдения объекта исследования.

Несплошным называют такое статистическое исследование, при котором изучается часть совокупности для характеристики целого.

Несплошное наблюдение бывает нескольких видов:

- монографическое

- метод основного массива

- выборочное исследование

Монографический метод применяется при изучении какого-либо одного объекта, одной какой-либо единицы,

         Этот вид наблюдения широко используется при изучении передового опыта или, наоборот, отстающего учреждения. Метод основного массива охватывает большую часть единиц изучаемого объекта наблюдения. Он применяется при изучении тех объектов, в которых сосредоточено большинство изучаемых явлений. Этот метод иногда называют несовершенным сплошным.

Основным недостатком монографического метода и метода основного массива является отсутствие возможности распространения полученных данных на весь объект исследования.

Из всех методов несплошного наблюдения только выборочный позволяет распространить результаты, полученные на части единиц наблюдения, на всю совокупность. Для этого выборочная совокупность должна быть репрезентативной.

   

3.2. Второй этап — организация и проведение сбора необходимых данных, предусмотренных программой исследования. На этом этапе основное внимание должно быть уделено соблюдению правил регистрации, охвату всех
включенных в исследование единиц наблюдения, достоверности собираемых данных. Нельзя нарушать порядок отбора единиц наблюдения, пропускать, исключать отдельные случаи, подменять одни единицы наблюдения другими.

3.3. Третий этап — обработка данных.

Он включает в себя два основных подэтапа:

группировку данных

статистическую сводку и обработку.

На этом этапе, прежде чем провести группировку материала, необходимо осуществить контроль качества собранного материала с целью отбора учетных документов, имеющих дефекты, для их последующего исправления и дополнения или исключения из исследования. На этом этапе производят также, если это необходимо, шифровку или кодирование.

После заключительного контроля качества учетных документов и шифровки, распределяют единицы наблюдения по однородным группам, т. е. проводят группировку материала. Затем заполняют статистические таблицы и вычисляют статистические показатели.

3.4. Четвертый этап — анализ результатов статистического исследования. После обработки статистических данных, расчета различных показателей, индексов, коэффициентов переходят к анализу полученных результатов.
При проведении статистического анализа полученные данные сопоставляют (сравнивают) с нормативами, со средними уровнями аналогичных величин, со стандартами, с данными по другим учреждениям и территориям,
литературным данными, в динамике. В заключении делают выводы и намечают тактические действия.

Большое значение для анализа полученных результатов имеет использование графического изображения, так как оно позволяет представить их более наглядно и лаконично.

3.4.1 Виды графических изображений

Основными типами графических изображений, которые можно использовать в медицинской статистике, являются диаграммы: линейные (координатные), столбиковые, секторные, на системе полярных координат и изобразительные (фигурные). В качестве вспомогательного средства для изображения территориальных различий и распространения изучаемого явления используются картограммы и картодиаграммы.

Линейные диаграммы

Линейные диаграммы, или графики, строятся на прямоугольной системе координат. В таких диаграммах на оси абсцисс (горизонтальной линии) откладываются в виде равных отрезков слева направо числовые значения одного ряда величин (промежутки времени, возрастные периоды и т. п.), а на оси ординат (вертикальной линии) снизу вверх — значения другого ряда. Точка пересечения оси абсцисс и оси ординат соответствует нулевой точке обеих шкал. Из точек, отложенных на оси абсцисс, проводятся параллельные оси ординат линии, высота которых соответствует величине изображаемого явления. Конечные точки всех проведенных ординат соединяются ломаной линией, которая дает представление о динамике изучаемого явления.

Примером такой диаграммы является температурный лист, по оси абсцисс которого обозначены сроки измерения температуры, а на оси ординат — температура в градусах. Температурная кривая отражает динамику  температуры у больного. При помощи линейных диаграмм можно также изображать взаимозависимость двух явлений.

В медицинской статистике при помощи линейных диаграмм целесообразно изображать динамику показателей движения населения, заболеваемости, изменение сети медико-санитарных учреждений и т. п. Для сравнительного исследования динамики нескольких однородных явлений на одной и той же диаграмме можно изобразить несколько линий, отличающихся друг от друга цветом, различной толщиной или различной формой пунктира.

Столбиковые диаграммы

Диаграммы, построенные по такому же принципу, как и линейные, но в которых вертикально или горизонтально проводимым линиям соответствуют прямоугольники, являются простейшим примером столбиковых диаграмм.

      Число жителей

   

2000  2001   2002   2003  2004

Число жителей

(наличное, в тыс. на 1 января текущего года)

Эти диаграммы особенно удобны при изображении не динамики явлений, а сравнительной величины их в какой-либо определенный промежуток времени.

Секторные диаграммы

Секторные диаграммы могут быть круговыми или полосовыми.

Секторные диаграммы круговые представляют собой круг, отдельные секторы которого соответствуют частям изображаемого явления. Такие круги удобно применять для изображения распределения явления на составные части, т. е. для графического отражения совокупности экстенсивных коэффициентов.

                                           20% до 5 лет

                               50%  5-10 лет

                                   25%   11-15 пет

                               5%  16 и более лет

Распределение врачей по стажу работы в ЦРБ

В круговых секторных диаграммах секторы, изображающие отдельные части изучаемого явления, располагаются в порядке их возрастания или уменьшения по движению часовой стрелки и покрываются красками различного цвета или различно заштриховываются.

При пользовании одновременно 2-3 секторными диаграммами, на которых изображено одно и то же явление, но за различное время или у различных групп населения, порядок чередования секторов может быть неодинаков, но необходимо, чтобы секторы различных кругов, отображающие относительные размеры одной и той же части явления за различные промежутки времени, имели одинаковый цвет или штриховку прямоугольниками, деля их на части, соответствующие по значению частям явления.

Кругами и прямоугольниками различной величины можно также изображать сравнительную величину двух или нескольких явлений. Следует только помнить, что площади прямоугольников при равных основаниях пропорциональны их высотам и прямоугольник, имеющий вдвое большую высоту, ограничивает и вдвое большую площадь; площади кругов пропорциональны не радиусам, а квадратам радиусов, и, следовательно, круг, имеющий вдвое больший радиус, будет иметь площадь, большую не в два, а в четыре раза.

Диаграммы на системе полярных координат (радиальные)

Диаграммы, построенные на системе полярных координат, пригодны для изображения сезонных (помесячного, подекадного, понедельного и т. п.) колебаний уровня заболеваемости какой-либо болезнью, размеров смертности, рождаемости и т. п. Для построения таких диаграмм круг делят на сектора. Длина радиуса круга соответствует среднему уровню.

•Уровень травматизма

Сезонные колебания (по месяцам года) уровней

транспортного травматизма в текущем году в городе N

На каждом радиусе откладывают и отмечают точкой величину, соответствующую уровню заболеваемости или смертности в данном месяце. Если в этом месяце заболеваемость или смертность была выше среднегодовой, ее отмечают за пределами круга на продолжении радиуса. Расположение месяцев года на радиусах круга соответствует движению часовой стрелки (сверху направо вниз и дальше налево вверх). Отмеченные точки соединяются ломаными линиями. Получаются характерные фигуры, наглядно изображающие сезонность.

Картограммы

Картограммами называются диаграммы, в которых изображено распределение какого-либо явления по территории. Например, если нужно распределить области Российской Федерации по величине коэффициентов рождаемости в 2004 г., то, определив коэффициенты рождаемости для каждой республики, края и области, покрывают на карте РФ эти регионы соответствующей раскраской или штриховкой, обозначающей различные размеры коэффициентов.

Картодиаграммы

Картодиаграммы также рисуются на карте (или схеме карты). В каждой части территории помещается диаграмма (столбиковая или секторная диаграмма), показывающая динамику или состав изображенного на картодиаграмме явления в различных частях данной территории.

Каждая диаграмма, к какому бы типу графических изображений она ни относилась, должна иметь четкую и ясную, по возможности краткую надпись, поясняющую изображение. Шкалы на диаграмме должны быть снабжены указателями размеров. Числа рекомендуется надписывать на самой диаграмме или в прилагаемой к ней таблице. Все условные обозначения должны быть объяснены.

3.5 Пятый этап — внедрение результатов исследования в практику и оценка эффективности.

Социально-гигиеническое исследование должно заканчиваться внедрением их результатов в практику. В зависимости от целей и задач исследования возможны различные варианты практического использования результатов работы.

Полученные данные могут быть использованы в докладах и лекциях, по материалам исследования можно подготовить приказ, методические рекомендации, инструкцию, положение и т. д. На основе результатов исследования может быть проведена реорганизация деятельности медицинского учреждения, результаты работы могут быть оформлены как рационализаторские предложения, изобретения, открытия, могут быть опубликованы в печати.

Внедрение результатов исследования в практику здравоохранения является нередко трудным и многоэтапным процессом.

3.6 Контрольные вопросы к разделам 1, 2, 3

  1.  Определение статистики
  2.  Медицинская статистика её разделы и задачи
  3.  Понятие статистической совокупности
  4.  Дайте понятие единицы наблюдения
  5.  Генеральная и выборочная совокупность, ее свойства
  6.  Учетные признаки, их классификация по характеру и роли в совокупности
  7.  Понятие репрезентативности
  8.  Способы формирования выборочной совокупности

9. Как рассчитывается необходимая численность выборки
10.Этапы статистического исследования

11.Содержание программы и плана исследования

12.Виды статистического наблюдения (сплошное, несплошное, текущее, единовременное)

13.Виды статистических таблиц. Правила составления, и заполнения статистических таблиц

14.Виды графического изображения

15.Пути внедрения полученных результатов в практику здравоохранения

РАЗДЕЛ 4

ОТНОСИТЕЛЬНЫЕ ВЕЛИЧИНЫ

Относительные величины весьма распространены и постоянно применяются в медицине и здравоохранении. С помощью относительных величин производится сравнение уровней заболеваемости, рождаемости, смертности, сопоставляются показатели деятельности лечебных учреждений.

Однако, в результате сводки материала в разработочных таблицах получаются абсолютные числа, которые характеризуют объем, размер явления. Абсолютные числа не нашли такого широкого применения в медицине и здравоохранении, как другие статистические величины — относительные и средние.

Абсолютные величины без преобразования их в относительные показатели имеют ограниченное познавательное значение. Чаше всего, оперируя абсолютными величинами, нельзя проводить сравнение и сопоставление одной совокупности с другой.

Логическая структура темы «Относительные величины»

Относительные величины

I

Область

применения

Для характеристики статистических совокупностей

Для сравнения уровня явлений

II

Классификация

Экстенсивные

Интенсивные

Соотношения

Наглядности

III

Назначение относительных

величин

Показывает отношение части к целому

Выражают

частоту явлений в

непосредственно

связанной с ними средами

Характеризуют степени развития

явлений в

среде,

непосредственно с ними не связанной

Дают

наглядные

представления о величинах

IV

Применение в

здравоохранении

Анализ

структуры заболеваемости

Анализ

уровней

рождаемости, смертности, заболеваемости

Анализ

обеспеченности населения

мед. кадрами, больничными койками

Анализ

показателей здоровья населения

Абсолютные числа для анализа можно использовать в двух случаях:

- это, во-первых, при малых числах наблюдения, в том случае, когда не требуется определение закономерности и,

- во-вторых, когда абсолютные цифры исчерпали факт, например, при сравнении численности населения по всеобщей переписи населения.

Относительные величины применяют главным образом для характеристики распределения признаков в совокупности, а также для сравнения в ходе анализа разных совокупностей.

Различают следующие виды относительных величин: экстенсивные, интенсивные показатели, показатели соотношения и наглядности.

4.1 Экстенсивные показатели

   Экстенсивные показатели — показатели удельного веса, части в целом, которые характеризуют распределение всего изучаемого явления на составляющие его части.

  На основании этого показателя обычно рассматриваются всевозможные структуры: заболеваний, причин смерти, распределение коечного фонда по специальностям, состав операций в больнице и т. п. Выражается экстенсивный показатель обычно в процентах. Способ вычисления: вся совокупность принимается за 100%, а искомая часть за х%.

 

Экстенсивный показатель

=

Абсолютный размер части явления

Х 100%

Абсолютный размер явления в целом


4.2 Интенсивные показатели

   Интенсивные показатели — показатели, которые характеризуют распространенность, частоту явления в среде, которая его продуцирует. Обычно в социально-гигиенических исследованиях такой средой является население.

    В зависимости от частоты изучаемого явления интенсивные показатели рассчитываются на 100, 1000, 10.000, 100.000 населения. Множитель зависит от распространенности явления в среде, чем реже оно встречается, тем больше множитель. Для вычисления некоторых интенсивных показателей множители общеприняты. Так все демографические показатели рассчитываются на 1000 населения, заболеваемость с временной утратой трудоспособности на 100 работающих, показатели летальности на 100 заболевших и т. д.

Интенсивный показатель

=

Абсолютный размер явления  х  100 (1000, 10000, 100000)

Абсолютный размер среды, продуцирующей  данное явление

4.3. Показатели соотношения

      Показатели соотношения — показатели, которые характеризуют отношение между двумя самостоятельными совокупностями (в этом его сходство с интенсивным показателем), причем независимые совокупности не только связаны друг с другом, но и не продуцируют одна другую (в этом отличие показателя соотношения от интенсивного показателя).

Показатель соотношения

=

Абсолютный размер явления  х  100 (1000, 10000, 100000)

Абсолютный размер среды, не продуцирующей  данное явление

       Показателями соотношения являются показатели обеспеченности населения врачами, медсестрами, больничными койками, рассчитанные на 10000 населения. Их широко используют при планировании здравоохранения.

4.4 Показатели наглядности

      Показатели наглядности — наглядно представляют соотношения показателей, характеризующих один и тот же признак в различных совокупностях или одно и то же явление в динамике.

        В основу вычисления показателя наглядности положен принцип принятия одной из величин за 100%, а остальные рассчитываются в процентном отношении к ней.

Показатели наглядности можно вычислять на основе интенсивных показателей, показателей соотношения и средних величин.

        Показатели наглядности указывают, на сколько процентов или во сколько раз произошло увеличение или уменьшение сравниваемых величин.

Показатель наглядности

=

явление  х  100

Такое же явление из ряда сравниваемых, принятых за 100%

    В применении относительных величин наиболее часто встречаются следующие ошибок:

    Интенсивные показатели сравниваются за различные по протяженности периоды наблюдения (помесячные показатели сравниваются с годовыми)

    Подмена интенсивного показателя экстенсивным для характеристики уровня, частоты явления, особенно для выявления изменения этого уровня в динамике или по территориям.

    При сравнительной оценке экстенсивных показателей в динамике или по территориям надо анализировать всю структуру совокупности, а не сравнивать удельные веса только отдельных его частей

4.5 Динамические ряды

    Для анализа изменения явления во времени (динамика явления) используются динамические ряды.

    Динамическим рядом называется совокупность однородных статистических величин, показывающих изменения какого-либо явления на протяжении определенного промежутка времен./

    Динамический ряд может состоять из абсолютных или производных величин — относительных чисел и средних.

Динамические ряды

I. Виды динамических рядов

Простой

Сложный

Моментный

Интервальный

Динамические ряды

II. Способы выравнивания динамических рядов

Укрупнение

интервалов

Вычисление групповой средней

Вычисление скользящей средней

Динамические ряды

III. Показатели динамического ряда

Абсолютный

прирост

Темп прироста

Значение 1% прироста

Темп роста

Числа динамического ряда принято называть уровнями ряда. Различают два основных типа динамических рядов в зависимости от того, из какого рода чисел состоит ряд.

4.5.1 Типы динамических рядов

Ряды могут быть простыми (состоят из абсолютных величин) и сложными (состоят из относительных или средних величин).

Простой динамический ряд может быть двух видов: моментный и интервальный

Моментный, состоит из величин, характеризующих размеры явления на определенное время (например, численность населения РФ на конец соответствующего года).

Интервальным, состоит из чисел, характеризующих величину явления не на какой-либо момент, а за определенный интервал времени (количество родившихся в РФ за год, количество умерших за год и т. п.).

4.5 2 Выравнивание уровней динамических рядов

Динамический ряд не всегда состоит из уровней, последовательно изменяющихся в сторону снижения или увеличения. Нередко уровни в динамическом ряду носят скачкообразный характер, имеют значительные колебания, что затрудняет возможность проследить основную закономерность, свойственную явлению в наблюдаемый период.

В этих случаях для выявления общей динамической тенденции рекомендуется произвести выравнивание ряда

Выделяют следующие способы выравнивания динамического ряда. укрупнение интервалов, вычисление групповой средней, вычисление скользящей средней и т. п.

Однако, следует осторожно применять метод выравнивания, его следует употреблять только после глубокого и всестороннего анализа причин, обусловивших колебания этих уровней. Механическое выравнивание может искусственно сгладить уровни и завуалировать причинно-следственные связи.

4.5.2.1 Укрупнение интервалов

Укрупнение интервалов — применяется, когда явление в интегральном ряду выражено в абсолютных величинах, уровни которых суммируются по более крупным периодам. Применение возможно при кратном числе периодов. Например, зная помесячное число обращений по поводу того или иного заболевания, можно укрупнить период и анализировать поквартально. Укрупнение периодов может выявить сезонные колебания, определенные закономерности.

Пример: Сезонные колебания заболевания ангиной в населенном пункте Н.

Месяцы

I

II

III

IV

V

VI

VII

VIII

IX

X

XI

XII

Всего

120

190

130

380

230

280

530

380

390

230

140

250

3250

440

890

1300

620

3250

Как видно из таблицы, помесячные числа заболеваний ангиной то увеличиваются, то уменьшаются. После укрупнения интервалов по кварталам года выявляется определенная закономерность: наибольшее число заболеваний приходится на летне-осенний период.

4.5.2.2 Вычисление групповой средней

Вычисление групповой средней — применяется, когда уровни ряда выражены в абсолютных, средних или относительных величинах. При вычислении групповой средней смежные величины суммируются, а затем делятся на число слагаемых. Этот метод позволяет сгладить волнообразные изменения и получить более четкую картину изменений.

Пример: Динамика процента расхождений клинических и патолого-анатомических диагнозов в областной больнице города Н. за 1997-2004 гг.

Годы

1997

1998

1999

2000

2001

2002

2003

2004

Процент расхождения диагнозов

12,0

10,8

9,0

10,2

9,2

9,6

9,5

8,9

Групповая средняя

11,4

9,6

9,4

9,2

  

 Уровни динамического ряда, представленных в таблице имеют волнообразные колебания. Выравнивание ряда путем вычисления групповой средней выявило четкую тенденцию к постепенному снижению процента расхождений диагнозов в областной больнице.

4.5.2.3 Расчет скользящей средней

Расчет скользящей средней — применяется, когда явление выражено в абсолютных, средних или относительных величинах. Каждый уровень заменяется на среднюю из данного уровня и двух соседних с ним. Данный метод применяется, когда не требуется особой точности и когда имеется достаточно длинный ряд и можно пренебречь потерей двух значений ряда.

Скользящая средняя вычисляется как средняя величина из данного уровня и двух соседних с ним. При вычислении скользящей средней каждый уровень ряда заменяется на среднюю величину из данного уровня и двух соседних с ним.

Пример: Скользящая средняя

Годы

1997

1998

1999

2000

2001

2002

2003

2004

Процент расхождения диагнозов

12,0

10,8

9,0

10,2

9,2

9,6

9,5

8,9

Скользящая средняя

-

10,6

10,0

9,5

9,5

9,4

9,3

-

     Пример расчета    для 1998 г.: (12,0+10,8+9,0):3=10,6;

                              для 1999 г.: (10,8+9,0+10,2):3=10,0.

    Частота расхождения клинических и патологоанатомических диагнозов в областной больнице ежегодно колебалась. Ряд, выровненный с помощью скользящей средней, выявляет постепенное уменьшение частоты расхождения диагнозов.

Для углубленного изучения процессов во времени рассчитывают показатели динамического ряда.

4.5. 3.  Показатели динамического ряда

К показателям динамического ряда относятся:

- Абсолютный прирост

- Темп прироста

- Значение 1 % прироста

- Темп роста

Методики расчета показателей

Абсолютный прирост — разность между последующим и предыдущим уровнями.

Абсолютный прирост   = последующий уровень - предыдущий уровень

Темп прироста — процентное отношение абсолютного прироста к предыдущему уровню.

Темп прироста =

Абсолютный прирост

х 100%

предыдущий  уровень

Значение 1% прироста — отношение абсолютного прироста к темпу прироста.

Значение 1 % прироста =

Абсолютный прирост

Темп прироста

Темп роста — процентное отношение последующего уровня к предыдущему

Темп роста =

последующий уровень

х 100%

предыдущий уровень

Все показатели выражаются знаком «+» — прирост или «-» — убыль.

4.7 Контрольные вопросы

  1.  Что такое абсолютные числа?
  2.  Можно ли на основании абсолютных данных провести статистический анализ того или иного явления?
  3.  Что такое относительные величины, общая методика их расчета?
  4.  Применение относительных величин в практике здравоохранения.
  5.  Какие различают виды относительных величин?
  6.  Что такое экстенсивный показатель и какова методика его расчета?
  7.  Что такое интенсивный показатель и какова методика расчета этого показателя?
  8.  Что такое показатель соотношения, как рассчитать показатель соотношения, его отличие от интенсивного показателя?

9. Что такое показатель наглядности и как его рассчитать?

10.Динамические ряды: определение и виды.

11.Какие показатели используются при анализе динамических рядов, их определение и методика расчета?

РАЗДЕЛ 5

СРЕДНИЕ ВЕЛИЧИНЫ

Значительная вариабельность медико-биологических, социально-гигиенических явлений определяет необходимость проведения тщательного, статистически достоверного анализа при оценке состояния здоровья населения, характеристики социально-гигиенических условий, обобщении результатов деятельности различных лечебно-профилактических учреждений.

Особое место в статистическом анализе принадлежит определению среднего уровня изучаемого признака или явления. Средние величины широко используются в медицинской научной и практической деятельности для оценки состояния здоровья населения (характеристика физического развития, выявление распространенности и длительности различных заболеваний, анализ демографических показателей), для изучения деятельности лечебно-профилактических учреждений, медицинских кадров и оценки качества их работы, планирования и определения потребности населения в различных видах медицинской помощи. Средние величины используются также для определения медико-физиологических показателей в норме и патологии, при обработке лабораторных данных, клинических и экспериментальных исследованиях.

Средняя величина — это типичная величина, которая характеризует среднее значение показателей, нивелируя максимальные и минимальные значения этих показателей. При работе со средними величинами необходимо соблюдать определенные условия.

Требования к средним величинам

- качественная однородность совокупности для которой вычисляется средняя величина

- средняя величина должна быть рассчитана на массовых материалах, на достаточно большом числе наблюдений.

- средняя арифметическая величина обладает тремя свойствами:

- занимает срединное положение в вариационном ряду;

- имеет абстрактный характер;

- сумма отклонений всех вариант от средней равна 0.

5.1 Вариационный ряд и методика его составления

Средние величины рассчитываются на основе вариационных рядов.

Вариационный ряд — это однородная в качественном отношении статистическая совокупность, отдельные единицы которой характеризуют количественные различия изучаемого признака или явления.

Цифровое значение, каждого отдельного признака или явления, входящего в вариационный ряд, называется вариантой и обозначается буквой V. 

Числа, показывающие, как часто встречается та или иная варианта в составе данного ряда, носят названия частот и обозначаются буквой — p.

Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n.

Варианты, расположенные в порядке возрастания или убывания количественной характеристики признака, составляют ранжированный вариационный ряд.

Вариационный ряд

I.  Виды вариационных рядов

Простой

Сгруппированный

Сгруппированный ряд

II. Характеристика

вариационного ряда

Варианта V

Частота р

Общее число

наблюдений n

Сгруппированный ряд

III. Этапы составления

сгруппированного ряда

Определение числа групп

Определение

Интервала

Определение

границ и середины группы

Распределение

наблюдений по группам

Графическое изображение

Вариационный ряд

IV. Практическое применение

Для характеристики

типа распределения признака в совокупности

Для вычисления среднего уровня (средней величины)

Различают два вида вариационных рядов:

- простой вариационный ряд;

- сгруппированный вариационный ряд,

Простым вариационным рядом называется такой ряд, где каждая варианта встречается лишь один раз.

Вариационный ряд, где указано сколько раз встречается каждая варианта называется сгруппированным вариационным рядом.

Если исследователь имеет не более 30 наблюдений, то достаточно все значения признака расположить в нарастающем или в убывающем порядке (от минимальной варианты до максимальной или наоборот) и указать частоту каждой варианты. При большом числе наблюдений (более 30) рекомендуется варианты объединить в группы с указанием частоты встречаемости всех вариант, входящих в данную группу.

Основные требования к составлению вариационного ряда:

1 - расположить все варианты по порядку

2 - суммировать единицы, имеющие одинаковый признак, т.е. найти частоту каждой единицы

3 - определить количество групп

4 - определить интервал между группами

5 - определить начало, середину и конец группы

6 - распределить данные наблюдений по группам

7 - графически изобразить вариационный ряд

5.2 Виды средних величин, методика их вычисления

Средние величины

I. Область применения

Для обобщающей характеристики количественных признаков

Для характеристики отдельных величин путем сравнения их со средним уровнем

Средние величины

II. Основание для

определения средних величин

Вариационный ряд

III. Характеристика

вариационного ряда

Варианта V

Частота р

Общее число

наблюдений n

Средние величины. Вариационный ряд.

IV. Виды средних величин

Мода  (Мо)

Медиана (Ме)

Средняя арифметическая

Средняя арифметическая

V. Виды средней арифметической

простая

взвешенная

вычисленная по способу моментов

Средняя арифметическая

VI. Свойства средней арифметической

Занимает срединное положение

имеет абстрактный характер

сумма отклонений от средней равна 0

Различают три вида средних величин: мода (М0), медиана (Ме), средняя арифметическая (М). 

Они не могут подменить друг друга и лишь в совокупности достаточно полно и в сжатой форме представляют собой особенности вариационного ряда.

Мода (Мо) — наиболее часто встречающаяся в ряду распределения варианта. Она дает представление о центре распределения вариационного ряда. Используется:

- для определения центра распределения в открытых вариационных рядах

- для определения среднего уровня в рядах с резко асимметричным распределением

Медиана — это серединная варианта, центральный член ранжированного ряда. Название медиана взято из геометрии, где так именуется линия, делящая сторону треугольника на две равные части.

Медиана применяется:

- для определения среднего уровня признака в числовых рядах с неравными интервалами в группах

- для определения среднего уровня признака, когда исходные данные представлены в виде качественных признаков  и когда единственным способом указать некий центр тяжести совокупности является указание варианты (группы вариант), которая занимает центральное положение

- при вычислении некоторых демографических показателей (средней продолжительности предстоящей жизни)

- при определении наиболее рационального места расположения учреждений здравоохранения, коммунальных учреждений и т. п. (имеется в виду учет оптимальной удаленности учреждений от всех объектов обслуживания)

В настоящее время очень распространены различные опросы (маркетинговые, социологические и др.), в которых опрашиваемых просят выставить баллы изделиям, политикам и т. п. Затем из полученных оценок рассчитывают средние баллы и рассматривают их как интегральные оценки, выставленные коллективом опрошенных. При этом обычно для определения средних показателей применяют среднее арифметическое. Однако такой способ на самом деле применять нельзя. Обоснованным в этом случае является использование в качестве средних баллов медианы или моды.

Для характеристики среднего уровня признака наиболее часто используется в медицине средняя арифметическая величина (М).

Средняя арифметическая величина — это общая количественная характеристика определенного признака изучаемых явлений, составляющих качественно однородную статистическую совокупность. 

Различают среднюю арифметическую простую и взвешенную.

Средняя арифметическая простая вычисляется для не сгруппированного вариационного ряда путем суммирования всех вариант и делением этой суммы на общее количество вариант, входящих в вариационный ряд.

Вычисляется средняя арифметическая простая по формуле:

М=

V

n

М — средняя арифметическая простая,

       ∑V — сумма вариант,

       n — число наблюдений

      

     Cредняя арифметическая взвешенная вычисляется для сгруппированного вариационного ряда по формуле:

М=

Vp

n

М — средняя арифметическая взвешенная,

       ∑Vp — сумма произведений вариант на их частоты,

       n — число наблюдений.

Помимо указанного метода прямого расчета средней арифметической взвешенной, существуют другие методы, в частности, способ моментов при котором несколько упрощены арифметические расчеты.

Расчет средней арифметической способом моментов проводится по формуле:

М = А +

dp

n

А - условная средняя (чаще всего в качестве условной средней берется  мода М0)

            d - отклонение каждой варианты от условной средней (V-A)

∑dp — сумма произведений отклонений на их частоту.

Порядок вычисления представлен в таблице (за условную среднюю принимаем М0 = 76 ударам в минуту).

Определение средней арифметической способом моментов

частота пульса V 

Р 

d (V-A) 

dp 

60 

1 

-16 

-16 

62 

2 

-14 

-28 

64 

3 

-12 

-36 

66 

3 

-10 

-30 

68 

3 

-8 

—24 

70 

9 

-6 

-54 

72 

6 

-4 

-24 

74 

7 

-2 

-14 

76 

11 

0 

0 

78 

5 

2 

10 

80 

4 

4 

16 

n= 54 

 |   dp= -200 

М = А +

dp

=

76+

-200

= 76 -3,7=72,3 (ударов в минуту

n

54

Среднюю арифметическую можно также рассчитать и по данным середины группы. С учетом интервала между группами. Расчет проводим по формуле:

М = А +

dp

х i

n

 где i — интервал между группами.

Порядок вычисления представлен в табл. (за условную среднюю принимаем М0 = 73 ударам в минуту, где i = 3)

Определение средней арифметической способом моментов

частота пульса V 

середина группы 

частота Р 

условное отклонение в интервалах (d) 

произведение условного отклонения на частоту (dp) 

60-62 

61 

3 

-4 

-12 

63-65 

64 

3 

-3 

-9 

66-68 

67 

6 

-2 

-12 

69-71 

70 

9 

-1 

-9 

72-74 

73 

13 

0 

 0     

75-77 

76 

11 

1 

11 

78-80 

79 

9 

2 

18 

n = 54                                dp = -13

М = А +

dp

=

73+

-13*3

= 73 - 0,7=72,3 (ударов в минуту

n

54

Таким образом, полученное значение средней арифметической величины по способу моментов идентично таковому, найденному обычным способом.

5.3 Методы оценки разнообразия признака в статистической совокупности

Разнообразие признака в статистической совокупности

Критерии характеризующие границы совокупности

Лимит

Амплитуд

Разнообразие признака в статистической совокупности

Критерии характеризующие внутреннюю структуру совокупности

Среднее квадратическое отклонение

коэффициент вариации

Среднее квадратическое отклонение

Практическое применение среднего квадратического отклонения

Для определения типичности средней

Для определения стандартов

Для индивидуальной оценки уровней (например физического развития)

Для индивидуальной оценки уровней (например физического развития

Способы расчета

Среднеарифметический

Способ моментов

По амплитуде

коэффициент вариации

Оценки степени разнообразия

признака

Cv< 10% слабое разнообразие

Cv =10-20% среднее разнообразие

Сv > 20% сильное разнообразие

    Средние величины, являясь важными характеристиками статистической совокупности скрывают индивидуальные значения признака, не показывают величину разнообразия вариационного ряда. Если вариационный ряд компактен, то средняя величина более точно характеризует данную совокупность. Если же ряд растянут, отдельные величины существенно отличаются от средней величины, она является менее типичной.

     Следовательно, средняя величина, обычно средняя арифметическая, взятая только сама по себе, имеет ограниченную ценность, т. к. не дает представление о вариабельности, в которой случаи наблюдений распределены вокруг нее.

    

Выделяют следующие критерии разнообразия признака:

1. Характеризующие границы совокупности:

лимит (Lim)

амплитуда (Am)

  1.  Характеризующие внутреннюю структуру совокупности:

- среднее квадратическое отклонение а (сигма малая)

- коэффициент вариации (Cv).

    5. 3.1 Критерии, характеризующие границы совокупности (лимит, амплитуда)

Лимит (Lim) определяется крайними значениями вариант в вариационном ряду: Lim=Vmin-Vmax

Амплитуда (Am) — разность крайних вариант (разность между наибольшей и наименьшей вариантами):

Am = Vmax – Vmin

    Лимит и амплитуда дают определенную информацию о степени разнообразия ряда, однако они не являются достаточно удовлетворительной мерой вариабельности, т. к. основываются только на крайних наблюдениях и не учитывают все распределение наблюдений вокруг средней в целом. Лимит и амплитуда не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры.

5.3.2 Критерии, характеризующие внутреннюю структуру совокупности

Наиболее полную характеристику разнообразию признака в совокупности дает среднее квадратическое отклонение, обозначаемое греческой буквой (сигма малая).

5.3.2.1 Расчет среднеквадратического отклонения

Среднее квадратическое отклонение характеризует среднее отклонение всех вариант вариационного ряда от средней арифметической величины.

Существует три способа расчета среднего квадратического отклонения: среднеарифметический,  способом моментов и по амплитуде.

Возвратимся к нашему примеру.

1) При среднеарифметическом способе расчета применяется формула:

=

d — отклонение отдельных вариант от средней арифметической (V-M)

р — частота

n — число наблюдений (при числе наблюдений менее 30, в знаменатель необходимо взять n—1).

Порядок вычисления среднего квадратического отклонения представлен в таблице

Частота пульса V 

Р 

d (V - М) М = 72,3 

d2 

d2p 

60 

1 

-12,3 

151,29 

151,29 

62 

2 

-10,3 

106,09 

212,18 

64 

3 

-8,3 

68,89 

206,67 

66 

3 

-6,3 

39,69 

119,07 

68 

3 

-4,3 

18,49 

55,47 

70 

9 

-2,3 

5,29 

47,61 

72 

6 

-0,3 

0,09 

0,54 

74 

7 

1,7 

2,89 

20,23 

76 

11 

3,7 

13,69 

150,59 

78 

5 

5,7 

32,49 

162,45 

80 

4 

7,7 

59,29 

237,16 

n=54      ∑ 1363,26

=

54

Среднее квадратическое отклонение, также как и среднюю арифметическую, можно рассчитать более простым способом, а именно способом моментов по формуле:

= √

d2p

-

∑(dp)2

n

n2

где d - отклонение каждой варианты от  условной средней (V-A).

Порядок вычисления среднего квадратического отклонения представлен в таблице (за условную среднюю принимаем М0 = 76 ударам в минуту).

Частота пульса V 

D(V-A) А=76 

d 

dp 

d2 

d2p 

60

1

-16

-16

256

256

62

2

-14

-28

196

392

64

3

-12

-36

144

432

66

3

-10

-30

100

300

68

3

-8

-24

64

192

70

9

-6

-54

36

324

72

6

-4

-24

16

96

74

7

-2

-14

4

28

76

11

0

0

0

0

78

5

2

10

4

20

80

4

4

16

16

64

                            N = 54     ∑ = -200     ∑ = 2104

= √

d2p

-

d2p2

= √ 

2104

-

-2002

= √25,2

≈ 5,0

n

n2

54

542

Результаты вычисления среднего квадратического отклонения среднеарифметическим способом и способом моментов идентичны. Однако, как указывалось выше, второй способ значительно убыстряет и упрощает расчеты. Если отсутствуют необходимые исходные данные для вычисления среднего квадратического отклонения обычным путем, может быть использован приближенный способ вычисления среднего квадратического отклонения по амплитуде вариационного ряда.

Среднее квадратическое отклонение, вычисленное по амплитуде, несколько отличается по величине от о, вычисленной обычными способами. Различие это тем больше, чем больше число наблюдений, использованных для составления вариационного ряда. Поэтому определение среднего квадратического отклонения по амплитуде более целесообразно производить преимущественно при ориентировочных расчетах.

Вычисление производится по формуле:

=

Am

=

Vmax-Vmin

k

k

   

Am — амплитуда

k — коэффициент, соответствующий числу наблюдений (определяется по специальной таблице, в нашем примере при n=54 коэффициент равен 4,56)

=

80-60

=

20

4,4

4,56

4,56

Значения и для вычисления среднего квадратического отклонения () по амплитуде

N

0

1

2

3

4

5

6

7

8

9

0

-

-

1,13

1,69

2,06

2,33

2,53

2,70

2,85

2,97

10

3,08

3,17

3,26

3,34

3,41

3,47

3,53

3,59

3,64

3.69

20

3,73

3,78

3,82

3,86

3,90

3,93

3,96

4,00

4,03

4,06

30

4,09

4,11

4,14

4,16

4,19

4,21

4,24

4,26

4,28

4,30

40

4,32

4,34

4,36

4,38

4,40

4,42

4,43

4,45

4,47

4,48   4,48

50

4,50

4,51

4,53

4,54

4,56

4,57

4,59

4,60

4,61

4,63

60

4,64

4,65

4,66

4,68

4,69

4.70

4,71

4,72

4,73

4,74

70

4,75

4,77

4,78

4,79 1

4,80П

4,81

4,82

4,83

4,83

4,84

80

4,85

4,86

4,87

4,88

4,89

4,90

4,91

4,91

4,92

4,93

90

4,94

4,95

4,96

4,96

4,97

4,98

4,99

4,99

5,00

5,01

N

100

200

300

400

500   

600

700

800

900

1000

К

5,02

5,49

5,76

5,94

6,07  

6,18

6,28

6,35

6,42

6,48

Среднее квадратическое отклонение вычисленное обычными способами дает точную величину ( = 5,0). Однако различие это не слишком велико и, если бы были известны только крайние варианты ряда, приближенное вычисление среднего квадратического отклонения по амплитуде вариационного ряда имело бы смысл.

Итак, нахождение среднего квадратического отклонения позволяет судить о характере однородности исследуемой группы наблюдений. Если величина среднего квадратического отклонения небольшая, то это свидетельствует о достаточно высокой однородности изучаемого явления.

Среднюю арифметическую в таком случае следует признать вполне характерной, типичной для данного вариационного ряда. При очень большой величине сигмы средняя арифметическая в меньшей степени характеризует весь вариационный ряд, что говорит о значительной вариабельности изучаемого признака или явления или о неоднородности исследуемой группы.

5.3.2.2 Расчет коэффициента вариации

Оценка степени рассеяния вариант около средней может быть произведена с помощью коэффициента вариации, вычисляемого по формуле:

Cv =

х 100%

M

      Значения коэффициента вариации (CV)

- менее 10% свидетельствует о малом рассеянии,

- от 10% до 20% — о среднем,

- более 20% — о сильном рассеянии вариант вокруг средней арифметической.

      Возвращаясь к нашему примеру мы можем дать характеристику изучаемому вариационному ряду. М=72,3 удара в минуту, =5,0

Cv =

5,0

х 100%

= 6,9%

72,3

Расчеты свидетельствуют о малом рассеянии вариант, следовательно средняя арифметическая величина вполне типична, а исследуемая группа наблюдений является достаточно однородной.

Коэффициент вариации часто используется при оценке разнообразия ряда различных признаков, например, рост и масса тела, средняя длительность лечения на дому и частота врачебных посещений. Непосредственное сравнение « » в данном случае невозможно, так как величина среднего квадратического отклонения обычно характеризует рассеянность ряда при сравнении однотипных рядов.

Предположим, что при изучении физического развития группы подростков коэффициент изменчивости для массы тела составил 9%, а для роста — 3,7%. Эти цифры можно сравнивать и сделать заключение, что в данном примере рост является более устойчивым признаком, чем масса тела.

5.4 Контрольные вопросы

Дайте определение средней величины

Какие требования предъявляются при работе со средними величинами?

Дайте определение вариационного ряда

Назовите основные элементы вариационного ряда

Виды вариационных рядов

Правила построения вариационного сгруппированного ряда

Как определяется средняя арифметическая простая?

Как определяется средняя арифметическая взвешенная?

Определение средней арифметической способом моментов

10.Назовите критерии разнообразия признака вариационного ряда

11.Что такое среднее квадратическое отклонение и его значение?

12.Роль коэффициента вариации и его применение?

РАЗДЕЛ 6

СТАТИСТИЧЕСКАЯ ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

Под достоверностью статистических показателей следует понимать степень их соответствия отображаемой ими действительности. Достоверными результатами считаются те, которые не искажают и правильно отражают объективную реальность.

Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность.

В большинстве медицинских исследований врачу приходится, как правило, иметь дело с частью изучаемого явления, а выводы по результатам такого исследования переносить на все явление в целом — на генеральную совокупность.

Таким  образом, оценка достоверности необходима для того, чтобы по части явления можно было бы судить о явлении в целом, о его закономерностях.

Мера достоверности результатов (ошибка репрезентативности)

m =

n

При среднеарифметической (М)

При  относительной величине  (P)

m = √

Pq

n

Практическое применение

Позволяет определить вероятность с которой возможно перенести результаты изучения с выборочной совокупности на генеральную совокупность

Способы оценки достоверности

Доверительные границы параметра

Достоверность разницы параметра

(При  М)

M ± tm

(При P)

P ± tm

При средних арифметических

t =

M1 – M2

m12 + m22

При относительных величинах

t =

P1 – P2

m12 + m22

Доверительная вероятность в медицинских исследованиях

В медико-биологических исследованиях вероятность 95% и более, т.е. при минимуме удвоенной ошибки (t=2)

Разница достоверна при t2  с вероятностью 95% и более

 Оценка достоверности результатов исследования предусматривает определение:

  1.  ошибок репрезентативности (средних ошибок средних арифметических и относительных величин) — m
  2.  доверительных границ средних (или относительных) величин
  3.  достоверности разности средних (или относительных) величин (по критерию t)
  4.  достоверности различия сравниваемых групп по критерию 2

6.1 Определение ошибки репрезентативности

Определение средней ошибки средней (или относительной) величины (ошибки репрезентативности) — m

Ошибка репрезентативности (m) является важнейшей статистической величиной, необходимой для оценки достоверности результатов исследования. Эта ошибка возникает в тех случаях когда требуется по части охарактеризовать явление в целом. Эти ошибки неизбежны. Они проистекают из сущности выборочного исследования; генеральная совокупность может быть охарактеризована по выборочной совокупности только с некоторой погрешностью, измеряемой ошибкой репрезентативности.

Ошибки репрезентативности нельзя смешивать с обычным представлением об ошибках: методических, точности измерения, арифметических и др.

По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генеральной совокупности.

Этот единственный вид ошибок, учитываемых статистическими методами, которые не могут быть устранены, если не осуществлен переход на сплошное изучение. Ошибки репрезентативности можно свести к достаточно малой величине, т. е. к величине допустимой погрешности. Делается это путем привлечения в выборку достаточного количества наблюдений (n).

Каждая средняя величина — М (средняя длительность лечения, средний рост, средняя масса тела, средний уровень белка крови и др.), а также каждая относительная величина — Р (уровень летальности, заболеваемости и др.) должны быть представлены со своей средней ошибкой — m. Так, средняя арифметическая величина выборочной совокупности (М) имеет ошибку репрезентативности, которая называется средней ошибкой средней арифметической (mM) и определяется по формуле:

mM =

√ n

Как видно из этой формулы, величина средней ошибки средней арифметической прямо пропорциональна степени разнообразия признака и обратно пропорциональна корню квадратному из числа наблюдений. Следовательно, уменьшение величины этой ошибки при определении степени разнообразия () возможно путем увеличения числа наблюдений.

На этом принципе основан метод определения достаточного числа наблюдений для выборочного исследования.

Относительные величины (Р), полученные при выборочном исследовании, также имеют свою ошибку репрезентативности, которая называется средней ошибкой относительной величины и обозначается тр.

Для определения средней ошибки относительной величины (Р) используется следующая формула:

                                            

где Р — относительная величина. Если показатель выражен в процентах, то q = 100 - Р, если Р — в промиллях, то q=1000 - Р, если Р—в продецимиллях, то q=10 000 - Р и т.д.; n — число наблюдений. При числе наблюдений менее 30 в знаменатель следует взять n - 1.

Примеры определения средних ошибок средних и относительных величин

mM =

√ n

                          

У 49 больных гипертиреозом

исследован уровень пепсина

n=49

М=1.0 г%

 = 0,35 г%

mм =?

mм =

0,35

= ± 0,05г%

√49

Исследовано 110 больных с абсцессом легкого, из них у 44 обнаружены дистрофические изменения пародонта n=110

Р =

44*100

= 40%

110

лиц с дистрофическими изменениями пародонта

q= 100 - 40=60% лиц без дистрофических изменений пародонта
mр=?

mр=

40*60

= ± 4,7%

110

Каждая средняя арифметическая или относительная величина, полученная на выборочной совокупности, должна быть представлена со своей средней ошибкой. Это дает возможность рассчитать доверительные границы средних и относительных величин, а также определить достоверность разности сравниваемых показателей (результатов исследования).

6.2 Определение доверительных границ генеральной совокупности.

Определяя для средней арифметической (или относительной) величины два крайних значения: минимально возможное и максимально возможное, находят пределы, в которых может быть искомая величина генерального параметра. Эти пределы называют доверительными границами.

Доверительные границы — это то максимальное и минимальное значение, в пределах которого, при заданной степени вероятности безошибочного прогноза, может колебаться искомая средняя величина генерального параметра.

Доверительные границы средней арифметической в генеральной совокупности определяют по формуле:

Мген = Мвыб ± tmМ

Доверительные границы относительной величины в генеральной совокупности определяют по следующей формуле:

                  Рген  = Рвыб ± tmР

где Мген и Рген — значения средней и относительной величин, полученных для генеральной совокупности; Мвы6 и Рвы6 — значения средней и относительной величин, полученных для выборочной совокупности; тМ и тР — ошибки репрезентативности выборочных величин; t — доверительный критерий (критерий точности, который устанавливают при планировании исследования; tm — доверительный интервал; tm=, где предельная ошибка показателя, полученного при выборочном исследовании.

Размеры предельной ошибки () зависят от коэффициента t, который избирает сам исследователь, исходя из необходимости получить результат с определенной степенью точности.

Величина критерия t связана определенными отношениями с вероятностью безошибочного прогноза — р и численностью наблюдений в выборочной совокупности.

Зависимость доверительного критерия t от степени вероятности безошибочного прогноза (при n>30)

Степень вероятности безошибочного прогноза в %

Доверительный критерий - t

95,0

2

99,0

3

Для большинства медико-биологических и социальных исследований достоверными считаются доверительные границы, установленные с вероятностью безошибочного прогноза р = 95% и более. Чтобы найти критерий t при числе наблюдений n<30, необходимо воспользоваться специальной таблицей, в которой слева показано число наблюдений без единицы (n-1), а сверху (р) — степень вероятности безошибочного прогноза.

Значение критерия t для трех степеней вероятности (по Н А. Плохинскому)

Р

Р

n=n— 1

95%

99%

99,9%

n=n— 1

95%

99%

99,9%

1

12,7

63,7

37,0

10

2,2

3,2

4,6

2

4,3

9,9

31,6

11

2,2

3,1

4,4

3

3,2

5,8

12,9

12

2,2

3,1

4,3

4

2,8

4,6

8,6

13

2,2

3,0

4,1

5

2,6

4,0

6,9

14—15

3,0

4,1

6

2,4

3,7

6,0

16—17

2,1

2,9

4,0

7

2,4

3,5

5,3

18—20

2,9

3,9

8

2,3

3,4

5,0

21—2,4

2,1

2,8

3,8

9

2,3

3,3

4,8

25—29

2,0

2,8

3,7

При определении доверительных границ сначала надо решить вопрос о том, с какой степенью вероятности безошибочного прогноза необходимо представить доверительные границы средней или относительной величины. Избрав определенную степень вероятности, соответственно этому находят величину доверительного критерия t при данном числе наблюдений. Таким образом, доверительный критерий t устанавливается заранее, при планировании исследования.

Любой параметр (средняя величина или относительная величина) может оцениваться с учетом доверительных границ, полученных при расчете.

Для ознакомления с методикой определения доверительных границ Мвыб и Рвы6 рекомендуется записать исходные данные и провести расчеты в определенной логической последовательности:

Пример 1. Определить доверительные границы среднего уровня пепсина у больных гипертиреозом с 95% вероятностью безошибочного прогноза (р = 95%).

Условие задачи: n=49

Мвы6 = 1 г%

mм = ±0,05 г%

р = 95% (следовательно при n = 49 t = 2).

Определяем доверительные границы средней величины в генеральной совокупности.

Формула Мген = Мвыб ± tmM

Решение : Мген = 1 г% ± 2 х 0,05 г%

Мген не более 1 г%+0,1 г%= 1,1 г%,

Мген не менее 1 г%—0,1 г% =0,9 г%.

Вывод: Установлено с вероятностью безошибочного прогноза (р = 95%>, что средний уровень пепсина в генеральной совокупности у больных с гипертиреозом не превышает 1,1 г% и не ниже 0,9 г%.

Пример 2. Определить доверительные границы показателя частоты дистрофии пародонта у больных с абсцессом легкого с вероятностью безошибочного прогноза р = 95%.

Условие задачи:

n=110

Рвы6 =40%

mp = ±4,7%

р =95% (следовательно, при n=110 t=2).

Определяем доверительные границы относительного показателя в генеральной совокупности.

Формула: Рген = Рвыб ± tmp,

Решение: Pген = 49% ±2 х 4,7%

Рген не более 40% + 9,4 = 49,4%

Рген не менее 40% -9,4 = 30,6%

Вывод: Установлено с 95% вероятностью безошибочного прогноза (р = 95%), что дистрофические изменения пародонта в генеральной совокупности наблюдаются у больных с абсцессом легкого не чаще, чем в 49,4%, и не реже, чем в 30,6% случаев.

Как видно, доверительные границы зависят от размера доверительного интервала (tm=).

Анализ доверительных интервалов указывает, что при заданных степенях вероятности (р) и n >30 t имеет неизменную величину и при этом доверительный интервал зависит от величины ошибки репрезентативности (mM или mР).

С уменьшением величины ошибки суживаются доверительные границы средних и относительных величин, полученных на выборочной совокупности, т. е. уточняются результаты исследования, которые приближаются к соответствующим величинам генеральной совокупности.

Если ошибка большая, то получают для выборочной величины большие доверительные границы, которые могут противоречить логической оценке искомой величины в генеральной совокупности.

Например, при определенном режиме питания и тренировок спортсменов средняя годовая прибавка массы тела у 80 спортсменов составила Мвы6=1 кг; mM= ±0,8 кг. При степени вероятности р = 95,0% и t = 2 Мген = 1 кг ± 2 х 0,8 кг. Следовательно:

Мген не более + 2,6 кг,

Мген не менее - 0,6 кг.

Эти противоречивые данные означают, что при указанном режиме спортсмены могут дать большую среднюю прибавку массы тела (до +2,6 кг), но могут и убавить массу тела в среднем на 600 г. Таким образом, остается по-прежнему невыясненным вопрос о степени влияния данного режима спортсменов на массу их тела.

В подобном случае надо искать резервы сокращения размаха доверительных границ в размере величины ошибки репрезентативности. Прежде всего надо проанализировать уровень разнообразия признака по среднему квадратическому отклонению () с позиций однородности группы. Необходимо также иметь в виду, что большое влияние на величину средней ошибки, а следовательно, и на доверительные границы оказывает численность наблюдений.

Доверительные границы Мвыб и Рвыб зависят не только от средних ошибок этих величин (mм или mР), но и от избранной исследователем степени вероятности безошибочного прогноза (р). При большой степени вероятности размах доверительных границ увеличивается.

6.3 Оценка достоверности разницы результатов исследования

В медицине и здравоохранении по разности параметров оценивают средние и относительные величины, полученные для разных групп населения по полу, возрасту, а также групп больных и здоровых и т. д. Во всех случаях при сопоставлении двух сравниваемых величин возникает необходимость не только определить их разность, но и оценить ее достоверность.

Достоверность разности величин, полученных при выборочных исследованиях, означает, что вывод об их различии может быть перенесен на соответствующие генеральные совокупности.

Достоверность выборочной разности измеряется доверительным критерием (критерием точности t), который рассчитывается по специальным формулам для средних и относительных величин.

Формула оценки достоверности разности сравниваемых средних величин такова:

t =

M1M2  

√ m12 + m22

и для  относительных величин:

t =

P1 – P2

√ m12 + m22

где M1, M2,  P1, P2— параметры, полученные при выборочных исследованиях; m1, и m2— их средние ошибки; t — критерий точности. Разность достоверна при t 2, что соответствует вероятности безошибочного прогноза, равной 95% и более (р>95,0%).

Для большинства исследований, проводимых в медицине и здравоохранении, такая степень вероятности является вполне достаточной.

Наряду с указанием степени вероятности безошибочного прогноза (Р), в научной литературе часто встречается указание вероятности ошибки, которая определяется как (1-Р), т.е. если Р=95% (р=0,95), то степень вероятности ошибки р=0,05

При величине критерия достоверности t<2 степень вероятности безошибочного прогноза составляет р<95%. При такой степени вероятности мы не можем утверждать, что полученная разность показателей достоверна с достаточной степенью вероятности.

В этом случае необходимо получить дополнительные данные, увеличив число наблюдений.

Может случиться, что при увеличении численности выборки разность продолжает оставаться недостоверной. Если при таких повторных исследованиях разность остается недостоверной, можно считать доказанным, что между сравниваемыми совокупностями не обнаружено различий по изучаемому признаку.

Например, требуется определить, достоверны ли различия в уровне пепсина в желудочном соке больных гипертиреозом и здоровых лиц. Обследуются на пепсин две группы: 49 больных гипертиреозом и 50 здоровых людей (контроль). Результаты представлены в таблице

Сравнение среднего уровня пепсина в желудочном соке

больных  гипертиреозом и здоровых лиц (контроль)

Степень 

вероятности безошибочного 

прогноза (р) 

Сравниваемые группы 

П 

М, г% 

т, г% 

t 

Больные гипертиреозом 

49 

1,0 

±0,3 

10,0 

>99,0 

Здоровые (контроль) 

50 

4,0 

±0,1 

t =

M1M2  

=

4-1

=10,0

√ m12 + m22

0,32 + 0,12

Можно сделать вывод о том, что при гипертиреозе наблюдается снижение уровня пепсина, что подтверждается с большой степенью вероятности безошибочного прогноза (р>99%). Следовательно, снижение уровня пепсина может быть использовано в качестве одного из симптомов для подтверждения диагностики гипертиреоза.

Подобным же образом оценивают достоверность разности сравниваемых относительных величин.

Сравнение частоты случаев дистрофического поражения пародонта  у

больных с абсцессом легкого и здоровых лиц (контроль)

Сравниваемые

группы 

N 

Из них с дистрофией пародонта 

t 

p

абс. 

p 

mр 

С абсцессом легкого 

110 

44 

40.0 

±4,7 

6,2 

>99,0 

Здоровые (контроль) 

80 

5 

6.8 

±2,7 

Вывод: разность показателей (40,0 - 6,8 = 33,2%) существенна и достоверна с вероятностью более 99%. Следовательно, можно с большой вероятностью утверждать, что дистрофия пародонта как сопутствующее заболевание характерно для больных с абсцессом легкого.

Такое сочетание закономерно и должно быть объяснено глубокими патофизиологическими сдвигами в организме этих больных. Этот пример показывает, что в большинстве случаев врачу-исследователю приходится решать вопрос о том, существенно ли и достоверно ли различие, которое он наблюдает между параметрами двух выборочных совокупностей. Будет ли отражать закономерность полученная им разность и с какой вероятностью безошибочного прогноза можно это утверждать.

Указанная методика оценки достоверности и разности результатов исследования позволяет проводить только попарное сравнение групп при обязательном наличии обобщающих параметров — средних арифметических (M1, и М2) или относительных величин (Р1 и Р2) и их средних ошибок (m).

6.4 Типичные ошибки, допускаемые при применении методов оценки достоверности результатов исследования

  1.  При определении доверительных границ генеральной совокупности, при числе наблюдений меньше 30, критерий t не определяют по специальной таблице его оценки, с учетом числа наблюдений и задаваемой
    степени вероятности, а сразу подставляют значение
    t = 2 или 3. В результате полученных цифровых значений доверительные границы не верны.
  2.  При применении метода оценки достоверности разности результатов исследования наиболее частыми являются следующие ошибки:

    2.1.При оценке вычисленного значения критерия t делаются выводы о достоверности (или недостоверности) самих результатов исследования. На основании этого метода нельзя судить о достоверности самих полученных результатов исследования, а только лишь о достоверности различии между ними;

    2.2.При значении критерия t меньше 2, делается вывод о необходимости увеличения числа наблюдении, таким образом значение критерия t связывается только с величиной ошибок репрезентативности. Если же выборочные совокупности репрезентативны (то есть достаточны по числу наблюдений и качественно однородны) генеральной, то нельзя делать вывод о необходимости увеличения числа наблюдений, так как в данном случае значение критерия t свидетельствует о случайности в различиях результатов исследования.

6.5 Задачи эталоны

Пример 1: Из 120 детей, больных ревматизмом, состоящих под диспансерным наблюдением, у 10% сформировался порок сердца.

Определить ошибку репрезентативности и доверительные границы показателя частоты формирования порока сердца у детей, больных ревматизмом к состоящих под диспансерным наблюдением.

1. Вычисляем ошибку репрезентативности

mp =  √

10*(100-10)

= ± 2,7

120

                                                        

2. Определяем доверительные границы генеральной совокупности.

Задаем необходимую степень вероятности безошибочного прогноза. Для данного исследования достаточно Р=95%. что при n > 30 соответствует значению критерия t = 2

Pгeн = Pвыб ± tmP Рген=10±2*2,7=10±5,4 то есть не более 15,4% и не менее 4,6%

Вывод: С вероятностью безошибочного прогноза равной 95% установлено, что частота формирования порока сердца у детей, больных ревматизмом и состоящих под диспансерным наблюдением составит не менее 4,6 и не более 15,4 случаев на 100 больных ревматизмом детей.

Пример 2: Обследовались 25-летние мужчины и женщины. В группе мужчин:

средняя величина спирометрии М1 = 3400 см2

средняя ошибка m1 = 250,0 см2

В группе женщин:

средняя величина спирометрии М2 = 2600 см2

средняя ошибка m2 - 150,0 см2

Определить достоверность различия полученных результатов.

t =

M1M2  

=

3400 - 2600

=

800

= 2,76

√ m12 + m22

2502 +1502

85000

Вывод: Значение t=2,76 что соответствует вероятности безошибочного прогноза более 95%. Следовательно, различие в средних величинах спирометрии у мужчин и женщин достоверно.

Пример 3: При изучении показателей летальности в двух городских больницах были получены следующие данные: в больнице А показатель летальности Р1 был равен 3,2% (m1= ±0,04%), в больнице Б — Р2 = 2,7% (m2 = ±0,07%). Состав больных по отделениям был примерно одинаковым. Оценить достоверность разности показателей летальности в больницах А и Б.

t =

P1 – P2

=

3,2 -2,7

=

0,5

= 6,25

√ m12 + m22

√ 0,042 + 0,072

√ 0,0065

Вывод: Статистически достоверно (t > 2), летальность в больнице А показатель выше, чем в больнице Б.

6.6 Контрольные вопросы

  1.  Что такое средняя ошибка средней арифметической, ее определение и применение?
  2.  Как определяется достоверность различий средних величин, для каких целей?
  3.  Как рассчитать ошибку репрезентативности?
  4.  Как определяются доверительные границы для генеральной совокупности?
  5.  Как определяется достоверность разности относительных показателей?
  6.  Что такое «вероятность безошибочного прогноза»?
  7.  Что означает понятие «нулевая гипотеза»?
  8.  Можно ли оценить величину хи квадрат без таблицы? Каковы критерии оценки?

6.7 Задачи для самостоятельного решения

Требуется оценить достоверность разности между двумя относительными и средними величинами.

Вариант I В детской больнице А из 1600 оперированных умерло 16 больных, в детской больнице Б из 1800 оперированных умерло 24 больных.

Вариант 2 При изучении заболеваемости по обращаемости в районе Н. с численностью населения 250000 человек, по полу получены следующие данные: показатели заболеваемости у мужчин составили 504,7 на 1000 населения, у женщин — 529,4 на 1000 населения.

Вариант 3 Показатели послеоперационной летальности в двух больницах (р! и Р2), где распределение больных по видам операций было примерно одинаковым, составили

в больнице А — 2,0% (m1 = ± 0,3%)

в больнице Б — 1,5% (m2 = ± 0,2%)

Вариант 4 Частота кариеса зубов среди населения, использующего питьевую воду с пониженным содержанием фтора, составила 380 случаев на 1000 человек (m =± 10%о), в то время как пораженность кариесом зубов населения, потребляющего воду с нормальным содержанием фтора, составляет 200 случаев на 1000 населения (m = ± 15%о).

Вариант 5 Максимальное артериальное давление у студентов до сдачи экзаменов в среднем составило 127,2 мм рт. ст. (m1= ± 3,0 мм рт. ст), после сдачи экзамена 117,0 мм рт. ст. (m2= ±4,0 мм рт. ст.) Можно ли на основании этих данных считать, что действительно до сдачи экзамена у студентов отмечается некоторое повышение максимального артериального давления?

Вариант б В стационаре лечилось 40 больных с анемией. До лечения препаратами железа среднее количество гемоглобина в крови было 92,3 ± 2,2 г/л. После лечения препаратами железа среднее количество гемоглобина в крови стало 124,7 ±5,6 г/л.

Можно ли на основании этих данных считать, что действительно после лечения больных анемией препаратами железа отмечается повышение количества гемоглобина в крови?

Вариант 7 При изучении частоты пульса у детей 3-х лет двух детских садов обнаружено, что в детском саду А частота пульса в среднем составила 80,0 ± 2,0 ударов в минуту, а в детском саду Б — 78,0 ± 2,0 ударов в минуту.

Можно ли на основании этих данных говорить о большей частоте пульса у детей детского сада А?

РАЗДЕЛ 8

МЕТОДЫ СТАНДАРТИЗАЦИИ

В практической и научно-практической деятельности врачи любой специальности при изучении какого-либо явления, закономерностей и особенностей его распространения в различных совокупностях используют сравнение интенсивных показателей. Это относится, например, к сравнению показателей заболеваемости населения двух районов города, или производственного травматизма среди рабочих двух цехов, или летальности в двух больницах и т.д. При этом важно не только констатировать больший или меньший уровень одного из показателей, но и выяснить причины этой разницы. И прежде всего надо иметь в виду, что нередко состав совокупностей, для которых рассчитаны сравниваемые показатели, отличаются по какому-либо признаку (пол), возрасту, профессии, стажу работы и др.), что в свою очередь, может повлиять на различие показателей. Установить это и позволяет метод стандартизации.

Метод стандартизации применяется при сравнении интенсивных показателей, рассчитанных для совокупностей (групп), отличающихся по своему составу по какому-то признаку (полу, возрасту, профессии и т.д.).

Сущность метода стандартизации состоит в том, что он позволяет устранить возможное влияние различий в составе совокупностей по какому-либо признаку на величину сравниваемых интенсивных показателей.

Это достигается путем условного уравнивания составов этих совокупностей по данному признаку и расчета при этом стандартизованных показателей.

Стандартизованные показатели — это условные величины, не дающие представления об истинном размере явления, а указывающие лишь на то, какова была бы величина сравниваемых интенсивных показателей, если бы они были бы вычислены для однородных по своему составу (по данному признаку) совокупностей.

Существуют различные способы расчета стандартизованных показателей: прямой, косвенный, обратный. Наиболее распространенным является прямой метод стандартизации.

Этапы прямого метода стандартизации.

I этап.    Расчет интенсивных показателей в отдельных группах, по признаку различия (полу, возрасту, стажу работы и т.д.) и по совокупностям в целом.

II этап.   Выбор и расчет стандарта, то есть одинакового для сравниваемых совокупностей численного состава по данному признаку. За стандарт принимается сумма, полусумма численностей соответствующих групп или численный состав одной из сравниваемых групп.

III этап.     Расчет «ожидаемых величин» для каждой группы стандарта.

IV этап. Вычисление стандартизованных показателей для сравниваемых совокупностей.

V этап.   Сопоставление соотношений стандартизованных и интенсивных показателей. Выводы.

8.1.    Прямой метод стандартизации

Метод стандартизации 

1 .Случаи

применения

 

 

сравнение 

показателей 

, полученных на различных 

по составу 

группах 

вывод о наличии

или отсутствии влияния

элиминируемого фактора

на величину

показателя

устранение

влияния каких

либо факторов на величину

показателя

 

2. Методы 

стандартизации 

 

| 

прямой 

косвенный 

обратный 

3. Этапы 

стандарти- 

зации пря- 

мого метода 

              

вычисление

частных

и общих

показателей I

вы-

бор

стан-

дарта

II

расчет

ожидаемых

величин в

каждой

группе

стандарта

III

вычис-

ление

стандар-

тизиро-

ванных

показа-

телей

IV

сопоставление интенсивных

(фактических) и

стандарти-

зованных

показателей

V 

4.Определение стандарта 

 

 

 

сумма сравни-

ваемых

групп

полу 

сумма 

гру пп

одна из

групп

произвольный

численный состав

Примеры решения типовых ситуационных задач:

Пример 1

Вычислить стандартизованные показатели летальности в больницах А и Б. Сравнить их с интенсивными показателями и сделать выводы.

За стандарт принять полусумму больных, прошедших по каждому отделению в двух больницах.

Распределение больных и умерших по отделениям больниц А и Б

Отделение 

Больница А 

Больница Б 

число прошедших больных 

из них умерло 

число прошедших больных 

из них

умерло 

Терапевтическое 

600 

30 

200 

12 

Хирургическое 

300 

9 

700 

21 

Инфекционное 

100 

4 

100 

5 

Всего 

1000 

43 

1000 

38 

I этап. Вычисление интенсивных показателей в отделениях и по больницам в целом

Отделение 

Больница А 

Больница Б 

Терапевтическое

30 х 100

= 5%

600

12 х 100

= 6%

200

Хирургическое

9 х 100

= 3%

300

21 х 100

= 3%

700

Инфекционное

4 х 100

= 4%

100

5 х 100

= 5%

100

Всего

43 х 100

=4,3%

1000

38 х 100

=3,8%

1000

II этап. Определение стандарта.

За стандарт принимаем полусумму больных, прошедших по каждому отделению в двух больницах.

Отделение 

Число прошедших больных 

Стандарт 

Терапевтическое 

600+200 

400 

2 

Хирургическое 

300+700 

500 

2 

Инфекционное 

100+100 

100 

2 

Всего 

1000 + 1000 

1000 

2 

Ill этап. Определяем ожидаемое количество умерших больных в стандарте по каждому отделению в

больницах А и Б

Отделение 

Ожидаемое число умерших больных в стандарте

Больница А 

Больница Б 

Терапевтическое 

600—30

400— X     Х=20 

200—12

400— X      Х=24 

Хирургическое 

300—9

500— X     Х=15 

700—21

500— X      Х=15 

Инфекционное 

100—4

100— X      Х=4 

100—5

100— X      Х=5 

Всего 

∑=39 

∑=44 

IV этап. Определяем общие стандартизованные показатели летальности в больницах А и Б.

Больница Б

44x100

= 4,4%

1000

Больница А

39x100

= 3,9%

1000

V этап. Сопоставляем интенсивные и стандартизованные показатели в больницах А и Б.

Больница А 

Больница Б 

Соотношение А и Б 

Интенсивный показатель

4,3 

3,8 

А>Б 

Стандартизованный показатель

3,9 

4,4 

А<Б 

Выводы:

  1.  Уровень летальности в больнице А выше, чем в больнице Б.
  2.  Показатели летальности по отделениям, напротив, выше в больнице Б.
  3.  Однако, если бы состав больных в отделениях был одинаков, то летальность была бы выше в больнице Б.

Следовательно, на различия в уровнях летальности оказала влияние неоднородность больных в больницах А и Б, а именно, неодинаковое число прошедших больных по терапевтическому отделению больницы А и Б, поскольку большинство умерших больных приходится на это отделение.

Пример 2.

Используя метод стандартизации при сравнении уровней, производственного травматизма в цехах №1 и №2, сделайте соответствующие выводы. За стандарт принять сумму рабочих по каждой группе в обоих цехах.

Уровень производственного травматизма в цехах № 1 и № 2. 

Цех № 1 

Цех № 2 

Стаж работающих 

число рабочих 

число травм 

число рабочих 

число травм 

до 1 года 

300 

30 

150 

16 

1 — 4 года 

150 

6 

300 

20 

5 лет и более 

100 

2 

500 

12 

Всего 

550 

38 

950 

48 

I этап. Вычисление интенсивных показателей в группах и в целом по цехам

Стаж Работающих 

Число травм на 100 работающих 

Цех№1

Цех№2

Цех№2

до 1 года 

30 х 100% 

= 10,0%

16x100% 

=10,7%

300 

150 

1 — 4 года 

6 х 100% 

= 4,0%

20 х 100% 

=6,7%

150 

300 

5 лет и более 

2x100% 

= 2,0%

12x100% 

=2,4%

100 

500 

Всего 

38 х 100% 

= 6,9%

48 х 100% 

=5,0%

550 

950 

II этап. Определяем стандарт. За стандарт принимаем сумму рабочих по каждой группе в обоих цехах.

Стаж работы 

Число работающих 

Стандарт 

до 1 года 

300+150 

450 

1 — 4 года 

150+300 

450 

5 лет и более 

100+500 

600 

Всего 

550+950 

1500 

III этап. Определяем ожидаемое число травм в стандарте по каждой стажевой группе для цехов № 1 и № 2.

Стаж работы

Ожидаемое число травм в стандарте

Цех № 1

Цех № 2

до 1 года

300 - 30

450 - Х      Х = 45,0

150-16

450 - Х    X = 48,0

1-4 года

150 - 6

450 -Х      Х=18,0

300 - 20

450 - X    Х = 30,0

5 лет и более

100 -2

600 -Х      Х=12,0

500-12

600 - X     X = 14,4

Всего

∑=75,0

∑=92,4

IV этап. Определяем общие стандартизованные показатели травматизма в цехах № 1 и № 2.

Цех № 1

75,0x100

= 5,0 на 100 работающих

1500

Цех № 2

92,4x100

= 6,2 на 100 работающих

1500

V этап. Сопоставляем интенсивные и стандартизованные показатели травматизма в цехах № 1 и № 2.

Цех № 1

Цех № 2

Соотношение № 1 и № 2

Интенсивные Показатели

6,9

5,0

№ 1 > № 2

Стандартизованные показатели

5,0

6,2

№ 1  № 2

Выводы:

  1.  Уровень производственного травматизма в цехе № 1 выше, чем в цехе № 2.
  2.  Показатели травматизма по стажевым группам, напротив, выше в цехе № 2.
  3.  Однако, если бы состав рабочих по стажу в этих цехах был одинаков, то
    травматизм был бы выше в цехе № 2.

Следовательно, на различия в уровнях травматизма оказала влияние неоднородность стажевого состава рабочих, а именно, преобладание в цехе № 1 рабочих со стажем до 1 года, имеющих высокие показатели травматизма, а в цехе № 2 — рабочих со стажем 5 лет и более, имеющих низкие показатели травматизма.

8.2 Косвенный метод стандартизации

Применяется, если специальные коэффициенты в сравниваемых группах неизвестны или известны, но мало достоверны. Это наблюдается, например, когда числа заболевших очень малы и, следовательно, вычисляемые коэффициенты будут существенно меняться в зависимости от прибавления одного или нескольких случаев заболеваний.

Вычисление стандартизованных коэффициентов косвенным способом можно разбить на три  этапа

I этап. Состоит в выборе стандарта. Так как нам обычно неизвестны специальные коэффициенты сравниваемых групп (коллективов), то за стандарт берутся специальные коэффициенты какого-то хорошо изученного коллектива. В рассматриваемом примере таковыми могут служить повозрастные показатели смертности от злокачественных новообразований в городе «С».

 

Стандарт - онкосмертность населения с городе С по возрастам (на 100000 нас.)

до 29 лет включительно - 5,0

30-39 лет - 32,0

40-49 лет - 130,0

50-59 лет - 360,0

60 лет и старше 730,0

всего 1250,0

Возрастные группы 

Численность населения 

Город А 

Город В 

до 29 лет включительно 

280000 

275000 

30-39 лет 

90000 

78000 

40-49 лет 

75000 

56000 

50-59 лет 

70000 

51000 

60 лет и старше 

65000 

40000 

Всего населения 

580000 

500000 

Всего умерло от н/о 

754 

590 

 

Вычисляем онкосмертность (на 100000 нас.)

Город А 754/580000x100000=130 на 100000 нас.

Город В 590/500000x100000=118 на 100000 нас.

II этап включает вычисление «ожидаемых» чисел умерших от злокачественных новообразований. Допуская, что повозрастные коэффициенты смертности в обоих сравниваемых городах равны стандартным, определяем сколько бы умерло людей от злокачественных новообразований в каждой возрастной группе.

Возрастные группы 

Численность населения 

я 

Город А 

Город В 

до 29 лет включительно 

100000-5

280000-х х=14,0 

100000-5

275000-х х=13,8 

30-39 лет 

100000-32 90000-х х=28,8 

100000-32 78000-х х=24,9 

40-49 лет 

100000-130 75000-х х=97,5 

100000-130 56000-х х=72,8 

50-59 лет 

100000-360 70000-х х=252,0 

100000-360 51000-х х=183,6 

60 лет и старше 

100000-730 65000-х х=474,5 

100000-730 40000-х х=292,0 

Всего 

866,8 

587,1 

III этап. На этом этапе вычисляются стандартизованные коэффициенты смертности населения от злокачественных новообразований. Для этого действительное число умерших относят к суммарному «ожидаемому» числу, и результат умножают на общий коэффициент смертности стандарта.

Вычисляем стандартизированные показатели для городов А и В

стандартизированные показатели

=

Действительное число умерших

Х

Общий коэффициент смертности стандарта

ожидаемое число умерших

Для г. А 754/866,8x125= 108 на 100000 нас.

Для г. В 590/587,1x125= 108 на 100000 нас.

Следовательно, более низкий общий коэффициент смертности населения в городе В (118,0 на 100000 нас. против 130,0 на 100000 нас. в городе А) объясняется более благоприятной возрастной структурой населения в этом городе.

8.3 Обратный метод стандартизации

Обратный метод стандартизации применяется при отсутствии данных о возрастном составе населения, когда имеются лишь сведения о возрастном составе больных или умерших, то есть данные обратные тем, что использовались при косвенном методе. Метод дает менее точные результаты. Они тем точнее, чем более дробные возрастные интервалы применяются при стандартизации. Важно также выбрать подходящий, близкий к сравниваемым контингентам, стандарт. Стандартом в этом случае служат возрастные коэффициенты смертности или заболеваемости.

Например, в городе Н за последние 10 лет несколько увеличились коэффициенты смертности населения от злокачественных новообразований со 115,5 на 100000 нас. в 1986 г. до 119,0 на 100000 нас. в 1996 г. За это время численность населения возросла с 800000 до 900000 человек и, по-видимому, возрастной состав был различен в сравниваемые годы.

I этап состоит из выбора стандарта. Примем за стандарт повозрастные коэффициенты   смертности   от   злокачественных   новообразований   на 100000 населения в 1989 г., в год переписи, когда эти коэффициенты были
определены с достаточной точностью.

II этап включает в себя вычисление «ожидаемой» численности населения города, при этом допускается, что повозрастные коэффициенты смертности от злокачественных новообразований в 1986 и 1996 гг. были
такими же, как и в 1989 г.

Стандартизация коэффициентов смертности от злокачественных новообразований в городе Н. Обратный метод (числа условные)

I этап 

II этап 

Возрастные группы

Повозрастные

коэффициенты смертности от злокачественных новообразований на

100000 населения, принятого за стандарт

1986 г. 

1996 г 

Число умерших от

злокачественных

новообразований в

данном возрасте

«Ожидаемая»

численность населения

Число умерших от

злокачественных

новообразований в

данном возрасте

«Ожидаемая»

численность населения

До 30 

4,0 

21 

525000 

18 

450000 

30-39 

35,0 

44 

125714 

36 

102857 

40-49 

132,0 

156 

110606 

181 

136364 

50-59 

354,0 

221 

62469 

278 

78523 

60 лет и

старше

722,0

482

66759

558

72280

Всего 

121,0 

924 

890548 

1071 

840024 

Для вычисления «ожидаемой» численности населения делим число умерших в каждой возрастной группе на соответствующие повозрастные коэффициенты смертности от злокачественных новообразований принятого за стандарт населения, и результат умножаем на 100000.

Например, для того, чтобы в возрасте до 30 лет коэффициент смертности от злокачественных новообразований составлял 4,0 на 100000 при наличии 21 умершего в этом возрасте в 1986 г., численность населения данного возраста в этом году должна составлять:

21х100000

=525000 человек

а в 1996 г.

18х100000

= 45000 человек

4,0

4,0

Таким же образом определяем «ожидаемую» численность населения для всех остальных возрастных групп населения. В результате подсчета оказалось, что «ожидаемая» численность населения в 1986 году составляла 890548 человек, а в 1996 году - 840024 человека.

Расхождение «ожидаемых» и фактических чисел населения вызвано различием действительных и принятых за стандарт повозрастных коэффициентов смертности населения от злокачественных новообразований.

III этап. На третьем этапе стандартизации для устранения указанного различия делим «ожидаемые» числа населения на фактические и умножаем на принятый за стандарт коэффициент смертности.

Для 1986 г. это составляет

890548

х 121,0 = 134,7 на 10000

800000

для 1996 года

840024

х 121,0 = 112,9 на 10000

900000

Отсюда можно сделать вывод, что некоторый рост общих коэффициентов смертности населения города Н от злокачественных новообразовании был вызван только изменением возрастного состава населения. После применения стандартизации и элиминирования влияния изменений возрастного состава оказалось, что за истекшие 10 лет население города стало реже умирать от злокачественных новообразований.

Необходимо еще раз подчеркнуть, что выбор конкретного метода стандартизации зависит от того, насколько полный статистический материал имеется в наличии. Прямой метод дает более надежные результаты но в случае невозможности его применения следует использовать косвенный или обратный метод стандартизации: они достаточно точны для практического применения. Стандартизация позволяет нам сделать правильный вывод о том, имеется ли действительно разница общих интенсивных коэффициентов в сравниваемых коллективах или эти различия зависят только от неодинаковой структуры сравниваемых совокупностей.

8.4 Контрольные вопросы

  1.  Что такое метод стандартизации?
  2.  Являются ли стандартизованные показатели истинными или условными.
  3.  Случаи применения метода стандартизации.
  4.  Что такое стандартизованные показатели?
  5.  Из каких этапов состоит прямой метод стандартизации?
  6.  Дайте понятие косвенного метода стандартизации, назовите его этапы.
  7.  Дайте понятие обратного метода стандартизации, назовите его этапы.

РАЗДЕЛ 9

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Измерение связи между явлениями или признаками   

1. Виды связи

Функциональная

корреляционная

2. Критерии оценки

корреля ционной связи

коэффициент корреляции

3. Методы

определения коэффи циента корреля ции

Метод квадратов (Пирсона)

Метод рангов (Спирмена)

4. Оценка характера связи

Прямая (+)

Обратная (+)

5. Оценка силы связи

Сильная

(от 0,7 до 1)

Средняя

(от 0,3 до 0,7)

Слабая

(от 0 до 0,3)

Все в природе связано и взаимообусловлено. Изменчивость одного признака находится в определенном соответствии с изменчивостью другого. Если изменению одного признака всегда соответствует изменение второго признака на определенную величину, то говорят о функциональной зависимости (связи). Примером такой зависимости являются физические, химические явления, зависимости в геометрии и т. д.

Примером может служить увеличение площади круга, которая находится в строгой зависимости от увеличения его радиуса, или тот факт, что угол правильного многоугольника зависит от числа сторон, но не зависит от их длины и т.п.

Когда с изменением одного признака второй может измениться на величину, которую заранее предопределить невозможно, и каждому значению одного признака может соответствовать несколько значений другого признака, говорят о корреляционной связи.

Корреляционная связь проявляется между массой тела и ростом детей, числом эритроцитов и содержанием гемоглобина в крови, дозой заражающего агента и летальностью животных, содержанием вредно действующих веществ в окружающей среде и заболеваемостью. Статистика измеряет эту связь. Статистический анализ связи обычно начинается с построения комбинационных аналитических таблиц, где очень важно провести правильную группировку материала, которая поможет выявлению зависимости.

Корреляционная зависимость отличается по форме, направлению и силе связи.

Форма связи может быть прямолинейной и криволинейной. Когда равномерным изменениям одного признака соответствуют равномерные изменения второго (при незначительных отклонениях), говорят о прямолинейной связи.

Например, с возрастанием загрязнения окружающей среды заболеваемость увеличивается. Когда равномерным изменениям одного признака соответствуют неравномерные изменения второго признака, причем неравномерность имеет определенную закономерность, говорят о криволинейной связи.

Направление связи может быть двух видов:

- прямое (положительное) т. е с увеличением одного признака второй тоже увеличивается или с уменьшением одного другой тоже уменьшается (например, с увеличением роста человека увеличивается масса его тела; с уменьшением концентрации вредных веществ в воздухе уменьшается заболеваемость)

- обратное (отрицательное): с увеличением одного признака второй уменьшается или с уменьшением одного признака второй увеличивается (например, с увеличением количества фтора в воде до оптимальных величин уменьшается заболеваемость флюорозом; с увеличением санитарной грамотности матерей уменьшается заболеваемость детей)

Сила связи измеряется степенью корреляции. Под силой связи понимается сопряженность связанных признаков, широта варьирования значений. Связь может быть сильной, средней, слабой.

Корреляция

Коэффициент при корреляции

прямой

обратной

Слабая (малая, низкая) Средняя

Сильная (большая,   высокая)

0 - 0,3

0,3 - 0,7

0,7 - 1,0

0 - (- 0,3)

(-0,3) - (-0,7)

(-0,7) - (-1,0)

При определении коэффициента корреляции наиболее часто применяется метод квадратов (Пирсона) и метод рангов (Спирмена).

Вычисление корреляционной зависимости методом квадратов

Коэффициент корреляции методом квадратов (Пирсона) вычисляется по формуле:

rхy =

                         

                     

г - коэффициент корреляции

х и у - признаки, между которыми определяется связь dx и dy— отклонения каждой варианты от средней арифметической, вычисленной в ряду признака х и в ряду признака у.

Для определения достоверности коэффициента корреляции вычисляют:

1. Его ошибку по формуле

mr = ± √

1-rху2

n - 2

2. Критерий достоверности (t):

t =

rху

mr

При t равном или больше 3 - коэффициент корреляции достоверен.

9.2 Вычисление корреляционной зависимости методом рангов

Коэффициент корреляции методом рангов (Спирмена) вычисляется по формуле:

ρxy = 1 -

6 * ∑d2

n(n2-1)

ρ –  коэффициент корреляции,

х и у - признаки, между которыми определяется связь,

6 - постоянный коэффициент,

n - число наблюдений

Для определения достоверности коэффициента корреляции вычисляют его ошибку по формуле:

mρ = ± √

1- ρxy2

n - 2

Критерий достоверности (t)

t =

ρxy

mρ

Для вычисления коэффициента ранговой корреляции определяем порядковый номер (ранг), который занимает каждое значение систолического и диастолического давления.

При обозначении ранга начинают с меньшего (или большего) значения признака в обоих рядах. Так, например, значение систолического давления 105 мм рт. ст. является наименьшим и мы ставим ранг равный 1. Если значение признака встречается несколько раз ранги проставляются следующим образом: систолическое давление 110 мм рт. ст. встречается 3 раза, занимая по величине 2, 3, 4 места, поэтому порядковый номер в данном случае будет равен (2 + 3 + 4):3 = 3, т.е. против каждого значения систолического давления, равное 110 мм рт. ст., будет поставлен ранг равный 3, систолическое давление 115 мм рт. ст. встречается 2 раза и против каждого значения будет поставлен ранг (5 + 6):2 = 5,5и т.д. Аналогично проставляются ранги и для значений диастолического давления.

Затем определяем разность между рангами в каждой строке, обозначив эту разность буквой d, возводим ее в квадрат.

Измерение корреляции между систолическим и диастолическим давлением

Систолическое давление (х)

Диастолическое давление (у)

Ранги

Разность рангов (d)

Квадрат разности рангов (d2)

X

У

105

65

1

2

-1

1

115

70

5,5

5,5

0

0

115

65

5,5

2

3,5

12,25

110

65

3

2

1

1

110.

70

3

5,5

-2,5

6,25

120

75

8,5

9

-0,5

0,25

120

75

8,5

9

-0,5

0,25

120

70

8,5

5,5

3

9

125

75

11,5

9

2,5

6,25

110

70

3

5,5

-2,5

6,25

125

80

11,5

11,5

0

0

120

80

8,5

11,5

0

9

                                    ∑=51,5

Коэффициент ранговой корреляции определяется по формуле

ρxy = 1 -

6 * ∑d2

n(n2-1)

В нашем примере:

ρxy = 1 -

6 * 51,5

= 1 -

309

= 1 – 0,18

= + 0,82

12*143

1716

Коэффициент корреляции, равный +0,82, свидетельствует о наличии прямой, сильной связи между систолическим и диастолическим давлением.

Для определения достоверности коэффициента корреляции вычисляем:

а) его ошибку:

mρ = ± √

1- ρxy2

= ±√

1-0,67

=±√ 0,033

= ±0,18

n - 2

10

б) критерий достоверности:

t =

ρxy

=

0,82

= 4,5

mρ

0,18

Поскольку критерий t больше 3, коэффициент корреляции достоверен.

Таким образом, между систолическим и диастолическим давлением существует прямая сильная корреляционная зависимость статистически достоверная

9.3 Контрольные вопросы

  1.  Что такое корреляционная связь?
  2.  Чем отличается корреляционная зависимость от функциональной?
  3.  Какие существуют методы вычисления коэффициента корреляции?
  4.  Какова оценка силы связи?
  5.  Как понимать термин «прямая» и «обратная» корреляционная зависимость?

9.4 Задачи для самостоятельного решения

Задача 1

Определите характер и силу связи между загрязненностью воздуха рабочей зоны и частотой возникновения заболеваний органов дыхания, основываясь на данных таблицы, (методом квадратов)

Средний уровень загрязненности воздуха рабочей зоны в течение смены (в перерасчете на ПДК) 

Абс число случаев временной нетрудоспособности в связи с болезнями органов дыхания (на 100 работающих) 

0,5

0,8

1,0

1,2
1,5
2,0

30 28 32 46 42 50 

Достоверны ли полученные результаты? 

Задача 2

Определите, существует ли зависимость между количеством детей в группах дошкольных учреждений и заболеваемостью ОРВИ среди них (см данные таблицы) (методом рангов)

Количество детей 

Кратность заболеваний ОРЗ

(число заболеваний в месяц) 

10 

1

4

3 2 4 3 5 2 3 6

11 

4

12 

3

13 

2

14 

4

15 

3

16 

5

17 

2

18 

3

18 

6

Задача 3

Определить коэффициент корреляции методом рангов. Длина и масса тела у 7 мальчиков в возрасте 5 лет

Длина тела, см 

Масса тела, кг 

95 

15 

93 

14 

98 

15 

108 

19 

106 

16 

101 

15 

110 

16 

ЛИТЕРАТУРА

  1.  Буштуева   К.А.,   Случанко   И.С.   Методы   и   критерии   оценки
    состояния здоровья населения в связи с загрязнением окружающей
    среды.: М, Медицина, 1979, 160 с.
  2.  Зайцев   В.М.,   Лифляндский   В.Г.,   Маринкин   В.И.   Прикладная
    медицинская статистика.: СПб, Фолиант, 2003,432 с.
  3.  Кучеренко В.З. Применение методов статистического анализа для
    изучения общественного здоровья и здравоохранения.: - М., 2004,
    Гэотар-мед, 192 с.
  4.  Лисицын Ю.П. Общественное здоровье и здравоохранение. М.,
    2002, Гэотар-мед, 520 с.
  5.  Медик В.А., Юрьев В. К. Курс лекций по общественному здоровью
    и здравоохранению. Часть
    I.   Общественное здоровье  — М.: Ме
    дицина, 2003. - 368 с.
  6.  Миняев    В.А.,    Вишнякова   Н.И.    Общественное    здоровье    и
    здравоохранение. М., 2002, Медпресс-информ, 528 с.
  7.  Серенко Л.Ф., Ермакова В.В. Социальная гигиена и организация
    здравоохранения., М., 1984, Медицина, 640 с.

8.Юрьев     В.К.     Куценко     Г.И.     Общественное     здоровье     и
здравоохранение СПб., 2000, Петрорполис, 912 с

Методы статистического анализа в медицине

Методы статистического анализа в медицине

Учебное пособие для студентов медицинских вузов

Отпечатано в типографии КГМА. г. Киров, ул. К. Маркса, 112

Тираж 500. Заказ 225.




1. Манифест систем объектно-ориентированных баз данных
2. Методика преподавания информатики электронные таблицы Excel
3. ТАНЦЕВАЛЬНО-ИГРОВАЯ ГИМНАСТИКА «СА ФИ - ДАНСЕ» КАК СРЕДСТВО РАЗВИТИЯ ТВОРЧЕСКИХ СПОСОБНОСТЕЙ У ДОШКОЛЬНИКОВ
4. реферат дисертації на здобуття наукового ступеня кандидата економічних наук Львів ~1
5. Оподаткування субєктів малого бізнесу єдиний податок
6. Тема- Экономическая природа рынка ценных бумаг и его формирование в Российской Федерации
7. Нормирование качества окружающей среды
8. реферату- Товарне виробництвоРозділ- Організація виробництва Товарне виробництво План Товар та його вл
9. а преобразуются в кодирующем устройстве в последовательности символов.
10. На самом деле человечество ежедневно печатает умопомрачительное количество информации нанося ее на бумагу
11. и кинопленке могут быть преобразованы в цифровой компьютерный формат путем пространственной дискретизаци
12. Управление как деятельность государства по выполнению его задач и функций, его социальное назначени
13. Тема 2 Организационноправовые формы управления в общественном секторе
14. Тема- Здоровый образ жизни Здоровому все здорово Цель урока- развитие ценностного отношения к здор
15. IQ, когнитивный стиль и креативность
16.  I usully to get up t seven o~clock in the morning
17. 13 лет- 30 33 36 39 42 45 48 48 [2000 2003 г
18. Тема задания- Принцип возможных перемещений возможное перемещение 6
19. Исследования малых групп в зарубежной социальной психологии.html
20. РЕФЕРАТ Дисертація на здобуття наукового ступеня кандидата сільськогосподарських наук Ль