Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Согласно наиболее популярному определению, доказательная медицина (медицина, основанная на доказательствах) это сознательное, четкое и беспристрастное использование лучших из имеющихся доказанных сведений для принятия решений о помощи конкретным больным (Дэвид Сакет). Или согласно другому определению: доказательная медицина это последовательное и сознательное применение в ведении конкретных пациентов только тех вмешательств, эффективность которых доказана в доброкачественных исследованиях (группа канадских ученых, Университет Мак-Мастер, 1990). Профессор Дэвид Сакет (David Sackett) во введении в первый выпуск журнала «Доказательная медицина» сформулировал основные аспекты новой науки доказательной медицины.
Основные предпосылки возникновения доказательной медицины:
1) растущая потребность в критической оценке огромного количества медицинской информации (с целью установления ее надежности и достоверности), рост числа альтернативных методов лечения и диагностики, необходимость их грамотного выбора на основе надежных научных сведений;
2) ограниченный объем финансирования на оказание медицинской помощи (учитывая данный фактор из всего многообразия предлагаемых методов должны быть выбраны только те, доказательство эффективности которых не вызывает сомнений).
Понятие доказательной медицины включает в себя умение оптимального выбора врачом наилучшего способа лечения и диагностики для конкретного пациента, используя как накопленный опыт коллег, так и современные научные достижения в области медицины.
Доказательная медицина разрабатывает научные основы врачебной практики свод правил для принятия клинических решений. Главный постулат доказательной медицины: каждое клиническое решение должно базироваться на строго доказанных научных фактах.
Изучение принципов доказательной медицины позволяет:
Методы доказательной медицины позволяют врачу, стремящемуся быть в курсе последних достижений медицины, оперативно найти нужную информацию, касающуюся поставленного вопроса, осуществить поиск по доступным источникам данных и дать им критическую оценку. Научно-обоснованная медицинская практика (доказательная медицина) учит врача искусству критического анализа информации и умению соотнести результаты исследования с конкретной клинической ситуацией.
Как наука доказательная медицина базируется на двух основополагающих направлениях: клинической эпидемиологии и медицинской статистике.
Клиническая эпидемиология это наука, разрабатывающая методы клинических исследований, минимизирующие влияние систематических и случайных ошибок.
Цель клинической эпидемиологии разработка и применение таких методов клинического наблюдения, которые дают возможность делать справедливые заключения.
В отличие от фундаментальных биомедицинских наук, клиническую медицину интересуют вопросы, ответы на которые могут дать исследования только на живых людях, а не на экспериментальных животных, культурах тканей или клеточных мембранах. Клиническое исследование трудно отнести к “чистому эксперименту”. Здесь объект изучения пациент, который волен сам определять свои поступки, а экспериментатор врач с личным профессиональным опытом, склонностями и подчас ошибочными суждениями. Вот почему в клинических исследованиях всегда заложена опасность систематических ошибок (предвзятости), избежать которых можно лишь следуя четким научным принципам.
“Золотым стандартом” клинических исследований считаются рандомизированные контролируемые испытания (РКИ). Они обязательно предполагают наличие опытной и контрольной групп, пациентов распределяют по группам случайным образом (рандомизация), следя при этом, чтобы группы не различались по параметрам, влияющим на исход заболевания. Врач, а тем более сам пациент не знают, получает ли больной плацебо (безвредное неактивное вещество, предлагаемое под видом лекарства, которое не отличается от него по виду, запаху, текстуре) или лекарство (такое исследование носит название "двойной слепой" метод). Перед включением пациента в исследование он подписывает документ «Информированное согласие пациента», предусматривающий его согласие на использование плацебо. Все пациенты прослеживаются в течение определенного, часто весьма длительного отрезка времени (проспективное исследование), по истечении которого сравнивается частота наступления клинически важных конечных точек (выздоровление, смерть, осложнения) в опытной и контрольной группах. Нередко для проведения подобных исследований привлекаются тысячи и десятки тысяч больных, в разных научных центрах и странах (мультицентровое исследование). Таким образом, "золотым стандартом" клинических исследований является рандомизированное, мультицентровое, проспективное исследование, проведенное по "двойному слепому" методу.
Кроме "двойного слепого" метода исследование может быть проведено по "одиночному (простому) слепому" методу (только пациенты не знают, какое лечение, экспериментальное или контрольное, они получают), а также по "тройному слепому" методу (когда ни пациент, ни врач, ни специалист, обрабатывающий результаты, не знают, какое лечение, экспериментальное или контрольное, получает тот или иной пациент).
По способу набора данных исследования можно разделить на проспективные и ретроспективные. Проспективные исследования исследования, при которых данные накапливаются после того, как было решено провести исследование. Ретроспективные исследования исследования, при которых данные накапливаются до проведения исследования (выкопировка данных из медицинской документации).
Показатель, характеризующий надежность информации, приведенной в научном журнале, называется индекс цитируемости.
Медицинская статистика один из важнейших инструментов доказательной медицины.
Медицинская общественность долго не желала признавать важность статистики, отчасти потому, что она приуменьшала значение клинического мышления. Подобный подход ставил под сомнение компетентность врачей, опирающихся на постулаты неповторимости каждого больного, и, следовательно, индивидуальности выбранной терапии. Особенно это было заметно во Франции стране, которая подарила миру множество исследователей, изучавших проблемы вероятности: Пьера де Ферма, Пьера-Симона Лапласа, Авраама де Муавра, Блеза Паскаля и Симеона Дениса Пуассона. В 1835 г. уролог Ж. Сивиаль опубликовал статью, из которой следовало, что после бескровного удаления камней мочевого пузыря выживают 97% больных, а после 5175 традиционных операций выжили только 78% больных. Французская академия наук назначила комиссию врачей для того, чтобы проверить данные статьи Ж. Сивиаля. В отчёте этой комиссии было высказано и обосновано мнение о нецелесообразности применения статистических методов в медицинеК середине 19 века «…уже были разработаны основные принципы статистики и известно понятие вероятности событий. В книге «Общие принципы медицинской статистики» Жюль Гавар применил их к медицине. Эта книга замечательна тем, что в ней впервые подчеркивалось, что вывод о преимуществе одного метода лечения перед другим должен основываться не только на умозрительном заключении, но вытекать из результатов, полученных в процессе непосредственного наблюдения достаточного количества больных, получавших лечение по сравниваемым методикам. Можно сказать, что Гавар фактически разработал статистический подход, на котором в наши дни основывается доказательная медицина.
Фактором, оказавшим значительное влияние на развитие математических методов статистики, стало открытие закона больших чисел Яковом Бернулли (1654-1705) и появление теории вероятности, основы которой разработал французский математик и астроном Пьер Симон Лаплас (1749-1827). Заметным этапом в ряду этих событий для медицинской статистики стала публикация работ бельгийского ученого А. Кетле (1796-1874), впервые применившего на практике математико-статистические методы исследования. В своей работе «О человеке и развитии его способностей» А. Кетле вывел тип среднего человека, наделенного, наряду со средними показателями физического развития (рост, вес), средними умственными способностями и средними моральными качествами. В этот же период времени в России выходит работа врача Бернулли «О прививках против оспы: о смерти и теории вероятности».
Медицинская статистика как точка приложения методов математической статистики занимает особое место. Это особое место обусловлено большой ролью медицины в возникновении статистики как самостоятельной науки и существенным влиянием научно-исследовательских разработок медико-биологических проблем на появление многих методов статистического анализа. В настоящее время, с целью подчеркнуть особый статус медико-биологической математической статистики, для ее обозначения все чаще используют термин биометрия.
Большинство методов статистического анализа являются универсальными и могут применяться не только в разных отраслях медицинской статистики, но и в самых разнообразных отраслях человеческой деятельности. Например, с точки зрения формальной логики статистический прогноз инфекционной заболеваемости и прогноз курса доллара одна и та же задача.
Методы медицинской статистики можно разделить на следующие группы:
Теория вероятностей математическая наука, устанавливающая закономерности случайных явлений.
Закономерности, устанавливаемые теорией вероятностей, позволяют по вероятностям одних случайных событий находить вероятности других случайных событий, связанных каким-либо образом с первыми.
Вероятность это возможность реализации какого-либо события, например, выздоровления или смерти. Когда речь идет о вероятности, используются соответствующие термины:
Эксперимент процесс измерения или наблюдения с целью сбора данных. Примером является кидание костей или оценка исходов лечения.
Событие (исход) определенный результат эксперимента. Примером является факт одновременного выпадения двоек, троек, четверок или пятерок на обеих костях. Для медицины примером может служить оценка результатов при выписке пациентов: излечение или хронизация заболевания, выявление заболевания у наугад выбранного человека при проведении профилактического осмотра. Под событием в теории вероятностей понимается всякий факт, который при реализации определенного комплекса условий может произойти или не произойти.
Выборочное пространство все возможные исходы эксперимента. Если рассматривать пример с двумя игральными костями и подсчитывать сумму выпавших значений, то выборочное пространство для нашего эксперимента это множество {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.
Чтобы правильно определить вероятность, необходимо решить, о каком типе вероятности идет речь.
Под вероятностью события понимается численное выражение возможности появления данного события при реализации определенных условий. Например, вероятность выпадения «орла» или «решки» при бросании монетки равна 0.5.
При введении понятия вероятности мы опираемся на практический смысл, а именно: на основании опыта считаем более вероятными те события, которые происходят чаще, и менее вероятными те, которые происходят реже. Равновероятные события события, которые происходят с одинаковой частотой, ни одно из них не является объективно более возможным, чем другие. Например, выпадение «орла» или «решки» при бросании монетки; выбор белого или черного шара из урны, в которой находится одинаковое число черных и белых шаров.
Случайная величина величина, которая при реализации определенных условий может принимать различные значения. Пример: число вызовов, поступающих на станцию скорой помощи в течение суток.
Достоверное событие событие, которое при реализации определенных условий произойдет в любом случае. Пример: неизбежная смерть человека при приеме токсической дозы цианистого калия или падение любого предмета вниз под действием силы тяжести.
Если приписать достоверному событию вероятность, равную 1, то вероятности всех других событий, возможных, но не достоверных, будут определяться числами от 0 до 1.
Противоположностью по отношению к достоверному событию является событие невозможное.
Невозможное событие событие, которое при реализации определенных условий произойти не может. Пример: падение брошенного под действием силы тяжести предмета на потолок, а не на пол, или регенерация утраченных конечностей.
Невозможному событию приписывается вероятность, равная 0.
Таким образом, мы установили меру вероятности и диапазон ее возможных значений. Вероятность появления случайного события всегда больше нуля и меньше единицы, что символически записывается следующим образом:
0 < Р(А) < 1,
где А случайное событие. Р(А) вероятность появления события А.
Если Р(А) = 1, то событие А точно произойдет. Пример события А: человек с наличием пульса, дыхания и мозговой активности жив.
Если Р(А) = 0, то событие А не произойдет. Пример события А: студенты университета за год не пропустят ни одной лекции.
События образуют полную группу событий, если при наличии определенных условий хотя бы одно из них появится непременно. Пример: выявление и невыявление заболевания при проведении профилактического осмотра; промах и попадание в цель при единичном выстреле по цели и т.д.
Вероятность появления какого-либо события из полной группы событий при наличии определенных условий равна 1.
События называются несовместными, если никакие два из них при наличии определенных условий не могут появиться совместно. Пример: здоровый человек, находящийся в контакте с инфекционным больным, не может одновременно заболеть и не заболеть, или заболеть и оказаться носителем инфекции и заболеть и не оказаться носителем инфекции.
Два несовместных события, образующих полную группу несовместных событий, называются противоположными событиями.
Обозначим событие, противоположное основному, той же буквой только с чертой сверху. Например: события «попадание в цель» (А) и «промах» () при одиночном выстреле по цели или события «заболеть» (А) и «не заболеть» () при контакте с инфекционным больным.
Если в группе событий события являются одновременно несовместными и равновозможными и образуют полную группу событий, то события называются случаями, и тогда мы имеем дело со схемой случаев.
Если какой-либо опыт сводится к схеме случаев, то вероятность события можно приравнять частоте благоприятных случаев, т.е. случаев, в которых произошло данное событие.
Основные теоремы теории вероятности
Вероятность суммы двух несовместных событий равняется сумме вероятностей этих событий.
Запишем теорему сложения символически:
Р(А + В) = Р(А)+Р(В),
где Р вероятность соответствующего события (событие указывается в скобках).
Пример. У больного наблюдается желудочное кровотечение. Этот симптом регистрируется при язвенной эрозии сосуда (событие А), разрыве варикозно-расширенных вен пищевода (событие В), раке желудка (событие С), полипе желудка (событие D), геморрагическом диатезе (событие F), механической желтухе (событие Е) и конечном гастрите (событие G).
Врач, основываясь на анализе статистических данных, присваивает каждому событию значение вероятности:
Всего врач имел 80 больных с желудочным кровотечением (n = 80), из них у 12 была язвенная эрозия сосуда (), у 6 разрыв варикозно-расширенных вен пищевода (), у 36 рак желудка () и т. д.
Для назначения обследования врач хочет определить вероятность того, что желудочное кровотечение связано с заболеванием желудка (событие I):
Вероятность того, что желудочное кровотечение связано с заболеванием желудка, достаточно высока, и врач может определить тактику обследования, исходя из предположения о заболевании желудка, обоснованном на количественном уровне с помощью теории вероятностей.
Если рассматриваются совместные события, вероятность суммы двух событий равна сумме вероятностей этих событий без вероятности совместного их наступления.
Символически это записывается следующей формулой:
Прежде чем перейти к теореме умножения, необходимо рассмотреть понятия независимых и зависимых событий и условной и безусловной вероятностей.
Независимым от события В называется такое событие А, вероятность появления которого не зависит от появления или непоявления события В.
Зависимым от события В называется такое событие А, вероятность появления которого зависит от появления или непоявления события В.
Пример. В урне находятся 3 шара, 2 белых и 1 черный. При выборе шара наугад вероятность выбрать белый шар (событие А) равна: Р(А) = 2/3, а черный (событие В)Р(В) = 1/3. Мы имеем дело со схемой случаев, и вероятности событий рассчитываются строго по формуле. При повторении опыта вероятности появления событий А и В остаются неизменными, если после каждого выбора шар возвращается в урну. В этом случае события А и В являются независимыми. Если же выбранный в первом опыте шар в урну не возвращается, то вероятность события (А) во втором опыте зависит от появления или непоявления события (В) в первом опыте. Так, если в первом опыте появилось событие В (выбран черный шар), то второй опыт проводится при наличии в урне 2 белых шаров и вероятность появления события А во втором опыте равна: Р(А) = 2/2= 1.
Если же в первом опыте не появилось событие В(выбран белый шар), то второй опыт проводится при наличии в урне одного белого и одного черного шаров и вероятность появления события А во втором опыте равна: Р(А)=1/2. Очевидно, в этом случае события А и В тесно связаны и вероятности их появления являются зависимыми.
Условной вероятностью события А называется вероятность его появления при условии, что появилось событие В. Условная вероятность символически обозначается Р(А/В).
Если вероятность появления события А не зависит от появления события В, то условная вероятность события А равна безусловной вероятности:
Если вероятность появления события А зависит от появления события В, то условная вероятность никогда не может быть равна безусловной вероятности:
Выявление зависимости различных событий между собой имеет большое значение в решении практических задач. Так, например, ошибочное предположение о независимости появления некоторых симптомов при диагностике пороков сердца по вероятностной методике, разработанной в Институте сердечно-сосудистой хирургии им. А. Н. Бакулева, обусловило около 50% ошибочных диагнозов.
Теорема умножения
Вероятность произведения двух событий А и В равна произведению вероятности одного из них (А) на условную вероятность другого (В), вычисленную при условии, что первое имело место.
Символически это записывается следующим образом:
Следствие 1. Если событие А не зависит от события В, то и событие В не зависит от события А.
Следствие 2. Вероятность произведения независимых событий равна произведению вероятностей этих событий.
Как уже говорилось, под произведением событий понимается совместное их появление.
Для двух событий по теореме умножения имеем:
Но поскольку события независимы, справедливо равенство Р(В/А) = Р(В), и тогда получаем:
Для трех событий по аналогии получаем:
Пример. Из урны, в которой находятся 1 черный и 2 белых шара (), выбираем два шара подряд. Какова вероятность того, что оба шара белые?
Если после выбора белого шара первый раз его возвращают в урну, то события и будут независимыми и равными:
Тогда искомая вероятность будет равна:
Классическая вероятность применима к ситуациям, когда нам известно число возможных исходов определенного события А. Если обозначить через m число случаев, в которых появилось событие А, а через n общее число случаев, в которых реализуются определенные условия, тогда вероятность появления события А вычисляется по формуле:
При этом для невозможного события и , для достоверного: и , для случайного: и .
Эта формула пригодна тогда и только тогда, когда опыт сводится к схеме случаев, т. е. обладает симметрией возможных исходов. Большинство же интересующих нас опытов и наблюдений не сводятся к схеме случаев.
Чтобы воспользоваться классической вероятностью, необходимо иметь представление о происходящем событии и оценить количество его исходов. Также необходимо сосчитать общее число событий в данном выборочном пространстве.
Пример. В кармане халата лежат две синих и одна красная ручки. Рассчитать вероятность извлечения красной ручки.
Решение:
Р(Акр) = 1/3 ≈ 0,33
противоположное событие извлечение синей ручки: Р(Асин)=2/3≈0,67.
Частотой, или эмпирической вероятностью, события А в данной серии опытов называется отношение числа опытов, в которых появилось событие А (m), к общему числу опытов (n). Под опытом будем понимать реализацию определенных условий.
Обозначим частоту события через Р* и получим:
При небольшом числе опытов частота носит случайный характер и может заметно измениться от одной группы опытов к другой.
Пример. Какова вероятность того, что студент сдаст зачет с первого раза? Ниже представлено количество попыток, потребовавшихся студенту по 20 дисциплинам, чтобы получить зачет: 2, 4, 3, 1, 2, 3, 3, 4, 3, 2, 3, 4, 3, 4, 1, 4, 3, 1, 3, 2.
Решение: Поскольку результат зависит от множества причин, придется опереться на эмпирическую вероятность.
Количество попыток |
Количество наблюдений |
Доля |
1 |
3 |
3/20 = 0.15 |
2 |
4 |
4/20 = 0.2 |
3 |
8 |
8/20 = 0.4 |
4 |
5 |
5/20 = 0.25 |
На основании этих наблюдений следует:
Итак, частота и вероятность тесно связанные друг с другом понятия, но существенно различные.
Закон больших чисел: когда эксперимент проводится большое число раз, эмпирическая вероятность этого процесса стремится к классической.
Чтобы продемонстрировать действие этого закона, предположим, что трижды подбрасывая монетку, каждый раз она выпадала «орлом» вверх. Для данного эксперимента эмпирическая вероятность выпадения орла равняется 100%. Но если подбросить монетку 100 раз, эмпирическая вероятность окажется гораздо ближе к классической вероятности в 50%.
Математическую формулировку этой закономерности впервые дал Яков Бернулли в своей теореме, которая представляет собой простейшую форму закона больших чисел. Я. Бернулли показал, что при неограниченном увеличении числа однородных независимых опытов с практической достоверностью можно утверждать, что наблюдаемая частота случайного события будет сколь угодно мало отличаться от вероятности появления события в отдельном опыте.
Практика определенно указывает на то, что при увеличении числа опытов частота стремится к некоторой постоянной величине, которая представляет собой вероятность появления случайного события.
Субъективная вероятность. Субъективная вероятность используется тогда, когда классическую и эмпирическую вероятности применить невозможно. В этом случае при оценке вероятности необходимо полагаться на опыт и интуицию. Примером использования субъективной вероятности может служить следующий вопрос: «Какова вероятность того, что пациент будет соблюдать предписанный режим питания?»
Средняя величина это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.
В зависимости от характера задачи пользуются тем или иным видом средней величины. К ним принадлежат среднее арифметическое, мода, медиана, степенные средние (среднее гармоническое, среднее геометрическое и т.п.).
Пусть имеется n объектов, для которых измерена некоторая характеристика, и получены значения , , ..., . Среднее арифметическое этих n значений обозначают через М и определяют как
это также может быть записано следующим образом:
Медиана, или средняя точка, может быть вычислена как для порядковых, так и для количественных данных. Если все элементы совокупности размещены в порядке возрастания или убывания числовых значений признака, то медиана это такое значение признака, которое делит всю совокупность пополам.
Итак, количество элементов совокупности, имеющих значение признака, меньшее медианы, равно количеству элементов со значением признака, большим медианы. Будем обозначать медиану символом Ме.
При нахождении медианы дискретного вариационного ряда следует различать два случая:
1) объем совокупности нечетный;
2) объем совокупности четный.
Если объем совокупности нечетный и равен (2n+1), и варианты размещены в порядке возрастания их значений:
то .
Если же количество элементов четное и равно 2n, то нет варианты, которая бы делила совокупность на две равные по объему части:
поэтому в качестве медианы условно берется полусумма вариант, находящихся в середине вариационного ряда:
Медиана обладает важными свойствами, которые в некоторых случаях дают ей преимущество перед другими средними величинами. Например, если при упорядоченном размещении некоторого признака "крайние" значения сомнительные и к тому же резко отличаются от основной массы данных, то в качестве меры центральной тенденции целесообразно использовать медиану. Это связано с тем, что на ее величину эти "крайние" значения никакого влияния не оказывают, а в то же время они могут существенным образом повлиять на значение среднего арифметического.
Среднее арифметическое является хорошей мерой центральной тенденции для количественных данных, не имеющих выбросов; медиана - для порядковых данных и для количественных данных, в том числе и при наличии выбросов. Подобная характеристика нужна и для номинальных данных. Такой характеристикой является мода. Она применяется как для неупорядоченных категорий, так и для упорядоченных, и для количественных данных.
Мода это такое значение признака, которое встречается наиболее часто. В случае дискретных рядов вычислить моду нетрудно. Достаточно найти варианту, которая имеет наибольшую частоту или относительную частоту, это и будет мода. Будем обозначать моду символом Мо.
Если все значения в вариационном ряде встречаются одинаково часто, то считают, что этот ряд не имеет моды.
Если два соседних значения вариационного ряда имеют одинаковую частоту, и она больше частоты любого другого значения, то считают, что мода равняется среднему арифметическому этих значений.
Если два не соседних значения вариационного ряда имеют одинаковую частоту, и она больше частоты любого другого значения, то считают, что вариационный ряд имеет две моды, а соответствующее распределение называют бимодальным.
Пример использования моды в медицинских исследованиях: требуется определить среднюю длительность госпитализации рабочих промышленных предприятий в связи с производственным травматизмом.
Число дней госпитализации |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Итого |
Число рабочих |
6 |
18 |
14 |
10 |
6 |
3 |
2 |
1 |
60 |
При визуальном анализе графического изображения распределения видно, что ряд распределения несимметричен: вершина распределения сдвинута в начало ряда. Если определять среднюю величину на основе среднего арифметического (М), то средняя длительность одной госпитализации составит 4,2 дня. Однако, чаще всего (Мо) длительность госпитализации составляла 3 дня.
Для правильного выбора пути статистического анализа необходимо знать вид распределения изучаемого признака.
Под видом распределения случайной величины понимают соответствие, устанавливаемое между всеми возможными числовыми значениями случайной величины и вероятностями их появления в совокупности. Вид (закон) распределения может быть представлен:
- аналитической зависимостью в виде формулы;
- в виде графического изображения;
- в виде таблицы.
Под видом распределения случайной величины понимают соответствие, устанавливаемое между всеми возможными числовыми значениями случайной величины и вероятностями их появления в совокупности. Вид (закон) распределения может быть представлен:
- аналитической зависимостью в виде формулы;
- в виде графического изображения;
- в виде таблицы.
Виды распределений
Посмотрим, как можно построить такой график на примере данных роста. Сначала, просто запишем результаты исследования. Потом, отсортируем всех людей по группам, так чтобы каждый попал в свой диапазон роста, например, "от 180 до 181 включительно". После этого необходимо посчитать количество людей в каждой подгруппе (диапазоне) это будет частота попадания роста жителей города в данный диапазон. Если затем эти частоты построить по оси у, а диапазоны отложить по оси х, можно получить гистограмму упорядоченный набор столбиков, ширина которых равна, в данном случае, одному сантиметру, а высота будет равна той частоте, которая соответствует каждому диапазону роста. Если зарегистрированных данных было достаточно много, то полученный график будет выглядеть примерно так:
Дальше можно уточнить задачу. Каждый диапазон разбить на десять, жителей рассортировать по росту с точностью до миллиметра. Диаграмма станет глаже, но уменьшится по высоте, т.к. в каждом маленьком диапазоне количество жителей уменьшается. Если гипотетически повторить эту процедуру несколько раз, будет вырисовываться колоколообразная фигура, которая характерна для нормального (или Гауссова) распределения:
Стандартизированные кривые нормального распределения, значения функций которых приводятся в таблицах книг по статистике, всегда имеют суммарную площадь под кривой равную единице. Это связано с тем, что вероятность достоверного события всегда равна 100% (или единице), а для любого человека иметь хоть какое-то значение роста достоверное событие.
Выделяют большое количество видов распределения признака в статистической совокупности. Остановимся на их краткой характеристике:
- правостороннее
- левостороннее
- бимодальное
Нормальное (Гауссово, симметричное, колоколообразное) распределение одно из самых важных распределений в статистике. Оно характеризуется тем, что наибольшее число наблюдений имеет значение, близкое к среднему, и чем больше значения отличаются от среднего, тем меньше таких наблюдений. Примерами характеристик, подчиняющихся нормальному распределению, являются показатели роста, веса, какие-либо биохимические показатели крови.
Гауссово распределение характеризует распределение непрерывных случайных величин и встречается в природе наиболее часто, за что и получило название «нормального».
Кривая нормального распределения имеет следующие свойства:
Среднее арифметическое, мода и медиана при нормальном распределении равны и соответствуют вершине распределения:
Нормальное распределение описывает явления, которые носят вероятностный, случайный характер, а также совместное воздействие на изучаемое явление небольшого числа случайно сочетающихся факторов. Однако, если какой-либо фактор играет преобладающую роль, то распределение не будет подчиняться Гауссову закону. Например, при исследовании показателя сахара крови для больных сахарным диабетом кривая распределения, имеющая симметричную форму для совокупности здоровых пациентов, станет несимметричной, и ее максимум сместится вправо (левостороннее асимметричное распределение).
При асимметричном распределении данных наиболее полезной мерой центральной тенденции становится медиана. Это связано с тем, что на простую среднюю арифметическую сильно влияют экстремальные (очень высокие или очень низкие) значения, из-за чего она может стать причиной неверной интерпретации результатов. Медиана же менее подвержена влиянию экстремальных величин.
Если график распределения имеет правостороннюю асимметрию ("хвост" вправо, в вариационном ряду преобладают варианты меньших значений), то в этом случае мода размещена левее, а среднее арифметическое (на рисунке обозначено как ) правее медианы:
Обратное расположение имеет место при левосторонней асимметрии графика. При этом, чем больше асимметричен график, тем больше расстояние между его средними точками.
Проиллюстрируем важность выбора медианы, а не среднего арифметического значения на следующем примере. График заработной платы для жителей России имеет правостороннее асимметричное распределение (большинство людей имеет небольшую заработную плату). В силу того, что разброс минимальной и максимальной величин заработной платы очень велик, экстремальные значения сильно сказываются на значении среднего арифметического М (на рисунке обозначено как ). В связи с этим М сильно сдвигается в сторону «хвоста» распределения (вправо) и не может характеризовать заработную плату, соответствующую большей части населения.
Бимодальное (двугорбое) распределение наблюдается тогда, когда исследуемый признак анализируется вне однородной совокупности и, следовательно, необходимо учитывать два средних значения признака для достоверного анализа. Пример: при оценке физического развития детей подростков распределение роста будет иметь две моды (соответствующие девочкам и мальчикам).
Альтернативное распределение наблюдается в том случае, когда значения исследуемого признака распределяются по принципу: «да/нет», т.е. взаимоисключают друг друга. Подобное распределение характерно для описания качественных признаков (пример: мужской, женский пол).
Использование средних величин в медицине и здравоохранении:
а) для оценки состояния здоровья например, параметров физического развития (средний рост, средний вес, средний объем жизненной емкости легких и др.), соматических показателей (средний уровень сахара в крови, средний пульс, средняя СОЭ и др.);
б) для оценки организации работы лечебно-профилактических и санитарно-противоэпидемических учреждений, а также деятельности отдельных врачей и других медицинских работников (средняя длительность пребывания больного на койке, среднее число посещений за 1 ч. приема в поликлинике и др.);
в) для оценки состояния окружающей среды.
Показатели измерения вариации признака бывают абсолютные и относительные. К абсолютным показателям вариации относят: размах вариации, лимит, среднее квадратическое отклонение, дисперсию. Коэффициент вариации и коэффициент осцилляции относятся к относительным показателям вариации.
Лимит (lim) это критерий, который определяется крайними значениями вариант в вариационном ряду. Другими словами, данный критерий ограничивается минимальной и максимальной величинами признака:
Амплитуда (Am) или размах вариации это разность крайних вариант. Расчет данного критерия осуществляется путем вычитания из максимального значения признака его минимального значения, что позволяет оценить степень разброса вариант:
Недостатком лимита и амплитуды как критериев вариабельности является то, что они полностью зависят от крайних значений признака в вариационном ряду. При этом не учитываются колебания значений признака внутри ряда.
Наиболее полную характеристику разнообразия признака в статистической совокупности дает среднее квадратическое отклонение (сигма), которое является общей мерой отклонения вариант от своей средней величины. Среднее квадратическое отклонение часто называют также стандартным отклонением.
В основе среднего квадратического отклонения лежит сопоставление каждой варианты со средней арифметической данной совокупности. Так как в совокупности всегда будут варианты как меньше, так и больше, чем она, то сумма отклонений , имеющих знак "", будет погашаться суммой отклонений, имеющих знак "", т.е. сумма всех отклонений равна нулю. Для того, чтобы избежать влияния знаков разностей берут отклонения вариант от среднего арифметического в квадрате, т.е. . Сумма квадратов отклонений не равняется нулю. Чтобы получить коэффициент, способный измерить изменчивость, берут среднее от суммы квадратов это величина носит название дисперсии:
По смыслу, дисперсия это средний квадрат отклонений индивидуальных значений признака от его средней величины. Дисперсия квадрат среднего квадратического отклонения .
Дисперсия является размерной величиной (именованной). Так, если варианты числового ряда выражены в метрах, то дисперсия дает квадратные метры; если варианты выражены в килограммах, то дисперсия дает квадрат этой меры (кг2), и т.д.
Среднее квадратическое отклонение квадратный корень из дисперсии:
В том случае, если число элементов совокупности , то при расчете дисперсии и среднего квадратического отклонения в знаменателе дроби вместо необходимо ставить .
Расчет среднего квадратического отклонения можно разбить на шесть этапов, которые необходимо осуществить в определенной последовательности:
Применение среднеквадратического отклонения:
а) для суждения о колеблемости вариационных рядов и сравнительной оценки типичности (представительности) средних арифметических величин. Это необходимо в дифференциальной диагностике при определении устойчивости признаков.
б) для реконструкции вариационного ряда, т.е. восстановления его частотной характеристики на основе правила «трех сигм». В интервале (М±3σ) находится 99,7% всех вариант ряда, в интервале (М±2σ) 95,5% и в интервале (М±1σ) 68,3% вариант ряда (рис.1).
в) для выявления «выскакивающих» вариант
г) для определения параметров нормы и патологии с помощью сигмальных оценок
д) для расчета коэффициента вариации
е) для расчета средней ошибки средней арифметической величины.
Для характеристики любой генеральной совокупности, имеющей нормальный тип распределения, достаточно знать два параметра: среднюю арифметическую и среднее квадратическое отклонение.
Рисунок 1. Правило «трех сигм»
Пример.
В педиатрии среднеквадратическое отклонение используется для оценки физического развития детей путем сравнения данных конкретного ребенка с соответствующими стандартными показателями. За стандарт принимаются средние арифметические показатели физического развития здоровых детей. Сравнение показателей со стандартами проводят по специальным таблицам, в которых стандарты приводятся вместе с соответствующими им сигмальными шкалами. Считается, что если показатель физического развития ребенка находится в пределах стандарт (среднее арифметическое) ±σ, то физическое развитие ребенка (по этому показателю) соответствует норме. Если показатель находится в пределах стандарт ±2σ, то имеется незначительное отклонение от нормы. Если показатель выходит за эти границы, то физическое развитие ребенка резко отличается от нормы (возможна патология).
Кроме показателей вариации, выраженных в абсолютных величинах, в статистическом исследовании используются показатели вариации, выраженные в относительных величинах. Коэффициент осцилляции - это отношение размаха вариации к средней величине признака. Коэффициент вариации - это отношение среднего квадратического отклонения к средней величине признака. Как правило, эти величины выражаются в процентах.
Формулы расчета относительных показателей вариации:
Из приведенных формул видно, что чем больше коэффициент V приближен к нулю, тем меньше вариация значений признака. Чем больше V, тем более изменчив признак.
В статистической практике наиболее часто применяется коэффициент вариации. Он используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Арифметически отношение σ и средней арифметической нивелирует влияние абсолютной величины этих характеристик, а процентное соотношение делает коэффициент вариации величиной безразмерной (неименованной).
Полученное значение коэффициента вариации оценивается в соответствии с ориентировочными градациями степени разнообразия признака:
- слабое до 10 %
- среднее 10 - 20 %
- сильное более 20 %
Использование коэффициента вариации целесообразно в случаях, когда приходится сравнивать признаки разные по своей величине и размерности.
Отличие коэффициента вариации от других критериев разброса наглядно демонстрирует пример.
Таблица 1
Состав работников промышленного предприятия
Учетный признак |
Среднее арифметическое |
Среднее квадратическое отклонение σ |
Коэффициент вариации, % |
Стаж работы (лет) |
8,7 |
2,8 |
32,1 |
Возраст (лет) |
37,2 |
4,1 |
11,0 |
Образование (классов) |
9,2 |
1,1 |
11,9 |
На основании приведенных в примере статистических характеристик можно сделать вывод об относительной однородности возрастного состава и образовательного уровня работников предприятия при низкой профессиональной устойчивости обследованного контингента. Нетрудно заметить, что попытка судить об этих социальных тенденциях по среднему квадратическому отклонению привела бы к ошибочному заключению, а попытка сравнения учетных признаков «стаж работы» и «возраст» с учетным признаком «образование» вообще была бы некорректной из-за разнородности этих признаков.
Стандартная ошибка среднего вычисляется по формуле:
В современной научной литературе средняя арифметическая записывается вместе с ошибкой репрезентативности:
или вместе со среднеквадратическим отклонением:
В случае, когда результаты исследования представлены относительными величинами (например, процентными долями) рассчитывается стандартная ошибка доли:
где P показатель в %, n количество наблюдений.
Результат отображается в виде (P ± m)%. Например, процент выздоровления среди больных составил (95,2±2,5)%.
В том случае, если число элементов совокупности , то при расчете стандартных ошибок среднего и доли в знаменателе дроби вместо необходимо ставить .
Для нормального распределения (распределение выборочных средних является нормальным) известно, какая часть совокупности попадает в любой интервал вокруг среднего значения. В частности:
На практике проблема заключается в том, что характеристики генеральной совокупности нам неизвестны, а выборка делается именно с целью их оценки. Это означает, что если мы будем делать выборки одного и того же объема n из генеральной совокупности, то в 68,3% случаев на интервале будет находиться значение M (оно же в 95,5% случаев будет находиться на интервале и в 99,7% случаев на интервале).
Поскольку реально делается только одна выборка, то формулируется это утверждение в терминах вероятности: с вероятностью 68,3% среднее значение признака в генеральной совокупности заключено в интервале, с вероятностью 95,5% - в интервале и т.д.
На практике вокруг выборочного значения строится такой интервал, который бы с заданной (достаточно высокой) вероятностью доверительной вероятностью «накрывал» бы истинное значение этого параметра в генеральной совокупности. Этот интервал называется доверительным интервалом.
Доверительная вероятность P это степень уверенности в том, что доверительный интервал действительно будет содержать истинное (неизвестное) значение параметра в генеральной совокупности.
Очевидно, что степень уверенности (доверительная вероятность) зависит от величины интервала: чем шире интервал, тем выше уверенность, что в него попадет неизвестное значение для генеральной совокупности. На практике для построения доверительного интервала берется, как минимум, удвоенная ошибка выборки, чтобы обеспечить уверенность не менее 95,5%.
Исходя из этого, доверительные границы (или доверительный интервал) - это границы средних или относительных величин, выход за пределы которых вследствие случайных колебаний имеет незначительную вероятность.
Доверительный интервал может быть переписан в виде: , где t доверительный критерий.
Доверительные границы средней арифметической величины в генеральной совокупности определяют по формуле:
Мген = Мвыб+ t mM
для относительной величины:
Рген = Рвыб+t mР
где Мген и Рген - значения средней и относительной величины для генеральной совокупности; Мвыб и Рвыб - значения средней и относительной величины, полученные на выборочной совокупности; mM и mP - ошибки средней и относительной величин; t - доверительный критерий (критерий точности,
Применение среднеквадратического отклонения:
а) для суждения о колеблемости вариационных рядов и сравнительной оценки типичности (представительности) средних арифметических величин. Это необходимо в дифференциальной диагностике при определении устойчивости признаков.
б) для реконструкции вариационного ряда, т.е. восстановления его частотной характеристики на основе правила «трех сигм». В интервале (М±3σ) находится 99,7% всех вариант ряда, в интервале (М±2σ) 95,5% и в интервале (М±1σ) 68,3% вариант ряда (рис.1).
в) для выявления «выскакивающих» вариант
г) для определения параметров нормы и патологии с помощью сигмальных оценок
д) для расчета коэффициента вариации
е) для расчета средней ошибки средней арифметической величины.
Для характеристики любой генеральной совокупности, имеющей нормальный тип распределения, достаточно знать два параметра: среднюю арифметическую и среднее квадратическое отклонение.
Рисунок 1. Правило «трех сигм»
Пример.
В педиатрии среднеквадратическое отклонение используется для оценки физического развития детей путем сравнения данных конкретного ребенка с соответствующими стандартными показателями. За стандарт принимаются средние арифметические показатели физического развития здоровых детей. Сравнение показателей со стандартами проводят по специальным таблицам, в которых стандарты приводятся вместе с соответствующими им сигмальными шкалами. Считается, что если показатель физического развития ребенка находится в пределах стандарт (среднее арифметическое) ±σ, то физическое развитие ребенка (по этому показателю) соответствует норме. Если показатель находится в пределах стандарт ±2σ, то имеется незначительное отклонение от нормы. Если показатель выходит за эти границы, то физическое развитие ребенка резко отличается от нормы (возможна патология).
Выбор подходящего метода сравнения выборочных совокупностей определяется несколькими факторами: характером сравниваемых признаков (качественные или количественные), числом сопоставляемых групп, зависимостью или независимостью выборок, а также видом распределения признака.
Выборки являются независимыми, если набор объектов исследования в каждую из групп осуществлялся независимо от того, какие объекты исследования включены в другую группу. Так, в частности, происходит при рандомизации, когда распределение объектов происходит случайным образом. Примером сравнения независимых выборок может служить сопоставление данных анализа крови в группе пациентов с аналогичными показателями в группе здоровых.
Группы являются зависимыми (связанными) в динамических исследованиях, когда изучаются одни и те же объекты в разные моменты времени. Например, показатели анализа крови у одних и тех же пациентов до и после лечения.
От вида распределения и типа исследуемого признака зависит выбор подходящего математико-статистического критерия. Критерии делятся на два типа параметрические и непараметрические.
Параметрические критерии критерии, основанные на оценке параметров распределения, к которым относятся среднее арифметическое, среднеквадратическое отклонение, дисперсия. Они применимы только в том случае, если численные данные подчиняются нормальному распределению. Если распределение отличается от нормального, то следует пользоваться так называемыми непараметрическими критериями.
Непараметрические критерии не основаны на оценке параметров распределения и вообще не требуют, чтобы данные подчинялись какому-то определенному типу распределения. Непараметрические критерии дают более грубые оценки, чем параметрические, но являются более универсальными. А параметрические методы более точны, но лишь в случае, если правильно определено распределение совокупности.
Перед тем как перейти к рассмотрению статистических критериев, введем понятия нулевой и альтернативной гипотез, которые нам потребуются в дальнейшем.
На каждом шаге процесса анализа данных выдвигаются две гипотезы. Первая обозначается и называется нулевой гипотезой. Вторая гипотеза обозначается и носит название альтернативной, т.е. противоположной по смыслу. Под «нулевой гипотезой» подразумевается допущение об отсутствии того или иного интересующего исследователя события, явления или эффекта, а под «альтернативной» о его наличии. Обе гипотезы, как бы они не были сформулированы, обязательно должны иметь взаимоисключающее содержание.
Нулевая гипотеза не может быть отвергнута, если ее вероятность окажется выше некого наперед заданного уровня α, достаточно близкого к 0, т.е. . Эта величина α носит название уровень значимости нулевой гипотезы.
Альтернативная гипотеза может быть принята лишь в том случае, если ее вероятность достигнет некого наперед заданного уровня β или превзойдет его, т.е. . Эта величина β уровень доверительной вероятности. Он соответствует «уровням безошибочных прогнозов», т.е. вероятностям 0.95, 0.99 и 0.999 (область практически достоверных событий). Соответственно, α очерчивает область практически невозможных событий с порогами вероятностей 0.05, 0,01 и 0.001.
Поскольку и альтернативные гипотезы, то их суммарная вероятность равна единице.
От вида распределения и типа исследуемого признака зависит выбор подходящего математико-статистического критерия. Критерии делятся на два типа параметрические и непараметрические. Параметрические критерии критерии, основанные на оценке параметров распределения, к которым относятся среднее арифметическое, среднеквадратическое отклонение, дисперсия. Они применимы только в том случае, если численные данные подчиняются нормальному распределению. Если распределение отличается от нормального, то следует пользоваться так называемыми непараметрическими критериями.
Для этих параметров разработаны два наиболее популярных параметрических критерия: критерий Стьюдента и критерий Фишера.
Критерий Стьюдента (t-критерий) критерий, основанный на сравнении средних значений выборок. Критерий Стьюдента является наиболее известным. С одной стороны, анализ средних значений сравнительно прост для вычислений. С другой стороны, средние величины наиболее наглядны и понятны.
Наиболее часто t-критерий используется в двух вариантах. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и опытная группа, состоящая из разных пациентов, количество которых в группах может быть различно. Во втором же случае используется так называемый парный t-критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп.
Для того, чтобы определить, является ли нормальным исследуемое распределение, используются критерии Шапиро-Уилка и Колмогорова-Смирнова.
Критерий Стьюдента для независимых выборок
Проверка гипотез производится при помощи критерия Стьюдента, обозначаемого символом :
где - стандартная ошибка или мера отклонения наблюдаемой разницы выборочных средних от теоретически возможной, «генеральной». Формально величина t показывает, во сколько раз разница выборочных средних превышает свою собственную случайную вариацию.
В случае независимых выборок критерий t рассчитывается следующим образом:
При этом, как для первой, так и для второй выборки стандартная ошибка m рассчитывается по формуле:
Полученное значение критерия t сравнивают со стандартным табличным значением t-критерия Стьюдента для выбранного уровня значимости и числа степеней свободы .
Если , нулевая гипотеза не может быть отвергнута, и различие выборочных средних считается «статистически незначимым» (при этом обязательно указывается при каком уровне значимости это имеет место).
Если , то это означает что величина d оказалась за пределами своих собственных случайных колебаний. Такое различие называют «статистически значимым», т.е. нулевая гипотеза может быть отвергнута.
Критерий Стьюдента для зависимых выборок
пример, когда у некой группы людей измерили частоту пульса и величину артериального давления, потом попросили сделать, скажем, 20 приседаний, и провели те же измерения повторно. Понятно, что реакция сердечно-сосудистой системы каждого человека будет весьма индивидуальной, причем результаты измерений, полученные «после того», будут находиться в причинной и «исторической» связи с исходным состоянием «до того», т.е. в зависимости от них.
В этом случае при обнаружении ненулевой разницы выборочных средних результатов «до того» и «после того» также рассчитывается критерий
Однако, величина рассчитывается иным образом:
- это разница парных вариант: , квадрат которой, как видно из формулы, суммируется по всем парам.
Проверка справедливости гипотез при этом производится так же, как и для независимых выборок:
Различие лишь в том, что число степеней свободы для определения табличного значения в данном случае составляет , где n число сравниваемых пар.
Критерий Фишера критерий сравнения выборочных дисперсий.
Однако, как всякая выборочная числовая характеристика, выборочная дисперсия величина случайная.
Дисперсия имеет распределение (распределение Пирсона), поэтому для ее анализа критерий Стьюдента неприменим. Для того, чтобы приблизить распределение к нормальному рассматривают разность логарифмов сравниваемых дисперсий, которая обозначается символом Z:
Величина Z имеет нормальное распределение и, соответственно, к ней может быть применен критерий Стьюдента.
На практике часто рассматривают отношение F большей из сравниваемых дисперсий к меньшей (следуя свойствам логарифмов):
Полученная величина критерия сравнивается с критическим табличным значением. Если на независимых выборках была обнаружена достоверность различия дисперсий, то их средние значения нельзя сравнивать по t- критерию Стьюдента!
Рассмотренный метод сравнения мер вариации и его модификации являются основой чрезвычайно мощного и информативного метода математико-статистического анализа данных, получившего название дисперсионный анализ.
Непараметрические критерии не основаны на оценке параметров распределения и вообще не требуют, чтобы данные подчинялись какому-то определенному типу распределения. Непараметрические критерии дают более грубые оценки, чем параметрические, но являются более универсальными. А параметрические методы более точны, но лишь в случае, если правильно определено распределение совокупности.
Параметрические критерии обладают высокой информативностью, поскольку позволяют не только обнаружить достоверность различий, но и точно, конкретно демонстрируют их характер и степень. Однако, при всех несомненных достоинствах параметрические критерии обладают и рядом существенных недостатков ограничениями их применимости. Самый серьезный из них - допущение о нормальности распределения сравниваемых величин. Втрое ограничение - непригодность таких критериев к выборкам малого объема (<10-15 измерений).
Рассмотрим критерии Манна-Уитни и Вилкоксона.
Критерий Манна-Уитни и критерий Вилкоксона критерии ранговые, т.е. основанные на сравнении сумм рангов, полученных тем или иным образом из сравниваемых выборочных распределений. В данном конкретном случае рангом называется порядковый номер числа в ранжированном (расставленном в порядке возрастания) массиве данных чем больше число, тем выше его ранг. При этом, если числа не повторяются, то их ранги в точности соответствуют их порядковым номерам. Если же некое число повторяется несколько раз, то всем им приписывается средний ранг. Продемонстрируем, как все это происходит и выглядит. Допустим, мы получили следующий вариационный ряд данных x:
5.6 11.7 -3.5 6.3 8 7.4 0.5 8 3 3.1 15.2 3.1 8 6.7 111 4.4
Здесь числа представлены в том порядке, как они были получены.
Расставим их в порядке возрастания и припишем порядковые номера, а также ранги R:
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
x |
-3.5 |
0.5 |
3 |
3.1 |
3.1 |
4.4 |
5.6 |
6.3 |
6.7 |
7.4 |
8 |
8 |
8 |
11.7 |
15.2 |
111 |
R |
1 |
2 |
3 |
4.5 |
4.5 |
6 |
7 |
8 |
9 |
10 |
12 |
12 |
12 |
14 |
15 |
16 |
Из приведенного примера хорошо видно, что при ранжировании происходит «линеаризация данных» - сглаживание их резких колебаний за счет того, что ранг числа не зависит от его абсолютной величины и разницы с соседними вариантами. Например, последнее число 111 чуть ли не на порядок превышает ближайшее к нему 15.2. Тем не менее, ранг его всего на 1 выше, чем у предпоследнего числа.
Ранговые критерии для сравнения выборочных совокупностей делятся на две группы для независимых и зависимых выборок.
Критерий Манна-Уитни ранговый критерий для сравнения независимых выборок.
Критерий парных сравнений Вилкоксона ранговый критерий для сравнения зависимых выборок.
Рассмотрим его на примере. У 10 здоровых взрослых людей измеряли кровяное давление после введения кофеина и плацебо. Получены следующие данные для «верхнего», систолического давления СД:
x(кофеин) |
126 |
145 |
137 |
116 |
137 |
157 |
125 |
139 |
143 |
163 |
y(плацебо) |
121 |
143 |
115 |
120 |
135 |
157 |
115 |
130 |
153 |
160 |
Возникает вопрос, можно ли на основании этих данных полагать, что кофеин оказывает физиологическое действие.
Вначале значения одного ряда строго попарно вычитают из значений другого с учетом знака разницы d. Вычтем нижний ряд из верхнего:
x(кофеин) |
126 |
145 |
137 |
116 |
137 |
157 |
125 |
139 |
143 |
163 |
y(плацебо) |
121 |
143 |
115 |
120 |
135 |
157 |
115 |
130 |
153 |
160 |
d |
5 |
2 |
22 |
-4 |
2 |
0 |
10 |
9 |
-10 |
3 |
Далее разницы ранжируют по известным правилам, но при этом не учитывают знак разницы (т.е. ранжируют по модулю). Нулевую пару отбрасывают.
d |
2 |
2 |
3 |
-4 |
5 |
9 |
10 |
-10 |
22 |
R |
1.5 |
1.5 |
3 |
4 |
5 |
6 |
7.5 |
7.5 |
9 |
Отдельно суммируют ранги для положительных и отрицательных разниц. В нашем случае получаем: , . В качестве значения критерия Tz берут меньшую сумму независимо от знака, т.е. Tz =11,5. Сравниваем это значение с «критическим» из специальной таблицы, входом в которую является число сравниваемых пар, но лишь тех, которые не дают нулевые разницы. В нашем случае таковых 9. Тогда Tкр = 6 для и Tкр =2 для. Поскольку даже для первого уровня значимости, различий уровней СД нулевую гипотезу отвергнуть нельзя и различия не являются статистически значимыми (р<0,05). Иными словами, у нас нет пока оснований утверждать, что действие кофеина носит исключительно физиологический характер.
Смысл теста состоит в следующем. Если бы мы имели бесконечно большой ряд случайных разниц, то число и величина положительных разниц равнялись бы числу отрицательных и, соответственно, суммы их рангов были бы равны. На конечном и ограниченном числовом массиве опять же чисто случайно может иметь место «перекос» в сторону преимущественно положительных или отрицательных разниц. Это обстоятельство и учитывается в критических значениях критерия.
Tкр это граница между практически возможными и практически невозможными значениями критерия. Соответственно, если , то полученная нами сумма рангов с достаточно высокой вероятностью могла возникнуть чисто случайно и о сдвиге одного числового ряда относительно другого ничего определенного сказать нельзя. Это недостоверное различие. Если же , то наблюдаемое различие положительных и отрицательных разниц не могло быть получено случайным образом. Это означает, что смещение значений в сопоставляемых числовых рядах объясняется действием какой-то систематически действующей, неслучайной причины, т.е. носит статистически достоверный (устойчивый и прогнозируемый) характер.
Как было показано выше, пары, имеющие одинаковые числовые значения и, соответственно, дающие нулевые разницы, исключаются из рассмотрения. И если таких случаев много, то «жесткость» критерия нарастает, поскольку Tкр тем меньше, чем меньше сравниваемых пар. Соответственно, увеличивается число ситуаций, когда нулевую гипотезу отвергнуть невозможно, и различие будет считаться незначимым. Более того, если число пар окажется меньше 6, то критерий Вилкоксона вообще перестанет «работать»: 6 - минимальное число пар, для которого еще существует Tкр. Для меньшего числа его просто невозможно рассчитать. А подобные ситуации в медико-биологической практике возникают довольно часто, поскольку многие измерения неизбежно приходится выполнять с достаточно высокой степенью грубости, и вероятность появления совпадающих значений здесь все еще весьма высока.
Любые явления в окружающем нас мире могут быть связаны прямой или обратной связью. Эта характеристика называется направленностью связи.
По направленности связь может быть прямой или обратной.
Прямая (или положительная) связь характеризует зависимость, при которой увеличение или уменьшение значения одного признака ведет, соответственно, к увеличению или уменьшению второго. Например, при увеличение температуры возрастает давление газа (при сохранении неизменным его объема). При уменьшении температуры снижается и давление.
Обратная (или отрицательная) связь характеризуется такой зависимостью, когда при увеличении одного признака второй уменьшается или, наоборот, при уменьшении одного, второй увеличивается. Обратная зависимость или обратная связь является основой нормального регулирования почти всех процессов жизнедеятельности любого организма.
По характеру связь может быть функциональной или корреляционной (статистической).
Функциональная зависимость такой вид зависимости, когда каждому значению одного признака соответствует точное значение другого (зависимость может быть задана функцией). Например: взаимосвязь радиуса и длины окружности. Такую зависимость можно считать полной (исчерпывающей). Она полностью объясняет изменение одного признака изменением другого. Этот вид связи характерен для объектов, являющихся точкой приложения точных наук. В медико-биологических исследованиях сталкиваться с функциональной связью приходится крайне редко, поскольку объекты исследований имеют большую индивидуальную изменчивость. С другой стороны, характеристики биологических объектов зависят, как правило, от комплекса большого числа сложных взаимосвязей и не могут быть сведены к отношению двух или трех факторов.
Корреляционная зависимость существует в том случае, когда при изменении величины одного признака наблюдается тенденция соответствующего изменения значений другого признака.
Например, при изменении роста человека меняется и масса тела. Однако, эта зависимость не является полной, т.е. функциональной. У людей с одинаковым ростом может быть разная масса тела, поскольку на нее влияют и многие другие факторы (питание, здоровье и т.п.). При оценке статистических связей можно говорить только о тенденции, когда возрастание одного признака вызывает тенденцию возрастания или уменьшения другого признака.
Корреляционная связь описывается с помощью различных статистических характеристик. Выбор характеристики для определения взаимосвязи обусловлен видом исследуемых признаков, способами их группировки и предполагаемым характером связи. Подчас, для выявления реально существующих взаимосвязей достаточно правильно составить статистическую таблицу распределения или построить наглядный график этого распределения.
Корреляционный анализ занимается измерением степени связи между двумя переменными (х и у). Вначале предполагаем, что как х, так и у количественные величины, например, рост и вес.
Предположим, что есть пара величин (х, у), измеренных у каждого из пациентов в выборке. Мы можем отметить точку, соответствующую паре величин каждого пациента, на двухмерном графике рассеяния точек (рис 1,2,3). Обычно переменную х располагают на горизонтальной оси, а у на вертикальной в той же диаграмме. Размещая точки для всех пациентов, получаем график рассеяния точек (корреляционное поле), который говорит о взаимосвязи между этими двумя переменными.
В результате могут возникнуть следующие ситуации:
Рисунок 1. Положительная (прямая) корреляционная связь
Рисунок 2. Отрицательная (обратная) корреляционная связь
Рисунок 3. Корреляционная связь отсутствует
Если на графике рассеяния точек построить прямую линию, наилучшим образом описывающую изображенные данные (расстояния от точек до прямой минимальны), то полученная прямая является линией регрессии. Расчет коэффициентов корреляции дает численную характеристику того, насколько близко находятся наблюдения к линии регрессии. Основными коэффициентами корреляции являются коэффициент корреляции Пирсона и коэффициент корреляции Спирмэна.
Свойства коэффициентов корреляции:
Следует отметить, что в случае биологических факторов тот или иной характер связи сохраняется, как правило, только в определенном интервале изменений признаков. За пределами этого интервала связь может ослабнуть, стать прямо противоположной по направлению либо совсем исчезнуть.
Например, при увеличении возраста ребенка сила скелетной мускулатуры увеличивается. В зрелом возрасте такой связи уже нет. А в старших возрастных группах тенденция становится обратной.
Сила корреляционной связи между признаками оценивается по величине коэффициента корреляции согласно Таблице 1:
Таблица 1
Распределение значений коэффициента линейной корреляции
Характеристики связи |
Прямая |
Обратная |
Связи нет |
0 |
0 |
Слабая |
от 0 до 0,3 |
от 0 до -0,3 |
Средняя |
от 0,3 до 0,7 |
от - 0,3 до -0,7 |
Сильная |
от 0,7 до 1 |
от - 0,7 до - 1 |
Полная (функциональная) |
+ 1 |
-1 |
Случаи, в которых не следует рассчитывать коэффициент линейной корреляции:
Рисунок 4. Диаграммы, показывающие, когда не следует рассчитывать коэффициент корреляции, (а) - соотношение нелинейно, (б) - при наличии выброса (выбросов), (в) - данные состоят из подгрупп.
Коэффициент корреляции Пирсона
Коэффициент корреляции Пирсона () определяет силу и направление связи только для количественных данных (x, y значения исследуемых признаков, n количество пар данных):
Условия для расчета коэффициента корреляции Пирсона:
Достоверность коэффициента корреляции устанавливается по величине средней ошибки. Поскольку коэффициент корреляции в клинических исследованиях рассчитывается обычно для ограниченного числа наблюдений, нередко возникает вопрос о надежности полученного коэффициента. С этой целью определяют среднюю ошибку коэффициента корреляции. При достаточно большом числе наблюдений (больше 100) средняя ошибка коэффициента корреляции () вычисляется по формуле:
n число наблюдений.
В том случае, если число наблюдений меньше 100 точнее определять среднюю ошибку коэффициента корреляции, по формуле:
С достаточной для медицинских исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине трех своих ошибок (r ≥3mr). Обычно это отношение коэффициента корреляции (r) к его средней ошибке (mr) обозначают буквой tr:
Если tr≥3, то коэффициент корреляции является статистически значимым.
Часы изучения х |
Балл на экзамене у |
Расчеты |
||
ху |
х2 |
у2 |
||
3 |
86 |
258 |
9 |
7396 |
5 |
95 |
368 |
25 |
8464 |
4 |
92 |
475 |
16 |
9025 |
4 |
83 |
332 |
16 |
6889 |
2 |
78 |
156 |
4 |
6084 |
3 |
82 |
246 |
9 |
6724 |
=79 |
Используя эти значения и n=6 (общее количество студентов), получаем:
Теперь рассчитаем среднюю ошибку коэффициента корреляции
Установим, надежной, ли является установленная нами связь
Ранговый коэффициент корреляции Спирмэна (rs) непараметрический аналог корреляционного коэффициента Пирсона.
Применение этого коэффициента корреляции может быть рекомендовано в случаях:
Вычисление:
1. Располагают величины х в возрастающем порядке, начиная с наименьшей величины, и придают им последовательные ранги (номера 1, 2, 3, .., n). Равные варианты получают среднее значение из суммы их порядковых номеров.
2. Подобным образом ранжируют у.
3. Рассчитывается rs коэффициент корреляции между рангами х и у по формуле:
где разности между рангами соответствующих пар y и x;
n число сопоставляемых пар.
x |
3 |
5 |
4 |
4 |
2 |
3 |
y |
86 |
95 |
92 |
83 |
78 |
82 |
Rx |
2.5 |
6 |
4.5 |
4.5 |
1 |
2.5 |
Ry |
4 |
6 |
5 |
3 |
1 |
2 |
Ry- Rx |
1.5 |
0 |
0.5 |
-1.5 |
0 |
-0.5 |
(Ry- Rx)2 |
2.25 |
0 |
0.25 |
2.25 |
0 |
0.25 |
Таким образом, получено, что исследуемая корреляционная связь является прямой и сильной.
В ходе корреляционного анализа или анализа корреляционной связи решается целая группа взаимосвязанных задач:
Таким образом, статистические методы изучения связи между переменными зависят от:
Статистические методы изучения связи между переменными могут быть:
В медицине и здравоохранении могут использоваться как абсолютные, так и относительные величины.
Абсолютные величины характеризуют показатели на определенный момент времени (моментные) или за период (интервальные). На момент времени абсолютные величины показывают состояние явления (численность населения, уровень артериального давления, показание температуры тела); за период явление за определенный промежуток времени (количество заболевших за неделю, число вызовов скорой помощи за месяц). Абсолютные величины всегда представляются в именованных единицах измерения (сантиметры, килограммы, дни и т. п.).
Относительные величины представляют собой отношение двух абсолютных показателей и, соответственно, не имеют размерности. Они вычисляются в том случае, когда необходимо сравнить явления, происходящие одновременно или отстоящие друг от друга по времени (пример: сравнение заболеваемости населения в г.Красноярске и заболеваемости в г.Ачинске; сравнение уровней рождаемости 2000 и 2011 гг.). Относительные величины широко используются в официальной статистике для оценки медико-демографической и санитарно-эпидемиологической ситуации, оценки деятельности медицинских учреждений и т.п.
Среди относительных величин наибольшее практическое значение имеют: интенсивные коэффициенты, экстенсивные коэффициенты, показатели соотношения, показатели наглядности, показатели относительной интенсивности.
Интенсивные коэффициенты показывают интенсивность развития (частоту, уровень, распространенность, риск) явления в среде, которая продуцирует это явление. Эти коэффициенты отвечают на вопрос, как часто явление встречается в известной среде.
Например: явление количество заболевших за год относим к среде, его продуцирующей численности населения.
Общая формула для расчета интенсивного показателя выглядит следующим образом:
Масштабирующий коэффициент применяется для удобства интерпретации полученных результатов. Его размер тем больше, чем меньше расчетное значение относительной величины. Масштабирующий коэффициент может принимать различные значения: 100, 1000, 10000 и т.д., и отражает численность населения, на которую рассчитывается показатель. ПримерВ таб. 1 представлены данные о числе смертей в городе N. На основании этих данных можно сделать вывод о снижении смертности населения города N на 800 случаев (с 10000 до 9200). Однако, за указанный период времени, с 1980 по 2005 год, численность жителей города уменьшилась, соответственно, с 1 000 000 до 850 000 человек
Показатель |
1980 г. |
2005 г. |
Число смертей (размер явления) |
10000 |
9200 |
Число жителей (размер среды) |
1000000 |
850000 |
Смертность на 1000 жителей (интенсивный показатель) |
10,0 |
10,8 |
Если теперь пересчитать смертность в относительных показателях, то окажется, что смертность населения не уменьшилась, а возросла с 10,0 до 10,8 случаев на 1000 (масштабирующий коэффициент) жителей города.
Аналогичным образом вычисляются специальные интенсивные показатели (когда речь идет об определенной причине заболеваемости или смертности). Например, если число умерших от туберкулеза в городе N составило в 2005 году 9, то показатель смертности от туберкулеза составит (9 / 850000 х 100 000), 1,1 случая на 100 000 жителей.
Одной из особенностей интенсивных коэффициентов является невозможность их прямого сложения между собой (поскольку это дроби с разными знаменателями).
Интенсивные величины используются для:
а) определения уровня частоты, либо распространенности того или иного явления;
б) сравнения ряда различных совокупностей по степени частоты того или иного явления;
в) динамического анализа изучаемого явления.
Для графического представления интенсивных коэффициентов используются различные варианты столбиковых и линейных диаграмм. Для отображения циклических явлений наглядными являются радиальные диаграммы.
Экстенсивные коэффициенты характеризуют долю части явления по отношению к явлению в целом и отражают его структуру. Они всегда выражаются в процентах. Пример: из общего количества госпитализированных в хирургическое отделение 35% пришлось на больных с острым аппендицитом, 25% - на больных с паховой грыжей, 20% - на больных с желчекаменной болезнью, 15% - на больных с осложнениями язвенной болезни желудка, 5% - на больных с другими диагнозами. Экстенсивные коэффициенты характеризуют отношение части статистической совокупности к целой совокупности (долю, удельный вес, часть от целого), т.е. отношение отдельного элемента к итогу:
Рассмотрим структуру причин смерти в Красноярском крае в 2009 году. Для графического представления экстенсивных коэффициентов используют внутрисекторную или внутристолбиковую диаграммы.
Структура причин смертности в Красноярском крае в 2009г. Внутрисекторная диаграмма.
При расчете экстенсивного показателя, как показателя структуры, сумма всех значений должна быть равна 100%.
Экстенсивные величины используются для:
а) определения удельного веса, части явления по отношению к явлению в целом;
б) для определения структуры явления (например, возрастно-половая структура населения).
Одной из самых распространенных ошибок, встречающихся в практике статистического анализа, является ошибочное использование интенсивных и экстенсивных коэффициентов. Экстенсивные величины не должны использоваться при сравнении явления во времени, а также при сравнении показателей в заведомо разных совокупностях.
Динамический ряд ряд однородных статистических величин, показывающий изменение какого-либо явления во времени.
С помощью статистического анализа динамических рядов решаются следующие задачи:
Числа, составляющие динамический ряд, называются уровнями ряда. Эти уровни могут быть представлены абсолютными, относительными или средними величинами.
Различают следующие виды динамических рядов:
Простой ряд, составленный из абсолютных величин, характеризующих динамику одного явления.
Сложный динамический ряд, отражающий изменение во времени параллельно нескольких явлений.
Моментный динамический ряд, состоящий из величин, характеризующих явление на какой-либо определенный момент времени. Например: численность населения на начало, середину или конец года.
Интервальный ряд, характеризующий изменение явления в течение какого-либо периода (интервала), итоги за определенный интервал времени (сутки, недели, год, несколько лет).
Интервальный ряд, в отличие от моментного, можно разделить на меньшие периоды, а также можно укрупнить интервалы.
Все относительные числа, характеризующие здоровье населения, а также показатели деятельности медицинских учреждений, как правило, представлены в виде интервальных динамических рядов.
Нередко некоторые уровни в динамическом ряду представляют значительные колебания, что затрудняет возможность проследить основную закономерность, свойственную данному явлению в изучаемый период. В таких случаях для выявления общей динамической тенденции рекомендуется провести выравнивание ряда. Последнее производится путем укрупнения интервала, вычисления групповой средней и скользящей средней.Пример
Таблица 2
Сезонные колебания случаев ангины в городе А
Месяц |
Число заболеваний |
|
По месяцам |
По кварталам (укрупнение) |
|
|
129 |
455 |
|
193 |
|
|
133 |
|
|
387 |
905 |
|
230 |
|
|
288 |
|
|
530 |
1280 |
|
370 |
|
|
380 |
|
|
231 |
650 |
|
137 |
|
|
282 |
Укрупнение интервала производят путем суммирования данных за ряд смежных периодов (см. таб. 2). Как видно из таб. 2, число заболеваний ангиной по месяцам то увеличивается, то уменьшается. После укрупнения интервалов по кварталам года можно увидеть определенную закономерность наибольшее число заболеваний соответствует летне-осеннему периоду года.
Вычисление групповой средней заключается в определении средней величины каждого укрупненного периода. Для этого надо суммировать смежные уровни соседних периодов, а затем сумму разделить на число слагаемых.
Пример
Таблица 3
Динамика расхождения клинических и патологоанатомических диагнозов в лечебном учреждении.
Годы |
Процент несовпадения диагнозов |
Групповая средняя |
2000 |
11 |
10,4 |
2001 |
9,8 |
|
2002 |
8,0 |
8,6 |
2003 |
9,2 |
|
2004 |
8,2 |
8,4 |
2005 |
8,6 |
|
2006 |
8,5 |
8,2 |
2007 |
7,9 |
Метод расчета скользящей средней для уровней ряда расчет средней арифметической предыдущего, данного и последующего уровней динамического ряда.
Пример расчета скользящей средней по табл.3:
для 2001г. (11,0 + 9,8 + 8,0) / 3 = 9,6
для 2002г. (9,8 + 8,0 + 9,2) / 3 = 9,0
для 2003г. (8,0 + 9,2 +8,2) / 3 = 8,5
и т.д.
Скользящая средняя является простейшим способом выравнивания ряда. Этот метод дает возможность сгладить и устранить резкие колебания динамического ряда.
Анализ динамического ряда. Вычисление основных показателей динамического ряда
На первом этапе статистической обработки динамических рядов анализируются основные тенденции (тренд) изменения явления во времени. Для этого, во-первых, используются графические изображения, которые часто дают самую исчерпывающую информацию. Во-вторых, вычисляется комплекс специальных показателей, позволяющих дать количественную оценку динамики анализируемого явления. При этом, если полученные показатели дают достаточно ясную и наглядную картину тенденций, то на этом этапе нередко и заканчивается весь анализ динамического ряда.
Абсолютный прирост или убыль характеризует изменение явления в единицу времени (за интервал времени). Получается путем вычитания из данных последующего периода данных предыдущего. Если ряд возрастает, то прирост положителен. Если убывает отрицателен (убыль). Этот показатель не может использоваться при сравнении динамики разнородных данных (вес в кг, рост в см). Кроме того, на его значение оказывает влияние и абсолютный размер анализируемой характеристики. Например: рост в см трехзначное число, окружность бедра в см двухзначное.
Темп роста или снижения показывает соотношение в процентах последующего уровня и предыдущего, поэтому может использоваться при сравнительном анализе динамики разнородных величин. Получается путем деления последующего уровня на предыдущий и умножения на 100. Если прирост положителен, то показатель больше 100%, если отрицателен меньше 100%.
Темп прироста показывает, на сколько процентов увеличился или уменьшился уровень явления. По существу отражает относительную скорость изменения явления от одного отрезка времени к другому. Вычисляется путем деления абсолютного прироста на предыдущий уровень, либо вычитанием из показателя темпа роста 100. Если прирост положителен показатель больше 0. Если отрицателен меньше.
Абсолютное значение 1% прироста характеризует значение 1% прироста изучаемого явления. Этот показатель может вычисляться делением абсолютного прироста на темп прироста или делением показателя предыдущего уровня на 100.
Этот показатель является одним из самых существенных, поскольку «размер» одного процента темпа роста и прироста в различных совокупностях может серьезно различаться.
Пример: число районов города «N» с высоким уровнем загрязнения атмосферного воздуха в 2001 году было 4, в 2002 стало 8. Темп роста 200%. В городе «NN» таких районов в 2001 году было 10, стало 15. Темп роста 50%. Однако, в первом случае число неблагополучных районов увеличилось на 4, а во втором на 5. Даже в одном динамическом ряду значение одного процента роста и темпа прироста может существенно различаться на разных отрезках времени.
Показатель наглядности характеризует динамику явления в процентах относительно исходного уровня. Он представляет собой отношение каждого уровня ряда к одному из них (чаще начальному), принятому за 100%.
В отличие от предыдущих показателей на всем протяжении временного ряда «стоимость» одного процента этого показателя остается неизменной. Однако, динамика изменения исходных данных от одного промежутка времени к другому становится менее выразительной.
В работе практикующего врача часто встречается необходимость проведения научного исследования. Планирование и оценка результата неотрывная часть любого исследовательского процесса.
Выделяют следующие этапы статистического исследования:
1-й этап определение целей и задач, составление плана и программы исследования;
2-й этап наблюдение, сводка и группировка полученных статистических материалов, вычисление первичных итогов;
3-й этап углубленная математико-статистическая обработка данных;
4-й этап анализ полученных результатов, выводы.
На предыдущих занятиях изучалось, как правильно описать и сравнить уже имеющиеся данные. Эта тема посвящена особенностям первых двух этапов научного исследования: постановке цели и задач, оценке необходимых размеров выборки, методикам сбора данных и т.д.
1-й этап
На 1-ом этапе статистического исследования определяют:
Цель исследования обуславливается конечным результатом, на достижение которого направлено это исследование, т.е. это то, ради чего оно проводится. Цель большинства статистических исследований в медицине раскрытие взаимосвязи и оценка влияния тех или иных факторов на здоровье человека.
Задачи исследования отражают частные вопросы, которые необходимо последовательно решить, чтобы достигнуть конечной цели исследования. При определении конкретных задач обязательно учитывается главный принцип любого статистического исследования достоверность исходной информации и объективность отражения изучаемого явления, что гарантирует обоснованность (валидность) выводов.
План исследования систематизирует решение организационных вопросов. В том числе: выбор места и сроков наблюдения, источников финансирования, субъекта исследования (организации и лиц, осуществляющих основные работы), подбор и обучение кадров, подготовку необходимых аппаратных и программных средств, регистрационных бланков и т.п. Для детальной проработки организационных и методических вопросов планом предусматривается проведение пробных (пилотажных) исследований.
Программа исследования включает программу сбора и программу разработки материалов исследования, обусловливает выбор объекта и единицы наблюдения, а также учетных признаков, подлежащих регистрации в ходе исследования. Как обсуждалось на предыдущих занятиях, учетные признаки по виду могут быть качественными, порядковыми или количественными, а по роли факторными или результативными.
Выбор единицы наблюдения и учетных признаков определяет весь ход и результаты статистического исследования.
2-й этап
В первую очередь на этом этапе проводится сбор данных.
В обобщенном виде программа сбора это перечень учетных признаков наблюдения, которые позволяют достаточно полно характеризовать каждую единицу наблюдения и факторы изучаемых явлений. анкета опроса, регистрационная карта наблюдения и т.п.
В целом, по способу наблюдения программой сбора могут предусматриваться следующие варианты получения исходных данных: непосредственное наблюдение (регистрация), выкопировка данных из отчетно-учетных документов, опрос.
Непосредственное наблюдение предполагает непосредственную регистрацию единиц наблюдения и их характеристик, либо измерение параметров с помощью технических средств (измерение жизненной емкости легких, форсированного выдоха, параметров кардиограмм и т.п.).
Выкопировка данных из отчетно-учетной документации предполагает использование в виде источника информации различных документов (история болезни, история развития ребенка, больничный лист). Этот способ получения информации требует предварительной экспертной оценки наличия документации в полном объеме, правильности заполнения и полноты записей в документах.
Опрос обеспечивает получение информации со слов опрашиваемого (респондента) методом интервью или заочным путем (почтовые, телефонные, прессовые опросы). Регистрация такой информации производится на специальные опросные листы или анкеты. Для качественного проведения опроса рекомендуется привлекать специалистов по разработке опросных листов.
Для получения оптимальных результатов посредством любой из существующих методик проведения опросов необходимо придерживаться следующих основных требований к содержанию опросного листа (анкеты):
Получить неискаженную информацию по анкете, содержащей более 4050 вопросов, на практике невозможно.
Одной из самых существенных среди них по негативным последствиям, с точки зрения результативности статистической обработки, является аналитическая вариабельность. Она возникает из-за расхождения между результатами измерений в одной пробе.
Внутрииндивидуальная вариабельность характеризует расхождение значений нескольких замеров какого-либо параметра у одного и того же человека. Например: масса тела у одного и того же здорового человека в течение суток изменяется.
Межиндивидуальная, или внутригрупповая, вариабельность характеризует расхождение значений замеров какого-либо параметра у разных людей, даже если они здоровы.
По времени наблюдение может быть текущим или единовременным.
Текущее (непрерывное) наблюдение предусматривает регистрацию данных по мере их возникновения за какой-либо длительный промежуток времени. Данные при этом виде наблюдения накапливаются во времени. Например: данные о заболеваемости по обращаемости, инфекционной заболеваемости, смертности, Единовременное (прерывное) наблюдение предусматривает регистрацию данных в один момент времени, или по состоянию на один момент времени, так называемый критический момент наблюдения. Таким образом, проводится сбор данных при переписях населения.
На определенный момент времени (на конец года) учитывается численность населения, численность медицинского персонала, количество учреждений медицинской помощи. Заболеваемость по данным профилактических осмотров (патологическая пораженность) также регистрируется на определенный момент времени. Особенность полученных таким путем данных их нельзя просто суммировать. Например: численность населения района в 2006 году составила 20000 человек, в 2007 году 18000 человек. За суммарный период 20072008 годов можно рассчитать только среднегодовую численность населения. Если единовременное наблюдение регулярно повторяется (ежегодный учет численности населения, предприятий и т.п.), то такое наблюдение называется периодическим.
По охвату статистической совокупности исследование может быть сплошное или не сплошное. К методам не сплошного наблюдения относятся монографический метод, метод основного массива и, собственно, выборочный метод.
Монографический метод применяется для подробного описания объекта, имеющего какие-либо яркие особенности. Например: медико-социальное обследование национальностей Крайнего Севера или социально-гигиеническое описание промышленного центра. Выводы, которые получаются путем таких обследований, относятся либо только к конкретному объекту исследования, либо могут быть распространены на весьма ограниченную группу аналогичных объектов.
Метод основного массива предусматривает обследование контингентов, которые могут быть сосредоточены на конкретном объекте. Например: изучение госпитализированной заболеваемости в стационаре. Данные о структуре заболеваний, тяжести течения и их прогнозе, полученные в этом исследовании, могут иметь значение только для решения частных вопросов. Судить о распространенности патологии за пределами такого стационара по этим данным нельзя.
Собственно выборочное исследование охватывает выборочную совокупность или просто выборку из генеральной совокупности. Такое исследование имеет ряд весьма существенных преимуществ перед сплошным наблюдением. Во-первых, оно дает значительную экономию средств и требует существенно меньше времени, чем сплошное. Во-вторых, при выборочном исследовании может быть достигнута большая глубина и детальность изучения вопроса. В-третьих, при меньшем числе наблюдений уменьшаются вероятности систематических ошибок наблюдения, возникающих, когда объектам приписывают искаженные данные.
Конечной целью изучения выборочной совокупности всегда является получение информации о генеральной совокупности. Для этого выборочное исследование должно удовлетворять определенным условиям. Одно из главных условий репрезентативность (представительность) выборки. Как обсуждалось ранее, выделяют качественную и количественную репрезентативность.
Случайность, гарантирующая качественную (структурную) репрезентативность статистических исследований, достигается выполнением ряда условий формирования выборочных групп (совокупностей):
1. Каждый член генеральной совокупности должен иметь равную вероятность попасть в выборку.
2. Отбор единиц наблюдения из генеральной совокупности необходимо проводить независимо от изучаемого признака. Если отбор проводится целенаправленно, то и при этом необходимо соблюдать условия независимости распределения изучаемого признака.
3. Отбор должен проводиться из однородных групп.
Соблюдение условий, гарантирующих максимальную близость выборочной и генеральной совокупностей, обеспечивается специальными способами отбора. В зависимости от способа формирования различают следующие выборки:
1. Выборки, не требующие разделения генеральной совокупности на части (собственно, случайная повторная или бесповторная выборка).
2. Выборки, требующие разбиения генеральной совокупности на части (механическая, типическая или типологическая выборки, когортная, парно-сопряженная выборки).
Собственно, случайная выборка формируется случайным отбором наудачу. В основе случайного отбора лежит перемешивание. Например: выбор шара в спортлото после перемешивания всех шаров, выбор выигрышных номеров лотереи, случайный выбор карточек больных для исследования и т.п. Иногда используют случайные числа, получаемые из таблиц случайных чисел или с помощью генераторов случайных чисел. Согласно этим числам из заранее пронумерованного массива генеральной совокупности выбираются единицы наблюдения с номерами, соответствующими выпавшим случайным числам.
При составлении случайной выборки после того, как объект выбран, и все необходимые данные о нем зарегистрированы, можно поступать двояко: объект можно вернуть, или не вернуть в генеральную совокупность. В соответствии с этим выборку называют повторной (объект возвращается в генеральную совокупность) или бесповторной (объект не возвращается в генеральную совокупность). Поскольку в большинстве статистических исследований разница между повторной и бесповторной выборками практически отсутствует, то априорно принимается условие, что выборка повторная.
Общий алгоритм оценки публикации:
Сначала проводится оценка издания. Предпочтение следует отдавать рецензируемым реферируемым журналам. Оценивается соответствие названия публикации интересующей проблеме. Следует обращать внимание на фамилию автора и название организации, которые выполняли исследование. Регулярно просматривая материалы, посвященные интересующему разделу медицины, в течение некоторого времени можно узнать ведущих специалистов и медицинские «фирмы», выпускающие надежную и качественную «продукцию». Затем, если прочтение реферата (или выводов в нереферируемом издании) вызывает интерес, то последующее ознакомление с методами и структурой исследования должно создать представление о необходимости углубленного изучения данной публикации или возможности прекращения дальнейшего прочтения из-за ее низкого методологического качества.
Ниже приводятся критерии, используемые при критической оценке данных исследований, посвященных диагностике, лечению, этиологии (причинам) и прогнозу заболевания.
Исследования методов диагностики
Исследования лечебных вмешательств
Исследования этиологии (причин заболевания)
Исследования прогноза