Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Оренбургская государственная медицинская академия Минздрава России С

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 25.11.2024

Государственное бюджетное образовательное учреждение высшего профессионального образования «Оренбургская государственная медицинская академия» Минздрава России

«Согласовано»

Утверждено ЦМК факультета

Проректор УВСР

«__»_________20__ г.

«__»_________20__ г.

Декан факультета

Утверждено Ученый Совет факультета

«__»_________20__ г.

«__»_________20__ г.

                                                                        

Рабочая ПРОГРАММА

По дисциплине

МЕДИЦИНСКАЯ СТАТИСТИКА

По направлению подготовки

060500 СЕСТРИНСКОЕ ДЕЛО

КВАЛИФИКАЦИЯ (СТЕПЕНЬ) ВЫПУСКНИКА «БАКАЛАВР»

Рассмотрена на заседании кафедры______________

«___»___________20__ г.

Зав.  кафедрой _____________   ФИО

Оренбург 2014г.

содержание

1

Объём дисциплины и виды учебной работы………………………...

2

Структура и содержание дисциплины……………………………….

3

Структура модулей……………………………………………………

4

Самостоятельная внеаудиторная работа……………………………..

5

Дополнительная самостоятельная внеаудиторная работа………….

6

Виды контроля…………………………………………………………

6.1

Темы рефератов……………………………………………………….

6.2

Тесты……………………………………………………………………

6.3

Ситуационные задачи…………………………………………………

6.4

Вопросы к зачёту…………………………………………………….

Лекция № 1…………………………………………………………….

Лекция № 2…………………………………………………………….

Практическое занятие № 1……………………………………………

Практическое занятие № 2……………………………………………

Лекция 1

Статистика и клиническая практика

Когда-то мне казалось, что медицинские журналы приходят к нам из идеального мира. В этом мире, недоступном простым смертным, авторы публикаций в совершенстве владеют статистическими методами, а строгие редакторы ни за что не пропустят работу со статистическими ошибками. Однако очень скоро я понял, как легко опубликовать ошибочную и просто бессмысленную статью, как невысок барьер на пути несостоятельной работы к читателю. Авторы и редакторы медицинских журналов живут в том же мире, что и мы и имеют о статистике примерно такое же представление, что и остальные его обитатели. В этом суровом мире существует, помимо прочего, такая неприятная вещь, как ограничение финансирования.

Рис. 1.1. Ежегоднье раоходы на здравоохранение (США 1960 - 1990 гг.).

А. Абсолютнье (в миллиардах долларов). Б. Относительные (в процентах от валового национального продукта).

ОГРАНИЧЕНИЕ ФИНАНСИРОВАНИЯ И СТАТИСТИКА

Медицина вступает в новую эру. Вплоть до середины XX века лечение мало влияло на сроки, да и сам факт выздоровления. Введение в клиническую практику инсулина, пенициллина, кортикостероидов, витамина В12 радикально изменило ситуацию. Победа над ранее неизлечимыми болезнями породила веру во всесилие науки и стимулировала дальнейшие исследования. Разрабатывались все новые противоопухолевые психотропные гипотензивные и антиаритмические средства. Безграничный оптимизм породил почти столь же безграничное финансирование. В США расходы на медицину в 1991 г составили 752 миллиарда долларов или 13,2% валового национального продукта. Расходы росли как абсолютно, так и в процентах от валового национального продукта (рис 1.1). В результате ограничение расходов на медицину сегодня превратилось в одну из первостепенных задач.

На протяжении всего этого периода, который похоже заканчивается, врачи и исследователи получали в свое распоряжение практически неограниченные и не обусловленные конкретными целями ресурсы. Помощь больному едва ли не выпала из числа показателей «хорошей медицины». Характерно, что даже для по настоящему действенных методов лечения отсутствуют достоверные оценки того, как часто и насколько эффективно они помогают. Сложившийся подход означал не просто выбрасывание денег на ветер. Больные регулярно принимали сильно действующие препараты или подвергались хирургическому вмешательству без серьезных оснований, но с риском серьезных осложнений.

Однако при чем тут статистика?

Когда поток не связанных с конкретными задачами средств умерит свои рост, медицинским работникам придется взглянуть на используемые ими средства с точки зрения их реальной отдачи. Потребуются строгие доказательства эффективности методов диагностики и лечения. Мало того, что придется уяснить эффективно ли лечение, — придется выяснить также какому проценту больных оно помогает, и в какой степени. Но эти данные без помощи статистики не получишь. Естественная биологическая изменчивость, психотерапевтический эффект, субъективность оценок — все эти факторы делают прямое суждение об эффективности лечения ненадежным. Перевести клинический опыт на язык количественных оценок — задача медицинской статистики.

Статистическому анализу может быть подвергнута не только эффективность нового метода лечения, но и эффективность работы самого врача. Так в одном исследовании*** было показано, что больные с пиелонефритом выписываются из стационара в среднем на 2 дня раньше, если их лечение проводилось в строгом соответствии с рекомендациями «Настольного справочника врача» («Phvsiciansdesk reference»). Расходы на пребывание в стационаре составляют значительную часть всех медицинских расходов, поэтому сокращение сроков госпитализации (разумеется, не в ущерб больному) позволило бы сэкономить значительные средства. Считается, что бесконечному многообразию случаев должно соответствовать бесконечное многообразие методов лечения. Данное исследование - сильный, хотя и не бесспорный, довод в пользу большей стандартизации.

Поиск новых методов диагностики и лечения выбор наилучшего из уже принятых - везде статистические соображения играют не последнюю роль. Чтобы принять полноправное участие в обсуждении этих вопросов, врач должен быть знаком с принципами и основными методами статистики.

До сих пор медики редко участвовали в обсуждении статистических вопросов, на первый взгляд далеких от врачебной практики и носящих сугубо технический характер. Однако по мере ужесточения требований к использованию ресурсов медикам следует научиться проверять обоснованность претензий на эффективность и с большим пониманием участвовать в распределении средств. И основой для этого служит статистика.

ДОСТОВЕРНОСТЬ И СТАТИСТИЧЕСКАЯ ЗНАЧИМОСТЬ

Рассмотрим типичный пример применения статистических методов в медицине. Создатели препарата предполагают, что он увеличивает диурез пропорционально принятой дозе. Для проверки этого предположения они назначают пяти добровольцам разные дозы препарата. По результатам наблюдений строят график зависимости диуреза от дозы (рис. 1.2А). Зависимость видна невооруженным глазом. Исследователи поздравляют друг друга с открытием, а мир — с новым диуретиком.

На самом деле данные позволяют достоверно утверждать лишь то, что зависимость диуреза от дозы наблюдалась у этих пяти добровольцев. То, что эта зависимость проявится у всех людей, которые будут принимать препарат, — не более чем предположение. Нельзя сказать, что оно беспочвенно - иначе, зачем ставить эксперименты?

Рис. 1.2. А. У 5 добровольцев измерили суточный диурез после приема разных доз препарата (предполагаемого диуретика). Зависимость диуреза от дозы казалась бы налицо, чем больше доза - тем больше диурез. Можно ли считать диуретический эффект препарата доказанным? Б. Такую картину мы увидели бы, если бы могли исследовать связь дозы и диуреза у всех людей: зависимости нет в помине. Пять человек, вошедших в первоначальное исследование, помечены черным. В данном случае мнимая зависимость порождена случайностью. С помощью статистических методов можно оценить вероятность подобной ошибки.

Но вот препарат поступил в продажу. Все больше людей принимают его в надежде увеличить свой диурез. И что же мы видим? Мы видим рис 1.2Б, который свидетельствует об отсутствии какой либо связи между дозой препарата и диурезом. Черными кружками отмечены данные первоначального исследования. Статистика располагает методами, позволяющими оценить вероятность получения столь «непредставительной», более того, сбивающей с толку выборки. Оказывается в отсутствие связи между диурезом и дозой препарата полученная «зависимость» наблюдалась бы примерно в 5 из 1000 экспериментов. Итак, в данном случае исследователям просто не повезло. Если бы они применили даже самые совершенные статистические методы, это все равно не спасло бы их от ошибки.

Этот вымышленный, но совсем не далекий от реальности пример, мы привели не для того, чтобы указать на бесполезность статистики. Он говорит о другом, о вероятностном характере ее выводов. В результате применения статистического метода мы получаем не истину в последней инстанции, а всего лишь оценку вероятности того или иного предположения. Кроме того, каждый статистический метод основан на собственной математической модели и результаты его правильны настолько насколько эта модель соответствует действительности.

ДОВЕРЯЙ, НО ПРОВЕРЯЙ

О новых методах диагностики и лечения врачи узнают главным образом из публикации в медицинских журналах. Познания читателей в статистике обычно скромны, поэтому выводы авторов им приходится принимать на веру. Это было бы не так страшно, если бы публикации предшествовала серьезная проверка результатов. К сожалению, проводится она далеко не всегда.

На рис. 1.3 суммированы результаты четырех исследовании использования статистических методов в статьях опубликованных в медицинских журналах с 1950 по 1976 г .

Рис. 1.3. Доля медицинских статей, содержащих статистические ошибки. Невозможно рассмотреть все статьи, публикуемые в медицинских журналах, поэтому долю определяли по некоторой случайной выборке. В результате появляется оценка истинной доли статей с ошибками, на рисунке эти оценки показаны кружками. Вертикальные отрезки — это доверительный интервал, то есть пределы в которых, скорее всего, находится истинная доля статей с ошибками.

Разумеется, исследования могли охватить лишь часть напечатанного, поэтому выявленная в исследованиях доля статей содержащих статистические ошибки служит лишь приближенной оценкой истинной доли. Вертикальные черточки на рис. 1.3 указывают диапазон называемый доверительным интервалом, в который с высокой вероятностью попадает истинная доля статей с ошибками. Вычисление доверительных интервалов — один из разделов статистики, с которым нам предстоит познакомиться. Как мы видим, статистические ошибки встречаются примерно в половине статей. Однако дальнейшие исследования показали, что журналам, в которых взяли за правило обращать внимание не только на медицинскую, но и статистическую сторону дела удалось существенно снизить долю ошибочных статей. Эта доля нимало не изменилась в тех журналах, которые так и не ввели статистического рецензирования.

Врачам известно множество методов диагностики и лечения, эффективность которых была «доказана» статистическими методами и которые, тем не менее, канули в Лету, не выдержав проверки практикой. А сколь часто приходится читать статьи, в которых статистические манипуляции с одними и теми же данными приводят к прямо противоположным выводам. Все это наводит читателя на мысль, что статистические методы либо ненадежны, либо слишком трудны для понимания, либо вообще не более чем инструмент недобросовестного исследователя. Между тем даже начального знакомства со статистикой в сочетании со здравым смыслом обычно достаточно чтобы понять, что предлагает нам автор в качестве «доказательств». По иронии судьбы ошибки редко связаны с тонкими статистическими вопросами. Как правило, это простейшие ошибки такие, как отсутствие контрольной группы использование неслучайных выборок или пренебрежение статистической проверкой гипотез. По неизвестным науке причинам такие ошибки неизменно смещают результаты исследования в пользу предлагаемого автором метода.

Вред, приносимый ошибками такого рода, очевиден. Исследователь заявляет о «статистически достоверном» эффекте лечения, редактор помещает статью в журнал, врач неспособный критически оценить публикацию, применяет неэффективный метод лечения. В конце этой цепи находится больной, который и расплачивается за все, подвергаясь ненужному риску и не получая действительно эффективного лечения. Не следует сбрасывать со счетов и ущерб от самого факта проведения бессмысленных исследований. Деньги и подопытные животные приносятся в жертву науке, больные рискуют ради сбора ошибочно интерпретируемых данных.

Сегодня грамотная проверка эффективности лечения становится первоочередной задачей. Исследования должны тщательно планироваться, а результаты правильно интерпретироваться.

ОШИБКИ ВЕЧНЫ?

Поскольку описанные ошибки совершаются в массовом порядке, ничто не побуждает исследователей корректно использовать статистические методы. Редко кому приходилось слышать критические замечания, на сей счет. Наоборот, исследователи часто опасаются, что их коллеги, а особенно рецензенты, сочтут грамотно и полно изложенную статистическую процедуру высокомерной теоретизацией.

Журналы призваны быть оплотом качества научных исследовании. В некоторых редакциях действительно осознали, что их рецензенты не слишком сведущи в использовании элементарной статистики, и изменили саму процедуру рецензирования. Теперь перед тем как направить рукопись на рецензию, ее тщательно проверяют на предмет правильности использования статистических методов. Результатом этого нередко становится пересмотр используемых в статье статистических методов, а иногда и самих выводов* .

Но большинство редакторов, похоже, убеждены, что каждый рецензент рассматривает статистическую сторону работы столь же тщательно, сколь и собственно медицинскую. Неясно, однако, как он может это сделать — ведь даже авторы ведущих медицинских журналов, упоминая статистическую проверку гипотез, редко затрудняют себя указанием, какой именно критерий был использован.

Коротко говоря, для грамотного чтения медицинской литературы необходимо научиться понимать и оценивать правильность применения статистических методов, используемых для анализа результатов. К счастью, основные идеи, которыми необходимо овладеть вдумчивому читателю (и, конечно, вдумчивому исследователю), довольно просты. В следующей главе мы приступим к их обсуждению.

Лекция 2

Как описать данные

В этой книге мы встретимся с двумя типами задач. Первый тип задач, — как сжато, описать данные. Этими задачами занимается так называемая описательная статистика. Задачи второго типа связаны с оценкой статистической значимости различий и вообще с проверкой гипотез. В этой главе мы рассмотрим задачи первого типа — как наилучшим образом описать данные.

Если значения интересующего нас признака у большинства объектов близки к их среднему и с равной вероятностью отклоняются от него в большую или меньшую сторону, лучшими характеристиками совокупности будут само среднее значение и стандартное отклонение. Напротив, когда значения признака распределены несимметрично относительно среднего, совокупность лучше описать с помощью медианы и процентилей.

Возможно, сказанное давно вам известно. Тогда смело переходите к следующей главе. Тех же, для кого термины вроде про- центиля звучат туманно, мы приглашаем приступить к изучению марсиан.

Поначалу займемся, каким-нибудь количественным признаком, например ростом. Чтобы попусту не фантазировать слетаем на Марс и измерим всех марсиан благо их всего две сотни. Результаты приведены на рис. 2.1 (мы округлили рост до целого числа сантиметров). Каждому марсианину соответствует кружок так, что, например два кружка над числом 30 означают, что имеются два марсианина ростом 30 см. Рис 2.1 это распределение марсиан по росту. Мы видим, что рост большинства марсиан — от 35 до 45 см. Коротышек (ниже 30 см) совсем немного

  1.  всего трое, и столько же великанов (выше 50 см).

Окрыленные успехом марсианского проекта мы решаем измерить венецианцев. Легко находим деньги на путешествие и, вооружившись линейками, измеряем всех 150 обитателей Венеры. Научный отчет об экспедиции будет звучать так: «Редко встретишь венерианца ниже 10 см или выше 20 см, а чаше попадаются 15-сантиметровые, см. рис. 2.2».

Но вот остались позади нелегкие межпланетные перелеты. Настала пора скрупулезного анализа данных. Сравним рис. 2.1 и 2.2. Мы видим, что венерианцы ниже марсиан и что интервал, в

Рис. 2.1. Распределение марсиан по росту. Каждому марсианину соответствует кружок. Обратите внимание, что марсиан среднего роста (около 40 см) больше всего и что высокорослых столько же, сколько коротышек — распределение симметрично.

Но вот остались позади нелегкие межпланетные перелеты. Настала пора скрупулезного анализа данных. Сравним рис. 2.1 и 2.2. Мы видим, что венерианцы ниже марсиан и что интервал, в который умещается рост всех марсиан шире, чем соответствующий интервал для венерианцев. Ширина интервала, в который попадают почти все марсиане (194 из 200) — 20 см (от 30 до 50 см). Рост большинства венерианцев (144 из 150) умещается в интервал от 10 до 20 см, то есть имеет ширину всего лишь

  1.  см. Несмотря на эти различия между двумя совокупностями инопланетян имеется и существенное сходство. В обоих рост любого члена скорее близок к середине распределения, нежели заметно от нее удален и одинаково вероятно может быть как выше, так и ниже середины. Распределения на рис. 2.1 и 2.2 имеют схожую форму и приближенно определяются одной и той же формулой.

Раз существует множество похожих распределений, значит, для характеристики одного из них достаточно указать чем оно отличается от других ему подобных, то есть всю собранную информацию мы можем свести к нескольким числам, которые называются параметрами распределения. Это среднее значение и стандартное отклонение.

Рис. 2.2. Распределение венерианцев по росту. Венерианцы ниже марсиан, разброс значений меньше. Однако по форме распределения, напоминающей колокол, венерианцы и марсиане схожи друг с другом.

Расположив мысленно распределения марсиан и венерианцев на одной шкале роста, мы увидим, что распределение венери- анцев находится ниже, чем распределение марсиан. Характеристика положения распределения на числовой оси называется средним. Среднее по совокупности обозначают греческой буквой ц (читается "мю") и вычисляют по формуле:

Сумма значений признака для всех членов совокупности                                                                                                                                                                     LIVV/V 1J1V11VU WUV/IV V 1111W A J

Среднее по совокупности =----------------------------------------------------------------------------------------------

Число членов совокупности

Эквивалентное математическое выражение имеет вид

где X — значение признака, N — число членов совокупности. Как всегда, большая греческая буква X (читается «сигма») обозначает сумму. Подставив в формулу добытые нами данные, получим ценное дополнение к научному отчету: средний рост марсиан 40 см, а венерианцев — 15 см.

СТАНДАРТНОЕ ОТКЛОНЕНИЕ

Еще на Венере мы заметили, что тамошние жители более однородны по росту, нежели марсиане. Хотелось бы и это впечатление оформить количественно, то есть иметь показатель разброса значений относительно среднего. Ясно, что для характеристики разброса все равно, в какую сторону отклоняется значение

  1.  в большую или меньшую. Иными словами, отрицательные и положительные отклонения должны вносить равный вклад в характеристику разброса. Воспользуемся тем, что квадраты двух равных по абсолютной величине чисел равны между собой, и вычислим средний квадрат отклонения от среднего. Этот показатель носит название дисперсии и обозначается а2. Чем больше разброс значений, тем больше дисперсия. Дисперсию вычисляют по формуле:

Стандартное отклонение измеряется в тех же единицах, что исходные данные. Например, стандартное отклонение роста марсиан составляет 5 см, а венерианцев — 2,5 см.

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Таблица 2.1 сжато представляет то, что мы узнали о марсианах и венерианцах. Таблица очень информативна, из нее можно узнать об объеме совокупности, о среднем росте и о том, насколько велик разброс относительно среднего.

Вновь обратившись к рис. 2.1 и 2.2, мы обнаружим, что на обеих планетах рост примерно 68% обитателей отличается от среднего не более чем на одно стандартное отклонение и примерно 95%на два стандартных отклонения. Подобные распределения встречаются очень часто. Можно сказать, что это происходит всегда, когда некая величина отклоняется от средней под действием множества слабых, независимых друг от друга факто-

Таблица 2.1. Параметры распределения марсиан и венерианцев по росту

Стандартное

совокупности Среднее, см отклонение, см

ров. Распределение такого рода называется нормальным (или гауссовым) и описывается формулой:

Заметим, что нормальное распределение полностью определяется средней y и стандартным отклонением а. Поэтому сведения в табл. 2.1 — это не просто удачное представление данных.

МЕДИАНА И ПРОЦЕНТИЛИ

И снова в путь! Обогатившись теоретическими познаниями, мы отправляемся на Юпитер. Здесь мы не только измеряем всех до одного юпитериан, но также подсчитываем среднее и стандартное отклонение роста для всей их совокупности. Оказывается средний рост юпитериан — 37,6 см, а его стандартное отклонение — 4,5 см. Можно заключить, что юпитериане очень похожи на марсиан, ведь близки оба параметра определяющие нормальное распределение — среднее и стандартное отклонение.

Однако если взглянуть на исходные данные по юпитерианам (рис. 2.ЗА), то обнаружится совершенно иная картина. На самом деле типичный юпитерианин довольно приземист — около 35 см, то есть на добрых 5 см ниже марсианина. И только небольшая группа долговязых смещает значения стандартного отклонения и среднего вводя ученых в заблуждение.

Итак, рост произвольно выбранного юпитерианина вовсе не равновероятно может оказаться выше или ниже среднего, то есть распределение юпитериан по росту асимметрично. В такой ситуации полагаться на среднее и стандартное отклонение нельзя. На рис. 2.ЗБ изображено нормальное распределение для совокупности с теми же самыми значениями среднего и стандартного отклонения, что и на рис. 2.ЗА. Оно ничуть не похоже на распределение юпитериан. Таким образом, доверившись среднему и стандартному отклонению, мы получим превратное представ ление о совокупности, не подчиняющейся нормальному распределению.

Для описания таких данных лучше подходит не среднее, а медиана. Медиана — это значение, которое делит распределение пополам половина значений больше медианы половина — меньше (точнее не больше). Из рис. 2.4А видно, что ровно половина юпитериан выше 36 см. Стало быть 36 см — это медиана роста юпитериан.

Для характеристики разброса роста юпитериан найдем значения, не выше которых оказались 25 и 75% результатов измерения.

Рис. 2.4. Для описания асимметричного распределения следует использовать медиану и процентили. Медиана — это значение, которое делит распределение пополам. А. Медиана роста юпитериан — 36 см. Б. 25-й и 75-й процентили отсекают четверть самых низких и четверть самых высоких юпитериан 25-й процентиль ближе к медиане, чем 75-й — это говорит об асимметричности распределения.

Эти величины называются 25-м и 75-м процентилями. Если медиана делит распределение пополам, то 25-й и 75-й процентили отсекают от него по четвертушке. (Саму медиану, кстати, можно считать 50-м процентилем). Для юпитериан, как видно из рис. 2.4Б, 25-й и 75-й процентили равны соответственно 34 см и 40 см. Конечно, медиана и процентили, в отличие от среднего и стандартного отклонения, не дают полного описания распределения. Однако между 25 м и 75-м процентилями находится половина значений, - значит, мы можем судить, каков ростом средний юпитерианин. По положению медианы относительно 25-го и 75-го процентилей можно судить о том, насколько асимметрично распределение. И наконец, теперь мы примерно знаем, кто на Юпитере считается высоким (выше 75-го проценти- ля), а кто ростом не вышел (ниже 25-го процентиля).

Для описания распределения чаще всего применяют 25-й и 75-й процентили. Однако можно рассчитывать любые другие процентили. Например, в качестве границ нормы лабораторных показателей часто используют 5-й и 95-й процентили.

Вычисление процентилей — хороший способ разобраться в том, насколько распределение близко к нормальному. Напомним, что для нормального распределения 95% значений заключено в пределах двух стандартных отклонений от среднего и 68% — в пределах одного стандартного отклонения, медиана совпадает со средним. Соответствие между процентилями и числом стандартных отклонений от среднего таково (см. также рис. 2.5):

Процентили

Отклонения от среднего

2,5

ц - 2с

16

ц - с

50

Ц

84

ц + с

97,5

ц + 2с

Если соответствие между процентилями и отклонениями от среднего не слишком отличается от приведенного, то распределение близко к нормальному и его можно описать при помощи среднего и стандартного отклонения.

Есть еще одна, и очень важная, причина, по которой нужно знать, близко ли распределение к нормальному. Дело в том, что многие методы проверки гипотез, в частности рассматриваемые в гл. 2, 4 и 9, основаны на предположении что распределение близко к нормальному. Только в этом случае эти методы будут надежны. (Методы, не требующие нормальности распределения, изложены в гл. 10)

ВЫБОРОЧНЫЕ ОЦЕНКИ

До сих пор нам удавалось получить данные обо всех объектах совокупности, поэтому мы могли точно рассчитать значения среднего, дисперсии и стандартного отклонения. На самом деле обследовать все объекты совокупности удается редко: обычно довольствуются изучением выборки, полагая, что эта выборка отражает свойства совокупности. Выборку, отражающую свойства совокупности, называют представительной. Имея дело с выборкой, мы, конечно, не узнаем точных значений среднего и стан дартного отклонения, но можем оценить их. Опенка среднего, вычисленная по выборке называется выборочным средним. Выборочное среднее обозначают X и вычисляют по формуле:

где n - объем выборки.

Оценка стандартного отклонения называется выборочным стандартным отклонением (5) и определяется следующим образом:

Эта формула отличается от формулы для стандартного отклонения по совокупности. Во-первых, среднее ц заменяется

его выборочной оценкой — X. Во-вторых, в знаменателе из числа членов выборки вычитается единица. Строгое обоснование последнего требует основательной математической подготовки, поэтому ограничимся следующим объяснением. Разброс значений в пределах выборки никогда не бывает столь большим, как во всей совокупности, и деление не на n, а на n - 1 компенсирует возникающее занижение оценки стандартного отклонения.

Подытожим. Если известно, что выборка скорее всего принадлежит к совокупности с нормальным распределением, лучше всего использовать выборочное среднее и выборочное стандартное отклонение. Если есть основания полагать, что распределение в совокупности отличается от нормального, следует использовать медиану, 25-й и 75-й процентили.

НАСКОЛЬКО ТОЧНЫ ВЫБОРОЧНЫЕ ОЦЕНКИ

Выборочное среднее и выборочное стандартное отклонение есть оценки среднего и стандартного отклонения для совокупности, вычисленные по случайной выборке. Понятно, что разные выборки дадут разные оценки. Для характеристики точности выборочных оценок используют стандартную ошибку. Стандартную ошибку можно подсчитать для любого показателя, но сейчас мы остановимся на стандартной ошибке среднего, — она позволяет оценить точность, с которой выборочное среднее характеризует значение среднего по всей совокупности.

Рис. 2.6. Три случайные выборки из одной совокупности дают три разных оценки среднего и стандартного отклонения.

На рис. 2.6А представлено уже знакомое нам распределение марсиан по росту. Мы уже знаем рост каждого марсианина. Посмотрим, что получится, если оценивать средний рост по выборке объемом, скажем, 10 марсиан.

Из 200 обитателей Марса наугад выберем 10 и пометим их черными кружками (рис. 2.6А). На рис. 2.6Б эта выборка изображена в виде, принятом в журнальных публикациях. Точка и два

отрезка по бокам от нее изображают выборочное среднее (X = 41,5 см) и выборочное стандартное отклонение (5 = 3,8 см). Эти значения близки, но не равны среднему по совокупности (|1 = 40 см) и стандартному отклонению (а = 5 см).

Рис. 2.7. Такое распределение мы получим, выбрав 25 раз по 10 марсиан из совокупности представленной на рис 2 6 А, и рассчитав среднее для каждой выборки (средние для трех выборок с рис. 2.6 показаны заполненными кружками). Если построить распределение средних для всех возможных выборок, оно окажется нормальным. Среднее этого распределения будет равно среднему той совокупности, из которой извлекаются выборки. Стандартное отклонение этого распределения называется стандартной ошибкой среднего.

Извлечем еще одну случайную выборку того же объема. Результат показан на рис. 2.6В. На рис. 2.6А попавшие в эту выборку марсиане изображены заштрихованными кружками. Выборочное среднее (36 см) по-прежнему близко к среднему по совокупности, хотя и отличается от него; что касается выборочного стандартного отклонения (5 см), то на этот раз оно совпало со стандартным отклонением по совокупности.

На рис. 2.6Г представлена третья выборка. Попавшие в нее марсиане на рис. 2.6А изображены кружками с точками. Среднее и стандартное отклонение для этой выборки составляют соответственно 40 и 5 см.

Теперь пора поставить добычу случайных выборок на промышленную основу. Рассмотрим совокупность средних для каждой из возможных выборок по 10 марсиан. Общее число таких выборок превышает 1016. Три из них мы уже обследовали. Средние по этим выборкам представлены на рис. 2.7 в виде заполненных кружков. Пустые кружки — это средние еще для 22 выборок. Итак, теперь каждому выборочному среднему соответствует кружок, точно так же, как до сих пор кружки соответствовали отдельному объекту.

Посмотрим на рис. 2.7. Набор из 25 выборочных средних имеет колоколообразное распределение похожее на нормальное. Это не случайно. Можно доказать, что если переменная представляет собой сумму большого числа независимых переменных, то ее распределение стремится к нормальному, какими бы ни были распределения переменных, образующих сумму. Так как выборочное среднее определяется именно такой суммой, его распределение стремится к нормальному, причем чем больше объем выборок, тем точнее приближение. (Если выборки принадлежат совокупности с нормальным распределением, распределение выборочных средних будет нормальным независимо от объема выборок).

Поскольку распределение на рис. 2.7 нормальное, его можно описать с помощью среднего и стандартного отклонения.

Так как среднее значение для рассматриваемых 25 точек есть среднее величин, которые сами являются средними значениями, обозначим его . Аналогично, стандартное отклонение обозначим Sx . По формулам для среднего и стандартного отклонения находим Хх = 40 см и Sx = 1,6см.

Среднее выборочных средних Хх оказалось равно среднему ц всей совокупности из 200 марсиан. Ничего неожиданного в этом нет. Действительно, если бы мы провели исследования всех возможных выборок, то каждый из 200 марсиан был бы выбран равное число раз. Итак, среднее выборочных средних совпадет со средним по совокупности.

Интересно, равно ли Sx стандартному отклонению, а совокупности из 200 марсиан? Стандартное отклонение для совокупности выборочных средних Sx равно 1,6 см, а стандартное отклонение самой совокупности — 5 см. Почему Sx меньше, чем а? В общих чертах это можно понять, если учесть, что в случайную выборку редко будут попадать одни только коротышки и одни гиганты. Чаше их будет примерно поровну, и отклонения роста от среднего будут сглаживаться. Даже в выборке, куда попадут 10 самых высоких марсиан, средний рост составит только 50 см, тогда как рост самого высокого марсианина

  1.  53 см.

Подобно тому, как стандартное отклонение исходной выбор ки из 10 марсиан s служит оценкой изменчивости роста марсиан, Sx является оценкой изменчивости значений средних для выборок по 10 марсиан в каждой. Таким образом, величина Sx служит мерой точности, с которой выборочное среднее X является оценкой среднего по совокупности ц. Поэтому Sx носит название стандартной ошибки среднего.

Чем больше выборка, тем точнее оценка среднего и тем меньше его стандартная ошибка. Чем больше изменчивость исходной совокупности, тем больше изменчивость выборочных средних, поэтому стандартная ошибка среднего возрастает с увеличением стандартного отклонения совокупности.

Истинная стандартная ошибка среднего по выборкам объемом n, извлеченным из совокупности, имеющей стандартное отклонение а, равна*:

Собственно стандартная ошибка — это наилучшая оценка величины ах по одной выборке:

где s — выборочное стандартное отклонение.

Так как возможные значения выборочного среднего стремятся к нормальному распределению, истинное среднее по совокупности примерно в 95% случаев лежит в пределах 2 стандартных ошибок выборочного среднего.

Как уже говорилось, распределение выборочных средних приближенно всегда следует нормальному распределению независимо от распределения совокупности, из которой извлечены выборки. В этом и состоит суть утверждения, называемого центральной предельной теоремой. Эта теорема гласит следующее.

  1.  Выборочные средние имеют приближенно нормальное распределение независимо от распределения исходной совокупности, из которой были извлечены выборки.
  2.  Среднее значение всех возможных выборочных средних равно среднему исходной совокупности.
  3.  Стандартное отклонение всех возможных средних по выборкам данного объема, называемое стандартной ошибкой среднего, зависит как от стандартного отклонения совокупности, так и от объема выборки.

На рис. 2.8 показано, как связаны между собой выборочное среднее, выборочное стандартное отклонение и стандартная ошибка среднего и как они изменяются в зависимости от объема выборки. По мере того как мы увеличиваем объем выборки, выборочное среднее X и стандартное отклонение s дают все более точные оценки среднего ц и стандартного отклонения а по совокупности. Увеличение точности оценки среднего отражается в уменьшении стандартной ошибки среднего ах. Набрав достаточное количество марсиан, можно сделать стандартную ошибку среднего сколь угодно малой. В отличие от стандартного отклонения стандартная ошибка среднего ничего не говорит о разбросе данных, — она лишь показывает точность выборочной оценки среднего.

Хотя разница между стандартным отклонением и стандартной ошибкой среднего совершенно очевидна, их часто путают. Большинство исследователей приводят в публикациях значение стандартной ошибки среднего, которая заведомо меньше стандартного отклонения. Авторам кажется, что в таком виде их данные внушают больше доверия. Может быть, так оно и есть, однако беда в том, что стандартная ошибка среднего измеряет именно точность оценки среднего, но никак не разброс данных, который и интересен читателю. Мораль состоит в том, что, описывая совокупность, всегда нужно приводить значение стандартного отклонения.

Объем выборки, п

Рис. 2.8. С увеличением объема выборки возрастает точность оценки параметров распределения. Выборочное среднее X стремится к среднему в совокупности ц выборочное стандартное отклонение s стремится к стандартному отклонению в совокупности а, а стандартная ошибка среднего стремится к нулю.

Рассмотрим пример, позволяющий почувствовать различие между стандартным отклонением и стандартной ошибкой среднего, а также уяснить, почему не следует пренебрегать стандартным отклонением. Положим, исследователь, обследовав выборку из 20 человек, пишет в статье, что средний сердечный выброс составлял 5,0 л/мин со стандартным отклонением 1 л/мин. Мы знаем, что 95% нормально распределенной совокупности попадает в интервал среднее плюс-минус два стандартных отклоне ния. Тем самым, из статьи видно, что почти у всех обследованных сердечный индекс составил от 3 до 7 л/мин. Такие сведения весьма полезны, их легко использовать во врачебной практике.

Увы, приведенный пример далек от реальности. Скорее автор укажет не стандартное отклонение, а стандартную ошибку среднего. Тогда из статьи вы узнаете, что «сердечный выброс составил 5,0 ± 0,22 л/мин». И если бы мы спутали стандартную ошибку среднего со стандартным отклонением, то пребывали бы в уверенности, что 95% совокупности заключено в интервал от 4,56 до 5,44 л/мин. На самом деле в этом интервале (с вероятностью 95%) находится среднее значение сердечного выброса. (В гл. 7 мы поговорим о доверительных интервалах более подробно). Впрочем, стандартное отклонение можно рассчитать самому — для этого нужно умножить стандартную ошибку среднего на квадратный корень из объема выборки (численности группы). Правда, для этого нужно знать, что же именно приводит автор — стандартное отклонение или стандартную ошибку среднего.

ВЫВОДЫ

Когда совокупность подчиняется нормальному распределению, она исчерпывающе описывается параметрами распределения — средним и стандартным отклонением. Когда же распределение сильно отличается от нормального, более информативны медиана и процентили.

Так как наблюдать всю совокупность удается редко, мы оцениваем параметры распределения по выборке, случайным образом извлеченной из совокупности. Стандартная ошибка среднего служит мерой точности, с которой выборочное среднее является оценкой среднего по совокупности.

Эти величины полезны не только для описания совокупности или выборки. Их можно также использовать для проверки статистических гипотез, в частности о различиях между группами.

Этому и будет посвящена следующая глава.

ЗАДАЧИ

  1.  Найдите среднее, стандартное отклонение, медиану, 25й и 75-й процентили для следующей выборки 0; 0; 0; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 3; 4; 4; 5; 5; 5; 5; 6; 7; 9; 10; 11. Можно ли считать, что выборка извлечена из совокупности с нормальным распределением? Обоснуйте свой ответ. (Приведенные числа — клинические оценки тяжести серповидноклеточной анемии. Подробный анализ этого исследования см. в задаче 8.9. Данные заимствованы из работы: R. Hebbel et al. Erythrocyte adherence to endothelium in sickle-cell anemia: a possible determinant of disease seventy. N. Engl. J. Med., 302, 992-995, 1980).
  2.  Найдите среднее, стандартное отклонение, медиану, 25й и 75-й процентили для следующих данных 289, 203, 359, 243, 232, 210, 251, 246, 224, 239, 220, 211. Можно ли считать, что выборка извлечена из совокупности с нормальным распределением? Обоснуйте свой ответ. (Эти числа — продолжительность (в секундах) физической нагрузки до развития приступа стенокардии у 12 человек с ишемической болезнью сердца. Данные заимствованы из работы: W. Aronow. Effect of nonnicotine ciga- retts and carbon monoxide on angina. Circulation, 61:262-265, 1979. Более подробно эта работа описана в задаче 9.5.)
  3.  Найдите среднее, стандартное отклонение, медиану, 25й и 75-й процентили для следующих данных 1,2; 1,4; 1,6; 1,7; 1,7; 1,8; 2,2; 2,3; 2,4; 6,4; 19,0; 23,6. Можно ли считать, что это
  4.  выборка из совокупности с нормальным распределением? Обоснуйте свой ответ. (Приведены результаты оценки проницаемости сосудов сетчатки из работы: G. A. Fishman et al. Blood- retinal barrier function in patients with cone or cone-rod dystrophy. Arch . Ophthalmol., 104:545-548, 1986.)
  5.  Опишите распределение числа очков, выпадающих при бросании игральной кости. Найдите среднее число очков.
  6.  Бросьте одновременно две игральные кости, посмотрите, сколько очков выпало на каждой из них, и рассчитайте среднее. Повторите опыт 20 раз и постройте распределение средних, найденных после каждого броска. Что это за распределение? Вычислите его среднее и стандартное отклонение. Что они характеризуют?
  7.  Р. Флетчер и С. Флетчер (R. Fletcher, S. Fletcher. Clinical research in general medical journals: a 30-year perspective. N. Engl. J. Med., 301:180-183, 1979) изучили библиографические характеристики 612 случайно выбранных статей, опубликованных в журналах Journal of American Medical Association, New England Journal of Medicine и Lancet с 1946 г. Одним из показателей было число авторов статьи. Было установлено следующее:

Год

Число обследованных статей

Среднее число авторов

Стандартное  отклонение

1946

151

2

1,4

1956

149

2,3

1,6

1966

157

2,8

1,2

1976

155

4,9

7,3

Нарисуйте график среднего числа авторов по годам. Может ли распределение статей по числу авторов быть нормальным? Почему?

Лекция 3

Сравнение нескольких групп: дисперсионный анализ

Статистические методы используют для описания данных и для оценки статистической значимости результатов опыта. В предыдущей главе мы занимались описанием данных. Мы ввели понятия среднего, стандартного отклонения, медианы и процентилей. Мы узнали, как оценивать эти показатели по выборке. Мы разобрались, как определить, насколько точна выборочная оценка среднего. Перейдем теперь к методам оценки статистической значимости различий (их называют критериями значимости, или просто критериями*). Методов этих существует множество, но все они построены по одному принципу. Сначала мы формулируем нулевую гипотезу, то есть, предполагаем, что исследуемые факторы не оказывают никакого влияния на исследуемую величину и полученные различия случайны. Затем мы определяем, какова вероятность получить наблюдаемые (или более сильные) различия при условии справедливости нулевой гипотезы. Если эта вероятность мала*, то мы отвергаем нулевую гипотезу и заключаем что результаты эксперимента статистически значимы. Это, разумеется, еще не означает что мы доказали действие именно изучаемых факторов (это вопрос прежде всего планирования эксперимента), но, во всяком случае, маловероятно, что результат обусловлен случайностью.

Дисперсионный анализ был разработан в 20-х годах нашего столетия английским математиком и генетиком Рональдом Фишером. На дисперсионном анализе основан широкий класс критериев значимости, со многими из которых мы познакомимся в этой книге. Сейчас мы постараемся понять общий принцип этого метода.

СЛУЧАЙНЫЕ ВЫБОРКИ ИЗ НОРМАЛЬНО РАСПРЕДЕЛЕННОЙ СОВОКУПНОСТИ

Однажды в небольшом городке (200 жителей) ученые исследовали влияние диеты на сердечный выброс. Случайным образом отобрали 28 человек, каждый из которых согласился участвовать в исследовании. После этого они опять таки случайным образом были разделены на 4 группы по 7 человеке каждой. Члены первой (контрольной) группы продолжали питаться как обычно, члены второй группы стали есть только макароны, третьей группы

  1.  мясо, четвертой — фрукты. Через месяц у всех участников эксперимента измерили сердечный выброс. Результаты представлены на рис. 3.2.

Анализ данных мы начинаем с формулировки нулевой гипотезы. В данном случае она заключается в том, что ни одна из диет не влияет на сердечный выброс. Откроем маленький секрет, — дело обстоит именно так. На рис. 3.1 показано распределение сердечного выброса для всех жителей городка, каждый житель представлен кружком. Члены наших экспериментальных групп изображены заштрихованными кружками. Все четыре группы представляют собой просто случайные выборки из нормально распределенной совокупности.

Рис. 3.1. Распределение жителей городка по величине сердечного выброса. Диета не влияет на сердечный выброс, и экспериментальные группы представляют собой просто четыре случайные выборки из нормально распределенной совокупности.

Однако как убедиться в этом, располагая только результатами эксперимента (рис. 3.2)? Как видно из рисунка 3.2, группы все же различаются по средней величине сердечного выброса. Вопрос можно поставить так: какова вероятность получить такие различия, извлекая случайные выборки из нормально распределенной совокупности? Прежде чем ответить на этот вопрос нам надо получить показатель, характеризующий величину различий.

Оставим на время наш эксперимент и зададимся вопросом, что заставляет нас, взглянув на несколько выборок думать, что различия между ними не случайны.

Попробуем (исключительно в учебных целях) так изменить наши данные, чтобы читатель поверил во влияние диеты на сердечный выброс. Результат этой подтасовки представлен на рис.

  1.  Взаимное расположение точек в группах осталось прежним, но сами группы значительно раздвинуты по горизонтальной оси. Сравнив рис. 3.2 и 3.3 всякий скажет, что четыре вы борки на рис. 3.2 «не различаются», а выборки на рис. 3.3. — «различаются».

Рис. 3.2. Исследователь не может наблюдать совокупность, все, чем он располагает - это его экспериментальные группы. На этом рисунке данные с рис. 3.1 представлены такими, какими их видит исследователь. Результаты в разных группах несколько различаются. Вызваны эти различия диетой или просто случайностью? Внизу рисунка показаны средние значения сердечного выброса в четырех группах (выборочные средние) а также среднее и стандартное отклонение этих четырех средних.

Почему? Сравним разброс значений внутри выборок с разбросом выборочных средних. Разброс выборочных средних на рис. 3.2. значительно меньше разброса значений в каждой из выборок. На рис. 3.3 картина обратная — разброс выборочных средних превышает разброс в каждой из выборок. То же самое можно сказать и о данных на рис. 3.4, хотя здесь три выборочных средних близки друг другу и заметно отличается от них только одна.

Рис. 3.3. Те же группы что на предыдущих рисунках; теперь они раздвинуты по горизонтальной оси. Вряд ли такие различия можно отнести на счет случайности — влияние диеты налицо! Обратите внимание, что разброс выборочных средних превышает разброс внутри групп. На предыдущем рисунке картина была иной, — разброс выборочных средних был меньше разброса внутри групп.

Итак, чтобы оценить величину различий, нужно каким-то образом сравнить разброс выборочных средних с разбросом значений внутри групп. Сейчас мы покажем, как это можно сделать с помощью дисперсии (как мы выяснили в предыдущей главе, этот показатель характеризует именно разброс), но прежде сделаем несколько замечаний.

Дисперсия правильно характеризует разброс только в том случае, если совокупность имеет нормальное распределение (вспомните обследование юпитериан, чуть было не приведшее к ошибочным заключениям). Поэтому и критерий, основанный на дисперсии, применим только для нормально распределенных совокупностей.

Рис. 3.4. Еще один возможный исход эксперимента с диетой. В трех группах средние примерно равны и только в группе макаронной диеты сердечный выброс явно повысился. Такой результат, как и предыдущий никто не отнесет на счет случайности. И снова разброс выборочных средних превышает разброс внутри групп.

Вообще, все критерии, основанные на оценке параметров распределения (они называются параметрическими), применимы только в случае, если данные подчиняются соответствующему распределению (чаще всего речь идет о нормальном распределении). Если распределение отличается от нормального, следует пользоваться так называемыми непараметрическими критериями. Эти критерии не основаны на оценке параметров распределения и вообще не требуют, чтобы данные подчинялись какому-то определенному типу распределения. Более подробно мы рассмотрим непараметрические критерии в гл. 5, 8 и 10. Непараметрические критерии дают более грубые оценки, чем параметрические. Параметрические методы более точны, но лишь в случае, если правильно определено распределение совокупности.

Рис. 3.5. Еще один набор из четырех случайных выборок по семь человек в каждой, извлеченых из совокупности в 200 человек (население городка, где изучали влияние диеты на сердечный выброс).

ДВЕ ОЦЕНКИ ДИСПЕРСИИ

Мы уже выяснили, что чем больше разброс средних и чем меньше разброс значений внутри групп, тем меньше вероятность того, что наши группы — это случайные выборки из одной совокупности. Осталось только оформить это суждение количественно.

Дисперсию совокупности можно оценить двумя способами. Во-первых, дисперсия, вычисленная для каждой группы, — это оценка дисперсии совокупности. Поэтому дисперсию совокупности можно оценить на основании групповых дисперсий. Такая оценка не будет зависеть от различий групповых средних. Например, для данных на рис. 3.2 и 3.3 она будет одинаковой. Во-вторых, разброс выборочных средних тоже позволяет оценить дисперсию совокупности. Понятно, что такая оценка дисперсии зависит от различий выборочных средних.

Если экспериментальные группы — это четыре случайные выборки из одной и той же нормально распределенной совокупности (применительно к нашему эксперименту это значило бы, что диета не влияет на сердечный выброс), то обе оценки дисперсии совокупности дали бы примерно одинаковые результаты. Поэтому, если эти оценки оказываются близки, то мы не можем отвергнуть нулевую гипотезу. В противном случае мы отвергаем нулевую гипотезу, то есть, заключаем маловероятно, что мы получили бы такие различия между группами, если бы они были просто четырьмя случайными выборками из одной нормально распределенной совокупности.

Перейдем к вычислениям. Как оценить дисперсию совокупности по четырем выборочным дисперсиям? Если верна гипотеза о том, что диета не влияет на величину сердечного выброса, то любая из них дает одинаково хорошую оценку. Поэтому в качестве оценки дисперсии совокупности возьмем среднее выборочных дисперсий. Эта оценка называется внутригрупповой дисперсией; обозначим ее 5в2ну.

где 5к2он, sL, sL, 5фру — выборочные оценки дисперсии в группах, питавшихся как обычно (контроль), макаронами, мясом и фруктами. Дисперсия внутри каждой группы вычисляется относительно среднего для группы. Поэтому внутригрупповая дисперсия не зависит от того, насколько различаются эти средние.

Оценим теперь дисперсию совокупности по выборочным средним. Так как мы предположили, что все четыре выборки извлечены из одной совокупности, стандартное отклонение четырех выборочных средних служит оценкой ошибки среднего. На помним, что стандартная ошибка среднего связана со стандартным отклонением совокупности о и объемом выборки n следующим соотношением:

Тем самым, дисперсию совокупности о2 можно рассчитать следующим образом:

2 2 а _ пах£.

Воспользуемся этим, чтобы оценить дисперсию совокупности по разбросу значений выборочных средних. Эта оценка называется межгрупповой дисперсией, обозначим ее

де sX — оценка стандартного отклонения выборки из четырех средних.

Если верна нулевая гипотеза, то как внутригрупповая, так и межгрупповая дисперсии служат оценками одной и той же дисперсии и должны быть приближенно равны. Исходя из этого, вычислим критерий F: Дисперсия совокупности, оцененная по выборочным средним Дисперсия совокупности, оцененная по выборочным дисперсиям или

И числитель, и знаменатель этого отношения — это оценки одной и той же величины — дисперсии совокупности о2, поэтому значение F должно были близко к 1. Для четырех групп, представленных на рис. 3.2, значение F действительно близко к единице. Теперь наши исследователи влияния диеты на сердечный выброс могут сделать определенные выводы. Полученные в эксперименте данные не противоречат нулевой гипотезе, следовательно, нет оснований, считать, что диета влияет на сердечный выброс. Что касается данных, которые мы специально сконструировали, чтобы убедить читателя в таком «влиянии» (рис. 3.3), то для них F = 68,0. Для данных, изображенных на рис. 3.4, F = 24,5. Как видим, величина F хорошо согласуется с впечатлением, которое складывается при взгляде на рисунок.

Итак, если F значительно превышает 1, нулевую гипотезу следует отвергнуть. Если же значение F близко к 1, нулевую гипотезу следует принять. Осталось понять, начиная с какой именно величины F следует отвергать нулевую гипотезу.

КРИТИЧЕСКОЕ ЗНАЧЕНИЕ F

Если извлекать случайные выборки из нормально распределенной совокупности, значение F будет меняться от опыта к опыту. Например, на рис. 3.5 представлен еще один набор из четырех случайных выборок по семь человек в каждой, извлеченных из нашей совокупности в 200 человек. На этот раз F = 0,5. Положим, что нам удалось повторить эксперимент с жителями того же городка, скажем, 200 раз. Каждый раз мы заново набирали по четыре группы, и каждый раз вычисляли F. На рис. З.6А приведены результаты этого многократного эксперимента. Значения F округлены до одного знака после запятой и изображены кружками. Два черных кружка соответствуют данным с рис. 3.2 и 3.5. Как и следовало ожидать, большинство значений F близко к единице (попадая в интервал от 0 до 2), только в 10 из 200 опытов (то есть в 5% случаев) мы получили значение F, большее или равное З. (На рис. 3.6Б эти 10 значений показаны черными кружками). Значит, отвергая нулевую гипотезу при F > 3, мы будем ошибаться в 5% случаев. Если такой процент ошибок не чрезмерен, то будем считать «большими» те значения F, которые больше или равны 3. Значение критерия, начиная с которого мы отвергаем нулевую гипотезу, называется критическим значением.

Вероятность ошибочно отвергнуть верную нулевую гипотезу, то есть найти различия там, где их нет, обозначается Р. Как правило, считают достаточным, чтобы эта вероятность не превышала 5%. (Максимальная приемлемая вероятность ошибочно отвергнуть нулевую гипотезу называется уровнем значимости и обозначается а). Почему бы не повысить критическое значение F тем самым, уменьшая эту вероятность? Однако в этом случае возрастет риск ошибочно принять неверную нулевую гипотезу (то есть не найти различий там, где они есть). Подробнее мы поговорим об этом в гл. 6.

Итак, мы решили, приняв допустимой 5% вероятность ошибки, отвергать нулевую гипотезу при F > 3. Однако критическое значение F следовало бы выбрать на основе не 200, а всех 1042 экспериментов, которые можно провести на совокупности из 200 человек. Предположим, что нам удалось провести все эти эксперименты. По их результатам мы вычислили соответствующие значения F и нанесли их на график (рис. 3.6В). Здесь каждое значение F изображено «песчинкой». На долю темных песчинок в правой части горки приходится 5% всех значений. Картина, в общем, похожа на ту, что мы видели рис. 3.6Б. На практике совокупности гораздо больше, чем население нашего городка, а число возможных значений F несравненно больше 1042. Если мысленно увеличить объем совокупности до бесконечности, то песчинки сольются, и получится гладкая кривая, изображенная на рис. 3.6Г. Площади под кривой аналогичны долям от общего числа кружков или песчинок на рис. 3.6А, Б и В. Заштрихованная область на рис. 3.6Г составляет 5% всей площади под кривой. Эта область начинается от F = 3,01, это и есть критическое значение F.

В нашем примере число групп равнялось 4, в каждую группу входило 7 человек. Если бы число групп или число членов в каждой группе было другим, кривая пошла бы по-другому и критическое значение F тоже было бы другим. Вообще, критическое значение F однозначно определяется уровнем значимости (обычно 0,05 или 0,01) и еще двумя параметрами, которые называются внутригрупповым и межгрупповым числом степеней свободы и обозначаются греческой буквой v («ню»). Оставим в стороне вопрос о происхождении этих названии и просто укажем, как их определять. Межгрупповое число степеней свободы — это число групп минус единица v = m - 1. Внутригрупповое число степеней свободы — это произведение числа групп на численность каждой из групп минус единица v = m (п - 1). В примере с исследованием диеты межгрупповое число степеней свободы равно

  1.  - 1 = 3, а внутригрупповое 4 (7 - 1) = 24. Вычислить критическое значение F довольно сложно, поэтому пользуются таблицами критических значений F для разных а, v^ и v^ (табл. 3.1).

Рис. 3.6. А. Четыре случайные выборки по 7 человек в каждой извлекли из той же совокупности (население городка) 200 раз. Каждый раз рассчитывали значение F и наносили его на график. Результаты для выборок с рис. 3.2 и 3.5 помечены черным. Б. Десять наибольших значений помечень черньм. Область черных кружков начинается со значения F, равного 3,0.

Математическая модель, на которой основано вычисление критических значений F предполагает следующее.

  1.  Каждая выборка независима от остальных выборок.
  2.  Каждая выборка случайным образом извлечена из исследуемой совокупности.

Рис. 3.6. (продолжение). В. Из той же совокупности извлекли все воэможнье наборы из 4 выборок по 7 человек в каждой и построили распределение F. Отдельные значения слились, превратившись в песчинки. 5% песчинок с самыми большими значениями F помечены черным. Г. Такое распределение F получится, если извлекать выборки из бесконечной совокупности. Пяти процентам самых высоких значений F соответствует заштрихованная область (ее площадь составляет 5% от общей площади всей кривой). «Большие» значения F начинаются там, где начинается эта область, то есть с F = 3,01.

  1.  Совокупность нормально распределена.
  2.  Дисперсии всех выборок равны.

При существенном нарушении хотя бы одного из этих условий нельзя пользоваться ни таблицей 3.1, ни вообще дисперсионным анализом.

В рассмотренном нами эксперименте исследовалась зависимость только от одного фактора — диеты. Дисперсионный анализ, в котором проверяется влияние одного фактора, называется однофакторным. При изучении влияния более чем одного фактора используют многофакторный дисперсионный анализ (в этой книге не рассматривается).

V  вну

1

2

3

4

5

6

7

8

9

10

11

12

36

4,11

3,26

2,87

2,63

2,48

2,36

2,28

2,21

2,15

2,11

2,07

2,03

7,4

5,25

4,38

3,89

3,57

3,35

3,18

3,05

2,95

2,86

2,79

2,72

38

4,1

3,24

2,85

2,62

2,46

2,35

2,26

2,19

2,14

2,09

2,05

2,02

7,35

5,21

4,34

3,86

3,54

3,32

3,15

3,02

2,92

2,83

2,75

2,69

40

4,08

3,23

2,84

2,61

2,45

2,34

2,25

2,18

2,12

2,08

2,04

2

7,31

5,18

4,31

3,83

3,51

3,29

3,12

2,99

2,89

2,8

2,73

2,66

42

4,07

3,22

2,83

2,59

2,44

2,32

2,24

2,17

2,11

2,06

2,03

1,99

7,28

5,15

4,29

3,8

3,49

3,27

3,1

2,97

2,86

2,78

2,7

2,64

44

4,06

3,21

2,82

2,58

2,43

2,31

2,23

2,16

2,1

2,05

2,01

1,98

7,25

5,12

4,26

3,78

3,47

3,24

3,08

2,95

2,84

2,75

2,68

2,62

46

4,05

3,2

2,81

2,57

2,42

2,3

2,22

2,15

2,09

2,04

2

1,97

7,22

5,1

4,24

3,76

3,44

3,22

3,06

2,93

2,82

2,73

2,66

2,6

48

4,04

3,19

2,8

2,57

2,41

2,29

2,21

2,14

2,08

2,03

1,99

1,96

7,19

5,08

4,22

3,74

3,43

3,2

3,04

2,91

2,8

2,71

2,64

2,58

50

4,03

3,18

2,79

2,56

2,4

2,29

2,2

2,13

2,07

2,03

1,99

1,95

7,17

5,06

4,2

3,72

3,41

3,19

3,02

2,89

2,78

2,7

2,63

2,56

60

4

3,15

2,76

2,53

2,37

2,25

2,17

2,1

2,04

1,99

1,95

1,92

7,08

4,98

4,13

3,65

3,34

3,12

2,95

2,82

2,72

2,63

2,56

2,5

70

3,98

3,13

2,74

2,5

2,35

2,23

2,14

2,07

2,02

1,97

1,93

1,89

7,01

4,92

4,07

3,6

3,29

3,07

2,91

2,78

2,67

2,59

2,51

2,45

80

3,96

3,11

2,72

2,49

2,33

2,21

2,13

2,06

2

1,95

1,91

1,88

6,96

4,88

4,04

3,56

3,26

3,04

2,87

2,74

2,64

2,55

2,48

2,42

100

3,94

3,09

2,7

2,46

2,31

2,19

2,1

2,03

1,97

1,93

1,89

1,85

6,9

4,82

3,98

3,51

3,21

2,99

2,82

2,69

2,59

2,5

2,43

2,37

120

3,92

3,07

2,68

2,45

2,29

2,18

2,09

2,02

1,96

1,91

1,87

1,83

6,85

4,79

3,95

3,48

3,17

2,96

2,79

2,66

2,56

2,47

2,4

2,34

oo

3,84

3

2,61

2,37

2,21

2,1

2,01

1,94

1,88

1,83

1,79

1,75

Таблица 3.1. Критические значения F для а = 0,05 (обычный шрифт) и а = 0,01 (жирный шрифт) S

Сейчас мы уже можем оценивать статистическую значимость реальных данных. Покажем это на трех примерах, заимствованных из медицинской литературы. Оговорюсь, что при изложении этих примеров мне пришлось несколько отклониться от первоисточников. Тому есть две причины. Во-первых, в медицинских публикациях обычно приводят не сами данные, а средние величины и прочие обобщенные показатели. Нередко дело обстоит и того хуже. Минуя все промежуточные этапы, авторы сообщают, что «Р < 0,05». Поэтому «данные из литературных источников» по большей части являются плодом моих собственных догадок, какими могли бы быть исходные данные. Во-вторых. дисперсионный анализ в том виде, как мы его изложили, требует, чтобы численность всех групп была одинаковой. Поэтому мне пришлось видоизменять приводимые в работах данные так, чтобы соблюсти это требование. Впоследствии мы обобщим наши статистические методы, и их можно будет применять и при неравной численности групп.

Позволяет ли правильное лечение сократить срок госпитализации?

Стоимость пребывания в больнице — самая весомая статья расходов на здравоохранение. Сокращение госпитализации без снижения качества лечения дало бы значительный экономический эффект. Способствует ли соблюдение официальных схем лечения сокращению госпитализации? Чтобы ответить на этот вопрос, Кнапп и соавт.* изучили истории болезни лиц, поступив ших в бесплатную больницу с острым пиелонефритом. Острый пиелонефрит был выбран как заболевание, имеющее четко очерченную клиническую картину и столь же четко регламентированные методы лечения.

Эта работа — пример обсервационного исследования. В отличие от экспериментального исследования, где исследователь сам формирует группы и сам оказывает то или иное воздействие в обсервационном исследовании он может лишь наблюдать течение процесса. С другой стороны, это исследование — ретроспективное, поскольку имеет дело с данными, полученными в прошлом (в отличие от проспективного).

В обсервационном исследовании мы никогда не можем гарантировать, что группы различаются только тем признаком, по которому они были сформированы. Этот неустранимый недостаток исследований такого рода. Известно, например, что курильщики чаще болеют раком легких. Это считается доказательством того, что курение вызывает рак легких. Однако возможна и другая точка зрения у людей с генетической предрасположенностью к раку легких существует и генетическая предрасположенность к курению. В обсервационном исследовании отвергнуть такое объяснение невозможно.

Ретроспективное исследование, естественно, всегда является обсервационным, разделяя недостатки последнего, оно обладает и рядом собственных. Исследователь использует информацию, собранную для других целей, — естественно, часть ее приходится реконструировать, еще часть неизбежно теряется. Меняются методы исследования, диагностические критерии и сами представления о нозологических единицах, наконец, истории болезни ведутся порой небрежно. Кроме того, имея весь материал в руках, здесь особенно трудно удержаться от непреднамеренной подтасовки.

Тем не менее, ретроспективные исследования проводились и будут проводиться. Они недороги и позволяют получить большой объем информации в короткий срок. Последнее особенно важно в случае редкого заболевания при проспективном исследовании на сбор данных уйдут годы. В примере, который мы разбираем, проспективное исследование вообще невозможно нельзя же, в самом деле, одну группу больных лечить правильно, а другую неправильно.

Чтобы избежать ловушек обсервационного (и особенно ретроспективного) исследования, чрезвычайно важно в явном виде задать критерии, по которым больных относили к той или иной группе. Самому исследователю это поможет избежать невольного самообмана, читателю работы это даст возможность судить, насколько результаты исследования приложимы к его больным.

Кнапп и соавт. сформулировали следующие критерии включения в исследование.

  1.  Диагноз при выписке — острый пиелонефрит.
  2.  При поступлении—боли в пояснице, температура выше 37,8°С.
  3.  Бактериурия более 100 000 колоний/мл, определена чувствительность к антибиотикам.
  4.  Возраст от 18 до 44 лет (больных старше 44 лет не включали в связи с высокой вероятностью сопутствующих заболеваний, ограничивающих выбор терапии).
  5.  Отсутствие почечной, печеночной недостаточности, а также заболеваний, требующих хирургического лечения (эти состояния тоже ограничивают выбор терапии).
  6.  Больной был выписан в связи с улучшением (то есть не покинул больницу самовольно, не умер и не был переведен в другое лечебное учреждение).

Кроме того, исследователи сформулировали критерий того, что считать «правильным» лечением. Правильным считалось лечение, соответствующее рекомендациям авторитетного справочника по лекарственным средствам «PhysiciansDesk Reference» («Настольный справочник врача»). По этому критерию больных разделили на две группы леченных правильно (1-я группа) и неправильно (2-я группа). В обеих группах было по 36 больных.

Результат представлен на рис. 3.7. Средняя длительность госпитализации составила для первой группы 4,51 сут. (стандартное отклонение 1,98 сут.), для второй группы 6,28 сут. (стандартное отклонение 2,54 сут). Можно ли считать эти различия случайными? Прибегнем к дисперсионному анализу.

Вычислим сначала внутригрупповую дисперсию как среднюю дисперсий обеих групп:

Рис. 3.7. Длительность госпитализации при правильном (1-я руппа) и неправильном лечении. Каждый больгой обозначен кружком; положение кружка соответствует сроку госпитализации. Средняя длительность госпитализации в первой группе меньше, чем во второй. Можно ли отнести это различие на счет случайности?

Теперь вычислим межгрупповую дисперсию.

Среднее двух выборочных средних равно

следовательно, стандартное отклонение равно

и наконец межгрупповая дисперсия равна

Теперь можно вычислить F — как отношение межгруппо- вой к внутригрупповой дисперсии:

Рассчитаем межгрупповое и внутри групповое число степеней свободы v = 2 - 1 = 1, v = 2 (36 - 1) = 70. Теперь по таблице 3.1 найдем критическое значение F. На пересечении столбца «1» и строки «70» находим число 7,01, набранное жирным шрифтом. То есть при уровне значимости 0,01 критическое значение F составляет 7,01. Итак, на наш вопрос можно ли считать различия в длительности госпитализации случайными мы можем дать ответ, вероятность этого весьма мала меньше 1%. Леченные правильно находились в больнице меньше чем, леченные неправильно и различия эти статистически значимы. Значит ли это, что благодаря правильному лечению больные выздоравливают быстрее? Увы, нет. Как это всегда бывает в обсервационном исследовании, мы не можем исключить того, что группы различались чем-то еще кроме лечения. Может быть, врачи, которые лечат «по справочнику» просто более склонны быстрее выписывать своих больных?

Галотан и морфин при операциях на открытом сердце

Галотан препарат, широко используемый при общей анестезии. Он обладает сильным действием, удобен в применении и очень надежен. Галотан — газ его можно вводить через респиратор. Поступая в организм через легкие, галотан действует быстро и кратковременно поэтому, регулируя подачу препарата можно оперативно управлять анестезией. Однако галотан имеет существенный недостаток — он угнетает сократимость миокарда и расширяет вены, что ведет к падению АД. В связи с этим было предложено вместо галотана для общей анестезии применять морфин, который не снижает АД. Т. Конахан и соавт.* сравнили.

галотановую и морфиновую анестезию у больных, подвергшихся операции на открытом сердце.

В исследование включали больных, у которых не было противопоказаний ни к галотану, ни к морфину. Способ анестезии (галотан или морфин) выбирали случайным образом.

Такое исследование — со случайно отобранной контрольной группой (то есть рандомизированное) и наличием воздействия со стороны исследователя — называется рандомизированным контролируемым клиническим испытанием или просто контролируемым испытанием. Контролируемое испытание — это всегда проспективное исследование (данные получают после начала исследования), кроме того, это экспериментальное исследование (воздействие оказывает исследователь). Эксперимент, который в естественных науках давно стал основным методом исследования, в медицине получил распространение сравнительно недавно. Значение контролируемых испытаний трудно переоценить. Благодаря рандомизации мы уверены в том, что группы различаются только исследуемым признаком, тем самым преодолевается основной недостаток обсервационных исследований. В отличие от ретроспективного исследования, в проспективном исследовании никто до его завершения не знает, к чему оно приведет. Это уменьшает риск невольной подтасовки, о которой мы говорили выше. Быть может, по этим причинам контролируемые испытания нередко приводят к заключению о неэффективности того или иного метода лечения, когда обсервационное исследование, напротив, доказывает его эффективность*.

Но почему в таком случае не все методы лечения проходят контролируемое испытание? Немаловажную роль играет консерватизм, когда метод уже вошел в практику, трудно убедить врачей и больных, что его эффективность еще нуждается в подтверждении. Рандомизация психологически трудна: предлагая по жребию лечиться тем или иным способом, врач по сути дела признается в незнании и призывает больного стать объектом эксперимента. Чтобы охватить достаточное количество больных, исследование часто приходится проводить одновременно в нескольких местах (кооперированные испытания). Конечно, это вносит приятное разнообразие в работу координаторов проекта, однако повышает его стоимость и оборачивается дополнительной нагрузкой для сотрудников сторонних медицинских учреждений. Контролируемые испытания, как и вообще проспективные исследования иногда занимают многие годы. За это время больной может переехать в другой город, утратить интерес к эксперименту или умереть (по причинам, не относящимся к исследованию). Нередко основная трудность состоит в том, чтобы не потерять участников испытания из виду.

С выбыванием больных из исследования связан и более принципиальный недостаток контролируемых испытаний (и проспективных исследований вообще). Если в обсервационном исследовании мы не можем гарантировать сопоставимость начального состава групп, то в проспективном исследовании мы не можем гарантировать сопоставимость выбывания из исследования. Проблема состоит в том, что выбывание может быть связано с лечением. Если, например, риск побочного действия препарата связан с тяжестью заболевания, то из группы леченных будут выбывать (из-за непереносимости препарата) наиболее тяжелые больные. Тем самым состояние группы леченных будет «улучшаться». Чтобы избежать подобных иллюзий, эффективность метода лечения следует рассчитывать как долю всех больных, включенных в исследование, а не только прошедших полный курс. Даже при соблюдении этого условия результаты исследования с большим числом выбывших всегда сомнительны. Существуют и более тонкие методы анализа результатов проспективных исследований, с ними мы познакомимся позже, в гл. 11.

Удачный выбор предмета исследования позволил Конахану и соавт. избежать большинства упомянутых трудностей. Поскольку исследователей интересовали только ближайшие результаты, проблемы выбывания не возникало. Регистрировали следующие показатели параметры гемодинамики на разных этапах операции, длительность пребывания в реанимационном отделении и общую длительность пребывания в больнице после операции, а также послеоперационную летальность. Данные по летальности мы проанализируем после того, как познакомимся в гл. 5 с необходимыми статистическими методами. Пока же сосредоточим внимание на артериальном давлении между началом анестезии и началом операции. Именно в этот период артериальное давление наиболее адекватно отражает гипотензивное действие анестетика, поскольку в дальнейшем начинает сказываться гипотензивный эффект самой операции. Артериальное давление между началом анестезии и началом операции измеряли многократно, каждый раз вычисляя среднее артериальное давление:

где АДсредн — среднее артериальное давление, АДд — диастолическое артериальное давление, АДС — систолическое артериальное давление. Брали минимальное из полученных значений.

В исследование вошло 122 больных. У половины больных использовали галотан (1-я группа), у половины — морфин (2-я группа). Результаты представлены на рис. 3.8. Данные округлены до ближайшего четного числа. В среднем у больных, получавших галотан, минимальное АД было на 6,3 мм рт. ст. ниже,

’ ^средн у г у

чем у больных, получавших морфин. Разброс значений довольно велик, и диапазоны значений сильно перекрываются. Стандартное отклонение в группе галотана составило 12,2 мм рт. ст. в группе морфина — 14,4 мм рт. ст.

Достаточно ли велико различие в 6,3 мм рт. ст., чтобы его нельзя было отнести за счет случайности?

Применим дисперсионный анализ. Оценкой внутригрупповой дисперсии служит среднее двух выборочных дисперсий:

Эта оценка дисперсии вычислена по дисперсиям отдельных выборок, поэтому она не зависит от того, различны или нет выборочные средние.

Рис. 3.8. Минимальный уровень АДсредн между началом анестезии и началом операции при галотановой (1-я группа) и морфиновой (2-я группа) анестезии. Можно ли на основании этих данных отвергнуть нулевую гипотезу об отсутствии связи между выбором анестетика и артериальным давлением?

Оценим теперь дисперсию, полагая, что галотан и морфин оказывают одинаковое действие на артериальное давление. В этом случае две группы бальных, представленные на рис. 3.8, являются просто двумя случайными выборками из одной и той же совокупности. В результате стандартное отклонение выборочных средних есть оценка стандартной ошибки среднего. Среднее двух выборочных средних равно

 

Стандартное отклонение выборочных средних:

Так как объем каждой выборки n равен 61 оценка дисперсии совокупности полученная на основе выборочных средних со ставит

Число степеней свободы v = m - 1 = 2 - 1 = 1, v = m (n - 1) =

меж ’ вну v '

= 2 (61 - 1) = 120. В таблице 3.1 находим критическое значение F для 5% уровня значимости — 3,92. Поскольку у нас F = 6,81, то мы приходим к выводу, что различия статистически значимы. Мы можем заключить, что морфин в меньшей степени снижает артериальное давление, чем галотан. Каково клиническое значение этого результата? Мы вернемся к этому вопросу позднее.

БЕГ И МЕНСТРУАЦИИ

Врачам общей практики и гинекологам очень часто приходится искать причину нерегулярности менструации в частности их задержки. Задержка менструации может быть признаком беременности, менопаузы нередко она случается в начале приема перо- ральных контрацептивов. Задержка менструации может быть проявлением самых разных гинекологических эндокринных и даже психических заболевании. Среди последних особенно опасна нервная анорексия — психическое расстройство, когда женщина, убежденная в своей полноте изнуряет себя голодом и клизмами, доходя до крайнего истощения. Без срочного и решительного врачебного вмешательства нервная анорексия может привести к смерти. Между тем есть еще одна вполне невинная причина, которая как полагают, может вызвать задержку менструации - это занятия физкультурой и спортом. Чтобы проверить это предположение Дейл и соавт.* провели обсервационное исследование целью, которого было установить, есть та связь между занятиями спортом и частотой менструации. В исследование вошли 78 молодых женщин разделенных на 3 группы по 26 человек в каждой. В первую — контрольную — группу вошли женщины, которые не занимались ни физкультурой, ни спортом. Вторая группа состояла из физкультурниц — они бегали трусцой и за неделю пробегали от 8 до 48 км. Женщины третьей группы — спортсменки — тренировались всерьез за неделю они пробегали более 48 км.

На рис. 3.9 представлено распределение числа менструации в год. В контрольной группе среднее число менструации в год равнялось 11,5, у физкультурниц — 10,1 и у спортсменок — 9,1. Можно ли отнести эти различия на счет случайности?

Оценим дисперсию совокупности по среднему выборочных дисперсий:

Чтобы оценить дисперсию по разбросу выборочных средних нужно сначала оценить стандартную ошибку среднего для чего вычислить стандартное отклонение среднего трех выборок. Так как среднее трех средних равно

получаем следующую оценку стандартной ошибки:

Объем выборки n равен 26, поэтому оценка дисперсии по разбросу средних дает величину

Число менструаций в год

Рис. 3.9. Число менструации в год у женщин которые не занимались ни физкультурой, ни спортом (1-я группа), физкультурниц (2-я группа) и спортсменок (3-я группа). Среднее число менструаций различно. Можно ли отнести эти различия за счет случайности.

Наконец,

Число степеней свободы v = m - 1 = 3 - 1 = 2, v = m (n - 1)

меж 7 вну v 7

= 3 (26 - 1) = 75. Критическое значение F при 1% уровне значимости — 4,90. Итак, различия между группами статистически значимы — вероятность случайно получить такие различия не превышает 1%. Похоже, услышав жалобы на задержку месячных, врач должен спросить «А не занимаетесь ли вы спортом?» Однако не будем спешить — решены еще далеко не все вопросы. Можно ли утверждать, что задержки менструаций свойственны как физкультурницам, так и спортсменкам? Есть ли связь между интенсивностью нагрузок и частотой менструаций? Ответы на эти вопросы мы отложим до гл.4.

ЗАДАЧИ

  1.  Если при родах шейка матки долго не раскрывается, то продолжительность родов увеличивается и может возникнуть необходимость кесарева сечения. Ч. О’Херлихи и Г. Мак-Дональд (С. OHerlihy, H. MacDonaid. Influence of reproduction prostaglandin E2 vaginal gel on cervical ripening and labor. Obstet. Gynecol., 54: 708—710, 1979) решили выяснить, ускоряет ли гель с простаг- ландином Е2 раскрытие шейки матки. В исследование вошло 2 группы рожениц. Роженицам первой группы вводили в шейку матки гель с простагландином Е2, роженицам второй группы вводили гель-плацебо. В обеих группах было по 21 роженице возраст, рост и сроки беременности были примерно одинаковы. Роды в группе, получавшей гель с простагландином Е длились в среднем 8,5 ч (стандартное отклонение 4,7 ч), в контрольной группе
  2.  13,9 ч (стандартное отклонение — 4,1 ч). Можно ли утверждать, что гель с простагландином Е2 сокращал продолжительность родов?

Курение считают основным фактором, предрасполагающим к хроническим обструктивным заболеваниям легких. Что касается пассивного курения, оно таким фактором обычно не считается. Дж. Уайт и Г. Фреб усомнились в безвредности пассивного курения и исследовали проходимость дыхательных путей у некурящих, пассивных и активных курильщиков (J. White, H. Froeb. Small-airways dysfunction in nonsmokers chronically exposed to tobacco smoke. N. Engl. J. Med., 302:720—723, 1980). Для характеристики состояния дыхательных путей взяли один из показателей функции внешнего дыхания — максимальную объемную скорость середины выдоха которую измеряли во время профилактического осмотра сотрудников Калифорнийского университета в Сан-Диего. Уменьшение этого показателя — признак нарушения проходимости дыхательных путей. Данные обследования представлены в таблице.

где не курят

200

3,17

0,74

работающие в

накуренном помещении

200

2,72

0,71

Курящие

выкуривающие

небольшое число сигарет

200

2,63

0,73

выкуривающие среднее

число сигарет

200

2,29

0,7

выкуривающие большое

число сигарет

200

2,12

0,72

Можно ли считать максимальную объемную скорость середины выдоха одинаковой во всех группах?

Низкий уровень холестерина липопротеидов высокой плотности (ХЛПВП) — фактор риска ишемической болезни сердца. Некоторые исследования свидетельствуют, что физическая нагрузка может повысить уровень ХЛПВП. Дж. Хартунг и соавт. (G. Н. Hartung et al. Relation of diet to hidh-density liрoprotein cholesterol in middle-aged marathon runners, joggles, and inactive men. N. Engl. J. Med., 302:357—361, 1980) исследовали уровень ХЛПВП у бегунов-марафонцев, бегунов трусцой и лиц, не занимающихся спортом. Средний уровень ХЛПВП у лиц, не занимающихся спортом, составил 43,3 мг% (стандартное откло нение 14,2 мг%), у бегунов трусцой — 58,0 мг% (стандартное отклонение 17,7 мг%) и у марафонцев — 64,8 мг% (стандартное отклонение 14,3 мг%). Будем считать, что в каждой группе было по 70 человек. Оцените статистическую значимость различий между группами.

  1.  Марихуана — наркотик, поэтому исследовать курение марихуаны на добровольцах невозможно. Исследования такого рода проводят на лабораторных животных. Г. Хубер и соавт. (G. Huber et al. Marijuana, tetrahydrocannabinol, and pulmonary arterial antibacterial defenses. Chest, 77:403—410, 1980) изучали влияние марихуаны на антибактериальную защиту у крыс. После ингаляционного введения бактерий крыс помещали в камеру, где специальная машина окуривала их сигаретами с марихуаной. Забив крыс, исследователи извлекали легкие и подсчитывали процент погибших бактерий, который и служил показателем состояния антибактериальной защиты. Чтобы установить, что именно влияет на антибактериальную защиту — тетрагид- роканнабинолы (вещества, которые обусловливают наркотическое действие марихуаны) или просто дым одну из групп окуривали сигаретами, из которых тетрагидроканнабинолы были удалены. В каждой группе было по 36 крыс. Являются ли различия статистически значимыми?

Число сигарет

Среднее

среднего

0 (контроль)

85,1

0,3

15

83,5

1

30

80,9

0,6

50

72,6

0,7

75

60

1,3

75 (тетрагидроканнабинота удалены)

73,5

0,7

150

63,8

2,6

Стремясь отделить действие тетрагидроканнабинолов от действия дыма, Г. Хубер и соавт. изучили их действие при внутривенном введении. После ингаляционного введения бактерий крысам вводили спиртовой раствор тетрагидроканнабинолов, контрольной группе вводили этиловый спирт. В обеих группах было по 36 животных. После введения тетрагидроканнабино- лов доля погибших бактерий составила в среднем 51,4%, в контрольной группе — 59,4%. Стандартные ошибки среднего составили соответственно 3,2% и 3,9%. Позволяют ли эти данные утверждать, что тетрагидроканнабинолы ослабляют антибактериальную защиту?

  1.  Работа медицинской сестры сопряжена с постоянным напряжением и тяжелыми переживаниями. Груз ответственности, не уравновешенной правом принимать решения, рождает чувство усталости, раздражения и безысходности, интересная некогда работа становится ненавистным бременем. Этот синдром не совсем точно называют опустошенностью. Считается, что его развитию особенно подвержены медицинские сестры, которые работают с наиболее тяжелыми больными. Чтобы проверить это предположение, Э. Кин и соавт. (A. Keane et al. Stress in ICU and non-ICU nurses. Nurs. Res., 34:231—236, 1985) провели опрос медицинских сестер с помощью специально разработанного опросника, позволяющего оценить опустошенность в баллах. Медицинских сестер разделили на три группы в зависимости от тяжести состояния больных, с которыми они работали (1-я группа — наиболее тяжелые больные, 3-я — самые легкие). Далее каждую группу разделили на две — медицинские сестры хирургических и терапевтических отделений, таким образом, получилось 6 групп по 16 медицинских сестер в каждой. Являются ли различия между 6 группами статистически значимыми?

Группа

1

2

3

Хир.

Тер.

Хир.

Тер.

Хир.

Тер.

Среднее

49,9

51,2

573

46,4

43,9

65,2

Стандартное отклонение

1,4,3

13,4

14,9

14,7

16,5

20,5

Объем выборки

16

16

16

16

16

16

3.7. Нитропруссид натрия и дофамин — препараты, которые широко используют при инфаркте миокарда (Инфаркт миокарда развивается вследствие закупорки одной из коронарных артерий. Кровь перестает поступать к тому или иному участку миокарда, который в результате отмирает от недостатка кислорода). Считается, что нитропруссид натрия облегчает работу сердца и тем самым снижает потребность миокарда в кислороде; в результате устойчивость миокарда к недостаточному кровоснабжению повышается. Дофамин препятствует падению артериального давления и увеличивает поступление крови к пораженному участку через дополнительные сосуды (так называемые кол- латерали). К. Шатни и соавт. (C. Shatney et al. Effects of infusion of dopamine and nitroprusside on size of experimental myocardial infarction. Chest., 73:850—856, 1978) сравнили эффективность этих препаратов в опытах на собаках с инфарктом миокарда. Инфаркт миокарда вызывали перевязкой коронарной артерии, после чего вводили препарат (собакам контрольной группы вводили физиологический раствор). Через 6 часов собак забивали и взвешивали пораженный участок миокарда, результат выражали в процентах от веса левого желудочка. Препарат для каждой собаки выбирали случайным образом. Исследователь, взвешивавший миокард, не знал, какой препарат вводили собаке. Полученные данные приведены в таблице:

Вес пораженного участка миокарда (в процентах от веса левого желудочка)

Группа

Число  животных Среднее

Стандартная ошибка среднего

Контроль  Дофамин

30

15

1

низкая доза

13

15

2

высокая доза

20

9

2

Нитропруссид

20

7

1

Можно ли считать различия между группами статистически значимыми? (Формулы для дисперсионного анализа при неравной численности групп найдите в прил. А).

3.8. Считается, что выработка тромбоцитов (форменных элементов крови, играющих важную роль в ее свертывании) у новорожденных регулируется иначе чем у взрослых. Исследуя эту регуляцию X. Бесслер и соавт. (Н. Bessler et al. Thrombopoietic activity in newborn infants. Biol. Neonate, 49:61—65, 1986) опрe- делили содержание тромбоцитов в крови взрослых и грудных детей разного возраста. Можно ли говорить о существовании различии в количестве тромбоцитов?

Группа

Число  обследованных

Число тромбоцитов, мкл 1  Стандартное Среднее отклонение

Взрослые Дети в возрасте

15

257

159

4 суток

37

196

359

1 месяца

31

221

340

2 месяцев

13

280

263

4 месяцев

10

310

95

Лекция 4

Сравнение двух групп: критерий Стьюдента

В предыдущей главе мы познакомились с дисперсионным анализом. Он позволяет проверить значимость различий нескольких групп. В задачах к этой главе вы видели, что нередко нужно сравнить только две группы. В этом случае можно применить критерий Стьюдента. Сейчас мы изложим его сущность и покажем, что критерий Стьюдента — это частный случаи дисперсионного анализа.

Критерий Стьюдента чрезвычайно популярен, он используется более чем в половине медицинских публикаций*. Однако следует помнить, что этот критерий предназначен для сравнения именно двух групп, а не нескольких групп попарно. На рис. 4.1 представлено использование критерия Стьюдента в статьях из журнала Circulation. Критерий был использован в 54% статей, и чаще всего неверно. Мы покажем, что ошибочное использование критерия Стьюдента увеличивает вероятность «выявить» не существующие различия. Например, вместо того чтобы признать несколько методов лечения равно эффективными (или неэффективными), один из них объявляют «лучшим».

Рис. 4.1. Использование статистических методов в медицинских исследованиях. Рассмотрено 142 статьи опубликованные в 56-м томе журнала Circulation (кроме обзоров, описаний случаев и работ по рентгенологии и патоморфологии). В 39% работ статистические методы не использовались вовсе, в 34% прааильно использовали критерий Стьюдента, дисперсионный анализ или другие методы. В 27% работ критерий Стьюдента использовали неправильно — для попарного сравнения нескольких групп (S. A. Glantz. How to detect correct and prevent errors in the med call teralure. Circulation, 61:1—7, 1980). 1 - не использовали статистических методов, 2 - правильно использовали критерий Стьюдента, 3 - правильно использовали дисперсионный анализ, 4 - правильно использовали другие методы, 5 - неправильно использовали критерий Стьюдента для попарного сравнения нескольких групп.

ПРИНЦИП МЕТОДА

Предположим, что мы хотим испытать диуретическое действие нового препарата. Мы набираем десять добровольцев, случайным образом разделяем их на две группы — контрольную, которая получает плацебо и экспериментальную, которая получает препарат, а затем определяем суточный диурез. Результаты пред ставлены на рис. 4.2А. Средний диурез в экспериментальной группе на 240 мл больше чем в контрольной. Впрочем, подобными данными мы вряд ли кого-нибудь убедим, что препарат — диуретик. Группы слишком малы.

Повторим эксперимент, увеличив число участников. Теперь в обеих группах по 20 человек. Результаты представлены на рис. 4.2Б. Средние и стандартные отклонения примерно те же, что и в эксперименте с меньшим числом участников. Кажется, однако, что результаты второго эксперимента заслуживают большего доверия. Почему?

Вспомним, что точность выборочной оценки среднего характеризуется стандартной ошибкой среднего (см. гл. 2).

где n — объем выборки, а а — стандартное отклонение совокупности, из которой извлечена выборка.

С увеличением объема выборки стандартная ошибка среднего уменьшается, следовательно уменьшается и неопределенность в оценке выборочных средних. Поэтому уменьшается и неопределенность в оценке их разности. Применительно к нашему эксперименту, мы более уверены в диуретическом действии препарата. Точнее было бы сказать, мы менее уверены в справедливости гипотезы об отсутствии диуретического действия (Будь такая гипотеза верна, обе группы можно было бы считать двумя случайными выборками из нормально распределенной совокупности).

Чтобы формализовать приведенные рассуждения, рассмотрим отношение:

_ Разность выборочных средних

Стандартная ошибка разности выборочных средних

Для двух случайных выборок извлеченных из одной нормально распределенной совокупности это отношение, как правило, будет близко к нулю. Чем меньше (по абсолютной величине) t, тем больше вероятность нулевой гипотезы. Чем больше t, тем больше оснований отвергнуть нулевую гипотезу и считать, что различия статистически значимы.

Для нахождения величины t нужно знать разность выборочных средних и ее ошибку. Вычислить разность выборочных средних нетрудно — просто вычтем из одного среднего другое. Сложнее найти ошибку разности. Для этого обратимся к более общей задаче нахождения стандартного отклонения разности двух чисел, случайным образом извлеченных из одной совокупности.

Рис. 4.3 А. Из этой совокупности мы будем извлекать пары и вычислять разности. Б. Разности первых 6 пар. В. Разности еще ста пар. Разброс разностей больше, чем разброс самих значений.

СТАНДАРТНОЕ ОТКЛОНЕНИЕ РАЗНОСТИ

На рис. 4.ЗА представлена совокупность из 200 членов. Среднее равно 0, стандартное отклонение 1. Выберем наугад два члена совокупности и вычислим разность. Выбранные члены помечены на рис. 4.ЗА черными кружками, полученная разность представлена таким же кружком на рис. 4.ЗБ. Извлечем еще пять пар (на рисунках они различаются штриховкой), вычислим разность для каждой пары, результат снова поместим на рис. 4.ЗБ. Похоже, что разброс разностей больше разброса исходных данных. Извлечем наугад из исходной совокупности еще 100 пар, для ка ждой из которых вычислим разность. Теперь все разности включая вычисленные ранее изображены на рис. 4.3В. Стандартное отклонение для полученной совокупности разностей — примерно 1,4 то есть на 40% больше чем в исходной совокупности.

Можно доказать что дисперсия разности двух случайно извлеченных значении равна сумме дисперсии совокупностей из которых они извлечены *.

В частности если извлекать значения из одной совокупности, то дисперсия их разности будет равна удвоенной дисперсии этой совокупности. Говоря формально если значение X из-

^ 2

влечено из совокупности, имеющей дисперсию ох, а значение

Y из совокупности имеющей дисперсию о2, то распределение всех возможных значений X - Y имеет дисперсию

Почему дисперсия разностей больше дисперсии совокупности легко понять на нашем примере (см. рис. 4.3): в половине случаев члены пары лежат по разные стороны от среднего, поэтому их разность еще больше отклоняется от среднего, чем они сами.

Продолжим рассматривать рис. 4.3. Все пары извлекали из одной совокупности. Ее дисперсия равна 1. В таком случае дисперсия разностей будет

 

Стандартное отклонение есть квадратный корень из дисперсии. Поэтому стандартное отклонение разностей равно %/2, то есть больше стандартного отклонения исходной совокупности примерно на 40%, как и получилось в нашем примере.

Чтобы оценить дисперсию разности членов двух совокупностей по выборочным данным нужно в приведенной выше формуле заменить дисперсии их выборочными оценками

Тем самым искомая стандартная ошибка разности средних

Теперь мы можем вычислить отношение t.

КРИТИЧЕСКОЕ ЗНАЧЕНИЕ t

Напомним, что мы рассматриваем отношение Разность выборочных средних

t = -

Стандартная ошибка разности выборочных средних

Воспользовавшись результатом предыдущего раздела, имеем

Если ошибку среднего выразить через выборочное стандартное отклонение, получим другую запись этой формулы

где n — объем выборки.

Если обе выборки извлечены из одной совокупности, то выборочные дисперсии s,2 и s2, — это оценки одной и той же дисперсии а2. Поэтому их можно заменить на объединенную оценку дисперсии. Для выборок равного объема объединенная оценка дисперсии вычисляется как

Значение t, полученное на основе объединенной оценки

Если объем выборок одинаков, оба способа вычисления t дадут одинаковый результат. Однако если объем выборок разный, то это не так. Вскоре мы увидим, почему важно вычислять объединенную оценку дисперсии, а пока посмотрим, какие значения t мы будем получать, извлекая случайные пары выборок из одной и той же нормально распределенной совокупности.

Так как выборочные средние обычно близки к среднему по совокупности, значение t будет близко к нулю. Однако иногда мы все же будем получать большие по абсолютной величине значения t (вспомним опыты с Fв предыдущей главе). Чтобы понять, какую величину t следует считать достаточно «большой», чтобы отвергнуть нулевую гипотезу, проведем мысленный эксперимент, подобный тому, что мы делали в предыдущей главе. Вернемся к испытаниям предполагаемого диуретика. Допустим, что в действительности препарат не оказывает диуретического действия. Тогда и контрольную группу, которая получает плацебо, и экспериментальную, которая получает препарат, можно считать случайными выборками из одной совокупности. Пусть это будет совокупность из 200 человек, представленная на рис. 4.4А. Члены контрольной и экспериментальной групп различаются штриховкой . В нижней части рисунка данные по этим двум выборкам показаны так, как их видит исследователь. Взглянув на эти данные, трудно подумать, что препарат — диуретик. Полученное по этим выборкам значение t равно -0,2.

Разумеется, с не меньшим успехом можно было бы извлечь любую другую пару выборок, что и сделано на рис. 4.4Б. Как и следовало ожидать, две новые выборки отличаются как друг от друга, так и от извлеченных ранее (рис. 4.4А). Интересно, что на этот раз нам «повезло» — средний диурез довольно сильно различается. Соответствующее значение t равно -2,1. На рис. 4.4В изображена еще одна пара выборок. Они отличаются друг от друга и от выборок с рис. 4.4А и 4.4Б. Значение t для них равно 0.

Разных пар выборок можно извлечь более 1027. На рис. 4.5 А приведено распределение значений t, вычисленных по 200 парам выборок. По нему уже можно судить о распределении t. Оно симметрично относительно нуля, поскольку любую из пары выборок можно счесть «первой». Как мы и предполагали, чаще всего значения t близки к нулю, значения, меньшие -2 и большие +2, встречаются редко.

На рис. 4.5Б видно, что в 10 случаях из 200 (в 5% всех случаев) t меньше -2,1 или больше +2,1. Иначе говоря, если обе выборки извлечены из одной совокупности, вероятность того, что значение

Рис. 4.4. Испытания предполагаемого диуретика. А. В действительности препарат не обладает диуретическим действием, поэтому обе группы — просто две случайные выборки из совокупности, показанной в верхней части рисунка. Члены совокупности, которым посчастливилось принять участие в исследовании, помечены штриховкой. В нижней части рисунка данные показаны такими, какими их видит исследователь. Вряд ли он решит, что препарат — диуретик: средний диурез в группах различается очень незначительно. Б. Исследователю могла бы попасться и такая пара выборок. В этом случае он наверняка бы счел препарат диуретиком. В. Еще две выборки из той же совокупности.

t лежит вне интервала от -2,1 до +2,1, составляет 5%. Продолжая извлекать пары выборок, мы увидим, что распределение принимает форму гладкой кривой, показанной на рис. 4.5В. Теперь 5% крайних значений соответствуют закрашенным областям графика левее -2,1 и правее +2,1. Итак, мы нашли, что если две выборки извлечены из одной и той же совокупности, то вероятность получить значение t, большее +2,1 или меньшее -2,1, составляет всего 5%. Следовательно, если значение t находится вне

Рис. 4.5. А. Из совокупности, показанной на рис. 4.4, извлекли 200 пар случайных выборок по 10 членов в каждой, для каждой пары рассчитали значение t и нанесли его на график. Значения для t трех пар выборок с рис. 4.4 помечены черным. Большая часть значений сгруппирована вокруг нуля, однако некоторые значения по абсолютной величине превышают 1,5 и даже 2. Б. Число значений, по абсолютной величине превышающих 2,1 составляет 5%. В. Продолжая извлекать пары выборок, в конце концов мы получим гладкую кривую. 5% наибольших (по абсолютной величине) значений образуют две заштрихованные области (сумма заштрихованных площадей как раз и составляет 5% всей площади под кривой). Следовательно «большие» значения t начинаются там, где начинается заштрихованная область, то есть с t = ±2,1. Вероятность получить столь высокое значение t, извлекая случайные выборки из одной совокупности, не превышает 5%. Г. Описанный способ выбора критического значения t предопределяет возможность ошибки: в 5% случаев мы будем находить различия там, где их нет. Чтобь снизить вероятность ошибочного заключения, мы можем выбрать более высокое критическое значение. Например, чтобы площадь заштрихованной области составляла 1% от обшей площади под кривой, критическое значение должно составлять 2,878.

интервала от -2,1 до +2,1, нулевую гипотезу следует отклонить, а наблюдаемые различия признать статистически значимыми.

Обратите внимание, что таким образом мы выявляем отличия экспериментальной группы от контрольной как в меньшую, так и в большую сторону — именно поэтому мы отвергаем нулевую гипотезу как при t < -2,1 так и при t > +2,1. Этот вариант критерия Стьюдента называется двусторонним, именно его обычно и используют. Существует и односторонний вариант критерия Стьюдента. Используется он гораздо реже, и в дальнейшем говоря о критерии Стьюдента, мы будем иметь в виду двусторонний вариант.

Вернемся к рис. 4.4Б. На нем показаны две случайные выборки из одной и той же совокупности при этом t = - 2,2. Как мы только что выяснили, нам следует отвергнуть нулевую гипотезу и признать исследуемый препарат диуретиком, что самой собой неверно. Хотя все расчеты были выполнены правильно, вывод ошибочен. Увы, такие случаи возможны.

Разберемся подробнее. Если значение t меньше -2,1 или больше +2,1, то при уровне значимости 0,05 мы сочтем различия статистически значимыми. Это означает, что если бы наши группы представляли собой две случайные выборки из одной и той же совокупности, то вероятность получить наблюдаемые различия (или более сильные) равна 0,05. Следовательно, ошибочный вывод о существовании различии мы будем делать в 5% случаев. Один из таких случаев и показан на рис. 4.4Б.

Чтобы застраховаться от подобных ошибок, можно принять уровень значимости не 0,05, а скажем 0,01. Тогда, как видно из рис. 4.5Г, мы должны отвергать нулевую гипотезу при t < -2,88 или t > +2,88. Теперь-то рис. 4.4Б нас не проведет — мы не признаем подобные различия статистически значимыми. Однако во первых ошибочные выводы о существовании различий все же не исключены просто их вероятность снизилась до 1% и во вторых вероятность не найти различии там где они есть теперь повысилась. О последней проблеме подробнее мы поговорим в гл. 6.

Критические значения t (подобно критическим значениям F они сведены в таблицу) зависят не только от уровня значимости, но и от числа степеней свободы V. Если объем обеих выборок — n, то число степеней свободы для критерия Стьюдента равно 2(n - 1). Чем больше объем выборок, тем меньше критическое значение t. Это и понятно — чем больше выборка, тем менее выборочные оценки зависят от случайных отклонении и тем точнее представляют исходную совокупность.

Таблица 4.1. Критические значения t (двусторонний вариант)

Уровень значимости а

V

0,5

0,2

0,1

0,05

0,02

0,01

0,005

0,002

0,001

1

1

3,078

6,314

12,706

31,821

63,656

127,321

318,289

636,578

2

0,816

1,886

2,92

4,303

6,965

9,925

14,089

22,328

31,6

3

0,765

1,638

2,353

3,182

4,541

5,841

7,453

10,214

12,924

4

0,741

1,533

2,132

2,776

3,747

4,604

5,598

7,173

8,61

5

0,727

1,476

2,015

2,571

3,365

4,032

4,773

5,894

6,869

6

0,718

1,44

1,943

2,447

3,143

3,707

4,317

5,208

5,959

7

0,711

1,415

1,895

2,365

2,998

3,499

4,029

4,785

5,408

8

0,706

1,397

1,86

2,306

2,896

3,355

3,833

4,501

5,041

9

0,703

1,383

1,833

2,262

2,821

3,25

3,69

4,297

4,781

10

0,7

1,372

1,812

2,228

2,764

3,169

3,581

4,144

4,587

11

0,697

1,363

1,796

2,201

2,718

3,106

3,497

4,025

4,437

12

0,695

1,356

1,782

2,179

2,681

3,055

3,428

3,93

4,318

13

0,694

1,35

1,771

2,16

2,65

3,012

3,372

3,852

4,221

14

0,692

1,345

1,761

2,145

2,624

2,977

3,326

3,787

4,14

15

0,691

1,341

1,753

2,131

2,602

2,947

3,286

3,733

4,073

16

0,69

1,337

1,746

2,12

2,583

2,921

3,252

3,686

4,015

17

0,689

1,333

1,74

2,11

2,567

2,898

3,222

3,646

3,965

18

0,688

1,33

1,734

2,101

2,552

2,878

3,197

3,61

3,922

19

0,688

1,328

1,729

2,093

2,539

2,861

3,174

3,579

3,883

20

0,687

1,325

1,725

2,086

2,528

2,845

3,153

3,552

3,85

21

0,686

1,323

1,721

2,08

2,518

2,831

3,135

3,527

3,819

22

0,686

1,321

1,717

2,074

2,508

2,819

3,119

3,505

3,792

23

0,685

1,319

1,714

2,069

2,5

2,807

3,104

3,485

3,768

24

0,685

1,318

1,711

2,064

2,492

2,797

3,091

3,467

3,745

25

0,684

1,316

1,708

2,06

2,485

2,787

3,078

3,45

3,725

26

0,684

1,315

1,706

2,056

2,479

2,779

3,067

3,435

3,707

27

0,684

1,314

1,703

2,052

2,473

2,771

3,057

3,421

3,689

28

0,683

1,313

1,701

2,048

2,467

2,763

3,047

3,408

3,674

29

0,683

1,311

1,699

2,045

2,462

2,756

3,038

3,396

3,66

30

0,683

1,31

1,697

2,042

2,457

2,75

3,03

3,385

3,646

31

0,682

1,309

1,696

2,04

2,453

2,744

3,022

3,375

3,633

32

0,682

1,309

1,694

2,037

2,449

2,738

3,015

3,365

3,622

33

0,682

1,308

1,692

2,035

2,445

2,733

3,008

3,356

3,611

34

0,682

1,307

1,691

2,032

2,441

2,728

3,002

3,348

3,601

35

0,682

1,306

1,69

2,03

2,438

2,724

2,996

3,34

3,591

36

0,681

1,306

1,688

2,028

2,434

2,719

2,99

3,333

3,582

37

0,681

1,305

1,687

2,026

2,431

2,715

2,985

3,326

3,574

38

0,681

1,304

1,686

2,024

2,429

2,712

2,98

3,319

3,566

39

0,681

1,304

1,685

2,023

2,426

2,708

2,976

3,313

3,558

40

0,681

1,303

1,684

2,021

2,423

2,704

2,971

3,307

3,551

Таблица 4.1. Окончание

Уровень значимости а

V

0,5

0,2

0,1

0,05

0,02

0,01

0,005

0,002

0,001

42

0,68

1,302

1,682

2,018

2,418

2,698

2,963

3,296

3,538

44

0,68

1,301

1,68

2,015

2,414

2,692

2,956

3,286

3,526

46

0,68

1,3

1,679

2,013

2,41

2,687

2,949

3,277

3,515

48

0,68

1,299

1,677

2,011

2,407

2,682

2,943

3,269

3,505

50

0,679

1,299

1,676

2,009

2,403

2,678

2,937

3,261

3,496

52

0,679

1,298

1,675

2,007

2,4

2,674

2,932

3,255

3,488

54

0,679

1,297

1,674

2,005

2,397

2,67

2,927

3,248

3,48

56

0,679

1,297

1,673

2,003

2,395

2,667

2,923

3,242

3,473

58

0,679

1,296

1,672

2,002

2,392

2,663

2,918

3,237

3,466

60

0,679

1,296

1,671

2

2,39

2,66

2,915

3,232

3,46

62

0,678

1,295

1,67

1,999

2,388

2,657

2,911

3,227

3,454

64

0,678

1,295

1,669

1,998

2,386

2,655

2,908

3,223

3,449

66

0,678

1,295

1,668

1,997

2,384

2,652

2,904

3,218

3,444

68

0,678

1,294

1,668

1,995

2,382

2,65

2,902

3,214

3,439

70

0,678

1,294

1,667

1,994

2,381

2,648

2,899

3,211

3,435

72

0,678

1,293

1,666

1,993

2,379

2,646

2,896

3,207

3,431

74

0,678

1,293

1,666

1,993

2,378

2,644

2,894

3,204

3,427

76

0,678

1,293

1,665

1,992

2,376

2,642

2,891

3,201

3,423

78

0,678

1,292

1,665

1,991

2,375

2,64

2,889

3,198

3,42

80

0,678

1,292

1,664

1,99

2,374

2,639

2,887

3,195

3,416

90

0,677

1,291

1,662

1,987

2,368

2,632

2,878

3,183

3,402

100

0,677

1,29

1,66

1,984

2,364

2,626

2,871

3,174

3,39

120

0,677

1,289

1,658

1,98

2,358

2,617

2,86

3,16

3,373

140

0,676

1,288

1,656

1,977

2,353

2,611

2,852

3,149

3,361

160

0,676

1,287

1,654

1,975

2,35

2,607

2,847

3,142

3,352

180

0,676

1,286

1,653

1,973

2,347

2,603

2,842

3,136

3,345

200

0,676

1,286

1,653

1,972

2,345

2,601

2,838

3,131

3,34

0,675

1,282

1,645

1,96

2,327

2,576

2,808

3,091

3,291

КРИТЕРИЙ НЬЮМЕНА-КЕЙЛСА**

При большом числе сравнении поправка Бонферрони делает критерии Стьюдента излишне жестким. Более изощренный критерий Ньюмена-Кейлса дает более точную оценку вероятности о!; чувствительность его выше, чем критерия Стьюдента с поправкой. Бонферрони.

Сначала нужно с помощью дисперсионного анализа проверить нулевую гипотезу о равенстве всех средних. Если она отвергается, все средние упорядочивают по возрастанию и сравнивают попарно, каждый раз вычисляя значение критерия Ньюмена-Кейлса:

где XA и XB — сравниваемые средние, 5в2ну — внутригрупповая дисперсия, а пА и nB численность групп.

Вычисленное значение q сравнивается с критическим значением (табл. 4.3). Критическое значение зависит от а' (вероятность ошибочно обнаружить различия хотя бы в одной из всех сравниваемых пар, то есть истинный уровень значимости) числа степеней свободы v = N - m (где N - сумма численностей всех групп, m

  1.  число групп) и величины l, которая называется интервалом сравнения. Интервал сравнения определятся так. Если сравниваются средние стоящие соответственно наj-м и i месте в упорядоченном ряду, то интервал сравнения l = j - i + 1. Например, при сравнении 4-го и 1-го членов этого ряда l = 4 - 1 + 1 = 4, при сравнении 2-го и 1-го l = 2 - 1 + 1 = 2.

Результат применения критерия Ньюмена-Кейлса зависит от очередности сравнений, поэтому их следует проводить в определенном порядке. Этот порядок задается двумя правилами.

  1.  Если мы расположили средние от меньшего к большему (от 1 до m), то сначала нужно сравнить наибольшее с наименьшим, то есть m-ое с 1-ым, затем m-ое со 2-ым, 3-м и так далее вплоть до m - 1-го. Затем предпоследнее (m - 1-е) тем же порядком сравниваем с 1-м, 2-м и так далее до m - 2-го. Продолжаем эти «стягивающие сравнения» пока не переберем все пары. Например, в случае 4 групп порядок сравнений такой: 4 - 1, 4 - 2,
  2.  - 3, 3 - 1, 3 - 2, 2 - 1.
  3.  Перебирать все пары впрочем, приходится не всегда. Если какие-либо средние не различаются, то все средние лежащие между ними тоже не различаются. Например, если не выявлено различий между 3-м и 1-м средним, не нужно сравнивать ни 3-е со 2-м, ни 2-е с 1-м.

Бег и менструации. Продолжение анализа

Воспользуемся критерием Ньюмена-Кейлса для анализа связи частоты менструации с занятиями физкультурой и спортом. Среднегодовое число менструаций в контрольной группе составило

  1.  у физкультурниц — 10,1 и у спортсменок 9,1. Упорядочим эти средние по возрастанию 9,1, 10,1, 11,5 (спортсменки физкультурницы контроль) и обозначим их X1, X2, X3 соответственно. Оценка внутригрупповой дисперсии = 3,95, число степень

Таблица 4.3А. Критические значения q для а' = 0,05

v

2

3

4

5

6

7

8

9

10

1

17,97

26,98

32,82

37,08

40,41

43,12

45,4

47,36

49,07

2

6,085

8,331

9,798

10,88

11,74

12,44

13,03

13,54

13,99

3

4,501

5,91

6,825

7,502

8,037

8,478

8,853

9,177

9,462

4

3,927

5,04

5,757

6,287

6,707

7,053

7,347

7,602

7,826

5

3,635

4,602

5,218

5,673

6,033

6,33

6,582

6,802

6,995

6

3,461

4,339

4,896

5,305

5,628

5,895

6,122

6,319

6,493

7

3,344

4,165

4,681

5,06

5,359

5,606

5,815

5,998

6,158

8

3,261

4,041

4,529

4,886

5,167

5,399

5,597

5,767

5,918

9

3,199

3,949

4,415

4,756

5,024

5,244

5,432

5,595

5,739

10

3,151

3,877

4,327

4,654

4,912

5,124

5,305

5,461

5,599

11

3,113

3,82

4,256

4,574

4,823

5,028

5,202

5,353

5,487

12

3,082

3,773

4,199

4,508

4,751

4,95

5,119

5,265

5,395

13

3,055

3,735

4,151

4,453

4,69

4,885

5,049

5,192

5,318

14

3,033

3,702

4,111

4,407

4,639

4,829

4,99

5,131

5,254

15

3,014

3,674

4,076

4,367

4,595

4,782

4,94

5,077

5,198

16

2,998

3,649

4,046

4,333

4,557

4,741

4,897

5,031

5,15

17

2,984

3,628

4,02

4,303

4,524

4,705

4,858

4,991

5,108

18

2,971

3,609

3,997

4,277

4,495

4,673

4,824

4,956

5,071

19

2,96

3,593

3,977

4,253

4,469

4,645

4,794

4,924

5,038

20

2,95

3,578

3,958

4,232

4,445

4,62

4,768

4,896

5,008

24

2,919

3,532

3,901

4,166

4,373

4,541

4,684

4,807

4,915

30

2,888

3,486

3,845

4,102

4,302

4,464

4,602

4,72

4,824

40

2,858

3,442

3,791

4,039

4,232

4,389

4,521

4,635

4,735

60

2,829

3,399

3,737

3,977

4,163

4,314

4,441

4,55

4,646

120

2,8

3,356

3,685

3,917

4,096

4,241

4,363

4,468

4,56

2,772

3,314

3,633

3,858

4,03

4,17

4,286

4,387

4,474

ней свободы n = 75, численность каждой группы 26 человек. Теперь мы можем воспользоваться критерием Ньюмена—Кейлса. Сравним Х3 и X1. Имеем:

Интервал сравнения в данном случае l = 3 - 1 + 1 = 3. По таблице 4 .ЗА находим, что для уровня значимости а' = 0,05 числа степеней свободы v = 75 и интервала сравнения l=3 критическое значение q равно 3,385, то есть меньше чем поучилось у нас. Следовательно, различие статистически значимо.

Интервал сравненияl

V

2

3

4

5

6

7

8

9

10

1

90,03

135

164,3

185,6

202,2

215,8

227,2

237

245,6

2

14,04

19,02

22,29

24,72

26,63

28,2

29,53

30,68

31,69

3

8,261

10,62

12,17

13,33

14,24

15

15,64

16,2

16,69

4

6,512

8,12

9,173

9,958

10,58

11,1

11,55

11,93

12,27

5

5,702

6,976

7,804

8,421

8,913

9,321

9,669

9,972

10,24

6

5,243

6,331

7,033

7,556

7,973

8,318

8,613

8,869

9,097

7

4,949

5,919

6,543

7,005

7,373

7,679

7,939

8,166

8,368

8

4,746

5,635

6,204

6,625

6,96

7,237

7,474

7,681

7,863

9

4,596

5,428

5,957

6,348

6,658

6,915

7,134

7,325

7,495

10

4,482

5,27

5,769

6,136

6,428

6,669

6,875

7,055

7,213

11

4,392

5,146

5,621

5,97

6,247

6,476

6,672

6,842

6,992

12

4,32

5,046

5,502

5,836

6,101

6,321

6,507

6,67

6,814

13

4,26

4,964

5,404

5,727

5,981

6,192

6,372

6,528

6,667

14

4,21

4,895

5,322

5,634

5,881

6,085

6,258

6,409

6,543

15

4,168

4,836

5,252

5,556

5,796

5,994

6,162

6,309

6,439

16

4,131

4,786

5,192

5,489

5,722

5,915

6,079

6,222

6,349

17

4,099

4,742

5,14

5,43

5,659

5,847

6,007

6,147

6,27

18

4,071

4,703

5,094

5,379

5,603

5,788

5,944

6,081

6,201

19

4,046

4,67

5,054

5,334

5,554

5,735

5,889

6,022

6,141

20

4,024

4,639

5,018

5,294

5,51

5,688

5,839

5,97

6,087

24

3,956

4,546

4,907

5,168

5,374

5,542

5,685

5,809

5,919

30

3,889

4,455

4,799

5,048

5,242

5,401

5,536

5,653

5,756

40

3,825

4,367

4,696

4,931

5,114

5,265

5,392

5,502

5,559

60

3,762

4,282

4,595

4,818

4,991

5,133

5,253

5,356

5,447

120

3,702

4,2

4,497

4,709

4,872

5,005

5,118

5,214

5,299

3,643

4,12

4,403

4,603

4,757

4,882

4,987

5,078

5,157

Величины а' и V те же, что и раньше, но теперь l = 3 - 2 + 1 = 2. По таблице 4.3А находим критическое значение q = 2,822. Полученное нами значение снова превосходит критическое. Различие статистически значимо.

Для Х2 и Х1 имеем:

Величины а', V и l = 2 - 1 + 1 = 2 те же, что и в предыдущем сравнении, соответственно то же и критическое значение. Оно больше вычисленного, следовательно, различие статистически не значимо.

В данном случае вывод не отличается от полученного при применении критерия Стьюдента с поправкой Бонферрони.

КРИТЕРИИ ТЬЮКИ

Критерии Тьюки совпадает с критерием Ньюмена-Кейлса во всем кроме способа определения критического значения. В критерии Ньюмена-Кейлса критическое значение q зависит от интервала сравнения l. В критерии Тьюки при всех сравнениях вместо l берут число групп т, таким образом, критическое значение q все время одно и то же. Критерий Ньюмена-Кейлса был разработан как усовершенствование критерия Тьюки.

Применяя критерии Тьюки к только что рассмотренной задаче о влиянии бега на частоту менструации нужно было бы приравнять l к числу групп т = 3. Соответствующее критическое значение равно 3,385 и неизменно при всех сравнениях. В нашем примере при двух последних сравнениях критические значения по Тьюки будут больше чем по Ньюмену-Кейлсу. Однако в данном случае результат применения обоих критериев один и тот же. Разумеется, так будет не всегда. Поскольку в критерии Тьюки при всех сравнениях используется максимальное критическое значение q, различия будут выявляться реже, чем при использовании критерия Ньюмена-Кейлса.

Критерий Тьюки слишком жесток и отвергает существование различий чаще, чем нужно, а критерий Ньюмена-Кейлса напротив слишком мягок. В общем, выбор критерия определяется скорее психологическим фактором, чего больше боится исследователь найти отличия там, где их нет или пропустить их там, где они есть. Автор предпочитает критерий Ньюмена-Кейлса.

Лекция 5

Множественные сравнения с контрольной группой

Иногда задача заключается в том, чтобы сравнить несколько групп с единственной — контрольной. Конечно, можно было бы использовать любой из описанных методов множественного сравнения (критерий Стьюдента с поправкой Бонферрони, Ньюмена—Кейлса или Тьюки): попарно сравнить все группы, а затем отобрать те сравнения, в которых участвовала контрольная группа. Однако в любом случае (особенно при применении поправки Бонферрони) из-за большого числа лишних сравнений критическое значение окажется неоправданно высоким. Иными словами мы слишком часто будем пропускать реально существующие различия. Преодолеть эту трудность позволяют специальные методы сравнения, из которых мы разберем два. Это еще одна модификация критерия Стьюдента с поправкой Бонферрони и критерии Даннета. Как и другие методы множественного сравнения их следует применять только после того, как с помощью дисперсионного анализа отвергнута нулевая гипотеза о равенстве всех средних.

Поправка Бонферрони

Применить поправку Бонферрони к сравнению нескольких групп с одной контрольной очень просто. Ход вычислений такой же что и при применении поправки Бонферрони в общем случае. Надо только учесть, что число сравнений k составляет теперь m - 1 и соответственно рассчитать уровень значимости в каждом из сравнений а = о!/к. Применим этот метод к исследованию частоты менструаций. Сравним спортсменок и физкультурниц с контрольной группой. Число сравнений к - 2 (а не 3 как при всех возможных сравнениях). Чтобы полная вероятность ошибочно обнаружить различия не превышала 0,05 при каждом сравнении, уровень значимости должен быть 0,05/2 = 0,025 (вместо 0,05/3 = 0,017). Число степеней свободы — 75; критическое значение t = 2,31 (при всех возможных сравнениях оно бы составило 2,45). Величину l для сравнения физкультурниц и спортсменок с контролем мы уже рассчитывали — 2,54 и 4,35 соответственно. Таким образом, и спортсменки и физкультурницы статистически значимо отличаются от контрольной группы. В данном случае вывод получился тот же, что и при применении поправки Бонферрони в общем случае. Ясно, однако, что за счет снижения критического уровня t чувствительность метода повышается. Обратите внимание, что в данном случае мы не делаем никакого заключения о различии спортсменок и физкультурниц

Интервал сравнения /

V

2

3

4

5

6

7

8

9

10

11

12

13

16

21

5

2,57

3,03

3,29

3,48

3,62

3,73

3,82

3,9

3,97

4,03

4,09

4,14

4,26

4,42

6

2,45

2,86

3,1

3,26

3,39

3,49

3,57

3,64

3,71

3,76

3,81

3,86

3,97

4,11

7

2,36

2,75

2,97

3,12

3,24

3,33

3,41

3,47

3,53

3,58

3,63

3,67

3,78

3,91

8

2,31

2,67

2,88

3,02

3,13

3,22

3,29

3,35

3,41

3,46

3,5

3,54

3,64

3,76

9

2,26

2,61

2,81

2,95

3,05

3,14

3,2

3,26

3,32

3,36

3,4

3,44

3,53

3,65

10

2,23

2,57

2,76

2,89

2,99

3,07

3,14

3,19

3,24

3,29

3,33

3,36

3,45

3,57

11

2,2

2,53

2,72

2,84

2,94

3,02

3,08

3,14

3,19

3,23

3,27

3,3

3,39

3,5

12

2,18

2,5

2,68

2,81

2,9

2,98

3,04

3,09

3,14

3,18

3,22

3,25

3,34

3,45

13

2,16

2,48

2,65

2,78

2,87

2,94

3

3,06

3,1

3,14

3,18

3,21

3,29

3,4

14

2,14

2,46

2,63

2,75

2,84

2,91

2,97

3,02

3,07

3,11

3,14

3,18

3,26

3,36

15

2,13

2,44

2,61

2,73

2,82

2,89

2,95

3

3,04

3,08

3,12

3,15

3,23

3,33

16

2,12

2,42

2,59

2,71

2,8

2,87

2,92

2,97

3,02

3,06

3,09

3,12

3,2

3,3

17

2,11

2,41

2,58

2,69

2,78

2,85

2,9

2,95

3

3,03

3,07

3,1

3,18

3,27

18

2,1

2,4

2,56

2,68

2,76

2,83

2,89

2,94

2,98

3,01

3,05

3,08

3,16

3,25

19

2,09

2,39

2,55

2,66

2,75

2,81

2,87

2,92

2,96

3

3,03

3,06

3,14

3,23

20

2,09

2,38

2,54

2,65

2,73

2,8

2,86

2,9

2,95

2,98

3,02

3,05

3,12

3,22

24

2,06

2,35

2,51

2,61

2,7

2,76

2,81

2,86

2,9

2,94

2,97

3

3,07

3,16

30

2,04

2,32

2,47

2,58

2,66

2,72

2,77

2,82

2,86

2,89

2,92

2,95

3,02

3,11

40

2,02

2,29

2,44

2,54

2,62

2,68

2,73

2,77

2,81

2,85

2,87

2,9

2,97

3,06

60

2

2,27

2,41

2,51

2,58

2,64

2,69

2,73

2,77

2,8

2,83

2,86

2,92

3

120

1,98

2,24

2,38

2,47

2,55

2,6

2,65

2,69

2,73

2,76

2,79

2,81

2,87

2,95

СЮ

1,96

2,21

2,35

2,44

2,51

2,57

2,61

2,65

2,69

2,72

2,74

2,77

2,83

2,91

Таблица 5.1А. Критические значения q' для а' = 0,05

Таблица 5.1. Б Критические значения q' для а' = 0,01

V

2

3

4

5

6

7

8

9

10

11

12

13

16

21

5

4,03

4,63

4,98

5,22

5,41

5,56

5,69

5,8

5,89

5,98

6,05

6,12

6,3

6,52

6

3,71

4,21

4,51

4,71

4,87

5

5,1

5,2

5,28

5,35

5,41

5,47

5,62

5,81

7

3,5

3,95

4,21

4,39

4,53

4,64

4,74

4,82

4,89

4,95

5,01

5,06

5,19

5,36

8

3,36

3,77

4

4,17

4,29

4,4

4,48

4,56

4,62

4,68

4,73

4,78

4,9

5,05

9

3,25

3,63

3,85

4,01

4,12

4,22

4,3

4,37

4,43

4,48

4,53

4,57

4,68

4,82

10

3,17

3,53

3,74

3,88

3,99

4,08

4,16

4,22

4,28

4,33

4,37

4,42

4,52

4,65

11

3,11

3,45

3,65

3,79

3,89

3,98

4,05

4,11

4,16

4,21

4,25

4,29

4,3

4,52

12

3,05

3,39

3,58

3,71

3,81

3,89

3,96

4,02

4,07

4,12

4,16

4,19

4,29

4,41

13

3,01

3,33

3,52

3,65

3,74

3,82

3,89

3,94

3,99

4,04

4,08

4,11

4,2

4,32

14

2,98

3,29

3,47

3,59

3,69

3,76

3,83

3,88

3,93

3,97

4,01

4,05

4,13

4,24

15

2,95

3,25

3,43

3,55

3,64

3,71

3,78

3,83

3,88

3,92

3,95

3,99

4,07

4,18

16

2,92

3,22

3,39

3,51

3,6

3,67

3,73

3,78

3,83

3,87

3,91

3,94

4,02

4,13

17

2,9

3,19

3,36

3,47

3,56

3,63

3,69

3,74

3,79

3,83

3,86

3,9

3,98

4,08

18

2,88

3,17

3,33

3,44

3,53

3,6

3,66

3,71

3,75

3,79

3,83

3,86

3,94

4,04

19

2,86

3,15

3,31

3,42

3,5

3,57

3,63

3,68

3,72

3,76

3,79

3,83

3,9

4

20

2,85

3,13

3,29

3,4

3,48

3,55

3,6

3,65

3,69

3,73

3,77

3,8

3,87

3,97

24

2,8

3,07

3,22

3,32

3,4

3,47

3,52

3,57

3,61

3,64

3,68

3,7

3,78

3,87

30

2,75

3,01

3,15

3,25

3,33

3,39

3,44

3,49

3,52

3,56

3,59

3,62

3,69

3,78

40

2,7

2,95

3,09

3,19

3,26

3,32

3,37

3,41

3,44

3,48

3,51

3,53

3,6

3,68

60

2,66

2,9

3,03

3,12

3,19

3,25

3,29

3,33

3,37

3,4

3,42

3,45

3,51

3,59

120

2,62

2,85

2,97

3,06

3,12

3,18

3,22

3,26

3,29

3,32

3,35

3,37

3,43

3,51

©o

2,58

2,79

2,92

3

3,06

3,11

3,15

3,19

3,22

3,25

3,27

3,29

3,35

2,42

m - 1 и соответственно рассчитать уровень значимости в каждом из сравнений а = о!/к. Применим этот метод к исследованию частоты менструаций. Сравним спортсменок и физкультурниц с контрольной группой. Число сравнений к - 2 (а не 3 как при всех возможных сравнениях). Чтобы полная вероятность ошибочно обнаружить различия не превышала 0,05 при каждом сравнении, уровень значимости должен быть 0,05/2 = 0,025 (вместо 0,05/3 = 0,017). Число степеней свободы — 75; критическое значение t = 2,31 (при всех возможных сравнениях оно бы составило 2,45). Величину l для сравнения физкультурниц и спортсменок с контролем мы уже рассчитывали — 2,54 и 4,35 соответственно. Таким образом, и спортсменки и физкультурницы статистически значимо отличаются от контрольной группы. В данном случае вывод получился тот же, что и при применении поправки Бонферрони в общем случае. Ясно, однако, что за счет снижения критического уровня t чувствительность метода повышается. Обратите внимание, что в данном случае мы не делаем никакого заключения о различии спортсменок и физкультурниц.

Критерии Даннета

Критерии Даннета — это вариант критерия Ньюмена-Кейлса для сравнения нескольких групп с одной контрольной. Он вычисляется как

Число сравнении равно числу групп не считая контрольной, и существенно меньше числа сравнений в исходном критерии Нью- мена-Кейлса. Соответственно меньше и критические значения (табл. 5.1). Как и в критерии Ньюмена-Кейлса сначала средние значения для всех групп упорядочиваются только теперь — по абсолютной величине их отличия от контрольной группы. Затем контрольную группу сравнивают с остальными начиная с наиболее отличной от контрольной. Если различия с очередной группой не найдены вычисления прекращают. Параметр l постоянен и равен числу групп включая контрольную. Число степеней свободы вычисляют как в критерии Ньюмена-Кейлса: V = N - т.

Применим критерий Даннета к анализу влияния бега на менструации. Сначала сравним с контрольной наиболее от нее отличную группу спортсменок:

Общее число средних равно трем, поэтому l=3. Число степеней свободы равно 75. По таблице 5.1 находим критическое значение для уровня значимости 0,05. Оно равно 2,28. Вычисленное значение больше критического. Тем самым различие между спортсменками и контрольной группой статистиче ски значимо и сравнения можно продолжать.

Теперь сравним с контрольной группу физкультурниц

Критическое значение, q по-прежнему равно 2,28. Вычисленное значение больше. Различие между физкультурницами и контрольной группой статистически значимо.

Критерии Даннета, как вариант критерия Ньюмена-Кейлса более чувствителен, чем критерий Стьюдента с поправкой Бон- феррони, особенно при большом числе групп. Если бы групп было больше, мы убедились бы, что критерии Ньюмена-Кейлса обнаруживает те различия, которые упускает критерии Стьюдента с поправкой Бонферрони завышающей критические значения t.

ЧТО ОЗНАЧАЕТ Р

Поговорим еще раз о вероятности справедливости нулевой гипотезы Р. Понимание смысла Р требует понимания логики проверки статистической гипотезы. Например, исследователь хочет узнать, влияет ли некий препарат на температуру тела. Очевидная схема эксперимента: взять две группы, одной дать препарат другой плацебо измерить температуру и вычислить для обеих групп среднюю температуру и стандартное отклонение. Средние температуры вряд ли совпадут, даже если препарат не обладает никаким действием. Поэтому естественен вопрос сколь вероятно, что наблюдаемое различие случайно?

Для ответа на этот вопрос, прежде всего, нужно выразить различия одним числом — критерием значимости. Со многими из них мы уже встречались — это критерии F, t, q и q'. Значение критерия тем больше, чем больше различия. Если препарат не оказывает действия, то величина критерия будет мала, если оказывает — велика. Но что значит «мала» и что значит «велика»?

Чтобы разграничить «большие» и «малые» значения критерия, строится предположение, что препарат не оказывает влияния на температуру. Это так называемая нулевая гипотеза. Если нулевая гипотеза верна, то обе группы можно считать просто случайными выборками из одной и той же совокупности. Далее эксперимент мысленно проводится на всех возможных выборках, и для каждой пары вычисляется значение критерия. Чаше всего оно будет небольшим, но какая-то часть выборок даст весьма высокие значения. При этом мы сможем указать такое число (критическое значение), выше которого значение критерия, оказывается, скажем, в 5% случаев.

Теперь вернемся к препарату и вычислим значение критерия. Если оно превышает критическое значение, то мы можем утверждать следующее, если бы нулевая гипотеза была справедлива, то вероятность получить наблюдаемые различия была бы меньше 5%. В принятой системе обозначений это записывается как Р < 0,05. Отсюда мы заключаем, что гипотеза об отсутствии влияния препарата на температуру вряд ли справедлива, то есть различия статистически значимы (при 5% уровне значимости). Разумеется, этот вывод по сути своей носит вероятностный характер. Не исключено, что мы ошибочно признаем неэффективный препарат эффективным, то есть найдем различия там, где их нет. Однако мы можем утверждать, что вероятность подобной ошибки не превышает 5%.

Дадим определение Р.

Р есть вероятность того, что значение критерия окажется не меньше критического значения при условии справедливости нулевой гипотезы об отсутствии различий между группами.

Определение можно сформулировать и по-другому.

Р есть вероятность ошибочно отвергнуть нулевую гипотезу об отсутствии различий.

Упрощая, можно сказать, что Рэто вероятность справедливости нулевой гипотезы. Часто говорят также, что Р — это вероятность ошибки. В общем, и это верно, однако несколько неточно. Дело в том, что существует два рода ошибок. Ошибка I рода — это ошибочное заключение о существовании различий, которых в действительности нет. Вероятность именно этой оценивает P. Возможна и противоположная ошибка — принять неверную нулевую гипотезу то есть не найти действительно существующее различие. Это гак называемая ошибка II рода. О вероятности этой ошибки P ничего не говорит, мы обсудим ее в гл. 6.

ЗАДАЧИ

  1.  Конахан и соавт. определили среднее артериальное давление и общее периферическое сосудистое сопротивление при операциях на открытом сердце с галотановой (9 больных) и мор- финовой (16 больных) анестезией. Результаты приведены в табл. 4.2. Можно ли утверждать, что в группах галотановой и морфи- новой анестезии эти гемодинамические показатели различаются статистически значимо?

Кокаин чрезвычайно вреден для сердца, он может вызвать инфаркт миокарда даже у молодых людей без атеросклероза. Кокаин сужает коронарные сосуды что приводит к уменьшению притока крови к миокарду кроме того, он ухудшает насосную функцию сердца. Нифедипин (препарат из группы антагонистов кальция) обладает способностью расширять сосуды, его применяют при ишемической болезни сердца. Ш. Хейл и соавт. (S. L. Hale, К. J. Alker, S. H. Rezkalla et al. Nifedipine protects the heart from the acute deleterious effects of cocaine if administered before but not after cocaine. Circulation, 83:1437—1443, 1991) предположили, что нифедипин можно использовать и при поражении сердца, вызванном кокаином. Собакам вводили кокаин, а затем нифеди- пин либо физиологический раствор. Показателем насосной функции сердца служило среднее артериальное давление. Были получены следующие данные.

Среднее артериальное давление после приема кокаина, мм рт. ст.

Плацебо

Нифедипин

156

73

171

81

133

103

102

88

129

130

150

106

120

106

110

111

112

122

130

108

105

99

Влияет ли нифедипин на среднее артериальное давление пос-

ле приема кокаина?

4.3. Ш. Хейл и соавт. измеряли также диаметр коронарных

артерии после приема нифедипина и плацебо. Позволяют ли при-

водимые ниже данные утверждать, что нифедипин влияет на

диаметр коронарных артерий?

Диаметр коронарной артерии, мм

Плацебо

Нифедипин

2,5

2,5

2,2

1,7

2,6

1,5

2

2,5

2,1

1,4

1,8

1,9

2,4

2,3

2,3

2

2,7

2,6

2,7

2,3

1,9

2,2

  1.  Решите задачи 3.1 и 3.5 используя критерий Стьюдента.
  2.  В задаче 3.2 приведены данные, собранные Уайтом и Фре- бом о проходимости дыхательных путей у некурящих работающих в помещении, где не курят у пассивных курильщиков и у курильщиков выкуривающих различное число сигарет. Дисперсионный анализ обнаружил, что приведенные данные не согласуются с гипотезой о том, что проходимость дыхательных путей во всех группах одинакова. Выделите группы с одинаковой функцией легких. Что означает полученный результат, с точки зрения первоначально поставленного вопроса влияет ли пассивное курение на функцию легких?
  3.  Используя данные задачи 3.2, оцените статистическую значимость различий некурящих работающих в помещении, где не курят со всеми остальными группами. Воспользуйтесь критерием Даннета.
  4.  Решив задачу 3.3, мы пришли к заключению, что уровень холестерина липопротеидов высокой плотности (ХЛПВП) у бегунов марафонцев бегунов трусцой и лиц, не занимающихся спортом неодинаков. Пользуясь критерием Стьюдента с поправкой Бонферрони, сравните эти группы попарно.
  5.  Используя данные задачи 3.3 и рассматривая группу не занимающихся спортом как контрольную сравните ее с остальными двумя группами. Используйте поправку Бонферрони.
  6.  Пользуясь данными задачи 3.4, найдите группы с близкими показателями антибактериальной защиты.
  7.  По данным задачи 3.7 опишите различия групп. Используйте поправку Бонферрони.
  8.  Решите снова задачу 4.10, пользуясь критерием Нью- мена—Кейлса. Сравните результат с решением задачи 4.10 и объясните различия, если они есть.
  9.  В задаче 3.6 мы установили, что существуют различия в степени опустошенности у медицинских сестер работающих с больными разной тяжести. В чем заключаются эти различия?

Лекция 6

Непараметрические критерии

Для определения эффективности одного или нескольких методов лечения используется дисперсионный анализ, в частности критерий Стьюдента. Эти критерии основаны на допущении, что наблюдаемый признак подчиняется нормальному распределению. Более того, для применимости этих методов требуется, чтобы сравниваемые совокупности имели одинаковые дисперсии. Различными могут быть только значения средних. По их различию и судят о различии совокупностей. Применяя тот или иной метод, нужно быть уверенным, что допущения, на которых он основан, выполняются хотя бы приближенно. Иначе велик риск, что, выполнив, казалось бы, правильную последовательность действий, мы придем к ошибочным выводам.

Условия применимости дисперсионного анализа и критерия Стьюдента выполняются часто, но не всегда. В одних случаях слишком велика разница дисперсий, в других распределение далеко от нормального. Наконец, измеряемый признак может оказаться нечисловым или «не вполне числовым». В такой ситуации следует воспользоваться непараметрическими методами. Один из таких критериев знаком нам по гл. 5 — это критерий %2, другой пример — критерий Мак-Нимара (гл. 9). Теперь мы займемся непараметрическими критериями, основанными на рангах.

Ранее мы уже встречались с порядковыми признаками. Природа порядковых признаков такова, что о двух значениях можно сказать лишь, какое больше или меньше, но в принципе нельзя

  1.  на сколько или во сколько раз. (Любой количественный признак можно рассматривать как порядковый, но не наоборот.) Первое, что следует сделать при анализе таких признаков, это перейти к их рангам — номерам, под которыми будут стоять исходные данные, если выстроить их по возрастанию. Критерии, основанные на рангах, не нуждаются в предположениях о типе распределения. Единственное требование состоит в том, чтобы тип распределения в сравниваемых совокупностях был одинаковым. При этом не нужно знать, что это за распределение и каковы его параметры.

Мы начнем с аналогов критерия Стьюдента — критерия суммы рангов Манна—Уитни и критерия Уилкоксона. Затем будет изложен критерий Крускала—Уоллиса — аналог дисперсионного анализа и критерий Фридмана — аналог дисперсионного анализа повторных измерений.

ПАРАМЕТРИЧЕСКИЕ И НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ. КАКОЙ ВЫБРАТЬ?

Математическая модель, которая используется при построении дисперсионного анализа, предполагает нормальное распределение. Вспомним жителей маленького городка, которых мучили диетами, якобы влияющими на сердечный выброс (гл. 3), и мужественных добровольцев, принимавших совершенно неэффективный диуретик (гл. 4), — все это были выборки из нормально распределенной совокупности. Поэтому критические значения F и t, которые мы нашли в этих главах, дадут правильное представление о статистической значимости различий только в случае, если выборки извлечены именно из такой совокупности.

Параметрические методы, как видно уже из их названия, опе рируют параметрами распределения. В частности, дисперсионный анализ и его частный случай, критерий Стьюдента, основаны на сравнении средних и дисперсий. Но эти параметры правильно описывают только нормально распределенную совокупность. Если распределение далеко от нормального, среднее и дисперсия дадут о нем неверное представление. Столь же неверными окажутся и критерии, основанные на этих параметрах.

В гл. 2 мы изучали рост юпитериан (см. рис. 2.3А). Средний рост составил 37,6см, а стандартное отклонение 4,5см. На рис. 2.3Б изображено, как выглядело бы нормальное распределение с такими параметрами. Оно мало похоже на распределение, наблюдаемое в действительности. Если бы распределение роста юпи- териан было нормальным, рост большинства из них оказался бы в пределах 37—38 см и рост практически всех — в интервале от 26 до 49 см. Однако картина иная. Рост большинства юпитериан группируется вокруг 35 см, то есть ниже среднего. При этом интервал, охватывающий все значения роста (от 31 до 52 см), смещен вправо, то есть распределение асимметрично.

Непараметрические методы, которые мы рассмотрим в этой главе, заменяют реальные значения признака рангами. При этом мы сохраняем большую часть информации о распределении, но избавляемся от необходимости знать, что это за распределение. Нас не интересуют более параметры распределения, отпадает и необходимость равенства дисперсий. Остается в силе только предположение, что тип распределения во всех случаях одинаков*.

Если выполняется условие нормальности распределения, параметрические критерии обеспечивают наибольшую чувствительность. Если же это условие не выполняется хотя бы приблизительно, их чувствительность существенно снижается и непараметрические критерии дают больше шансов выявить реально существующие различия. Что будет, если применить непараметрический критерий при нормальном распределении? Чувствительность критериев, которые мы рассмотрим в этой главе, составляет в этом случае примерно 95% от чувствительности их пара метрических аналогов (это обстоятельство можно использовать для оценки чувствительности непараметрических критериев и определения необходимого числа наблюдений).

Как выяснить, согласуются ли данные с предположением о нормальности распределения? Простейший способ состоит в том, чтобы нанести их на график, подобный тем, которые мы рисовали, изучая рост инопланетян в гл. 2. Нарисовав график, прикиньте, похож ли он на нормальное распределение. Та ли у него форма, достаточно ли он симметричен относительно среднего, покрывает ли интервал, равный плюс-минус двум стандартным отклонениям от среднего, практически все наблюдения? Сравните графики для разных групп. Близок ли разброс значений? Ответив на все вопросы утвердительно, воспользуйтесь параметрическим критерием. В противном случае следует использовать непараметрический критерий. Изложенный нехитрый прием почти наверняка поможет правильно выбрать тип критерия.

Для тех, кто не привык полагаться на зрительные впечатления, укажем еще два способа, иногда более точные и всегда более трудоемкие. Первый основан на использовании нормальной вероятностной бумаги. Вы легко поймете, о чем идет речь, если когда-нибудь видели логарифмическую бумагу. Вся разница в том, что на логарифмической бумаге вертикальная ось програ- дуиро-вана так, чтобы графиком экспоненты была прямая, а на нормальной вероятностной бумаге прямой окажется функция нормального распределения. На такую бумагу определенным образом наносят имеющиеся значения. Если они расположатся почти на одной прямой, можно применять параметрические методы. Второй способ опирается на критерий %2. Он позволяет сравнить реальные данные с теми, которые дало бы нормальное распределение, имеющее то же среднее и дисперсию. Мы не будем останавливаться на этих процедурах*, поскольку их выводы наверняка совпадут с теми, что даст простая прикидка. Как правило, основная трудность состоит не в том, какой из перечисленных способов выбрать, а в том, что объем выборки слишком мал, чтобы применить любой из них. Убедительные свидетельства в пользу гипотезы нормальности или против нее встречаются редко. Гораздо чаще все решают интуиция, привычка и вкус исследователя. Существуют две точки зрения на то, как следует поступать в таких случаях. Согласно одной, в отсутствие очевидных противоречий между данными и гипотезой их нормального распределения следует применить параметрический метод. Согласно другой, если нет явного подтверждения гипотезы нормальности распределения, лучше воспользоваться непараметрическим методом. Сторонники первой точки зрения упирают на то, что параметрические методы более чувствительны и более известны. Приверженцы второй резонно замечают, что исследователь не должен исходить из предположений, которые нельзя проверить, и что, применяя непараметрические критерии, мы почти ничем не рискуем — ведь даже в случае нормального распределения их чувствительность не намного ниже чувствительности параметрических. Ни одна из сторон пока не одержала верх, и похоже, этого не произойдет никогда.

СРАВНЕНИЕ ДВУХ ВЫБОРОК: КРИТЕРИЙ МАННА—УИТНИ

Напомним схему, по которой строились все параметрические методы, будь то критерий Стьюдента, дисперсионный или корреляционный анализ. Из нормально распределенной совокупности мы извлекали все возможные выборки определенного объема и строили распределение значений соответствующего критерия. Теперь, упорядочив значения признака и перейдя от реальных значений к рангам, мы поступим несколько иначе. Мы просто перечислим все возможные варианты упорядочивания двух групп.

Как это сделать, мы покажем на простом примере. Чтобы вариантов упорядочивания было не слишком много, рассмотрим опыт с участием 7 добровольцев. Из них 3 принимают плацебо (контрольная группа), а 4 препарат, предположительно диуретик (экспериментальная группа). В табл. 10.1 приведены данные о суточном диурезе. Против каждого значения диуреза указан

Таблица 10.1. Эксперимент с диуретиком

Плацебо  (контрольная группа)

Препарат  (экспериментальная группа)

Суточный  диурез, мл

Ранг

Суточный диурез, мл

Ранг

1000

1

1400

6

1380

5

1600

7

1200

3

1180

2

Т = 9

1220

4

его ранг — место в общем упорядоченном ряду. Рангом наименьшей величины будет 1; ранг наибольшей величины равен числу наблюдений, то есть 7. Если препарат увеличивает диурез, то ранги в экспериментальной группе должны быть больше, чем в контрольной. Мерой отличия изберем сумму рангов в меньшей из групп и обозначим ее Т. В нашем примере меньшая группа

  1.  контрольная. Соответствующее значение Т равно 9.

Достаточно ли мало значение T, чтобы отклонить гипотезу

  1.  отсутствии действия препарата?

Для ответа на этот вопрос рассмотрим совокупность всех возможных перестановок. Заметьте, после перехода к рангам нам уже не нужно рассматривать сами исходные величины и совокупность их возможных значений. Поэтому наши дальнейшие рассуждения полностью применимы к любым двум группам наблюдений по 3 и 4 наблюдения в каждой.

Итак, нулевая гипотеза — гипотеза об отсутствии влияния препарата на диурез. Если она справедлива, любой ранг может равновероятно оказаться в любой из групп. Чтобы узнать, велика ли вероятность случайно получить перестановку из табл. 10.1, рассмотрим все возможные перестановки. Понятно, что распределить ранги по двум группам — это то же самое, что набрать ранги для одной из групп (оставшиеся автоматически попадут во вторую). Тогда, перечислив все варианты выбора 3 рангов из 7, мы тем самым перечислим все варианты распределения семи рангов по двум группам. Число способов по-разному выбрать 3 ранга из

  1.  равно 35. Все 35 вариантов приведены в табл. 10.2. Крестиком помечены ранги, попадающие в контрольную группу. В правом столбце для каждого из вариантов указана величина T — сумма рангов меньшей (контрольной) группы. Если нанести значения T на график, получится распределение, показанное на рис. 10.1.

Таблица 10.2. Варианты разделения 7 рангов на две группы по 3 и 4 ранга

Ранги

Сумма

1

2

3

4

5

6

7

рангов

X

X

X

6

X

X

X

7

X

X

X

8

X

X

X

9

X

X

X

10

X

X

X

8

X

X

X

9

X

X

X

10

X

X

X

11

X

X

X

10

X

X

X

11

X

X

X

12

X

X

X

12

X

X

X

13

X

X

X

14

X

X

X

9

X

X

X

10

X

X

X

11

X

X

X

12

X

X

X

11

X

X

X

12

X

X

X

13

X

X

X

13

X

X

X

14

X

X

X

15

X

X

X

12

X

X

X

13

X

X

X

14

X

X

X

14

X

X

X

15

X

X

X

16

X

X

X

15

X

X

X

16

X

X

X

17

X

X

X

18

Сумма рангов для меньшей из групп (Т)

Рис. 10.1. 35 возможных сумм рангов для меньшей из групп (см. табл. 10.2).

столбце для каждого из вариантов указана величина T — сумма рангов меньшей (контрольной) группы. Если нанести значения T на график, получится распределение, показанное на рис. 10.1. Если справедлива нулевая гипотеза, то все сочетания рангов равновероятны. Это значит, что если, например, Т = 12 в 5 вариантах из 35, то вероятность случайно получить значение T = 12 равна 5/35. Таким образом, на рис. 10.1 изображено распределение значений T в случае справедливости нулевой гипотезы об отсутствии действия препарата. По форме оно напоминает распределение t (рис. 4.5). Однако есть и отличия. Действительно, распределение t непрерывно. Оно построено по бесконечной совокупности значений, вычисленных для бесконечного числа выборок из бесконечной нормально распределенной совокупности. Напротив, распределение Т конечно и дискретно, то есть имеет ступенчатый вид, принимая значения лишь в конечном числе целочисленных точек.

Глядя на рис. 10.1, легко определить вероятность получить то или иное значение Т при условии справедливости нулевой гипотезы. Например, значения T = 9 и Т = 15 наблюдаются в 3 вариантах, то есть вероятность появления каждой из этих сумм равна 3/15. Вероятность получить значение Т, равное 8 или 16, составляет 2/35 = 0,057. Будем считать эти значения T критическими. В нашем опыте Т = 9, так что нулевую гипотезу отвергнуть мы не можем.

Уровень значимости обычно принимают равным 5% или 1%. Можно ли установить такой уровень в нашем примере? Оказывается, нет. У нас есть всего 13 разных значений Т, поэтому уровень значимости может меняться только скачками. Назвав произвольный уровень значимости а, мы скорее всего обнаружим, что нет такого значения Т, которому бы он соответствовал. В качестве критического берут то значение Т, которому соответ ствует уровень значимости, наиболее близкий к 1 или 5%. В нашем примере ближе всего к 5% находится уровень значимости 5,7%, соответствующий Т = 8.

Критические значения критерия Манна— Уитни приведены в табл. 10.3. Столбец критических значений содержит пары чисел. Различия статистически значимы, если Т не больше первого из них или не меньше второго. Например, когда в одной группе

  1.  человека, а в другой 6, различия статистически значимы, если T < 7 или T > 23.

Изложенный вариант критерия известен как T-критерий Манна—Уитни*. Порядок его вычисления таков.

  1.  Данные обеих групп объединяют и упорядочивают по возрастанию. Ранг 1 присваивают наименьшему из всех значений, ранг 2 — следующему и так далее. Наибольший ранг присваивают самому большому среди значений в обеих группах. Если значения совпадают, им присваивают один и тот же средний ранг (например, если два значения поделили 3-е и 4-е места, обоим присваивают ранг 3,5).
  2.  Для меньшей группы вычисляют Т — сумму рангов ее членов. Если численность групп одинакова, Т можно вычислить для любой из них.
  3.  Полученное значение T сравнивают с критическими значениями. Если Т меньше или равно первому из них либо больше или равно второму, то нулевая гипотеза отвергается (различия статистически значимы).

Что делать, если нужной численности групп в таблице не оказалось? Можно самому построить распределение Т. К сожалению, с ростом численности групп сделать это становится все труднее.

Таблица 10.3. Критические значения критерия (двусторонний вариант) Манна— Уитни

мень-  шей

боль-  шей

Критические  значения

Точное значение а

Критические  значения

Точное значение а

3

4

6

18

0,057

5

6

21

0,036

5

7

20

0,071

6

7

23

0,048

6

24

0,024

7

7

26

0,033

6

27

0,017

7

8

25

0,067

8

8

28

0,042

6

30

0,012

4

4

11

25

0,057

10

26

0,026

5

11

29

0,032

10

30

0,016

5

12

28

0,063

6

12

32

0,038

10

34

0,01

7

13

35

0,042

10

38

0,012

8

14

38

0,048

11

41

0,008

8

12

40

0,016

5

5

17

38

0,032

15

40

0,008

5

18

37

0,056

16

39

0,016

6

19

41

0,052

16

44

0,01

7

20

45

0,048

17

48

0,01

8

21

49

0,045

18

52

0,011

6

6

26

52

0,041

23

55

0,009

6

24

54

0,015

7

28

56

0,051

24

60

0,008

7

25

59

0,014

8

29

61

0,043

25

65

0,008

8

30

60

0,059

26

64

0,013

7

7

37

68

0,053

33

72

0,011

8

39

73

0,054

34

78

0,009

8

8

49

87

0,05

44

92

0,01

Число вариантов равно 184756. Поэтому лучше воспользоваться тем, что при численности групп, большей 8, распределение Т приближается к нормальному со средним

 

и стандартным отклонением

где n и «б — объемы меньшей и большей выборок*. В таком случае величина

имеет стандартное нормальное распределение. Это позволяет сравнить zT с критическими значениями нормального распределения (последняя строка табл. 4.1). Более точный результат обеспечивает поправка Йейтса:

Роды по Лебуайе

В последние десятилетия произошел коренной пересмотр взглядов на родовспоможение. Акушерская революция совершалась под лозунгом «Отец вместо седативных средств». Восторже ствовала точка зрения, согласно которой при нормальных родах следует прибегать к помощи психологических, а не лекарственных средств. Что делать конкретно, мнения расходились. Масла в огонь подлила книга Лебуайе «Рождение без насилия». Французский врач предлагал комплекс мер, призванных свести к минимуму потрясение, которое испытывает новорожденный при появлении на свет. Роды надлежит принимать в тихом затемненном помещении. Сразу после родов ребенка следует уложить на живот матери и не перерезать пуповину, пока та не перестанет пульсировать. Затем, успокаивая младенца легким поглаживанием, нужно поместить его в теплую ванну, чтобы «внушить, что разрыв с организмом матери — не шок, но удовольствие». Лебуайе указывал, что дети, рожденные по его методике, здоровее и радостнее других. Многие врачи считали, что предложенная методика не только противоречит общепринятой практике, но и создает дополнительную опасность для матери и ребенка. Тем не менее у Лебуайе нашлись и сторонники.

Как часто бывает в медицине, отсутствие достоверных данных могло затянуть спор на многие годы. Пока Н. Нелсон и со- авт.* не провели клиническое испытание, материалы ограничивались «клиническим опытом» автора методики.

В эксперименте Нелсон, проведенном в клинике канадского университета Макмастер, участвовали роженицы без показаний к искусственному родоразрешению, срок беременности которых составлял не менее 36 недель и которые были согласны рожать как по обычной методике, так и по Лебуайе. Роженицы были случайным образом разделены на две группы. В контрольной роды проводились по общепринятой методике в нормально освещенном помещении с обычным уровнем шума; после рождения пуповина немедленно перерезалась, ребенка пеленали и отдавали матери. В экспериментальной группе роды принимались по методике Лебуайе. В обеих группах при родах присутствовали мужья, применение обезболивающих средств было ми нимальным. Тем самым, группы различались только в том, в чем методика Лебуайе не совпадает с общепринятой.

То, в какую группу попала роженица, было известно самой роженице и всем, кто присутствовал при родах. На этом этапе эффект плацебо исключить было невозможно. Однако уже на этапе послеродового наблюдения одна из сторон, а именно врачи, которые оценивали состояние ребенка, не знали, по какой методике происходили роды. Таким образом исследование Нелсон было простым слепым: условия знала только одна из сторон, наблюдателю же они были неизвестны.

Для оценки развития детей была разработана специальная шкала. Из числа детей, рожденных по обычной методике, оценку «отлично» по этой шкале получали примерно 30%. Изучив труды Лебуайе, Нелсон и соавт. пришли к выводу, что предлагаемый метод, судя по заявлениям автора, гарантирует оценку «отлично» у 90% детей. Приняв уровень значимости а = 0,05, исследователи рассчитали, что для обеспечения 90% вероятности выявить такие различия в каждой из групп должно быть по 20 детей.

Работа продолжалась целый год. За это время исследователи провели беседы с 187 потенциальными участницами, разъясняя им смысл предстоящего эксперимента. 34 женщины не подошли по состоянию здоровья, 97 отказались участвовать в эксперименте (из них 70 собирались рожать только по методике Лебуайе). Из оставшихся 56 женщин одна успела родить до рандомизации. В результате число участниц сократилось до 55. Их и разделили случайным образом на две группы. После того как из исследования выбыла одна из попавших в контрольную группу, в этой группе оказалось 26, а в экспериментальной 28 рожениц. Однако у 6 женщин в контрольной группе и у 8 в экспериментальной возникли осложнения, и их пришлось исключить из участия в эксперименте. В итоге в каждой из групп оказалось по 20 женщин. Вы видите, насколько трудно обеспечить достаточную численность групп даже в простом исследовании*.

Оценка по шкале развития производилось сразу после родов,

Продолжительность бодрствования в первый час жизни, мин

Рис. 10.2. Продолжительность бодрствования в первый час жизни после обычных родов и родов по Лебуайе. Обратите внимание, что в обеих группах распределение асимметрично — преобладают высокие значения.

а также спустя несколько месяцев. Мы остановимся на одном из показателей — времени бодрствования в первый час жизни. Предполагалось, что чем лучше состояние новорожденного, тем более он активен. Значит, у младенцев, рожденных по Лебуайе, время бодрствования должно быть продолжительнее, чем у рожденных по обычной методике.

Из рис. 10.2 видно, что данные не подчиняются нормальному распределению. Особенно это заметно в экспериментальной группе. Тем самым, параметрические методы, например критерий Стьюдента, к этим данным неприменимы. Поэтому воспользуемся непараметрическим критерием Манна—Уитни.

Объединим данные, относящиеся к обеим группам, и упорядочим их по возрастанию. В табл. 10.4 кроме суммарного времени бодрствования указан также его ранг. Поскольку численность групп одинакова, сумму рангов Т можно вычислить для любой из них. Подсчитаем T для контрольной группы. Она равна 374. Размер групп достаточен, чтобы воспользоваться нормальным приближением для Т. Поэтому перейдем от Т к zr Итак, полагая истинной нулевую гипотезу, вычисляем среднее всех возможных значений Т

Таблица 10.4. Продолжительность бодрствования в первый час жизни, мин

Роды по  обычной  методике

Ранг

Роды  по Лебуайе

Ранг

5

2

2

1

10,1

3

19

5

17,7

4

29,7

10

20,3

6

32,1

12

22

7

35,4

15

24,9

8

36,7

17

26,5

9

38,5

19

30,8

11

40,2

20

34,2

13

42,1

22

35

14

43

23

36,6

16

44,4

24

37,9

18

45,6

26

40,4

21

46,7

27

45,5

25

47,1

28

49,3

31

48

29

51,1

33

49

30

53,1

36

50,9

32

55

38

51,2

34

56,7

39

52,5

35

58

40  T = 374

53,3

37

и стандартное отклонение

Таким образом, с учетом поправки Йейтса,

В табл. 4.1 находим 5% критическое значение для бесконечные величины 5,32 и -5,32 получат один и тот же ранг, а уже затем рангам будет присвоен знак изменения.

Таблица 10.5. Действие диуретика

Суточный диурез, мл

До

После

Величина

Ранг изме-

Знаковый

Участник

приема приема

изменения

нения

ранг

1

1490

1600

110

5

5

2

1300

1850

550

6

6

3

1400

1300

-100

4

-4

4

1410

1500

90

3

3

5

1350

1400

50

2

2

6

1000

1010

10

1  W=

1  13

Рассмотрим пример. Допустим, мы исследуем некий препарат, предположительно диуретик. Дадим его 6 добровольцам и сравним диурез до и после приема препарата. Результаты представлены в табл. 10.5.

У 5 человек диурез увеличился. Значит ли это, что препарат является диуретиком?

Упорядочим изменения диуреза по абсолютной величине и присвоим им ранги от 1 до 6. Затем, приписав рангу каждого изменения соответствующий изменению знак, перейдем к знаковым рангам (последний столбец табл. 10.5). Наконец, вычислим сумму знаковых рангов W = 13.

Если препарат не оказывает действия, сумма рангов со знаком « + » должна быть примерно равна сумме рангов со знаком «-» и значение Wокажется близким нулю. Напротив, если препарат увеличивает (или уменьшает) диурез, будут преобладать положительные (отрицательные) ранги и значение W будет отличным от нуля.

Чтобы найти критическое значение W, выпишем все 64 возможных исхода опыта (табл. 10.6 и рис. 10.3). В четырех случаях значение W no абсолютной величине равно или превосходит 19. Таким образом, отвергая нулевую гипотезу при \W\ > 19, мы обеспечим уровень значимости 4/64 = 0,0625. Изменение диуреза в нашем опыте надо признать статистически не значимым:

Таблица 10.6. Возможные сочетания знаковых рангов для 6 пар измерений

Ранги

Сумма зна-

1

2

3

4

5

6

ковых рангов

+

-40

-

+

-

-

-

-

-17

-

-

+

-

-

-

-15

-

-

-

+

-

-

-13

-

-

-

-

+

-

-11

-

-

-

-

-

+

-9

+

+

-

-

-

-

-15

+

-

+

-

-

-

-13

+

-

-

+

-

-

-11

+

-

-

-

+

-

-9

+

-

-

-

-

+

-7

-

+

+

-

-

-

-11

-

+

-

+

-

-

-9

-

+

-

-

+

-

-7

-

+

-

-

-

+

-5

-

-

+

+

-

-

-7

-

-

+

-

+

-

-5

-

-

+

-

-

+

-3

-

-

-

+

+

-

-3

-

-

-

+

-

+

-1

-

-

-

-

+

+

1

+

+

+

-

-

-

-9

+

+

-

+

-

-

-7

+

+

-

-

+

-

-5

+

+

-

-

-

+

-3

+

-

+

+

-

-

-5

+

-

+

-

+

-

-3

+

-

+

-

-

+

-1

+

-

-

+

+

-

-1

+

-

-

+

-

+

1

+

-

-

-

+

+

3

Таблица 10.6. Окончание

Ранги

Сумма зна-

1

2

3

4

5

6

ковых рангов

-

+

+

+

-

-

-3

-

+

+

-

+

-

-1

-

+

+

-

-

+

1

-

+

-

+

+

-

1

-

+

-

+

-

+

3

-

+

-

-

+

+

5

-

-

+

+

+

-

3

-

-

+

+

-

+

5

-

-

+

-

+

+

7

-

-

-

+

+

+

9

+

+

+

+

-

-

-1

+

+

+

-

+

-

1

+

+

+

-

-

+

3

+

+

-

+

+

-

3

+

+

-

+

-

+

5

+

+

-

-

+

+

7

+

-

+

+

+

-

5

+

-

+

+

-

+

7

+

-

+

-

+

+

9

+

-

-

+

+

+

11

-

+

+

+

+

-

7

-

+

+

+

-

+

9

-

+

+

-

+

+

11

-

+

-

+

+

+

13

-

-

+

+

+

+

15

+

+

+

+

+

-

9

+

+

+

+

-

+

11

+

+

+

-

+

+

13

+

+

-

+

+

+

15

+

-

+

+

+

+

17

-

+

+

+

+

+

19

+

+

+

+

+

+

21

Рис. 10.3. 64 возможные суммы рангов для группы из 6 человек (см. табл. 10.6). 4 наибольших по абсолютной величине значения помечены черным.

Р < 0,0625. На самом деле в таблице имеется 14 значений W по абсолютной величине не меньших 13. Поскольку 14/64 = 0,219, мы могли бы записать Р < 14/64.

Как и в случае критерия Манна— Уитни, распределение W не является непрерывным и поэтому нельзя указать критическое значение, для которого уровень значимости в точности равнялся бы, например, 5%. В табл. 10.7 приведены критические значения, наиболее близкие к 5 и 1% уровням значимости для случая, когда численность группы не превосходит 20.

Если число пар измерений больше 20, то распределение W достаточно близко к нормальному со средним = 0 и стандартным отклонением

где n — число пар наблюдений (то есть численность группы). Можно, таким образом, использовать

Чтобы приближение было более точным, воспользуемся поправкой Йейтса на непрерывность:

Таблица 10.7. Критические значения W (двусторонний вариант)

п

W

Р

п

W

Р

5

15

0,062

13

65

0,022

6

21

0,032

57

0,048

19

0,062

14

73

0,02

7

28

0,016

63

0,05

24

0,046

15

80

0,022

8

32

0,024

70

0,048

28

0,054

16

88

0,022

9

39

0,02

76

0,05

33

0,054

17

97

0,02

10

45

0,02

83

0,05

39

0,048

18

105

0,02

11

52

0,018

91

0,048

44

0,054

19

114

0,02

12

58

0,02

98

0,05

50

0,052

20

124

0,02

106

0,048

F. Mostellerand R. Rourke. Sturdy statistics: nonparametrics and order statistics, Addison- Wesley, Reading, Mass., 1973.

При анализе наблюдений до—после встречается два вида совпадений. Это, во-первых, совпадение величин, которым присваиваются ранги. Такая ситуация возникает при использовании любого рангового метода, будь то критерий Манна—Уитни или коэффициент корреляции Спирмена. Как всегда, совпадающим величинам присваивается общий ранг, равный среднему мест, занимаемых ими в упорядоченном наборе*.

Единственная особенность — то, что в случае наблюдений (до—после) речь идет о совпадении не самих величин наблюдае мого признака, а их изменений. Другой вид совпадения — совпадение значений «до» и «после». Каждую такую пару наблюдений нужно исключать из расчета, соответственно уменьшая на единицу объем выборки.

Повторим последовательность шагов, позволяющую по наблюдениям, выполненным до и после лечения, проверить его эффективность.

  1.  Вычислите величины изменений наблюдаемого признака. Отбросьте пары наблюдений, которым соответствует нулевое изменение.
  2.  Упорядочите изменения по возрастанию их абсолютной величины и присвойте соответствующие ранги. Рангами одинаковых величин назначьте средние тех мест, которые они делят в упорядоченном ряду.
  3.  Присвойте каждому рангу знак в соответствии с направлением изменения: если значение увеличилось — «+», если уменьшилось — «-».
  4.  Вычислите сумму знаковых рангов W*.
  5.  Сравните полученную величину W с критическим значением. Если она больше критического значения, изменение показателя статистически значимо.

А теперь применим критерий Уилкоксона к анализу рассмотренного в гл. 9 эксперимента Левина.

Курение и функция тромбоцитов

В гл. 9 мы разобрали исследование Левина, посвященное влиянию курения на функцию тромбоцитов. В частности, на рис. 9.2 приведены результаты опыта с выкуриванием сигареты: агрегация тромбоцитов до и после этого вредоносного воздействия. Рассмотрим еще раз эти данные (табл. 10.8). Обратим внимание на 4-й столбец: здесь показана величина изменения интересую щего нас показателя. Можно ли считать распределение изменения нормальным? При большом желании да, но следует все же признать, что для суждения о типе распределения данных слишком мало. Смущает и «выскакивающее» значение 27% — оно наводит на мысль о возможной асимметрии распределения. В подобных случаях лучше не рисковать и воспользоваться непараметрическим критерием. Применим критерий Уилкоксона.

Таблица 10.8. Агрегация тромбоцитов до и после сигареты выкуривания

Участ-  ник

До  курения

После  курения

Измене-  ние

Ранг изменения

Знаковый ранг изменения

1

25

27

2

2

2

2

25

29

4

3,5

3,5

3

27

37

10

6

6

4

44

56

12

7

7

5

30

46

16

10

10

6

67

82

15

8,5

8,5

7

53

57

4

3,5

3,5

8

53

80

27

11

11

9

52

61

9

5

5

10

60

59

-1

1

-1

11

28

43

15

8,5

8,5 W = 64

Изменение агрегации тромбоцитов, % от исходного уровня

Рис. 10.4. Изменение агрегации тромбоцитов после выкуривания сигареты. Вряд ли мы имеем дело с нормальным распределением, об этом свидетельствует, в частности, «выпадающее» значение 27%. В таких случаях непараметрические методы, например критерий Уилкоксона, предпочтительнее параметрических, таких, как критерий Стьюдента.

щего нас показателя. Можно ли считать распределение изменения нормальным? При большом желании да, но следует все же признать, что для суждения о типе распределения данных слишком мало. Смущает и «выскакивающее» значение 27% — оно наводит на мысль о возможной асимметрии распределения. В подобных случаях лучше не рисковать и воспользоваться непараметрическим критерием. Применим критерий Уилкоксона.

Выпишем абсолютные величины изменений в порядке возрастания. Полученные ранги приведены в пятом столбце табл.

а шестой столбец содержит те же ранги, но со знаками, соответствующими направлению изменения. Сумма знаковых рангов W = 2 + 3,5 + 6 + 7 + 10 + 8,5 + 3,5 + 11 + 5 + (-1) + 8,5 = 64. В табл. 10.7 находим 1,8% критическое Значение для суммы рангов. Оно равно 52, то есть меньше полученного нами. Поэтому мы признаем изменение агрегации тромбоцитов статистически значимым (Р < 0,018).

Лекция 7

Сравнение нескольких групп: критерий Крускала - Уоллиса

В гл. 3 была рассмотрена задача сравнения нескольких выборок. Эта задача возникает, например, когда нужно определить, одинаково ли эффективны несколько методов лечения, каждый из которых испытывается на отдельной группе. Предполагалось, что данные, полученные для каждой из групп, подчиняются нормальному распределению, причем дисперсии по всем группам примерно одинаковы. На этом допущении и основан изложенный в гл. 3 однофакторный дисперсионный анализ. Сейчас мы познакомимся с его непараметрическим аналогом, не. требующим предположения о нормальности распределения. Это критерий Крускала—Уоллиса.

Критерий Крускала—Уоллиса представляет собой обобщение критерия Манна—Уитни. Сначала все значения, независимо от того, какой выборке они принадлежат, упорядочивают по возрастанию. Каждому значению присваивается ранг — номер его места в упорядоченном ряду. (Совпадающим значениям присваивают общий ранг, равный среднему тех мест, которые эти величины делят между собой в общем упорядоченном ряду.) Затем вычисляют суммы рангов, относящихся к каждой группе, и для каждой группы определяют средний ранг. При отсутствии межгрупповых различий средние ранги групп должны оказаться близки. Напротив, если существует значительное расхождение средних рангов, то гипотезу об отсутствии межгрупповых различий следует отвергнуть. Значение критерия Крускала— Уоллиса H и является мерой такого расхождения средних рангов.

Для простоты положим, что групп всего три. Обобщение на большее число групп получится автоматически. Имеются результаты измерения некоторого признака в трех группах. Чис ленность групп — n n2 и n Значения объединим, упорядочим и каждому присвоим ранг. Вычислим сумму рангов для каждой группы — R1, R2 и R3. Найдем средние ранги: R1 = R1/nl, R2 = R1jn1 и R3 = R3 / n3.

Общее число наблюдений N = n1 + n2 + n3. Для объединенной группы рангами являются числа 1,2, ..., N и общая сумма рангов равна

Тогда средний ранг R для объединенной группы равен

Теперь найдем величину D, равную

Это прямой аналог межгрупповой вариации, знакомой нам по гл. 9. Величина D зависит от размеров групп. Чтобы получить показатель, отражающий их различия, следует поделить D на N(N + 1)/12. Полученная величина

является значением критерия Крускала—Уоллиса. Суммирование в приведенной формуле производится по всем группам.

Как найти критическое значение Н? Можно было бы просто перечислить все сочетания рангов, как это делалось для критериев Манна—Уитни и Уилкоксона. Однако сделать это довольно трудно — число вариантов слишком велико. К счастью, если группы не слишком малы, распределение H хорошо приближается распределением %2 с числом степеней свободы v = = k - 1, где k — число групп. Тогда для проверки нулевой гипотезы нужно просто вычислить по имеющимся наблюдениям значение Н и сравнить его с критическим значением %2 из табл. 5.7. В случае трех групп приближение с помощью %2 пригодно, если численность каждой группы не меньше 5. Для четырех групп —

если общее число наблюдений не менее 10. Но если группы совсем малы, не остается ничего, кроме как обратиться к таблице точных значений распределения Крускала—Уоллиса (мы не приводим эту таблицу из-за ее громоздкости).

Итак, чтобы выяснить, одинаково ли действие нескольких методов лечения, каждый из которых испытывается на отдельной группе, нужно проделать следующее.

  1.  Объединив все наблюдения, упорядочить их по возрастанию. Совпадающим значениям ранги присваиваются как среднее тех мест, которые делят между собой эти значения*.
  2.  Вычислить критерий Крускала—Уоллиса Н.
  3.  Сравнить вычисленное значение Н с критическим значением х2 для числа степеней свободы, на единицу меньшего числа групп. Если вычисленное значение Н окажется больше критического, различия групп статистически значимы. Приведем пример использования критерия Крускала—Уоллиса.

Влияние пероральных контрацептивов на выведение кофеина

Ряд лекарственных средств и пищевых продуктов (кофе, чай и прохладительные напитки) содержат кофеин. Беременным не следует увлекаться крепким кофе, поскольку кофеин может оказать неблагоприятное влияние на плод, а выведение кофеина у беременных замедлено. Существует предположение, что замедленное выведение кофеина обусловлено высоким уровнем половых гормонов во время беременности. Р. Патвардан и соавт.** решили косвенно подтвердить это предположение, определив скорость выведения кофеина у женщин, принимающих пероральные кон - трацептивы. (При приеме пероральных контрацептивов уровень эстрогенов и прогестагенов в крови повышается — то же самое происходит и при беременности.)

Таблица 10.9. Период полувыведения кофеина

Мужчины

Женщины

Не принимающие  пероральных  контрацептивов

Принимающие  пероральные  контрацептивы

T12 ч

Ранг

Tm, ч

Ранг

Tm, ч

Ранг

2,04

1

5,3

12

10,36

25

5,16

10

7,28

19

13,28

29

6,11

15

8,98

21

11,81

28

5,82

14

6,59

16

4,54

6

5,41

13

4,59

8

11,04

26

3,51

4

5,17

11

10,08

24

3,18

2

7,25

18

14,47

31

4,57

7

3,47

3

9,43

23

4,83

9

7,6

20

13,41

30

11,34

27

3,79

5

9,03

22

7,21

17

Сумма рангов Средний ранг

146  11,23

128  14,22

222  24,67

Скорость выведения кофеина (как и других веществ) непостоянна — она прямо пропорциональна его концентрации в плазме. Поэтому нет смысла измерять скорость выведения, скажем, в миллиграммах в минуту. Вместо этого используют период полувыведения (T1/2) — время уменьшения концентрации вдвое: после того как вещество всосется и поступит в кровь, эта величина остается постоянной, пока вещество не будет почти полностью выведено из организма.

T1/2 определили у женщин, принимающих и не принимающих пероральные контрацептивы, а также у мужчин. Численность групп составила соответственно 9, 9 и 13 человек. Каждый участник эксперимента принимал 250 мг кофеина, что соответствует примерно 3 чашкам кофе, после чего дважды определяли концентрацию кофеина в крови и рассчитывали T Результаты представлены в табл. 10.9.

Общий средний ранг

Вычисляем взвешенную сумму квадратов отклонений средних по группам от общего среднего

значение критерия Крускала—Уоллиса

По табл. 5.7 находим 1% критическое значение %2 с числом степеней свободы v = к - 1 = 3 - 1 = 2. Оно равно 9,210, то есть меньше полученного нами. Таким образом, различия групп статистически значимы (Р < 0,01).

Непараметрическое множественное сравнение

Потребность во множественном сравнении возникает всякий раз, когда с помощью дисперсионного анализа (или его непараметрического аналога — критерия Крускала—Уоллиса) обнаруживается различие нескольких выборок. В этом случае и требуется установить, в чем состоит это различие. В гл. 4 мы познакомились с параметрическими методами множественного сравнения. Они позволяют сравнить группы попарно и затем объединить их в несколько однородных наборов так, что различия между группами из одного набора статистически незначимы, а между группами из разных наборов — значимы. Кроме того, они позволяют сравнить все группы с контрольной.

К счастью, параметрические методы множественного сравнения легко преобразовать в непараметрические. Когда объемы выборок равны, для множественного сравнения используют не параметрические варианты критериев Ньюмена—Кейлса и Дан- нета. Когда же объемы выборок различны, применяется критерий Данна. Опишем вкратце эти методы.

Начнем с критериев для выборок равного объема. Критерии Ньюмена—Кейлса и Даннета совпадают практически полностью, поскольку критерий Даннета есть просто вариант критерия Ньюмена—Кейлса для сравнения всех выборок с одной контрольной.

Формула для непараметрического варианта критерия Нью- мена—Кейлса:

где RA Rb — суммы рантов двух сравниваемых выборок, п — объем каждой выборки, l — интервал сравнения. Вычисленное q сравнивается с критическим значением в табл. 4.3 для бесконечного числа степеней свободы.

Значение непараметрического критерия Даннета определяется формулой:

где Rkoh, — сумма рангов контрольной выборки, а остальные величины те же, что в Критерии q. Уточним только, что l — число всех выборок, включая контрольную. Значение q' сравнивается с критическим значением для бесконечного числа степеней свободы (табл. 4.4).

Наконец, для сравнения выборок разного объема используется критерий Данна. Впрочем, ничто не мешает применить его и к выборкам одинакового объема. Значение критерия Данна:

Таблица 10.10. Критические значения Q для попарного сравнение

Число сравниваемых выборок к

Уровень значимости а

0,05

0,01

2

1,96

2,576

3

2,394

2,936

4

2,639

3,144

5

2,807

3,291

6

2,936

3,403

7

3,038

3,494

8

3,124

3,57

9

3,197

3,635

10

3,261

3,692

11

3,317

3,743

12

3,368

3,789

13

3,414

3,83

14

3,456

3,868

15

3,494

3,902

16

3,529

3,935

17

3,562

3,965

18

3,593

3,993

19

3,622

4,019

20

3,649

4,044

21

3,675

4,067

22

3,699

4,089

23

3,722

4,11

24

3,744

4,13

25

3,765

4,149

где Ra и RB — средние ранги двух сравниваемых выборок, пА и пв

  1.  их объемы, а N — общий объем всех сравниваемых выборок.

Критические значения Q приведены в табл. 10.10. «Стягивающее» сравнение проводится как в критерии Ньюмена—Кейлса.

Критерием Данна можно воспользоваться и для сравнения с контрольной выборкой. Приэтом формула для Q остается прежней, только критические значения находятся уже по табл. 10.11.

Еще одна чашка кофе

Вернемся к исследованию выведения кофеина. Мы уже установили, что между тремя группами (группа мужчин и две группы женщин — принимающих и не принимающих пероральные кон - трацептивы) существует различие в скорости выведения кофеина. Однако осталось неизвестным, какие группы отличаются друг от друга, а какие похожи. Для ответа на этот вопрос предназначены методы множественного сравнения. Поскольку численность групп разная, применим критерий Данна.

Таблица 10.11. Критические значения Q для сравнения с кон-

трольной группой

Число сравниваемых выборок k

Уровень значимости а

0,05

0,01

2

1,96

2,576

3

2,242

2,807

4

2,394

2,936

5

2,498

3,024

6

2,576

3,091

7

2,639

3,144

8

2,69

3,189

9

2,735

3,227

10

2,773

3,261

11

2,807

3,291

12

2,838

3,317

13

2,866

3,342

14

2,891

3,364

15

2,914

3,384

16

2,936

3,403

17

2,955

3,421

18

2,974

3,437

19

2,992

3,453

20

3,008

3,467

21

3,024

3,481

22

3,038

3,494

23

3,052

3,506

24

3,066

3,518

25

3,078

3,529

женщин — принимающих и не принимающих пероральные кон - трацептивы) существует различие в скорости выведения кофеина. Однако осталось неизвестным, какие группы отличаются друг от друга, а какие похожи. Для ответа на этот вопрос предназначены методы множественного сравнения. Поскольку численность групп разная, применим критерий Данна.

Из табл. 10.9 видно, что сильнее всего различаются средние ранги в 3-й группе (женщины, принимающие пероральные контрацептивы) и в 1-й группе (мужчины). Вычисляем значение критерия Данна:

В табл. 10.10 находим 5 % критическое значение для k = 3. Оно равно 2,394, то есть меньше выборочного. Тем самым, различия групп статистически значимы (Р < 0,05). Продолжим стягивающие сравнения. Следующая пара групп — женщины, принимающие пероральные контрацептивы (3-я группа), и женщины, не принимающие пероральных контрацептивов (2-я группа):

Это значение также больше критического. Наконец, для оставшейся пары групп:

что меньше критического. Итак, выведение кофеина у женщин, принимающих пероральные контрацептивы, медленнее, чем у женщин, не принимающих пероральных контрацептивов, и у мужчин; последние же две группы по скорости выведения кофеина друг от друга не отличаются. Предположение о влиянии половых гормонов на выведение кофеина подтвердилось.

Лекция 8

Повторные измерения: критерий Фридмана

Если одна и та же группа больных последовательно подвергается нескольким методам лечения или просто наблюдается в разные моменты времени, применяют дисперсионный анализ повторных измерений (гл. 9). Но чтобы использование дисперсионного анализа было правомерно, данные должны подчиняться нормально-

Таблица 10.12. Данные для расчета критерия Фридмана. Пример 1

Больной

Метод

лечения

1

2

3

4

1

1

2

3

4

2

4

1

2

3

3

3

4

1

2

4

2

3

4

1

5

1

4

3

2

Сумма рангов

11

14

13

12

му распределению. Если вы в этом не уверены, лучше воспользоваться критерием Фридмана — непараметрическим аналогом дисперсионного анализа повторных измерений.

Логика критерия Фридмана очень проста. Каждый больной ровно один раз подвергается каждому методу лечения (или наблюдается в фиксированные моменты времени). Результаты наблюдений у каждого бального упорядочиваются. Обратите внимание, что если раньше мы упорядочивали группы, то теперь мы отдельно упорядочиваем значения у каждого больного независимо от всех остальных. Таким образом, получается столько упорядоченных рядов, сколько больных участвует в исследовании. Далее, для каждого метода лечения (или момента наблюдения) вычислим сумму рангов. Если разброс сумм велик — различия статистически значимы.

В табл. 10.12 описаны результаты испытания 4 методов лечения на 5 больных. В таблице указаны не сами значения, а их ранги среди данных, относящихся к одному больному. Каждая строка, кроме последней, соответствует одному больному. Последняя строка содержит суммы рангов для каждого из методов лечения. Различие сумм невелико; не похоже, чтобы эффективность какого-то метода отличалась от эффективности других.

Теперь обратимся к табл. 10.13. Различие в эффективности методов выражено предельно четко — упорядочение одинаково для всех больных. Во всех случаях наиболее эффективным оказался первый метод лечения, следующим — третий, за ним четвертый, и наконец, наименее эффективным — второй.

Таблица 10.13. Данные для расчета критерия Фридмана. Пример 2

Больной

Метод лечения

1

2

3

4

1

4

1

3

2

2

4

1

3

2

3

4

1

3

2

4

4

1

3

2

5

4

1

3

2

Сумма рангов

20

5

15

10

Перейдем к количественному оформлению наших впечатлений. Критерий Фридмана сходен с критерием Крускала—Уоллиса и вычисляется следующим образом. Сначала рассчитаем среднюю сумму рангов, присвоенных одному методу. (Именно этой величине равнялась бы сумма рангов любого из методов, если бы они были в точности равноэффективны.) Затем вычислим сумму квадратов S отклонений истинных сумм рангов, полученных каждым из методов, от средней суммы.

Разберем это на примере данных из табл. 10.12 и 10.13. Для каждого больного средний ранг равен (1 + 2 + 3 + 4)/4 = 2,5. В общем случае при к методах лечения средний ранг равен

Если каждым методом лечилось n больных, средняя сумма рангов равна п(к +1)/2. В нашем примере п = 5. Поэтому средняя сумма рангов равна 5(4 + 1)/2 = 12,5.

Значение критерия S определяется формулой

где Км — истинные суммы рангов для методов лечения. Тогда для табл. 10.12 находим:

 

Это и есть критерий Фридмана. При большой численности группы его величина приблизительно следует распределению X2 с числом степеней свободы v = k - 1. Однако при k = 3 и n < 9 и при k = 4 и n < 4 это приближение оказывается слишком грубым. В таком случае нужно воспользоваться приведенными в табл. 10.14 точными значениями %2.

Повторим порядок расчета критерия Фридмана.

  1.  Расположите значения для каждого больного по возрастанию, каждому значению присвойте ранг.
  2.  Для каждого из методов лечения подсчитайте сумму присвоенных ему рангов.
  3.  Вычислите значение %2.
  4.  Если число методов лечения и число больных присутствует в табл. 10.14, определите критическое значение X по этой таблице. Если число методов лечения и число больных достаточно велико (отсутствует в таблице), воспользуйтесь критическим значением X2 с числом степеней свободы v = k - 1.
  5.  Если рассчитанное значение превышает критическое — различия статистически значимы.

Теперь применим критерий Фридмана для анализа уже знакомого исследования.

Таблица 10.14. Критические значения критерия Фридмана

n

Zr

Р

n

Zr

Р

3

6

0,028

2

6

0,042

4

6,5

0,042

3

7

0,054

8

0,005

8,2

0,017

5

5,2

0,093

4

7,5

0,054

6,4

0,039

9,3

0,011

8,4

0,008

5

7,8

0,049

6

5,33

0,072

9,96

0,009

6,33

0,052

6

7,6

0,043

9

0,008

10,2

0,01

7

6

0,051

7

7,63

0,051

8,86

0,008

10,37

0,009

8

6,25

0,047

8

7,65

0,049

9

0,01

10,35

0,01

9

6,22

0,048

8,67

0,01

10

6,2

0,046

8,6

0,012

11

6,54

0,043

8,91

0,011

12

6,17

0,05

8,67

0,011

13

6

0,05

8,67

0,012

14

6,14

0,049

9

0,01

15

6,4

0,047

8,93

0,01

к — число методов лечения (моментов наблюдения), п — число больных, а — уровень значимости.

Owen. Handbook of statistical tables. US Department of Eneigy, Addison-Wesley, Reading, Mass., 1962.

 Таблица 10.15. Легочное сосудистое сопротивление при лечении гидралазином

Легочное сосудистое сопротивление

До лечения (контрольное)

Спустя 48 часов

Спустя 3— месяцев

6

Больной

Величина

Ранг

Величина

Ранг

Величина

Ранг

1

22,2

3

5,4

1

10,6

2

2

17

3

6,3

2

6,2

1

3

14,1

3

8,5

1

9,3

2

4

17

3

10,7

1

12,3

2

Гидрапазин при первичной легочной гипертензии

В табл. 10.15 воспроизведены данные о легочном сосудистом сопротивлении из табл. 9.5. В предыдущей главе мы применили к ним дисперсионный анализ повторных измерений. Это допустимо в случае нормального распределения. Но данных так мало, что судить о распределении невозможно. Поэтому прибегнем к критерию Фридмана, не требующему нормальности распределения.

Имеем три измерения (k = 3) у четырех больных (п = 4). Средний ранг для каждого наблюдения 1 + 2 + 3/3 = 2. Средняя сумма рангов для каждого измерения равна 4 X 2 = 8. Сумма квадратов отклонений для трех наблюдений:

 

Эта величина совпадает с критическим значением X при

п = 4 и k = 3. Соответствующий точный уровень значимости составляет 0,042. Таким образом, различия между измерениями статистически значимы (Р < 0,05).

Множественное сравнение после применения критерия Фридмана

Как всегда, за выявлением различий между несколькими методами лечения должно последовать выяснение, в чем состоят эти различия, то есть попарное сравнение методов лечения. Поскольку число больных, подвергшихся каждому методу лечения, одинаково, для этой цели легко приспособить критерий Ньюмена—Кейлса. Если считать один из методов лечения «контролем», то остальные можно сравнить с ним при помощи критерия Даннета. Если речь идет о повторных наблюдениях в ходе лечения, таким контролем естественно считать значения, полученные перед началом лечения.

Лекция 9

Анализ выживаемости

До сих пор мы имели дело только с полными данными: мы знали исход лечения у каждого больного. В гл. 5 мы разобрали работу, целью которой было определить влияние аспирина на риск тромбоза шунта у больных на гемодиализе. Мы подсчитали число больных с тромбозом и без тромбоза в группах аспирина и плацебо и свели результаты в таблицу сопряженности (см. табл. 5.1). Затем мы построили вторую таблицу сопряженности, содержавшую ожидаемые числа, которые наблюдались бы, если бы в группах аспирина и плацебо частота тромбозов была одинаковой. По двум этим таблицам мы вычислили величину %2. Полученное значение оказалось достаточно большим, чтобы отклонить гипотезу об отсутствии межгрупповых различий. В этом исследовании срок наблюдения всех больных был одинаковым и никто из них не выбыл из-под наблюдения до завершения исследования. То же самое можно сказать об исследовании галотановой и морфиновой анестезии, с которым мы впервые встретились в гл. 2. Тогда, говоря о трудностях, связанных с проспективными исследованиями, мы упомянули о проблеме выбывания*, но в рассмотренных примерах мы с ней не сталкивались. Однако ситуация, когда исследование должно быть завершено до наступления исхода у всех больных, для проспективных исследований, в частности клинических испытаний, скорее правило, чем исключение. Понятно, что на этот случай нужны специальные статистические методы.

Наиболее типичный пример исследования такого рода — это изучение выживаемости, когда больных наблюдают от начала болезни до смерти. Обычно больных включают в исследование на всем его протяжении, поэтому оно всегда заканчивается до смерти последнего больного. Истинная продолжительность болезни выживших к концу исследования остается неизвестной. Кроме того, исследователь может потерять больного из виду до завершения исследования, если тот, к примеру, переехал в другой город. Наконец, больной может умереть по причине, не связанной с изучаемым заболеванием, например погибнуть вавто- катастрофе. Во всех этих случаях длительность заболевания остается неизвестной, мы знаем только, что она превышает некоторый срок.

Сейчас мы займемся именно изучением выживаемости, однако будем иметь в виду, что те методы, которые мы освоим, пригодны и для других исследований, в том числе для контролируемых испытаний.

ПАССИВНОЕ КУРЕНИЕ НА ПЛУТОНЕ

Табачные дельцы, теснимые все дальше от Земли борцами за здоровый образ жизни, окопались на Плутоне. Они решили превратить эту девственную планету в оплот табакокурения. Многое наивные плутониане поддались навязчивой рекламе и закурили. Но это еще полбеды. Как известно, на Плутоне очень холодно, поэтому его обитатели редко покидают свои домики. Чрезвычайно деликатные по природе, плутониане не могут выставить курильщика на улицу и вынуждены дышать табачным дымом, который производит их несознательный соотечественник.

Плутониане вообще живут недолго, что же будет теперь, когда Плутон охватила эпидемия пассивного курения! Первое, что мы должны сделать в этой ситуации, — это оценить продолжительность жизни плутонианина после начала пассивного курения.

Вот как проводилось исследование. Мы попросили всех плу- тониан сообщать нам, как только в их домике появится активный курильщик. Выявленных таким образом пассивных курильщиков включали в группу наблюдения и дожидались (увы!) их смерти. Исследование длилось 15 плутонианских часов; за это время пассивными курильщиками стали 10 плутониан. Первыми сообщили о начале пассивного курения А и Б. Остальные участники вошли в группу наблюдения уже после начала исследования (что типично для исследований выживаемости); их звали В, Г, Д, Е, Ж, 3, И и К. Периоды наблюдения за каждым из них показаны на рис 11.1 А в виде горизонтальных отрезков. Из десяти участников к концу исследования умерли семь — А, Б, В, Е, Ж, 3 и К; в живых остались двое — Г и И. Еще одного участника, Д, местное начальство на 14-м часу исследования послало в командировку на Нептун; что с ним было дальше, нам неизвестно.

Таким образом, продолжительность жизни после начала пассивного курения нам известна в 7 случаях. В 3 случаях нам известно только, что наблюдаемые прожили не меньше такого-то срока*. Неважно, почему они не прослежены до конца жизни — 

Рис. 11.1. Продолжительность жизни плутониан после начала пассивного курения. А. Ход исследования показан в обычной шкале времени. Жизнь плуто- нианина после начала пассивного курения представлена горизонтальным отрезком. Левый конец отрезка—это начало наблюдения. На правом конце отрезка — черный или белый кружок. Черный кружок означает, что плутонианин умер и, таким образом, продолжительность его жизни нам известна. Белый кружок означает, что исследование закончилось до его смерти либо он куда-то уехал — словом, выбыл из-под наблюдения. Относительно выбывших нам известно только, что они прожили не меньше определенного срока. Б. Ход исследования показан так, как будто все плутониане начали наблюдаться одновременно. Теперь на шкале времени не астрономические часы, а часы наблюдения. Такое представление данных облегчит нам дальнейшие расчеты прекратилось ли исследование, уехали они куда-то, — всех их мы будем называть выбывшими.

На рис. 11.1 Б изображены те же данные, что и на рис. 11.1 А. Теперь отрезки, соответствующие периоду наблюдения за каждым плутонианином, расположены так, как если бы все наблюдения были начаты в один момент. Это представление данных более удобно. Теперь сразу видно, кто сколько прожил после начала пассивного курения. Кружок на правом конце каждого из отрезков показывает, умер плутонианин за время наблюдения (кружок закрашен) или выбыл (кружок не закрашен).

Если бы продолжительность наблюдения была одинаковой, мы могли бы рассчитать долю выживших и применить методы, описанные в гл. 5. Однако поскольку участники входили в группу наблюдения на разных сроках исследования, это условие не выполняется. Если бы все наблюдаемые умерли, то можно было бы применить методы, изложенные в гл. 2 или 10. Однако и этого не произошло, как это обычно и бывает в исследованиях такого рода. Для анализа выживаемости нужны новые методы. Прежде чем с ними познакомиться, сформулируем требования, которым должны удовлетворять все исследования выживаемости.

  1.  Для всех наблюдаемых известно время начала наблюдения.
  2.  Для всех наблюдаемых известно время окончания наблюдения, а также — умер он или выбыл.
  3.  Выбор наблюдаемых произведен случайно.

Для начала мы научимся строить кривую выживаемости, а затем перейдем к оценке статистической значимости различий кривых выживаемости.

КРИВАЯ ВЫЖИВАЕМОСТИ

Кривая выживаемости задает вероятность пережить любой из моментов времени после некоторого начального события. Эту вероятность обычно называют просто выживаемостью. В примере, который мы сейчас разбираем, кривая выживаемости применяется для изучения продолжительности жизни. Однако кривыми такого рода можно описать продолжительность самых разнообразных процессов. Тогда в качестве исхода будет выступать

не смерть, а другое интересующее нас событие, не всегда нежелательное. Например, можно изучать срок лечения какого-либо заболевания (исход — ремиссия), длительность лечения бесплодия или эффективность контрацепции (исход в обоих случаях

  1.  наступление беременности), долговечность протеза (исход- поломка).

Для начала, как всегда, рассмотрим кривую выживаемости для совокупности. Такая кривая получилась бы, если бы мы проследили судьбу всех плутониан от рождения до смерти. Выживаемость к моменту времени t обозначим S(t), Дадим определение.

Выживаемость S(t)это вероятность прожить более t с момента начала наблюдения.

Для совокупности эта вероятность выражается формулой:

S ^t) _ Число переживших момент t Объем совокупности

Типичная кривая выживаемости изображена на рис. 11.2. Понятно, что в точке 0, соответствующей начальному моменту, например моменту рождения, выживаемость равна 1. Затем кривая

постепенно понижается и, начиная с некоторой точки, становится равной 0. Возраст, до которого доживает ровно половина совокупности, называется медианой выживаемости.

Наша цель состоит в том, чтобы оценить выживаемость по выборке. Никакого другого способа ее оценки не существует. Если бы не выбывшие, это было бы очень просто:

В тех случаях, когда имеет место выбывание (а это бывает почти всегда), мы не сможем воспользоваться этой формулой. Вместо этого поступим следующим образом. Для каждого момента времени, когда произошла хотя бы одна смерть, оценим вероятность пережить этот момент. Такой оценкой будет отношение числа переживших этот момент к числу наблюдавшихся к этому моменту. Тогда, согласно правилу умножения вероятностей, вероятность пережить некоторый момент времени для каждого вступившего в исследование будет равна произведению этих оценок от нулевого до данного момента. Рассмотрим эту процедуру более подробно на примере плутонианских пассивных курильщиков.

Будем считать, что все начали наблюдаться в момент времени t = 0, и от этого момента будем отсчитывать все сроки (рис. 11.1Б). Расположим плутониан по возрастанию длительности наблюдения (табл. 11.1) и укажем саму эту длительность во второй колонке таблицы. Длительность наблюдения выбывших плутониан пометим знаком «+» — это будет означать, что плутонианин прожил более такого-то срока, а на сколько — неизвестно. Первый плутонианин (К) умер через 2 часа, второй (З) — через 6 часов после начала наблюдения. На 7-м часу умерли двое — А и В, на этом же сроке выбыл из-под наблюдения плутонианин И.

Первый плутонианин умер в 2 часа. Наблюдались в это время все 10 плутониан. Значит, вероятность умереть в 2 часа — d2/n2 = 1/10 = 0,1. Соответственно, вероятность не умереть в 2 часа для тех, кто дожил до этого времени:

Таблица 11.1. Результаты исследования продолжительности жизни плутониан после начала пассивного курения.

Наблюдалось Умерло Время к моменту t в момент t

Плутонианин

t

nt

d

К

2

10

1

З

6

9

1

А и В

7

8

2

И

7+

-

Е

8

5

1

Ж

9

4

1

Д

11+

Б

12

2

1

Г

12+

-

Следующий плутонианин умер в 6 часов. Наблюдалось к это

му времени 9 плутониан. Для доживших до 6 часов вероятность умереть в 6 часов — djn = 1/9 = 0,111, а вероятность не умереть в 6 часов

 

Теперь мы можем оценить вероятность, что плутонианин проживет более 6 часов, то есть S (6). Прожить более 6 часов — это значит не умереть в 2 часа и не умереть в 6 часов. То есть, по правилу умножения вероятностей,

Уже рискуя надоесть читателю однообразными рассуждениями, перейдем к следующему печальному событию. В 7 часов умерло сразу 2 пл

Внимательному читателю может показаться, что мы зря усложняем дело. Действительно, приведя сложные выкладки, мы получили то, что и так было очевидно: если через 7 часов умерло четверо из десяти плутониан, то дольше 7 часов прожило шестеро и выживаемость составляет S (7) = 6/10 = 0,600.

Еще терпение! До сих пор у нас не было выбывших, поэтому результаты и совпадают. Посмотрим, что будет в 8 часов. В 8 часов умирает плутонианин Е. Наблюдаются к этому времени 5 плутониан (4 умерли, 1 выбыл: 10 - 4 - 1 = 5).

 

Если бы мы считали «долю выживших» старым способом,

мы бы получили для S (8) оценку 0,5. В дальнейшем, чем больше будет выбывших, тем больше будет и расхождение.

Описанная процедура называется расчетом выживаемости моментным методом, или методом Каплана—Мейера.

Математическое выражение моментного метода:

где dt — число умерших в момент t, nt — число наблюдавшихся к моменту t, П (большая греческая буква «пи») — символ произведения. В данном случае она означает, что надо перемножить значения (1 - djn) для всех моментов, когда произошла хотя бы одна смерть. В принципе, можно перемножать и по остальным моментам, однако, если dt = 0, то (1 - dt/nt) = 1, а умножение на единицу на результате никак не скажется.

В табл. 11.2 расчет выживаемости моментным методом приведен полностью. Теперь мы можем представить результаты исследования выживаемости плутониан после начала пассивного курения в виде графика (рис. 11.3). Точ - ки на графике соответствуют моментам, когда умер хотя бы один из наблюдавшихся. Эти точки обычно соединяют ступенчатой линией. В момент времени 0 выживаемость со ставляет 1,0, затем постепенно снижается. В данном случае умерли не все наблюдавшиеся — поэтому нуля линия не достигает.

Медиана выживаемости

Наиболее полная характеристика выживаемости — это кривая выживаемости, которую мы только что построили. Хотелось бы, однако, иметь и обобщенный показатель, характеризующий выживаемость в виде одного числа. Распределение по продолжительности жизни, как правило, асимметрично, поэтому лучше всего тут подходит медиана. Определение медианы выживаемости для совокупности мы дали выше. Для выборки медиана выживаемости определяется как наименьшее время, для которого выживаемость меньше 0,5.

Чтобы определить медиану выживаемости, нужно построить кривую выживаемости и посмотреть, где она впервые опускается ниже 0,5. Например, на рис. 11.3 это произошло в 8 часов. Аналогично медиане могут быть вычислены другие про- центили выживаемости.

Если число умерших меньше половины числа наблюдаемых, медиану определить невозможно.

Рис. 11.3. Эта кривая выживаемости плутониан после начала пассивного курения рассчитана по данным с табл. 11.1; ход вычислений показан в табл. 11.2. Кривая представляет собой ступенчатую линию, каждой ступеньке соответствует момент смерти одного или нескольких плутониан.

Стандартная ошибка и доверительные интервалы выживаемости

Как всегда при исследовании выборки, полученная нами кривая выживаемости на самом деле представляет собой оценку кривой выживаемости. Если бы мы могли определить продолжительность жизни всех плутониан, подвергшихся пассивному курению, мы получили бы гладкую кривую вроде изображенной на рис. 11.2. Оценку точности приближения дает стандартная ошибка выживаемости; ее можно рассчитать по формуле Гринвуда*:

где сумма берется по всем моментам t,, от нуля до t включительно. На примере данных по выживаемости плутониан после на чала пассивного курения рассчитаем стандартную ошибку выживаемости для 7 часов:

В табл. 11.3 приведены значения стандартной ошибки для вычисленных по табл. 11.1 оценок функции выживаемости.

В гл. 7 было показано, как с помощью стандартной ошибки вычислить доверительные интервалы для долей. Точно также ее используют для вычисления доверительного интервала для выживаемости. Напомним, что 100(1 - а)-процентный доверительный интервал для доли р задается неравенством

Р - Za Sp < Р < Р + ZaSp, где za — двустороннее критическое значение для стандартного нормального распределения, a — уровень значимости, p — выборочное значение доли, Sp — стандартная ошибка для этой доли. Доверительный интервал для выживаемости в момент t определяется аналогично:

Обычно определяют 95% доверительный интервал. Тогда а = 1 - 0,95 = 0,05. Соответствующее значение za = 1,960. Дальнейшие вычисления показаны в таблице 11.3. Отложив на графике доверительные интервалы (рис. 11.4), мы увидим расширяющийся «рукав» — доверительную область для выживаемости. Причина расширения доверительной области понятна: чем меньше остается наблюдаемых, тем больше ошибка.

Как вы помните, при расчете доверительных интервалов для долей существовало ограничение на использование нормального распределения. Аналогичное ограничение существует и при оценке доверительных интервалов для функции выживаемости. Дело в том, что нормальное приближение вносит сильные искажения, когда функция выживаемости принимает значение, близкое к граничным — к 0 или 1. В этом случае доверительный интервал должен быть несимметричен относительно р. (См. также рис. 7.4 и соответствующее обсуждение в гл. 7.) Приведенная выше формула, напротив, дает симметричную оценку, которая может выйти за граничные значения 1 и 0. Простейший способ подправить такую оценку состоит в том, чтобы значения, большие единицы, заменить на единицу, а меньшие нуля

  1.  на ноль. Существует и несколько более сложный способ, он позволяет рассчитать доверительный интервал точнее. Возьмем

двойной логарифм ln[-ln S (t)]. В отличие от S (t), эта величина не должна лежать в пределах от 0 до 1. Затем вычислим для нее стандартную ошибку, после чего вернемся к исходной функции S (t). Стандартная ошибка для логарифмической формы выживаемости:

Тогда 100(1 - а) процентный доверительный интервал для S(t) определяется неравенством:

В клинических исследованиях часто возникает необходимость сравнить выживаемость разных групп больных. Посмотрим, как это делается в случае двух групп*. Нулевая гипотеза состоит в том, что в обеих группах выживаемость одинакова. Если бы не было выбывания и все больные наблюдались равное время, нам бы подошел анализ таблиц сопряженности (см. гл. 5). Если бы все больные наблюдались вплоть до смерти, можно было бы сравнить выживаемость в обеих группах с помощью изложенных в гл. 10 непараметрических методов, например рангового критерия Манна—Уитни или метода Крускала—Уоллиса. В реальной жизни подобные ситуации редки, и, как мы уже говорили, выбывание практически неизбежно. Для сравнения кривых выживаемости нужны специальные методы. Первым мы рассмотрим так называемый логранговый критерий.

Он основан на следующих трех допущениях.

  1.  Две сравниваемые выборки независимы и случайны.
  2.  Выбывание в обеих выборках одинаково.
  3.  Функции выживаемости связаны соотношением: S2(t) = [S1(t)] ¥ Величина ¥ («пси») называется отношением смертности. Если ¥ = 1, то кривые выживаемости совпадают. Если ¥ < 1, люди во 2-й выборке умирают позже, чем в 1-й. И наоборот, если ¥ > 1, позже умирают в 1-й выборке.

Трансплантация костного мозга при остром лимфобластном лейкозе взрослых

При остром лимфобластном лейкозе мутация предшественника лимфоцитов приводит к появлению клона лейкозных клеток, способных неограниченно делиться. В отличие от обычных лимфоцитов, лейкозные клетки функционально неактивны и не обладают защитными свойствами. Размножаясь в костном мозге, они подавляют нормальное кроветворение, в результате развива ются иммунодефицит, анемия и тромбоцитопения. Без лечения острый лимфобластный лейкоз низбежно приводит к смерти.

Задача лечения — полностью уничтожить лейкозные клетки. Этого можно достичь с помощью облучения и химиотерапии. Однако при этом уничтожаются и нормальные кроветворные клетки. Чтобы компенсировать это побочное действие лечения, используют трансплантацию костного мозга. Для трансплантации лучше всего подходит костный мозг близкого родственника (аллотрансплантация). К сожалению, не всегда есть у кого его взять. Поэтому применяется и другой способ, так называемая аутотрансплантация, когда костный мозг берут у самого больного. Из полученного костного мозга специальный методами удаляют лейкозные клетки и, по завершении курса лучевой и химиотерапии, его вновь вводят больному. Н. Вей с соавт. сравнили выживаемость после ауто- и аллотрансплантации*.

В исследование включали больных старше 15 лет с подтвержденным диагнозом острого лимфобластного лейкоза после достижения первой полной ремиссии. Больным, у которых не было подходящих родственников, проводили аутотрансплантацию (1-я группа), остальным — аллотрансплантацию (2-я группа). Исследование продолжалось 11 лет.

Полученные данные представлены в табл. 11.4. Как и ранее, выбывшие помечены знаком «+». В табл. 11.5 приведен расчет выживаемости для каждой из групп. Соответствующие кривые показаны на рис. 11.5. Выживаемость в 1-й группе хуже, чем во 2-й. Вопрос состоит в том, какова вероятность получить подобное различие выживаемости случайно.

Перейдем к построению логрангового критерия. Ход вычислений показан в табл. 11.6 (выбывших в таблице нет, показаны только моменты наступления смерти). Как видим, спустя месяц после трансплантации в 1-й группе умерли 3 из 33 больных, во второй — 1 из 21 больного. Каким бы было число умерших при условии справедливости нулевой гипотезы? Рассчитаем ожидаемые числа умерших, подобно тому, как мы это делали в гл. 5.

Таблица 11.4. Продолжительность жизни после транспланта

Ауготрансплантация

Аллотрансплантация

(1-я группа, n

= 33)

(2-я группа, п = 21)

Месяцы

Число смертей Месяцы после Число смертей

после пересадки или выбытии

пересадки или выбытии

1

3

1 1

2

2

2 1

3

1

3 1

4

1

4 1

5

1

6 1

6

1

7 1

7

1

12 1

8

15+ 1

10

1

20+ 1

12

21+ 1

14

1

24 1

17

1

30+ 1

20+

1

60+ 1

27

85+ 2

28

1

86+ 1

30

87+ 1

36

1

90+ 1

38+

1

100+ 1

40+

1

119+ 1

45+

1

132+ 1

50

3

63+

1

132+

2

только моменты наступления смерти). Как видим, спустя месяц после трансплантации в 1-й группе умерли 3 из 33 больных, во второй — 1 из 21 больного. Каким бы было число умерших при условии справедливости нулевой гипотезы? Рассчитаем ожидаемые числа умерших, подобно тому, как мы это делали в гл. 5.

В первый месяц в обеих группах умерло 3 +1 = 4 из 33 + 21 = 54 больных. Таким образом, смертность в обеих группах составила 4/54 = 0,074 = 7,4%. Если бы, согласно нулевой гипотезе, меж групповых различий не было, то в первой группе умерло бы

  1.  х 0,074 = 2,442 человека. Это число довольно близко к 3 — наблюдаемому числу умерших. Если нулевая гипотеза справедлива, ожидаемые и наблюдаемые числа и дальше будут близки.

Найдем таким же способом ожидаемое число умерших в 1-й группе в каждый из месяцев, когда кто-нибудь умирал хотя бы в одной группе.

Таблица 11.5. Вычисление логрангового критерия

Аутотрансплантация (1-я группа)

Аллотрансплантация Объединенная (2-я группа) группа

Наблюда-

Наблюда-

лись к

лись к

Умерли в

началу

Умерли в

началу

Месяц

месяц t

месяца t

месяц t

месяца t

t

du

пи

d2t

ПЪ

1

3

33

1

21

2

2

30

1

20

3

1

28

1

19

4

1

27

1

18

5

1

26

0

17

6

1

25

1

17

7

1

24

1

16

8

2

23

0

15

10

1

21

0

15

12

2

20

1

15

14

1

18

0

14

Таблица 11.5. Вычисление логрангового критерия (продолжение)

Ожидае-

Наблю-

мое число

дались к

смертей

Умерли в

началу

в 1-й

Слагаемое Слагаемое

месяц t

месяца t

группе

для иь

для sUl

do6t =

no6t =

Еи =

#ИМЯ?

#ИМЯ?

- „  ~ пи  «об,

du~Eu

см. текст

4

54

2,444

0,556

0,897

3

50

1,8

0,2

0,691

2

47

1,191

-1,191

0,471

2

45

1,2

-0,2

0,469

1

43

0,605

0,395

0,239

2

42

1,19

-0,19

0,47

2

40

1,2

-0,2

0,468

2

38

1,211

0,789

0,465

1

36

0,583

0,417

0,243

3

35

1,714

0,286

0,691

1

32

0,563

0,438

0,246

30

0,567

0,433

0,248

26

0,576

-0,577

0,241

25

1,2

0,8

0,46

23

0,565

0,435

0,246

22

1,091

0,909

0,472

19

0,526

0,474

0,249

15

1,2

1,8

0,617

и, = 6,572 s}j = 7,883  1 U L

Распределение z приблизительно нормально, поэтому сравним эту величину с критическим значением для стандартного нормального распределения (см. последнюю строку табл. 4.1)**. Критическое значение для уровня значимости 2% в случае нормального распределения равно 2,326, то есть меньше полученного нами. Поэтому мы отклоняем нулевую гипотезу об отсутствии различий в выживаемости.

В заключение заметим, что совершенно неважно, для какой именно из групп вычисляется UL. Для 2-й группы UL равна по абсолютной величине UL для 1-й, но имеет противоположный знак.

Поправка Йейтса для логрангового критерия

Мы уже сталкивались с ситуацией, когда дискретное распределение приближенно описывается нормальным, которое по сути своей непрерывно. Практически это приводит к излишней «мягкости» критерия: мы несколько чаще, чем следовало бы, отвергаем нулевую гипотезу. Чтобы компенсировать влияние дискретности, применяют поправку Йейтса. В случае логрангово- го критерия это делается таким образом:

Для примера, который мы рассматриваем:

В результате применения поправки Йейтса величина z уменьшилась с 2,342 до 2,162, однако она по-прежнему больше 1,960

  1.  критического значения для уровня значимости 0,05. В данном случае поправка Йейтса не изменила общий вывод — различия выживаемости статистически значимы.

КРИТЕРИЙ ГЕХАНА

Существует другой метод сравнения выживаемости. Он называется критерием Гехана и представляет собой обобщение критерия Уилкоксона. Он не требует постоянства отношения смертности, но на его результаты слишком сильно влияет число ранних смертей.

Критерий Гехана вычисляют так. Каждого больного из 1-й группы сравнивают с каждым больным из 2-й группы. Результат сравнения оценивают как +1, если больной из 1-й группы наверняка прожил дольше, -1, если он наверняка прожил меньше, и 0, если невозможно наверняка сказать, кто из них прожил дольше. Последнее возможно в трех случаях: если оба выбыли, если один выбыл до того, как другой умер, и если время наблюдения одинаково.

Результаты сравнения для каждого больного суммируют; эту сумму мы обозначим h. В свою очередь сумма всех h дает величину UW стандартная ошибка которой определяется по формуле:

И наконец, вычисляют

Полученное значение нужно сравнить с критическим значением стандартного нормального распределения (см. последнюю строку табл. 4.1).

Поправка Иейтса применяется к критерию Гехана точно так

же, как к логранговому критерию.

Какой критерий предпочесть? Логранговый критерий предпочтительнее критерия Гехана, если справедливо предположение о постоянном отношении смертности: S2(t) = [S1(t)]'p. Установить, выполняется ли это условие, можно, нарисовав графики

ln[-lnS1 (t)] и ln[-lnS2 (t)] — они должны быть параллельны. Во всяком случае, кривые выживаемости не должны пересекаться.

ЧУВСТВИТЕЛЬНОСТЬ И ОБЪЕМ ВЫБОРКИ

Как вы помните, чувствительность любого критерия зависит от трех величин — величины различия, которую он должен уловить, уровня значимости и численности групп. И наоборот, численность групп, необходимая для того, чтобы уловить различия, не меньшие некоторой величины, определяется уровнем значимости и необходимой чувствительностью. Логранговый критерий не является исключением. Чем меньшее различие выживаемости нужно выявить, тем большим должно быть число наблюдений.

Для простоты ограничимся случаем равной численности групп*. Заметим, что, как и всегда, при заданном числе обследованных именно равная численность групп обеспечивает максимальную чувствительность.

Прежде всего следует оценить необходимое число исходов (смертей, рецидивов и т. д.). Имеем

где ¥ — отношение смертности, а za и z1-p — соответствующие а и 1 - в значения стандарного нормального распределения (их можно найти в последней строке табл. 4.1). Как определить ¥? Поскольку при всех t соблюдается равенство S2(t) = [S1(t)]¥, этот параметр можно оценить как

где S1(o) и S2(o) — выживаемость в 1-й и 2-й группах к концу наблюдения. Теперь мы можем найти п — численность каждой из групп:

d 

Таким образом, по ожидаемым долям доживших до завершения эксперимента мы можем найти объем п каждой из выборок.

Рассмотрим пример. Пусть мы предполагаем, что выживаемость должна повыситься с 30 до 60% или более. Эти различия мы хотим выявить с вероятностью 80% (то есть чувствительность 1 - в = 0,8). Уровень значимости а = 0,05. По табл. 4.1 находим

za = z0,05 = 1,960 и z!-P = z0,80 = 0,84°.

Оценив

 

подставим значения в формулу для числа исходов

и рассчитаем численность каждой группы: d 48, 1

ЗАКЛЮЧЕНИЕ

К анализу выживаемости неприменимы обычные способы оценки различий, такие, как сравнение долей и средних величин. Необходимы методы, учитывающие выбывание, которое неизбежно имеет место в исследованиях такого рода. Мы рассмотрели простейшие методы сравнения выживаемости, а именно сравнение выживаемости в двух группах. Соответствующие методы для произвольного числа групп основаны примерно на тех же принципах. Как логранговый критерий, так и критерий Гехана относятся к непараметрическим — они не исходят из предположения об определенной форме кривой выживаемости. Существуют и параметрические методы анализа выживаемости.

Значение анализа выживаемости чрезвычайно велико. В гл.

  1.  мы говорили о показателях процесса и показателях результата. Если, например, препарат снижает уровень холестерина, то это еще не значит, что он позволяет продлить жизнь больного или отдалить появление стенокардии, — речь, следовательно, идет о показателе процесса. Напротив, если доказано, что препарат продлевает жизнь, то речь идет о показателе результата, имеющем несомненную клиническую значимость.

Сегодня, когда требования к доказательствам эффективности лечения ужесточаются, изучение выживаемости (и вообще течения заболеваний) приобретает все большее значение. Исследования такого рода, в отличие от простой регистрации показателей процесса, столь же трудны, сколь и необходимы. В следующей главе мы подробнее обсудим разные типы исследований и их роль в медицине.

Лекция 10

Как построить исследование

Мы познакомились со многими статистическими методами, узнали о принципах, лежащих в их основе, и получили некоторый навык в расчетах. Каждый метод основан на собственной математической модели, и применение его тем успешнее, чем ближе эта модель к действительности. Чтобы правильно выбрать статистической метод, необходимо учитывать прежде всего характер интересующего нас признака (количественный, порядковый или качественный) и тип распределения (нормальное или нет). Ниже мы кратко суммируем все, что узнали о выборе статистического метода. Однако существует еще одно обстоятельство, о котором мы упоминали лишь вскользь, но которое решающим образом влияет на практическую ценность результата исследования. Это представительность выборки. Любой статистический метод исходит из предположения, что выборка извлечена из совокупности случайно. Если это условие не выполняется (то есть если выборка непредставительна), никакой, даже самый изощренный статистический метод не даст правильного результата.

Далее, если выборка представительна, то какую совокупность она представляет? Как мы увидим, больные в крупных медицинских центрах, где обычно проводятся клинические испытания, мало напоминают тех, с которыми встречается врач общей практики. И наконец, мы еще раз напомним об опасности эффекта множественных сравнений. Интересно, что этот многоликий враг исследователей в наибольшей степени угрожает самым любознательным из них.

КАКИМ КРИТЕРИЕМ ВОСПОЛЬЗОВАТЬСЯ

В этой книге мы не стремились охватить все статистические методы: многие из них остались вне поля зрения. Так, не были рассмотрены многофакторные методы, в которых исследуются результаты одновременного использования нескольких способов лечения или две группы сравниваются по нескольким показателям.

Однако мы выстроили костяк из статистических методов, вокруг которого естественным образом наращиваются более общие. Охватив широкий круг типов задач, внутри каждого типа мы рассмотрели простейшую модель. Встретившись с более сложной задачей того же или сходного типа, вы без труда сами подберете подходящий метод. Тем не менее освоенные нами методы открывают достаточно большие возможности для решения практических задач.

С помощью табл. 12.1 вы легко найдете, каким критерием следует воспользоваться в зависимости от вида исследования и изучавшегося признака (количественный, порядковый или качественный). Виду исследования (применялись ли сравниваемые методы лечения к общей группе больных или каждый испытывался на отдельной группе, равно ли число сравниваемых методов двум и т. д.) соответствуют столбцы таблицы. Строки таблицы определяют, какие признаки изучались — числовые, порядковые или качественные. Данные о выживаемости мы выделили в отдельный тип, поэтому получилось четыре типа данных. Выбор статистического критерия в случае числовых признаков требует пояснения. Если известно, что распределение признака в совокупности нормально, можно использовать параметрический метод, указанный в таблице (иногда необходимы дополнительные условия, например, в случае дисперсионного анализа требуется равенство дисперсий). Если распределение далеко от нормального, или если у вас нет желания использовать параметрические методы, следует воспользоваться их непараметрическими аналогами.

Табл. 12.1 — это своего рода путеводитель по статистическим критериям. Но прежде чем им воспользоваться, примите во внимание три вещи. Во-первых, обнаружив, что нулевая гипотеза об отсутствии эффекта не может быть отвергнута, выясните почему. Для этого определите чувствительность критерия (гл. 6). Если чувствительность мала, причиной может быть малый объем выборки. Но если чувствительность велика, то эффект действительно отсутствует. Во-вторых, обнаружив статистически значимый эффект, не забудьте вычислить его величину и доверительные интервалы (гл. 7 и 8), по которым можно судить о его клинической значимости. И, наконец, в-третьих, обязательно попытайтесь понять, в самом ли деле процедура получения данных обеспечивает их представительность, в противном случае все последующие выкладки потеряют смысл. Тема представительности данных заслуживает более подробного рассмотрения.

РАНДОМИЗАЦИЯ И СЛЕПОЙ МЕТОД

Все статистические методы исходят из предположения, что данные извлечены из совокупности случайно. Что значит «извлечены случайно»? Это значит, что вероятность оказаться выбранным одинакова для всех членов совокупности. Например, если групп две (экспериментальная и контрольная) и их размеры равны, то любой член совокупности может равновероятно попасть в любую из групп.

Обеспечить равную вероятность попадания в любую из групп совсем не так просто, как кажется на первый взгляд. (Предназначенные для этого методы называются рандомизацией, с этим понятием мы встречались в гл. 3.) Прежде всего необходимо исключить всякое влияние человека, что довольно сложно. Врачи,

участвующие в исследовании, изобретательны и хитроумны. Любой недочет в системе рандомизации они обязательно используют, чтобы повлиять на формирование групп. При этом они, скорее всего, будут исходить из самых добрых побуждений; тем не менее такое вмешательство неизбежно приведет к нарушению сопоставимости групп и к искажению результатов исследования. Следует тщательно продумать, как сделать такое влияние невозможным для всех участников исследования, и прежде всего для себя самого.

Задача рандомизации — обеспечить такой подбор больных, чтобы контрольная группа ни в чем не отличалась от экспериментальной, кроме метода лечения. Однако этого мало. На этапе оценки результатов вновь появляется пристрастный исследователь. Велика и роль больного, его веры в новый способ лечения. Обоих следует лишить возможности влиять на результаты. Для этого предназначен слепой метод. В идеале это двойной слепой метод: ни больной, ни наблюдающий его врач не знают, какой из способов лечения был применен. Двойной слепой метод не всегда осуществим, поэтому используют также простой слепой (примененный способ лечения известен врачу, но не больному или наоборот) и частично слепой (и врач, и больной располагают лишь частью информации) методы. В любом случае информацию, которой располагают участники исследования, следует свести к минимуму.

Строго говоря, применение рандомизации и слепого метода — две разные проблемы, однако они настолько тесно связаны, что примеры, которые мы рассмотрим, приложимы к обеим.

Перевязка внутренней грудной артерии при стенокардии

Идея этой операции возникла еще в 30-е годы. При ишемической болезни сердца сосуды, питающие миокард, частично закупориваются атеросклеротическими бляшками. Миокард не получает достаточно кислорода, и при физической нагрузке, когда потребность в кислороде увеличена, возникает приступ стенокардии. Если перевязать внутренние грудные артерии, то кровь, которая раньше текла по ним, устремится (по крайней мере частично) в коронарные сосуды — примерно так рассуждали авторы

метода. Кровоснабжение миокарда улучшится, приступы стенокардии прекратятся. Сама же операция достаточно проста, ее можно выполнить под местной анестезией. Идея была осуществлена, и в 1958 г. Р. Митчелл и соавт. опубликовали результаты. Операция была проведена 50 больным. Продолжительность послеоперационного наблюдения составляла от 2 до 6 месяцев. У 34 больных (68% общего числа) состояние улучшилось (у 18 приступы стенокардии прекратились полностью, у 16 стали реже). У 11 больных (22%) состояние осталось прежним, умерли 5 больных (10%). На первый взгляд, превосходные результаты.

Еще до публикации работы Митчелла на страницах журнала «Ридерс Дайджест» появилась восторженная статья «Хирург спасает сердце», принесшая этому способу лечения больше известности, чем все публикации в медицинских журналах.

Однако в наши дни мало кто слышал о перевязке внутренних грудных артерий. Что стало с этим многообещающим методом лечения? В 1959 г. Л. Кобб и соавт. опубликовали результаты проверки эффективности двусторонней перевязки внутренних грудных артерий, полученные двойным слепым методом. Ни больной, ни врач, оценивавший результат операции, не знали, были ли перевязаны внутренние грудные артерии или нет. Больному делали надрезы и выделяли сосуды. Затем вскрывали конверт, в котором говорилось, нужно ли выполнить перевязку. К какой группе — экспериментальной или контрольной — принадлежал больной, покинувший операционную, знал только оперировавший его хирург. По данным послеоперационного наблюдения группы не различались ни по частоте приступов, ни по переносимости физической нагрузки. Чем было обусловлено обнаруженное Митчеллом улучшение состояния — отбором для операции наиболее легких больных, их энтузиазмом в отношении разрекламированного метода лечения или пристрастностью оценки результатов — судить трудно. Вывод же прост: результаты исследования без контрольной группы, без применения слепого метода несостоятельны.

Портокавальное шунтирование при циррозе печени

При алкоголизме часто развивается цирроз печени. Одно из его проявлений — портальная гипертензия: повышение давления в воротной вене из-за затруднения кровотока через печень. Повышение давления в воротной вене приводит к варикозному расширению вен пищевода. Это чрезвычайно опасное состояние: из- за разрыва варикозно расширенных вен в любой момент может возникнуть смертельное кровотечение. Для снижения давления в воротной вене применяют портокавальное шунтирование: воротную и нижнюю полую вены соединяют в обход печени.

Ранние работы по оценке результатов этой операции относятся к концу 40-х годов. Типичный план исследования в ту эпоху предусматривал набор определенного числа оперированных и подсчет доли выживших, каковая и рассматривалась в качестве результата. То обстоятельство, что больной мог бы выжить и без операции (а также умереть в результате операции), во внимание не принималось. Контрольные группы больных, не подвергавшихся портокавальному шунтированию, использовались редко.

В 1966 г., через двадцать лет после первой операции, Н. Грейс и соавт.* провели анализ полусотни исследований эффективности этого метода. Предметом анализа была связь между наличием контрольной группы и применением рандомизации, с одной стороны, и оценкой эффективности — с другой. Табл. 12.2 показывает, как распределились исследования по этим признакам. Проявилась любопытная закономерность. Если исследование выполнялось без контрольной группы или последняя формировалась не случайно, метод, как правило, получал высокую оценку. В тех немногих исследованиях, где использовалась контрольная группа и больные равновероятно распределялись между нею и экспериментальной, метод оценивался невысоко.

Причина высоких оценок в исследованиях без контрольной группы ясна, ведь само суждение об эффективности метода здесь совершенно произвольно. Сложнее с оценками, основанными на использовании нерандомизированных групп. Даже при кажущейся беспристрастности отбора сама возможность влиять на него толкает исследователя на построение неравноценных групп. В результате в одну группу попадают более тяжелые больные, в другую — более легкие.

Исследователь редко стремится обмануть других, но легко становится жертвой самообмана. При этом форма самообмана может быть весьма изощрённой. Рассмотрим такой пример: больных, госпитализированных по нечетным дням месяца, определяют в экспериментальную группу, по четным — в контрольную. Можно ли считать такую рандомизацию достаточной? Разумеется, нет. Врач может влиять на срок госпитализации, следовательно, состав групп будет неслучайным.

Если у кого-либо из участников исследования есть возможность влиять на построение групп, эта возможность будет использована.

Для рандомизации недостаточно, чтобы выбор не зависел от исследователя. Он должен быть независим и от самих подопытных. Приведем пример из области лабораторных исследований. Двадцать крыс, сидящих в клетке, нужно разделить на две группы. Выпустим из клетки десять крыс и назовем их контрольной группой. Представительна ли она? Скорее всего, нет. Вероятно, первыми из клетки выбегут самые сильные и агрессивные особи.

Есть только один способ получить случайную выборку — воспользоваться для этого достоверно случайным процессом, на пример бросанием игральной кости или таблицей (генератором) случайных чисел.

Мы видели, что среди всех исследований эффективности портокавального шунтирования лишь те, в которых применялась рандомизация, показали истинную степень его эффективности. Остальные приводили к оценкам, смещенным в пользу операции. Общим правилом является следующее.

Чем лучше проведено исследование, тем менее вероятно его результат смещен в пользу исследуемого метода.

Влияние качества рандомизации на результаты клинических испытаний исследовали К. Шульц и соавт*. Рассмотрев 250 контролируемых клинических испытаний, они разделили их на хорошо и плохо рандомизированные. Хорошо рандомизированным считалось испытание, в котором распределение по группам основывалось на использовании случайных чисел. В остальных случаях участники исследования могли влиять на распределение по группам и испытание считалось плохо рандомизированным. Так, плохо рандомизированным считалось распределение, зависящее от момента включения в исследование. Шульц обнаружил, что доля методов лечения, признанных по итогам испытания эффективными, оказалась в плохо рандомизированных испытаниях на 41% выше, чем в хорошо рандомизированных. Некачественная рандомизация привела к почти полуторному завышению числа эффективных методов!

Этична ли рандомизация?

Итак, только рандомизация позволяет надежно оценить эффективность нового метода лечения. Но этична ли она, когда речь идет о жизни и здоровье людей? В гл. 3 мы уже говорили о психологических трудностях, связанных с рандомизацией. Рандомизация лишает права выбора и врача-экспериментатора, и самого больного. Простое решение состоит том, что если достоверно не известно, какой метод лучше, то лечить можно любым.

К сожалению, на деле все не так просто. У любого метода найдутся сторонники и противники (иначе кто бы взялся за проверку.) Не будем говорить о мнении авторов метода. Но свои воззрения есть и у привлеченного к эксперименту врача, человека обычно просвещенного и не чуждого гуманизма. Почему, нередко спрашивает врач, я должен, подобно язычнику, слепо следовать воле неких случайных чисел, требующих лишить больного лучшего лечения? Этично ли в глазах поборников перевязки грудных артерий было использование Коббом рандомизированной контрольной группы? Однако, как мы видели, неэтичной оказалась скорее не рандомизация, а операция. Слыша мнения о нецелесообразности рандомизированных испытаний, задайте вопрос: на чем, кроме веры и интуиции, основано убеждение в достоинствах одного и недостатках другого метода? Ведь сравнительная проверка еще только предстоит.

Мы привели примеры неэффективных методов, которые успели стать достоянием практической медицины, но все же не превратились в общепринятые. К сожалению, опровергнуть укоренившийся метод почти так же невозможно, как невозможно опровергнуть традицию. Самое тщательное доказательство неэффективности давно прижившегося метода в лучшем случае ускорит его естественное отмирание. Так невозможно доказать отсутствие лечебного действия пиявок, этих священных коров практической медицины.

Мы уже говорили о том, что не следует путать достоверность и статистическую значимость. Именно в совершенно недостоверных работах уровень значимости, как правило, не оставляет желать лучшего. Нередко приходится слышать о «высоко достоверных результатах, Р < 0,01», тогда как речь идет о нерандомизированном исследовании, применительно к которому, как мы показали, вообще бессмысленно говорить о значении Р. И наоборот, если в результате правильно проведенного исследования мы получили значение Р < 0,1, то это значит, что вероятность ошибочно признать существование различий не превышает 10% — и это утверждение истинно. Какой практический вывод сделать из этого истинного утверждения, каждый может решить сам. Считать ли вероятность ошибки 10% слишком большой — это вообще не вопрос статистики. Многое тут зависит от того, чем мы

рискуем, признав или отвергнув предлагаемый метод лечения. Меньше всего следует фетишизировать уровень значимости и придавать ему смысл критерия истинности. В конце концов, различие между 5 и 10% чисто количественное. Гораздо важнее тщательно продумывать, какую совокупность должна представлять ваша выборка, как обеспечить случайность формирования групп и уберечься от невольного самообмана при оценке результатов.

Всегда ли нужна рандомизация?

Следует признать, что великие открытия, изменившие облик медицины в середине XX века, такие, как открытие пенициллина, не подвергались проверке в рандомизированных исследованиях.

Порой сами обстоятельства способны натолкнуть на переоценку общепринятых методов лечения. Так, французский военный хирург Амбруаз Парэ в полном соответствии с предписаниями лечил огнестрельные раны кипящим маслом. Однажды, в одну из битв 1536 г., масла на всех раненых не хватило. Части солдат Парэ сделал перевязку, не обработав рану этим целительным средством. Утром он с удивлением обнаружил, что солдаты, чьи раны перед перевязкой были обработаны по всем правилам, корчатся от боли, тогда как просто перевязанные «прекрасно отдохнули и не испытывали болей»*. История умалчивает, подал ли Парэ рапорт о необходимости проведения рандомизированных клинических испытаний эффективности кипящего масла как средства лечения пулевых ранений. Но нам не кажется, что, соверши он свое открытие в наши дни, ему потребовалось бы детальная проверка.

Наконец, рандомизация не всегда возможна. Так, в гл. 11 мы рассмотрели выживаемость после трансплантации костного мозга при остром лимфобластном лейкозе взрослых. Одним больным пересаживался костный мозг близких родственников, дру гим — их собственный. Случайно распределить больных по двум этим группам невозможно, поскольку не у каждого найдется родственник-донор. К счастью для экспериментаторов, само по себе наличие или отсутствие близких родственников не влияет на течение заболевания. Ситуация, когда разделить больных случайным образом невозможно, в медицинских исследованиях возникает довольно часто. В таких случаях надо стремиться сделать группы максимально схожими по всем известным прогностическим факторам.

ДОСТАТОЧНО ЛИ РАНДОМИЗАЦИИ?

Контролируемые рандомизированные клинические испытания сегодня стали эталоном медицинского исследования. Но всегда ли они приводят к верным заключениям? Нет, не всегда. Нередко в исследовании скрыто присутствует множественное сравнение. Исследователь не учитывает эту множественность и в результате, сам того не подозревая, многократно занижает вероятность ошибочно выявить мнимый эффект. Рассмотрим три типичных случая.

Проверкой нового метода лечения независимо друг от друга занимаются несколько исследователей. Получив положительный результат, исследователь опубликует его. А получив отрицательный? Вероятно, воздержится от публикации, но, кроме того, еще и предпримет повторную проверку. В конце концов в одной из многих проверок будет обнаружен желанный «эффект». В гл.

  1.  мы описали эту ситуацию и привели оценки истинной вероятности ошибиться, многократно превышающей вероятность ошибки в единичном испытании.

В медицине приняты широкомасштабные исследования различных методов лечения, используемых прежде всего при хронических болезнях, таких, например, как ишемическая болезнь сердца и сахарный диабет. Результатом исследования является описание огромного числа разнообразных признаков. Данные подвергаются различным группировкам с целью выяснения наиболее информативных признаков, в наибольшей степени влияющих на конечный показатель — выживаемость. Понятно, что

зин»). Между группами не было обнаружено значимых различий по таким признакам, как возраст, пол, число пораженных коронарных артерий и т. д. По одному признаку — сократимости левого желудочка — статистически значимое различие наблюдалось. Несомненно, пытливый исследователь не преминул бы связать это различие с использованием «рандомизина». Однако, увы, по самому важному признаку — выживаемости

  1.  различие было статистически не значимым (см. рис. 12.1 А).

В этой ситуации исследователь наверняка продолжил бы поиск различий, разделив больных на более мелкие группы. Так и поступил Ли. Больные были разделены (стратифицированы) по двум признакам: числу пораженных коронарных артерий (1, 2 или 3) и сократимости левого желудочка (нормальной или сниженной). В результате получилось 6 подгрупп. Влияние рандо- мизина на выживаемость изучалось в каждой из этих подгрупп. Но этого мало. Каждая подгруппа была разделена еще на две в зависимости от наличия или отсутствия сердечной недостаточности. В каждой из получившихся 12 подгрупп вновь оценивалась эффективность рандомизина. Упорные усилия были вознаграждены. В одной из подгрупп (больные с поражением 3 коронарных артерий и сниженной сократимостью левого желудочка) рандомизин оказался эффективен: различия выживаемости «леченых» и «нелеченых» были статистически значимыми, Р < 0,025 (рис. 12.1 Б).

Рандомизин — выдумка. Но многочисленные препараты, эффективность которых была доказана совершенно таким же способом, существуют в действительности. Секрет их «эффективности» очень прост — это множественность сравнений. В исследовании рандомизина бьыо построено 18 пар подгрупп и выполнено 18 сравнений. Чему равна вероятность получить хотя бы один значимый результат в 18 сравнениях, уровень значимости в каждом из которых равен 0,05? Находим: а! = 1 - (1 - a)k = = 1 - (1 - 0,05)18 = 1 - 0,40 = 0,60. Таким образом, истинная вероятность ошибки I рода оказалась в 12 раз выше той, о которой доложил бы исследователь.

Как избежать несостоятельных выводов, не отказываясь от возможности группировать данные? Для этого достаточно в уровне значимости каждого отдельного сравнения учесть, что их более одного. Поправка Бонферрони дает уровень значимости, равный а'/к, где а' — выбранный уровень значимости для всего набора из k сравнений. Это чрезмерно жесткая, заниженная оценка. Наиболее продуктивный подход состоит в применении многофакторных статистических методов*. Помимо прочего, они позволяют обнаружить одновременное влияние более чем двух методов лечения, что в принципе недоступно методам, изложенным ранее.

КОГО МЫ ИЗУЧАЕМ

В лабораторных исследованиях, в исследованиях общественного мнения или потребительского спроса существует достаточная определенность, что представляет собой исследуемая совокупность. Понятно и как организовать представительную выборку из нее. Иначе обстоит дело в клинических исследованиях. Здесь нет ясности ни в том, какова изучаемая совокупность, ни в том, как построить представительную выборку из нее.

Чаще всего исследования проводятся в крупных клиниках, куда попадают далеко не все больные. При всей своей условности рис. 12.2, тем не менее, отражает реальную картину. Из 1000 больных госпитализируется лишь девять и только один попадает в клинику. Ясно, что сложный путь больного по медицинским учреждениям далеко не случаен — он определяется прежде всего тяжестью, сложностью случая или редкостью болезни. Поэтому при всем желании больных в клиниках трудно признать представительной выборкой. Это несоответствие обязательно нужно иметь в виду, решая, на какую совокупность больных могут быть (и в какой мере) распространены полученные в исследовании результаты.

Данные, относящиеся к госпитализированным больным, и прежде всего к больным из крупных клиник, не отражают ни общий спектр болезней и их стадий, ни их взаимосвязь. Исследователи вынуждены изучать взаимосвязь болезней, опираясь на дан ные, относящиеся к госпитализированным или амбулаторным больным. Но разные заболевания и разные стадии одного заболевания требуют разных форм лечения. В результате связь заболеваний представляется искаженной. Человек, страдающий несколькими болезнями, имеет больше шансов попасть в больницу, чем человек с одной болезнью. Поэтому наиболее частый вид искажения — это мнимое обнаружение связи заболеваний или преувеличение действительно существующей связи. В задаче 5.10 мы встретились с более сложным видом искажения, когда из-за неравной вероятности госпитализации создается впечатление о более сильной связи болезни Х с болезью Z, чем с болезнью Y. Данные о связи заболеваний, полученные при изучении госпитализированных больных, следует оценивать с чрез вычайной осторожностью. Эта проблема названа по имени Бер- ксона*, первым обратившего на нее внимание.

КАК УЛУЧШИТЬ ПОЛОЖЕНИЕ

Способность применить статистический подход в медицине не сводится к заучиванию нескольких формул и умению отыскать табличное значение. Как и любая творческая деятельность, применение статистических методов и интерпретация полученных результатов требуют глубокого проникновения в суть дела — понимания как возможностей и ограничений используемых методов, так и существа решаемой клинической задачи. В гл. 1 мы говорили, что значение статистических методов возрастает по мере ужесточения требований к обоснованию эффективности предлагаемых методов лечения. Статистическое обоснование зачастую оказывается важнейшим фактором, определяющим решение в пользу предлагаемого лечения.

В то же время сами медики редко занимаются статистическим обоснованием своих исследований в силу того, что их познания в этой области столь же скромны, сколь и оторваны от практики. Обычно вся статистическая сторона дела перепоручается консультантам, нередко действительно разбирающимся в статистике, но имеющим довольно смутное представление о медицинских вопросах. Единственный выход состоит в том, чтобы медики наконец сами занялись статистическим анализом, поскольку именно они знают цели исследования и несут за него ответственность. Увы, проблема усугубляется еще и тем, что у немалой части исследователей сбор данных предшествует формулировке вопроса, на который они должны бы ответить. На этом пути исследователя неизменно подстерегают малоприятные открытия. Всякий раз исследователь попадает в ситуацию, когда данные собраны и остается только вычислить значение Р, но тут обнаруживается, что это значение существует не само по себе, а лишь в связи с проверкой гипотезы. Но самое обескураживающее — чтобы проверить гипотезу, ее, оказывается, нужно иметь.

Не многие исследователи обременяют себя необходимостью еще до начала сбора данных осознать цели исследования и подлежащие проверке гипотезы. Например, лишь 20% протоколов, одобренных комитетом по клиническим исследованиям одного крупного научно-медицинского центра, содержали четко сформулированные гипотезы*.

Попытайтесь понять, что вы хотите от исследования, какой вопрос вы хотите решить. И когда у вас будет конкретная гипотеза, станет понятно, каким должен быть тип предстоящего эксперимента и какие потребуются данные. Тогда по табл. 12.1 вы легко определите нужный метод анализа. Придерживаясь этих правил, вы всегда соберете данные, необходимые и достаточные для анализа.

Лишь очень немногие поступают таким образом. Поэтому неудивительно, что, когда настает время вычислить значение Р, исследователь обнаруживает, что собранные им данные мало связаны с проверяемой гипотезой, да к тому же нарушают предпосылки известных ему статистических методов. Но не начинать же все с начала. Поэтому для устранения и сглаживания статистических несообразностей на этом, завершающем этапе призывается специалист, который оставляет от Монблана данных немногое, хоть как-то пригодное для анализа, заменяет неприменимые параметрические методы неприхотливыми, но менее чув ствительными непараметрическими или предлагает вместо одной гипотезы перейти к нескольким, пригодным для статистической проверки. Отчет об исследовании приобретает приемлемый вид. Однако само исследование не становится более осмысленным. Способ избежать этого прост и состоит в том, чтобы задуматься о том, как анализировать данные, в начале, а не в конце исследования.

С примерами несостоятельных работ мы неоднократно встречались в этой книге. Еще чаще они встречаются в жизни. Поэтому серьезный врач, особенно исследователь, не должен принимать за чистую монету все, что пишется в журналах.

Знакомясь с материалами очередного исследования, обратите внимание, названы ли:

  1.  подлежащая проверке гипотеза;
  2.  использованные данные и способ их получения (включая метод рандомизации);
  3.  совокупность, которую представляют используемые в исследовании выборки;
  4.  статистические методы, использованные для оценки гипотезы.

Очень трудно найти публикацию, которая бы содержала все это. Но чем ближе она к такому идеалу, тем вернее можно положиться на приведенные в ней выводы. Напротив, очень мало доверия заслуживает статья, в которой использованные методы не указаны вовсе или упоминаются некие «стандартные методы».

Возвращаясь к вопросу об этичности исследований на людях, хочется подчеркнуть, что чем менее грамотно и добросовестно исследование, тем менее оно этично, как по отношению к тем больным, которые в нем участвовали, так и ко всем больным, лечение которых напрямую зависит от его результатов. Неэтичен любой вводящий в заблуждение результат. Неэтично подвергать людей страданиям и мучить лабораторных животных ради получения данных, на основании которых невозможно сделать какой-либо вывод. Неэтично выполнять такие исследования, опровержение которых потребует чьих-то сил, здоровья и средств.

Конечно, тщательная проработка статистической стороны исследования не освобождает исследователя от обязанности тща тельно продумать эксперимент с врачебной точки зрения, свести риск и страдания больных к минимуму. Больше того, она даже не гарантирует, что в исследовании будут получены глубокие и новаторские результаты. Иными словами, статистическая корректность — это необходимое, но еще не достаточное условие успеха исследования.

Как же изменить исследовательскую практику к лучшему? Прежде всего, будьте активны. Если это от вас зависит, не подпускайте к исследованиям людей, несведущих в статистике, как не подпускаете тех, кто не смыслит в медицине. Встретив статистические несуразности в журнале, пишите редактору*. Не стесняйтесь задавать вопросы своим коллегам. Не поддавайтесь гипнозу наукообразия — докапывайтесь до сути дела. Когда вас осыпают мудреными терминами, спросите, что в данном случае означает Р. Но самое главное, чтобы ваши собственные исследования были безупречны с точки зрения планирования и применения статистических методов.

1. Цели и задачи дисциплины:

Цель – Цель дисциплины «Медицинская статистика» – дать знания и умения, необходимые будущему специалисту для работы в сфере медицинской статистики, необходимые для планирования статистических исследований в сестринском деле, построения дизайна исследований, правильного сбора и анализа информации.  

Задачи - научить студентов:  планированию статистических исследований состояния здоровья населения с целью его сохранения, укрепления и восстановления; основам использования и анализа информации о здоровье населения и деятельности лечебно-профилактических и санитарно-профилактических учреждений для предложения мероприятий по повышению качества и эффективности медицинской и медико-профилактической помощи.


2. Место дисциплины в структуре ООП:

Дисциплина «Медицинская статистика» относится к циклу дисциплин ФГОС по специальности 060500 «Сестринское дело» квалификация (степень) бакалавр высшего профессионального медицинского образования, изучается в  третьем семестре.

№ п/п

Наименование предшествующих  дисциплин

№  модулей данной дисциплины, опирающихся на изучение предшествующих  дисциплин

1

1.

Математика

+

2.

Информатика

+

 

В результате изучения программы предшествующих дисциплин студент должен:

иметь практический опыт:

-работы с нормативно-правовыми документами;

-работы с прикладными информационными программами, используемыми в здравоохранении;

-работы в команде;

-ведения медицинской документации;

уметь:

-организовывать рабочее место;

-рационально организовать деятельность персонала и соблюдать психологические и этические аспекты работы в команде;

-анализировать эффективность своей деятельности;

-внедрять новые формы работы;

-использовать нормативно-правовую документацию, регламентирующую профессиональную деятельность;

-вести утвержденную медицинскую документацию, в том числе с использованием информационных технологий;

-пользоваться прикладным программным обеспечением в сфере профессиональной деятельности;

-применять информационные технологии в профессиональной деятельности (АРМ – автоматизированное рабочее место);

-применять методы медицинской статистики, анализировать показатели здоровья населения и деятельности учреждений здравоохранения;

-участвовать в защите прав субъектов лечебного процесса;

знать:

-основы современного менеджмента в здравоохранении;

-основы организации работы коллектива исполнителей;

-принципы делового общения в коллективе;

-основные нормативные и правовые документы, регулирующие профессиональную деятельность;

-основные численные методы решения прикладных задач;

-использование компьютерных технологий в здравоохранении;

-виды медицинской документации, используемые в профессиональной деятельности;

-принципы ведения учета и отчетности в деятельности фельдшера;

-функциональные обязанности медсестры и других работников структурного подразделения;

-вопросы экономики, планирования, финансирования здравоохранения;

-основы организации лечебно-профилактической помощи населению;

-принципы организации оплаты труда медицинского персонала учреждений здравоохранения;

Требования к результатам освоения содержания дисциплины

Процесс изучения дисциплины направлен на формирование элементов следующих компетенций в соответствии с ФГОС ВПО и ООП ВПО по данному направлению подготовки :

а) общекультурных (ОК):

• владение культурой мышления, способность к обобщению, анализу, восприятию информации к постановке цели и выбору путей её достижения (ОК-1);

•  умение логически верно, аргументировано и ясно строить устную и письменную речь (ОК-2);

•  готовность к кооперации с  коллегами, работе в коллективе (ОК-3);

•  способностью находить организационно-управленческие решения в нестандартных ситуациях и готов нести за них ответственность (ОК-4);

•  умением использовать нормативные правовые документы в своей деятельности (ОК-5);

• стремление к саморазвитию, повышению своей квалификации и мастерства (ОК-6);

• умение критически оценивать свои достоинства и недостатки, наметить пути и выбрать средства развития домтоинств и устранения недостатков

(ОК-7)

• осознание социальной значимости своей будущей профессии, обладание высокой мотивацией к выполнению профессиональной деятельности  (ОК-8);

•  использование основных законов естественнонаучных дисциплин профессиональной деятельности, применением методов математического анализа, теоретического и экспериментального исследования (ОК-10)

•  владением основными методами, способами и средствами получения, хранения, переработки информации, наличием навыков работы с компьютером как средством управления информацией (ОК-12);

• владением основными методами защиты производственного персонала и населения от возможных последствий аварий, катастроф, стихийных бедствий (ОК-15).

б) профессиональных (ПК)

• способность выполнять сестринские манипуляции (оказывать медицинские услуги), подготавливать пациента к диагностическим процедурам, осуществлять лекарственную терапию по назначению врача (ПК-1)

• готовность обеспечить квалифицированный уход за пациентом с учетом его индивидуальных потребностей и проблем, на основе владения методами сбора и оценки данных о состоянии здоровья пациента, методологии сестринского процесса, результатов оценки эффективности оказания медицинской и медико-социальной помощи пациенту (ПК-2)

• готовность к взаимодействию с коллегами и работе в коллективе, в том числе в составе лечебной бригады в соответствии с утвержденными порядками оказания медицинской помощи больным (ПК-3)

•  готовность к взаимодействию с коллегами и к работе в коллективе

(ПК-4);

• способность применять знания общих закономерностей происхождения и развития жизни, строения и функционирования клеток, тканей, органов и систем организма, представления о факторах формирования здоровья, защитно-приспособительных процессах, регуляции и саморегуляции в норме и патологии, с целью проведения целенаправленных мероприятий по профилактике заболеваний, укреплению восстановлению здоровья индивида и группы населения (ПК-7)

• способность вести пропаганду здорового образа жизни на основе научного представления о здоровом образе жизни, владения методами, умениями и навыками физического самосовершенствования (ПК-8)

• способность консультировать пациента (семью) по вопросам профилактики обострений заболеваний, их осложнений, травматизма, вопросам организации рационального питания, обеспечения безопасной среды, физической нагрузки ( ПК-9)

• готовность проводить исследовательскую работу в области своей профессиональной деятельности по анализу и оценке качества сестринской помощи, способствовать внедрению современных медицинских технологий (ПК-10);

• готовностью работать с нормативно-распорядительной документацией и применять основы экономических и правовых знаний для реализации профессиональных функций в области здравоохранения (ПК-11);

• способность и готовность к реализации правовой компетентности, соблюдению норм в области профессиональной деятельности и оказанию помощи в защите прав и интересов пациента (ПК-12)

• способностью к руководству сестринским персоналом и готовностью к разработке управленческих решений по повышению эффективности работы структурного подразделения/учреждения (ПК-13);

• способностью к анализу работы, оценке потенциальных возможностей развития и определению потребности в изменениях сестринской службы структурного подразделения/учреждения и готовностью к составлению программ нововведений и разработке плана мероприятий по их реализации (ПК-14);

• способность и готовность к организации мероприятий по оценке, повышению квалификации, переподготовке кадров со средним медицинским образованием (ПК-15)

• готовностью осуществлять сбор и обработку медико-статистических данных (ПК-16);

• готовностью к оперативному поиску, обмену, анализу информации в области исследований в сестринской практике и медицине; способностью к созданию условий для их осуществления (ПК-17).

• готовность проводить исследовательскую работу в области своей профессиональной деятельности (ПК-18)

В результате изучения дисциплины студент должен:

Модуль 1 «Основы медицинской статистики».

иметь практический опыт:

- работы с нормативно-правовыми документами;

- работы с прикладными информационными программами, используемыми в здравоохранении;

- работы в команде;

- ведения медицинской документации;

уметь:

- организовывать рабочее место;

- рационально организовать деятельность персонала и соблюдать психологические и этические аспекты работы в команде;

- анализировать эффективность своей деятельности;

- внедрять новые формы работы;

- использовать нормативно-правовую документацию, регламентирующую профессиональную деятельность;

- вести утвержденную медицинскую документацию, в том числе с использованием информационных технологий;

- пользоваться прикладным программным обеспечением в сфере профессиональной деятельности;

- применять информационные технологии в профессиональной деятельности (АРМ – автоматизированное рабочее место);

- применять методы медицинской статистики, анализировать показатели здоровья населения и деятельности учреждений здравоохранения;

-участвовать в защите прав субъектов лечебного процесса;

знать:

- основы современного менеджмента в здравоохранении;

-основы организации работы коллектива исполнителей;

-принципы делового общения в коллективе;

-основные нормативные и правовые документы, регулирующие профессиональную деятельность;

- программное и аппаратное обеспечение вычислительной техники;

- компьютерные сети и сетевые технологии обработки информации;

- методы защиты информации;

-основные понятия автоматизированной обработки информации;

-базовые, системные, служебные программные продукты и пакеты прикладных программ;

- использование компьютерных технологий в здравоохранении;

-демографические проблемы Российской Федерации, региона;

- состояние здоровья населения Российской Федерации;

-значение мониторинга;

-медицинскую статистику;

-виды медицинской документации, используемые в профессиональной деятельности;

- принципы ведения учета и отчетности в деятельности медперсонала ЛПУ;

- функциональные обязанности  работников структурных  подразделений ЛПУ;

- вопросы экономики, планирования, финансирования здравоохранения;

- основы организации лечебно-профилактической помощи населению;

-принципы организации оплаты труда медицинского персонала учреждений здравоохранения;

-основные вопросы ценообразования, налогообложения и инвестиционной политики в здравоохранении;

-основные вопросы финансирования здравоохранения, страховой медицины;

-принципы организации медицинского страхования.

Объем дисциплины и виды учебной работы (заочное  отделение бакалавриата)

Вид учебной работы

Всего

часов

Семестры

3

Аудиторные занятия (всего)

72

72

В том числе:

Лекции (Л)

19

19

Практические занятия (ПЗ)

29

29

Самостоятельная работа  (всего)

24

24

В том числе:

Выполнение домашних заданий в рабочих тетрадях для самостоятельной работы

2

2

Решение задач

2    

2    

Составление развернутого плана ответа на заданную тему

1     

1     

Работа с тестами для самоподготовки  

2

2

Составление конспектов по заданным темам

3

3

Написание  рефератов

2

2

Участие в создании наглядных учебных пособий

3

3

Разработка обучающих компьютерных программ

2

2

Составление тематических кроссвордов

1

1

Составление тестовых заданий по изучаемым темам

Составление  проблемно-ситуационных задач

Создание презентаций

Вид промежуточной аттестации. Зачёт.

Подготовка и сдача экзамена

Общая трудоемкость                                     72                                             


Структура и содержание дисциплины

п/п

Модуль

дисциплины

Семестр

Неделя

семестра

Виды учебной работы, включая самостоятельную работу студентов и трудоемкость (в часах)

Рубежные контрольные

и неделя проведения

Лекции

Прак.

занят.

Самост.

работа

1

Модуль 1.

3

 

19

  29

   24

Итого

3

 

19

  29   

   24

5.2. Элементы компетенций, формируемые данной дисциплиной

1. ОК-1. Владение культурой мышления, способность к обобщению, анализу, восприятию информации, постановке цели и выбору путей ее достижения

1.1. Компонент – способность к культуре мышления,  к обобщению, анализу, постановке цели и ее достижению.

1.1.1. Содержание на занятиях по различным темам у студентов формируется способность анализировать и синтезировать факты, развивать мышление, ставить цели и планировать пути ее достижения.

1.1.2. Технология - анализ учебной, справочной и научной литературы, сравнительный анализ различных источников, конспектирование, систематизация и обобщение учебного материала

1.1.3. Контроль -  устный опрос, письменный опрос, проверочная работа, решение тестов.

2. ОК-2. Умение логически верно, аргументировано и ясно строить устную и письменную речь.

2.1.  Компонент – способность логически мыслить, грамотно строить устную и письменную речь.

2.1.1. Содержание – на занятиях формируются навыки логического и ясного построения устного и письменного общения.

2.1.2. Технология - анализ учебной, справочной и научной литературы, сравнительный анализ различных источников, конспектирование, систематизация и обобщение учебного материала.

2.1.3. Контроль -  устный опрос, письменный опрос, проверочная работа, решение тестов.

3. ОК-3. Готовность к кооперации с коллегами, работе в коллективе.

3.1. Компонент – способность к работе в коллективе, совместной деятельности с коллегами.

3.1.1. Содержание - в ходе изучения всей дисциплины студенты на занятиях формируют навыки работы в коллективе.

3.1.2. Технология – решение ситуационных  задач и выполнение других заданий группами

3.1.3. Контроль – оценка работы группами, взаимооценка.

4. ОК-4. Способность находить организационно-управленческие решения в нестандартных ситуациях и готовность нести за них ответственность;

4.1. Компонент - организационно-управленческие решения в нестандартных ситуациях, ответственность за их принятие.

4.1.1.  Содержание – на занятиях изучаются понятия и методы, необходимые для решения нестандартных ситуаций.

4.1.2. Технология – используются активные методы обучения (проблемные лекции, тематические дискуссии, мозговой штурм, анализ конкретных ситуаций, учебная игра.

4.1.3. Контроль - беседа, фронтальный опрос, тестирование,  оценка активности студентов при проведении дискуссии, «мозгового штурма».

5. ОК-5.Умение использовать нормативные правовые документы в своей деятельности ;

5.1. Компонент – способность использовать нормативно- правовые документы в сестринской деятельности.

5.1.1. Содержание - изучение на занятиях нормативных и правовых документов, регламентирующих деятельность в маркетинге здравоохранения

5.1.2. Технология – лекция, учебная и справочная литература, интернет ресурсы.

5.1.3. Контроль – опрос, письменное задание, тестирование.

6. ОК-6. Стремление к саморазвитию, повышению своей квалификации и мастерства

6.1. Компонент – способность к саморазвитию, повышению своей квалификации.

6.1.1. Содержание - ознакомление с теорией и практикой, понятиями науки и практики, анализ образовательных технологий обучения, содержательная характеристика направлений повышения квалификации и мастерства.

6.1.2. Технология - проблемная лекция, примеры практических ситуаций, деловая игра, самостоятельная работа с литературой..

6.1.3. Контроль - устный и письменный опрос, тестирование.

7.  ОК  7 Умение критически оценивать свои достоинства и недостатки, наметить пути и выбрать средства развития домтоинств и устранения недостатков

7.1 Компонент – критическая оценка своих достоинств и недостатков

7.1.1. Содержание –изучение своих достоинств и недостатков

7.1.2. Технология – собеседование, практическая деятельность

8. ОК 8. Осознание социальной значимости своей будущей профессии, обладанием высокой мотивацией к выполнению профессиональной деятельности;

8.1. Компонент – социальная значимость своей профессии, мотивация к выполнению профессиональной деятельности.

8.1.1. Содержание – изучение социальных аспектов профессии, факторов, способствующих высокой мотивации к профессиональной деятельности.

8.1.2. Технология – лекция, собеседование, практическая деятельность.

8.1.3. Контроль – анкетирование, тестирование, опрос, делова игра.

9. ОК 10 Использование основных законов естественнонаучных дисциплин профессиональной деятельности, применением методов математического анализа, теоретического и экспериментального исследования

9.1. Компонент – основные законы естественнонаучных дисциплин профессиональной деятельности

9.1.1. Содержание – изучение основных законов естественнонаучных дисциплин профессиональной деятельности, методов математического анализа, теоретического и экспериментального исследования

9.1.2. Технология – лекция, собеседование, практическая деятельность

9.1.3. Контроль – устный опрос, проверка письменных заданий, докладов

10. ОК – 12. владение основными методами, способами и средствами получения, хранения, переработки информации, наличием навыков работы с компьютером как средством управления информацией;

10.1. Компонент – основные методы и средства получения, хранения, переработки информации, наличием навыков работы с компьютером.

10.1.1. Содержание – в ходе изучения дисциплины при подготовке к практическим занятиям, выполнении письменных заданий, проектной деятельности студенты приобретают навык  библиографической и информационно-поисковой работы, необходимый при решении профессиональных задач, работы с компьютером

10.1.2.Технология - самостоятельная работа студентов с учебной, справочной и научной литературой, с Интернет-ресурсами, написание докладов, обсуждение.

10.1.3.Контроль - устный опрос, проверка письменных заданий и докладов.

11. ОК-15  владение основными методами защиты производственного персонала и населения от возможных последствий аварий, катастроф, стихийных бедствий

11.1.Компонент - основными методами защиты производственного персонала и населения от возможных последствий аварий, катастроф, стихийных бедствий

11.1.1 Содержание – изучение основных методов защиты персонала и населения от возможных последствий аварий, катастроф, стихийных бедствий

11.1.2 Технология.- собеседование, практическая деятельность

11.1.3. Контроль – опрос, решение ситуационных задач

12. ПК-1. Способность выполнять сестринские манипуляции (оказывать медицинские услуги), подготавливать пациента к диагностическим процедурам, осуществлять лекарственную терапию по назначению врача;

12.1. Компонент – сестринские манипуляции, подготовка пациента к процедурам, выполнение назначений врача.

12.1.1.Содержание – изучение сестринских манипуляций, подготовки пациентов к процедурам, сестринских вмешательств  при терапевтической, хирургической, акушерско-гинекологической и педиатрической патологии.

12.1.2.Технология – лекция, решение ситуационных задач,  контрольная письменная работа, работа с муляжами.

12.1.3.Контроль - опрос, деловая игра, тестирование, оценка контрольной работы.

13. ПК -2.  Готовность обеспечить квалифицированный уход за пациентом с учетом его индивидуальных потребностей и проблем, на основе владения методами сбора и оценки данных о состоянии здоровья пациента, методологии сестринского процесса, результатов оценки эффективности оказания медицинской и медико-социальной помощи пациенту

13.1. Компонент – квалифицированный уход за пациентом

13.1.1.Содержание – при изучении дисциплины определяются индивидуальные потребности и проблемы  пациента на основе владения методологии сестринского процесса при различной патологии в условиях общеврачебной практики.

13.1.2.Технология – лекция, решение ситуационных задач,  контрольная письменная работа, самостоятельная работа с литературой, доклады, рефераты.

13.1.3. Контроль – устный и письменный опрос, тестирование, оценка контрольной работы, реферата.

14. ПК- 3. Готовность к взаимодействию с коллегами и работе в коллективе, в том числе в составе бригады менеджеров

14.1. Компонент – взаимодействие с коллегами и работа в составе бригады менеджеров

14.1.1. Содержание – изучение правил взаимодействия в закрытом коллективе

14.1.2. Технология – лекция, решение ситуационных задач,  контрольная письменная работа, самостоятельная работа с литературой, рефераты, делова игра.

14.1.3. Контроль – устный и письменный опрос, тестирование, оценка контрольной работы, результатов решения ситуационных задач, реферата.

15. ПК- 4. готовностью оказать медицинскую помощь при неотложных и угрожающих жизни состояниях;

15.1. Компонент - медицинская помощь при неотложных и угрожающих жизни состояниях при терапевтической, хирургической, акушерско-гинекологической и педиатрической патологии

15.1.1.Содержание – изучение алгоритмов сестринской помощи при неотложных и угрожающих жизни состояниях при заболеваниях различного профиля независимо от пола и возраста пациента

15.1.2.Технология - лекция, решение ситуационных задач,  контрольная письменная работа, самостоятельная работа с литературой, рефераты, делова игра.

15.1.3. Контроль - устный и письменный опрос, тестирование, оценка контрольной работы, результатов решения ситуационных задач, реферата.

16. ПК- 7 Способность применять знания общих закономерностей происхождения и развития жизни, строения и функционирования клеток, тканей, органов и систем организма, представления о факторах формирования здоровья, защитно-приспособительных процессах, регуляции и саморегуляции в норме и патологии, с целью проведения целенаправленных мероприятий по профилактике заболеваний, укреплению восстановлению здоровья индивида и группы населения;

16.1. Компонент - мероприятия по профилактике заболеваний, укреплению восстановлению здоровья индивида и группы населения ;

16.1.1.Содержание – применение в ходе изучения данной дисциплины знаний общих закономерностей происхождения и развития жизни, строения и функционирования клеток, тканей, органов и систем организма, представления о факторах формирования здоровья, защитно-приспособительных процессах, регуляции и саморегуляции в норме и патологии

16.1.2.Технология - лекция, решение ситуационных задач, самостоятельная работа с литературой, рефераты, доклады.

16.1.3Контроль - устный и письменный опрос, тестирование, результатов решения ситуационных задач, реферата.

17. ПК-8. Способность вести пропаганду здорового образа жизни на основе научного представления о здоровом образе жизни, владения методами, умениями и навыками физического самосовершенствования;

17.1. Компонент -  пропаганда здорового образа жизни

17.1.1.Содержание – использование на занятиях научных представлений о здоровом образе жизни, методов, умений и навыков физического самосовершенствования с целью пропаганды здорового образа жизни

17.1.2.Технология - лекция, решение ситуационных задач, самостоятельная работа с литературой, рефераты, доклады, наглядные материалы, подготовка презентаций.

17.1.3 Контроль - устный и письменный опрос, тестирование, результатов решения ситуационных задач, реферата, презентаций.

18. ПК-9. Способность консультировать пациента (семью) по вопросам профилактики обострений заболеваний, их осложнений, травматизма, вопросам организации рационального питания, обеспечения безопасной среды, физической нагрузки;

18.1. Компонент – навыки консультировать пациента

18.1.1. Содержание – изучение вопросов и особенностей профилактики обострений заболеваний, их осложнений, травматизма организации рационального питания, обеспечения безопасной среды, физической нагрузки при патологии различного профиля;

18.1.2. Технология - лекция, решение ситуационных задач, самостоятельная работа с литературой, рефераты, доклады, подготовка презентаций

18.1.3. Контроль - устный и письменный опрос, тестирование, результатов решения ситуационных задач, реферата, презентаций.

19. ПК-10. Способность обеспечить выполнение требований к лечебно-охранительному, санитарно-гигиеническому и санитарно-эпидемиологическому режиму в медицинском учреждении;

19.1. Компонент - выполнение требований к лечебно-охранительному, санитарно-гигиеническому и санитарно-эпидемиологическому режиму в медицинском учреждении;

19.1.1. Содержание – изучение нормативных документов по лечебно-охранительному, санитарно-гигиеническому и санитарно-эпидемиологическому режиму в медицинском учреждении, в ЛПУ терапевтического, хирургического, акушерско-гинекологического и педиатрического профилей.

19.1.2.Технология – лекция, решение проблемных ситуаций, контрольная работа, самостоятельная работа с литературой и интернет ресурсами, доклады.

19.1.3. Контроль – устный и письменный опрос, тестирование, оценка результатов решения проблемных ситуаций, докладов.

20.ПК-11. Готовность работать с нормативно- распорядительной документацией и применять основы экономических и правовых знаний для реализации профессиональных функций в области здравоохранения

20.1 Компонент - оперативный поиск, обмен, анализ информации

20.1.1. Содержание – при изучении дисциплины овладение навыками работы с оперативно-распорядительной документацией

20.1.2.Технология – самостоятельная работа с документацией, решение ситуационных задач

20.1.3. Контроль - устный и письменный опрос, результатов решения письменных заданий, реферата, презентаций.

21.ПК-12 Способность и готовность к реализации правовой компетентности, соблюдению норм в области профессиональной деятельности и оказанию помощи в защите прав и интересов пациента

21.1 Компонент – поиск и анализ научной информации по вопросам правовой компетентности

21.1.1. Содержание – при изучении дисциплины овладение навыками оказания помощи в защите прав и интересов пациента

21.1.2.Технология – самостоятельная работа с документацией, решение ситуационных задач

21.1.3. Контроль - устный и письменный опрос, оценка результатов решения письменных заданий, реферата, презентаций.

22.ПК-13 Способность к руководству сестринским персоналом и готовность к разработке управленческих решений по повышению эффективности работы структурного подразделения/ учреждения

22.1 Компонент – поиск и анализ научной информации по вопросам повышения эффективности  работы структурного  подразделения/учреждения

22.1.1. Содержание – при изучении дисциплины овладение навыками повышения эффективности работы подразделения

22.1.2.Технология – самостоятельная работа с документацией, решение ситуационных задач

22.1.3. Контроль – оценка результатов решения письменных заданий, реферата, презентаций, деловая игра

23. ПК -14 Способность к анализу работы, оценке потенциальных возможностей развития и определению потребности в изменениях сестринской службы структурного подразделения/учреждения и готовность к  составлению программ нововведений  и разработке плана мероприятий по их реализации

23.1 Компонент –анализ работы сестринской службы

23.1.1. Содержание – при изучении дисциплины овладение навыками определения потребности в изменениях сестринской службы, составление программ нововведений

23.1.2.Технология – самостоятельная работа с документацией, решение ситуационных задач

23.1.3. Контроль – оценка результатов решения письменных заданий, реферата, презентаций, деловая игра

24. ПК – 15 Способность и готовность к организации мероприятий по оценке, повышению квалификации, переподготовке кадров со средним медицинским образованием

24.1 Компонент – организация мероприятий по оценке, повышению квалификации, переподготовке кадров со средним медицинским образованием

24.1.1. Содержание – при изучении дисциплины овладение навыками организации повышения квалификации и переподготовке кадров со средним медицинским образованием

24.1.2.Технология – самостоятельная работа с документацией, решение ситуационных задач

24.1.3. Контроль – оценка результатов решения письменных заданий, реферата, презентаций, деловая игра

25. ПК-16 Готовность осуществлять сбор и обработку медико-статистических данных

25.1 Компонент – организация мероприятий по сбору и обработке медико-статистических данных

25.1.1. Содержание – при изучении дисциплины овладение навыками по сбору и обработке медико-статистических данных

25.1.2.Технология – самостоятельная работа с документацией, решение ситуационных задач

25.1.3. Контроль – оценка результатов решения письменных заданий, реферата, презентаций, решение ситуационных задач

26. ПК-17. Готовность к оперативному поиску, обмену, анализу информации в области исследований в сестринской практике и медицине; способностью к созданию условий для их осуществления;

26.1. Компонент - оперативный поиск, обмен, анализ информации в области исследований в сестринской практике

26.1.1.Содержание – при изучении дисциплины овладение навыками оперативного поиска, обмена, анализа информации в области исследований в сестринской практике

26.1.2.Технология - лекция, решение заданий с научно-исследовательским компонентом, самостоятельная работа с литературой, рефераты, доклады, подготовка презентаций

26.1.3. Контроль - устный и письменный опрос, результатов решения письменных заданий, реферата, презентаций.

27. ПК-18.  Готовность проводить исследовательскую работу в области своей профессиональной деятельности.

27.1 Компонент – поиск и анализ научной информации по вопросам

27.1.1. Содержание – осуществление исследовательской деятельности при изучении дисциплины «Маркетинг в здравоохранении»

27.1.2. Технология – выполнение заданий с научно-исследовательским компонентом, самостоятельная работа с литературой, рефераты, доклады, подготовка презентаций

27.1.3. Контроль -  устный и письменный опрос,  оценка результатов решения письменных заданий, реферата, презентаций.


Модули дисциплины и междисциплинарные связи с обеспечиваемыми (последующими) дисциплинами

№ п/п

Наименование обеспечиваемых

(последующих) дисциплин

№ № модулей данной дисциплины,

необходимых для изучения обеспечиваемых  (последующих) дисциплин

1

1.

Сестринское дело в терапии

+

2.

Сестринское дело в педиатрии

+

3.

Сестринское дело в хирургии

+

4.

Основы сестринского дела

+

5.

Математика

+

6.

Информатика

+

Содержание дисциплины

  1.  Содержание модулей дисциплины

№ п/п

Наименование модуля

дисциплины Общая трудоемкость

(в часах)

Содержание модуля

( в дидактических единицах)

Компетенции

1

РАЗДЕЛ 1.Модуль 1. «Медицинской статистики»

2

ТЕМА 1.1. Статистическая совокупность и ее элементы

Предмет, содержание медицинской статистики.

Статистическая совокупность, единица наблюдения, учетные признаки, их классификация. Генеральная и выборочная совокупность. Условия формирования выборочной совокупности.

3.

ТЕМА1.2. Статистическое исследование и этапы его проведения

Статистическое исследование, его этапы. Составление плана и программы исследования. Определение целей и задач исследования. Сбор материала. Способы сбора материала. Разработка материала. Понятия шифровки и группировки материала. Группы статистических показателей. Теория статистических таблиц. Графическое изображение материала. Методика анализа полученных данных. Составление выводов и рекомендаций.

Структура  модулей

№ п/п

Содержание

Трудоемкость (час)

Недели в семестре

Модуль 1

Раздел 1: Тема «Медицинская статистика».

 

1. Аудиторная работа

а) Лекции

1.

Статистическая совокупность и ее элементы.

2

2.

 Статистическое исследование и этапы его проведения.

2

б) Практические занятия

1.

Статистическая совокупность и ее элементы.

3

2.

Статистическое исследование и этапы его проведения.

    Текущий контроль

    Рубежный контроль

Самостоятельная внеаудиторная работа

реализуемая в рамках всей дисциплины (без привязки к конкретному модулю).

Обязательная внеаудиторная самостоятельная работ

Вид работы

Трудоемкость

(час)

Вид контроля 

Выполнение домашних заданий в рабочих тетрадях для самостоятельной работы

2

Проверка домашних заданий.

Решение задач

2    

Задачи в виде ситуаций для индивидуального решения.

Составление развернутого плана ответа на заданную тему

1     

Контроль процесса составления развёрнутого плана ответа на заданную тему

Работа с тестами для самоподготовки  

2

Контроль тестовых заданий.

Составление конспектов по заданным темам

3

Проверка содержания конспектов.

Написание  рефератов

2

Проверка рефератов и предварительное прослушивание перед публичным выступлением.

Дополнительная внеаудиторная самостоятельная работа

Вид работы

Трудо-

емкость

(час)

Вид контроля 

Участие в создании наглядных учебных пособий

3

Проверка наглядных пособий.

Разработка обучающих компьютерных программ

2

Проверка обучающих компьютерных рабочих программ.

Составление тематических кроссвордов

1

Проверка кроссвордов.

Составление тестовых заданий по изучаемым темам

Проверка тестовых заданий.

Составление проблемно-ситуационных задач

Проверка проблемно – ситуационных задач.

Создание презентаций

Проверка презентаций.

Виды контроля.

Темы рефератов.

1. История Медицинской статистики.

2. Организация статистического исследования в ЛПУ.

3. Формы и методы контроля и оценки качества медицинской деятельности.

4. Методы сбора и обработки медико-статистической информацию

5. Статистика здоровья населения.

Тесты.

01. Затраты государства на здравоохранение окупаются посредством

а) увеличения средней продолжительности предстоящей жизни

б) снижения общей смертности населения

02. Рентабельность ЛПУ – это

а) экономное расходование средств

б) показатель эффективности работы ЛПУ

в) технизация медицины

03. Один из основных показателей эффективности работы ЛПУ

а) рентабельность

б) количество выписанных больных с выздоровлением

в) себестоимость

04. В условиях ОМС стационары финансируются за счет

а) объема оказанных услуг

б) качества медицинских услуг

05. Цель медицинского страхования

а) гарантировать гражданам получение медицинской помощи

 при возникновении страхового случая;

б) гарантировать гражданам получение страховой суммы

 по истечению срока страхования

06. Обязательное медицинское страхование является

а) всеобщим

б) индивидуальным

в) коллективным

07. Формы добровольного медицинского страхования

а) индивидуальная

б) коллективная

в) всеобщая

08. Правовой базой ОМС (обязательного медицинского страхования)

являются

а) закон РФ "О медицинском страховании граждан"

б) "Основы законодательства об охране здоровья граждан"

в) федеральные целевые программы

09. Формы собственности в РФ

а) частная

б) государственная

в) муниципальная

г) аграрная

д) промышленная

10. Целью аккредитации медицинского учреждения является

а) определение объема медицинской помощи

б) повышение квалификационной категории сотрудников

в) установление соответствия стандарту качества медицинской помощи

11. Лицензия – это

а) разрешение на определенный вид и объем деятельности

б) трудовой договор

в) разрешение на предоставление населению

 любых видов медицинских услуг

12. Продуктом отрасли здравоохранения является

а) показатель рождаемости

б) показатель смертности

в) объем оказанных медицинских услуг

13. Лицензирование медицинского учреждения включает

а) определение соответствия качества медицинской помощи стандартам

б) выдачу документов на право заниматься

 определенным видом лечебно-профилактической деятельности

в) сертификация специалистов лечебных учреждений

14. Выдача документов на право заниматься

определенным видом лечебно-профилактической деятельности

в системе медицинского страхования – это

а) аккредитация медицинского учреждения

б) лицензирование медицинского учреждения

15. Компоненты оценки качества медицинской помощи

а) эффективность

б) экономичность

в) простота

г) адекватность

16. Основным компонентом оценки качества медицинской помощи

является

а) эффективность

б) доступность

в) экономичность

17. Эффективность медицинской помощи означает

степень достижения конкретных результатов

а) при определенных материальных затратах

б) при определенных временных, трудовых и материальных затратах

18. Эффективность медицинской помощи зависит

а) от выбора технологий и их соблюдения

б) от вида медицинской помощи

в) от объема медицинской помощи

г) от количества страхового взноса

19. Уровень "качества" медицинских кадров включает

а) квалификацию кадров

б) добросовестность кадров

в) соблюдение принципов этики и деонтологии

г) состояние объекта здравоохранения

001. Под статистикой понимают

            а) самостоятельную общественную науку, изучающую количественную сторону массовых явлений в неразрывной связи с их качественной стороной

            б) сбор, обработку и хранение информации, характеризующей количественные закономерности общественных явлений

            в) анализ массовых количественных данных с использованием статистическо-математических методов

            г) анализ массовых количественных данных с использованием статистическо-математических методов

            д) статистическо-математические методы при сборе, обработке и хранении информации

 

002. Под медицинской статистикой понимают

            а) отрасль статистики, изучающей здоровье населения

            б) совокупность статистических методов, необходимых для анализа деятельности ЛПУ

            в) отрасль статистики, изучающей вопросы, связанные с медициной, гигиеной, санитарией и здравоохранением

            г) отрасль статистики, изучающей вопросы, связанные с медицинской и социальной гигиеной

            д) отрасль статистики, изучающая вопросы, связанные с социальной гигиеной, планированием и прогнозирование деятельности ЛПУ

003. Предметом изучения медицинской статистики являются

           а) информация о здоровье населения

           б) информация о влиянии факторов окружающей среды на здоровье человека

           в) информация о кадрах, сети и деятельности учреждений и служб здравоохранения

           г) информация о результатах клинических и экспериментальных исследованиях в медицине

          д) все вышеперечисленное

004. Здоровье населения рассматривается (изучается) как

         а) многофакторная проблема, включающая в себя цели и задачи по изучению здоровья населения и влияющих факторов окружающей среды

         б) величина, определяющая здоровье общества как целостно функционирующего организма

         в) все вышеперечисленное

005. Статистическими измерителями общественного здоровья населения являются 

         а) демографические показатели

         б) заболеваемость

         в) инвалидность

         г) физическое развитие

         д) временная нетрудоспособность

006. Экологическая концепция здоровья включает в себя

         а) оценку вклада в здоровье внешней среды

         б) влияние природно-климатических условий на здоровье

         в) систему скрининга

         г) оценку качества медицинской помощи

         д) изучение распространенности патологии

007. Информация статистики здоровья включает в себя

         а) обеспеченность населения медицинскими кадрами

         б) анализ деятельности ЛПУ

         в) показатель общей смертности

         г) обеспеченность населения койками

008. Раздел медицинской статистики, называемый «статистика здравоохранения», включает в себя

        а) нагрузку врача-терапевта на приеме в поликлинике

        б) показатели младенческой и общей смертности

        в) показатели общей заболеваемости

        г) показатели инвалидности

009.  Медицинская демография изучаетвсе перечисленное, кроме

        а) «статику» населения (численность, расселение, плотность и т. д.)

        б) движение населения (механическое и естественное)

        в) заболеваемость с временной утратой трудоспособности

012. К общим показателям воспроизводства (естественного движения) населения не относится

         а) рождаемость

         б) смертность

         в) естественный прирост

         г) средняя продолжительность жизни

013.  Коэффициент рождаемости рассчитывается путем

         а) соотношения численности родившихся в данном году к среднегодовой численности населения

         б) соотношения численности умерших, к численности родившихся

         в) вычитания числа умерших,  из числа родившихся

014.  Уровень рождаемости (на 1000) населения в нашей стране в настоящее время находится в приделах

          а) от 10 до 15

          б) до 10

          в) от 15 до 20

015.  Общий коэффициент смертности – это

          а) отношение числа умерших, к среднегодовой численности населения

          б) отношение числа умерших, к численности населения на 01.01 данного года

          в) общее количество умерших, в течение межпереписного периода

016.  Уровень общей смертности (на 1000) населения в нашей стране в настоящее время находится в пределах

           а) от 5 до10

           б) от 11 до 15

           в) от 16 до 20

017.   Показатель материнской смертности вычисляется по формуле

           а) (число умерших беременных, рожениц, родильниц в течение 42 недель после прекращения беременности х 100 000 живорожденных) / число живорожденных

           б) (число умерших беременных х 1000 живорожденных) / суммарное число беременностей

           в) (число умерших после 28 недель беременности х 100 000 живорожденных) / суммарное число беременностей

           г) (число умерших беременных х 100 000 живорожденных и мертворожденных)/

суммарное число беременных после 28 недель

018.  Повозрастные показатели смертности рассчитываются путем

          а) соотношения численности умерших в каждой возрастной группе к численности данной возрастной группы

          б) вычитания родившихся и умерших в каждой пятилетней возрастной группе

          в) соотношения числа умерших в каждой возрастной группе к среднегодовой численности населения территории

019.  В структуре смертности населения экономически развитых стран ведущие места занимают

         а) инфекционные и паразитарные заболевания; болезни системы пищеварения; психические заболевания

         б) болезни системы кровообращения; новообразования; травмы и отравления

         в) новообразования; травмы и отравления; болезни органов дыхания

020. Укажите страну, где наблюдается наибольшая разница в продолжительности  жизни мужчин и женщин

        а) Россия

        б) Япония

        в) США

        г) Франция

        д) Германия

021.  Средняя продолжительность предстоящей жизни - это

        а) число лет, которое предстоит прожить данному поколению родившихся при условии, что на протяжении всей жизни повозрастные показатели смертности останутся неизменными

        б) число лет, которое предстоит прожить данному поколению родившихся при условии, что на протяжении всей жизни повозрастные показатели рождаемости останутся  неизменными

022.  В общей структуре смертности населения травмы занимают место

        а) третье

        б) первое

        в) второе

023.  В общей структуре смертности населения злокачественные новообразования занимают место

        а) второе

        б) первое

        в) третье

024.  В общей структуре смертности населения сердечно-сосудистые заболевания занимают место

        а) первое

        б) второе

        в) третье

 025.  Специальные показатели детской смертности все, кроме

        а) перинатальной смертности

        б) поздней неонатальной смертности

        в) ранней неонатальной смертности

        г) мертворождаемости

        д) младенческой смертности

026.  Показатель младенческой смертности вычисляется по формуле

       а) (число детей, умерших в возрасте до 1 мес) х 1000 / число родившихся живыми и мертвыми

       б) (число детей, умерших в возрасте до 1 года + число детей, родившихся мертвыми) х 1000 / число всех родившихся (мертвых и живых)

       в) (число детей, умерших до 1 года х 1000) / средняя численность населения

       г) (число детей, умерших до года х 1000) / число мертворожденных

       д) (число детей, умерших до 1 года в данном календарном году х 1000) / (2/3 родившихся в данном году + 1/3 родившихся в предыдущем году)

027.  Показатель перинатальной смертности вычисляется по формуле

       а) (число детей, родившихся мертвыми + число детей, умерших в течение первого года жизни) х 1000 / число детей родившихся живыми

       б) (число детей, родившихся мертвыми + число детей, умерших в течение 7 дней жизни) х 1000 / число детей родившихся мертвыми и живыми

       в) (число детей, родившихся мертвыми + число детей, умерших в течение 28 дней жизни) х 1000 / число детей родившихся мертвыми и живыми

       г) (число детей, родившихся мертвыми) х 1000 / число детей родившихся мертвыми и живыми

       д) (число детей, родившихся мертвыми + число детей, умерших в течение7 дней жизни) х 1000 / число детей родившихся живыми

028.  Показатель мертворождаемости вычисляется по формуле 

           а) (число детей, родившихся мертвыми + число детей, умерших в течение первого года жизни) х 1000 / число детей родившихся живыми

           б) (число детей, родившихся мертвыми + число детей, умерших в течение7 дней жизни) х 1000 / число детей родившихся живыми и мертвыми

           в) ( число детей родившихся мертвыми и недоношенными) х 1000 / число детей родившихся живыми и мертвыми

           г) (число детей, родившихся мертвыми) х 1000 / число детей родившихся живыми и мертвыми

           д) (число детей, родившихся мертвыми + число детей, умерших в течение 7 дней жизни) х 1000 / число детей родившихся живыми

029.  Показатель ранней неонатальной смертности вычисляется по формуле 

          а) (число детей, родившихся мертвыми + число детей, умерших в течение первого года жизни) х 1000 / число детей родившихся живыми

          б) (число детей, умерших в течение 7 дней жизни) х 1000 / число детей родившихся живыми и мертвыми

          в) (число детей, умерших в течение 28 дней жизни) х 1000 / число детей родившихся живыми

          г) (число детей, умерших в течение 28 дней жизни) х 1000 / число детей родившихся мертвыми и живыми

          д) (число детей, умерших в течение 7 дней жизни) х 1000 / число детей родившихся живыми

030. Показатель поздней неонатальной смертности вычисляется по формуле

          а) (число детей, умерших в течение первого года жизни) х 1000 / число детей родившихся живыми

        б) (число детей, умерших в течение7 дней жизни) х 1000 / число детей родившихся живыми и мертвыми

        в) (число детей, умерших в течение 28 дней жизни) х 1000 / число детей родившихся мертвыми и живыми

        г) (число детей, умерших на 2-4 неделе жизни) х 1000 / число детей, родившихся живыми – число умерших на первой неделе

        д) (число детей, родившихся мертвыми + число детей, умерших в течение 7 дней жизни) х 1000 / число детей родившихся живыми

031.  Показатель постнеонатальной смертности вычисляется по формуле

        а) (число детей, умерших в течение первого года жизни) х 1000 / число детей родившихся живыми

        б) (число детей, умерших в течение 6 месяцев жизни) х 1000 / число детей родившихся живыми

        в) (число детей, умерших в возрасте от 29 дней до 1 года) х 1000 / число детей родившихся мертвыми и живыми

        г) (число детей, родившихся мертвыми и умерших в возрасте до 1 года) х 1000 / число детей родившихся мертвыми и живыми

        д) (число детей, умерших в возрасте от 29 дней до 1 года) х 1000 / число детей родившихся живыми

032.  Назовите основные причины младенческой смертности с учетом занимаемого ими места

        а) пороки развития и родовой травматизм, заболевания органов дыхания, кишечные инфекции

        б) прочие болезни, родовой травматизм и пороки развития, желудочно-кишечные заболевания

        в) родовой травматизм и пороки развития, пневмония, прочие болезни

033. Назовите основные причины перинатальной смертности

        а) родовой травматизм, порки развития, болезни новорожденных

        б) кишечные инфекции, заболевания органов дыхания

034.  Индекс Покровского – это отношение 

        а) годовое число родившихся / годовому числу умерших

        б) (годовое число умерших х 1000) / годовому числу родившихся

        в) (годовое число родившихся – годовое число умерших) х 1000 / среднегодовая численность населения

035.  Коэффициент естественного прироста – это отношение 

         а) годовое число родившихся / годовому числу умерших

         б) годовому числу умерших / годовое число родившихся

         в) (годовое число родившихся – годовое число умерших) х 1000 / среднегодовая численность населения

036.  Среднее число девочек, рожденных одной женщиной за всю ее жизнь и доживших до возраста женщины их родившей, называется

         а) нетто-коэффициент

         б) брутто-коэффициент

         в) индекс Покровского

037.  Коэффициентами конечного воспроизводства населения является все, кроме

          а) брутто-коэффициента

          б) нетто-коэффициента

          в) индекса  Покровского

038.  Назовите типы воспроизводства населения 

          а) прогрессивный, регрессивный

          б) суженый, стационарный, расширенный

          в) стационарный

039.  Назовите типы возрастной структуры населения 

          а) суженый, стационарный, расширенный

          б) прогрессивный, стационарный, регрессивный

040.  Основными источниками информации о здоровье населения служат следующие, кроме

          а) официальной информации о смертности населения

          б) данных страховых компаний

          в) эпидемиологической информации

          г) данных мониторинга окружающей среды и здоровья

          д) регистров заболеваний, несчастных случаев и травм

041.  На сохранение и укрепление здоровья населения влияют следующие факторы

           а) уровень культуры населения

           б) экологические факторы среды

           в) качество и доступность медицинской помощи

           г) безопасные условия труда

           д) сбалансированность питания

           е) все вышеперечисленное

042.  Под физическим развитием понимают 

           а) совокупность всех антропологических признаков и результаты функциональных измерений

           б) соматоскопические признаки и показатели

           в) данные о телосложении

           г) все вышеперечисленное

043.  Основные методы изучения заболеваемости все, кроме

           а) по причинам смерти

           б) по обращаемости

           в) по данным переписи населения

           г) по данным медицинских осмотров

044.  Первичная заболеваемость - это

            а) заболевания, впервые выявленные в этом году

            б) заболеваемость, регистрируемая врачом и записанная им в медицинской документации

            в) совокупность всех имеющихся среди населения заболеваний, впервые выявленных в данном году или известных ранее, по поводу которых больные вновь обратились в данном году

         г) учет всех заболеваний (инфекционных, неэпидемических, с ВУТ)

 

045.  Сущность термина «болезненность»

             а) вновь выявленные заболевания в данном году

             б) все заболевания, зарегистрированные в данном году

             в) заболевания, выявленные при целевых медицинских осмотрах

             г) заболевания, выявленные при периодических медицинских осмотрах

046.  Общая заболеваемость - это

            а) показатель заболеваемости по данным обращаемости

            б) заболеваемость, регистрируемая врачом и записанная им в медицинской документации

            в) совокупность всех имеющихся среди населения заболеваний, впервые выявленных в данном году или известных ранее, по поводу которых больные вновь обратились в данном году

            г) учет всех заболеваний и специальный учет заболеваний, включающий инфекционную заболеваемость, неэпидемическую заболеваемость, заболеваемость с ВН, госпитализированную заболеваемость

047.  Комплексная методика определения истинной («исчерпанной») заболеваемости не включает в себя

           а) изучение заболеваемости по обращаемости

           б) изучение госпитализированной заболеваемости

           в) выборочные комплексные осмотры населения группой специалистов

           г) экспертный метод

048.  Под статистическим термином «обращаемость» понимается

           а) число больных, впервые обратившихся за медицинской помощью по поводу заболевания

          б) соотношение числа всех первичных посещений по поводу болезни к общему числу обслуживаемого населения

        в) абсолютное число всех первичных и повторных посещений больными медицинского учреждения

        г) отношение числа всех посещений больными  амбулаторно-поликлинического учреждения к общему числу обслуживаемого населения

049.  Заболевание, которым больной страдает в течение ряда лет и ежегодно обращается к врачу поликлиники войдет в статистику

       а) первичной заболеваемости

       б) общей заболеваемости

       в) патологической пораженности

050.  При анализе первичной заболеваемости населения учитывается

       а) статистические талоны только со знаком (+)

       б) все статистические талоны

       в) статистические талоны без знака (+)

051. При анализе общей заболеваемости населения учитываются

        а) статистические талоны только со знаком (+)

        б) все статистические талоны

        в) статистические талоны без знака (+)

052.  Укажите, как регистрируется первичная заболеваемость населения

        а) статистические талоны только со знаком (+)

        б) статистические талоны без знака (+)

053. Укажите основные виды заболеваний, подлежащих первичному учету

         а) острая инфекционная заболеваемость

         б) важнейшая неэпидемическая

         в) госпитализированная

         г) заболеваемость с ВУТ

         д) все вышеперечисленное

         е) нет правильного ответа

054.  Укажите основные виды регистрируемой заболеваемости по данным обращаемости

         а) общая заболеваемость

         б) важнейшая неэпидемическая

         в) острая инфекционная заболеваемость

         г) госпитализированная

         д) заболеваемость с ВУТ

         е) все вышеперечисленное

055.  В течение какого времени и в какое лечебное учреждение направляется извещение о важнейшем неэпидемическом заболевании

         а) в диспансер соответствующего профиля в течение 1 месяца

         б) в СЭС в течение 12 часов

         в) в СЭС в течение 5 часов

         г) в диспансер соответствующего профиля в течение 1 недели

         д) в диспансер соответствующего профиля в течение 2 недель

056.  Какие объективные факторы влияют на уровень зарегистрированной заболеваемости (обращаемости)?

         а) объем и доступность медицинской помощи

         б) санитарно-культурный уровень населения

         в) все вышеперечисленное

057.  Укажите основные методы изучения заболеваемости

          а) обращаемость

          б) профилактические осмотры

          в) регистрация причин смерти

          г) все вышеперечисленное

058.  У больного язвенная болезнь желудка. Болеет 10 лет, каждый год обращается к врачу. Сколько статистических талонов на него будет заполнено и сколько из них со знаком (+)?

          а) 10 статистических талонов, первый из них со знаком (+)

          б) 10 статистических талонов, каждый из них со знаком (+)

          в) 1 статистический талон со знаком (+)

059.  По поводу ангины больной обращался к врачу 9 января, 15 марта, 12 декабря. Когда и каким статистическим талоном будет зарегистрировано заболевание при посещении врача?

         а) с (+) 9 января, 15 марта, 12 декабря

         б) без (+) 9 января, 15 марта, 12 декабря

         в) с (+) 9 января

060.  У женщины со сроком беременности 38 недель родился живой ребенок массой 3200 г и длиной тела 45 см. Ребенок умер через 35 минут после рождения от внутричерепного кровоизлияния. Какие документы на него требуются заполнить?

  1.  медицинское свидетельство о рождении
  2.  свидетельство о перинатальной смертности
  3.  врачебное свидетельство о смерти

а) верно 1) и 3)

б) верно 1) и 2)

в) верно 3)

061.  При изучении общей заболеваемости (по данным амбулаторно-поликлинических учреждений) используется

         а) медицинская карта амбулаторного больного

         б) единый талон амбулаторного пациента

         в) журнал регистрации инфекционных заболеваний в ЛПУ и ЦСЭН

062. Укажите единый нормативный документ для статистических разработок госпитализированной заболеваемости

          а) такого документа не существует

          б) международная классификация болезней, травм и причин смерти

          в) статистическая карта выбывшего из стационара, ф.№ 066/у

          г) листок учета движения больных и коечного фонда стационара, ф.№ 007/у

          д) сводная ведомость учета движения больных и коечного фонда по стационару, отделению или профилю коек, ф.№ 016/у

         

063.  При изучении инфекционной заболеваемости применяется

         а) журнал регистрации инфекционных заболеваний ЛПУ и ЦСЭН

         б) экстренное извещение об инфекционном заболевании, пищевом отравлении, профессиональном заболевании

         в) отчет ежемесячный и годовой о числе инфекционных заболеваний

         г) отчет о заболеваниях активным туберкулезом

064.  В городе «А» сердечно-сосудистые заболевания составляют 20%, а в городе «Б» – 30% среди всех заболеваний. Можно ли утверждать, что в городе «Б» эти заболевания встречаются чаще?

         а) можно; процент заболеваний в городе «Б» явно выше

         б) можно; данные показатели характеризуют уровень сердечно-сосудистых заболеваний

         в) можно; данные показатели характеризуют распространенность заболевания, а в городе «Б» она выше

         г) нельзя; мы не знаем ошибки данных показателей

         д) нельзя; мы не знаем базы этих показателей, т.е. общее число заболеваний вкаждом городе, принятое за 100%

066.  Экстенсивные показатели характеризуют

         а) структуру, состав явления

         б) частоту явлений в своей среде

         в) распределение целого на части

         г) соотношение двух разнородных совокупностей

067.  Виды относительных величин все, кроме

          а) интенсивных показателей

          б) экстенсивных показателей

          в) показателей наглядности

          г) показателей соотношения

          д) показателей информативности

068.  Показатель соотношения характеризует

         а) структуру, состав явления

         б) частоту явления в своей среде

         в) соотношение двух разнородных совокупностей

         г) распределение целого на части

069.  Методика расчета показателя распространенности заболеваний у населения

  1.  (число вновь возникших заболеваний в данном году)

--------------------------------------------------------------------  х 1000

                (среднегодовая численность населения)

         2) (число всех имеющихся у населения заболеваний в данном году)    

                --------------------------------------------------------------------------------   х 1000

             (среднегодовая численность населения)

         3) (число заболеваний выявленных у населения на определенный момент времени)

               ------------------------------------------------------------------------------------------------------ х 1000

             (средняя численность осмотренных)

          4) (число заболеваний определенной нозологии)

               ---------------------------------------------------------- х 100

               (число всех зарегистрированных)

070.  Методика расчета  показателя структуры заболеваемости

  1.  (число вновь выявленных болезней)

-----------------------------------------------   х 1000

                  (среднегодовая численность населения)

  1.  (число всех болезней)

----------------------------------------------   х 1000

(среднегодовая численность населения)

  1.  (число болезней определенной формы (группы, нозологии)

----------------------------------------------------------------------------    х 100

(общее число болезней)

  1.  (число болезней в данном месяце)

--------------------------------------------      

(число дней в месяце)

071.  В каких показателях должны быть представлены результаты исследования при изучении состава в госпитализированных больных по отделениям стационара?        

           а) экстенсивных

           б) интенсивных

072.  Укажите показатели, в которых должны быть представлены результаты исследования при изучении распространенности гипертонической болезни у лиц разного возраста

           а) интенсивные

           б) экстенсивные

           в) соотношения

           г) наглядности

073.  К интенсивным статистическим показателям относятся

           а) распределение больных по полу и возрасту

           б) показатели заболеваемости, смертности

           в) структура заболеваний по нозологическим формам

074.  Диаграммой, наиболее наглядно характеризующей показатели сезонной заболеваемости, служит

             а) секторная

             б) радиальная

             в) столбиковая

             г) объемная

075.  Какой статистический показатель характеризует развитие явления в среде, непосредственно с ним не связанной?

            а) экстенсивный

            б) интенсивный

            в) соотношения

            г) наглядности

            д) средняя арифметическая

076.  Какие показатели позволяют демонстрировать сдвиги явления во времени или по территории, не раскрывая  истинного уровня этого явления?

            а) экстенсивные

            б) интенсивные

            в) соотношения

            г) наглядности

            д) регрессии

077.  В отличие от статистических коэффициентов средние величины применяются для изучения

           а) вероятных признаков, которые могут быть или не быть

           б) постоянных признаков, присущих всем единицам наблюдения

078.  Международная классификация болезней – это

           а) перечень наименований болезней в определенном порядке

           б) перечень диагнозов в определенном порядке

           в) перечень симптомов, синдромов и отдельных состояний, расположенных по определенному принципу

           г) система рубрик, в которые отдельные патологические состояния включены в соответствии с определенными установленными критериями

           д) перечень наименований болезней, диагнозов и синдромов, расположенных в определенном порядке

079.  Показатель обеспеченности населения врачебным, средним и младшим медицинским персоналом вычисляется

           а) в проценте

           б) в промиле

           в) в продецемиле

           г) в темпе прироста

           д) в показателе наглядности

080.  Обеспеченность населения врачебными кадрами на 10000 населения рассматривается

           1) по штатным должностям

           2) по занятым должностям

           3) по физическим лицам

           4) по численности населения на врачебных участках

           5) по соотношению врачебного и среднего медицинского персонала

           а) верно все перечисленное

           б) верно 1), 2) и 3)

           в) верно 4) и 5)

081.  Под потребностью населения в амбулаторно-поликлинической помощи понимается

         а) число посещений на одну врачебную должность в год

         б) число посещений на одного жителя в год

         в) число обращений на одного жителя в год

         г) число врачебных должностей на определенную численность населения

082.  Под потребностью населения в госпитализации понимается

         а) число коек на определенную численность населения

         б) процент населения, нуждающегося в госпитализации

         в) число госпитализированных за год больных

         г) число врачебных должностей стационара на определенную численность населения

083.  Организация работы поликлиники характеризуется следующими данными

           а) структура посещений по специальностям

           б) динамика посещений; распределение посещений по виду обращений; по месяцам, дням недели, часам дня

           в) объем помощи на дому; структура посещений на дому; активность врачей по помощи на дому

           г) соотношение первичных и повторных посещений на дому

           д) все вышеперечисленное

084.  Какие из перечисленных показателей, характеризующих деятельность поликлиники, относятся к показателям качества?

          1) участковость на дому и в поликлиники

          2) полнота охвата профосмотрами, диспансерным наблюдением

3) средняя численность населения на участке

4) среднее число профпосещений на одного больного в год   

  1.  частота обострений и рецидивов
  2.  полнота охвата оздоровительными мероприятиями
  3.  уровень заболеваемости по обращаемости
  4.  летальность

           а) все вышеперечисленное

           б) верно 2), 4), и 6)

           в) верно 1), 3), 5), 7) и 8)

           г) верно 5), 7)

085.  Укажите правильную последовательность методики анализа деятельности поликлиники в условиях бюджетно-страховой медицины

  1.  качество врачебной диагностики и лечения больных
  2.  проведение профилактической работы и ее результаты
  3.  организация работы поликлиники
  4.  общие данные о поликлинике
  5.  преемственность работы поликлиники и стационара

а) 1), 2), 3), 4), 5)

б) 4), 3), 2), 1), 5)

086.  Факторами, обусловливающими объем медицинской помощи в поликлинике, могут быть все, кроме

          а) характеристики врачебного участка

          б) обеспеченности населения койками стационара по специальностям

          в) заболеваемости населения

          г) укомплектованности врачебными кадрами

          д) функции врачебной должности

087.  Методика анализа нагрузки врачей поликлиники включает в себя показатели, кроме

          а) нагрузки врачей по специальностям в часы приема в поликлиники

          б) нагрузки врачей по помощи на дому

          в) удельного веса посещений жителями района поликлиники

          г) нагрузки врачей по дням недели

          д) нагрузки врачей по месяцам года

088.  Качество диагностики врачей поликлиники можно оценить по следующим показателям (по таблице Е.Н. Бэна)

                а) частота совпадения патологоанатомических и поликлинических диагнозов

                б) процент отказов в госпитализации вследствие необоснованности направления больных поликлиникой в стационар

                в) частота совпадения (или расхождения) клинического и патологоанатомического диагноза

                г) процент ошибочных диагнозов; процент не выявленных (просмотренных) диагнозов врачей поликлиники

                д) процент неправильных диагнозов

089.  На уровне «врач терапевт – участковый (цеховой)» экспертно оцениваются

                а) каждый случай смерти на дому

                б) каждый случай первичного выхода на инвалидность

                в) каждый случай расхождения диагнозов поликлиники и стационара

                г) каждый случай выявления больных с запущенными формами злокачественного новообразования, туберкулеза

               д) все перечисленное верно

090.  Организация работы стационара характеризуется следующими показателями

                а) среднее число дней работы койки

                б) оборот койки

                в) средние сроки пребывания больного в стационаре

                г) все вышеперечисленное

091.  Какие из перечисленных показателей, характеризующие деятельность стационара, относятся к показателям объема?

  1.  обеспеченность населения койками
  2.  процент госпитализации
  3.  среднегодовая занятость койки
  4.  средняя длительность пребывания больного на койке
  5.  оборот койки
  6.  совпадение клинических и патологоанатомических диагнозов
  7.  послеоперационные осложнения
  8.  больничная летальность
  9.  укомплектованность врачами

а) все перечисленное верно

б) верно 6), 7), 8)

в) верно 1), 2), 3), 4), 5), 9)

092.  Укажите правильную последовательность методики анализа деятельности стационара в условиях бюджетно-страховой медицины

               1) общие данные о стационаре

  1.           2) преемственность работы стационара и поликлиники

     3)организация работы стационара

      4)качество врачебной диагностики

      5) качество лечения больных

               а) 1), 2), 3), 4), 5)

               б) 1), 3), 4), 5), 2)

093.  Качественную оценку работы стационара могут характеризовать следующие показатели

               а) структура проведенных операций (состав операций)

               б) показатель частоты осложнений при операциях

               в) показатель частоты применения различных видов наркоза

               г) показатель послеоперационной летальности

               д) сроки до и послеоперационного лечения больных

               е) все вышеперечисленное

094.  Интенсивный показатель досуточной летальности определяется

            а) к общему числу умерших в больнице

            б) отношением числа умерших в первые сутки к числу поступивших в стационар

            в) отношением числа поступивших в стационар к числу умерших в первые сутки

            г) отношением числа выбывших из стационара к числу умерших в первые сутки

            д) отношением числа умерших в первые сутки к числу выбывших из стационара

095.  Отчет о деятельности стационара в разделе «Состав больных стационара, сроки и исходы лечения» в полном объеме содержит следующую информацию

            а) шифр МКБ, выписано больных, проведено койко-дней взрослыми и детьми до 14 лет включительно

            б) шифр МКБ, выписано больных, проведено койко-дней взрослыми, детьми и подростками, умерло

            в) наименование болезней, выписано взрослых и подростков, проведено выписанными койко-дней, умерло

            г) наименование болезней, шифр МКБ, выписано взрослых и подростков, проведено выписанными койко-дней

            д) шифр МКБ, наименование болезней, выписано, проведено выписанными койко-дней,умерло взрослых и подростков, детей до 14 лет включительно

096.  Среднее число дней работы койки в году вычисляется следующим образом

           а) (число койко-дней фактически проведенных больными) / (число дней в году)

           б) (число койко-дней фактически проведенных больными) / (число среднегодовых коек)

           в) (число выписанных больных) / (число среднегодовых коек)

           г) (число проведенных больными койко-дней) / (число выписанных больных)

097.  Среднее число пребывания больного в стационаре определяется следующим образом

           а) (число койко-дней фактически проведенных больными) / (среднегодовое число коек)

           б) (число проведенных больными койко-дней) / (число пользованных больных)

           в) (число проведенных больными койко-дней) / (число дней в году)

098.  Оборот койки определяется следующим отношением

          а) (число госпитализированных больных) / (среднегодовое число коек)

          б) (число госпитализированных больных) / (число дней работы койки в году)

          в) (число госпитализированных больных) / (среднее время пребывания больного на койке)

          г) (число госпитализированных больных) /  (средние сроки лечения больного в стационаре)

099.  Среднегодовое количество коек рассчитывается следующим образом

          а) (сумма всех среднемесячных коек) / (число месяцев в году)

          б) (сумма всех среднемесячных коек) / (оборот койки)

          в) (сумма всех среднемесячных коек) / (число дней работы койки в году)

  1.  Показатель среднего времени простоя койки за год вычисляется следующим образом

         а) (среднее число дней работы койки в году – календарное число дней в году) / (оборот койки)

         б) (календарное число дней в году - среднее число дней работы койки в году) / (оборот койки)

        в) (число койко-дней фактически проведенных больными) / (число календарных дней в году)

        г) (число койко-дней закрытия на ремонт х 100) / (число календарных дней в году)

  1.  Средняя длительность лечения в стационаре при инфаркте миокарда рассчитывается следующим образом

а) занятость койки инфарктными больными делится на оборот этих коек

б) число койко-дней фактически проведенных в стационаре больными в с инфарктом миокарда, делится на общее число больных инфарктом миокарда, выбывших из стационара

в) число койко-дней проведенных в стационаре выписанными больными с инфарктом миокарда, делится на число больных инфарктом миокарда, выписанных из стационара

  1.  Показатель хирургической активности в стационаре – это

а) процентное отношение числа прооперированных больных к числу больных, выбывших из хирургического отделения

б) процентное отношение числа проведенных хирургических операций к числу больных, выбывших из хирургического отделения

в) процентное отношение числа прооперированных больных к числу больных, выписанных из хирургического отделения

г) процентное отношение числа проведенных хирургических операций к числу больных, выписанных из хирургического отделения

  1.  Как изменится занятость терапевтической койки при снижении средней длительности пребывания больного на койке (при прочих равных условиях)?

а) занятость койки увеличится

б) занятость койки уменьшится

в) занятость койки не изменится, т.к. этот показатель и средняя длительность пребывания больного на койке не связаны между собой

г) в зависимости от профиля больных занятость койки может оставаться неизмененной или не изменяться в обоих направлениях

  1.  О выявлении каких заболеваний информирует учетная статистическая форма №090/у?

а) о вновь выявленном инфекционном заболевании

б) о вновь выявленном туберкулезе легких

в) о вновь выявленном психическом заболевании

г) о вновь выявленном злокачественном новообразовании

д) о вновь выявленном венерическом заболевании

  1.  В приложении  к приказу Минздрава СССР, действующего на территории РФ за №1030 (от 04.10.80 г.) представлен перечень следующей медицинской документации

а) отчетные формы статистической документации в стационарах и поликлиниках, учреждениях судебно-медицинской экспертизы, лабораториях ЛПУ, санитарно-профилактических учреждениях, других типах ЛПУ

б) статистические формы первичной медицинской документации (учет), используемые в стационарах и поликлиниках, учреждениях судебно-медицинской экспертизы, лабораториях ЛПУ, санитарно-профилактических учреждениях, других типах ЛПУ

в) все перечисленное выше

  1.  Первичная медицинская статистическая документация необходима для

а) регистрации изучаемого явления (например, заболеваемости с впервые в жизни диагностируемым заболеванием)

б) оперативного управления ЛПУ

в) выработки конкретного, обоснованного решения

г) изучения особенностей и закономерностей состояния здоровья населения

д) все вышеперечисленное

  1.  Укажите основной учетный документ

а) контрольная карта диспансерного наблюдения

б) амбулаторная карта

в) история болезни

г) листок нетрудоспособности

  1.  При изучении отказов в госпитализации используется следующая медицинская документация

а) статистический талон на прием (25-2/у)

б) карта выбывшего из стационара (066/у)

в) учетная форма 007/у

г) учетная форма 016/у

д) учетная форма 001/у

  1.  Информация о переводе больного из отделения в отделение стационара регистрируется

а) учетная форма 025-10/у-97

б) учетная форма 025-2/у

в) учетная форма 007/у

г) учетная форма 066/у

д) все названное выше

  1.  При переходе амбулаторно-поликлинических учреждений (подразделений) на систему учета по законченному случаю обслуживания («Талон амбулаторного пациента» (учетная форма №025-10/у-04) не рекомендуется использовать следующие формы первичной документации

а) статистический талон для регистрации заключительных (уточненных) диагнозов (ф.025-2/у)

б) талон на прием к врачу (ф.025-4/у-88)

в) единый талон амбулаторного пациента (ф.025-8/у-04)

г) талон на законченный случай временной нетрудоспособности ( ф.025-9/у-96)

д) все перечисленное выше

  1.  Отчетная медицинская статистическая документация необходима для

а) обобщения основных характеристик деятельности системы здравоохранения по данным годовых отчетов

б) сопоставления учреждений и служб здравоохранения по основным статистическим показателям в динамике и по территориям

в) планирования здравоохранения

г) прогнозирования здравоохранения

д) все перечисленное выше

  1.  Раздел годового отчета «Работа врачей поликлиники» заполняется на основании следующей медицинской документации
  2.  талон на прием врачу
  3.  талон амбулаторного пациента
  4.  журнал выдачи больничных листов
  5.  журнал вызова врачей на дом
  6.  медицинская карта амбулаторного больного

а) верно все перечисленное

б) верно 2), 3), 4) и 5)

в) верно 2) и 4)

  1.  Единство, полнота и достоверность медицинской отчетности обеспечиваются

а) единой номенклатурой учреждений здравоохранения

б) едиными принципами и методами лечебно-профилактической и санитарно-профилактической деятельности

в) единой системой первичной медицинской документации, стандартным порядком ее ведения и достоверностью информации

г) единой программой отчетов для всех типов лечебно-профилактических учреждений

д) все перечисленное

  1.  Обработка данных на вычислительных машинах (ЭВМ) позволяет

а) совершенствовать и оптимизировать регистрацию, сводку и группировку статистических данных

б) получать различного вида статистические таблицы

в) получать различного вида показатели и средние величины, оценку их достоверности

г) создать регистр и банк данных

д) все вышеперечисленное

  1.  Статистическая совокупность как объект статистического исследования включает

а) группу или множество относительно однородных элементов, обладающих признаками сходства

б) группу или множество относительно однородных элементов, обладающих признаками различия

в) группу или множество относительно однородных элементов, обладающих признаками

сходства и признаками различия

  1.  Из приведенных определений единицу совокупности характеризует

а) первичный элемент статистического наблюдения, являющийся носителем признаков, подлежащих регистрации

б) первичный элемент, из которого состоит вся наблюдаемая совокупность

в) перечень элементов, определяющих комплекс признаков, подлежащих регистрации

г) перечень элементов, определяющих совокупность наблюдения

117.Установите соответствие

      Операции                                                      Этапы статистического

                                                                               исследования  

      а) выбор единицы наблюдения                     1) 1 этап-а,б,г

        б) составление плана и программы              2) 2 этап-в

        в) сбор материала                                           3) 3 этап-д   

        г) определение цели исследования               4) 4 этап-ж

        д) группировка и сводка материалов

        е) анализ результатов исследования

        ж) расчет и графическое изображение статистических величин

  1.   Выбор единицы наблюдения зависит

а) от программы исследования

б) от плана исследования

в) от цели и задач исследования

  1.   Программа статистического исследования – это

а) перечень вопросов

б) совокупность изучаемых признаков

в) определение масштаба исследования

г) определение времени исследования

  1.   Методологические аспекты статистических сравнений

а) понятийный аппарат (однородность изучаемых явлений, определения)

б) методы сбора, группировки, вычисления данных

в) требования к информации (адекватность, полнота, своевременность, достоверность)

г) пространственный фактор

д) временной фактор

е) все вышеперечисленное

  1.   Из приведенных ниже примеров характерным для единовременного наблюдения является

а) рождаемость

б) заболеваемость

в) профилактический осмотр

г) смертность

  1.   Выборочное наблюдение – это

а) наблюдение, охватывающее часть единиц совокупности для характеристики целого

б) наблюдение, приуроченное к одному какому-либо моменту

в) наблюдение в порядке текущей регистрации

г) обследование всех без исключения единиц изучаемой совокупности

  1.  Сплошное наблюдение – это

а) наблюдение, охватывающее часть единиц совокупности для характеристики целого

б) наблюдение, приуроченное к одному какому-либо моменту

в) наблюдение в порядке текущей регистрации

г) обследование всех без исключения единиц изучаемой совокупности

  1.   Единовременное наблюдение – это

а) наблюдение, охватывающее часть единиц совокупности для характеристики целого

б) наблюдение, приуроченное к одному какому-либо моменту

в) наблюдение в порядке текущей регистрации

г) обследование всех без исключения единиц изучаемой совокупности

  1.  Текущее наблюдение – это

а) наблюдение, охватывающее часть единиц совокупности для характеристики целого

б) наблюдение, приуроченное к одному какому-либо моменту

в) наблюдение в порядке текущей регистрации

г) обследование всех без исключения единиц изучаемой совокупности

  1.   Укажите виды наблюдений по объему

а) случайные

б) текущие и единовременные

в) сплошные и выборочные

127.  Из перечисленных видов статистических таблиц наилучшее представление об исследуемой совокупности дает

      а) простая таблица

      б) групповая таблица

      в) комбинированная таблица

128.  Результаты статистического исследования анализируется на основании всего, кроме  

      а)  статистических (регистрационных) бланков

      б) списков, журналов

      в) таблиц

      г) амбулаторных карт, историй болезни

  1.  Единица наблюдения – это

       а) первичный элемент объекта статистического наблюдения, являющийся носителем признаков, подлежащих регистрации

       б) массив единиц, являющихся носителем изучаемого признака

       в) наблюдение, приуроченное к какому-либо моменту

       г) определение объема наблюдения

  1.  При изучении заболеваемости инфарктом миокарда среди лиц умственного и физического труда единицей наблюдения является

      а) работающий человек

      б) больной язвенной болезнью желудка

      в) больной человек

      г) ребенок

      д) взрослый человек

  1.  При изучении заболеваемости язвенной болезнью желудка, у работающих в различных отраслях народного хозяйства, единицей наблюдения является

      а) работающий человек

      б) больной язвенной болезнью желудка

      в) больной человек

      г) ребенок

      д) взрослый человек

132.  При изучении возрастной, половой структуры больных инфарктом миокарда среди лиц умственного и физического труда единицей наблюдения является

а)   больной инфарктом миокарда

б)  работающий человек

в)   взрослый человек

г)   ребенок

д)   больной инфарктом миокарда трудоспособного возраста

133.  Вариационный ряд - это

а)   ряд чисел

б)   совокупность вариантов

в)   варианты, расположенные в определенной последовательности

134.  Средняя величина - это

а)   частота явления

б)   структура явления

в)   обобщающая характеристика варьирующего признака

135.  Варианта - это

а)   величина признака

б)   частота проявления признака.

 


Эталон ответов.

01 – а

08 – а, б

15 – а, б, г

02 – б

09 – а, б, в

16 – а

03 – а

10 – в

17 – б

04 – а

11 – а

18 – а

05 – а

12 – в

19 – а, б, в

06 – а

13 – б

07 – а, б

14 – б

Медицинская статистика и вычислительная техника

№ вопроса

Эталон ответа

№ вопроса

Эталон ответа

№ вопроса

Эталон ответа

001

а

026

д

051

б

002

в

027

б

052

а

003

д

028

г

053

д

004

в

029

д

054

е

005

а

030

г

055

а

006

в

031

д

056

в

007

в

032

а

057

г

008

а

033

а

058

а

009

в

034

а

059

а

010

б

035

в

060

б

011

в

036

а

061

а

012

г

037

в

062

в

013

а

038

б

063

б

014

а

039

б

064

д

015

а

040

б

065

б

016

б

041

е

066

а

017

а

042

г

067

д

018

а

043

в

068

в

019

б

044

а

069

2

020

а

045

б

070

3

021

а

046

в

071

а

022

а

047

г

072

а

023

а

048

а

073

б

024

а

049

б

074

б

025

д

050

а

075

в

№ вопроса

Эталон ответа

№ вопроса

Эталон ответа

№ вопроса

Эталон ответа

076

г

096

б

116

а

077

б

097

б

117

1 – абг

2 – в 3 – д

4 - ж

078

г

098

а

118

в

079

в

099

а

119

б

080

б

100

б

120

е

081

б

101

б

121

в

082

б

102

б

122

а

083

д

103

а

123

г

084

г

104

г

124

б

085

б

105

б

125

в

086

д

106

д

126

в

087

в

107

а

127

в

088

г

108

д

128

г

089

д

109

г

129

а

090

г

110

д

130

а

091

в

111

д

131

а

092

б

112

в

132

д

093

е

113

д

133

в

094

б

114

д

134

в

095

д

115

а

135

а




1. Отопление и вентиляция сельскохозяйственного здания
2. Пока и До Процедуры и функции Одномерные массивы 3 языка Двумерные массивы 3 языка Строковы
3. ти- переднюю грудиннореберную нижнюю диафрагмальную заднюю легочную
4. тема агрохімічних заходів продуктивність праці собівартість і рентабельність виробництва продукції рис
5. темах сайт журнала Гастроном по всем темам список литературы в конце а также осуществляйте поиск самостоя
6. исторической обстановке
7.  Ужасная ссора Глава 2
8. Инструментальные средства компьютерных технологий информационного обслуживания управленческой деятельности
9. Начните с того места где вы находитесь ~ советует П
10. Булгарпиво
11. Гимназия 20 Республика Мордовия г
12. Откройте файл Таблица6 из Вашей папки
13. Петр Ильич Чайковский
14. Стратегии обеспечения материальными ресурсами различных предприятий
15. Пойменные земли которые занимают низшее положение на водосборе харакся смешанным типом водного питани
16. 15 MOGILEV STTE POLYTECHNICL COLLEGE Mogilev Mechnicl Engineering Technicl School ws founded on Jnury 1 1947 in ccordnce with USSR Council of Ministers Regultion 178
17. Портфельные стратегии
18. реферату- Пригода бізнесу і його економічна основаРозділ- Підприємництво Пригода бізнесу і його економічна
19. ДОРОЖНІЙ КОЛЕДЖ Розглянуто та схвал
20. Жизненный путь Афанасия Афанасьевича Фета