Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
В.И. Сабанов
Н.В. Эккерт
Л.Н. Грибина
А.Н. Голубев
Ситуационные задачи
по медицинской статистике
с примерами решений
в программе
Microsoft Excel
под редакцией член-корреспондента РАМН,
заслуженного деятеля науки РФ,
профессора В.З. Кучеренко
Волгоград 2013
МИНИСТЕРСТВО ЗДРАВООХРАНЕНИЯ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Первый московский государственный медицинский
университет им. И.М. Сеченова
Волгоградский государственный медицинский университет
В.И. Сабанов, Н.В. Эккерт
Л.Н. Грибина, А.Н. Голубев
Ситуационные задачи
по медицинской статистике
с примерами решений
в программе Microsoft Excel
Учебно-методическое пособие к практическим занятиям
по дисциплине «Медицинская информатика»
под редакцией Заслуженного деятеля науки РФ,
член-корреспондента РАМН, профессора В.З. Кучеренко
Для студентов медицинских ВУЗов, обучающихся по специальностям: 060101 65 Лечебное дело, 060103 65 Педиатрия, 060105 (060104) 65 Медико-профилактическое дело, 060201 (060105) 65 Стоматология, 060301 (060108) Общественное здравоохранение.
Волгоград
Издательство
ВолгГМУ
2013
УДК 61:613 (075)
ББК 58
С414
УМО -
Рецензенты:
Ситуационные задачи по медицинской статистике с примерами решений в программе Microsoft Excel. Учебно-методическое пособие к практическим занятиям по дисциплине «Медицинская информатика» / В.И. Сабанов, Н.В. Эккерт, Л.Н. Грибина, А.Н. Голубев; под редакцией Заслуженного деятеля науки РФ, член-корреспондента РАМН, профессора В.З. Кучеренко. Волгоград: Изд-во ВолгГМУ, 2013. 178с.: ил.
Учебно-методическое пособие к практическим занятиям подготовлено на кафедрах общественного здоровья и здравоохранения Первого московского государственного медицинского университета им. И.М. Сеченова и Волгоградского государственного медицинского университета. Издание имеет целью оптимизацию изучения студентами важнейшего раздела дисциплины «Медицинская информатика» - «Медицинская статистика». В нем приведены примеры типовых ситуационных задач, встречающихся в медицинских исследованиях, их решения, а также задания для самостоятельной работы. Пособие предназначено для студентов медицинских вузов по направлениям подготовки 060101 65 Лечебное дело, 060103 65 Педиатрия, 060201 (060105) 65 Стоматология, 060301 (060108) Общественное здравоохранение, 060105 (060104) 65 Медико-профилактическое дело.
Печатается по решениям Центральных методических советов
Первого московского государственного медицинского университета им. И.М. Сеченова и Волгоградского государственного медицинского университета
ISBN
© Коллектив авторов, 2013
© Издательство Волгоградского государственного медицинского университета, 2013
Содержание
Введение 4
I. Базовые принципы применения программы Excel 5
II. Основы теории вероятностей 15
III. Организация и этапы статистического исследования 26
IV. Статистические таблицы 33
V. Относительные величины, динамические ряды 37
VI. Вариационные ряды, средние величины, вариабельность признака 50
VII. Проверка статистических гипотез, критерий Стьюдента 69
VIII. Проверка статистических гипотез, критерий Хи-квадрат 79
IX. Метод стандартизации 85
X. Дисперсионный анализ 91
XI. Метод корреляции 101
XII. Метод регрессии 113
Тестовые задания 117
Приложение 1 173
Приложение 2 174
Приложение 3 175
Список сокращений 176
Основная литература 177
Дополнительная литература 177
В современных условиях медицинские работники постоянно встречаются с множеством статистических данных. В основе решения вопроса об эффективности применения нового способа лечения или профилактики заболеваний лежит статистическая обработка данных и проверка статистических гипотез. Для понимания сущности изучаемых явлений врачу необходимо ориентироваться в фундаментальных понятиях и методах статистики, знать терминологию, уметь правильно оценивать статистические критерии и показатели.
Развитие средств вычислительной техники и внедрение информационных систем в здравоохранение значительно расширили возможности статистической обработки материалов научно-практических работ. Большинство врачей получили возможность применять удобные программные средства не только для автоматизации своей основной деятельности, но и для статистической обработки данных. Владение методологией применения способов статистического анализа с помощью компьютера является основой для получения обоснованных выводов социально-гигиенических и медико-биологических исследований.
В настоящем пособии рассматриваются примеры решения типовых задач, встречающихся в различных сферах системы здравоохранения. Оно рассчитано на студентов и практических врачей, изучающих медицинскую статистику и осваивающих методы статистической обработки данных с применением компьютерной техники. Пособие может использоваться для проведения занятий со студентами медицинских вузов в рамках учебной программы «Медицинская информатика», а также при изучении дисциплины «Общественное здоровье и здравоохранение».
Широкое распространение компьютерной техники, а также достижения информатики позволяют использовать персональные компьютеры, оснащенные прикладным программным обеспечением с целью подготовки, хранения и обработки данных медико-биологических исследований. Для решения таких задач разработаны специализированные программы статистического анализа экспериментальных данных, однако большинство из них сложны в применении либо недоступны медицинским работникам. В то же время, современные пакеты офисных программ включают основные модули статистической обработки данных, что позволяет применять их для целей сбора и анализа медицинской информации. Такими возможностями обладают программы, относящиеся к группе «Электронные таблицы» или «Табличные редакторы». Они предназначены для работы с таблицами данных и выполнения относительно несложных расчетов, например, бухгалтерских, а также изготовления рисунков деловой графики (диаграмм).
В России наибольшее распространение получил табличный редактор Microsoft Excel. Он имеет ряд существенных преимуществ, одним из которых является исключительно богатые графические возможности. Благодаря тому, что Excel входит в Microsoft Office, значительно облегчается оформление деловой документации, так как таблицы и рисунки диаграмм могут быть перенесены в текстовый редактор Microsoft Word с сохранением форматирования.
Запуск программы Excel выполняется с помощью кнопки «Пуск» из раздела «Все программы» выбором в списке меню «Microsoft Office» команды «Microsoft Office Excel». Программа открывается в стандартном окне системы Windows, и содержит в верхней части кнопки панелей инструментов, а также типовые элементы управления окном: заголовок, кнопки действий с окном, полосы прокрутки, основное меню программы и др. Рис. 1.
Строка формул
Табличный курсор
Имена столбцов
Номера строк
Горизонтальная полоса прокрутки
Вертикальная полоса прокрутки
Кнопка создания листа
Имя файла
Сетка таблицы
Основное меню
Кнопки действий с окном
Кнопка Office
Ярлыки листов
Рис. 1. Окно программы Excel.
Работа в программе Excel предъявляет высокие требования к внимательности и аккуратности пользователя. Необходимо строго соблюдать всю последовательность действий выполняемой команды, не пропуская и не добавляя лишних элементов и действий, например пробелов или дополнительных нажатий на клавиши клавиатуры и кнопки мыши.
Данные, вводимые пользователем в программе Excel, сохраняются в файле, который называется «Табличный документ». При создании нового файла этого типа именем документа, которое по умолчанию присваивается таблице и отображается в заголовке окна, является «Книга1». Такие файлы обозначаются расширением «xls» или «xlsx». Файл табличного документа может быть защищен от изменений, как в целом, так и по отдельным частям. С целью защиты части рабочей книги применяется режим «Рецензирование». Защита табличного документа с назначением пароля на его открытие выполняется методом шифрования выбором в меню кнопки «Office», режима «Подготовить», командой «Зашифровать документ».
Рабочая область окна программы Excel, в которой размещаются данные пользователя, называется «ЛИСТ». Он состоит из сетки таблицы разделенной на отдельные ячейки, которые предназначены для хранения данных. Максимальный размер каждого листа зависит от версии программы. Например, в Excel 2003 он составляет 256 столбцов и 64 тысячи строк, а для версий 2007 и 2010 около 16 тысяч столбов и более 1-го миллиона строк.
Файл, созданный этой программой, может содержать несколько листов. Их названия отображаются в закладках (ярлычках) расположенных в нижней части окна. Переключение к следующему листу производится щелчком левой клавиши мыши на ярлычке листа. Изменение названия листа выполняется двойным щелчком левой клавиши мыши на его корешке. Для создания нового листа служит кнопка «Вставить лист», расположенная справа от списка лисов в нижней части окна.
Совокупность листов Excel составляет рабочую книгу, в которой может быть составлено несколько статистических таблиц. При этом текстовая, числовая и другие виды информация должны размещаться в отдельных ячейках.
На рабочем листе размещаются основные структурные элементы таблицы: «Столбцы», «Строки», «Ячейки».
Столбцы это вертикальные составляющие экранной сетки Excel. Они обозначены буквами латинского алфавита (A, B, C, AA, AB и т.д.) в верхней части листа.
Строки горизонтальные составляющие экранной сетки Excel. Каждая строка обозначена цифрой (1, 2, 3 и т.д.) и располагаются слева.
Ячейки места пересечения столбцов и строк в таблице. Каждая ячейка обозначена адресом, состоящим из латинской буквы столбца, и цифры номера строки. Ячейка является основной рабочей единицей таблицы Excel.
Ввод данных осуществляется в активную ячейку, обозначенную табличным курсором «жирным» прямоугольником по ее границам. Для завершения ввода требуется нажать клавишу Enter или кнопку «Ввод» в строке формул программы. Смена активной ячейки производится с помощью клавиш клавиатуры управления курсором (стрелок) или щелчком левой клавиши мыши.
Если длинна текстовой строки или размерность числа не помещаются в установленные размеры ячейки, ширина столбцов или высота строк сетки таблицы может быть изменена. Это действие выполняется с помощью протаскивания границ между именами столбцов в верхней части окна и номерами строк слева. В каждой ячейке действуют стандартные команды изменения шрифта, выравнивания отступа и др.
Ячейки таблицы, в которых содержатся только числовые данные, могут использоваться в формулах. Для отделения целой и дробной части десятичного числа применяется знак запятой. При выполнении вычислений дробная часть числа может включать до 9 знаков после запятой. С целью уменьшения разрядности таких чисел с их округлением до требуемого количества знаков после запятой может применяться кнопка «Уменьшить разрядность», для обратного преобразования используется кнопка «Увеличить разрядность».
Когда при вводе числа или выводе результата вычислений после нажатия клавиши Enter в ячейке отображаются знаки решетки (####), это указывает на недостаточную ширину ячейки для отображения значения числа. Исправления такой ошибки для дробных чисел производится командой уменьшения разрядности. А также может быть выполнено увеличение ширины столбца перемещением границы между именами столбцов или уменьшение размера шрифта в ячейке.
Ввод в ячейку знаков алфавита служит для обозначения наименований и пояснений к таблицам, Адрес такой ячейки не применяется в вычислениях. Текстовая строка запоминается в одной ячейке, но может продолжаться, накрывая следующие.
Часть ячеек таблицы может быть выделена с целью их одновременного форматирования, копирования, перемещения или других групповых манипуляций. Выделение ячеек выполняется с помощью курса мыши помещенного в центр ячейки, нажатия левой клавиши и, при ее удержании, перемещения указателя в следующую ячейку таблицы. Выделенная область ячеек обозначается серым или светло-голубым цветом и называется «Диапазоном». Он обозначается начальным и конечным адресами ячеек, разделенных двоеточием. Например, диапазон адресов B2:D6 включает 15 ячеек.
Данные из отдельной ячейки таблицы или выделенного диапазона могут быть перемещены в другую часть листа. Основным способом перемещения данных является выполнение команд «Вырезать» и «Вставить». Кроме того перемещение данных может выполняться с помощью протаскивания ячейки или выделенного диапазона курсором мыши в форме стрелочки, которая появляется при указании на контур выделения. Однако если протаскивание или вставка выполняется в ячейку содержащую данные, появляется предупреждение о замене информации.
Одной из важных команд программы Excel является способ многократного повторения данных в соседних ячейках таблицы. Такое действие называется «Автозаполнение» ячеек. Оно выполняется протаскиванием курсора мыши в форме черного крестика, который появляется при указании в правый нижний угол контура выделения ячейки (на маркер заполнения). Применение автозаполнения ячеек, включающих формулы вычислений, позволяет выполнить однотипные расчеты в сроках или столбцах таблицы без повторного набора формул с клавиатуры.
Полная информация о данных, хранящихся в активной ячейке, отображается в специальной панели инструментов программы Excel, которая называется «Строка формул».
Строка формул предназначена для редактирования текстовых данных, чисел и формул в активной ячейке таблицы. Она расположена в верхней части окна и показывает истинное значение числа (без округления) или формулу, помещенную в ячейку, обозначенную табличным курсором.
Одной из важнейших функций электронных таблиц является создание формул, позволяющих выполнять вычисления в таблице. Результат вычисления демонстрируется в ячейке таблицы, а формула отображается в строке формул программы. Ввод и корректировка формул может выполняться с помощью строки формул или непосредственно в ячейке таблицы. При этом формула всегда должна начинаться со знака «=» (равно). Она может включать числовые данные, адреса числовых ячеек, знаки математических операций, а также названия встроенных функций. При вводе формул выполняющих вычисления недопустимо использовать текстовые данные и несуществующие адреса ячеек.
Адрес ячейки, используемый в формуле, обозначается только латинскими буквами, без пробелов. Он может быть записан в относительном и абсолютном виде с добавлением знака денежной единицы «$». Например, адрес ячейки D5 является относительным, а $D$5 абсолютным. Преобразование относительного адреса ячейки в абсолютный выполняется вводом с клавиатуры знака $ или клавишей F4. Важно помнить, что при выполнении команды автозаполнения относительный адрес изменяется на единицу в каждой соседней ячейке. Если адрес ячейки записан в абсолютном виде, он не изменяется при выполнении указанной команды.
Одним из способов ввода формул является возможность применения встроенных функций. Функцией в программе Excel называется алгоритм вычислений, который обозначен именем и содержит аргументы, заключенные в круглые скобки. В качестве аргументов функций могут применяться числа, адреса и диапазоны числовых ячеек. Например, для суммирования данных в выделенном диапазоне числовых ячеек таблицы применяется функция =СУММ(диапазон). С целью получения максимального значения числа в диапазоне ячеек используется функция =МАКС(диапазон), а минимального значения =МИН(диапазон). Ввод требуемой функции в ячейку таблицы выполняется с помощью указания ее имени с клавиатуры или выбором из списка предлагаемого «Мастером функций». Он позволяет получить информацию о назначении и правилах использования каждой стандартной функции.
Если формула содержит синтаксическую ошибку, программа Excel не выполнит вычислений и покажет сообщение в ячейке таблицы, где пользователь применил ошибочную формулу. Наиболее распространенными ошибками записи формул являются:
- ошибка #ЗНАЧ! указывает на использование недопустимого типа данных в формуле, например, адреса ячейки, содержащей текстовые данные. Для исправления этой ошибки требуется проверить содержимое ячеек, адреса которых записаны в формуле, и убедиться, что в них внесены числовые данные. А затем исправить формулу с применением адресов только числовых ячеек или ввести числовые данные в ячейки, адрес которых используется в формуле.
- если при вводе формулы в ячейке отображается ошибка #ИМЯ?, это указывает на использование несуществующего или неправильно записанного адреса ячейки. Например, лишний пробел в адресе ячейки (B2 правильно, B 2 ошибка) или знак русского алфавита (буква B английская - правильно, буква В русская - ошибка). Для исправления такой ошибки необходимо проверить правильность записи адресов ячеек в формуле и откорректировать ошибочные.
- появление ошибки #ДЕЛ/0 происходит при выполнении вычислений формулой, которая производит деление на ноль. Для исправления ошибки необходимо проверить правильность написания формулы и данные в адресах ячеек, указанных в знаменателе.
Кроме широких вычислительных возможностей программа Excel включает команды построения рисунков деловой графики, которые называются «Диаграммами». Диаграмма (от греч. diagramma - изображение, рисунок, чертеж) является средством наглядного представления данных с целью визуального сопоставления явлений, выявления закономерностей и тенденций. Диаграммы существенно информативнее числовых данных, так как они обеспечивают наглядное представление информации.
Диаграммы создаются на основе данных в сохраненных ячейках таблицы Excel. Для изготовления диаграммы выделяется область диапазон данных (или несколько диапазонов, возможно несмежные), на основе которых будет создан рисунок. Необходимо выделять все ячейки, которые хранят данные, отображаемые в диаграмме. Если выделяется несколько отдельных диапазонов, то число ячеек в них должны быть равными, то есть необходимо соблюдать симметричность выделенных областей. В случае использования нескольких диапазонов, изготовление диаграммы можно упростить путем копирования требуемых данных на отдельный лист, используя операции выделения, копирования и вставки.
Рисунок диаграммы включает следующие основные элементы: «Ряды данных», «Категории», «Легенда» (рис. 2).
Ось Y (значений)
Ось X (категорий)
Легенда
Ряды данных
Рис. 2. Основные элементы диаграммы.
Ряд данных - это столбец или строка числовых значений, отображаемых на оси Y диаграммы. Каждому ряду данных соответствует отдельный цвет или способ обозначения, указанный в легенде диаграммы. Диаграммы всех типов, кроме круговой, могут содержать несколько рядов данных.
Категории - (аргументы функции на оси Х) служат для упорядочения значений в рядах данных, которые изображены на диаграмме.
Легенда - это условные обозначения рядов данных на диаграмме. Она содержит текстовые пояснения о цветовых или узорных обозначениях, используемых в рисунке.
Команды создания диаграммы расположены в режиме «Вставка» и требуют выбора вида рисунка. Основными видами диаграмм, которые могут создаваться пользователем в программе Excel, являются: «Гистограмма», «Линейчатая», «График», «Круговая», «С областями» и «Точечная».
Гистограмма (столбиковая диаграмма) представляет собой набор вертикальных столбиков, высота которых определяется значениями данных. Она является одним из самых распространенных типов диаграмм. Применяется для сравнения значений числовых данных в одном или нескольких рядах, а также представления изменения данных во времени. Одним из вариантов представлений гистограммы является внутристолбиковая диаграмма, которая демонстрирует высотой столбика уровень явления в целом, в его части показывают доли этого явления.
Линейчатая диаграмма это гистограмма, столбики которой располагаются не вертикально, а горизонтально.
График отображает данные в форме сглаженной или ломаной линии, соединяющей точки, соответствующие значениям данных.
Круговая (секторная) диаграмма является одним из самых простых видов диаграмм. Она строится по одному ряду числовых данных и показывает долю каждого числового значения в сумме значений всего явления в целом. Как правило, каждый сектор круга обозначается подписью величины доли в процентах.
Диаграмма с областями иллюстрирует величину изменений явления в зависимости от времени подобно графику, но с накоплением уровня явления изображаемого цветом под линией. Например, график прибыли предприятия по годам, отображается в диаграмме с областями, чтобы обратить внимание на величину общей прибыли.
Точечная диаграмма отображает взаимосвязь между числовыми значениями в нескольких рядах в координатах X и Y. Точечная диаграмма имеет две оси значений, при этом один набор значений выводится вдоль горизонтальной оси (оси X), а другой вдоль вертикальной оси (оси Y). На точечной диаграмме эти значения объединяются в одну точку данных и отображаются с неравными интервалами, или кластерами. Точечные диаграммы обычно используются для представления и сравнения научных или статистических данных.
Дополнительными видами диаграмм являются: «Биржевая», «Поверхность», «Кольцевая», «Пузырьковая», «Лепестковая». Они применяются в дополнение к стандартным изображениям лишь в отдельных случаях. Например, лепестковая диаграмма используется для наглядного изображения повторяющихся циклических процессов. Благодаря внешнему виду она, также, называемая «Паутиной» или «Звездой». Лепестковая диаграмма содержит значения каждой категории вдоль радиальной оси, которая начинается в центре круга и заканчивается на внешнем кольце.
Важнейшей функциональной возможностью программы Excel является ее использование для статистического анализа данных. Хотя Excel уступает специализированным пакетам статистической обработки данных, тем не менее, программа содержит ряд методов, включающий наиболее часто используемые процедуры: средства описательной статистики, критерии проверки статистических гипотез, корреляционные и регрессионные методы и др., что позволяет выполнять статистический анализ медицинских данных.
Часть этих методов реализованы стандартными функциями программы. Например функция =СРЗНАЧ(диапазон) служит для вычисления средней арифметической величины. Большинство статистических методов сгруппированы в специальной надстройке к программе, которая называется «Пакет анализа». Он может быть вызван командой «Данные» - «Анализ данных».
Если в разделе «Данные» отсутствует указанный раздел, необходимо выполнить установку этой надстройки. Для этого требуется открыть основное меню кнопкой «Office», выбрать «Параметры Excel» -> «Надстройки» -> «Перейти» -> «Пакет анализа» -> «ОК». Модуль анализа данных в программе Excel, как правило, не подключается при типовой установке пакета программ Microsoft Office. В связи с этим перед применением программы Excel для статистической обработки данных требуется однократно выполнить установку указанного пакета.
Пример создания учетного электронного документа «Протокол работы студента» для изучения медицинской статистики.
Задача: необходимо создать табличный документ, который должен содержать результаты освоения студентом методики статистического исследования и средств обработки данных в программе Microsoft Excel. Документ должен быть защищен паролем и сохранен в общей папке локальной сети для совместного доступа к нему преподавателя и студентов.
Решение: запустите программу Excel, внесите на листе1 заголовок и название документа, ФИО студента(ов), которые будут работать с ним, срок обучения, цели и основные задачи. Пример заполнения ячеек таблицы этими данными показан на рисунке 3.
Рис. 3. Пример заполнения табличного документа протокола работы студента.
Сохраните файл на рабочем столе своего компьютера с указанием имени: СтатистикаФамилии студентов.xlsx
Установите защиту на открытие файла с назначением пароля, для этого выполните нажатие кнопки «Office» и в основном меню программы выберите раздел «Подготовить» - > «Зашифровать документ», введите свой пароль. Внимание! Запишите пароль в рабочей тетради, если он будет потерян, преподаватель не сможет оценить работу студента. Сохраните изменения файла командой «Сохранить». Закройте программу Excel. Перенесите созданный табличный документ в общую папку своей учебной группы, покажите результат работы преподавателю.
ЗАДАНИЕ
Заполнение табличного документа протокола работы студента.
а) В общей папке учебной группы откройте табличный документ с именем «СтатистикаФамилии студентов». Измените название «Лист1» на «Титул».
б) Создайте новый лист и укажите его название «Формулы». На новом листе в ячейку B1 внесите текст «Частота пульса студентов на занятии». Заполните диапазон ячеек от A3 до A14 номерами от 1 до 12. Подсчитайте частоту пульса студентов своей учебной группы и внесите полученные числовые данные в ячейки от B3 до B14. В ячейке B15 выполните вычисление средней частоты пульса функцией =СРЗНАЧ(B3:B14). В ячейке B16 определите минимальное значение пульса функцией =МИН(B3:B14). В ячейке B17 определите максимальное значение пульса функцией =МАКС(B3:B14). В ячейке B17 вычислите ранг числа 75 в числовом ряду значений частоты пульса функцией =РАНГ(72; B3:B14).
в) Откройте надстройку «Анализ данных» и выполните запуск модуля «Описательная статистика». Укажите входной интервал ячеек $B$3:$B$14, а выходной интервал $D$3. Установите отметки для вывода данных «Итоговая статистика», «Уровень надежности 95%», «К-й наименьший», «К-й наибольший», нажмите кнопку «ОК».
Cохраните файл и закройте программу. Покажите результат работы преподавателю.
Контрольные вопросы
Рекомендуемая литература:
О теории вероятностей
Теория вероятностей это математическая наука, изучающая закономерности массовых случайных явлений (событий).
Даже само высказывание "вычислить вероятность" содержит парадокс. Ведь вероятность, в противоположность достоверности, есть то, чего не знают. Как же можно вычислять то, о чем нет никаких знаний? Пользуясь классическим определением, можно сказать, что вероятность - это отношение числа случаев, благоприятствующих изучаемому событию, к полному числу возможных случаев.
Основные понятия теории вероятностей
Опыт, испытание
Под опытом (испытанием) в теории вероятностей принято понимать наблюдение какого-либо явления при соблюдении определенного комплекса условий, который должен каждый раз строго выполняться при повторении данного испытания. Если то же самое явление наблюдается при другом комплексе условий, то это уже другое испытание. В теории вероятностей принимается допущение, что испытание может быть повторено бесконечное число раз.
Например, выполнение штрафного броска в баскетболе есть испытание, при этом его результат: попадание мяча в кольцо - это результат данного испытание (исход или событие).
Событие
Событием называется любой результат испытания (опыта) произошедший в действительности. При проведении испытания требуемый результат (событие) может быть получен с различной степенью возможности.
Случайным событием называется любой факт действительности, который может произойти или не произойти в результате опыта.
В некоторых случаях можно сказать, что одно событие произойдет практически наверняка (достоверное событие), другое практически никогда (невозможное событие).
Примеры: наступление дня после ночи событие достоверное. Превращение воды в лёд при температуре +30° С событие невозможное. Вечером пойдёт дождь событие случайное.
События принято обозначать большими латинскими буквами A, B, С ... При этом достоверное событие обозначаются буквой W, а невозможное событие символом (пустое множество).
Достоверным событием (W) называется событие, которое наверняка произойдет в результате опыта. Событие называется невозможным (), если оно никогда не произойдет в результате опыта.
В отношении друг друга события также имеют особенности, т.е. в одном случае событие А может произойти совместно с событием В, в другом нет.
Например, если из коробки, содержащей только красные и зеленые шары, наугад вынимают один шар, то появление среди вынутых шаров белого невозможное событие (). При этом появление красного и появление зеленого шаров образуют полную группу событий.
Несовместными называются события, если появление одного из них исключает появление других.
Классическим примером несовместных событий является результат подбрасывания монеты выпадение лицевой стороны монеты исключает выпадение обратной стороны (в одном и том же опыте).
Противоположным событию , называется событие , состоящее в ненаступлении события . Очевидно, что события и несовместны.
Определение вероятности
Вероятностью P(A) события называется отношение числа m исходов опыта, благоприятствующих событию A, к общему числу n возможных исходов опыта, образующих полную группу равновероятных попарно несовместных событий:
.
Свойства вероятности событий:
- Вероятность случайного события есть положительное число, меньшее единицы:
.
- Вероятность достоверного события равна единице, действительно число благоприятных исходов события m=n, тогда: .
- Вероятность невозможного события равна нулю, действительно число благоприятных исходов события m=0, тогда: .
Аксиомы теории вероятностей
- Аксиома 1. Каждому случайному событию A соответствует определенное число Р(А), называемое его вероятностью и удовлетворяющее условию .
- Аксиома 2. Вероятность достоверного события равна единице.
- Аксиома 3 - сложения вероятностей. Пусть A и В несовместные события. Тогда вероятность того, что произойдет хотя бы одно из этих двух событий, равна сумме их вероятностей: P(A+B)=P(A)+P(B).
Теоремы теории вероятностей
- Теорема 1. Для любого события вероятность противоположного события выражается равенством .
- Теорема 2. Вероятность невозможного события равна нулю.
- Теорема Бернули Закон больших чисел. Относительная частота появления события приближенно равна вероятности этого события и тем точнее, чем больше число испытаний.
Действия над событиями
Сложение вероятности событий:
Сложением (или объединением) двух событий A и В называется событие С, заключающееся в том, что произойдет по крайней мере одно из событий A или В. Это событие обозначается так: С=А+В.
Задача. В урне 2 зеленых, 7 красных, 5 коричневых и 10 белых шаров. Какова вероятность появления цветного шара?
Решение. Находим соответственно вероятности появления зеленого, красного и коричневого шаров:
Р(зел.)=2/24; Р(кр.)=7/24; Р(кор.)=5/24.
Так как рассматриваемые события, очевидно, несовместны, то, применяя аксиому сложения, найдем вероятность появления цветного шара:
Умножение вероятности событий
Умножением (или совмещением) двух событий A и В называется событие, состоящее в совместном наступлении как события A, так и события В. Это событие будем обозначать С=АВ.
Задача: Из урны, содержащей 3 белых и 7 черных шаров, вынимают два шара. Какова вероятность того, что оба шара окажутся белыми?
Решение: Находим соответственно вероятности появления первого белого шара P(бел1)=3/10, находим вероятность появления второго белого шара P(бел2)=2/9. Вероятность появления 2 х белых шаров P(2 белых) = P(бел1) * P(бел2) = 3/10 * 2/9 = 2/30.
ВНИМАНИЕ!!! Для вычисления вероятности сложных событий, прежде всего, необходимо определить общее число возможных исходов таких событий. Для этого необходимо использовать методы комбинаторики.
Элементы комбинаторики
Выбор способа нахождения числа возможных перестановок и комбинаций k элементов из их общего числа n выполняется с учетом комбинаторных конфигураций. Основными комбинаторными конфигурациями являются:
- Правило произведения
- Перестановка
- Выборка с возвращением
- Сочетание
- Размещение
Правило произведения применяется когда необходимо определить число способов (m), которыми могут быть выполнены одно за другим k действий. Если первое действие можно выполнить n1 способами, второе n2 способами и так до nk го действия, то возможное число способов равно
m = n1 * n2 * nk.
Задача: в гардеробе имеется 5 различных галстуков, 8 рубашек и 3 заколки для галстука.
Решение: общее число разных вариантов по их использованию в одном комплекте согласно правилу произведения будет равно
m =5 * 8 * 3 = 120.
В программе Excel такие вычисления выполняются формулой =5*8*3.
Перестановка это такие выборки элементов, которые отличаются только порядком расположения элементов. Число перестановок из n элементов (например чисел 1,2,…,n) называется всякий упорядоченный набор из этих элементов. Возможное число перестановок из n элементов определяется по формуле:
An = 1 * 2 * 3 * … * (n−2) * (n−1) * n = n!, где An=число перестановок.
Обозначение n! означает факториал числа, например
4! = 1*2*3*4 = 24.
В программе Excel для вычисления факториала применяется функция =ФАКТР(n), поэтому формула в ячейке Excel = ФАКТР(4) даст результат 24.
Задача: за круглый стол садятся 7 человек.
Решение: число возможных вариантов их размещения за столом равно
A7 = 1 * 2 * 3 * 4 * 5 * 6 * 7 = 7! = ФАКТР(7) = 5040.
Выборка с возвращением
Выборка с возвращением это число способов (m), которыми можно создать комбинацию из n элементов k действиями с возвращением элементов в исходное множество. В этом случае число способов, которыми можно выполнить k действий, для множеств (n) с одинаковым числом элементов (с возвратом выбранных элементов в множество) равно
m = nk.
Задача: при кодировании замков деверей учебных классов используются трёхзначные номера из 5 цифр от 0 до 5.
Решение: число различных кодов, которые можно составить, равно
m =53 = 125.
В программе Excel такие вычисления выполняются формулой =5^3.
Сочетанием из n по k называется набор k элементов, выбранных из данных n элементов, при этом наборы отличающиеся только порядком следования элементов (но не составом), считаются одинаковыми. Этим сочетания отличаются от размещений. Такие неупорядоченные выборки называются сочетаниями из n элементов по k и обозначаются Сnk.
Выборка без возвращения (число возможных вариантов).
Выборка без возвращения - сочетание из n элементов с выбором k из них без возвращения в исходное множество. Число возможных сочетаний определяется по формуле:
Число сочетаний определяется по формуле Сnk = n!/ k!*(n − k)!.
где: C kn число сочетаний;
n- общее число элементов;
k выбираемое число элементов.
Обозначение n! означает факториал числа, например 4! = 1*2*3*4 = 24.
Задача: Сколько сочетаний можно составить из 36 карт игральной колоды, из которой выбирается по 2 карты без учёта порядка расположения этих карт, при условии, что выбранная карта не возвращается в колоду.
Решение: C236 =36!/2!(36-2)! =
= 371 993 326 789 901 000 000 000 000 000 000 000 000 000 / 2 * 295 232 799 039 604 000 000 000 000 000 000 000 000 =
= 3,72E+41 / 2 * 2,952E+38
= 630
В программе Excel такие вычисления выполняет функция =ЧИСЛКОМБ(N;K), например =ЧИСЛКОМБ(63;2) = 360.
Размещением (выборочной перестановкой) из n элементов по k (мест) называются такие выборки, которые имея по k элементов, выбранных из числа данных n элементов, отличаются одна от другой либо составом элементов, либо порядком их расположения. Размещением считается упорядоченный набор из k различных элементов некоторого n-элементного множества.
Число размещений из n по k обозначается Ank и определяется по формуле
Ank = n·(n − 1)·(n − 2)·...·(n − m + 1) = n!/(n − k)!.
Или:
В Excel эти вычисления выполняются функцией =ПЕРЕСТ(n;k).
Задача: Сколько всего сочетаний можно составить из 36 по 2 с учётом порядка расположения этих 2-х карт, при условии, что выбранные карты возвращаются в колоду.
Решение: A236 = 36!/(36-2)!= 36!/(34)!=
= 371 993 326 789 901 000 000 000 000 000 000 000 000 000 / 295 232 799 039 604 000 000 000 000 000 000 000 000 =
= ПЕРЕСТ(36;2) = 1260
Если при выполнении размещения выбираются все элементы множества, т.е. n=k, то такое размещение является перестановкой (см.выше) и тогда функция =ПЕРЕСТ(n;k) дает одинаковы результат с функцией ФАКТР(n). Например, число возможных вариантов размещения за круглым столом 7 человек равно
A7 = 1 * 2 * 3 * 4 * 5 * 6 * 7 = 7! =ПЕРЕСТ(7;7)= ФАКТР(7) = 5040.
Формула Байеса
Теорема Байеса (или формула Байеса) это одна из основных теорем теории вероятностей, которая позволяет определить вероятность того, что произошло какое-либо событие (гипотеза) при наличии лишь косвенных тому подтверждений (данных), которые могут быть неточны.
Формула названа в честь ее автора - Томаса Байеса. Его работа «An Essay towards solving a Problem in the Doctrine of Chances» была опубликована в 1763 году, через 2 года после смерти автора.
,
где:
P(A) априорная вероятность гипотезы A (смысл такой терминологии см. ниже);
P(A|B) вероятность гипотезы A при наступлении события B (апостериорная вероятность);
P(B|A) вероятность наступления события B при истинности гипотезы A;
P(B) вероятность наступления события B.
Однако, психологические эксперименты показали, что люди при оценках вероятности игнорируют различие априорных вероятностей (ошибка базовой оценки), и потому правильные результаты, получаемые по теореме Байеса, могут очень отличаться от ожидаемых.
Следствие теоремы Байеса является формула полной вероятности: .
Она служит для вычисления вероятности наступления события B, зависящего от ряда гипотез Ai, если известны степени достоверности этих гипотез (например, измерены экспериментально);
Пример:
Два стрелка подбрасывают монетку и выбирают, кто из них стреляет по мишени (одной пулей). Первый стрелок попадает по мишени с вероятностью 1, второй стрелок с вероятностью 0,00001. Можно сделать два предположения об эксперименте: и . Априорные (a'priori «до опыта») вероятности этих гипотез одинаковы: .
Рассмотрим событие . Известно, что
Поэтому вероятность пуле попасть в мишень
Предположим, что событие произошло. Какова теперь апостериорная (a'posteriori «после опыта») вероятность каждой из гипотез ? Очевидно, что первая из этих гипотез много вероятнее второй (а именно, в раз). Действительно,
Пример решения задач теории вероятностей в Excel
Задача: имеется 3 белые и 4 красные гвоздики (n). Букет составляют из 5 (k) цветков. Каким будет число различных вариантов составления букета?
Решение: Откройте книгу Excel. Создайте таблицу, содержащую исходные данные.
В ячейках 6-й и 7-й строк укажите формулировку задания:
Ниже внесите все данные, необходимые для вычисления и решения задачи.
n количество всех цветов. n = белые гвоздики + красные гвоздики (B2 + B3).
k количество цветов в букете.
Для вычисления числа комбинаций из 7 гвоздик в букет по 5 цветов используйте функцию ЧИСЛКОМБ(B11, B12).
Ответ выделите цветным фоном.
Задания для самостоятельной работы
Решите задачи с помощью программы Excel по варианту, указанному преподавателем. Каждую задачу разместите на отдельном листе книги.
Задача 1: Бросают игральную кость один раз. Какова вероятность выпадения 2 или 3.
Задача 2: Первый стрелок попадает в цель с вероятностью 0,9, второй стрелок - с вероятностью 0,5. Какова вероятность совместного попадания двух стрелков?
Задача 3: В гаражном кооперативе для кодирования замков боксов используются трехзначные номера из цифр от 0 до 5. Найти число комбинаций различных кодов. Какова вероятность открыть замок кодом 232?
Задача 4: Ребенок, не знающий алфавит, играет кубиками с буквами В, А, Ч, Р. Какова вероятность, что ребенок сложит слово «ВРАЧ»?
Задача 5: Для сигнализации об аварии установлены два независимо работающих сигнализатора. Вероятность того, что при аварии сигнализатор сработает, равна 0,95 для первого сигнализатора и 0,9 для второго. Найти вероятность того, что при аварии сработает только один сигнализатор.
Задача 6: Вероятность хотя бы одного попадания в цель при четырех выстрелах равна 0,9984. Найти вероятность попадания в цель при одном выстреле.
Задача 7: Молодой человек забыл номер своего приятеля, но помнит из него первые 4 цифры. В телефонном номере 7 цифр. Какова вероятность, что молодой человек дозвонится до своего приятеля, если наберёт номер случайным образом?
Задача 8: Монета брошена три раза. Найти вероятность того, что хотя бы один раз появится изображение герба.
Задача 9: В ящике находятся 5 красных и 8 синих шаров. Наугад вынимаются 2 шара. Какова вероятность, что они:
а) оба синие;
б) одного цвета;
в) разных цветов?
Задача 1: Бросают игральную кость. Какова вероятность выпадения 1 и 6.
Задача 2: Первый стрелок попадает в цель с вероятностью 0,8, второй стрелок - с вероятностью 0,4. Какова вероятность совместного попадания двух стрелков?
Задача 3: В гаражном кооперативе для кодирования замков боксов используются трехзначные номера из цифр от 0 до 9. Найти число комбинаций различных кодов. Какова вероятность открыть замок кодом 323?
Задача 4: Ребенок, не знающий алфавит, играет кубиками с буквами Д, О, К, Т, О, Р. Какова вероятность, что ребенок сложит слово «ДОКТОР»?
Задача 5: В квартире установлены две независимо работающих сигнализации. Вероятность того, что при ограблении первая сигнализация сработает, равна 0,85, а вторая 0,7. Найти вероятность того, что при аварии сработает только одна сигнализация.
Задача 6: Вероятность достать из ящика хотя бы один красный шар при четырех попытках равна 0,788. Найти вероятность достать красный шар при одной попытке.
Задача 7: Молодой человек забыл номер своего приятеля, но помнит из него первые 3 цифры. В телефонном номере 5 цифр. Какова вероятность, что молодой человек НЕ дозвонится до своего приятеля, если наберёт номер случайным образом?
Задача 8: Монета брошена три раза. Найти вероятность того, что хотя бы один раз появится изображение герба.
Задача 9: В ящике находятся 3 красных и 7 синих шаров. Наугад вынимаются 2 шара. Какова вероятность, что они:
а) оба красные;
б) одного цвета;
в) разных цветов?
Задача 1: Бросают игральную кость один раз. Какова вероятность выпадения 1 или 6.
Задача 2: Первый стрелок попадает в цель с вероятностью 0,8, второй стрелок - с вероятностью 0,4. Какова вероятность совместного попадания двух стрелков?
Задача 3: В гаражном кооперативе для кодирования замков боксов используются трехзначные номера из цифр от 0 до 9. Найти число комбинаций различных кодов. Какова вероятность открыть замок кодом 323?
Задача 4: Ребенок, не знающий алфавит, играет кубиками с буквами Д, О, К, Т, О, Р. Какова вероятность, что ребенок сложит слово «ДОКТОР»?
Задача 5: В квартире установлены две независимо работающих сигнализации. Вероятность того, что при ограблении первая сигнализация сработает, равна 0,85, а вторая 0,7. Найти вероятность того, что при аварии сработает только одна сигнализация.
Задача 6: Вероятность достать из ящика хотя бы один красный шар при четырех попытках равна 0,788. Найти вероятность достать красный шар при одной попытке.
Задача 7: Молодой человек забыл номер своего приятеля, но помнит из него первые 3 цифры. В телефонном номере 5 цифр. Какова вероятность, что молодой человек НЕ дозвонится до своего приятеля, если наберёт номер случайным образом?
Задача 8: Монета брошена три раза. Найти вероятность того, что хотя бы один раз появится изображение герба.
Задача 9: В ящике находятся 3 красных и 7 синих шаров. Наугад вынимаются 2 шара. Какова вероятность, что они:
а) оба красные;
б) одного цвета;
в) разных цветов?
Задача 1: Бросают игральную кость один раз. Какова вероятность выпадения 2 или 3.
Задача 2: Первый стрелок попадает в цель с вероятностью 0,9, второй стрелок - с вероятностью 0,5. Какова вероятность совместного попадания двух стрелков?
Задача 3: В гаражном кооперативе для кодирования замков боксов используются трехзначные номера из цифр от 0 до 5. Найти число комбинаций различных кодов. Какова вероятность открыть замок кодом 232?
Задача 4: Ребенок, не знающий алфавит, играет кубиками с буквами В, А, Ч, Р. Какова вероятность, что ребенок сложит слово «ВРАЧ»?
Задача 5: Для сигнализации об аварии установлены два независимо работающих сигнализатора. Вероятность того, что при аварии сигнализатор сработает, равна 0,95 для первого сигнализатора и 0,9 для второго. Найти вероятность того, что при аварии сработает только один сигнализатор.
Задача 6: Вероятность хотя бы одного попадания в цель при четырех выстрелах равна 0,9984. Найти вероятность попадания в цель при одном выстреле.
Задача 7: Молодой человек забыл номер своего приятеля, но помнит из него первые 4 цифры. В телефонном номере 7 цифр. Какова вероятность, что молодой человек дозвонится до своего приятеля, если наберёт номер случайным образом?
Задача 8: Монета брошена три раза. Найти вероятность того, что хотя бы один раз появится изображение герба.
Задача 9: В ящике находятся 5 красных и 8 синих шаров. Наугад вынимаются 2 шара. Какова вероятность, что они:
а) оба синие;
б) одного цвета;
в) разных цветов?
ВНИМАНИЕ! Файл с выполненными заданиями сохранить на рабочем столе и переместить в \\room\ Семинары\Документы студентов\Папка с номером группы. Сообщить преподавателю о выполнении заданий.
В любом медико-биологическом и социально-гигиеническом исследовании ведущая роль отводится проведению статистического наблюдения. Его организация определяет особенности последующей обработки полученных данных, выбор методов статистики и обоснованность выводов. В связи с этим методика проведения статистического наблюдения является одним из важнейших разделов статистики.
СТАТИСТИКА - это общественная наука, которая изучает количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной.
САНИТАРНАЯ (МЕДИЦИНСКАЯ) СТАТИСТИКА - это раздел статистики, изучающий состояние здоровья населения (показатели общественного здоровья) и деятельность лечебно-профилактических учреждений (ЛПУ), то есть состоит из статистики здоровья и статистики здравоохранения.
Предметами изучения медицинской статистики являются: здоровье населения в целом и отдельных возрастно-половых групп; выявление и установление зависимостей между уровнем здоровья и факторами окружающей среды; данные о сети, деятельности, кадрах учреждений здравоохранения; оценка статистической достоверности результатов медико-биологических, клинических и экспериментальных исследований.
Целью исследования в медицине и здравоохранении является выявление закономерностей изучаемого явления на основе проверки статистических (рабочих) гипотез, сформулированных в начале исследования. В зависимости от цели конкретизируются частные задачи и составляются план проведения всей работы, а также детальные программы сбора, разработки и статистического анализа собранного материала.
РАБОЧЕЙ ГИПОТЕЗОЙ называется эмпирически не проверенное предположение, предсказывающее существование некоторой зависимости между переменными или объектами. Рабочие гипотезы используются для выработки предварительного плана научного исследования.
Статистическое исследование начинается с определения объекта наблюдения, единицы наблюдения и учетных признаков.
Объектом статистического наблюдения является статистическая совокупность, состоящая из единиц, о которых должны быть собраны статистические сведения, взятая в определенных границах пространства и времени. Например, при сборе данных о заболеваемости объектом наблюдения является совокупность всех заболеваний или всех больных среди населения на данной территории за определенный период времени.
Единица статистического наблюдения это составная часть объекта наблюдения, подлежащая изучению и регистрации в соответствии с программой исследования. Например, отдельный случай заболевания или больное лицо, входящее в состав объекта наблюдения.
Каждая единица наблюдения характеризуется рядом признаков, величины которых исследователь регистрирует в процессе сбора статистического материала. Такие признаки принято называть учетными.
Учетные признаки - это медико-биологические характеристики, регистрируемые у единицы наблюдения в соответствии с целями и задачами исследования. Такими признаками могут быть: пол, возраст, место жительства, диагноз, дата заболевания, длительность болезни, ее исход и т.д.
В медицинской статистике используются следующие ВИДЫ УЧЕТНЫХ ПРИЗНАКОВ:
- сходства, по которым единицы наблюдения объединяются в статистическую совокупность;
- различия, которые отличают единицы наблюдения между собой;
- факторные, которые влияют на изучаемое явление;
- результативные, которые изменяются под влиянием факторных признаков.
В зависимости от способа регистрации встречаются следующие ТИПЫ учетных признаков:
- качественные (атрибутивные), которые могут быть выражены словесно, описательно;
- количественные, фиксирующие числовые значения признака.
Важнейшим понятием медицинской статистики является «Статистическая совокупность».
СТАТИСТИЧЕСКАЯ СОВОКУПНОСТЬ - это группа, состоящая из большого числа относительно однородных элементов (единиц наблюдения), взятых вместе в известных границах времени и пространства. Необходимо различать два основных вида статистических совокупностей - генеральную и выборочную.
ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ состоит из всех возможных единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования. Генеральная совокупность в медико-биологических исследованиях используется редко. Большинство исследований выполняется с использованием выборочной совокупности.
ВЫБОРОЧНАЯ СОВОКУПНОСТЬ это часть генеральной совокупности, отобранная специальным методом и предназначенная для характеристики генеральной совокупности.
Указанные совокупности могут быть сформированы двумя основными методами. МЕТОДАМИ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ являются:
- сплошное исследование, при котором изучаются все доступные единицы наблюдения генеральной совокупности;
- выборочное, при котором изучается определенная часть единиц наблюдения, наиболее полно характеризующие статистическую совокупность в целом.
В зависимости от продолжительности исследования применяются следующие ВИДЫ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ: единовременное и текущее.
Единовременное наблюдение это исследование, при котором статистические данные собираются на определенный (критический) момент времени. Например, перепись населения.
Текущее наблюдение это непрерывное, повседневное исследование, производимое в течение определенного периода: месяца, полугода, года. Например, изучение уровня заболеваемости населения города или региона.
Перед проведением исследования требуется сформулировать рабочую гипотезу и определить: что является объектом исследования, какие единицы наблюдения будут изучаться, какой перечень признаков (параметров) необходимо учитывать и какой вид исследования будет выполняться. Затем исследователь собирает статистический материал, выполняет его обработку и формулирует заключение, которое подтверждает или опровергает рабочую гипотезу.
Таким образом, научное исследование состоит из нескольких этапов:
1 этап - составление программы и плана исследования;
2 этап - статистическое наблюдение;
3 этап - группировка и разработка статистического материала;
4 этап - анализ результатов исследования.
На 1-м этапе статистического исследования основными видами работ являются:
- составление плана исследования;
- подготовка программы исследования.
Программа исследования включает вопросы, что и в каком направлении изучать, с обозначением объекта и единиц наблюдения, учетных признаков, методов сбора (анкеты, бланки, первичные документы), разработки и анализа материала (макеты таблиц, выбранные статистические критерии).
План исследования отвечает на вопросы: где, сколько, когда, кто и как выполняет исследование, и включает:
- выбор места проведения исследования;
- пути формирования объекта наблюдения (объем выборки, время, способы сбора материала);
- определение единицы наблюдения;
- способы разработки материала;
- сроки работ по этапам;
- выбор исполнителей;
- финансирование исследования;
- инструкции исполнителям, организационное и методическое сопровождение.
ПРОГРАММА СБОРА МАТЕРИАЛА представляет собой первичный учетный документ (бланк, карта, анкета), в который включены учетные признаки, соответствующие цели исследования и подлежащие регистрации.
При составлении учетного документа необходимо соблюдать следующие правила:
1) документ должен иметь четкое заглавие, в котором сформулирована единица наблюдения;
2) учетные признаки должны быть указаны краткими названиями и соответствовать цели исследования;
3) на каждый вопрос исследования следует предусмотреть варианты ответов в соответствии с выделенными группами единиц наблюдения.
Программа разработки материала предусматривает определение критериев группировки единиц наблюдения и составление макетов статистических таблиц.
На 2-м этапе проводится сбор статистического материала.
Статистическим материалом в каждом данном случае являются первичные учетные документы, официально существующие или специально разработанные (талоны, карты, анкеты и т.п.). Сбор материала проводят в соответствии с составленной ранее программой и планом статистического исследования.
На 3-м этапе осуществляется обработка собранного статистического материала. Он включает следующие последовательно выполняемые действия: контроль, шифровка, группировка, сводка в статистические таблицы, вычисление статистических показателей и их графическое изображение.
КОНТРОЛЬ - это проверка собранного материала с целью отбора учетных документов, имеющих дефекты, для их последующего исправления, дополнения или исключения из исследования.
ШИФРОВКА - это применение условных обозначений изучаемых признаков с последующим назначением шифра каждой единице наблюдения. При ручной обработке материала шифры могут быть цифровые, буквенные, знаковые; при машинной, как правило, цифровые.
ГРУППИРОВКА - это распределение единиц наблюдения на однородные группы по характеру или величине изучаемых признаков.
ВИДЫ группировок:
- типологическая - это группировка по атрибутивным (качественным) признакам. Например: пол, профессия.
- вариационная - это группировка на основе признаков, имеющих числовое выражение. Например: возраст, стаж.
СВОДКА ДАННЫХ УЧЕТА - занесение полученных после подсчета цифровых данных в таблицы.
Для дальнейшего анализа материала необходимо произвести РАСЧЕТЫ СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ и средних величин в соответствии с программой исследования и выполнить ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ.
На 4-м этапе выполняется обобщение и анализ полученных данных. Он включает:
- интерпретацию полученных различных статистических величин и графических изображений на основе сопоставления с нормативами, со средними уровнями аналогичных величин, со стандартами, с данными по другим учреждениям и территориям, литературными данными, в динамике;
- обобщение результатов исследования;
- литературное оформление работы;
- выявление закономерностей;
- выводы;
- предложения для внедрения в практику;
- прогноз, рекомендации.
На каждом из указанных этапов исследования может применяться компьютерная техника, оснащенная распространенным пакетом программ Microsoft Office или аналогичными программами. Их применение ускоряет выполнение статистических вычислений, упрощает подготовку статистических таблиц, наглядное представление данных и публикацию научных работ. Использование табличных редакторов, в том числе программы Excel, позволяет выполнять статистическую обработку медицинских данных с использованием большинства основных методов прикладной статистики и сохранять их в файлах электронных документов.
Пример разработки программы статистического исследования в табличном документе «Протокол работы студента».
Задача: необходимо заполнить табличный документ данными о плане проведения статистического исследования для изучения распространенности курения среди студентов медицинского вуза.
Решение: запустите программу Excel, создайте новый лист и укажите его название «План». В ячейку A1 внесите текст «План исследования», в ячейку A2 - «Изучение распространенности курения среди студентов медицинского вуза». В ячейках с A3 по A7 введите текстовые данные:
- Объект исследования: студенты медицинского вуза.
- Объем статистической совокупности: 30% студентов 1-го - 6-го курса медицинского ВУЗа.
- Сроки проведения исследования: с _______ по________.
- Методы сбора материала: анкетирование, выкопировка из медицинских документов студенческой поликлиники.
- Лица, выполняющие сбор и обработку материала: ФИО студентов
Сохраните свой файл.
ЗАДАНИЕ
Запустите программу Excel, в общей папке учебной группы откройте свой файл с именем «СтатистикаФамилии студентов». На листе «План» внесите анкету для сбора данных о распространенности курения среди студентов медицинских вузов. В ячейки с A9 по A22 внесите текст анкеты:
Сохраните файл на рабочем столе компьютера. Перенесите свой файл в общую папку своей учебной группы, покажите результат работы преподавателю.
Контрольные вопросы
Рекомендуемая литература:
Каждое медико-биологическое или социально-гигиеническое исследование начинается с этапа планирования эксперимента. На этом этапе необходимо разработать макеты статистических таблиц, которые должны стать основой для последующей обработки и анализа данных. Знание методики построения статистических таблиц позволяет подготовить проведение исследования в соответствии с рабочей гипотезой.
СТАТИСТИЧЕСКАЯ ТАБЛИЦА - это форма записи изучаемой статистической совокупности, разделенной на группы в соответствии с изучаемыми признаками.
В таблице, как и в грамматическом предложении, выделяют табличное подлежащее и табличное сказуемое. ТАБЛИЧНОЕ ПОДЛЕЖАЩЕЕ это то, о чем говорится в таблице, основной признак или признаки, которые, как правило, обозначены в строках таблицы. ТАБЛИЧНОЕ СКАЗУЕМОЕ или несколько сказуемых это количественные признаки, характеризующие подлежащее. Они, как правило, расположены в столбцах (графах) таблицы.
Каждая таблица должна иметь заголовок, отражающий ее содержание, шапку с указанием показателей или признаков и единиц измерений, а также столбец «Всего» и строку «Итого». В таблице не должно быть пустых ячеек. Если в документе встречается несколько таблиц, каждая из них обязательно нумеруется. Номер таблицы указывают над ней в правой части страницы.
В зависимости от размера и содержания таблицы она может относиться к одному из видов:
- ПРОСТАЯ (таблица, в которой подлежащее характеризуется лишь одним признаком);
- ГРУППОВАЯ (таблица, в которой подлежащее характеризуется двумя связанными между собой признаками);
- КОМБИНАЦИОННАЯ (таблица, в которой подлежащее характеризуется тремя и более связанными между собой признаками). Комбинационные таблицы, содержащие более 4-х признаков, обычно не применяются из-за громоздкости и сложности анализа. Исследователю лучше составить несколько таблиц, объединяющих по 3-4 связанных признака.
Пример создания макетов статистических таблиц.
Задача: необходимо составить макеты простой, групповой и комбинационной таблиц для внесения данных распределения заболевших жителей района N в 2010 году по социальному статусу (безработные, рабочие, служащие), классам заболеваний (болезни органов дыхания, инфекционные заболевания, травмы, прочие болезни) и возрасту (до 19 лет, 20-39, 40-59, 60 лет и старше).
Решение: запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов», создайте НОВЫЙ лист, переименуйте его, обозначив название «Макеты_таблиц». Создайте на этом листе макеты статистических таблиц, как показано ниже, сохраните файл и покажите результат работы преподавателю.
а) макет простой таблицы включает один признак, только табличное подлежащее (таблица 1).
Таблица 1
Распределение абсолютного числа больных по классам заболеваний
Класс заболеваний |
Число больных |
Болезни органов дыхания |
|
Инфекционные заболевания |
|
Травмы |
|
Прочие болезни |
|
Итого: |
б) макет групповой таблицы включает два связанных между собой признака, один - табличное подлежащее, другой сказуемое (таблица 2).
Таблица 2
Распределение абсолютного числа больных по классам заболеваний с учетом социальных группах среди жителей района
Класс заболеваний |
Число больных в группах |
Всего в группах |
||
рабочие |
служащие |
ИТР |
||
Болезни органов дыхания |
||||
Инфекционные заболевания |
||||
Травмы |
||||
Прочие болезни |
||||
Итого: |
в) макет комбинационной таблицы содержит три и более связанных между собой признака, один - табличное подлежащее, другие сказуемые (таблица 3).
Таблица 3
Распределение абсолютного числа больных по классам заболеваний с учетом возрастных и социальных групп среди жителей района
Класс заболеваний |
Число больных |
Всего в группах |
||||||||||||||||||
рабочие |
служащие |
ИТР |
||||||||||||||||||
до 19 лет |
20-39 лет |
40-59 лет |
60 лет и старше |
всего |
до 19 лет |
20-39 лет |
40-59 лет |
60 лет и старше |
всего |
до 19 лет |
20-39 лет |
40-59 лет |
60 лет и старше |
всего |
до 19 лет |
20-39 лет |
40-59 лет |
60 лет и старше |
всего |
|
Болезни органов дыхания |
||||||||||||||||||||
Инфекционные заболевания |
||||||||||||||||||||
Травмы |
||||||||||||||||||||
Прочие болезни |
||||||||||||||||||||
Итого: |
ЗАДАНИЯ
Запустите программу Excel, в папке учебной группы откройте свой файл под именем «СтатистикаФамилии студентов», на листе «Макеты_таблиц», изготовьте три таблицы на основе данных одного из вариантов, сохраните изменения и покажите результат работы преподавателю.
Вариант 1
Для изучения состава инвалидов Н-ского района требуется собрать данные о больных, прошедших медико-социальную экспертную комиссию (МСЭК), по группам инвалидности (I, II, III), причинам (общее заболевание, профессиональное, производственная травма, прочие причины) и занятости (не работает, продолжает работать). Составьте макеты простой, групповой и комбинационной таблиц.
Вариант 2
Изучается распределение среднего медицинского персонала города Волгограда по специальностям (фельдшеры, акушерки, медицинские сестры, лаборанты, рентгенотехники, помощники санитарных врачей и пр.), стажу (до 5 лет, от 5 до 10 лет, свыше 10 лет), возрасту (до 19 лет, 20-29, 30-39, 40-49, 50-59, 60 лет и старше). Составьте макеты простой, групповой и комбинационной таблиц.
Вариант 3
Проводится сбор данных о распределении рабочих Н-ской фабрики, имевших временную нетрудоспособность в течение года, по ее видам (заболевание, травма, карантин, уход за больным, беременность и роды), цехам (ткацкий, прядильный, красильный), возрасту (до 19 лет, 20-29, 30-39, 40-49, 50-59, 60 лет и старше) и полу. Составьте макеты простой, групповой и комбинационной таблиц.
Вариант 4
Изучается распределение работающих Н-ского завода по цехам (механический, литейный, модельный, кузнечный и др.), стажу работы (до 5 лет, от 5 до 10 лет, более 10 лет), профессиям (слесари, токари, инструментальщики и другие). Составьте макеты простой, групповой и комбинационной таблиц.
Вариант 5
Производится сбор данных о распределении больных язвенной болезнью желудка и двенадцатиперстной кишки, находящихся на диспансерном наблюдении в Н-ской поликлинике, по длительности заболевания (до 1 года, от 1 года до 3 лет, свыше 3 лет), методам лечения (хирургический, консервативный), возрасту (до 19 лет, 20-39, 40-59, 60 лет и старше). Составьте макеты простой, групповой и комбинационной таблиц.
Вариант 6
Изучается число больных в терапевтическом отделении стационара, госпитализированных по поводу крупозной пневмонии, в зависимости от сроков госпитализации (в 1-й, 2-й, 3-й день болезни и позднее), длительности лечения (до 15 дней, свыше 15 дней), наличию осложнений (с осложнениями, без осложнений). Составьте макеты простой, групповой и комбинационной таблиц.
Контрольные вопросы
Рекомендуемая литература:
Для характеристики изучаемой статистической совокупности используются относительные величины, расчет которых проводится на третьем этапе статистического исследования.
Относительные величины (показатели, коэффициенты) весьма распространены и постоянно, наряду с абсолютными величинами, применяются в медицине и здравоохранении, прежде всего для сопоставления одной совокупности с другой. Вычисление относительных величин выполняется на основе абсолютных значений учетных признаков (абсолютных величин).
Абсолютные величины, полученные непосредственно при измерении учетных признаков каждой единицы наблюдения, сами по себе несут важную информацию о размере того или иного явления (количество родившихся, умерших; число коек в каждой больнице города, число дней болезни каждого больного и др.). Они служат основой для вычисления относительных величин, поскольку без преобразования имеют ограниченное познавательное значение.
Относительные величины вычисляются путем отношения (деления) одной абсолютной величины на другую с последующим умножением полученной дроби на требуемое основание (100, 1000, 10 000, 100 000 и т.д.). Смысл расчета относительных величин состоит в нахождении общей меры, приведении к общему знаменателю (основанию). При этом подбор того или иного множителя связан с тем, что относительные величины целесообразно представлять в целых числах, легко воспринимающихся при анализе. Соответственно, относительные показатели могут быть выражены в процентах (%), промилле (%о), продецимилле (%00), просантимилле (%000). Для их условного обозначения применяется знак “P”.
Наиболее часто используются следующие ВИДЫ относительных показателей: интенсивные, экстенсивные, соотношения и наглядности.
Интенсивные показатели отображают распространенность (частоту, уровень) развития явления в своей среде, т.е. в среде, которая продуцирует это явление. Применяются они, чаще всего, в медицине и демографии, отвечая на вопрос: как часто явление встречается в известной среде? Интенсивные величины отражают ЧАСТОТУ (встречаемость) явления в СРЕДЕ, ПОРОДИВШЕЙ это явление и, как правило, вычисляются на основание 1000 (в промилле, %о). Если полученное значение меньше единицы, целесообразно использование множителей 10 000 (%00), 100 000 (%000).
Экстенсивные показатели отражают структурный состав изучаемой совокупности. Они характеризуют отношение части статистической совокупности к совокупности в целом (долю, удельный вес, часть от целого), т.е. отношение отдельного элемента к итогу. Эти показатели нельзя использовать для определения уровня изучаемого явления, они демонстрируют только соотношение его частей и чаще выражаются в %.
Показатели соотношения применяются, когда необходимо определить взаимоотношение не связанных между собой совокупностей. Например, обеспеченность населения больничными койками или врачами, соотношение средних медработников и врачей и др. Они вычисляются как отношение величины одного явления к другому явлению и выражаются, в основном, в продецимилле, реже - в процентах, промилле и др.
Для анализа изменения изучаемого явления во времени вычисляются ДИНАМИЧЕСКИЕ ПОКАЗАТЕЛИ на основе динамического ряда.
Динамическим называется ряд чисел, состоящий из однородных сопоставимых величин, характеризующих изменения какого-либо явления за определенные отрезки времени.
Основными ВИДАМИ динамических рядов являются:
- простой (состоит из абсолютных величин);
- сложный (из относительных и средних);
- моментный (состоит из величин, характеризующих размеры явлений на определенные даты);
- интервальный (состоит из величин, характеризующих размеры явления за определенный интервал времени).
Числа динамического ряда называются УРОВНЕМ.
К показателям динамического ряда относятся:
- абсолютный прирост - разность уровней изучаемого явления в данном и предыдущем периоде, может быть положительным, нулевым или отрицательным (убыль);
- ПОКАЗАТЕЛЬ НАГЛЯДНОСТИ - отношение каждого последующего уровня к исходному, принятому за 100%;
- ПОКАЗАТЕЛЬ РОСТА, или темп роста - отношение каждого последующего уровня к предыдущему уровню, принятому за 100%;
ПОКАЗАТЕЛЬ ПРИРОСТА, или темп прироста - отношение абсолютного прироста к предыдущему уровню, принятому за 100%. Как и абсолютный прирост этот показатель может выражаться положительным (прирост), нулевым (стабильность) или отрицательным (убыль) значением.
При оценке показателей абсолютного прироста и темпа прироста имеет значение на знак полученной величины. Если показатель положительный, это указывает на прирост изучаемого явления. При его отрицательном значении говорят об убыли. В случае нулевого значения фиксируется стабильное состояние изучаемого явления.
Для анализа полученных относительных и динамических показателей необходимо не только уметь их рассчитывать, но и правильно выбирать графическое изображение с целью наглядного представления результатов исследования. Применение графического метода в статистическом исследовании делает изучаемые величины более доступными для понимания. При применении графического метода важно знать, что содержание каждого показателя должно строго соответствовать виду графического изображения.
ИНТЕНСИВНЫЕ показатели, а также показатели СООТНОШЕНИЯ могут быть наглядно представлены в виде 4-х основных типов диаграмм: столбиковые, линейные, картограммы и картодиаграммы. Картограмма - это географическая карта с различной штриховкой. Картодиаграмма - это географическая карта с нанесенными на нее диаграммами.
ЭКСТЕНСИВНЫЕ показатели графически могут быть изображены секторной или внутристолбиковой диаграммой.
Для графического изображения динамических показателей наиболее часто применяются линейная и столбиковая диаграммы. Радиальная (лепестковая) диаграмма является частным видом линейной диаграммы, построенной на полярных координатах. Она используется при необходимости изобразить графически динамику явления за замкнутый цикл времени.
Каждый рисунок диаграммы сопровождается названием, помещаемым под рисунком, порядковым номером и количественными характеристиками представленных явлений.
Пример вычисления относительных величин, заполнения статистических таблиц и графического отображения данных.
Условие задачи: получены данные статистического наблюдения - абсолютные величины заболеваемости в р-не N за 2010 год.
Из них: мальчики - 1700 чел.;
девочки - 1800 чел.
Из них: мальчиков - 1400 чел.;
девочек - 1500 чел.
Из них: мальчики - 1900 случаев;
девочки - 1920 случаев.
Из них: мальчики - 35 случаев;
девочки - 31 случай.
Задание: а) вычислить показатели числа больных лиц, частоту случаев всех заболеваний и случаев скарлатины (интенсивные величины);
б) вычислить показатели доли (удельного веса) мальчиков и девочек среди детей района и долю заболеваний скарлатиной во всех заболеваниях детей, а также среди мальчиков и девочек (экстенсивные);
в) построить статистическую таблицу, содержащую интенсивные показатели;
г) изобразить экстенсивные показатели секторной и внутристолбиковой диаграммами.
Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Отн_вел». На этом листе введите данные условия задачи и решение, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
а) вычисление интенсивных показателей числа больных лиц, случаев всех заболеваний и скарлатины. Они отражают ЧАСТОТУ (встречаемость) явления в среде, ПОРОДИВШЕЙ это явление. Числитель явление, знаменатель среда, основание 1000.
В программе Excel вычисления производятся с помощью формул, которые могут включать абсолютные значения или адреса ячеек, где введены данные условия задачи. Формулы расчета интенсивных показателей:
Pбол.лиц всего= (2900/3500)*1000=828,6%о P бол.мальчики = (1400/1700)*1000=823,5%о P бол.девочки = (1500/1800)*1000=833,3%о |
Pслуч. = (3820/3500)*1000=1091,4%о P случ.мальчики = (1900/1700)*1000=1117,6%о P случ.девочки = (1920/1800)*1000=1066,7%о |
Pслуч.скарл. = (66/3500)*1000=18,9%о
P случ.у мальчиков = (35/1700)*1000=20,6 %о
P случ.у девочек = (31/1800)*1000=17,2 %о
б) вычисление экстенсивных показателей отражающих долю (УДЕЛЬНЫЙ ВЕС, часть явления в этом же явлении) числа мальчиков и девочек, проживающих в изучаемом районе, долю заболеваний скарлатиной в общей заболеваемости детей, а также среди мальчиков и девочек соответственно. Числитель часть явления, знаменатель всё явление, основание 100 (выражается в %).
Формулы расчета интенсивных показателей:
Pдоля мальчиков= (1700/3500)*100=48,6% Pдоля девочек= (1800/3500)*100=51,4% |
Pуд.вес случаев скарлатины = (66/3820)*100=1,7% Pуд.вес скарлатины среди мальчиков (35/1900)*100=1,8% PУд.вес скарлатины среди девочек = (31/1920)*100=1,6% |
в) заполнение статистической таблицы интенсивных относительных величин (таблица 4).
Таблица 4
Распространенность заболеваний среди детей в 2010 году
Пол |
Число болевших на 1000 детей (%о) |
Число случаев заболеваний на 1000 детей (%о) |
Число случаев скарлатины на 1000 детей (%о) |
Мальчики |
823,5 |
1117,6 |
17,2 |
Девочки |
833,3 |
1066,7 |
20,6 |
Итого: |
828,6 |
1091,4 |
18,9 |
г) создание секторной (рис. 4) и внутристолбиковой (рис. 5) диаграмм, наглядно демонстрирующих экстенсивные показатели. В программе Excel изготовление таких рисунков производятся командой «Вставка» с предварительным выделением диапазона ячеек содержащих данные для изображения. Значение изображаемых величин могут быть взяты из ячеек, в которых вычислены доли мальчиков и девочек, проживающих в изучаемом районе.
51,4%
51,4%
48,6%
48,6%
Рис. 4. Доля мальчиков и девочек, проживающих в районе N. |
Рис. 5. Доля мальчиков и девочек, проживающих в районе N. |
Пример расчета и анализа показателей первичной заболеваемости населения и структуры заболеваемости.
Условие задачи: получены данные статистического наблюдения: среднегодовая численность жителей города N в 2010 году составляла 300 тысяч человек. За год зарегистрировано 216 850 случаев заболеваний, в том числе по группам: заболевания органов дыхания 92 000 случаев, болезни органов кровообращения 82 000 случаев, травмы 16 500 случаев, новообразования 16 000 случаев, инфекционные болезни - 9000 случаев, прочие заболевания 1350.
Задание: составьте макет статистической таблицы для расчета для вычисления интенсивных показателей и структуры заболеваемости жителей района N за 2010 год. Отобразите эти показатели соответствующими диаграммами. Сделайте вывод.
Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов», на листе «Отн_вел» этого файла введите условие задачи, в отдельных ячейках листа Excel наберите данные и создайте статистическую таблицу с решением, как показано ниже. Сохраните изменения файла и покажите результат работы преподавателю.
В программе Excel для вычисления относительных величин необходимо занести абсолютные данные из условия задачи в отдельные ячейки таблицы, а затем изготовить макет статистической таблицы и в соответствующих ячейках этого макета поместить расчетные формулы. Правила и результаты вычислений интенсивных и экстенсивных показателей заболеваемости представлен в таблице 5, а их графическое изображение на рис. 6 и рис. 7.
Таблица 5
Показатели заболеваемости населения города N за 2010 год
Заболевания |
Общая заболеваемость (%о) интенсивный показатель |
Структура заболеваемости (%) экстенсивный показатель |
Органов дыхания |
306,7 =92000/300000*1000 |
42,4 =92000/216850*100 |
Органов кровообращения |
273,3 =82000/300000*1000 |
37,8 =82000/216850*100 |
Травмы |
55,0 =16500/300000*1000 |
7,6 =16500/216850*100 |
Новообразования |
53,3 =16000/300000*1000 |
7,4 =16000/216850*100 |
Инфекционные болезни |
30,0 =9000/300000*1000 |
4,2 =900/216850*100 |
Прочие заболевания |
4,5 =1350/300000*1000 |
0,6 =1350/216850*100 |
Итого: |
722,8 =216850/300000*1000 |
100 |
Рис. 6. Уровень заболеваемости по группам болезней жителей города N в 2010 году (интенсивные показатели, %о).
Рис. 7. Структура заболеваемости жителей города N в 2010 году
(экстенсивные показатели, %).
Вывод: заболеваемость в районе N характеризуется повышенным уровнем болезней органов дыхания и сердечно-сосудистой системы по сравнению с другими классами заболеваний, причем их доли в структуре заболеваемости приблизительно равны.
Пример расчета и анализа показателей динамики численности студентов в Волгоградской области.
Условие задачи: получены данные о численности студентов и населения Волгоградской области с 2004 по 2009 годы. В 2004 году число студентов составило 25 000 человек, в 2005 26 300 человек, в 2006 27 000, в 2007 26 800 человек, в 2008 28 300 в 2009 26 100 человек.
Задание: вычислить показатели динамики числа студентов, представить их графическим изображением, проанализировать и сделать вывод.
Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов», на листе «Отн_вел» этого файла введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
В программе Excel для вычисления динамических величин необходимо занести абсолютные данные из условия задачи в отдельные ячейки таблицы, а затем изготовить макет статистической таблицы и в соответствующих ячейках этого макета ввести расчетные формулы. Принцип вычисления динамических показателей представлен в таблице 6, а графическое изображение динамики на основе показателя наглядности демонстрирует рисунок 8.
Таблица 6
Динамика количества студентов в Волгоградской области за 6 лет
Годы |
Абсолютное значение числа студентов (чел.) |
Динамика числа студентов в показателях: |
|||
абсолютного прироста или убыли (чел.) |
наглядности (%) |
роста/ убыли (%) |
прироста/ убыли (%) |
||
2004 |
25 000 |
- |
100,0 |
- |
- |
2005 |
26 300 |
1300 =26300-25000 |
105,2 =26300/25000 *100 |
105,2 =26300/25000*100 |
5,2 =1300/25000*100 |
2006 |
27 000 |
700 =27000-26300 |
108,0 =27000/25000 *100 |
102,7 =27000/26300*100 |
2,7 =700/26300*100 |
2007 |
26 800 |
-200 |
107,2 |
99,3 |
-0,7 |
2008 |
28 300 |
1 500 |
113,2 |
105,6 |
5,6 |
2009 |
26 100 |
-2 200 |
104,4 |
92,2 |
-7,8 |
Рис. 8. Динамика числа студентов в Волгоградской области
с 2004 по 2009 годы (показатель наглядности, %).
Вывод: изменение относительного числа студентов в Волгоградской области за 6 лет (с 2004 по 2009 годы) характеризуется увеличением до 2008 года с последующей тенденцией к снижению до уровня 2005 года.
ЗАДАНИЯ
Запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов», на листе «Отн_вел» этого файла решите требуемый вариант заданий, сохраните изменения и покажите результат работы преподавателю.
Вариант 1
а) в районе города N с населением 40 тысяч человек в 2010 году впервые зарегистрировано 35600 случаев заболеваний, в том числе заболеваний органов дыхания 14500 случаев, болезней органов кровообращения 8000 случаев, травмы 9100 случаев, новообразования 1350 случаев, инфекционные заболевания 1500 случаев прочие заболевания 1150 случаев. Составьте простую статистическую таблицу. Вычислите интенсивные показатели заболеваемости на 1000 жителей. Определите структуру заболеваемости по группам болезней. Представьте графическое изображение интенсивных и экстенсивных показателей заболеваемости населения. Сформулируйте вывод.
б) вычислите динамические показатели на основе данных таблицы 7, отобразите их графически, проанализируйте и сделайте вывод.
Таблица 7
Динамика заболеваемости населения района с 2006 по 2010 год
Годы |
Число впервые зарегистрированных заболеваний |
Динамика заболеваемости населения в показателях: |
|||
абсолютного прироста/убыли (чел.) |
наглядности (%) |
роста (%) |
прироста (%) |
||
2006 |
34500 |
100 |
- |
- |
|
2007 |
34600 |
||||
2008 |
34900 |
||||
2009 |
35000 |
||||
2010 |
35600 |
Вариант 2
а) в городе M с численностью взрослого населения 200 тысяч человек в 2010 году впервые установлена инвалидность 16300 жителям старше 18 лет, в том числе инвалидов 3-й группы 7500 человек, 2-й группы 6200 человек, 1-й группы 2600 человек. Составьте простую статистическую таблицу. Вычислите интенсивные показатели инвалидности на 10 тысяч жителей. Определите возрастную структуру инвалидности. Представьте графическое изображение интенсивных и экстенсивных показателей инвалидности. Сформулируйте вывод.
б) вычислите динамические показатели на основе данных таблицы 8, отобразите их графически, проанализируйте и сделайте вывод.
Таблица 8
Динамика инвалидности взрослого населения города М с 2006 по 2010 год
Годы |
Число инвалидов |
Динамика инвалидности населения в показателях: |
|||
абсолютного прироста/убыли (чел.) |
наглядности (%) |
роста (%) |
прироста (%) |
||
2006 |
15300 |
100 |
- |
- |
|
2007 |
15500 |
||||
2008 |
16000 |
||||
2009 |
16200 |
||||
2010 |
16300 |
Вариант 3
а) в одном из районов города A с населением в 20 тысяч человек в 2010 году зарегистрировано 5650 обращений к варачам-эндокринологам, из них по поводу заболеваний щитовидной железы 1950 обращений, сахарного диабета 1330 обращений, нарушение питания и обмена веществ - 1420, других эндокринных заболеваний - 950 обращений. Составьте простую статистическую таблицу. Вычислите интенсивные показатели на тысячу жителей. Определите структуру болезненности по группам заболеваний. Представьте графическое изображение интенсивных и экстенсивных показателей болезненности. Сформулируйте вывод.
б) вычислите динамические показатели на основе данных таблицы 9, отобразите их графически, проанализируйте и сделайте вывод.
Таблица 9
Динамика обращаемости к врачам эндокринологам района с 2006 по 2010 год
Годы |
Число обращений |
Динамика обращаемости населения в показателях: |
|||
абсолютного прироста/убыли (чел.) |
наглядности (%) |
роста (%) |
прироста (%) |
||
2006 |
3210 |
100 |
- |
- |
|
2007 |
3185 |
||||
2008 |
3180 |
||||
2009 |
4190 |
||||
2010 |
5650 |
Вариант 4
а) в городе М с населением 500850 человек в 2010 году родилось живыми 5 870 детей, из них в возрасте до одного года умерло 103 ребенка, в том числе 8 смертельных исходов зарегистрировано от инфекционных и паразитарных болезней, от болезней органов дыхания умерло 13 детей, от врожденных аномалий и пороков развития - 25 детей, от состояний, возникающих в перинатальном периоде - 45 детей, от несчастных случаев - 5, от прочих заболеваний - 7. Составьте простую статистическую таблицу. Вычислите интенсивные показатели младенческой смертности на тысячу населения. Определите структуру смертности по группам заболеваний. Представьте графическое изображение показателей младенческой смертности. Сформулируйте вывод.
б) вычислите динамические показатели на основе данных таблицы 10, отобразите их графически, проанализируйте и сделайте вывод.
Таблица 10
Динамика заболеваемости новорожденных в городе М с 2006 по 2010 год
Годы |
Число детей первого года жизни, заболевших в течение года |
Динамика заболеваемости новорожденных в показателях: |
|||
абсолютного прироста/убыли (чел.) |
наглядности (%) |
роста (%) |
прироста (%) |
||
2006 |
121 |
100 |
- |
- |
|
2007 |
122 |
||||
2008 |
112 |
||||
2009 |
110 |
||||
2010 |
103 |
Вариант 5
а) в города А с населением 1 100 450 человек в 2010 году впервые зарегистрировано 901 020 случаев заболеваний, в том числе заболеваний органов дыхания 200 300 случаев, болезней органов кровообращения 178 120 случаев, травм - 114 930 случаев, новообразований - 93520 случаев, прочих заболеваний - 120450 случаев. Составьте простую статистическую таблицу. Вычислите интенсивные показатели заболеваемости на 1000 жителей. Определите структуру заболеваемости по группам болезней. Представьте графическое изображение интенсивных и экстенсивных показателей заболеваемости. Сформулируйте вывод.
б) вычислите динамические показатели заболеваемости на основе данных таблицы 11, отобразите их графически, проанализируйте и сделайте вывод.
Таблица 11
Динамика заболеваемости населения города А с 2006 по 2010 год
Годы |
Число впервые зарегистрированных заболеваний |
Динамика заболеваемости населения в показателях: |
|||
абсолютного прироста/ убыли (чел.) |
наглядности (%) |
роста (%) |
прироста (%) |
||
2006 |
890 000 |
100 |
- |
- |
|
2007 |
878 000 |
||||
2008 |
890 000 |
||||
2009 |
892 340 |
||||
2010 |
901 020 |
Вариант 6
а) в городе М с населением 1 500 850 человек в 2010 году родилось живыми 13 450 детей, из них в возрасте до одного года умерло 245 детей, в том числе 20 смертельных исходов зарегистрировано от инфекционных и паразитарных болезней, от болезней органов дыхания умерло 32 ребенка, от врожденных аномалий и пороков развития - 59 детей, от состояний, возникающих в перинатальном периоде - 95 детей, от несчастных случаев - 15, от прочих заболеваний - 24. Составьте простую статистическую таблицу. Вычислите интенсивные показатели младенческой смертности на 1 тысячу населения. Определите структуру младенческой смертности по группам заболеваний. Представьте графическое изображение интенсивных и экстенсивных показателей. Сформулируйте вывод.
б) вычислите динамические показатели на основе данных таблицы 12, отобразите их графически, проанализируйте и сделайте вывод.
Таблица 12
Динамика младенческой смертности в городе М с 2006 по 2010 год
Годы |
Число детей, умерших на первом году жизни |
Динамика младенческой смертности в показателях: |
|||
абсолютного прироста/убыли (чел.) |
наглядности (%) |
роста (%) |
прироста (%) |
||
2006 |
140 |
100 |
- |
- |
|
2007 |
145 |
||||
2008 |
132 |
||||
2009 |
125 |
||||
2010 |
110 |
Контрольные вопросы
Рекомендуемая литература:
Особое место в статистическом анализе принадлежит определению среднего уровня изучаемого признака или явления. Средний уровень признака измеряют средними величинами.
Средняя величина характеризует общий количественный уровень изучаемого признака и является групповым свойством статистической совокупности. Она нивелирует, ослабляет случайные отклонения индивидуальных наблюдений в ту или иную сторону и выдвигает на первый план основное, типичное свойство изучаемого признака.
Средние величины широко используются:
Вычисление средних величин выполняется на основе вариационных рядов. Вариационный ряд это однородная в качественном отношении статистическая совокупность, отдельные единицы которой характеризуют количественные различия изучаемого признака или явления.
Количественная вариация может быть двух типов: прерывная (дискретная) и непрерывная.
Прерывный (дискретный) признак выражается только целым числом и не может иметь никаких промежуточных значений (например, число посещений, численность населения участка, число детей в семье, степень тяжести болезни в баллах и др.).
Непрерывный признак может принимать любые значения в определенных пределах, в том числе и дробные, и выражается лишь приближенно (например, вес для взрослых можно ограничиться килограммами, а для новорожденных граммами; рост, артериальное давление, время, потраченное на прием больного, и т. д.).
Цифровое значение каждого отдельного признака или явления, входящего в вариационный ряд, называется вариантой и обозначается буквой V. В математической литературе встречаются и другие обозначения, например x или y.
Вариационный ряд, где каждая варианта указана один раз, называется простым. Такие ряды используются в большинстве статистических задач в случае компьютерной обработки данных.
При увеличении числа наблюдений, как правило, встречаются повторяющиеся значения вариант. В этом случае создается сгруппированный вариационный ряд, где указывается число повторений (частота, обозначается буквой «р»).
Ранжированный вариационный ряд состоит из вариант, расположенных в порядке возрастания или убывания. Как простой, так и сгруппированный ряды могут быть составлены с ранжированием.
Интервальный вариационный ряд составляют с целью упрощения последующих вычислений, выполняемых без использования компьютера, при очень большом числе единиц наблюдения (более 1000).
Непрерывный вариационный ряд включает значения вариант, которые могут выражаться любыми значениями.
Если в вариационном ряде значения признака (варианты) заданы в виде отдельных конкретных чисел, то такой ряд называют дискретным.
Общими характеристиками значений признака, отражаемого в вариационном ряду, являются средние величины. Среди них наиболее применяемые: средняя арифметическая величина М, мода Мо и медиана Me. Каждая из этих характеристик своеобразна. Они не могут подменить друг друга и лишь в совокупности достаточно полно и в сжатой форме представляют собой особенности вариационного ряда.
Модой (Мо) называют значение наиболее часто встречающейся варианты.
Медиана (Me) это значение варианты, делящей ранжированный вариационный ряд пополам (с каждой стороны медианы находится половина вариант). В редких случаях, когда имеется симметричный вариационный ряд, мода и медиана равны между собой и совпадают со значением средней арифметической.
Наиболее типичной характеристикой значений вариант является средняя арифметическая величина (М). В математической литературе она обозначается .
Средняя арифметическая величина (M, ) это общая количественная характеристика определенного признака изучаемых явлений, составляющих качественно однородную статистическую совокупность. Различают среднюю арифметическую простую и взвешенную. Средняя арифметическая простая вычисляется для простого вариационного ряда путем суммирования всех вариант и делением этой суммы на общее количество вариант, входящих в данный вариационный ряд. Вычисления проводятся по формуле:
,
где: М - средняя арифметическая простая;
ΣV- сумма вариант;
n - число наблюдений.
В сгруппированном вариационном ряду определяют взвешенную среднюю арифметическую. Формула ее вычисления:
,
где: М - средняя арифметическая взвешенная;
ΣVp - сумма произведений вариант на их частоты;
n - число наблюдений.
При большом числе наблюдений в случае ручных вычислений может применяться способ моментов.
Средняя арифметическая имеет следующие свойства:
Средние арифметические величины, взятые сами по себе, без учета вариабельности рядов, из которых они вычислены, могут не в полной мере отражать свойства вариационного ряда, в особенности когда необходимо сопоставление с другими средними. Близкие по значению средние могут быть получены из рядов с различной степенью рассеяния. Чем ближе друг к другу отдельные варианты по своей количественной характеристике, тем меньше рассеяние (колеблемость, вариабельность) ряда, тем типичнее его средняя.
Основными параметрами, которые позволяют оценить вариабельность признака, являются:
Приблизительно о колеблемости признака можно судить по размаху и амплитуде вариационного ряда. Размах указывает на максимальную (Vmax) и минимальную (Vmin) варианты в ряду. Амплитуда (Am) является разностью этих вариант: Am = Vmax - Vmin.
Основной, общепринятой мерой колеблемости вариационного ряда являются дисперсия (D). Но наиболее часто применяется более удобный параметр, вычисляемый на основе дисперсии - среднее квадратическое отклонение (σ). Оно учитывает величину отклонения (d) каждой варианты вариационного ряда от его средней арифметической (d=V - M).
Поскольку отклонения вариант от средней могут быть положительными и отрицательными, то при суммировании они дают значение «0» (d=0). Чтобы избежать этого, величины отклонения (d) возводятся во вторую степень и усредняются. Таким образом, дисперсия вариационного ряда является средним квадратом отклонений вариант от средней арифметической и вычисляется по формуле:
.
Она является важнейшей характеристикой вариабельности и применяется для вычисления многих статистических критериев.
Поскольку дисперсия выражается квадратом отклонений, ее величина не может использоваться в сопоставлении со средней арифметической. Для этих целей применяется среднее квадратическое отклонение, которое обозначается знаком «Сигма» (σ). Оно характеризует среднее отклонение всех вариант вариационного ряда от средней арифметической величины в тех же единицах, что и сама средняя величина, поэтому они могут использоваться совместно.
Среднее квадратическое отклонение определяют по формуле:
Указанная формула применяется при числе наблюдений (n) больше 30. При меньшем числе n значение среднего квадратического отклонения будет иметь погрешность, связанную с математическим смещением (n - 1). В связи с этим, более точный результат может быть получен с помощью учета такого смещения в формуле расчета стандартного отклонения:
.
стандартное отклонение (s) это оценка среднеквадратического отклонения случайной величины Х относительно её математического ожидания на основе несмещённой оценки её дисперсии.
При значениях n > 30 среднее квадратическое отклонение (σ) и стандартное отклонение (s) будут одинаковыми (σ = s). Поэтому в большинстве практических пособий эти критерии рассматриваются как разнозначные. В программе Excel вычисление стандартного отклонения может быть выполнено функцией =СТАНДОТКЛОН(диапазон). А с целью расчета среднего квадратического отклонения требуется создать соответствующую формулу.
Среднее квадратическое или стандартное отклонение позволяет определить, насколько значения признака могут отличаться от среднего значения. Предположим, существуют два города с одинаковой средней дневной температурой в летний период. Один их этих городов расположен на побережье, а другой на континенте. Известно, что в городах, расположенных на побережье, различия дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднее квадратическое отклонение дневных температур у прибрежного города будет меньше, чем у второго города. На практике это означает, что средняя температура воздуха каждого конкретного дня в городе, расположенного на континенте будет сильнее отличаться от среднего значения, чем в городе на побережье. Кроме того стандартное отклонение позволяет оценить возможные отклонения температуры от средней с требуемым уровнем вероятности.
Согласно теории вероятности, в явлениях, подчиняющихся нормальному закону распределения, между значениями средней арифметической, среднего квадратического отклонения и вариантами существует строгая зависимость (правило трех сигм). Например, 68,3% значений варьирующего признака находятся в пределах М ± 1σ , 95,5% в пределах М ± 2σ и 99,7% в пределах М ± 3σ .
Величина среднего квадратического отклонения позволяет судить о характере однородности вариационного ряда и исследуемой группы. Если величина среднего квадратического отклонения небольшая, то это свидетельствует о достаточно высокой однородности изучаемого явления. Среднюю арифметическую в таком случае следует признать вполне характерной для данного вариационного ряда. Однако слишком малая величина сигмы заставляет думать об искусственном подборе наблюдений. При очень большой сигме средняя арифметическая в меньшей степени характеризует вариационный ряд, что говорит о значительной вариабельности изучаемого признака или явления или о неоднородности исследуемой группы. Однако сопоставление величины среднего квадратического отклонения возможно только для признаков одинаковой размерности. Действительно, если сравнивать разнообразие веса новорожденных детей и взрослых, мы всегда получим более высокие значения сигмы у взрослых.
Сравнение вариабельности признаков различной размерности может быть выполнено с помощью коэффициента вариации. Он выражает разнообразие в процентах от средней величины, что позволяет производить сравнение различных признаков. Коэффициент вариации в медицинской литературе обозначается знаком «С», а в математической «v» и вычисляется по формуле:
.
Значения коэффициента вариации менее 10% свидетельствует о малом рассеянии, от 10 до 20% о среднем, более 20% о сильном рассеянии вариант вокруг средней арифметической.
Средняя арифметическая величина, как правило, вычисляется на основе данных выборочной совокупности. При повторных исследованиях под влиянием случайных явлений средняя арифметическая может изменяться. Это обусловлено тем, что исследуется, как правило, только часть возможных единиц наблюдения, то есть выборочная совокупность. Информация обо всех возможных единицах, представляющих изучаемое явление, может быть получена при изучении всей генеральной совокупности, что не всегда возможно. В то же время с целью обобщения данных эксперимента представляет интерес величина средней в генеральной совокупности. Поэтому для формулировки общего вывода об изучаемом явлении, результаты, полученные на основе выборочной совокупности, должны быть, перенесены на генеральную совокупность статистическими методами.
Чтобы определить степень совпадения выборочного исследования и генеральной совокупности, необходимо оценить величину ошибки, которая неизбежно возникает при выборочном наблюдении. Такая ошибка называется «Ошибкой репрезентативности» или «Средней ошибкой средней арифметической». Она фактически является разностью между средними, полученными при выборочном статистическом наблюдении, и аналогичными величинами, которые были бы получены при сплошном исследовании того же объекта, т.е. при изучении генеральной совокупности. Поскольку выборочная средняя является случайной величиной, такой прогноз выполняется с приемлемым для исследователя уровнем вероятности. В медицинских исследованиях он составляет не менее 95%.
Ошибку репрезентативности нельзя смешивать с ошибками регистрации или ошибками внимания (описки, просчеты, опечатки и др.), которые должны быть сведены до минимума адекватной методикой и инструментами, применяемыми при проведении эксперимента.
Величина ошибки репрезентативности зависит как от объема выборки, так и от вариабельности признака. Чем больше число наблюдений, тем ближе выборка к генеральной совокупности и тем меньше ошибка. Чем более изменчив признак, тем больше величина статистической ошибки.
На практике для определения ошибки репрезентативности в вариационных рядах пользуются следующей формулой:
,
где: m ошибка репрезентативности;
σ среднее квадратическое отклонение;
n число наблюдений в выборке.
Из формулы видно, что размер средней ошибки прямо пропорционален среднему квадратическому отклонению, т. е. вариабельности изучаемого признака, и обратно пропорционален корню квадратному из числа наблюдений.
При выполнении статистического анализа на основе вычисления относительных величин построение вариационного ряда не является обязательным. При этом определение средней ошибки для относительных показателей может выполняться по упрощенной формуле:
,
где: Р величина относительного показателя, выраженного в процентах, промилле и т.д.;
q величина, обратная Р и выраженная как (1-Р), (100-Р), (1000-Р) и т. д., в зависимости от основания, на которое рассчитан показатель;
n число наблюдений в выборочной совокупности.
Однако, указанная формула вычисления ошибки репрезентативности для относительных величин может применяться только в том случае, когда значение показателя меньше его основания. В ряде случаев расчета интенсивных показателей такое условие не соблюдается, и показатель может выражаться числом более 100% или 1000%о. В такой ситуации выполняется построение вариационного ряда и вычисление ошибки репрезентативности по формуле для средних величин на основе среднего квадратического отклонения.
Прогнозирование величины средней арифметической в генеральной совокупности выполняется с указанием двух значений минимального и максимального. Эти крайние значения возможных отклонений, в пределах которых может колебаться искомая средняя величина генеральной совокупности, называются «Доверительные границы».
Постулатами теории вероятностей доказано, что при нормальном распределении признака с вероятностью 99,7%, крайние значения отклонений средней будут не больше величины утроенной ошибки репрезентативности (М ± 3m); в 95,5% не больше величины удвоенной средней ошибки средней величины (М ± 2m ); в 68,3% не больше величины одной средней ошибки (М ± 1m) (рис. 9).
P%
Рис. 9. Плотность вероятностей нормального распределения.
Отметим, что приведенное выше утверждение справедливо только для признака, который подчиняется нормальному закону распределения Гаусса.
Большинство экспериментальных исследований, в том числе и в области медицины, связано с измерениями, результаты которых могут принимать практически любые значения в заданном интервале, поэтому, как правило, описываются моделью непрерывных случайных величин. В связи с этим в большинстве статистических методов рассматриваются непрерывные распределения. Одним из таких распределений, имеющим основополагающую роль в математической статистике, является нормальное, или гауссово, распределение.
Это объясняется целым рядом причин.
1. Прежде всего, многие экспериментальные наблюдения можно успешно описать с помощью нормального распределения. Следует сразу же отметить, что не существует распределений эмпирических данных, которые были бы в точности нормальными, поскольку нормально распределенная случайная величина находится в пределах от до , чего никогда не встречается на практике. Однако нормальное распределение очень часто хорошо подходит как приближение.
Проводятся ли измерения веса, роста и других физиологических параметров организма человека - везде на результаты оказывает влияние очень большое число случайных факторов (естественные причины и ошибки измерения). Причем, как правило, действие каждого из этих факторов незначительно. Опыт показывает, что результаты именно в таких случаях будут распределены приближенно нормально.
2. Многие распределения, связанные со случайной выборкой, при увеличении объема последней переходят в нормальное.
3. Нормальное распределение хорошо подходит в качестве приближенного описания других непрерывных распределений (например, асимметричных).
4. Нормальное распределение обладает рядом благоприятных математических свойств, во многом обеспечивших его широкое применение в статистике.
В то же время следует отметить, что в медицинских данных встречается много экспериментальных распределений, описание которых моделью нормального распределения невозможно. Для этого в статистке разработаны методы, которые принято называть «Непараметрическими».
Выбор статистического метода, который подходит для обработки данных конкретного эксперимента, должен производиться в зависимости от принадлежности полученных данных к нормальному закону распределения. Проверка гипотезы на подчинение признака нормальному закону распределения выполняется с помощью гистограммы распределения частот (графика), а также ряда статистических критериев. Среди них:
- Критерий асимметрии ();
- Критерий проверки на эксцесс ();
- Критерий Шапиро Уилкса (W) .
Анализ характера распределения данных (его еще называют проверкой на нормальность распределения) осуществляется по каждому параметру. Чтобы уверенно судить о соответствии распределения параметра нормальному закону, необходимо достаточно большое число единиц наблюдения (не менее 30 значений).
Для нормального распределения критерии асимметрии и эксцесса принимают значение 0. Если распределение смещено вправо > 0 (положительная асимметрия), при < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона =0. При > 0 кривая распределения острее, если < 0 пик более сглаженный, чем функция нормального распределения.
Для проверки на нормальность по критерию Шапиро Уилкса требуется найти значение этого критерия по статистическим таблицам при необходимом уровне значимости и в зависимости от числа единиц наблюдения (степеней свободы). Приложение 1. Гипотеза о нормальности отвергается при малых значениях этого критерия, как правило, при w<0,8.
Пример построения вариационных рядов, вычисления средних величин, создания графика распределения признака и проверки на нормальность распределения.
Условие задачи: Для выявления общей характеристики частоты сердечных сокращений (ЧСС) детей 1-го года жизни в отделении №1 больницы выполнено 16 измерений пульса у детей:
Задание: а) составьте простой не ранжированный вариационный ряд, вычислите среднюю арифметическую величину и определите степень рассеяния вариант в вариационном ряду;
б) выполите упорядочение (ранжирование) ряда по возрастанию и определите медиану;
в) составьте сгруппированный ранжированный вариационный ряд, постройте график распределения признака, определите моду и среднюю взвешенную величину;
г) определите вид распределения признака и статистические критерии нормальности распределения;
д) вычислите ошибку репрезентативности и доверительные границы колебания средней арифметической в генеральной совокупности.
Решение: запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Сред_вел». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
а) Построение простого вариационного ряда частоты пульса детей, поступивших в отделение №1 больницы. Простой вариационный ряд представляет собой таблицу, в которой подлежащим является изучаемый признак, обозначаемый знаком V (варианта). Все полученные в эксперименте данные вносят в таблицу в порядке их записи в журнал регистрации (условия задачи). Если значения вариант повторяются, то каждое из них заносится в отдельную ячейку таблицы. Затем вычисляют сумму вариант, среднюю арифметическую, отклонения (d) каждой варианты от средней величины и квадрат отклонения (d2) соответствующими формулами (таблица 13).
Таблица 13
Простой не ранжированный вариационный ряд
|
V |
d=V-M |
d2 |
1 Иванов Василий |
120 |
-1,88 |
3,52 |
2 Сидоров Костя |
130 |
8,13 |
66,02 |
3 … |
115 |
-6,88 |
47,27 |
4 … |
120 |
-1,88 |
3,52 |
5 … |
120 |
-1,88 |
3,52 |
6 … |
125 |
3,13 |
9,77 |
7 … |
110 |
-11,88 |
141,02 |
8 … |
125 |
3,13 |
9,77 |
9 … |
115 |
-6,88 |
47,27 |
10 … |
120 |
-1,88 |
3,52 |
11 … |
125 |
3,13 |
9,77 |
12 … |
135 |
13,13 |
172,27 |
13 … |
115 |
-6,88 |
47,27 |
14 … |
130 |
8,13 |
66,02 |
15 … |
125 |
3,13 |
9,77 |
16 … |
120 |
-1,88 |
3,52 |
Сумма ( |
1950 |
0,00 |
643,75 |
n=16 |
Вычисление средней арифметической (M) в простом вариационном ряду выполняется по формуле:
= 1950/16 = 121,9 уд/мин.
В программе Excel для вычисления средней арифметической может применяться функция =СРЗНАЧ(Диапазон ячеек). Использование этой функции даст такой же результат.
Определение степени рассеяния вариант в вариационном ряду с помощью среднего квадратического отклонения (σ - Сигма) и коэффициента вариации (С). Среднее квадратическое отклонения вычисляется по формуле:
= КОРЕНЬ(643,75 / 16) = ±6,343.
Для упрощения расчета среднего квадратического отклонения при n > 30 в программе Excel может использоваться функция =СТАНДОТКЛОН(Диапазон). Если выполнить вычисления этой функцией в нашем вариационном ряду, то будет получено значение стандартного отклонения = 6,55. Это значение отличается от величины среднего квадратического отклонения, что обусловлено малым числом наблюдений (n = 16).
Коэффициент вариации (С) вычисляется формулой:
= 6,343/121,9 * 100 = 5,2%, что является малым рассеянием (<10%).
Вариабельность признака (рассеяние) оценивается как малая при С<10%, средняя при 10%< С < 20%, высокая при С >20%
Вывод: средняя частота пульса пациентов изучаемой группы составляет 121,9 ударов в минуту, вариабельность пульса малая.
б) Преобразование не ранжированного вариационного ряда в ранжированный (таблица 14) производится в имеющей таблице простого ряда с помощью команды сортировки по столбцу V. С этой целью необходимо предварительно выделить диапазон ячеек таблицы, включающий данные из сортируемого столбца, а затем на вкладке «Главная» нажать кнопку «Сортировка и фильтр». При выполнении сортировки требуется автоматически расширить диапазон сортируемых ячеек.
Таблица 14
Ранжированный вариационный ряд
|
V |
d=V-M |
d2 |
1 |
110 |
-11,88 |
141,02 |
2 |
115 |
-6,88 |
47,27 |
3 |
115 |
-6,88 |
47,27 |
4 |
115 |
-6,88 |
47,27 |
5 Иванов Василий |
120 |
-1,88 |
3,52 |
6 |
120 |
-1,88 |
3,52 |
7 |
120 |
-1,88 |
3,52 |
8 |
120 |
-1,88 |
3,52 |
9 |
120 |
-1,88 |
3,52 |
10 |
125 |
3,13 |
9,77 |
11 |
125 |
3,13 |
9,77 |
12 |
125 |
3,13 |
9,77 |
13 |
125 |
3,13 |
9,77 |
14 Сидоров Костя |
130 |
8,13 |
66,02 |
15 |
130 |
8,13 |
66,02 |
16 |
135 |
13,13 |
172,27 |
Сумма (= =СУММ(Диапазон ячеек) |
1950 |
0 |
643,75 |
Средняя арифметическая = =СРЗНАЧ(Диапазон ячеек) |
121,875 |
|
|
Для определения медианы (Ме) в ранжированном вариационном ряду находят значение варианты, расположенной в центре ряда.
Ме = варианта, занимающая срединное положение (если ряд состоит из четного числа вариант, медианой является полусумма двух центральных вариант) = 120уд/мин.
В программе Excel для определения медианы применяться функция =МЕДИАНА(Диапазон ячеек).
в) Построение сгруппированного ранжированного ряда выполняется в отдельной таблице (таблица 15), которая должна включать столбец частоты повторений вариант (p). Данные из сгруппированного вариационного ряда используются для построения точечной диаграммы распределения частот. Он демонстрирует частоту встречаемости вариант (p), указываемую по вертикальной оси точечной диаграммы (рис. 10).
Таблица 15
Сгруппированный ранжированный
вариационный ряд
|
V |
p |
|||||
1 |
110 |
1 |
|||||
2 |
115 |
3 |
|||||
3 |
120 |
5 |
|||||
4 |
125 |
4 |
|||||
5 |
130 |
2 |
|||||
6 |
135 |
1 |
|||||
|
735 |
16 |
|||||
Рис. 10. График распределения признака. |
Определение моды может выполняться в сгруппированном вариационном ряду выбором значения варианты, которая повторяется наибольшее число раз.
Мо= наиболее часто повторяющаяся варианта = 120 уд/мин (встречается 5 раз).
В программе Excel для определения моды может применяться функция =МОДА(Диапазон данных), которая используется только в простом вариационном ряду.
В сгруппированном вариационном ряду средняя арифметическая вычисляется по модифицированной формуле и называется «Средняя взвешенная»:
Независимо от способа построения вариационного ряда и метода вычисления средней арифметической, для одинаковых данных значения их средней величины должны совпадать.
г) Оценка нормальности распределения выполняется с помощью графика распределения (рис. 10) по форме линии, которая должна приближаться к виду кривой Гаусса (функции нормального распределения). Статистические критерии нормальности распределения вычисляются с помощью функций или в модуле «Описательная статистика», который может быть вызван командой «Данные» - «Анализ данных» - «Описательная статистика».
Если указанная команда отсутствует разделе «Данные», необходимо выполнить установку надстройки программы Excel «Пакет анализа». Для этого требуется открыть меню настройки программы кнопкой «Office», выбрать «Параметры Excel» -> «Надстройки» -> «Перейти» -> «Пакет анализа» и «Пакет анализа - VBA» -> «ОК». Модуль анализа данных в программе Excel, как правило, не подключается при типовой установке пакета программ Microsoft Office. Поэтому для применения методов статистической обработки данных необходимо однократно выполнить указанную настройку программы.
Модуль «Описательная статистика» производит вычисления только в простых вариационных рядах. В связи с этим необходимо использовать диапазон ячеек таблицы, в котором составлен простой вариационный ряд созданный в пункте б) настоящей задачи. Результат вычислений, выполненный модулем «Описательная статистика», показан в таблице 16.
Таблица 16
Простой не ранжированный вариационный ряд |
||||||
|
V |
d=V-M |
d2 |
Результат выполнения команды «Анализ данных» -> «Описательная статистика». |
||
1 Иванов Василий |
120 |
-1,88 |
3,52 |
|||
2 Сидоров Костя |
130 |
8,13 |
66,02 |
Столбец1 |
||
3 … |
115 |
-6,88 |
47,27 |
Среднее |
121,875 |
|
4 … |
120 |
-1,88 |
3,52 |
Стандартная ошибка |
1,63777 |
|
5 … |
120 |
-1,88 |
3,52 |
Медиана |
120 |
|
6 … |
125 |
3,13 |
9,77 |
Мода |
120 |
|
7 … |
110 |
-11,88 |
141,02 |
Стандартное отклонение |
6,551081 |
|
8 … |
125 |
3,13 |
9,77 |
Дисперсия выборки |
42,91667 |
|
9 … |
115 |
-6,88 |
47,27 |
Эксцесс |
-0,16979 |
|
10 … |
120 |
-1,88 |
3,52 |
Асимметричность |
0,209598 |
|
11 … |
125 |
3,13 |
9,77 |
Интервал |
25 |
|
12 … |
135 |
13,13 |
172,27 |
Минимум |
110 |
|
13 … |
115 |
-6,88 |
47,27 |
Максимум |
135 |
|
14 … |
130 |
8,13 |
66,02 |
Сумма |
1950 |
|
15 … |
125 |
3,13 |
9,77 |
Счет |
16 |
|
16 … |
120 |
-1,88 |
3,52 |
Наибольший(1) |
135 |
|
|
1950 |
0,00 |
643,75 |
Наименьший(1) |
110 |
|
n=16 |
Уровень надежности(95,0%) |
3,490827 |
Эксцесс = -0,17. Для нормального распределения эксцесс = 0. Распределение близко к нормальному.
Асимметричность = 0,2. Для нормального распределения асимметричность = 0. Распределение близко к симметричному.
Применяя стандартные функции =ЭКСЦЕСС(Диапазон) и =СКОС(Диапазон) мы получим эти же значения.
д) Определение ошибки средней арифметической (m, ошибка репрезентативности или стандартная ошибка) выполняется по формуле:
= 6,343 / КОРЕНЬ(16-1) = 1,64
Программа Excel позволяет вычислять этот критерий с помощью модуля «Описательная статистика». При этом ошибка средней арифметической (m) называется «Стандартная ошибка», так как в качестве среднего квадратического отклонения используется «Стандартное отклонение» (таблица 16). Поэтому в вариационных рядах с числом единиц наблюдения менее 30 возможно несущественное отличие значений полученных расчетной формулой и модулем описательной статистики.
Таким образом, с вероятностью P>95% доверительные границы колебания средней арифметической в генеральной совокупности М ± 2m = 121,9 ± 2*1,64 =
121,9 ± 3,28уд/мин.
Для вычисления доверительных границ в программе Excel может применяться статистическая функция =ДОВЕРИТ(0,05; Значение стандартного отклонения; Число единиц наблюдения). При ее использовании с вычисленными ранее значениями задачи получим:
=ДОВЕРИТ(0,05; 6,55; 16) = 3,21.
Вывод: Средняя частота пульса пациентов 1-го отделения с вероятностью 95,5% составляет от 118,6 до 125,2 ударов в минуту.
Пример сравнения рассеяния вариационных рядов.
Условие задачи: Для выявления общей характеристики частоты сердечных сокращений (ЧСС) детей 1-го года жизни в отделении №2 больницы выполнено 17 измерений пульса у детей: 1. Казаков Саша 130 уд.в мин; 2. Литвинов Сережа 135 уд.в мин.; 3… 125; 4… 115; 5 … 125; 6 … 125; 7 … 120; 8 … 125;
9 … 130; 10 … 120; 11 … 140; 12 … 145; 13 … 115; 14 … 130; 15 … 125; 16 … 120; 17 … 125.
Задание: а) создать простой, ранжированный вариационный ряды, определить средние величины и доверительные границы средней арифметической;
б) составить сгруппированный, ранжированный вариационный ряд и построить график распределения признака, выполнить проверку его на нормальность;
в) определить параметры вариабельности признака: амплитуду, размах, среднее квадратическое отклонение, коэффициент вариации и ошибку репрезентативности;
г) сравнить характеристики рассеяния вариационных рядов, используемых в примерах данного раздела.
Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». На листе «Сред_вел» этого файла введите данные в соответствии с таблицей 19, выполните вычисления с помощью формул и модуля «Описательная статистика». Покажите результат работы преподавателю.
а) Построение простого ранжированного вариационного ряда (таблица 17) и вычисление их основных характеристик модулем «Описательная статистика».
Таблица 17
Простой ранжированный вариационный ряд и его характеристики
V |
d=V-M |
d2 |
Результат выполнения команды «Анализ данных» -> «Описательная статистика». |
|||
1 |
115 |
11,18 |
124,91 |
|||
2 |
115 |
11,18 |
124,91 |
Столбец1 |
|
|
3 |
115 |
11,18 |
124,91 |
|||
4 |
120 |
6,18 |
38,15 |
Среднее |
126,1764706 |
|
5 |
120 |
6,18 |
38,15 |
Стандартная ошибка |
2,035051839 |
|
6 |
125 |
1,18 |
1,38 |
Медиана |
125 |
|
7 |
125 |
1,18 |
1,38 |
Мода |
125 |
|
8 |
125 |
1,18 |
1,38 |
Стандартное отклонение |
8,390733685 |
|
9 |
125 |
1,18 |
1,38 |
Дисперсия выборки |
70,40441176 |
|
10 |
125 |
1,18 |
1,38 |
Эксцесс |
0,3573165 |
|
11 |
125 |
1,18 |
1,38 |
Асимметричность |
0,659063476 |
|
12 Казаков |
130 |
-3,82 |
14,62 |
Интервал |
30 |
|
13 |
130 |
-3,82 |
14,62 |
Минимум |
115 |
|
14 |
130 |
-3,82 |
14,62 |
Максимум |
145 |
|
15 Литвинов |
135 |
-8,82 |
77,85 |
Сумма |
2145 |
|
16 |
140 |
-13,82 |
191,09 |
Счет |
17 |
|
17 |
145 |
-18,82 |
354,33 |
Наибольший(1) |
145 |
|
|
2145 |
0,00 |
1126,47 |
Наименьший(1) |
115 |
|
n=17 |
Уровень надежности(95,0%) |
4,314116203 |
||||
M2= |
126,2 |
|||||
m2= |
2,04 |
Сигма (σ)= 8,390734 |
C=8,39/126,2*100=6,6% |
Вывод: Средняя частота пульса пациентов 2-го отделения с вероятностью 95,5% составляет 126,2±2,04 ударов в минуту, вариабельность малая.
б) Создание сгруппированного вариационного ряда (таблица 18) и построение графика распределения (рис. 11).
Таблица 18
Сгруппированный, ранжированный вариационный ряд |
|||||||
V |
p |
||||||
1 |
115 |
3 |
|||||
2 |
120 |
2 |
|||||
3 |
125 |
6 |
|||||
4 |
130 |
3 |
|||||
5 |
135 |
1 |
|||||
6 |
140 |
1 |
|||||
7 |
145 |
1 |
|||||
p |
17 |
n=17 |
|||||
Рис. 11. График распределения признака. |
Ме= варианта, занимающая срединное положение =МЕДИАНА(Диапазон ) = 125 уд/мин.
Мо= наиболее часто повторяющаяся варианта
=МОДА(Диапазон) = 125 уд/мин.
в) Параметры вариабельности определяются по результатам обработки данных модулем «Описательная статистика» (таблица 17). Амплитуда (интервал) = 30 уд/мин, размах от 115 до 145 уд/мин, среднее квадратическое отклонение = 8,4 уд/мин, коэффициент вариации = 6,6%, ошибка репрезентативности = ±2,04 уд/мин.
г) Сравнение рассеяния вариационных рядов, используемых в примерах данного раздела выполняется на основе коэффициента вариации первого (С1=5,4%) и второго вариационных рядов (С2=6,6%).
Вывод: вариабельность пульса пациентов 1-го отделения ниже, чем пациентов 2-го отделения больницы и в обоих случаях малая (<10%).
ЗАДАНИЯ
Запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов», создайте НОВЫЙ лист, переименуйте его, обозначив названием «Сред-е_вел», решите требуемый вариант задания, сохраните, покажите файл преподавателю.
Вариант 1
а) В районе N, где расположена тепловая электростанция, в одной из точек жилого поселка было взято 100 проб атмосферного воздуха. Количество пыли в пробах воздуха измерялось следующими цифрами: 0,09 мг/м3 в 2-х пробах, 0,08 мг/м3 2 раза, 0,15 мг/м3 16 раз, 0,12 мг/м3 14 раз, 0,14 мг/м3 30 раз, 0,16 мг/м3 4 раза, 0,13 мг/м3 16 раз, 0,11 мг/м3 9 раз, 0,10 мг/м3 5 раз, 0,17 мг/м3 2 раза. Составьте простой, ранжированный вариационный ряд и определите среднесуточную концентрацию пыли, ее вариабельность, доверительные границы колебаний средней величины. Составьте сгруппированный, ранжированный вариационный ряд и выполните построение графика распределения признака.
б) Сравните характер разнообразия массы тела у новорожденных, детей первого года жизни и семилетних, если известны следующие параметры:
Возраст |
Средняя масса (М), кг |
σ, кг |
Новорожденные |
3,4 |
±0,5 |
1 год |
10,5 |
± 0,8 |
7 лет |
22,9 |
±2,7 |
Вариант 2
а) В питьевой воде, которой снабжаются дома жителей района N, определяли концентрацию соединений фтора. В 2-х пробах было обнаружено 0,5 мг/л этих соединений, в 4-х 0,6 мг/л, в 8-и 0,9 мг/л, в 9-и 0,4 мг/л, в 16-и 0,8 мг/л, в 15-ти 0,9 мг/л, в 20-и 1,2 мг/л, в 24-х 1,1 мг/л, в 42-х 1,3 мг/л, в 50-и 1,0 мг/л, в 24-х 1,5 мг/л, в 23-х 1,6 мг/л, в 10-ти 0,7 мг/л, в 8-и 1,4 мг/л, в 4-х 0,3 мг/л. Составьте простой, ранжированный вариационный ряд, Определите среднюю концентрацию соединений фтора в питьевой воде и доверительные границы колебаний средней величины. Составьте сгруппированный, ранжированный вариационный ряд и выполните построение графика распределения признака.
б) Сравните характер разнообразия лабораторных анализов с различной размерностью:
Наименование теста |
Средний показатель |
σ |
Общий белок крови, мг% |
6,8 |
±0,4 |
СОЭ, мм/ч |
9 |
± 2 |
Лейкоциты |
8000 |
±800 |
Вариант 3
а) При стоматологическом обследовании группы школьников 4-х классов сельского района были получены следующие результаты: 2 школьника имели по 5 кариозных зубов, 28 школьников по 1 кариозному зубу, 8 школьников по 4 кариозных зубов, 1 школьник 8 кариозных зубов, 20 школьников по 3 кариозных зуба, 16 школьников по 2 кариозных зуба и 6 школьников не имели пораженных кариесом зубов. Составьте простой, ранжированный вариационный ряд, определите среднее число зубов пораженных кариесом у школьников района, степень вариабельности этого признака и доверительные границы колебаний средней величины. Составьте сгруппированный, ранжированный вариационный ряд и выполните построение графика распределения признака.
б) Сравните характер разнообразия антропометрических данных у мальчиков 7-и летнего возраста:
Показатель |
М |
σ |
Рост, см |
123,4 |
±4,9 |
Масса тела, кг |
24,2 |
± 3,1 |
Окружность грудной клетки, см |
60,1 |
±2,5 |
Вариант 4
а) Перед сдачей экзамена у студентов определялась частота пульса. Были получены следующие данные: у 2 студентов 76 ударов в минуту, у 3 студентов 80 ударов в минуту, у 4 студентов 108 ударов в минуту, у 2 студентов 116 ударов в минуту, у 20 студентов 88 ударов в минуту, у 6 студентов 98 ударов в минуту, у 17 студентов 86 ударов в минуту, у 11 студентов 92 удара в минуту. Составьте простой, ранжированный вариационный ряд и определите среднюю частоту пульса у студентов перед экзаменом, степень вариабельности признака и доверительные границы колебаний средней величины. Составьте сгруппированный, ранжированный вариационный ряд и выполните построение графика распределения признака.
б) Сравните характер разнообразия антропометрических данных у девушек 17-и летнего возраста:
Показатель |
М |
σ |
Рост, см |
161,2 |
±5,1 |
Масса тела, кг |
55,8 |
±7,2 |
Жизненная емкость легких, см3 |
3400 |
±250 |
Вариант 5
а) Исследовалась длительность лечения больных пневмонией в стационаре центральной районной больницы N-ского района. Были получены следующие результаты: 10 дней лечилось 2 больных, 9 дней 1 больной, 11 дней 1 больной, 12 дней 1 больной, 8 дней 3 больных, 13 дней 1 больной, 21 день 3 больных, 7 дней 1 больной, 22 дня 3 больных, 14 дней 2 больных, 20 дней 5 больных, 15 дней 2 больных, 16 дней 3 больных, 17 дней 4 больных, 19 дней 8 больных, 18 дней 7 больных. Составьте простой, ранжированный вариационный ряд и определите среднюю длительность лечения пневмонии, степень вариабельности признака и доверительные границы колебаний средней величины. Составьте сгруппированный, ранжированный вариационный ряд и выполните построение графика распределения признака.
б) Сравните характер разнообразия антропометрических данных у 12-летних мальчиков:
Показатель |
М, см |
σ |
Рост |
142,0 |
±8,5 |
Окружность грудной клетки |
66,0 |
±4,0 |
Окружность головы |
50,0 |
±2,0 |
Вариант 6
а) Исследовалась длина тела новорожденных девочек по данным родильного дома. Были получены следующие данные: у 8 девочек рост составил 48 см, у 6 девочек 51 см, у 7 девочек 53 см, у 1 девочки 49 см, у 9 девочек 52 см, у 8 девочек 50 см, у 1 девочки 47 см, у 3 девочек 46 см, у 2 девочек 54 см, у 1 девочки 55 см, у 1 девочки 56 см. Составьте простой, ранжированный вариационный ряд, определите среднюю длину тела новорожденных девочек, степень вариабельности признака и доверительные границы колебаний средней величины. Составьте сгруппированный, ранжированный вариационный ряд и выполните построение графика распределения признака.
б) Сравните характер разнообразия антропометрических данных у 12-летних девочек:
Показатель |
М |
σ |
Рост, см |
140 |
±9,5 |
Масса тела, кг |
40 |
± 6 |
Жизненная емкость легких, см3 |
2300 |
±360 |
Контрольные вопросы
Рекомендуемая литература:
В научно-исследовательской практике часто требуется сопоставить средние арифметические, например, при сравнении результатов в контрольной и экспериментальной группах, при оценке показателей здоровья населения в различных местностях за несколько лет и т. д.
Методологической основой любого исследования является формулировка рабочей гипотезы. При этом основной целью исследования является получение данных, на основании которых выдвинутую еще до начала исследования (априори) гипотезу можно было бы принять, т.е признать истинной, либо отвергнуть - признать ложной.
Выдвинутую гипотезу называют основной или нулевой (H0). Гипотезу, которая противоречит нулевой и является ее логическим отрицанием, называют конкурирующей или альтернативной (H1).
Гипотезы H0 и Н1 предоставляют выбор только одного из двух вариантов. Например, если нулевая гипотеза предполагает, что среднее арифметическое М = 15, то логическим отрицанием будет М ≠ 15. Коротко это записывается так: H0: М=15; Н1: М≠15. В медико-биологических исследованиях при сравнении регистрируемых признаков в качестве нулевой гипотезы принимают гипотезу об отсутствии различий.
Например, при оценке токсичности какого-либо вещества обычно берутся две группы лабораторных животных. Подбираются животные одинакового возраста, пола, одинакового содержания и т. п. Таким образом, делается все, чтобы эти группы животных представляли собой единую, как можно более однородную статистическую совокупность, с тем, чтобы максимально снизить исходную вариабельность анализируемых данных. Оптимальным с этой точки зрения считается ситуация, когда отличия сравниваемых групп заключаются только в том, что одна из групп (опытная) подвергается воздействию токсического вещества, а другая (контрольная) - нет. В любом случае, произошли ли после воздействия токсического вещества изменения в опытной группе или нет, различия средних показателей в обеих группах обязательно будут. Вопрос состоит в следующем: являются ли эти различия только следствием выборочного исследования, или разница возникла из-за того, что произошли существенные сдвиги физиологических функций животных опытной группы, которые будут обнаруживаться всегда, т.е. в генеральной совокупности. Значит, проверяется вопрос: принадлежат ли животные опытной и контрольной групп к той же самой генеральной совокупности или опытная группа принадлежит к другой генеральной совокупности (совокупности с измененными физиологическими параметрами)?
Методы оценки достоверности различий средних величин позволяют установить, насколько выявленные различия существенны (носят ли они закономерный характер или являются результатом действия случайных причин). Эту оценку можно выполнить только с определенной степенью вероятности, когда после установленного уровня вероятности допущение о наличии различий могут считаться закономерными или, наоборот, отвергаются.
Выдвинутая гипотеза может оказаться правильной или неправильной. При ее статистической проверке может быть отвергнута правильная гипотеза. Вероятность совершить такую ошибку называют уровнем значимости. Этот параметр принято обозначать через α или p. В биологии и медицине уровень значимости, как правило, принимают не выше 0,05. Это означает, что в 5 случаях из 100 (в 5%) мы рискуем отвергнуть правильную гипотезу. Соответственно, вероятность принятия такой гипотезы (P) равняется (P = 1 p) 0,95 (или 95%.)
Таким образом, статистическая значимость выборочных характеристик представляет собой меру уверенности в их «истинности». Уровень значимости находится в убывающей зависимости от надежности результата. Более высокая статистическая значимость соответствует более низкому уровню доверия к найденной в выборке средней величине. Именно уровень значимости представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю генеральную совокупность.
Выбор порога уровня значимости, выше которого результаты отвергаются как статистически не подтвержденные, во многом произвольный. Как правило, окончательное решение обычно зависит от традиций и накопленного практического опыта в данной области исследований. Верхняя граница p<0,05 статистической значимости содержит довольно большую вероятность ошибки (5%). Поэтому в тех случаях, когда требуется особая уверенность в достоверности полученных результатов, принимается значимость p<0,01 или даже p<0,001.
В практике медико-биологических исследований наиболее часто используются следующие значения показателей значимости: 0,1; 0,05; 0,01; 0,001. Традиционная интерпретация уровней значимости, принятая в этих исследованиях, представлена в таблице 19.
Таблица 19
Интерпретация уровня значимости (p).
Величина уровня значимости (p) |
Интерпретация |
≥0,1 |
Данные согласуются с нулевой гипотезой (H0), различия не подтверждены |
≥0,05 |
Есть сомнения в истинности как нулевой (H0), так и альтернативной гипотез (H1) |
<0,05 |
Нулевая гипотеза (H0) может быть отвергнута. |
≤0,01 |
Нулевая гипотеза (H0) может быть отвергнута. Сильный аргумент |
≤0,001 |
Нулевая гипотеза (H0) наверняка не подтверждается. Очень сильный аргумент |
Приблизительно о наличии достоверных различий между средними величинами можно судить по их доверительным границам. Если они имеют пересечение верхней границы одного из интервалов и нижней границы 2-го, можно предположить, что полученная разница средних является случайной и может не повториться в следующих экспериментах с вероятностью, которая использовалась при вычислении этих границ (как правило, 95%).
Если изучаемый признак подчиняется закону нормального распределения Гауса, может использоваться расчет критерия достоверности Стьюдента (t) (коэффициента достоверности). Величина этого коэффициента определяется модулем отношения разности сравниваемых средних величин к ошибке их разности. Ошибка разности равна корню квадратному из суммы квадратов средних ошибок сравниваемых величин: .
Таким образом, коэффициент достоверности (t) определяется по формуле:
,
где: M1 средняя арифметическая 1-го вариационного ряда,
M2 средняя арифметическая 2-го вариационного ряда,
m1 ошибка репрезентативности 1-го вариационного ряда,
m2 ошибка репрезентативности 2-го вариационного ряда.
Для сравнения относительных величин (показателей) применяется модифицированная формула:
где: P1 относительная величина (показатель) 1-й группы;
P2 относительная величина (показатель) 2-й группы;
m1 ошибка репрезентативности 1-го показателя;
m2 ошибка репрезентативности 2-го показателя.
При этом ошибка репрезентативности относительной величины может быть вычислена по формуле:
,
где: Р величина относительного показателя;
q величина, обратная Р и вычисленная как (1-Р), (100-Р), (100-Р) и т. д., в зависимости от основания, на которое рассчитан показатель;
n число наблюдений.
В медико-биологических исследованиях, где число наблюдений больше 30, допускается использовать сравнение вычисленного значения t с критическим значением 2. Если t-критерий больше 2, тогда выявленные различия считаются закономерными (не случайными, достоверными), т.е. они статистически подтверждены с вероятностью более 95%. Если значение критерия меньше 2, то разница не доказана и носит случайный характер, статистически не подтверждается (вероятность менее 95%). При меньшем числе наблюдений значение критического уровня для сравнения с расчетным значением t-критерия необходимо искать в книгах с таблицами Стьюдента или вычислять в статистической компьютерной программе.
Пример определения достоверности различий между средними величинами по критерию Стьюдента.
Условие задачи: сравнение средней частоты сердечных сокращений (ЧСС) детей 1го года жизни в отделениях №1, №2 (см. раздел III).
Задание: а) оценить достоверность различий между средним пульсом пациентов 1го и 2-го отделений с помощью доверительных границ;
б) вычислить критерий Стьюдента для сравнения ЧСС детей в этих отделениях, сделать вывод о достоверности различий средних величин.
Решение: Запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Крит_Стьюдента». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
а) доверительные границы колебаний средних в каждом отделении при уровне значимости p<0,05, т.е. с вероятностью прогноза более 95%, составляет M±2m, где M средняя арифметическая, m ошибка репрезентативности.
По условию задачи в 1-м отделении M1=121,9, m1=1,64. Т.е. 121,9 ± 2*1,64 = 121,9 ± 3,28 уд/мин. В ячейке таблицы Excel вводятся формулы =121,9+3,28 и =121,9-3,28. Получаем доверительные границы колебаний средней частоты пульса в 1-м отделении от 118,62 до 125,18 уд/мин.
Аналогично определяем доверительные границы средней ЧСС во 2-м отделении. По условию задачи M2=126,2, m2=2,04. Т.е. 126,29 ± 2 * 2,04 = 126,2 ± 4,08 уд/мин. Формулы вычисления =126,29+4,08 и =126,29-4,08. Получаем доверительные границы колебаний средней частоты пульса в 2-м отделении от 122,21 до 130,37 уд/мин.
Величина доверительных границ частоты пульса в 2-х отделениях больницы позволяют утверждать, что при повторных экспериментах в 95% случаях будут получены средние величины, укладывающиеся в пределах вычисленных значений границ в 1-м отделении от 118,62 до 125,18 уд/мин, во 2-ом - от 122,21 до 130,37 уд/мин. Поскольку доверительные границы этих отделений имеют пересечение верхней границы 1-го и нижней границы 2-го отделений, можно предположить, что полученная разница средних является случайной и может не повториться в следующих экспериментах.
б) оценка достоверности различий средней частоты пульса детей, поступающих в 1е и 2-е отделение больницы по критерию Стьюдента.
Формула вычисления критерия Стьюдента: ,
где: M1 средняя арифметическая 1-го вариационного ряда - 121,8,
M2 средняя арифметическая 2-го вариационного ряда - 126,2,
m1 ошибка репрезентативности 1-го вариационного ряда - 1,64,
m2 ошибка репрезентативности 2-го вариационного ряда - 2,04.
В программе Excel эта формула принимает вид:
=(121,8 126,2)/КОРЕНЬ(1,64^2+2,04^2) = -1,64667.
Модуль числа может быть получен с помощью функции =ABS(Число) = ABS(-1,64667) = 1,64667. Округление числа выполняется функцией =ОКРУГЛ(Число; Разрядность) = ОКРУГЛ(1,64667;2) = 1,65.
Вычисленное значение t-критерия (-1,65) оценивается по модулю числа (1,65) в сравнении с критическим значением, которое при числе наблюдений n>30 составляет 2. При числе наблюдений n<30 критическое значение находят по таблицам Стьюдента при степенях свободы df = n1 + n2 2 = 16 + 17 2 = 31. В программе Excel критическое значение критерия Стьюдента вычисляется функцией = СТЬЮДРАСПОБР(Уровень значимости p; Степени свободы df) =
= СТЬЮДРАСПОБР(0,05;(16+17-2)) = 2,04.
Если t>2,04 статистическая гипотеза о равенстве средних с уровнем значимости p<0,05 опровергается, следовательно, истинной будет являться гипотеза об их различии. Если t<2,04 гипотеза равенства средних подтверждается.
В нашем примере получаем: t = 1,65 < 2,04.
Если в сравниваемых вариационных рядах равное число наблюдений (n1=n2), программа Excel позволяет выполнить вычисления при помощи функции =ТТЕСТ(Диапазон1;Диапазон2;H;Тип), где:
Диапазон1 первый вариационный ряд (множество данных);
Диапазон2 второй вариационный ряд (множество данных);
H число хвостов распределения (1 или 2), как правило, используется число 2. Если Н = 1, то функция ТТЕСТ использует одностороннее распределение, при Н = 2 используется двустороннее распределение.
Тип цифра модификации теста 1, 2 или 3. Как правило используется цифра 3. Если указана цифра 1 это парный тест для связанных выборок, 2 двухвыборочный с равными дисперсиями, 3 двухвыборочный с неравными дисперсиями.
В большинстве задач статистической обработки медицинских данных эта функция применяется с параметрами =ТТЕСТ(Диапазон1;Диапазон2;2;3), что считается более грубой оценкой, но вполне достаточной для опровержения нулевой гипотезы.
Функция ТТЕСТ возвращает уровень значимости основной гипотезы при сравнении 2-х числовых массивов, вычисленный по критерию Стьюдента. Он выражает вероятность того, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее.
В нашем случае можно выполнить вычисление этой функцией на основе данных 16-и человек в каждой группе. Получаем опытный уровень значимости 0,12. Это означает, что выдвинутая гипотеза о равенстве средних в генеральной совокупности подтверждается с вероятностью 12%. Поскольку значение опытного уровня значимости больше принятого критического уровня (p=0,05 или 5%), то альтернативная гипотеза о различии средних величин не может быть принята, и значит, различия не подтверждены. В такой ситуации можно провести дополнительное исследование с теми же условиями опыта, но с увеличенным числом единиц наблюдения, что на более качественном уровне подтвердит или опровергнет рабочую гипотезу.
Вывод: Различия средней частоты пульса пациентов 1-го и 2-го отделений НЕдостоверны. Значит, более высокая средняя частота пульса во 2-м отделении больницы (126,2 уд/мин) по сравнению с ЧСС в 1-м отделении (121,9 уд/мин) не подтверждается при уровне значимости p=0,05.
Пример сравнения относительных величин и определения достоверности различий между ними по критерию Стьюдента.
Условие задачи: группа животных в количестве 120 особей получала препарат А. Из них у 98 животных произошло восстановление функций организма. Контрольная группа животных в составе 50 особей содержалась в аналогичных условиях без применения этого препарата, из них восстановление наблюдалось у 15 особей.
Задание: а) вычислить показатели частоты восстановления функций организма животных (интенсивные относительные величины) в 1-ой и 2-ой группах животных;
б) вычислить ошибки репрезентативности относительных величин;
в) определить доверительные границы колебаний относительной величины в каждой группе;
г) вычислить критерий Стьюдента для оценки достоверности различий относительных величин в изучаемых группах;
д) сделать вывод о проявления эффекта препарата в генеральной совокупности с вероятностью более 95%.
Решение: запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов», на листе «Крит_Стьюдента» этого файла выполните вычисления, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
а) расчет относительных величин частоты восстановления функций организма животных в 2-х группах: ,
P1= 98/120*100 = 81,67% ;
P2= 15/98*100 = 15,31% .
б) вычисление ошибок репрезентативности относительных величин:,
m1= 3,53%;
m2= 3,64%.
в) определение доверительных границ относительных величин в каждой группе:
при уровне значимости p<0,05, т.е. с вероятностью прогноза более 95%, границы вычисляют по формуле P±2m, где P относительная величина, m ошибка репрезентативности.
По условию задачи в 1-й группе животных P1=81,67, m1=15,31. Следовательно, 81,67 ± 2*3,53 = 81,67 ± 7,06%. Получаем доверительные границы колебаний относительных величин в 1-й группе от 74,61% до 88,73%, во 2-й группе - от 8,03% до 22,59%. Поскольку доверительные границы не пересекаются, с вероятностью 95% справедливо утверждение, что полученная разница относительных величин не случайна.
г) вычисление критерия Стьюдента для относительных величин:
t = ABS((81,67 - 15,31) / КОРЕНЬ(3,53^2 + 3,64^2)) = 13,088901 > 2
Вывод: восстановление функций организма животных на фоне действия препарата А проявляется в 81%. Этот показатель достоверно выше, чем в контрольной группе животных, не получавших препарат, при уровне значимости p<0,05.
ЗАДАНИЯ
Запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». На листе «Крит_Стьюдента», решите требуемый вариант заданий, сохраните изменения и покажите результат работы преподавателю.
Вариант 1
а) В районе N, где расположена тепловая электростанция, в одной из точек жилого поселка было взято 50 проб атмосферного воздуха. Уровень пыли составил: 0,14 мг/м3 в 15-и пробах, 0,16 мг/м3 в 8-ти пробах, 0,13 мг/м3 в 2-х пробах, 0,2 мг/м3 в 15-ти пробах, 0,18 мг/м3 в 6-ти пробах, 0,17 мг/м3 в 4-х пробах. После установки золоуловителя количество пыли в пробах воздуха измерялось следующими цифрами: 0,09 мг/м3 в 2-х пробах, 0,08 мг/м3 в 2-х пробах, 0,05 мг/м3 в 16-ти пробах, 0,02 мг/м3 в 20-и пробах, 0,14 мг/м3 в 2-х пробах. Составьте простой вариационный ряд. Определите, достоверно ли уменьшение среднесуточной концентрации пыли после введения в действие золоуловителя с уровнем значимости p<0,05?
б) Группа больных в количестве 130 человек применяла при лечении лекарственный препарат Z в течение 5 дней. У 106 человек наступило полное выздоровление. Определите частоту выздоровления пациентов на 100 больных и доверительные границы с вероятностью безошибочного прогноза 95%, при которых может наступать выздоровление. Оцените достоверность отличия этого показателя от аналогичного в контрольной группе больных, если известно, что он составил Р = 58,3%, m = ±0,63%.
Вариант 2
а) В питьевой воде, которой снабжаются дома жителей города N, определялясь концентрация соединений фтора. В 2-х пробах было обнаружено 0,5 мг/л этих соединений, в 4-х 0,6 мг/л, в 8-ти 0,9 мг/л, в 8-ти 0,4 мг/л, в 16-ти 0,8 мг/л, в 16-ти 0,9 мг/л, в 20-и 1,2 мг/л, в 24-х 1,1 мг/л, в 40 1,3 мг/л, в 50-и 1,0 мг/л, в 24-х 1,5 мг/л, в 20-и 1,6 мг/л, в 10-и 0,7 мг/л, в 8-и 1,4 мг/л, в 4-х 0,3 мг/л.
Одновременно в городе M были получены следующие результаты: в 20-и пробах было обнаружено 0,1 мг/л соединений фтора, в 15-и 0,09 мг/л, в 8-и 0,2 мг/л, в 8-и 0,05 мг/л, в 16-и 0,08 мг/л, в 10-и 0,15 мг/л, в 30-и 0,1 мг/л, в 12-ти 1,1 мг/л, в 14-и 1,3 мг/л, в 5-и 1,0 мг/л, в 4-х 1,5 мг/л, в 2-х 1,6 мг/л, в 1-й 0,7 мг/л, в 8-и 0,4 мг/л, в 4-х 0,3 мг/л. Составьте простые вариационные ряды. Определите среднюю концентрацию соединений фтора в питьевой воде городов N и M. Достоверно ли отличается средняя концентрация фторидов в питьевой воде города N от уровня фтора в воде города M?
б) При обследовании 280 учащихся 3-х классов пяти школ района К обнаружено, что у 64 из них наблюдается нарушение осанки. Определите распространенность этих нарушений на 100 учеников и доверительные границы частоты нарушения осанки у школьников 3-х классов остальных школ района К с вероятностью безошибочного прогноза 95%. Оцените достоверность отличия этого показателя от аналогичного в соседнем районе, если известно, что он составил Р = 35,5%, m = ±0,42%.
Вариант 3
а) При обследовании группы школьников 4-х классов сельского района А было установлено, что в среднем на одного человека приходится 2,98 кариозных зуба (m = ±0,26). При обследовании аналогичной группы школьников в районе Б были получены следующие результаты: 2 человека имели по 5 кариозных зубов, 28 человек по 1 кариозному зубу, 8 человек по 4 кариозных зуба, 1 человек 8 кариозных зубов, 20 человек по 3 кариозных зуба, 16 человек по 2 кариозных зуба и 6 человек не имели пораженных кариесом зубов. Составьте простой вариационный ряд. Определите среднюю интенсивность поражения кариесом школьников района Б и установите, достоверно ли она отличается от такого же показателя в районе А.
б) При выборочном обследовании 220 рабочих одного из промышленных предприятий у 47 из них были выявлены гастроэнтерологические заболевания. Определите частоту встречаемости этих заболеваний на 100 обследованных и доверительные границы возможной частоты гастроэнтерологических заболеваний среди всех работающих в аналогичных условиях с уровнем вероятности 95%. Оцените достоверность отличия этого показателя от аналогичного показателя на другом предприятии, если известно, что он составил Р = 12,5%, m= ±0,25%.
Вариант 4
а) Перед сдачей экзамена у студентов определялась частота пульса. Были получены следующие данные: у 2 студентов 76 ударов в минуту, у 3 студентов 80 ударов в минуту, у 4 студентов 108 ударов в минуту, у 2 студентов 116 ударов в минуту, у 20 студентов 88 ударов в минуту, у 6 студентов 98 ударов в минуту, у 17 студентов 86 ударов в минуту, у 11 студентов 92 удара в минуту. Составьте простой вариационный ряд. Определите среднюю частоту пульса у студентов перед экзаменом. Достоверно ли отличается показатель частоты пульса перед экзаменом от частоты пульса у этих же студентов после экзамена, если известно, что она составляла 72,4уд/мин (m = ±3,0уд/мин)?
б) Было осмотрено 185 учеников 5-х классов. У 26 из них обнаружена миопия. Определите распространенность миопии школьников 5-х классов на 100 учащихся и доверительные границы возможной частоты близорукости у школьников данного района с уровнем вероятности 95%. Оцените достоверность отличия распространенности миопии школьников района от аналогичного показателя в другом районе, если известно, что он составил Р = 25,5%, m = ±0,31%.
Вариант 5
а) Исследовалась длительность лечения больных пневмонией в стационаре центральной районной больницы N-ского района. Были получены следующие результаты: 25 дней лечилось 2 больных, 26 дней 1 больной, 11 дней 1 больной, 12 дней 1 больной, 23 дня 3 больных, 13 дней 1 больной, 21 день 3 больных, 24 дня 1 больной, 22 дня 3 больных, 14 дней 2 больных, 20 дней 5 больных, 15 дней 2 больных, 16 дней 3 больных, 17 дней 4 больных, 19 дней 8 больных, 18 дней 7 больных. Составьте простой ранжированный вариационный ряд. Рассчитайте среднюю длительность лечения пневмонии. Достоверно ли она отличается от аналогичного показателя соседнего района, если известно, что она составила 23 дня (m = ±1,3дня)?
б) Исследовано 110 больных абсцессом легкого, у 36 из них обнаружена дистрофия пародонта. Определите распространенность этой патологии на 100 человек, доверительные границы возможной частоты дистрофии пародонта при абсцессе легкого с уровнем вероятности 95%. Оцените достоверность отличия распространенности этого заболевания от аналогичного показателя в контрольной группе пациентов, если известно, что он составил Р=1,8%, m = ±0,07%.
Вариант 6
а) Исследовалась длина тела новорожденных девочек по данным родильного дома. Были получены следующие данные: у 8 девочек рост составил 48 см, у 6 девочек 51 см, у 7 девочек 53 см, у 1 девочки 49 см, у 9 девочек 52 см, у 8 девочек 50 см, у 1 девочки 47 см, у 2 девочек 46 см, у 2 девочек 54 см, у 1 девочки 55 см, у 1 девочки 56 см. Составьте простой ранжированный сгруппированный вариационный ряд, определите среднюю длину тела новорожденных девочек. Достоверно ли она отличается от длины тела новорожденных мальчиков, если по данным этого же родильного дома мальчики имели среднюю длину тела 51 см (m = ±2,3 см)?
б) При выборочном обследовании 150 ткачих хлопчатобумажного комбината у 32 из них обнаружена гинекологическая патология. Определите распространенность этих заболеваний на 100 обследованных и доверительные границы возможной частоты этой патологии у всех работниц комбината с уровнем вероятности 95%. Оцените достоверность отличия распространенности гинекологической заболеваемости от аналогичного показателя другой фабрики, если известно, что она составила Р = 2,8%, m = ±0,44%.
Контрольные вопросы
Рекомендуемая литература:
Анализ характера распределения данных (его еще называют проверкой на нормальность распределения) осуществляется по каждому параметру. Если установлено, что признак не является нормально распределенным, применение критерия достоверности Стьюдента не оправдано. Это, прежде всего, относится к дискретным и биномиальным данным, которые выражаются в баллах или строго определенными числовыми значениями.
Непараметрические критерии используются в тех случаях, когда изучаемое явление отличается от нормального распределения. Они позволяют оценить характер, тенденцию явления (увеличение, уменьшение, без перемен), а, с другой стороны, большинство из них обладает достаточно высокой статистической мощностью (чувствительностью). Особенно эффективно применение непараметрических критериев при малых выборках (n<30), а также при изучении качественных признаков.
Наиболее часто в медицинских исследованиях применяется критерий достоверности Хи-квадрат (χ2).
Формула вычисления критерия Хи-квадрат:
χ2=(Э - Т)² / Т ,
где: Э - эмпирическая частота появления признака, т.е. полученная в опыте;
T - теоретическая частота, рассчитанная по нулевой гипотезе (что было бы, если бы группы были одинаковы).
Под частотой понимается количество появлений какого-либо события. Обычно с частотой появления события имеют дело, когда переменные измерены в шкале наименований и другой их характеристики, кроме частоты, подобрать невозможно или сложно. Такие признаки применяются многими исследователями, которые используют балльную оценку величины явления, например: высокий, средний, низкий уровни и т.д.
Пример определения достоверности различий ЧСС в группах детей, поступающих в отделения больницы, по критерию Хи-квадрат.
Условие задачи: требуется сравнить частоту сердечных сокращений (ЧСС) детей 1-го года жизни, поступающих в отделения №1 и №2 больницы N (см. раздел III).
Задание: определить достоверность различий частоты пульса детей, поступающих в 1-е и 2-е отделения больницы, по критерию Хи-квадрат и сделать вывод.
Решение: запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Крит_Хи-квадрат». На этом листе создайте сгруппированные вариационные ряды, как показано в таблице 20 или перенесите таблицы сгруппированных вариационных рядов, скопировав их с листа «Крит_Стьюдента» (см. раздел III). Выполните вычисления, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
Таблица 20
Результаты измерения частоты пульса детей в 2-х отделениях больницы
1-й вариационный ряд: Частота пульса детей, поступивших в отделение №1 больницы в 20… году |
2-й вариационный ряд: Частота пульса детей, поступивших в отделение №2 больницы в 20… году |
|||||
|
V |
p |
V |
p |
||
1 |
110 |
1 |
1 |
110 |
0 |
|
2 |
115 |
3 |
2 |
115 |
3 |
|
3 |
120 |
5 |
3 |
120 |
2 |
|
4 |
125 |
4 |
4 |
125 |
6 |
|
5 |
130 |
2 |
5 |
130 |
3 |
|
6 |
135 |
1 |
6 |
135 |
1 |
|
7 |
140 |
0 |
7 |
140 |
1 |
|
8 |
145 |
0 |
8 |
145 |
1 |
Выполнение расчета (таблица 21):
1. Создаем таблицу частот и вычисляем опытные (эмпирические) и теоретические частоты. |
Эмпирические частоты - это количество единиц наблюдения по баллам, вычисляем из вариационных рядов ручным подсчетом или функцией =СЧЁТЕСЛИ(Диапазон ячеек;Значение). |
Теоретические частоты вычисляем из таблицы эмпирических частот как среднее значение в каждом отделении, например: 0,48=1*16/33, 0,52=1*17/33 и т.д. Итоги теоретических частот должны совпасть с итогами частот в эксперименте. |
Таблица 21
Вычисление теоретических частот и критерия Хи-квадрат
ЧСС |
Эмпирические частоты баллов (Э) |
Теоретические частоты (Вcего*Итого/n) (Т) |
Расчет χ2 = (Э - Т)² / Т |
|||||||
1-е отд-е |
2-е отд-е |
Всего |
1-е отд-е |
2-е отд-е |
Всего |
1-е отд-е |
2-е отд-е |
Всего |
||
1 |
110 |
1 |
0 |
1 |
0,48 |
0,52 |
1 |
0,55 |
0,52 |
1,06 |
2 |
115 |
3 |
3 |
6 |
2,91 |
3,09 |
6 |
0,00 |
0,00 |
0,01 |
3 |
120 |
5 |
2 |
7 |
3,39 |
3,61 |
7 |
0,76 |
0,72 |
1,48 |
4 |
125 |
4 |
6 |
10 |
4,85 |
5,15 |
10 |
0,15 |
0,14 |
0,29 |
5 |
130 |
2 |
3 |
5 |
2,42 |
2,58 |
5 |
0,07 |
0,07 |
0,14 |
6 |
135 |
1 |
1 |
2 |
0,97 |
1,03 |
2 |
0,00 |
0,00 |
0,00 |
7 |
140 |
0 |
1 |
1 |
0,48 |
0,52 |
1 |
0,48 |
0,46 |
0,94 |
8 |
145 |
0 |
1 |
1 |
0,48 |
0,52 |
1 |
0,48 |
0,46 |
0,94 |
|
Итого: |
16 |
17 |
n=33 |
16 |
17 |
33 |
2,50 |
2,36 |
4,86 |
2. Вычисляем опытное (эмпирическое) значение критерия Хи-квадрат. |
||||||
В ячейках каждого отделения и балла используется формула: (Э - Т)² / Т, а затем суммируется строка «Итого» или столбец «Всего». Общая формула вычислений имеет вид: |
||||||
= 4,86. |
3. Определяем достоверность различий с помощью сравнения с критическим значением критерия Хи-квадрат или вычислением вероятности различий. |
|||
Уровень значимости = |
0,05 |
||
Степени свободы (df) = |
(R - 1) * (C - 1), где R количество групп (в данном случае строк) в таблице, C количество столбцов опытных данных. |
||
Число строк, R = |
8 |
||
Число столбцов, C = |
2 |
||
df = (8 - 1) * (2- 1)= |
7 |
||
Критическое значение определяется по таблице, приведенной в приложении 2, или вычисляется функцией =ХИ2ОБР(0,05;7) |
|||
Критическое значение Хи-квадрат = |
14,06714. |
||
Или вычисляем вероятность различий: |
|||
Расчетная значимость вычисляется функцией =ХИ2ТЕСТ(Опытный интервал; Теоретический интервал). Такой расчет позволяет сократить вычисления, используя диапазоны данных из таблицы частот, и возвращает в ячейку непосредственно опытный уровень значимости. |
|||
Расчетная значимость по ХИ2ТЕСТ = |
0,677. |
4. Сравниваем опытное значение с критическим значением критерия Хи-квадрат с критическим уровнем значимости, формулируем вывод.
4,86 < 14,07, т.е. опытное значение (4,86) МЕНЬШЕ критического значения (14,07), что указывает на случайный характер различий выборочных совокупностей.
Или:
0,677 > 0,05, т.е. вероятность гипотезы о равенстве совокупностей составляет 67,75%, что не достаточно для подтверждения различий при выбранном уровне значимости 5% (0,05).
Вывод: различия частоты пульса в 2-х отделениях НЕдостоверны при уровне значимости p<0,05.
Вывод, сделанный на основе вычисления критерия Хиквадрат, в основном согласуется с выводом, сделанным по критерию Стьюдента. Однако вероятности того, что выборки взяты из одной генеральной совокупности, существенно отличаются. При использовании критерия Стьюдента эта вероятность составила 12% (0,12), а по критерию Хи-квадрат 67,7% (0,667). Значит, довод о равенстве совокупностей, полученный с применением критерия Хи-квадрат, более весомый.
ЗАДАНИЯ
Запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов», создайте НОВЫЙ лист, переименуйте его, обозначив названием «Крит-й_Хи-квадрат», решите требуемый вариант задания, сохраните, покажите решение преподавателю.
Вариант 1
В районе N, где расположена тепловая электростанция, в одной из точек жилого поселка было взято 50 проб атмосферного воздуха. Уровень пыли составил: 0,14 мг/м3 в 15-и пробах, 0,16 мг/м3 в 8-и пробах, 0,13 мг/м3 в 2-х пробах, 0,2 мг/м3 в 15-и пробах, 0,18 мг/м3 в 6-и пробах, 0,17 мг/м3 в 4-х пробах.
После установки золоуловителя количество пыли в пробах воздуха измерялось следующими цифрами: 0,09 мг/м3 в 2-х пробах, 0,08 мг/м3 в 2-х пробах, 0,05 мг/м3 в 16-и пробах, 0,02 мг/м3 в 20-и пробах, 0,14 г/м3 в 2-х пробах.
Определите, достоверно ли уменьшение запыленности после установки золоуловителя по критерию Хи-квадрат с уровнем значимости p<0,05?
Вариант 2
В питьевой воде, которой снабжаются дома жителей города N, определяли концентрацию соединений фтора, в 2-х пробах было обнаружено 0,5 мг/л этих соединений, в 4-х пробах 0,6 мг/л, в 8-и пробах 0,9 мг/л, в 8-и пробах 0,4 мг/л, в 16-и пробах 0,8 мг/л, в 16-и пробах 0,9 мг/л, в 20-и пробах 1,2 мг/л, в 24-х пробах 1,1 мг/л, в 40 пробах 1,3 мг/л, в 50-и пробах 1,0 мг/л, в 24-х пробах 1,5 мг/л, в 20-и пробах 1,6 мг/л, в 10-и пробах 0,7 мг/л, в 8-и пробах 1,4 мг/л, в 4-х пробах 0,3 мг/л.
Одновременно в городе M были получены следующие результаты: в 20-и пробах было обнаружено 0,1 мг/л соединений фтора, в 15-и пробах 0,09 мг/л, в 8-и пробах 0,2 мг/л, в 8-и пробах 0,05 мг/л, в 16-и пробах 0,08 мг/л, в 10-и пробах 0,15 мг/л, в 30-и пробах 0,1 мг/л, в 12-и пробах 1,1 мг/л, в 14-и пробах 1,3 мг/л, в 5-ти пробах 1,0 мг/л, в 4-х пробах 1,5 мг/л, в 2-х пробах 1,6 мг/л, в 1-й пробе 0,7 мг/л, в 8-и пробах 0,4 мг/л, в 4-х пробах 0,3 мг/л.
Определите среднюю концентрацию фторидов в питьевой воде городов N и М. Установите, достоверно ли отличается уровни фтора в питьевой воде этих городов по критерию Хи-квадрат с уровнем значимости p<0,05?
Вариант 3
При обследовании группы школьников 4-х классов сельского района А было установлено, что 8 человек имели по 5 кариозных зубов, 20 человек по 1 зубу, 10 человек по 4 зуба, 1 человек 8 зубов, 20 человек по 3 зуба, 16 человек по 2 зуба и 15 человек не имели пораженных кариесом зубов.
При обследовании аналогичной группы школьников в районе Б были получены следующие результаты: 2 человека имели по 5 кариозных зубов, 28 человек 1 зуб, 8 человек по 4 зуба, 1 человек 8 зубов, 20 человек по 3 зуба, 16 человек по 2 зуба и 6 школьников не имели пораженных кариесом зубов.
Сравните среднюю интенсивность поражения кариесом в районах А и Б, установите, достоверно ли отличаются районы по этому признаку на основе критерия Хи-квадрат с уровнем значимости p < 0,05.
Вариант 4
Перед сдачей экзамена у студентов определялась частота пульса (ЧСС). Были получены следующие данные: у 2-х студентов 76 ударов в минуту, у 3-х студентов 80 ударов в минуту, у 4х студентов 108 ударов в минуту, у 2-х студентов 116 ударов в минуту, у 20-и студентов 88 ударов в минуту, у 6-и студентов 98 ударов в минуту, у 17-и студентов 86 ударов в минуту, у 11-и студентов 92 ударов в минуту.
У этих же студентов была измерена частота пульса после экзамена и получены следующие результаты: у 2-х студентов 73 удара в минуту, у 3-х студентов 75, у 4-х студентов 80, у 2-х студентов 81, у 20и студентов 74, у 6-и студентов 82, у 17-и студентов 86, у 11-и студентов 85.
Сравните средние величины ЧСС студентов до и после экзамена и подтвердите достоверность различий этого признака по критерию Хи-квадрат с уровнем значимости p < 0,05.
Вариант 5
Исследовалась длительность лечения больных пневмонией в стационаре 2-х больниц города N. Были получены следующие результаты: в 1-й больнице 25 дней лечилось 10 больных, 26 дней 8 больных, 11 дней 1 больной, 12 дней 1 больной, 23 дня 5 больных, 13 дней 1 больной, 21 день 15 больных, 24 дня 9 больных, 22 дня 7 больных, 14 дней 2 больных, 20 дней 5 больных, 15 дней 2 больных, 16 дней 3 больных, 17 дней 4 больных, 19 дней 2 больных, 18 дней 3 больных.
Во 2-й больнице 25 дней лечился 1 больной, 21 день 2 больных, 11 дней 26 больных, 12 дней 18 больных, 23 дня 3 больных, 13 дней 10 больных, 21 день 3 больных, 24 дня 1 больной, 22 дня 3 больных, 14 дней 6 больных, 20 дней 5 больных, 15 дней 7 больных, 16 дней 5 больных, 17 дней 4 больных, 19 дней 1 больной, 18 дней 1 больной.
Рассчитайте среднюю длительность лечения пневмонии и определите достоверность различий этого показателя в 2-х больницах с помощью критерия Хиквадрат с уровнем значимости p < 0,05.
Вариант 6
Изучалась длина тела новорожденных по данным родильного дома. Были получены следующие данные о новорожденных девочках: у 8 девочек рост составил 48 см, у 6 девочек 51 см, у 7 девочек 53 см, у 1 девочки 49 см, у 9 девочек 52см, у 8 девочек 50 см, у 3 девочек 47 см, у 2 девочек 46 см, у 2 девочек 54 см, у 1 девочки 55 см, у 1 девочки 56 см.
Данные о новорожденных мальчиках: 9 мальчиков родились с длиной тела 56 см, 6 мальчиков 55 см, 7 мальчиков 58 см, 1 мальчик 59 см, 9 мальчиков 52 см, 8 мальчиков 54 см, 2 мальчика 50 см, 1 мальчик 49 см, 2 мальчика 53 см, 4 мальчика 54 см, 2 мальчика 51 см, 2 мальчика 53 см.
Определите среднюю длину тела новорожденных девочек и мальчиков, установите, достоверно ли отличается этот признак у новорожденных женского и мужского пола, подтвердите различия по критерию Хиквадрат с уровнем значимости p < 0,05.
Контрольные вопросы
Рекомендуемая литература:
Основным принципом подбора групп статистического наблюдения в случае необходимости сравнения между ними является однородность сравниваемых совокупностей по характеризующим признакам.
К характеризующим признакам относятся признаки, по которым выполняется группировка совокупностей. Они, как правило, оказывают влияние на результативные признаки и изучаемое явление в целом. Подбор групп с одинаковым уровнем характеризующих признаков позволяет исключить такое влияние и акцентировать внимание на изучаемых особенностях явления.
Например, общие интенсивные коэффициенты (рождаемости, смертности, младенческой смертности, заболеваемости и т.д.) правильно отражают частоту явлений при их сопоставлении лишь в том случае, если состав сравниваемых совокупностей однороден. Если же они имеют различный возрастно-половой или профессиональный состав, разное соотношение по нозологическим формам или другим характеризующим признакам, то, ориентируясь на общие показатели, сопоставляя их, можно сделать неправильный вывод об истинных причинах разницы показателей сравниваемых совокупностей.
Если же не удается провести формирование однородных выборок, или уже после проведения исследования оказывается, что сравниваемые группы не одинаковы по характеризующим признакам, может использоваться метод стандартизации. Это метод расчета условных (стандартизованных) показателей, заменяющих общие интенсивные (или средние) величины в тех случаях, когда их сравнение затруднено из-за несопоставимости групп. Он позволяет определить, какие показатели были бы получены в случае однородности групп, т.е. устранить (элиминировать) возможное влияние различий в составе совокупностей по какому-либо признаку на величину сравниваемых интенсивных показателей. Следовательно, метод стандартизации применяется тогда, когда имеющиеся различия в составе сравниваемых совокупностей могут повлиять на размеры общих коэффициентов.
Стандартизованные показатели это условные, гипотетические величины, они не отражают истинных размеров явлений, но свидетельствуют о том, каковы были бы значения сравниваемых интенсивных показателей, если бы были исключены различия в составах совокупностей.
Для того, чтобы устранить влияние неоднородности составов сравниваемых совокупностей на величину получаемых коэффициентов, их приводят к единому стандарту, то есть условно допускается, что состав совокупностей одинаков. В качестве стандарта можно принять величину среды одной или всех сравниваемых групп, уровень явления в этих группах или какой-либо близкой по существу третьей совокупности. От выбора стандарта зависит способ вычисления, т.е. модификация метода. Принято выделять прямой, обратный и косвенный варианты соответственно. Варианты используемого метода стандартизации не влияют на конечный вывод и определяются исследователем.
Методика выполнения расчетов прямого метода стандартизации состоит из 5 этапов:
- Первый этап. Вычисление общих показателей (относительных или средних величин) отдельно для каждой группы.
- Второй этап. Выбор стандарта осуществляется произвольно.
- Третий этап. Вычисление ожидаемых величин, демонстрирующих уровень явления, который мог бы быть зафиксирован при отсутствии неоднородности в группах.
- Четвертый этап. Определение стандартизованных показателей.
- Пятый этап. Сравнение групп по стандартизованным показателям и формулирование вывода.
Пример вычисления стандартизованных показателей прямым методом стандартизации.
Условия задачи: проведено углубленное обследование жителей 2-х микрорайонов города N, при котором получены следующие данные. В 1-м районе обследовано 795 человек, из них 156 мужчины, 639 женщины. Выявлена стенокардия у 3 мужчин и 30 женщин. Во 2-м районе обследовано 720 человек (585 мужчин, 135 женщин). Заболевание выявлено у 15 мужчин и 12 женщин.
Задание: сравнить патологическую пораженность стенокардией в 2-х районах города.
Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Стандартизация». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
1-й этап: создание таблицы и вычисление общих относительных величин, как показано в таблице 22.
Таблица 22
Вычисление относительных и стандартизованных величин
Абсолютные данные |
Патологическая пораженность на 100 обсл. (PОбщ.) |
Стандарт (1-й+2-й районы)
|
Ожидаемые величины |
||||||
Районы: |
1-й |
2-й |
1-й |
2-й |
1-й |
2-й |
|||
|
Обсл. |
Заб. |
Обсл. |
Заб. |
|||||
м |
639 |
30 |
135 |
12 |
4,7 |
8,9 |
774 |
36,3 |
68,8 |
ж |
156 |
3 |
585 |
15 |
1,9 |
2,6 |
741 |
14,3 |
19,0 |
Оба пола |
795 |
33 |
720 |
27 |
4,2 |
3,8 |
1515 |
50,6 |
87,8 |
Стандартизованные величины (Pст.) = |
3,3 |
5,8 |
|||||||
2-й этап: выбор стандарта. Для прямого метода стандартизации за стандарт выбирается число обследованных в обоих районах (уровень среды) среди мужчин и женщин отдельно, а затем их сумма, т.е. 741 = 156+585 и т.д. |
3-й этап: вычисление ожидаемых величин. Они вычисляются с помощью пропорций, которыми определяют возможное число заболевших, если бы в изучаемых районах был одинаков состав среды:
Из 100 болевших |
- |
Pобщ. |
х= |
Pобщ. * Стандарт |
Из числа стандарта |
- |
хОжид.число болевших |
100 |
Ожидаемая величина болевших мужчин района 1:
Из 100 муж. заболело |
- |
Pобщ. |
х= |
4,7 * 774 |
= 36,3 |
Из числа станд. муж. |
- |
хОжид.число болевших |
100 |
Ожидаемая величина болевших женщин района 1:
Из 100 жен. заболело |
- |
Pобщ. |
х= |
1,9 * 741 |
= 14,3 |
Из числа станд. жен. |
- |
хОжид.число болевших |
100 |
Аналогично составляются пропорции для района 2.
Ожидаемые величины по каждому району суммируются.
Для района 1: 36,3+14,3=50,6.
Для района 2: 68,8+19,0=87,8.
4-й этап: вычисление стандартизованных величин. Расчет выполняется по принципам вычисления относительных величин, но на основе ожидаемых значений с помощью составления пропорции:
Из общего числа обслед. |
- |
болело число ожидаемых |
Рст.= |
Ожид.вел. * 100 |
Из 100 чел. |
- |
Рст. |
Общее число обслед. |
Для района1:
Из 1515 чел |
- |
болело 50,6 |
Рст1.= |
50,6 * 100 |
= 3,3 |
|||
Из 100 чел. |
- |
Рст. |
1515 |
Для района 2:
Из 1515 чел |
- |
болело 87,8 |
Рст2.= |
87,8 * 100 |
= 5,8 |
|||
Из 100 чел. |
- |
Рст. |
1515 |
5-й этап: оценка достоверности стандартизованных величин, их сопоставление между собой и с относительными величинами и формулирование вывода. Вычисление критерия достоверности Стьюдента выполняется с целью подтверждения гипотезы о закономерности выявленных различий.
Критерий достоверности Стьюдента для относительных величин рассчитывается по формуле:
где: P1 относительная величина (показатель) 1-й группы;
P2 относительная величина (показатель) 2-й группы;
m1 ошибка репрезентативности 1-го показателя;
m2 ошибка репрезентативности 2-го показателя.
Для вычисления ошибки репрезентативности относительной величины используется формула:
,
где: Р величина относительного показателя;
q величина, обратная Р и вычисленная как (1-Р), (100-Р), (100-Р) и т. д., в зависимости от основания, на которое рассчитан показатель;
n число наблюдений.
В программе Excel значения этих критериев может быть вычислено следующими формулами:
m1: =КОРЕНЬ(3,3*(100-3,3)/(795-1)), результат 0,63;
m2: =КОРЕНЬ(5,8*(100-5,8)/(720-1)), результат 0,87;
t : =ABS((3,3-5,8)/КОРЕНЬ(0,63^2+0,87^2)), результат 2,3 > 2, т.е. различия достоверны.
Для удобства сопоставления полученных значений составляется таблица, в которой сравнивают интенсивные и стандартизованные показатели (таблица 23).
Таблица 23
Сопоставление интенсивных и стандартизованных величин
Показатели |
Район 1 |
Район 2 |
Результаты сравнения |
Интенсивные (PОбщ.) |
4,2 |
3,8 |
Заболеваемость в 1-м районе > чем во 2-м районе |
Стандартизованные (PСт.) |
3,3± 0,63 |
5,8±0,87 |
Заболеваемость в 1-м районе < чем во 2-м районе |
Вывод: сравнение стандартизованных показателей выявления стенокардии в районах 1 и 2 позволяет сделать заключение, что, если бы состав обследованных по полу в этих районах был одинаков, то показатель заболеваемости стенокардией в 1-ом районе был бы значительно ниже, чем во 2-ом (уровень значимости p<0,05).
Из анализа общих интенсивных показателей такой вывод сделать нельзя, так как на общие показатели оказал влияние разный состав осмотренных по полу в этих районах. Из литературных данных известно, что стенокардия приблизительно в 2 раза чаще встречается среди мужчин, чем среди женщин. Поэтому в 1-ом районе, где были обследованы преимущественно мужчины, общий интенсивный показатель был завышен (4,2 на 100 обследованных), а во 2-ом районе занижен (3,8 на 100 обследованных), так как были обследованы в основном женщины. Метод стандартизации позволил увидеть истинную картину заболеваемости, устранив влияние фактора, связанного с полом обследованных.
ЗАДАНИЯ
Запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». На листе «Стандартизация», решите требуемый вариант заданий, сохраните изменения и покажите результат работы преподавателю.
Вариант 1
Проведено изучение заболеваемости населения в городах N и M. В городе N проживало 30000 человек, из них 20000 мужчин и 10000 женщин. В течение года болели 5000 мужчин и 4000 женщин. В городе М проживало 65000 человек (25000 мужчин, 40000 женщин). Болели в течение года 7000 мужчин и 14000 женщин. Рассчитать интенсивные и стандартизованные показатели заболеваемости (на 1000 жителей), проанализировать и оценить достоверность различий между ними, сделать вывод.
Вариант 2
Требуется сравнить физическое развитие учеников 8-10 классов в 2-х школах. В 1-й школе обследовано 195 человек, из них 31 мальчик и 164 девочки, выявлено, что отставание физического развития есть у 1-го мальчика и 5-ти девочек.
Во 2-й школе обследовано 182 человека, из них 125 мальчиков и 57 девочек, имели отставание 5 мальчиков и 4 девочки. Рассчитать интенсивные и стандартизованные показатели частоты отклонений физического развития детей в этих школах, сравнить их и оценить достоверность различий между ними, сделать вывод.
Вариант 3
Необходимо сравнить качество протезирования зубов в 2-х стоматологических поликлиниках. В 1-й поликлинике изготовлено 400 протезов, из них 35 мостовидных и 365 единичных; плохая фиксация протезов зафиксирована у 1-го пациента с мостовидным и 5-ти пациентов с единичными протезами. Во 2-й поликлинике установлено 350 протезов, из них 250 мостовидных и 100 единичных; нарушение фиксации обнаружено 5-и пациентов с мостовидными и 4-х с единичными протезами. Рассчитать интенсивные и стандартизованные показатели качества протезирования в поликлиниках, проанализировать и оценить достоверность различий между ними, сделать вывод.
Вариант 4
Сравните загрязненность воздуха по количеству проб, не отвечающих санитарным требованиям, в 2-х районах города N. В 1-м районе взято 300 проб, из них 30 в жилых кварталах и 270 вблизи автомобильных дорог; обнаружено несоответствие требованиям в 2-х квартальных пробах и 5 у автодороги. Во 2-м районе взято 200 проб, из них 150 квартальных и 50 у дороги; имели отклонение от норматива загрязненности 5 квартальных и 4 пробы рядом с автодорогой. Рассчитать интенсивные и стандартизованные показатели загрязненности воздуха в 2-х районах, проанализировать и оценить достоверность различий между ними, сделать вывод.
Вариант 5
Требуется сравнить качество работы 2-х лечебно-профилактических учреждений (ЛПУ) по числу послеоперационных осложнений. В 1-й клинике проведено 600 хирургических операций, из них 55 полостных в общем отделении и 545 малоинвазивных в эндоскопическом отделении; послеоперационные осложнения зафиксированы у 20-и пациентов, перенесших полостную операцию, и у 5-ти пациентов из эндоскопического отделения. Во 2-й клинике выполнено 350 операций, из них 250 полостных и 100 малоинвазивных; осложнения были зафиксированы у 5-и пациентов общего отделения и у 4-х - эндоскопического. Рассчитать интенсивные и стандартизованные показатели послеоперационных осложнений в 2-х ЛПУ, проанализировать и оценить достоверность различий между ними, сделать вывод.
Вариант 6
Сравните загрязненность 2-х водоемов по количеству проб, не отвечающих санитарным требованиям. В 1-м водоеме взято 300 проб, из них 30 поверхностных и 270 с глубины 3 метра; обнаружено несоответствие требованиям в 5-ти поверхностных пробах и 7-ми глубинных. Во 2-м водоеме взято 200 проб, из них 150 поверхностных и 50 глубинных; имели отклонение от норматива загрязненности 8 поверхностных и 3 глубинные пробы. Рассчитать интенсивные и стандартизованные показатели загрязненности водоемов, проанализировать и оценить достоверность различий между ними, сделать вывод.
Контрольные вопросы
Рекомендуемая литература:
Трудно представить любое медицинское исследование (социально-гигиеническое, гигиеническое, клиническое, экспериментальное и др.), в котором не ставилась бы в той или иной мере задача определения силы влияния различных факторов на размеры изучаемого признака. Определяя различия средних арифметических двух выборочных групп наблюдения путем расчета критерия Стьюдента t, который позволяет выявить статистическую значимость разницы средних, исследователь подразумевает, как само собой разумеющееся, что группы исследуемых совершенно однородны и отличаются только по одному какому-то признаку или методу воздействия на них.
Между тем на практике это условие соблюдается далеко не всегда. На изучаемое явление и, следовательно, его средний уровень оказывают влияние многочисленные факторы, как постоянные (планируемые или сознательно выделяемые для их изучения), так и случайные (неопределенные). Например, больные гипертонической болезнью, отобранные по полу, возрасту, стадии и длительности заболевания, помимо болезни, подвергаются воздействию других неучтенных факторов, в результате чего у разных больных наблюдается различный уровень артериального давления.
При изучении явлений, сравнении их друг с другом в поисках сходства и различий необходимо обращать внимание не только на величину средних, но и на разнообразие вариант, а также вариабельность изучаемых признаков. Исследователь может встретить вариационные ряды, не отличающиеся по центральной тенденции (размеру средней арифметической), но различные по степени варьирования. И наоборот - ряды, одинаковые по величине разброса вариант, могут различаться по размерам средней арифметической. Установление значимости различий средних арифметических, измерение степени влияния факторов и их градаций на варьирующий (результативный) признак наиболее эффективно достигаются путем применения дисперсионного анализа. Впервые основа дисперсионного анализа была разработана известным английским статистиком Р. Фишером в 1925 году.
Дисперсионный анализ это метод в статистической математике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий вариабельности признака в исследуемой совокупности. В литературе также встречается обозначение ANOVA (от англ. ANalysis Of VAriance). Он базируется на определении степени рассеяния (дисперсии) оцениваемых признаков в нескольких группах. Это позволяет измерить силу влияния отдельных факторов на значения показателей.
Известно, что величина отдельных признаков представляет собой результат воздействия разнообразных факторов, различных по силе влияния. Одни факторы имеют значительно большую силу влияния, другие - меньшую. Причем, как правило, факторы сами воздействуют друг на друга, сочетая свое влияние, иногда усиливают действие друг друга, иногда, наоборот, погашают это действие. Преимуществом дисперсионного анализа является то, что он дает возможность изучить и сравнить роль каждого из них.
В отличие от дисперсионного анализа другие общепринятые в медицинских исследованиях статистические методы обработки, как правило, предусматривают проведение попарных сравнений, что приводит к огромному объему расчетов и часто не дает полной оценки.
Сущность дисперсионного анализа заключается в изучении статистического влияния одного или нескольких факторов на результативный признак.
Фактор - это влияние, воздействие или состояние, которое отражается на размерах и разнообразии результативного признака.
Результативный признак - это элементарное свойство объектов, изучаемое как результат влияния факторов: организованных в исследовании (основных - х) и всех остальных, неорганизованных, не учтенных в данном исследовании (случайных - z).
Градации фактора - это степень его воздействия, в том числе отсутствие воздействия (нулевое значение) в контрольной группе или состояние объектов изучения (пол, возраст и др.).
Дисперсионный комплекс - это совокупность градаций изучаемых данных (групп объектов наблюдения, выбранных исследователем) с вычисленными значениями относительных или средних величин по каждой градации.
При изучении количественных признаков в градации дисперсионного комплекса заносятся числовые результаты измерения изучаемого признака у каждого отдельного объекта. При изучении качественных признаков в градации комплекса заносится число объектов с наличием признака и общее число объектов.
Дисперсионные комплексы, составленные по принципу случайного отбора, называются рандомизированными.
Статистическое влияние - это отражение в разнообразии результативного признака того разнообразия фактора (его градаций), которое организовано в исследовании.
Сумма основных и случайных факторов составит общие факторы (у). Результативный признак изучается как результат воздействия факторов, организованных в исследовании (х) и неорганизованных (z).
Общее влияние как раз и определяет влияние всех организованных и неорганизованных (случайных) факторов, определивших такое развитие признака, которое наблюдалось в дисперсионном комплексе. Общее влияние служит базой для определения доли влияний - факториальных и случайных.
Факториальное влияние - это простое или комбинированное статистическое влияние изучаемых (учтенных) факторов.
Случайное влияние - это действие тех факторов, которые не учтены в дисперсионном комплексе и составляют общий фон, на котором действуют учитываемые факторы.
Таким образом, дисперсионный анализ исследует важнейшее свойство совокупности разнообразие (вариабельность, дисперсию) признака. Для этого выделяется три вида разнообразия: межгрупповое, внутригрупповое и общее. Межгрупповое разнообразие зависит от влияния исследуемого фактора, по которому выделяется каждая группа. Иными словами, межгрупповое разнообразие - это различие средних в каждой группе. Внутригрупповое разнообразие зависит от силы влияния каких-то неучтенных случайных факторов. Общее разнообразие складывается из межгруппового и внутригруппового.
В основе дисперсионного анализа лежит предположение о том, что одни переменные могут рассматриваться как причины (факторы, независимые переменные): f1, …, fk, а другие как следствия (зависимые переменные). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте исследователь имеет возможность варьировать ими и анализировать получающийся результат.
Основной целью дисперсионного анализа является исследование значимости различия между группами с помощью сравнения дисперсий. Разделение общей дисперсии на несколько источников позволяет сравнить дисперсию, вызванную различием между группами, с дисперсией, вызванной внутригрупповой изменчивостью. При истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии. Если выполняется сравнение средних в двух выборках, дисперсионный анализ даст тот же результат, что и обычный t-критерий Стьюдента. Однако, помимо этого, он позволяет оценить степень такого влияния, а также может использоваться при сопоставлении более чем 2-х групп.
Сущность дисперсионного анализа заключается в расчленении общей дисперсии (D или SS) изучаемого признака на отдельные компоненты, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости влияния этих факторов на исследуемый признак. Обозначение SS - это сокращение от фразы "суммы квадратов" (Англ. sum of squares). Оно чаще всего используется в зарубежных источниках.
Сравнивая компоненты дисперсии друг с другом посредством F-критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов.
Критерий Фишера экспериментальных (эмпирических) данных (FЭмп.) вычисляется как отношение среднего квадрата дисперсии, обусловленной изучаемым фактором, к среднему квадрату случайной дисперсии:
,
где: FЭмп. критерий Фишера, вычисленный в исследуемой совокупности,
MSФакт. средний квадрат дисперсии, обусловленной изучаемым фактором,
MSСлуч. средний квадрат дисперсии, обусловленной случайными факторами.
Для оценки достоверности полученного результата вычисленный на экспериментальных данных критерий Фишера сравнивают с его критическим значением (FКрит.) для принятого уровня вероятности (p) и степеней свободы (df ).
С целью уменьшения объема вычислений в программе Excel может применяться надстройка «Анализ данных» и ее модуль «Однофакторный дисперсионный анализ».
Пример задачи на выявление степени влияния изучаемого фактора.
Условие задачи: три различные группы из шести испытуемых получили списки из десяти слов. Первой группе слова предъявлялись с низкой скоростью - 1 слово в 5 секунд, второй группе со средней скоростью - 1 слово в 2 секунды, и третьей группе с большой скоростью - 1 слово в секунду. Было предсказано, что показатели воспроизведения будут зависеть от скорости предъявления слов. Результаты измерений представлены в таблице 24.
Таблица 24
Результаты запоминания слов, предъявляемых испытуемым
№ испытуемого |
Группа 1 (низкая скорость) |
Группа 2 (средняя скорость) |
Группа 3 (высокая скорость) |
1 |
8 |
7 |
4 |
2 |
7 |
8 |
5 |
3 |
9 |
5 |
3 |
4 |
5 |
4 |
6 |
5 |
6 |
6 |
2 |
6 |
8 |
7 |
4 |
Суммы |
43 |
37 |
24 |
Средние |
7,17 |
6,17 |
4 |
Общая сумма |
104 |
Статистическая гипотеза:
- Основная (H0): различия в объеме воспроизведения слов между группами являются не более выраженными, чем случайные различия внутри каждой группы.
- Альтернативная (H1): Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы.
Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Дисп_анализ». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
Этапы выполнения дисперсионного анализа.
1. Подсчет SSФакт. - вариативности признака, обусловленную действием исследуемого фактора (межгрупповое разнообразие):
,
где: Тс сумма индивидуальных значений по каждому из условий. Для нашего примера 43, 37, 24 (см. таблицу);
с количество условий (градаций) фактора (=3);
n количество испытуемых в каждой группе (=6);
N общее количество индивидуальных значений (=18);
квадрат общей суммы индивидуальных значений (=1042=10816).
Отметим разницу между , в которой все индивидуальные значения сначала возводятся в квадрат, а потом суммируются, и , где индивидуальные значения сначала суммируются для получения общей суммы, а потом уже эта сумма возводится в квадрат.
По формуле (1) рассчитав фактическую вариативность признака, получаем:
.
2. Вычисление SSОбщ. общей вариативности признака:
.
3. Вычисление случайной (остаточной) величины дисперсии SSСл., обусловленной неучтенными факторами (внутригрупповое разнообразие):
4. Определение числа степеней свободы dfОбщ. , dfФакт. , dfСл. :
5. Математическое ожидание суммы квадратов или «средний квадрат», усредненная величина соответствующих сумм квадратов SS равна:
6. Значение статистики критерия FЭмп. вычисляется по формуле:
Для нашего примера имеем: FЭмп.= 7,45
7. Определение FКрит. выполняется по статистическим таблицам (Приложение 3) для степеней свободы df1=k1=2 и df2=k2=15 и уровне значимости 0,05. Табличное значение статистики равно FКрит. = 3,68.
В программе Excel критическое значение критерия Фишера определяется функцией =FРАСПОБР(Уровень значимости; df1; df2) =FРАСПОБР(0,05;2;15) = 3,68232034.
8. Если FЭмп.< FКрит., то нулевая гипотеза принимается, в противном случае принимается альтернативная гипотеза. Для нашего примера FЭмп. > FКрит. (7,45>3,68), следовательно, принимается альтернативная гипотеза - влияние существует.
В программе Excel с помощью функции ФТЕСТ можно сразу вычислить вероятность различий двух массивов данных. Вводим в ячейку функцию =ФТЕСТ(Первый диапазон данных ; Второй диапазон данных).
Получаем вероятность 0,99999999 > 0,95 (95%).
Аналогичные вычисления выполняются с помощью надстройки «Анализ данных» в модуле «Однофакторный дисперсионный анализ». Результат обработки данных задачи этой командой показан в таблице 25.
Таблица 25
Однофакторный дисперсионный анализ |
||||||
ИТОГИ |
||||||
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
||
Группа 1 (низкая скорость) |
6 |
43 |
7,16667 |
2,1666667 |
||
Группа 2 (средняя скорость) |
6 |
37 |
6,16667 |
2,1666667 |
||
Группа 3 (высокая скорость) |
6 |
24 |
4 |
2 |
||
Дисперсионный анализ |
||||||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
Между группами |
31,444 |
2 |
15,7222 |
7,4473684 |
0,00567184 |
3,682320344 |
Внутри групп |
31,667 |
15 |
2,11111 |
|||
Итого |
63,111 |
17 |
|
|
|
|
Вывод: различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы (р<0,05). Таким образом, скорость предъявления слов влияет на объем их воспроизведения.
ЗАДАНИЯ
Запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». На листе «Дисп_анализ», решите требуемый вариант заданий, сохраните изменения и покажите результат работы преподавателю.
Вариант 1
В эксперименте на животных измерено время пробежки мышей по лабиринту на фоне различной концентрации препарата, стимулирующего нервную систему. Результаты измерений в секундах указаны в таблице 26.
Таблица 26
Результаты измерения времени пробежки мышей по лабиринту (сек.)
№ животного |
Группа 1 (низкая концентрация) |
Группа 2 (средняя концентрация) |
Группа 3 (высокая концентрация) |
1 |
8 |
7 |
4 |
2 |
7 |
8 |
5 |
3 |
9 |
5 |
3 |
4 |
5 |
4 |
6 |
5 |
6 |
6 |
2 |
6 |
8 |
4 |
3 |
7 |
7 |
7 |
4 |
8 |
8 |
6 |
2 |
9 |
9 |
7 |
4 |
10 |
8 |
7 |
3 |
Необходимо подтвердить влияние стимулирующего вещества с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ».
Вариант 2
На предприятии проведено изучение уровня травматизма с учетом фактора стажа работы сотрудников 5-и участков с близкими условиями труда, получены следующие данные (таблица 27).
Таблица 27
Уровень травматизма на 100 работающих
Участок |
Стаж работы |
|||
до 5 лет |
6-10 лет |
11-15 лет |
16 лет и более |
|
1 |
11 |
8 |
6 |
4 |
2 |
12 |
9 |
7 |
7 |
3 |
10 |
6 |
6 |
5 |
4 |
10 |
9 |
7 |
7 |
5 |
13 |
8 |
5 |
3 |
Необходимо оценить влияние стажа работы на уровень травматизма с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ».
Вариант 3
Проведено изучение уровня загрязнения водоема в 10 точках с учетом времени года, получены следующие данные (таблица 28).
Таблица 28
Уровень загрязнения водоема
№ точки отбора |
Концентрации (мг/м3) по временам года |
|||
зима |
весна |
лето |
осень |
|
1 |
3 |
8 |
6 |
4 |
2 |
4 |
9 |
7 |
7 |
3 |
2 |
6 |
6 |
5 |
4 |
3 |
9 |
7 |
7 |
5 |
1 |
8 |
5 |
3 |
6 |
4 |
8 |
3 |
5 |
7 |
2 |
9 |
2 |
3 |
8 |
3 |
6 |
4 |
5 |
9 |
1 |
9 |
3 |
4 |
10 |
2 |
8 |
4 |
4 |
Требуется определить влияние времени года на уровень загрязнения водоема с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ»
Вариант 4
Проведено обследование 8 групп пациентов, которым выполнялось лечение кариеса с применением 3-х типов пломбировочного материала и с учетом времени выполнения работы врача, получены следующие данные (таблица 29).
Таблица 29
Время работы врача-стоматолога (мин)
№ группы пациентов |
Тип пломбировочного материала |
||
1-й |
2-й |
3-й |
|
1 |
3 |
8 |
6 |
2 |
4 |
9 |
7 |
3 |
2 |
6 |
6 |
4 |
3 |
9 |
7 |
5 |
1 |
8 |
5 |
6 |
4 |
8 |
3 |
7 |
2 |
9 |
2 |
8 |
3 |
6 |
4 |
Необходимо подтвердить влияние типа используемого материала на время работы врача с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ».
Вариант 5
Проведено обследование длительности лечения 6 групп пациентов, которые получали терапию с применением лекарственного препарата, изготовленного тремя фармацевтическими компаниями, получены следующие данные (таблица 30).
Таблица 30
Длительность лечения (дней)
Пациент |
Производитель лекарственного средства |
||
1-й |
2-й |
3-й |
|
1 |
5 |
6 |
9 |
2 |
4 |
7 |
9 |
3 |
6 |
6 |
8 |
4 |
7 |
8 |
7 |
5 |
4 |
6 |
10 |
6 |
5 |
7 |
6 |
Необходимо подтвердить влияние на длительность лечения пациентов применения лекарства изготовленного разными фармацевтическими компаниями с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ».
Вариант 6
Выполнен отбор проб атмосферного воздуха населенного пункта для изучения уровня загрязнения фенолом с учетом расстояния от промышленной зоны, получены следующие данные (таблица 31).
Таблица 31
Уровень загрязнения воздуха фенолом
№ серии отбора проб |
Концентрации (мг/м3) на удалении |
|||
0,5 км |
1 км |
1,5 км |
2 км |
|
1 |
0,3 |
0,08 |
0,06 |
0,04 |
2 |
0,4 |
0,09 |
0,07 |
0,06 |
3 |
0,2 |
0,06 |
0,06 |
0,05 |
4 |
0,3 |
0,09 |
0,07 |
0,06 |
5 |
0,1 |
0,08 |
0,05 |
0,03 |
6 |
0,4 |
0,08 |
0,03 |
0,01 |
7 |
0,2 |
0,09 |
0,02 |
0,01 |
8 |
0,3 |
0,06 |
0,04 |
0,03 |
9 |
0,1 |
0,09 |
0,03 |
0,02 |
10 |
0,2 |
0,08 |
0,04 |
0,03 |
11 |
0,3 |
0,11 |
0,03 |
0,01 |
12 |
0,2 |
0,09 |
0,02 |
0,01 |
Требуется подтвердить влияние на уровень загрязнения фенолом фактора удаленности от промышленной зоны с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ».
Контрольные вопросы
Рекомендуемая литература:
При проведении исследования в биологии или медицине, как правило, регистрируются множество учетных признаков. Представляет интерес вопрос об их взаимном изменении, т.е. обнаружение зависимостей между ними. Выявление наличия таких взаимосвязей является одной из важнейших задач любой науки, в том числе и медицины.
Различают две формы количественных связей между явлениями или процессами: функциональную и корреляционную. Под ФУНКЦИОНАЛЬНОЙ понимают такую связь, при которой любому значению одного из признаков соответствует строго определенное значение другого. В точных науках, таких, как физика, химия и другие, может быть установлена функциональная взаимосвязь. Например, зависимость площади круга от длины окружности в геометрии, или в физике длина пути, пройденной телом в свободном падении, от времени. Наиболее известным видом функциональной зависимости является линейная, которая выражается математической формулой: y = ax+b.
В биологии и медицине установить функциональную зависимость, как правило, не удается. Объекты этих исследований имеют большую изменчивость и зависят от огромного числа факторов, измерить которые просто невозможно. В этом случае определяется наличие КОРРЕЛЯЦИОННОЙ связи, при которой значению каждой средней величины одного признака соответствует несколько значений другого взаимосвязанного с ним признака. Например: связь между ростом и массой тела человека. У группы людей с одинаковым ростом наблюдается различная масса тела, однако она варьирует в определенных пределах вокруг средней величины. Поэтому такую зависимость нужно оценивать с использованием понятия случайной величины с привлечением подходов теории вероятности. Такую форму зависимостей называют «Корреляционной».
При поиске зависимости между признаками может быть обнаружена взаимосвязь, различная по направлению и силе:
- Прямая (при увеличении одного признака увеличивается второй);
- Обратная (при увеличении одного признака второй уменьшается).
Степень взаимосвязи признаков по силе (тесноте) принято обозначать как:
- Отсутствие;
- Слабая;
- Средняя;
- Сильная;
- Полная.
Способами выявления корреляционной взаимосвязи между признаками являются:
- Визуальные (таблицы и графики).
- Статистические (корреляция и регрессия).
Следует подчеркнуть, что обнаружение корреляции между двумя признаками еще не говорит о существовании причинной связи между ними, а лишь указывает на возможность таковой или на наличие фактора, определяющего изменение обеих переменных совместно.
Приёмы визуализации данных позволяют обнаружить корреляционную зависимость лишь при небольшом числе наблюдений и только приблизительно. Для обнаружения корреляционной взаимосвязи с помощью таблицы в ней располагают ранжированные вариационные ряды и затем определяют совместное изменение признаков. График более наглядно демонстрирует такую зависимость и позволяет оценить ее форму: линейная, параболическая, тригонометрическая и др.
Наиболее точным способом обнаружения взаимосвязи между признаками является вычисление коэффициента корреляции. В зависимости от природы обрабатываемых данных применяются параметрические или непараметрические методы вычисления этого коэффициента.
При вычислении коэффициента корреляции исследователь получает возможность судить о силе связи (степени сопряженности) и ее направлении, а также с требуемой долей вероятности делать вывод о проявлении этой связи в генеральной совокупности. Чем больше коэффициент корреляции, тем с большей степенью уверенности можно говорить о наличии корреляционной зависимости между признаками. Если каждому заданному значению одного признака соответствуют близкие друг к другу, тесно расположенные около средней величины значения другого признака, то связь является более тесной. Когда эти значения сильно варьируют, связь менее тесная. Таким образом, мера корреляции указывает, насколько тесно связаны между собой параметры.
Коэффициент корреляции может принимать значения от -1 до +1. Направление обнаруженной взаимосвязи определяют по знаку коэффициента корреляции. При его положительном значении обнаруженная связь является прямой, при отрицательном обратной. Сила связи оценивается по модулю этого коэффициента. Условно выделяют следующие уровни корреляционной связи: отсутствие 0; слабая от 0 до 0,3; средняя от 0,3 до 0,7; сильная 0,7 и более; полная 1. Однако обсуждать наличие корреляции имеет смысл только в тех случаях, когда она статистически значима (p<0,05). Поэтому после вычисления коэффициента корреляции производится определение его ошибки репрезентативности и критерия достоверности.
Наиболее часто применяемыми в настоящее время методами обнаружения корреляции являются параметрический анализ по Пирсону и непараметрический анализ по Спирмену. Этими методами проверяется нулевая гипотеза (H0) об отсутствии связи между параметрами. Если такая гипотеза отклоняется при заданном уровне значимости (p), можно говорить о наличии взаимосвязи между параметрами.
Корреляционный анализ по Пирсону используется при решении задачи исследования линейной связи двух нормально распределенных параметров. Кроме проверки на нормальность распределения каждого параметра, до проведения корреляционного анализа рекомендуется строить график в координатах оцениваемых параметров, чтобы визуально определить характер зависимости.
Коэффициент корреляции Пирсона (rxy) или коэффициент линейной корреляции, был разработан в 90-х годах XIX века Карлом Пирсон, Фрэнсисом Эджуортом и Рафаэлем Уэлдоном в Англии. Он рассчитывается по формуле:
где: rxy коэффициент линейной корреляции Пирсона;
covXY ковариация признаков X и Y;
σX среднее квадратическое отклонение признака X;
σY среднее квадратическое отклонение признака Y;
средняя арифметическая признака X;
средняя арифметическая признака Y.
В медицинской литературе встречается упрощенная запись этой формулы:
где: rxy коэффициент линейной корреляции Пирсона;
dx отклонение каждой варианты признака x от средней этого признака: dx = x - Mx,
dy отклонение каждой варианты признака y от средней этого признака: dy = y - My.
В программе Excel значение коэффициент линейной корреляции Пирсона может быть вычислено функцией = КОРРЕЛ(Диапазон ячеек 1-го ряда; Диапазон ячеек 2-го ряда).
Для прогнозирования уровня корреляции в генеральной совокупности определяют ошибку репрезентативности этого коэффициента mr. Она вычисляется по формуле:
,
где: mr ошибка репрезентативности коэффициента корреляции;
rxy коэффициент линейной корреляции Пирсона;
n число парных вариант.
Достоверность коэффициента линейной корреляции оценивается по коэффициенту Стьюдента (tr), который вычисляется с использованием его ошибки:
,
где: tr коэффициент достоверности Стьюдента;
rxy коэффициент линейной корреляции Пирсона;
mr ошибка репрезентативности коэффициента корреляции.
Если число парных вариант n>30, то при tr >2 связь считается достоверной при уровне значимости p<0,05. Если число парных вариант n<30, то критическое значение tr-Крит. находят по таблице критических значений Стьюдента при степени свободы df = n - 2. В программе Excel это значение вычисляется функцией = СТЬЮДРАСПОБР(Уровень значимости p; Степени свободы df).
С целью уменьшения объема вычислений может применяться функция =КОРРЕЛ(Диапазон1; Диапазон2) или надстройка «Анализ данных» и ее модуль «Корреляционный анализ».
Отсутствие линейной корреляции еще не означает, что параметры полностью независимы. Связь между ними может быть нелинейной, или признаки, используемые в вычислениях, могут не подчиняться нормальному закону распределения. Поэтому, помимо вычисления коэффициента линейной корреляции, прибегают к использованию непараметрических коэффициентов корреляции. К ним относятся:
- Коэффициент ранговой корреляции Спирмена;
- Коэффициент ранговой корреляции Кендалла;
- Коэффициент корреляции знаков Фехнера;
- Коэффициент множественной ранговой корреляции (конкордации).
Корреляционный анализ по Спирмену применяется для обнаружения взаимосвязи двух параметров, если распределение хотя бы одного из них отлично от нормального.
Каждому показателю x и y присваивается ранг. На основе полученных рангов рассчитываются их разности d. Затем вычисляется коэффициент корреляции (ρ) по формуле:
где: коэффициент корреляции Спирмена;
d разность рангов;
n число парных вариант.
Ошибка репрезентативности коэффициента корреляции Спирмена определяется по формуле:
,
а коэффициент достоверности Стьюдента:
,
где: t коэффициент достоверности Стьюдента;
коэффициент корреляции Спирмена;
m ошибка репрезентативности коэффициента корреляции Спирмена.
Оценка коэффициента корреляции Спирмена и его достоверности выполняется так же, как и коэффициента линейной корреляции Пирсона.
Пример решения задачи на выявление корреляционной зависимости.
Условие задачи: выполнены измерения уровня запыленности на рабочих местах работников с учетом температуры в помещении (таблица 30).
Таблица 30
Результаты измерений запыленности в помещении с учетом температуры окружающей среды
Измерение на рабочем месте |
Температура воздуха Со |
Запыленность мг/м3 |
|
20 |
0,2 |
|
21 |
0,25 |
|
21 |
0,24 |
|
19 |
0,08 |
|
19 |
0,08 |
|
19 |
0,07 |
|
22 |
0,3 |
|
22 |
0,28 |
|
25 |
0,33 |
|
24 |
0,31 |
|
21 |
0,26 |
|
21 |
0,27 |
Задание: определить силу и направление зависимости между температурой окружающей среды и уровнем запыленности помещения с помощью:
а) таблицы;
б) графического изображения взаимосвязи между признаками;
в) коэффициента корреляции Пирсона;
г) коэффициента корреляции Спирмена.
Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Коррел-я». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
а) Требуется выполнить ранжирование вариационных рядов и поместить их рядом друг с другом, как показано в таблице 31, а затем проанализировать совместное возрастание или убывание значений.
Таблица 31
Ранжированные вариационные ряды
№ варианты |
Параметр x (температура воздуха, Co) |
Параметр y (запыленность, мг/м3) |
1 |
19 |
0,07 |
2 |
19 |
0,08 |
3 |
19 |
0,08 |
4 |
20 |
0,2 |
5 |
21 |
0,24 |
6 |
21 |
0,25 |
7 |
21 |
0,26 |
8 |
21 |
0,27 |
9 |
22 |
0,3 |
10 |
22 |
0,28 |
11 |
24 |
0,31 |
12 |
25 |
0,33 |
Вывод: в таблице наблюдается совместное прямое изменение двух
изучаемых параметров.
б) Построение графика и оценка формы взаимосвязи между признаками (рис. 12).
Рис. 12. Зависимость уровня запыленности от температуры воздуха в помещении.
Вывод: график зависимости совместного изменения двух изучаемых параметров показывает наличие взаимосвязи, которая приближенно оценивается как линейная.
в) Вычисление и оценка коэффициента корреляции методом Пирсона (таблица 32).
Таблица 32
Вычисление отклонений вариант от средней арифметической
Варианта № |
Температура воздуха (x) |
Запыленность мг/м3 (y) |
dx=x-Mx |
dy=y-My |
dx*dy |
dx2 |
dy2 |
1 |
19 |
0,07 |
-2,2 |
-0,153 |
0,330 |
4,7 |
0,0233 |
2 |
19 |
0,08 |
-2,2 |
-0,143 |
0,309 |
4,7 |
0,0203 |
3 |
19 |
0,08 |
-2,2 |
-0,143 |
0,309 |
4,7 |
0,0203 |
4 |
20 |
0,2 |
-1,2 |
-0,023 |
0,026 |
1,4 |
0,0005 |
5 |
21 |
0,24 |
-0,2 |
0,018 |
-0,003 |
0,0 |
0,0003 |
6 |
21 |
0,25 |
-0,2 |
0,028 |
-0,005 |
0,0 |
0,0008 |
7 |
21 |
0,26 |
-0,2 |
0,038 |
-0,006 |
0,0 |
0,0014 |
8 |
21 |
0,27 |
-0,2 |
0,048 |
-0,008 |
0,0 |
0,0023 |
9 |
22 |
0,3 |
0,8 |
0,078 |
0,065 |
0,7 |
0,0060 |
10 |
22 |
0,28 |
0,8 |
0,058 |
0,048 |
0,7 |
0,0033 |
11 |
24 |
0,31 |
2,8 |
0,088 |
0,248 |
8,0 |
0,0077 |
12 |
25 |
0,33 |
3,8 |
0,108 |
0,412 |
14,7 |
0,0116 |
Средняя (М) = |
21,2 |
0,223 |
Сумма (= |
1,725 |
39,7 |
0,0976 |
|
n= |
12 |
Коэффициент корреляции вычисляется по формуле:
= 0,88 .
В программе Excel может использоваться функция =КОРРЕЛ(Диапазон1;Диапазон2) или модуль «Корреляция» из пакета анализа, который вызывается командой «Данные» - «Анализ данных». Он производит создание таблицы «Корреляционная матрица». В ней по диагонали указаны значения коэффициента корреляции между одинаковыми признаками, выражающиеся цифрой 1, и между разными признаками в нижней части матрицы. При использовании последнего способа расчета имеется возможность вычислить коэффициенты корреляции одновременно для нескольких признаков, если выделенный диапазон данных будут включены более двух столбцов. Результат вычислений, выполненный с помощью указанного модуля, приведен в таблице 33.
Таблица 33
Вычисление корреляционной матрицы модулем «Корреляция»
|
Температура воздуха (x) |
Запыленность мг/м3 (y) |
Температура воздуха (x) |
1 |
|
Запыленность мг/м3 (y) |
0,876588407 |
1 |
Оценка достоверности коэффициента корреляции выполняется с помощью ошибки репрезентативности корреляции и критерия Стьюдента .
Ошибка репрезентативности корреляции вычисляется формулой:
= 0,152 , где: n число парных вариант.
Критерий достоверности Стьюдента для коэффициента корреляции рассчитывается по формуле:
= 5,8 > 2.
Сравнивая полученное значение критерия Стьюдента с критическим значением 2 можно оценить достоверность установленной корреляционной зависимости. При величине > 2 она считается достоверной с уровнем значимости < 0,05.
Вывод: зависимость изменения двух изучаемых параметров является сильной прямой и статистически достоверной при уровне значимости p<0,05.
г) вычисление и оценка коэффициента корреляции методом Спирмена.
В таблице вариационных рядов производится подсчет рангов как показано в таблице 34. Каждому из 12 чисел присваивается порядковый номер по возрастанию в соответствии с его значением. При этом наличие повторяющихся чисел влияет на ранг последующих чисел. Например, если в списке целых чисел трижды встречается число 19, имеющее ранг 1, число 20 будет иметь ранг 4 (ни одно из чисел не будет иметь ранги 2 и 3). Вычисление ранга в программе Excel возможно с помощью функции =РАНГ(Число; Диапазон; Порядок). Например: =РАНГ(C25;C$24:C$35;1). Затем вычисляется разность рангов, она возводится в квадрат и суммируется.
Таблица 34
Вычисление рангов и суммы квадратов их отклонений
Варианта |
Температура воздуха (x) |
Запыленность мг/м3 (y) |
Ранг x |
Ранг y |
dr = ранг x - ранг y |
dr2 |
1 |
19 |
0,07 |
1 |
1 |
0 |
0 |
2 |
19 |
0,08 |
1 |
2 |
-1 |
1 |
3 |
19 |
0,08 |
1 |
2 |
-1 |
1 |
4 |
20 |
0,2 |
4 |
4 |
0 |
0 |
5 |
21 |
0,24 |
5 |
5 |
0 |
0 |
6 |
21 |
0,25 |
5 |
6 |
-1 |
1 |
7 |
21 |
0,26 |
5 |
7 |
-2 |
4 |
8 |
21 |
0,27 |
5 |
8 |
-3 |
9 |
9 |
22 |
0,28 |
9 |
9 |
0 |
0 |
10 |
22 |
0,3 |
9 |
10 |
-1 |
1 |
11 |
24 |
0,31 |
11 |
11 |
0 |
0 |
12 |
25 |
0,33 |
12 |
12 |
0 |
0 |
=17 |
||||||
Вычисление коэффициента корреляции Спирмена: |
||||||
ρ = |
0,94 |
|||||
Вычисление ошибки репрезентативности коэффициента корреляции: |
||||||
m= |
0,107 |
|||||
Вычисление коэффициента достоверности Стьюдента для коэффициента корреляции: |
||||||
t= |
8,76 > 2. |
Вывод: корреляционная связь двух изучаемых параметров является сильной прямой и статистически достоверной при уровне значимости p<0,05.
ЗАДАНИЯ
Запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». На листе «Коррел-я», решите требуемый вариант заданий, сохраните изменения и покажите результат работы преподавателю.
Вариант 1
Выполнены измерения признаков, характеризующих температуру в помещении на рабочих местах работников предприятия и концентрацию вредных веществ (таблица 35).
Таблица 35
Данные измерений на рабочих местах предприятия
Измерение на рабочем месте |
Температура воздуха, Со |
Концентрация вещества, мг/м3 |
|
20 |
0,21 |
|
21 |
0,26 |
|
21 |
0,25 |
|
19 |
0,03 |
|
19 |
0,04 |
|
19 |
0,01 |
|
22 |
0,31 |
|
22 |
0,28 |
|
25 |
0,36 |
|
24 |
0,32 |
|
21 |
0,21 |
|
21 |
0,22 |
Определите силу и направление зависимости между температурой окружающей среды и концентрацией вредных веществ в помещении с помощью таблицы, графического изображения взаимосвязи между признаками, коэффициентов корреляции Пирсона и Спирмена, сделайте вывод.
Вариант 2
Выполнены измерения показателей физического развития школьников, характеризующих их рост стоя и объем грудной клетки (таблица 36).
Таблица 36
Данные физического развития школьников
Измерение |
Рост, см |
Объем грудной клетки, см |
|
151 |
70,8 |
|
178 |
78,2 |
|
152 |
71,1 |
|
160 |
73,2 |
|
160 |
73,3 |
|
178 |
78,2 |
|
170 |
76,1 |
|
170 |
76,3 |
|
143 |
67,5 |
|
170 |
76,1 |
|
150 |
70,5 |
|
172 |
76,6 |
Определите силу и направление зависимости между ростом и объем грудной клетки с помощью таблицы, графического изображения взаимосвязи между признаками, коэффициентов корреляции Пирсона и Спирмена, сделайте вывод.
Вариант 3
Врачом футбольной команды выполнены измерения показателей деятельности системы кровообращения и тренированности спортсменов, измерены частота пульса и систолический объем сердечного выброса (таблица 37).
Таблица 37
Данные измерений показателей деятельности сердечно-сосудистой системы спортсменов
Измерение |
Пульс, уд/мин |
Объем сердечного выброса, мл |
|
78 |
58 |
|
72 |
38 |
|
78 |
63 |
|
80 |
65 |
|
72 |
35 |
|
60 |
46 |
|
72 |
59 |
|
72 |
59 |
|
72 |
50 |
|
66 |
38 |
|
72 |
40 |
|
84 |
68 |
Определите силу и направление зависимости между пульсом и систолическим объемом с помощью таблицы, графического изображения взаимосвязи между признаками, коэффициентов корреляции Пирсона и Спирмена, сделайте вывод.
Вариант 4
В городе Н. было проведено изучение зависимости заболеваемости инфарктом миокарда по месяцам года от среднемесячной температуры воздуха (таблица 38).
Таблица 38
Заболеваемость инфарктом миокарда и температура воздуха по месяцам
Месяцы года |
Заболеваемость инфарктом миокарда (на 10000 жителей) |
Среднемесячная температура воздуха (С0) |
Январь |
1,60 |
-7,1 |
Февраль |
1,23 |
-7,7 |
Март |
1,14 |
-5,8 |
Апрель |
1,13 |
-4,1 |
Май |
1,12 |
13,0 |
Июнь |
1,02 |
14,9 |
Июль |
0,91 |
18,8 |
Август |
0,82 |
15,6 |
Сентябрь |
1,06 |
9,0 |
Октябрь |
1,22 |
6,0 |
Ноябрь |
1,33 |
-1,0 |
Декабрь |
1,40 |
-7,7 |
Определите силу и направление зависимости между заболеваемостью инфарктом миокарда и среднемесячной температурой воздуха с помощью таблицы, графического изображения взаимосвязи между признаками, коэффициентов корреляции Пирсона и Спирмена, сделайте вывод.
Вариант 5
Выполнены измерения показателей качества питьевой воды в городе Н , в том числе ее жесткость и концентрация кальция (таблица 37).
Таблица 37
Данные измерений показателей питьевой воды
№ измерения |
Жесткость воды, градусы жесткости |
Концентрация кальция в воде, мг/л |
|
4 |
28 |
|
11 |
77 |
|
27 |
191 |
|
34 |
241 |
|
8 |
56 |
|
37 |
262 |
Определите силу и направление зависимости между жесткостью воды и количеством кальция в ней с помощью таблицы, графического изображения взаимосвязи между признаками, коэффициентов корреляции Пирсона и Спирмена, сделайте вывод.
Вариант 6
Выполнены измерения показателей физического развития студенток, характеризующих их рост и объем грудной клетки (таблица 36).
Таблица 36
Данные физического развития студенток
Измерение |
Рост, см |
Объем грудной клетки, см |
|
159 |
71,8 |
|
176 |
79,6 |
|
158 |
71,5 |
|
165 |
73,2 |
|
168 |
73,4 |
|
179 |
78,2 |
|
182 |
79,1 |
|
176 |
76,3 |
|
155 |
69,5 |
|
171 |
76,1 |
|
156 |
69,5 |
|
172 |
76,6 |
Определите силу и направление зависимости между ростом и объем грудной клетки студенток с помощью таблицы, графического изображения взаимосвязи между признаками, коэффициентов корреляции Пирсона и Спирмена, сделайте вывод.
Контрольные вопросы
Рекомендуемая литература:
Метод регрессии - это статистический способ поиска функции, которая позволяет по величине одного коррелируемого признака судить о величине другого. С помощью регрессии ставится задача выяснить, как количественно меняется одна величина при изменении другой величины на единицу. Для выполнения такого прогноза требуется определить коэффициент корреляции Пирсона, с использованием которого вычисляют коэффициент регрессии (). Он участвует в создании регрессионной функции вида y=ax+b, которая применяется для прогнозирования требуемых параметров.
Коэффициент регрессии вычисляется по формуле:
,
где: Ry/x коэффициент регрессии;
rx/y коэффициент корреляции Пирсона;
σx среднее квадратическое отклонение признака x;
σy среднее квадратическое отклонение признака y.
Среднее квадратическое отклонение (сигма) вычисляется по формуле:
,
а в программе Excel функцией = СТАНДОТКЛОН(Диапазон ячеек).
Значение коэффициента регрессии () в программе Excel может быть вычислено функцией =НАКЛОН(Диапазон_y; Диапазон_х).
Формула определения значения зависимого признака:
y = My+Ry/x (x-Mx) ,
где: y зависимая переменная;
My средняя признака y;
Ry/x - коэффициент регрессии;
x - значение измеренного признака;
Mx средняя арифметическая признака x.
В программе Excel значение зависимой переменной (y) при заданном значении x может быть вычислено функцией =ПРЕДСКАЗ(x ; Диапазон_y; Диапазон_x).
После получения прогнозируемого значения (y) выполняется определение его доверительного интервала с целью экстраполяции данных на генеральную совокупность с уровнем значимости p<0,05. Для этого вычисляется сигма регрессии , которая показывает меру вариабельности зависимого признака, вычисленного по уравнению регрессии, в генеральной совокупности.
Она определяется по формуле: . Вычисление значения может производиться функцией = СТАНДОТКЛОН(Диапазон_у).
Пример прогнозирования значения одного признака по известному значению другого с помощью уравнения регрессии.
Условие задачи: на основе данных, характеризующих уровень запыленности рабочих мест (см. раздел VIII), необходимо выполнить прогноз уровня пыли при температуре воздуха 23С0.
Задание: построить уравнение регрессии для зависимости между температурой окружающей среды и уровнем запыленности помещения, создать регрессионную функцию и вычислить значение уровня пыли при температуре воздуха 23Со. Определить сигму регрессии и доверительный интервал для прогнозируемого значения уровня пыли.
Решение: запустите программу Excel, откройте файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Регрессия». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
а) первоначально требуется выполнить вычисление коэффициента корреляции Пирсона с помощью таблицы отклонений (таблица 39) или функцией =КОРРЕЛ(Диапазон1;Диапазон2).
Таблица 39
Вычисление коэффициента корреляции Пирсона
Варианта |
Температура воздуха (x) |
Запыленность мг/м3 (y) |
dx=x-Mx |
dy=y-My |
dx*dy |
dx2 |
dy2 |
1 |
19 |
0,07 |
2,2 |
0,153 |
0,330 |
4,7 |
0,0233 |
2 |
19 |
0,08 |
2,2 |
0,143 |
0,309 |
4,7 |
0,0203 |
3 |
19 |
0,08 |
2,2 |
0,143 |
0,309 |
4,7 |
0,0203 |
4 |
20 |
0,2 |
1,2 |
0,023 |
0,026 |
1,4 |
0,0005 |
5 |
21 |
0,24 |
0,2 |
-0,018 |
-0,003 |
0,0 |
0,0003 |
6 |
21 |
0,25 |
0,2 |
-0,028 |
-0,005 |
0,0 |
0,0008 |
7 |
21 |
0,26 |
0,2 |
-0,038 |
-0,006 |
0,0 |
0,0014 |
8 |
21 |
0,27 |
0,2 |
-0,048 |
-0,008 |
0,0 |
0,0023 |
9 |
22 |
0,3 |
-0,8 |
-0,078 |
0,065 |
0,7 |
0,0060 |
10 |
22 |
0,28 |
-0,8 |
-0,058 |
0,048 |
0,7 |
0,0033 |
11 |
24 |
0,31 |
-2,8 |
-0,088 |
0,248 |
8,0 |
0,0077 |
12 |
25 |
0,33 |
-3,8 |
-0,108 |
0,412 |
14,7 |
0,0116 |
Средняя (М) = |
21,2 |
0,223 |
Сумма (= |
1,725 |
39,7 |
0,0976 |
|
n= |
12 |
= КОРРЕЛ(x1:xn ; y1:yn) = 0,88 .
б) вычисление коэффициента регрессии (Ry/x):
Сигма |
σx = |
КОРЕНЬ(39,7/12) |
=СТАНДОТКЛОН(x1:xn) |
= 1,90 |
|
σy = |
КОРЕНЬ(0,0976/12) |
=СТАНДОТКЛОН(y1:yn) |
= 0,09 |
||
|
Ry/x= |
0,88*1,9/0,09 |
= 0,04 |
в) вычисление величины зависимого признака (y) при температуре 23С0:
y = My+Ry/x(x-Mx) |
При x = |
23С0 |
||
y = |
0,223+0,04(23-21,2) |
=ПРЕДСКАЗ(x ; y1:yn ; x1:xn) |
= 0,30 |
мг/м3 |
г) вычисление доверительных границ колебаний зависимого признака в генеральной совокупности:
σRy/x = |
1,9*КОРЕНЬ(1-0,882) = |
0,045 . |
|||||
Доверительные границы (2σ): |
от 0,21 |
до 0,39 |
При p<0/05 |
||||
Вывод: при температуре воздуха 23Со запыленность составит от 0,21 до 0,39мг/м3. |
ЗАДАНИЯ
Запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «СтатистикаФамилии студентов». На листе «Регрессия», решите требуемый вариант заданий, сохраните изменения и покажите результат работы преподавателю.
Вариант 1
Выполнены измерения признаков, характеризующих температуру в помещении на рабочих местах работников предприятия и концентрацию вредных веществ (см. вариант 1 заданий раздела X). Постройте уравнение регрессии для зависимости между температурой окружающей среды и концентрацией вещества в помещении. Определите значение уровня пыли при температуре воздуха 23 Со, вычислите сигму регрессии и доверительный интервал для полученного значения уровня пыли.
Вариант 2
Выполнены измерения показателей физического развития школьников, характеризующих их рост стоя и объем грудной клетки (см. вариант 2 заданий раздела IX). Постройте уравнение регрессии для зависимости между ростом и объем грудной клетки. Определите значение объема грудной клетки при росте 175 см. Вычислите сигму регрессии и доверительный интервал для полученного значения роста.
Вариант 3
Выполнены измерения показателей деятельности сердечно-сосудистой системы и тренированности спортсменов, среди них частота пульса и систолический объем сердечного выброса (см. вариант 3 заданий раздела X). Постройте уравнение регрессии для зависимости между пульсом спортсменов и систолическим объемом. Определите значение объема сердечного выброса при пульсе 75 уд/мин. Вычислите сигму регрессии и доверительный интервал для полученного значения пульса.
Вариант 4
В городе Н. было проведено изучение зависимости заболеваемости инфарктом миокарда по месяцам года в зависимости от среднемесячной температуры воздуха (см. вариант 4 заданий раздела X). Постройте уравнение регрессии для зависимости между среднемесячной температуры воздуха и уровнем заболеваемости инфарктом миокарда. Определите значение уровня заболеваемости инфарктом миокарда при температуре воздуха +10 С0. Вычислите сигму регрессии и доверительный интервал для полученного значения показателя заболеваемости.
Вариант 5
Выполнены измерения показателей качества питьевой воды в городе Н (см. вариант 5 заданий раздела X). Постройте уравнение регрессии для зависимости между жесткостью воды и количеством кальция в ней. Определите концентрацию кальция в воде с жесткостью 14оЖ. Вычислите сигму регрессии и доверительный интервал для полученного значения концентрации кальция.
Вариант 6
Выполнены измерения показателей физического развития студенток, характеризующих их рост и объем грудной клетки (см. вариант 6 заданий раздела X). Постройте уравнение регрессии для зависимости между ростом и объем грудной клетки студенток. Определите значение объема грудной клетки при росте студенток 160 см. Вычислите сигму регрессии и доверительный интервал для полученного значения объема грудной клетки.
Контрольные вопросы
Рекомендуемая литература:
а) Электронные таблицы
б) Браузеры
в) Текстовые редакторы
г) Графические редакторы
Решение: группа программ, предназначенных для создания и работы с таблицами, называется «Электронные таблицы».
Правильный ответ: а.
а) работа с упорядоченными числовыми данными, выполнение относительно несложных расчетов и создание диаграмм
б) это единственное средство проведения сложных расчетов и статистического анализа результатов научных исследований
в) создание деловой документации
г) просмотр страниц Интернет
Решение: основным назначением электронных таблиц (табличных процессоров) является работа с упорядоченными числовыми данными, выполнение относительно несложных расчетов и подготовка диаграмм.
Правильный ответ: а.
а) табличный редактор
б) текстовый редактор
в) графический редактор
г) браузер
Решение: программа Microsoft Excel является табличным редактором.
Правильный ответ: а.
а) Open Office
б) Microsoft Office
в) Star Office
г) On Note
Решение: пакет прикладных программ, в состав которого входит табличный редактор Excel, называется Microsoft Office.
Правильный ответ: б.
а) возможен, но с потерей данных
б) не возможен
в) возможен без ограничений
г) возможен, но с ограничением размера таблицы
Решение: перенос таблиц и рисунков диаграмм из программы Excel в деловые документы, создаваемые программой Word, возможен без ограничений.
Правильный ответ: в.
а) «Документ1»
б) «Книга1»
в) «Лист1»
г) «Страница1»
Решение: документ, создаваемый программой Excel, называется «Книгой», поэтому именем нового документа, которое по умолчанию присваивается табличному файлу при запуске программы и отображается в заголовке окна, является «Книга1».
Правильный ответ: б.
а) xls или xlsx
б) zip или arj
в) htm или html
г) doc или docx
Решение: именем табличные документы, создаваемые в программе Excel, обозначаются расширением «xls» (для версий до 2007) или «xlsx» (для версий 2007 и 2010).
Правильный ответ: а.
а) Главная
б) Вставка
в) Рецензирование
г) Вид
Решение: в программе Excel установка защиты части рабочей книги выполняется в режиме «Рецензирование».
Правильный ответ: в.
а) Подготовить
б) Вставка
в) Рецензирование
г) Вид
Решение: в программе Excel установка защиты файла табличного документа с назначением пароля на его открытие выполняется в режиме «Подготовить» командой «Зашифровать документ».
Правильный ответ: а.
а) сетка ячеек, предназначенных для ввода и отображения информации
б) место размещения кнопок для выполнения команд
в) строка ввода математических выражений для выполнения вычислений
г) диалоговое окно выполнения команды
Решение: элемент программы Excel, называемый рабочим листом это сетка ячеек, предназначенных для ввода и отображения информации.
Правильный ответ: а.
а) на панели инструментов
б) на корешке листа
в) в панели задач
г) в заголовке окна
Решение: в программе Excel имя рабочего листа отображается на ярлычке листа в нижней части окна.
Правильный ответ: б.
а) рабочую книгу
б) рабочую область
в) рабочую страницу
г) рабочую ячейку
Решение: в программе Excel имя рабочего листа отображается на ярлычке в нижней части окна.
Правильный ответ: а.
а) щелчком левой клавиши мыши в заголовке окна программы
б) протаскиванием движка в горизонтальной полосе прокрутки
в) щелчком левой клавиши мыши на ярлычке листа
г) щелчком правой клавиши мыши на ярлычке листа
Решение: переключение к следующему листу рабочей книги Excel производится щелчком левой клавиши мыши на ярлычке листа.
Правильный ответ: в.
а) римские цифры
б) английские буквы и их сочетание
в) специальные символы
г) русские символы и их сочетание
Решение: в программе Excel для обозначения столбцов таблицы, как правило, применяются английские буквы и их сочетание.
Правильный ответ: б.
а) арабские цифры
б) английские символы и их сочетание
в) римские цифры
г) русские символы и их сочетание
Решение: в программе Excel для обозначения строк таблицы используются арабские цифры.
Правильный ответ: а.
а) 10 столбцов и 256 строк
б) 256 столбцов и 65,5 тысяч строк
в) 65,5 тысяч столбцов и 256 тысяч строк
г) 65,5 тысяч столбцов и 65,5 тысяч строк
Решение: в программе Excel 2003 максимально возможный размер таблицы на одном листе составляет 256 столбцов и 65,5 тысяч строк.
Правильный ответ: б.
а) кнопка панели инструментов программы
б) место пересечения столбцов и строк в рабочей области экрана
в) пункт меню
г) лист в книге
Решение: в программе Excel ячейка таблицы это место пересечения столбцов и строк в рабочей области экрана.
Правильный ответ: б.
а) табличным курсором черным прямоугольником на ячейке
б) изменением размера ячейки
в) цветом текста в ячейке
г) диапазоном адресов
Решение: активная ячейка таблицы в программе Excel обозначается табличным курсором черным прямоугольником на ячейке.
Правильный ответ: а.
а) клавиши управления курсором (стрелки) клавиатуры
б) щелчок левой клавиши мыши на требуемой ячейке
в) применение клавиши Shift клавиатуры
г) протаскивание курсора мыши
Решение: способами перемещения табличного курсора в программе Excel являются клавиши управления курсором (стрелки) клавиатуры и щелчок левой клавиши мыши на ячейке.
Правильный ответ: а, б.
1
2
а) клавиша Enter клавиатуры
б) комбинация клавиш клавиатуры «Alt + Shift»
в) кнопка 1 (см.рисунок)
г) кнопка 2 (см.рисунок)
д) клавиша F1 клавиатуры
Решение: командами завершения ввода данных в ячейку B2 таблицы Excel (см.рисунок) являются клавиша Enter клавиатуры и кнопка 2.
Правильный ответ: а, г.
а) имени файла и даты его создания
б) имени владельца документа
в) буквы, обозначающей столбец, и цифры, обозначающей строку
г) формулы вычисления
Решение: адрес ячейки таблицы в программе Excel состоит из буквы, обозначающей столбец, и цифры, обозначающей строку.
Правильный ответ: в.
а) пробелом
б) двоеточием
в) запятой
г) точкой
Решение: в программе Excel дробная часть числа (десятичные знаки) отделяется от целой части запятой.
Правильный ответ: в.
а) диапазоном ячеек
б) группой ячеек
в) множеством ячеек
г) рабочей ячейкой
Решение: в программе Excel некоторое количество ячеек, обозначенных прямоугольной областью выделения, называется диапазоном ячеек и обозначается начальным и конечным адресами, разделенными двоеточием.
Правильный ответ: а.
а) зависание программы
б) появление предупреждения о замене данных
в) замена старых данных на новые без предупреждения
г) вставляемая информация добавится к существующей
Решение: если ячейка таблицы перетаскивается мышью в ячейку, содержащую данные, то происходит появление предупреждения о замене данных.
Правильный ответ: б.
а) указать курсором мыши на границу ячейки А1, нажать на левую клавишу мыши и, не отпуская ее, довести указатель мыши до ячейки С16
б) указать курсором мыши в центр ячейки А1, нажать на левую клавишу мыши и, не отпуская ее, довести указатель мыши до ячейки С16
в) щелкнуть левой клавишей мыши по ячейке А1, затем при нажатой клавише клавиатуры Ctrl щелкнуть левой клавишей мыши по ячейке С16
г) щелкнуть левой клавишей мыши по ячейке А1, затем при нажатой клавише клавиатуры Shift щелкнуть левой клавишей мыши по ячейке С16
Решение: в программе Excel выделение диапазона адресов таблицы A1:C16 (см. рисунок) выполняется следующими действиями: указать курсором мыши в центр ячейки А1, нажать на левую клавишу мыши и, не отпуская ее, довести указатель мыши до ячейки С16; или щелкнуть левой клавишей мыши по ячейке А1, затем при нажатой клавише клавиатуры Shift щелкнуть левой клавишей мыши по ячейке С16.
Правильный ответ: б, г.
а) 2 ячейки
б) 6 ячеек
в) 9 ячеек
г) 12 ячеек
Решение: в программе Excel диапазон ячеек обозначается начальным и конечным адресом, разделенным знаком двоеточия, поэтому обозначенный диапазон A1:D3 включает 4 столбца и 3 строки, то есть 12 ячеек.
Правильный ответ: г.
?
а) округления числа до одного знака после запятой
б) увеличения числа знаков, отображаемых после запятой
в) деления числа на 10
г) умножения числа на 10
Решение: указанная кнопка панели инструментов Excel (см.рисунок) используется для увеличения числа знаков, отображаемых после запятой.
Правильный ответ: б.
а) использование недопустимого типа данных, расположенных в ячейке, адрес которой указан в формуле
б) числовое значение не умещается по ширине ячейки
в) в формуле указан несуществующий или неправильный адрес ячейки
г) формула содержит вычисления включающие деление на ноль
Решение: если в программе Excel при вводе числа или формулы в ячейке отображаются знаки решетки (####), это указывает на недостаточную ширину ячейки для отображения числа. Для исправления ошибки требуется увеличить ширину столбца, уменьшить размер шрифта или его разрядность.
Правильный ответ: б.
?
?
а) протаскивание контура ячейки А1 левой клавишей мыши в ячейку D3
б) протаскивание контура ячейки А1 левой клавишей мыши при нажатой клавише клавиатуры Ctrl в ячейку D3
в) протаскивание левой клавишей мыши маркера в правом нижнем углу ячейки А1 до ячейки D3
г) выполнением команд «Вырезать» и «Вставить»
Решение: способами перемещения данных из ячейки а1 в ячейку D3 (см.рисунок) являются: протаскивание контура ячейки А1 левой клавишей мыши в ячейку D3; выполнением команд «Вырезать» и «Вставить».
Правильный ответ: а, г.
а) отображает наименование открытого листа
б) воспроизводит имя обрабатываемого файла
в) показывает адрес ячейки, обозначенной курсором и данные в ней
г) содержит служебную информацию о таблице
Решение: в программе Excel строка формул размещается в верхней части окна и показывает адрес активной ячейки, обозначенной курсором, а также данные и формулы в ней.
Правильный ответ: в.
а) в верхней части, ниже стандартной панели инструментов
б) справа, рядом с полосой прокрутки
в) внизу, над строкой состояния
г) слева, рядом с границей окна
д) в произвольном положении как отдельное окно
Решение: строка формул, как правило, расположена в верхней части окна ниже панели инструментов. Она предназначенная для ввода и редактирования в ячейках таблицы текстовых данных, чисел и формул. Данные, внесенные в активную ячейку, дополнительно отображаются в этой строке.
Правильный ответ: а.
а) ввода команд, управления программой
б) ввода и редактирования текстовых данных, чисел и формул в ячейках таблицы
в) сохранения таблицы в файле электронного документа
г) открытия страницы Интернет
Решение: строка формул, как правило, расположена в верхней части окна программы Excel. Она предназначена для ввода и редактирования в ячейках таблицы текстовых данных, чисел и формул. Данные, внесенные в активную ячейку, дополнительно отображаются в этой строке.
Правильный ответ: б.
а) адрес ячейки, обозначенной табличным курсором
б) имя обрабатываемого файла
в) наименование открытого листа
г) данные и формулы, расположенные в активной ячейке
Решение: строка формул, как правило, расположена в верхней части окна программы Excel. Она предназначена для ввода и редактирования в ячейках таблицы текстовых данных, чисел и формул. Данные, внесенные в активную ячейку, дополнительно отображаются в этой строке
Правильный ответ: а, г.
?
а) 30,5
б) 30,525
в) в зависимости от настройки программы: 30,5 или 30,525
Решение: в ячейке B1 отображено число 30,5 (см.рисунок), при этом в вычислениях используется значение 30,525.
Правильный ответ: б.
а) знака «=« (знака равенства)
б) указания адреса ячейки
в) выполнения команды «Формат»
г) сохранения документа
Решение: в программе Excel ввод формулы в ячейку таблицы начинается с «=« (знака равенства).
Правильный ответ: а.
а) любого алфавитного знака
б) «'« (апостроф)
в) «~» (тильда)
г) «=« (равно)
Решение: одной из важнейших функций электронных таблиц является создание формул, позволяющих выполнять вычисления в таблице. Формула всегда должна начинаться со знака «=« (равно). Все элементы в формулах обозначаются латинскими буквами, без пробелов.
Правильный ответ: г.
а) не возможна
б) выполняется в ячейке таблицы
в) происходит в отдельном диалоговом окне
г) выполняется в строке формул
Решение: корректировка формулы, введенной в ячейку таблицы Excel, выполняется в строке формул, которая расположена в верхней части окна ниже панели инструментов, или непосредственно в ячейке таблицы.
Правильный ответ: б, г.
а) смешанным
б) абсолютным
в) пользовательским
г) относительным
Решение: в программе Excel добавление в адрес ячейки знака денежной единицы «$», служит для указания абсолютных адресов, которые не изменяются при копировании.
Правильный ответ: б.
?
а) ввода с клавиатуры #В#1
б) ввода с клавиатуры $В$1
в) ввода с клавиатуры &В&1
г) ввода с клавиатуры &В$1
д) клавиши F4
Решение: строка формул, которая расположена в верхней части окна ниже панели инструментов, предназначенная для ввода и редактирования в ячейках таблицы текстовых данных, чисел и формул. Данные, внесенные в активную ячейку, дополнительно отображаются в этой строке. Изменение типа адреса ячейки B1 в формуле (см.рисунок) на абсолютный выполняется в строке формул с помощью ввода с клавиатуры $В$1 или клавишей F4.
Правильный ответ: б, д.
а) знак «=» (равно), а затем адреса числовых ячеек, константы и функции
б) только адреса ячеек, из которых извлекается число для вычислений
в) текстовое описание расчета
г) только функции вычислений
Решение: формула вычислений в ячейке таблицы Excel может включать знак «=» (равно), а затем адреса числовых ячеек, константы и функции.
Правильный ответ: а.
а) ввод с клавиатуры знака «=» (равно), а затем расчетной части формулы
б) ввод текста описания расчета с указанием адресов ячеек, используемых в вычислениях
в) выполнение команды «Вставить функцию» с выбором способа вычисления в «Мастере функций»
Решение: формула вычислений в ячейке таблицы Excel может быть вставлена набором с клавиатуры знака равно (=), а затем вводом адресов ячеек, констант и функций. Дополнительным способом использования формул является применение «Мастера функций», который позволяет выбрать требуемый алгоритм вычислений из списка функций.
Правильный ответ: а, в.
а) СУММ()
б) МАКС()
в) ДИСП()
г) СЧЕТ()
Решение: в программе Excel сумма значений в диапазоне ячеек может быть вычислена функцией СУММ().
Правильный ответ: а.
а) создания новой книги
б) мастера функций
в) надстроек
г) справочной системы
Решение: в программе Excel для облегчения ввода имени функции вычислений может применяться «Мастер функций», который позволяет выполнить выбор требуемой функции из соответствующей категории.
Правильный ответ: б.
а) 5
б) 12
в) 7
г) 3
Решение: в программе Excel функция МАКС служит для вычисления максимального значения в диапазоне ячеек, указанных в скобках и перечисленных через точку с запятой, поэтому в ячейке B3 будет вычислено значение 7.
Правильный ответ: в.
а) строке формул
б) панели инструментов
в) ярлыке листа
г) ячейке таблицы
Решение: в случае ввода в ячейку таблицы формулы с ошибкой, программа Excel сообщит о ней в ячейке таблицы.
Правильный ответ: г.
а) использование недопустимого типа данных, расположенных в ячейке, адрес которой указан в формуле
б) числовое значение не умещается по ширине ячейки
в) в формуле указан несуществующий или неправильный адрес ячейки
г) формула содержит вычисления включающие деление на ноль
Решение: если при вводе формулы в программе Excel в ячейке отображается ошибка #ЗНАЧ!, это указывает на использование недопустимого типа данных в формуле, например: используется адрес текстовой ячейки. Для исправления ошибки требуется изменение формулы или корректировка данных в ячейке, адрес которой используется в формуле.
Правильный ответ: а.
а) использование недопустимого типа данных, расположенных в ячейке, адрес которой указан в формуле
б) числовое значение не умещается по ширине ячейки
в) в формуле указан несуществующий или неправильный адрес ячейки
г) формула содержит вычисления включающие деление на ноль
Решение: если при вводе формулы в программе Excel в ячейке отображается ошибка #ИМЯ?, это указывает на использование несуществующего или неправильно указанного адреса ячейки. Для исправления ошибки необходимо проверить правильность обозначения адресов ячеек в формуле.
Правильный ответ: в.
а) использование недопустимого типа данных, расположенных в ячейке, адрес которой указан в формуле
б) числовое значение не умещается по ширине ячейки
в) в формуле указан несуществующий или неправильный адрес ячейки
г) формула содержит вычисления включающие деление на ноль
Решение: если при вводе формулы в программе Excel в ячейке отображается ошибка #ДЕЛ/0, это указывает на попытку деления на ноль. Для исправления ошибки необходимо проверить правильность формулы и содержимое адресов ячеек, используемых в ней.
Правильный ответ: г.
а) Главная
б) Вставка
в) Рецензирование
г) Вид
Решение: в программе Excel для создания рисунка диаграммы необходимо использовать режим «Вставка».
Правильный ответ: б.
а) Гистограмма
б) График
в) Круговая
г) Линейчатая
д) С областями
е) Точечная
ж) Рисованная
Решение: в программе Excel в режиме «Вставка» содержатся команды создания основных типов диаграмм: «Гистограмма», «График», «Круговая», «Линейчатая», «С областями» и «Точечная».
.Правильный ответ: а, б, в, г, д, е.
а) Гистограмма
б) График
в) Линейчатая
г) Круговая
Решение: диаграмма, содержащая вертикальные столбики называется «Гистограмма».
.Правильный ответ: а.
а) произвести установку модуля «Пакет анализа» из режима «Надстройки» программы
б) удалить программу Excel и произвести ее повторную стандартную установку
в) перезагрузить компьютер
Решение: для подключения к программе Excel пакета статистического анализа данных необходимо подключить модуль «Пакет анализа» из режима «Надстройки» основного меню программы.
Правильный ответ: а.
а) МЕДИАНА(…)
б) СРГАРМ(…)
в) СРЗНАЧ(…)
г) СРГЕОМ(…)
Решение: для вычисления среднего арифметического значения применяется функция срзнач(диапазон ячеек).
Правильный ответ: в.
а) наука об общих методах изучения массовых явлений
б) общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной в конкретных исторических условиях
в) универсальная наука, подвергающая количественному изучению все явления общества и природы
г) наука об особенностях деятельности медицинских учреждений в условиях рыночной экономики и страховой медицины
Решение: статистика - это общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной в конкретных исторических условиях.
Правильный ответ: б.
а) здоровье населения в целом и отдельных возрастно-половых групп;
б) выявление и установление зависимостей между уровнем здоровья и факторами окружающей среды
в) финансовые результаты деятельности медицинских учреждений
г) данные о сети, деятельности, кадрах учреждений здравоохранения
д) оценка статистической достоверности результатов медико-биологических, клинических и экспериментальных исследований
Решение: предметами изучения медицинской статистики являются: здоровье населения в целом и отдельных возрастно-половых групп; выявление и установление зависимостей между уровнем здоровья и факторами окружающей среды; данные о сети, деятельности, кадрах учреждений здравоохранения; оценка статистической достоверности результатов медико-биологических, клинических и экспериментальных исследований.
Правильный ответ: а, б, г, д.
а) отдельная социальная или биологическая единица наблюдения, подлежащая углубленному изучению и регистрации ее признаков в специальной учетной форме (бланке)
б) место или территория, где осуществляется статистическое исследование
в) статистическая совокупность, состоящая из единиц, о которых должны быть собраны статистические сведения, взятая в определенных границах времени и пространства
г) отдельное ЛПУ, в котором проводится статистическое исследование
Решение: объект статистического наблюдения это статистическая совокупность, состоящая из единиц, о которых должны быть собраны статистические сведения, взятая в определенных границах времени и пространства.
Правильный ответ: в.
а) выборочная часть детского травматизма за определенный период
б) все случаи детского уличного травматизма на определенной территории за определенный период
в) все случаи уличного травматизма на определенной территории за определенный период
г) отдельное ЛПУ, в котором лечились пострадавшие
Решение: объектом статистического исследования при изучении детского уличного травматизма является все случаи детского уличного травматизма на определенной территории за определенный период.
Правильный ответ: б.
а) составная часть объекта наблюдения, подлежащая изучению и регистрации в соответствии с программой исследования
б) явление, которое подлежит детальному изучению, и все учетные признаки которого могут быть измерены только количественно
в) явление, которое подлежит детальному изучению и его учетные признаки должны носить только качественный, описательный характер
г) место или территория, где осуществляется статистическое исследование
Решение: единица статистического наблюдения это составная часть объекта наблюдения, подлежащая изучению и регистрации в соответствии с программой исследования.
Правильный ответ: а.
а) текущим
б) нормированным
в) результативным
г) единовременным.
Решение: статистическое наблюдение может быть единовременным и текущим.
Правильный ответ: а, г.
а) сплошное
б) выборочное
г) нормированное
д) результативное
Решение: методами статистического наблюдения являются: сплошное исследование, при котором изучаются все доступные единицы наблюдения; выборочное - изучается определенная часть единиц наблюдения, наиболее полно характеризующие статистическую совокупность в целом.
Правильный ответ: а, б.
а) группа, состоящая из большого числа относительно однородных элементов (единиц наблюдения), взятых вместе в известных границах времени и пространства
б) явление, которое подлежит детальному изучению, и все учетные признаки которого могут быть измерены только количественно
в) явление, которое подлежит детальному изучению и его учетные признаки должны носить только качественный, описательный характер
г) место или территория, где осуществляется статистическое исследование
Решение: статистическая совокупность - это группа, состоящая из большого числа относительно однородных элементов (единиц наблюдения), взятых вместе в известных границах времени и пространства. Необходимо различать два основных вида статистических совокупностей: генеральная и выборочная.
Правильный ответ: а.
а) явление, которое подлежит детальному изучению, и все учетные признаки которого могут быть измерены только количественно
б) явление, которое подлежит детальному изучению и его учетные признаки должны носить только качественный, описательный характер
в) место или территория, где осуществляется статистическое исследование
г) набор всех возможных единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования
Решение: генеральная статистическая совокупность состоит из всех возможных единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования.
Правильный ответ: г.
а) явление, которое подлежит детальному изучению, и все учетные признаки которого могут быть измерены только количественно
б) часть генеральной совокупности, отобранная специальным методом и предназначенная для характеристики генеральной совокупности
в) место или территория, где осуществляется статистическое исследование
г) набор всех возможных единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования
Решение: выборочная статистическая совокупность это часть генеральной совокупности, отобранная специальным методом и предназначенная для характеристики генеральной совокупности.
Правильный ответ: б.
а) совокупность математических критериев, используемых при статистическом исследовании
б) медико-биологические характеристики, регистрируемые у единицы наблюдения в соответствии с целями и задачами исследования
в) относительные величины, сгруппированные по определенным признакам в статистическую таблицу
г) статистические показатели, характеризующие изучаемое явление
Решение: учетные признаки - это медико-биологические характеристики, регистрируемые у единицы наблюдения в соответствии с целями и задачами исследования.
Правильный ответ: б.
а) сходства
б) различия
в) факторные
г) результативные
д) интервальные
Решение: в медико-биологических исследованиях используются учетные признаки: сходства, различия, факторные, результативные.
Правильный ответ: а, б, в, г.
а) непрерывные
б) качественные (описательные или атрибутивные)
в) ранжированные
г) количественные
Решение: в медико-биологических исследованиях встречаются следующие типы учетных признаков: качественные (описательные или атрибутивные) выражающие словом изучаемое свойство, и количественные демонстрирующие числом уровень признака.
Правильный ответ: б, г.
а) статистическое наблюдение
б) разработка программы и составление плана статистического исследования
в) анализ результатов исследования
г) группировка и разработка статистического материала
Решение: последовательность этапов статистического исследования состоит из: 1-й - разработка программы и составление плана статистического исследования; 2-й - статистическое наблюдение; 3-й - группировка и разработка статистического материала; 4-й - анализ результатов исследования.
Правильный ответ: 1-б, 2-а, 3-г, 4-в.
а) вычисление статистических показателей;
б) сопоставление статистических данных;
в) графическое изображение показателей;
г) шифровка (кодирование) статистического материала;
д) выявление закономерностей в изучаемых явлениях;
е) обобщение результатов исследования;
ж) группировка статистического материала;
з) составление плана исследования;
и) подготовка программы исследования.
Решение: основными видами работ на первом этапе статистического исследования являются составление плана и подготовка программы исследования.
Правильный ответ: з, и.
а) установление качественных и количественных закономерностей в изучаемых явлениях
б) составление статистических таблиц с результатами сбора материала;
в) вопросы: что и в каком направлении изучать, с обозначением объекта и единиц наблюдения, учетных признаков, методов сбора, разработки и анализа материала
г) вопросы: где, когда, кто и как выполняет исследование
д) вопросы контроля за однородностью статистической совокупности и правила составления статистических таблиц
Решение: план статистического исследования включает вопросы: где, когда, кто и как выполняет исследование.
Правильный ответ: г.
а) установление качественных и количественных закономерностей в изучаемых явлениях
б) составление статистических таблиц с результатами сбора материала
в) вопросы: что и в каком направлении изучать, с обозначением объекта и единиц наблюдения, учетных признаков, методов сбора, разработки и анализа материала
г) вопросы: где, когда, кто и как выполняет исследование
д) вопросы контроля за однородностью статистической совокупности и правила составления статистических таблиц
Решение: программа исследования включает вопросы: что и в каком направлении изучать, с обозначением объекта и единиц наблюдения, учетных признаков, методов сбора, разработки и анализа материала.
Правильный ответ: в.
а) на первом этапе
б) на втором этапе
в) на третьем этапе
г) на четвертом этапе
Решение: составление плана и программы производится на первом этапе статистического исследования.
Правильный ответ: а.
а) вычисление статистических показателей;
б) сбор материала по программе исследования;
в) графическое изображение показателей;
г) шифровка (кодирование) статистического материала;
д) выявление закономерностей в изучаемых явлениях;
е) обобщение результатов исследования;
ж) группировка статистического материала;
з) составление плана и программы исследования.
Решение: основным видом работ на втором этапе статистического исследования является сбор материала в соответствии с программой исследования.
Правильный ответ: б.
а) шифровка (кодирование) статистического материала
б) сбор материала по программе исследования
в) группировка статистического материала
г) вычисление статистических показателей
д) выявление закономерностей в изучаемых явлениях
е) обобщение результатов исследования
ж) графическое изображение данных
з) составление плана и программы исследования
Решение: основными видами работ на третьем этапе статистического исследования являются: шифровка (кодирование) статистического материала; группировка; вычисление статистических показателей; графическое изображение данных.
Правильный ответ: а, в, г, ж.
а) на втором этапе
б) на первом этапе
в) на третьем этапе
г) на четвертом этапе
д) на всех этапах
Решение: при проведении статистического исследования вычисление показателей, а также графическое представление материала выполняются на третьем этапе.
Правильный ответ: в.
а) вариационная
б) абсолютная
в) типологическая
г) относительная
Решение: основными видами группировок единиц наблюдения являются вариационная и типологическая.
Правильный ответ: а, в.
а) вычисление статистических показателей
б) сопоставление статистических данных
в) графическое изображение показателей
г) шифровка (кодирование) статистического материала
д) выявление закономерностей в изучаемых явлениях
е) обобщение результатов исследования
ж) группировка статистического материала
Решение: основными видами работ на четвертом этапе статистического исследования являются: сопоставление статистических данных; выявление закономерностей в изучаемых явлениях; обобщение результатов исследования.
Правильный ответ: б, д, е.
а) на втором этапе
б) на первом этапе
в) на третьем этапе
г) на четвертом этапе
д) на всех этапах
Решение: при проведении статистического исследования обобщение полученных данных, формирование выводов и предложений выполняется на четвертом этапе.
Правильный ответ: г.
а) ознакомление аудитории с его результатами (лекции, доклады, семинары)
б) выпуск методических рекомендаций, приказов и инструкций
в) реорганизация деятельности лечебных учреждений
г) получение прибыли от оказания платных медицинских услуг
д) рационализаторские предложения, изобретения, открытия
Решение: основными вариантами практического использования результатов медико-социального исследования являются: ознакомление аудитории с его результатами (лекции, доклады, семинары); выпуск методических рекомендаций, приказов и инструкций; реорганизация деятельности лечебных учреждений; рационализаторские предложения, изобретения, открытия.
Правильный ответ: а, б, в, д.
а) простая
б) групповая
в) моментная
г) комбинационная
д) взвешенная
Решение: видами статистических таблиц являются: простая; групповая; комбинационная.
Правильный ответ: а, б, г.
а) табличная последовательность
б) табличное подлежащее
в) табличные подразделы
г) табличное сказуемое
д) табличное распределение
Решение: основными элементами статистических таблиц являются табличное подлежащее и табличное сказуемое.
Правильный ответ: б, г.
а) простой
б) групповой
в) вариационной
г) комбинационной
Решение: статистическая таблица, в которой представлена сводка данных по одному признаку, называется простой.
Правильный ответ: а.
а) простой
б) групповой
в) вариационной
г) комбинационной
Решение: статистическая таблица, в которой представлены данные по двум связанным между собой признакам, называется групповой.
Правильный ответ: б.
а) один
б) два
в) три
г) четыре и более
Решение: в групповой таблице представлены два связанных между собой признака.
Правильный ответ: б.
а) простой
б) групповой
в) вариационной
г) комбинационной
д) выборочной
Решение: статистическая таблица, в которой представлены данные по трем и более связанным между собой признакам, называется комбинационной.
Правильный ответ: г.
Причины смерти по данным
патологоанатомических вскрытий
Заболевания |
Число патологоанатомических вскрытий |
Инфаркт миокарда |
394 |
Язвенная болезнь желудка |
80 |
Кардиосклероз |
156 |
Рак легкого |
200 |
Итого: |
830 |
а) простой
б) групповой
в) вариационной
г) комбинационной
д) выборочной
Решение: таблица, показанная на рисунке, является простой т.к. в ней содержится сводка данных по одному признаку (число патологоанатомических вскрытий).
Правильный ответ: а.
Причины смерти по данным
патологоанатомических вскрытий
Заболевания |
Число несовпадений диагнозов |
||
Пол |
Всего |
||
М |
Ж |
||
Инфаркт миокарда |
20 |
44 |
64 |
Язвенная болезнь желудка |
10 |
12 |
22 |
кардиосклероз |
22 |
14 |
36 |
Рак легкого |
20 |
20 |
40 |
Итого: |
72 |
90 |
162 |
а) простой
б) групповой
в) вариационной
г) комбинационной
д) выборочной
Решение: таблица, показанная на рисунке, является групповой т.к. в ней содержится сводка данных по двум связанным признакам (несовпадение диагнозов при вскрытии и пол).
Правильный ответ: б.
Причины смерти по данным
патологоанатомических вскрытий
Заболевания |
Возраст |
Всего |
||||||
0-16 лет |
17-60 лет |
61 и более |
||||||
М |
Ж |
М |
Ж |
М |
Ж |
М |
Ж |
|
Инфаркт миокарда |
0 |
0 |
10 |
22 |
42 |
64 |
52 |
86 |
Язвенная болезнь желудка |
0 |
0 |
20 |
6 |
18 |
22 |
38 |
28 |
Кардиосклероз |
2 |
4 |
5 |
15 |
16 |
36 |
23 |
55 |
Рак легкого |
0 |
0 |
15 |
25 |
35 |
40 |
50 |
65 |
Итого: |
2 |
4 |
50 |
68 |
111 |
162 |
163 |
234 |
а) простой
б) групповой
в) вариационной
г) комбинационной
д) выборочной
Решение: таблица, показанная на рисунке, является комбинационной т.к. в ней содержится сводка данных по трем связанным признакам (число вскрытий, пол и возраст).
Правильный ответ: г.
а) название таблицы
б) номер таблицы
в) итоговые данные
г) отсутствие пустых ячеек
д) одинаковые размеры ячеек
Решение: основными требованиями, предъявляемыми к статистическим таблицам, являются: наличие названия таблицы расположенное на дней, номер таблицы; итоги по столбцам и строкам; отсутствие пустых ячеек.
Правильный ответ: а, б, в, г.
а) абсолютные
б) интенсивные
в) экстенсивные
г) соотношения
д) динамические
е) простые
Решение: видами статистических величин, которые используются при выполнении медико-биологических исследований, являются: абсолютные, интенсивные, экстенсивные, соотношения и динамические величины.
Правильный ответ: а, б, в, г, д.
СОВПАДЕНИЕ ДИАГНОЗОВ ЛПУ С ДАННЫМИ ПАТОЛОГОАНАТОМИЧЕСКИХ ВСКРЫТИЙ
Причины смерти по данным ЛПУ |
Число пат. анатомических вскрытий |
Число несовпадений диагнозов |
Инфаркт миокарда |
394 |
64 |
Язвенная болезнь желудка |
80 |
22 |
Кардиосклероз |
156 |
36 |
Итого: |
830 |
162 |
а) абсолютные
б) интенсивные
в) экстенсивные
г) относительные
Решение: таблица, показанная на рисунке, содержит абсолютные величины.
Правильный ответ: а.
а) сравнения статистических совокупностей
б) оценки вариабельность признака
в) определения достоверности различий между средними величинами
Решение: относительные величины применяются для сравнения статистических совокупностей.
Правильный ответ: а.
а) часть изучаемого явления во всей его совокупности (структуру явления)
б) частоту (распространенность) явления в изучаемой среде
в) количественные изменения изучаемого явления во времени
г) численное соотношение 2-х не связанных между собой совокупностей
Решение: экстенсивные относительные величины (показатели) характеризуют часть изучаемого явления во всей его совокупности (структуру явления).
Правильный ответ: а.
а) часть изучаемого явления во всей его совокупности (структуру явления)
б) частоту (распространенность) явления в изучаемой среде
в) количественные изменения изучаемого явления во времени
г) численное соотношение 2-х не связанных между собой совокупностей
Решение: интенсивные относительные величины (показатели) характеризуют частоту (распространенность) явления в изучаемой среде.
Правильный ответ: б.
а) часть изучаемого явления во всей его совокупности (структуру явления)
б) частоту (распространенность) явления в изучаемой среде
в) количественные изменения изучаемого явления во времени
г) численное соотношение 2-х не связанных между собой совокупностей
Решение: показатели соотношения характеризуют численное соотношение 2-х не связанных между собой совокупностей.
Правильный ответ: г.
а) экстенсивный показатель
б) интенсивный показатель
в) показатель соотношения
г) показатель наглядности
Решение: частоту (распространенность) явления характеризует интенсивный показатель.
Правильный ответ: б.
а) для сравнения изменений величин изучаемого явления во времени по отношению к исходному уровню
б) для характеристики структуры явления
в) для определения распространенности явления
Решение: показатель наглядности используется для сравнения изменений величин изучаемого явления во времени по отношению к исходному уровню.
Правильный ответ: а.
а) доля заболеваний органов дыхания в общей массе заболеваний;
б) обеспеченность населения больничными койками;
в) заболеваемость дифтерией на 1000 жителей;
г) рост числа заболеваний в текущем году по отношению к предыдущему.
Решение: из перечисленных показателей экстенсивным является доля заболеваний органов дыхания в общей массе заболеваний.
Правильный ответ: а.
а) показатели соотношения
б) интенсивные показатели
в) экстенсивные показатели
г) показатели наглядности
Решение: для определения структуры заболеваемости применяются экстенсивные показатели.
Правильный ответ: в.
а) доля заболеваний органов дыхания от общего числа заболеваний
б) обеспеченность населения больничными койками
в) заболеваемость дифтерией на 1000 жителей
г) рост числа заболеваний в текущем году по отношению к предыдущему
Решение: обеспеченность населения больничными койками является показателем соотношения.
Правильный ответ: б.
а) (ЧСЗ*1000)/ЧВ
б) (ЧСЗ*ЧЖ)/1000
в) (ЧСЗ*1000)/ЧЖ
г) (ЧЖ*1000)/ЧСЗ
Решение: формула вычисления интенсивного показателя, характеризующего уровень заболеваемости населения: (ЧСЗ*1000)/ЧЖ, (условные обозначения: ЧСЗ - число случаев заболевания, ЧЖ - число жителей населенного пункта, ЧВ - число врачей).
Правильный ответ: в.
а) доля заболеваний органов дыхания от общего числа заболеваний;
б) обеспеченность населения больничными койками;
в) заболеваемость населения гриппом на 1000 жителей;
г) рост числа заболеваний в текущем году по отношению к предыдущему.
Решение: показателем наглядности является рост числа заболеваний в текущем году по отношению к предыдущему.
Правильный ответ: г.
а) часть изучаемого явления во всей его совокупности (структуру явления)
б) частоту (распространенность) явления в изучаемой среде
в) количественные изменения изучаемого явления во времени
г) численное соотношение 2-х не связанных между собой совокупностей
Решение: динамические показатели характеризуют количественные изменения изучаемого явления во времени.
Правильный ответ: в.
УТОЧНЕНИЕ ПРИЧИН СМЕРТИ ПО ДАННЫМ ПАТОЛОГОАНАТОМИЧЕСКИХ ВСКРЫТИЙ
Причины смерти по данным ЛПУ |
Число пат.анат. вскрытий |
Число несовпадений диагнозов |
Инфаркт миокарда |
394 |
64 |
Язвенная болезнь желудка |
80 |
22 |
Кардиосклероз |
156 |
36 |
Рак легкого |
200 |
40 |
Итого: |
830 |
162 |
а) интенсивным
б) наглядности
в) средним величинам
г) экстенсивным
д) соотношения
Решение: показатели, которые можно вычислить при анализе качества диагностики по результатам вскрытий (см.таблицу), относятся к экстенсивным относительным величинам.
Правильный ответ: г.
а) секторная диаграмма
б) столбиковая диаграмма
в) внутристолбиковая диаграмма
г) линейная диаграмма
д) радиальная диаграмма
Решение: для графического изображения интенсивных показателей, как правило, используются столбиковая и линейная диаграммы.
Правильный ответ: б, г.
а) секторная диаграмма
б) столбиковая диаграмма
в) внутристолбиковая диаграмма
г) линейная диаграмма
д) радиальная диаграмма
Решение: для графического изображения экстенсивных показателей используются секторная и внутристолбиковая диаграммы.
Правильный ответ: а, в.
а) секторная диаграмма
б) столбиковая диаграмма
в) внутристолбиковая диаграмма
г) линейная диаграмма
д) картограмма
Решение: для графического изображения динамического ряда используются столбиковая и линейная диаграммы.
Правильный ответ: б, г.
а) секторная диаграмма
б) столбиковая диаграмма
в) радиальная диаграмма
г) линейная диаграмма
д) картограмма
Решение: для графического изображения циклических процессов используется радиальная диаграмма.
Правильный ответ: в.
а) круг, разделенный на секторы, с цветной штриховкой
б) столбики с различной штриховкой
в) географическая карта с различной штриховкой
г) географическая карта с нанесенными на нее диаграммами
Решение: картограмма - это географическая карта с различной штриховкой.
Правильный ответ: в.
а) круг, разделенный на секторы, с цветной штриховкой
б) столбики с различной штриховкой
в) географическая карта с различной штриховкой
г) географическая карта с нанесенными на нее диаграммами
Решение: картодиаграмма - это географическая карта с нанесенными на нее диаграммами.
Правильный ответ: г.
а) название диаграммы
б) номер рисунка
в) наличие имени автора диаграммы
г) наличие количественного определителя представленных явлений рядом с диаграммой
Решение: основными требованиями, предъявляемыми к диаграммам, являются: название, помещаемое под рисунком; его порядковый номер; наличие количественного определителя представленных явлений рядом с диаграммой.
Правильный ответ: а, б, г.
а) изучение состояния здоровья населения
б) анализ демографической ситуации
в) оценка деятельности лечебных учреждений
г) санитарно-эпидемиологические исследования
д) изучение экономических аспектов здравоохранения
е) рентгенографические исследования
Решение: области возможного использования средних величин: изучение состояния здоровья населения; анализ демографической ситуации; оценка деятельности лечебных учреждений; санитарно-эпидемиологические исследования; изучение экономических аспектов здравоохранения.
Правильный ответ: а, б, в, г, д.
а) однородная в качественном отношении статистическая совокупность, отдельные единицы которой характеризуют количественные различия изучаемого признака или явления
б) ряд чисел, сгруппированных в таблицу и полученных при измерении изучаемого признака у единиц наблюдения в соответствии с планом и программой исследования
в) количественное выражение изучаемого признака
Решение: вариационный ряд это однородная в качественном отношении статистическая совокупность, отдельные единицы которой характеризуют количественные различия изучаемого признака или явления.
Правильный ответ: а.
а) V варианта
б) p частота повторений варианты
в) n общее число наблюдений
г) m ошибка репрезентативности
д) σ среднее квадратическое отклонение
Решение: к обозначениям элементов вариационного ряда относятся: V варианта; p частота повторений варианты; n общее число наблюдений.
Правильный ответ: а, б, в.
а) число, указывающее, сколько раз встречается отдельная варианта в вариационном ряду, обозначаемое «p»
б) общее число наблюдений в вариационном ряду, обозначаемое «n»
в) варианта, расположенная в середине вариационного ряда, упорядоченного по возрастанию или убыванию, обозначаемая «Mе»
Решение: частота повторений варианты - это число, указывающее, сколько раз встречается отдельная варианта в вариационном ряду, обозначаемое «p».
Правильный ответ: а.
а) простой
б) ранжированный
в) сгруппированный
г) дискретный (прерывный)
д) непрерывный
е) интервальный
ж) сложный
з) репрезентативный
Решение: различают следующие виды вариационных рядов: простой, ранжированный, сгруппированный, дискретный (прерывный), непрерывный, интервальный.
Правильный ответ: а, б, в, г, д, е.
а) указано, сколько раз встречается каждая варианта
б) варианты расположены в порядке возрастания и указана Mо (мода)
в) варианты расположены в порядке возрастания или убывания
г) каждая варианта встречается только один раз
Решение: вариационный ряд называется простым, если в нем каждая варианта встречается только один раз.
Правильный ответ: г.
а) указано, сколько раз встречается каждая варианта
б) имеются варианты из двух разнородных совокупностей
в) имеются варианты из трех и более разнородных совокупностей
г) каждая варианта встречается только один раз
Решение: вариационный ряд называется сгруппированным, если в нем указано, сколько раз встречается каждая варианта.
Правильный ответ: а.
а) указано, сколько раз встречается каждая варианта
б) варианты расположены в порядке возрастания
в) варианты расположены в порядке убывания
г) каждая варианта встречается только один раз
Решение: вариационный ряд называется ранжированным, если в нем варианты расположены в порядке возрастания или убывания.
Правильный ответ: б, в.
а) указано, сколько раз встречается каждая варианта
б) варианты расположены в порядке возрастания
в) варианты представлены только целыми числами
г) варианты сгруппированы по величине
Решение: вариационный ряд называется дискретным, если в нем варианты представлены только целыми числами.
Правильный ответ: в.
а) указано, сколько раз встречается каждая варианта
б) варианты расположены в порядке возрастания
в) варианты представлены только целыми числами
г) варианты представлены любыми числовыми значениями
д) варианты сгруппированы по величине
Решение: вариационный ряд называется непрерывным, если в нем варианты представлены любыми числовыми значениями.
Правильный ответ: г.
а) средняя арифметическая
б) мода
в) медиана
г) амплитуда
д) коэффициент вариации
Решение: общими характеристиками значений вариант вариационного ряда являются: средняя арифметическая, мода и медиана.
Правильный ответ: а, б, в.
а) максимальная величина признака в вариационном ряду, характеризующая наивысший уровень явления в статистической совокупности
б) общая количественная характеристика изучаемого признака в вариационном ряду, рассчитанная в качественно однородной статистической совокупности
в) общая характеристика всех признаков статистической совокупности
Решение: средняя арифметическая величина вариационного ряда это общая количественная характеристика изучаемого признака в вариационном ряду, рассчитанная в качественно однородной статистической совокупности.
Правильный ответ: б.
а) частоту явления
б) структуру явления
в) обобщенную количественную характеристика изучаемого признака
Решение: средняя арифметическая величина вариационного ряда показывает обобщенную количественную характеристика изучаемого признака.
Правильный ответ: в.
а) простым
б) взвешенным
в) способом моментов
г) дискретным
д) непрерывным
е) сгруппированным
Решение: средняя арифметическая вычисляется следующими способами: простым, взвешенным, способом моментов.
Правильный ответ: а, б, в.
а) σ
б) n
в) М
г) m
д) r
е) t
Решение: средняя арифметическая обозначается знаком «М».
Правильный ответ: в.
а) σ
б) n
в) М
г) m
д) V
е) t
Решение: варианты в вариационном ряду обозначаются знаком «V».
Правильный ответ: д.
а) σ
б) n
в) М
г) p
д) V
е) t
Решение: частота встречаемости варианты в вариационном ряду обозначается знаком «p».
Правильный ответ: д.
а) σ
б) n
в) М
г) m
д) p
е) t
Решение: число наблюдений в вариационном ряду обозначается знаком »n».
Правильный ответ: б.
а)
б)
в)
г)
Решение: простая средняя арифметическая вычисляется по формуле: .
Правильный ответ: а.
а)
б)
в)
Решение: взвешенная средняя арифметическая вычисляется по формуле: .
Правильный ответ: а.
а) сумма всех отклонений от средней равна 0
б) при умножении (делении) всех вариант на один и тот же множитель (делитель) средняя арифметическая умножается (делится) на тот же множитель (делитель)
в) если прибавить (вычесть) ко всем вариантам одно и то же число, средняя арифметическая увеличивается (уменьшается) на то же число
г) может быть только целым числом
д) может быть только положительным числом
Решение: основными свойствами средней арифметической величины являются: сумма всех отклонений от средней равна 0; при умножении (делении) всех вариант на один и тот же множитель (делитель) средняя арифметическая умножается (делится) на тот же множитель (делитель); если прибавить (вычесть) ко всем вариантам одно и то же число, средняя арифметическая увеличивается (уменьшается) на то же число.
Правильный ответ: а, б, в.
а) медианой (Ме)
б) средней арифметической (М)
в) модой (Мо)
г) средним квадратическим отклонением
Решение: величина, наиболее часто встречающаяся в вариационном ряду, называется медианой (Мо).
Правильный ответ: в.
а) наибольшая по значению варианта вариационного ряда
б) варианта, встречающаяся чаще других в вариационном ряду
в) центральная варианта, делящая ранжированный вариационный ряд пополам
Решение: медиана вариационного ряда (Ме) это центральная варианта, делящая ранжированный вариационный ряд пополам.
Правильный ответ: в.
Решение: средняя величина вариационного ряда, которая определяется как наиболее часто встречающаяся варианта, называется «Мода».
Правильный ответ: мода.
Решение: средняя величина вариационного ряда, которая определяется как варианта, занимающая срединное положение в ранжированном вариационном ряду, называется «Медиана».
Правильный ответ: медиана.
а) M
б) m
в) Аm
г) r
д) t
е) σ
Решение: амплитуда вариационного ряда обозначается знаком «Аm».
Правильный ответ: в.
а)
б) Am = Vmax - Vmin
в)
Решение: амплитуда вариационного ряда вычисляется по формуле: Am = Vmax - Vmin .
Правильный ответ: б.
а) M
б) m
в) Аm
г) r
д) t
е) σ
Решение: среднее квадратическое отклонение обозначается знаком «σ».
Правильный ответ: е.
а) возможные отклонения параметров генеральной совокупности по сравнению с выборочной совокупностью
б) разницу между вариантой и средней арифметической
в) среднее отклонение всех вариант вариационного ряда от средней арифметической
Решение: среднее квадратическое отклонение характеризует среднее отклонение всех вариант вариационного ряда от средней арифметической.
Правильный ответ: в.
а) простым
б) как средневзвешенное
в) способом моментов
г) прямым
д) обратным
Решение: среднее квадратическое отклонение может рассчитываться следующими способами: простым; как средневзвешенное; способом моментов.
Правильный ответ: а, б, в.
а) ошибка репрезентативности
б) среднее квадратическое отклонение
в) коэффициент вариации
г) критерий Стьюдента
д) коэффициент корреляции
Решение: статистический критерий, которым сравнивают разнообразие вариационных рядов, если единицы измерения вариант в них различны, называется «Коэффициент вариации».
Правильный ответ: в.
а)
б)
в)
Решение: формула вычисления коэффициента вариации: .
Правильный ответ: б.
а) малой
б) средней
в) сильной
Решение: степень рассеяния вариант вокруг средней арифметической, если значение коэффициента вариации до 10%, является малой.
Правильный ответ: а.
а) малой
б) средней
в) сильной
Решение: степень рассеяния вариант вокруг средней арифметической, если значение коэффициента вариации от 10 до 20%, является средней.
Правильный ответ: б.
а) малой
б) средней
в) сильной
Решение: степень рассеяния вариант вокруг средней арифметической, если значение коэффициента вариации более 20%, является сильной.
Правильный ответ: в.
а) правило отбора единиц наблюдения в статистическую совокупность
б) вероятностная зависимость между значением средней арифметической, средним квадратическим отклонением и вариантами
в) отношение средней величины к среднему квадратическому отклонению
Решение: «Правило трех сигм» - это вероятностная зависимость между значением средней арифметической, средним квадратическим отклонением и вариантами.
Правильный ответ: б.
а) размах колебаний средней арифметической изучаемого признака, который можно оценить статистическими методами
б) разница между максимальной и минимальной вариантами
в) разница между средним квадратическим отклонением и ошибкой репрезентативности
г) отношение средней величины к среднему квадратическому отклонению
Решение: доверительный интервал это размах колебаний средней арифметической изучаемого признака, который можно оценить статистическими методами.
Правильный ответ: а.
а) генеральной
б) выборочной
Решение: свойство репрезентативности характерно для выборочной статистической совокупности.
Правильный ответ: б.
а) соответствие средней арифметической величины выборочной совокупности аналогичному параметру генеральной совокупности
б) понятие, характеризующее связь между признаками
в) характеристика методики исследования
Решение: репрезентативность это соответствие средней арифметической величины выборочной совокупности аналогичному параметру генеральной совокупности.
Правильный ответ: а.
а) увеличивается
б) остается без изменений
в) уменьшается
Решение: с увеличением объема наблюдений ошибка репрезентативности уменьшается.
Правильный ответ: в.
а) является мерой изменчивости значения средней арифметической, которая может быть получена при повторных исследованиях
б) позволяет с определенной вероятностью перенести результаты изучения признака в выборочной совокупности на генеральную совокупность
в) служит оценкой рассеяния вариант
Решение: ошибка репрезентативности: является мерой изменчивости значения средней арифметической, которая может быть получена при повторных исследованиях и позволяет с определенной вероятностью перенести результаты изучения признака в выборочной совокупности на генеральную совокупность.
Правильный ответ: а, б.
а) коэффициента корреляции
б) среднего квадратического отклонения
в) ошибки репрезентативности
Решение: степень совпадения выборочной совокупности с генеральной оценивается с помощью ошибки репрезентативности.
Правильный ответ: в.
а) соответствующим числом единиц наблюдения
б) стандартизацией
в) случайностью отбора единиц наблюдения
г) кодированием единиц наблюдения
Решение: репрезентативность выборочной совокупности обеспечивается соответствующим числом единиц наблюдения, а также случайностью отбора единиц наблюдения.
Правильный ответ: а, в.
а)
б)
в)
г)
Решение: формула вычисления среднего квадратического отклонения:
Правильный ответ: б.
а)
б)
в)
г)
Решение: формула вычисления ошибки репрезентативности в вариационном ряду: .
Правильный ответ: а.
а)
б)
в)
г)
Решение: формула вычисления ошибки репрезентативности для относительных величин: .
Правильный ответ: б.
а) числа наблюдений
б) среднего квадратического отклонения
в) коэффициента корреляции
г) критерия Стьюдента
Решение: величина ошибки репрезентативности зависит от среднего квадратического отклонения и числа наблюдений.
Правильный ответ: а, б.
а) арифметических ошибок вычислений
б) ошибок степени точности вычисления (округления чисел)
в) методических ошибок организации исследования
г) ошибок репрезентативности
Решение: при проведении медико-социальных исследований в выборочной совокупности невозможно избежать ошибок репрезентативности.
Правильный ответ: г.
а) увеличить
б) уменьшить
в) оставить без изменения
Решение: чтобы уменьшить ошибку репрезентативности, число наблюдений необходимо увеличить.
Правильный ответ: а.
а) меньше
б) больше
Решение: чем меньше число наблюдений, тем величина ошибки репрезентативности больше.
Правильный ответ: б.
а) меньше
б) больше
Решение: чем меньше вариабельность признака, тем величина средней ошибки меньше.
Правильный ответ: а.
а) вероятностная оценка возможных отклонений, в пределах которых может колебаться искомая средняя величина признака при повторных исследованиях
б) разница между максимальной и минимальной вариантами
в) разница между средним квадратическим отклонением и ошибкой репрезентативности
г) отношение средней величины к среднему квадратическому отклонению
Решение: доверительные границы - это вероятностная оценка возможных отклонений, в пределах которых может колебаться искомая средняя величина признака при повторных исследованиях.
Правильный ответ: а.
а) М ± 1m, вероятность 68,3%
б) М ± 2m, вероятность 95,5%
в) М ± 3m, вероятность 99,9%
Решение: доверительные границы средней арифметической с вероятностью 95,5%, достаточной для медико-биологических исследований, вычисляются по формуле М ± 2m.
Правильный ответ: б.
а) 68%
б) 90%
в) 92%
г) 95%
Решение: вероятность безошибочного прогноза для медико-биологических исследований составляет 95%.
Правильный ответ: г.
а) 37 - 43кг
б) 31 - 49кг
в) 39 - 42кг
Решение: рассеяние вариант вокруг средней арифметической с вероятностью 99,7% определяется в интервале М ± 3σ, если известно, что м=40,0кг, а σ=3,0кг, то крайние варианты вариационного ряда, с вероятностью прогноза 99,7%, будут находиться в диапазоне от 31 до 49кг.
Правильный ответ: б.
а) M ± m
б) M ± 2m
в) M ± 3m
Решение: границы возможных случайных колебаний средней величины в генеральной совокупности с вероятностью прогноза 95,5 % лежат в пределах M ± 2m.
Правильный ответ: б.
а) 68,3%
б) 95,5%
в) 99,7%
г) 100%
Решение: доверительный интервал м±3m соответствует вероятности прогноза 99,7%.
Правильный ответ: в.
а) ошибки репрезентативности
б) коэффициента вариации
в) средней арифметической
г) критерия Стьюдента
Решение: для признаков, подчиняющихся нормальному закону распределения, достоверность различия двух средних величин определяется с помощью критерия Стьюдента.
Правильный ответ: г.
а) ошибки репрезентативности
б) коэффициента вариации
в) среднего квадратического отклонения
г) критерия Стьюдента
Решение: статистическая достоверность различия между двумя средними величинами определяется с помощью критерия Стьюдента.
Правильный ответ: г.
а) во сколько раз разность сравниваемых средних величин превышает их среднюю ошибку
б) во сколько раз среднее квадратическое отклонение меньше средней арифметической
в) на ошибку разности средних величин в генеральной и выборочной совокупности
Решение: критерий достоверности Стьюдента указывает во сколько раз разность сравниваемых средних величин превышает их среднюю ошибку.
Правильный ответ: а.
а)
б)
в)
г)
Решение: величина критерия достоверности Стьюдента при сравнении средних величин определяется по формуле: .
Правильный ответ: г.
а)
б)
в)
г)
Решение: расчет критерия достоверности Стьюдента при сравнении относительных величин производится по формуле: .
Правильный ответ: г.
а)
б)
в)
г)
Решение: формула вычисления критерия достоверности Стьюдента: .
Правильный ответ: г.
а) выявленные различия случайны
б) выявленные различия не случайны
в) различий нет
Решение: если при сравнении двух выборочных совокупностей критерий достоверности Стьюдента превышает значение 2 (при n>30), можно сделать вывод о достоверном различии между ними с вероятностью 95,5%, т.е. выявленные различия не случайны.
Правильный ответ: б.
а) 0,5
б) 1,0
в) 1,5
г) 2,0
д) 2,5
Решение: различия между средними величинами двух признаков являются существенными, если величина критерия Стьюдента (t) равна или превышает значение 2 (при n>30).
Правильный ответ: г, д.
а) достоверны
б) не достоверны
в) однородны
г) независимы
Решение: если при сравнении двух выборочных совокупностей критерий достоверности Стьюдента превышает значение 2 (при n>30), можно сделать вывод о достоверном различии между ними с вероятностью 95,5%.
Правильный ответ: а.
а) 68,3%
б) 95,5%
в) 99,7%
г) 50,0%
Решение: событие в медико-биологических исследованиях считается не достоверным, если вероятность его прогноза меньше 95,5%.
Правильный ответ: а, г.
а) отсутствие взаимосвязи между признаками
б) отсутствие упорядочения вариационных рядов
в) различие между совокупностями по характеризующим признакам, влияющим на изучаемый признак
г) различие между совокупностями по изучаемым признакам
Решение: понятие «Неоднородность статистических совокупностей» означает различие между совокупностями по характеризующим признакам, влияющим на изучаемый признак.
Правильный ответ: в.
а) корреляции
б) выравнивания динамических рядов
в) стандартизации
г) экстраполяции
Решение: для сравнения показателей, полученных на неоднородных по своему составу совокупностях, используется метод стандартизации.
Правильный ответ: в.
а) корреляционная
б) механическая
в) функциональная
г) косвенная
Решение: типами взаимосвязи между явлениями, которые можно установить математическими методами, являются функциональная и корреляционная.
Правильный ответ: а, в.
а) корреляционная
б) стандартизованная
в) функциональная
г) регрессионная
Решение: строгая зависимость процессов или явлений, выраженная математической формулой, называется «Функциональная связь».
Правильный ответ: в.
а) корреляция
б) аппроксимация
в) стандартизация
г) дисперсия
Решение: для выявления вероятностной взаимосвязи между признаками в социально-гигиенических и медико-биологических исследованиях используется корреляционный анализ.
Правильный ответ: а.
а) с помощью статистической таблицы
б) с помощью графика
в) расчетом коэффициента корреляции
г) применением метода стандартизации
Решение: корреляционная взаимосвязь между изучаемыми признаками может быть обнаружена с помощью статистической таблицы, графика и коэффициента корреляции.
Правильный ответ: а, б, в.
а) больше или равно -0,6
б) меньше или равно 0,1
в) больше 0,7
г) меньше или равно 0,4
Решение: о наличии сильной прямой корреляционной зависимости можно говорить при значении коэффициента корреляции больше 0,7.
Правильный ответ: в.
а) от 0 до 0,3
б) от 0,3 до 0,7
в) от 0,7 до 1,0
г) от 0 до -0,3
д) от -0,3 до -0,7
е) от -0,7 до -1,0
Решение: о наличии сильной обратной корреляционной связи между признаками можно говорить при значении коэффициента корреляции от -0,7 до -1,0.
Правильный ответ: е.
а) положительные
б) отрицательные
в) любые
г) меньше или равны -1
Решение: значения коэффициента корреляции для прямой взаимосвязи между признаками являются положительными.
Правильный ответ: а.
а) положительные
б) отрицательные
в) любые
г) меньше или равно 1
Решение: значения коэффициента корреляции для обратной взаимосвязи между признаками являются отрицательными.
Правильный ответ: б.
а) от 1 до 10
б) от 0 до 1
в) от 0 до 100
г) могут встречаться любые значения
Решение: коэффициент корреляции может изменяться в пределах (по модулю числа) от 0 до 1.
Правильный ответ: б.
Решение: коэффициент корреляции может изменяться в пределах (по модулю числа) от 0 до 1.
Правильный ответ: 0.
Решение: коэффициент корреляции может изменяться в пределах (по модулю числа) от 0 до 1.
Правильный ответ: 1.
а) «Сервис (Данные)» → «Обработка данных» → «Поиск решения»
б) «Сервис (Данные)» → «Анализ данных» → «Описательная статистика»
в) «Сервис (Данные)» → «Обработка данных» → «Основная статистика»
Решение: вызов модуля вычисления средних величин и характеристик вариационного ряда в программе Excel производится командой «Сервис (Данные)» → «Анализ данных» → «Описательная статистика».
Правильный ответ: б.
?
а) начиная с ячейки А11
б) начиная с ячейки С11
в) в диапазоне ячеек A11:A110
г) в ячейку A110
Решение: результат обработки вариационного ряда, выполненный модулем «описательная статистика» программы Excel размещается в выходном интервале (см.рисунок) начиная с ячейки С11 и ниже.
Правильный ответ: б.
?
а) =(A6-D13)/корень(A8^2+D14^2)
б) =(A6+D13)*корень(A8^2+D14^2)
в) =(A6-D13)/корень(A8^2-D14^2)
Решение: формулой вычисления коэффициента Стьюдента в программе Excel (см.рисунок) является «=(A6-D13)/корень(A8^2+D14^2)».
Правильный ответ: а.
1
2
3
4
а) 1
б) 2
в) 3
г) 4
Решение: обозначение ошибки репрезентативности в таблице результатов обработки вариационного ряда пакетом «Описательная статистика» программы Excel (см.рисунок) соответствует позиция 2 (Стандартная ошибка).
Правильный ответ: б.
?
а) =A1*100/D3
б) =D3*100/A3
в) =A2*100/D2
г) =G3*100/А3
Решение: формулой вычисления относительного показателя (P) в программе Excel (см.рисунок) является «=D3*100/A3».
Правильный ответ: б.
?
а) = 100 - G2
б) = 100 - А5
в) = 100 - G3
г) = 100 A6
Решение: формулой вычисления величины, обратной P, в программе Excel (см. рисунок) является «= 100 - G3».
Правильный ответ: в.
?
а) =корень(G3*A6/A3)
б) =корень(D3*A6/A3)
в) =корень(G3*A6*A3)
г) =корень(D3*A6*A3)
Решение: формулой вычисления ошибки репрезентативности относительного показателя в программе Excel (см. рисунок) является «=корень(G3*A6/A3)».
Правильный ответ: а.
?
а) =G2-2*D5
б) =G3-2*D6
в) =G3-2*D6
г) =G3+2*D6
Решение: формулой вычисления нижней доверительной границы в программе Excel (см. рисунок) является «=G3-2*D6».
Правильный ответ: в.
?
а) =G2+2*D5
б) =G3-2*D6
в) =G3-2*D6
г) =G3+2*D6
Решение: формулой вычисления верхней доверительной границы в программе Excel (см. рисунок) является «=G3+2*D6».
Правильный ответ: г.
Число наблюдений, n |
Критическое значение критерия W для уровня вероятности p |
|
p=0,01 |
p=0,05 |
|
8 |
0,749 |
0,818 |
9 |
0,764 |
0,829 |
10 |
0,781 |
0,842 |
11 |
0,792 |
0,850 |
12 |
0,805 |
0,859 |
13 |
0,814 |
0,866 |
14 |
0,825 |
0,874 |
15 |
0,835 |
0,881 |
16 |
0,844 |
0,887 |
17 |
0,851 |
0,892 |
18 |
0,858 |
0,897 |
19 |
0,863 |
0,901 |
20 |
0,868 |
0,905 |
21 |
0,873 |
0,908 |
22 |
0,878 |
0,911 |
23 |
0,881 |
0,914 |
24 |
0,884 |
0,916 |
25 |
0,888 |
0,918 |
26 |
0,891 |
0,920 |
27 |
0,894 |
0,923 |
28 |
0,896 |
0,924 |
29 |
0,898 |
0,926 |
30 |
0,900 |
0,927 |
31 |
0,902 |
0,929 |
32 |
0,904 |
0,930 |
33 |
0,906 |
0,931 |
34 |
0,908 |
0,933 |
35 |
0,910 |
0,934 |
36 |
0,912 |
0,935 |
37 |
0,914 |
0,936 |
38 |
0,916 |
0,938 |
39 |
0,917 |
0,939 |
40 |
0,919 |
0,940 |
41 |
0,920 |
0,941 |
42 |
0,922 |
0,942 |
43 |
0,923 |
0,943 |
44 |
0,924 |
0,944 |
45 |
0,926 |
0,945 |
46 |
0,927 |
0,945 |
47 |
0,928 |
0,946 |
48 |
0,929 |
0,947 |
49 |
0,929 |
0,947 |
50 |
0,930 |
0,947 |
df |
Р |
df |
Р |
df |
Р |
|||||||||
0,10 |
0,05 |
0,01 |
0,001 |
0,10 |
0,05 |
0,01 |
0,001 |
0,10 |
0,05 |
0,01 |
0,001 |
|||
1 |
2,706 |
3,842 |
6,635 |
10,829 |
31 |
41,422 |
44,993 |
52,203 |
61,118 |
61 |
75,514 |
80,232 |
89,591 |
100,887 |
2 |
4,605 |
5,992 |
9,211 |
13,817 |
32 |
42,585 |
46,202 |
53,498 |
62,508 |
62 |
76,630 |
81,381 |
90,802 |
102,165 |
3 |
6,251 |
7,815 |
11,346 |
16,269 |
33 |
43.745 |
47.408 |
54.789 |
63.891 |
63 |
77,745 |
82,529 |
92,010 |
103,442 |
4 |
7,779 |
9,488 |
13,278 |
18,470 |
34 |
44.903 |
48.610 |
56.074 |
65.269 |
64 |
78,860 |
83,675 |
93,217 |
104,717 |
5 |
9,236 |
11,071 |
15,088 |
20,519 |
35 |
46.059 |
49.810 |
57.356 |
66.641 |
65 |
79,973 |
84,821 |
94,422 |
105,988 |
6 |
10,645 |
12,593 |
16,814 |
22,462 |
36 |
47.212 |
51.007 |
58.634 |
68.008 |
66 |
81,085 |
85,965 |
95,626 |
107,257 |
7 |
12,017 |
14,067 |
18,478 |
24,327 |
37 |
48.363 |
52.201 |
59.907 |
69.370 |
67 |
82,197 |
87,108 |
96,828 |
108,525 |
8 |
13,362 |
15,509 |
20,093 |
26,130 |
38 |
49.513 |
53.393 |
61.177 |
70.728 |
68 |
83,308 |
88,250 |
98,028 |
109,793 |
9 |
14,684 |
16,921 |
21,669 |
27,883 |
39 |
50.660 |
54.582 |
62.444 |
72.080 |
69 |
84,418 |
89,391 |
99,227 |
111,055 |
10 |
15,987 |
18,309 |
23,213 |
29,594 |
40 |
51.805 |
55.768 |
63.707 |
73.428 |
70 |
85,527 |
90,531 |
100,425 |
112,317 |
11 |
17,275 |
19,677 |
24,729 |
31,271 |
41 |
52.494 |
56.953 |
64.967 |
74.772 |
71 |
86,635 |
91,670 |
101,621 |
113,577 |
12 |
18,549 |
21,028 |
26,221 |
32,917 |
42 |
54.090 |
58.135 |
66.224 |
76.111 |
72 |
87,743 |
92,808 |
102,816 |
114,834 |
13 |
19,812 |
22,365 |
27,693 |
34,536 |
43 |
55.230 |
59.314 |
67.477 |
77.447 |
73 |
88,850 |
93,945 |
104,010 |
116,092 |
14 |
21,064 |
23,688 |
29,146 |
36,132 |
44 |
56.369 |
60.492 |
68.728 |
78.779 |
74 |
89,956 |
95,081 |
105,202 |
117,347 |
15 |
22,307 |
24,999 |
30,583 |
37,706 |
45 |
57.505 |
61.668 |
69.976 |
80.107 |
75 |
91,061 |
96,217 |
106,393 |
118,599 |
16 |
23,542 |
26,299 |
32,006 |
39,262 |
46 |
58,641 |
62,841 |
71,221 |
81,431 |
76 |
92,166 |
97,351 |
107,582 |
119,850 |
17 |
24,769 |
27,591 |
33,415 |
40,801 |
47 |
59,774 |
64,013 |
72,463 |
82,752 |
78 |
94,374 |
99,617 |
109,958 |
122,347 |
18 |
25,989 |
28,873 |
34,812 |
42,323 |
48 |
60,907 |
65,183 |
73,703 |
84,069 |
79 |
95.476 |
100.749 |
111.144 |
123.595 |
19 |
27,204 |
30,147 |
36,198 |
43,832 |
49 |
62,038 |
66,351 |
74,940 |
85,384 |
80 |
96.578 |
101.879 |
112.329 |
124.839 |
20 |
28,412 |
31,415 |
37,574 |
45,327 |
50 |
63,167 |
67,518 |
76,175 |
86,694 |
90 |
107.565 |
113.145 |
124.116 |
137.208 |
21 |
29,615 |
32,675 |
38,940 |
46,810 |
51 |
64,295 |
68,683 |
77,408 |
88,003 |
100 |
118.498 |
124.342 |
135.807 |
149.449 |
22 |
30,813 |
33,929 |
40,298 |
48,281 |
52 |
65,422 |
69,846 |
78,638 |
89,308 |
110 |
129.385 |
135.480 |
147.414 |
161.582 |
23 |
32,007 |
35,177 |
41,647 |
49,742 |
53 |
66,548 |
71,008 |
79,866 |
90,609 |
120 |
140.233 |
146.567 |
158.950 |
173.618 |
24 |
33,196 |
36,420 |
42,989 |
51,194 |
54 |
67,673 |
72,168 |
81,092 |
91,909 |
130 |
151.045 |
157.610 |
170.423 |
185.573 |
25 |
34,382 |
37,658 |
44,324 |
52,635 |
55 |
68,796 |
73,326 |
82,316 |
93,205 |
140 |
161.827 |
138.613 |
181.841 |
197.450 |
26 |
35,563 |
38,891 |
45,652 |
54,068 |
56 |
69,919 |
74,484 |
83,538 |
94,499 |
150 |
172.581 |
179.581 |
193.207 |
209.265 |
27 |
36,741 |
40,119 |
46,973 |
55,493 |
57 |
71,040 |
75,639 |
84,758 |
95,790 |
200 |
226.021 |
233.994 |
249.445 |
267.539 |
28 |
37,916 |
41,343 |
48,289 |
56,910 |
58 |
72,160 |
76,794 |
85,976 |
97,078 |
250 |
279.050 |
287.882 |
304.939 |
324.831 |
29 |
39,087 |
42,564 |
49,599 |
58,320 |
59 |
73,279 |
77,947 |
87,192 |
98,365 |
300 |
331.788 |
341.395 |
359.906 |
381.424 |
30 |
40,256 |
43,780 |
50,904 |
59,722 |
60 |
74,397 |
79,099 |
88,406 |
99,649 |
350 |
384.306 |
394.626 |
414.474 |
df2 |
Степени свободы df1 |
|||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
10 |
12 |
24 |
25 |
|
3 |
10,128 |
9,552 |
9,277 |
9,117 |
9,013 |
8,941 |
8,887 |
8,845 |
8,785 |
8,745 |
8,638 |
8,634 |
5 |
6,608 |
5,786 |
5,409 |
5,192 |
5,050 |
4,950 |
4,876 |
4,818 |
4,735 |
4,678 |
4,527 |
4,521 |
7 |
5,591 |
4,737 |
4,347 |
4,120 |
3,972 |
3,866 |
3,787 |
3,726 |
3,637 |
3,575 |
3,410 |
3,404 |
10 |
4,965 |
4,103 |
3,708 |
3,478 |
3,326 |
3,217 |
3,135 |
3,072 |
2,978 |
2,913 |
2,737 |
2,730 |
11 |
4,844 |
3,982 |
3,587 |
3,357 |
3,204 |
3,095 |
3,012 |
2,948 |
2,854 |
2,788 |
2,609 |
2,601 |
12 |
4,747 |
3,885 |
3,490 |
3,259 |
3,106 |
2,996 |
2,913 |
2,849 |
2,753 |
2,687 |
2,505 |
2,498 |
13 |
4,667 |
3,806 |
3,411 |
3,179 |
3,025 |
2,915 |
2,832 |
2,767 |
2,671 |
2,604 |
2,420 |
2,412 |
14 |
4,600 |
3,739 |
3,344 |
3,112 |
2,958 |
2,848 |
2,764 |
2,699 |
2,602 |
2,534 |
2,349 |
2,341 |
15 |
4,543 |
3,682 |
3,287 |
3,056 |
2,901 |
2,790 |
2,707 |
2,641 |
2,544 |
2,475 |
2,288 |
2,280 |
16 |
4,494 |
3,634 |
3,239 |
3,007 |
2,852 |
2,741 |
2,657 |
2,591 |
2,494 |
2,425 |
2,235 |
2,227 |
18 |
4,414 |
3,555 |
3,160 |
2,928 |
2,773 |
2,661 |
2,577 |
2,510 |
2,412 |
2,342 |
2,150 |
2,141 |
20 |
4,351 |
3,493 |
3,098 |
2,866 |
2,711 |
2,599 |
2,514 |
2,447 |
2,348 |
2,278 |
2,082 |
2,074 |
30 |
4,171 |
3,316 |
2,922 |
2,690 |
2,534 |
2,421 |
2,334 |
2,266 |
2,165 |
2,092 |
1,887 |
1,878 |
40 |
4,085 |
3,232 |
2,839 |
2,606 |
2,449 |
2,336 |
2,249 |
2,180 |
2,077 |
2,003 |
1,793 |
1,783 |
50 |
4,034 |
3,183 |
2,790 |
2,557 |
2,400 |
2,286 |
2,199 |
2,130 |
2,026 |
1,952 |
1,737 |
1,727 |
70 |
3,978 |
3,128 |
2,736 |
2,503 |
2,346 |
2,231 |
2,143 |
2,074 |
1,969 |
1,893 |
1,674 |
1,664 |
100 |
3,936 |
3,087 |
2,696 |
2,463 |
2,305 |
2,191 |
2,103 |
2,032 |
1,927 |
1,850 |
1,627 |
1,616 |
200 |
3,888 |
3,041 |
2,650 |
2,417 |
2,259 |
2,144 |
2,056 |
1,985 |
1,878 |
1,801 |
1,572 |
1,561 |
∞ |
3,843 |
2,998 |
2,607 |
2,374 |
2,216 |
2,100 |
2,011 |
1,940 |
1,833 |
1,754 |
1,519 |
1,528 |
ANOVA дисперсионный анализ (от англ. ANalysis Of VAriance);
covxy ковариация признаков x и y;
SS сумма квадратов (от англ. Sum of Squares);
ЛПУ лечебно-профилактическое учреждение;
МСЭК медико-социальная экспертная комиссия;
ЧСС частота сердечных сокращений.