Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Практическая работа № 4
Тема: Гистограммы
Цель работы: закрепление знаний, умений и навыков по статистической обработке множества данных о качестве продукции и построению гистограмм
1 Рассеяние и распределение
Если собрать данные о процессе, в котором все факторы (человек, машина, материал, метод и т.п.) строго постоянны, то они оказались бы одинаковыми. Однако в действительности невозможно все время сохранять постоянство всех факторов. Несмотря, на стремление удержать на постоянном уровне те условия, которые подвержены изменениям, в показателях качества изделий все-таки наблюдается рассеивание значений. Строго говоря, даже те несколько факторов, которые считаются постоянными, на самом деле будут изменяться. Такого рода рассеивание можно подразделить на две категории:
а) неизбежное рассеивание значений показателей качества;
б) устранимое рассеивание значений показателей качества.
Поскольку категория а) представляет собой случайные погрешности производства, которые возникают либо из-за колебаний в качестве сырья и материалов (в пределах допустимых отклонений), либо из-за изменений в условиях производства (также в пределах допустимых отклонений), то устранять эту категорию рассеивания, как обусловленную случайными причинами, неэкономично.
Категория б) представляет собой систематическую погрешность производства, которая возникает либо в результате использования нестандартного сырья и материалов, либо из-за нарушений технологического режима при выполнении операций, либо вследствие осуществления их по технологической документации, которая недоработана, либо в результате неожиданной разладки оборудования. Следовательно, это происходит по определенной причине и представляет собой устранимое явление, которое непременно следует устранить. Данные, полученные из выборки, служат основой для принятия решений о значениях параметров/характеристик генеральной совокупности (процесс, партия продукции). Чем больше объем выборки, тем больше информации об этой совокупности получится. Но увеличение объема выборки одновременно означает и увеличение количества данных, что затрудняет понимание совокупности по этим данным, в том числе и тогда, когда они представлены в виде таблицы. В таком случае нужен метод, благодаря которому можно было бы понять некоторые черты генеральной совокупности с первого взгляда. Этому требованию отвечает гистограмма. Организуя множество данных в гистограмму, можно получить общее представление о совокупности. Пример гистограмм можно видеть на рис. 1.
Рисунок 2 - Гистограммы
2 Построение гистограмм
Гистограммы - это графики частотных столбцов, которые показывают статистическую картину поведения процесса. Поэтому построению гистограммы предшествует построение таблицы частот.
2.1 Расчет данных для построения гистограмм
Этапы:
1 Вычисление выборочного размаха R.
Размеры классов определяются так, чтобы размах делился на интервалы равной ширины. Для получения ширины интервалов R делят на 1, 2 или 5 (либо 10, 20, 50; 0,1, 0,2, 0,5 и т.д.), чтобы получилось от 5 до 20 интервалов равной ширины. Если возникают две возможности, используют более узкий интервал при числе наблюдений 100 и больше, и более широкий - при 99 наблюдениях и меньше.
Готовят бланк (см. табл. 3), куда можно занести класс, среднюю точку, отметки частот, частоты и т.д.
4 Определение границ класса.
Определить границы интервалов так, чтобы они включали наименьшее и наибольшее значения и положить их в основу таблицы частот (см. табл. 3). Сначала требуется определить нижнюю границу первого класса и прибавить к ней ширину этого класса, чтобы получить границу между первым и вторым классами. После этого необходимо удостовериться, что первый класс включает наименьшее значение, и что его граничное значение приходится на середину принятой единицы. Далее, продолжая прибавлять найденный интервал к предыдущему значению для получения второй границы, затем третьей и т.д., можно удостовериться, что последний класс включает максимальное значение.
Вычислить, воспользовавшись приведенной ниже словесной формулой, середины классов и записать их в таблицу частот (см. табл. 3):
Середины второго, третьего и последующих классов можно еще получить и так:
Примечания:
6 Для получения частот надо подсчитать, какое количество значений из таблицы исходных данных попадает внутрь каждого из интервалов (2-ая колонка табл. 3) и записать частоты, приходящиеся на каждый интервал, используя наклонные черточки, сгруппированные по пять, как показано ниже:
Частота |
1 |
2 |
3 |
Подсчет частоты |
/ |
// |
/// |
Частота |
4 |
5 |
6 |
Подсчет частоты |
//// |
//// |
//// / |
Частота |
7 |
8 |
9 |
Подсчет частоты |
//// // |
//// /// |
//// //// |
2.2 Построение гистограммы
Этапы:
1 Желательно взять лист бумаги в клеточку. Нанесите горизонтальную ось и выберите масштаб на этой оси. Не стоит ориентироваться при этом на интервалы классов, лучше основываться на единицах величин измеряемых данных. Это делается для удобства сравнений множества гистограмм, описывающих похожие факторы и характеристики, а также для сравнения гистограмм с допусками (стандартами).
На горизонтальной оси с обеих сторон (перед первым и после последнего интервалов) оставьте свободное место, приблизительно равное интервалу.
2 Разметьте левую вертикальную ось масштабом частот, а на правую (если понадобится) нанесите шкалу относительных частот. Высоту класса с максимальной частотой стоит выбирать так, чтобы она оказалась между расстояниями от максимума до минимума на горизонтальной оси.
3 Нанесите на горизонтальную ось границы классов.
4 Пользуясь интервалом класса как основанием, постройте прямоугольник, высота которого соответствует накопленной частоте этого класса.
5 Нанесите на график линию, представляющую среднее арифметическое, а также линии, представляющие границы допуска, если они есть.
6 На чистом поле гистограммы укажите происхождение данных (период, в течение которого собирались данные и т.п.), число данных n, среднее арифметическое х и среднее квадратичное отклонение s.
3 Чтение гистограмм
Наиболее типичные формы гистограмм приведены на рисунке 2 (а-ж):
Рисунок 2 Типы гистограмм
а) Обычный тип (симметричный или колоколообразный)
Среднее значение гистограммы приходится на середину размаха данных. Наивысшая частота оказывается в середине и постепенно снижается к обоим концам. Форма симметрична.
Примечание. Это именно та форма, которая встречается чаще всего.
б) Гребенка (мультимодальный тип)
Классы через один имеют более низкие частоты
Примечание. Такая форма встречается, когда число единичных наблюдений, попадающих в класс, колеблется от класса к классу или когда действует определенное правило округления данных.
в) Положительно скошенное распределение (отрицательно скошенное распределение)
Среднее значение гистограммы локализуется слева (справа) от центра размаха. Частоты довольно резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма асимметрична.
Примечание. Такая форма встречается, когда нижняя (верхняя) граница регулируется либо теоретически, либо по значению допуска или когда левое (правое) значение недостижимо.
г) Распределение с обрывом слева (распределение с обрывом справа)
Среднее арифметическое гистограммы локализуется далеко слева (справа) от центра размаха. Частоты резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма асимметрична
Примечание. Это одна из тех форм, которые часто встречаются при 100 % -ном контроле изделий из-за плохой воспроизводимости процесса, а также когда проявляется резко выраженная положительная (отрицательная) асимметрия.
д) Плато (равномерное и прямоугольное распределения)
Частоты в разных классах образуют плато, поскольку все классы имеют более или менее одинаковые ожидаемые частоты с конечными классами.
Примечание. Такая форма встречается в смеси нескольких распределений, имеющих различные средние.
е) Двухпиковый тип (бимодальный тип)
В окрестностях центра диапазона данных частота низкая, зато есть по пику с каждой стороны.
Примечание. Такая форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями.
ж) Распределение с изолированным пиком
Наряду с распределением обычного типа появляется маленький изолированный пик
Примечание. Это форма, которая появляется при наличии малых включений данных из другого распределения, как в случае нарушения нормальности процесса, появления погрешности измерения или просто включения данных из другого процесса.
4 Нормальное распределение и его характеристики
Всякая гистограмма строится на основе некоторого числа данных. Но что произойдет с гистограммой, если наращивать число данных? Если интервал класса по мере роста числа данных будет все меньше и меньше, то сглаженная кривая распределения частот получится как предел распределения относительных частот. Она как раз и станет представлением для самой генеральной совокупности, поскольку получается из бесконечного числа данных.
Есть множество видов распределений, но самое типичное из них - нормальное распределение (рис. 3). Когда разброс характеристики качества обусловлен суммой большого числа независимых ошибок, вызванных различными факторами, то ее распределение во многих случаях получается приблизительно нормальным. Нормальное распределение можно легко узнать по колоколообразной форме, если:
1) его наибольшая частота приходится на середину интервала и плавно спадает к его концам (хвостам) т.е. большинство точек (данных) располагаются вблизи центральной линии или в середине;
2) центральная линия делит кривую на две симметричные половины;
3) лишь малое число точек разбросано далеко и относится к минимальным или максимальным значениям;
4) нет точек, лежащих за колоколообразной кривой.
Рисунок 3 - Форма нормального распределения
Провести исследование распределения содержания белка в молоке, поступающего на молочный завод:
Пример:
Для исследования распределения содержания белка в молоке, поступающего на завод, были измерены 90 проб (n = 90) (табл.1).
Таблица 1 Содержание белка в молоке сырье, %
Номер выборки |
Результаты измерений |
|||||||||
1-10 |
2,510 |
2,517 |
2,522 |
2,510 |
2,511 |
2,519 |
2,532 |
2,543 |
2,525 |
2,522 |
11-20 |
2,527 |
2,536 |
2,506 |
2,541 |
2,512 |
2,515 |
2,521 |
2,536 |
2,529 |
2,524 |
21-30 |
2,529 |
2,523 |
2,523 |
2,523 |
2,519 |
2,528 |
2,543 |
2,538 |
2,518 |
2,534 |
31-40 |
2,520 |
2,514 |
2,512 |
2,534 |
2,526 |
2,530 |
2,532 |
2,526 |
2,523 |
2,520 |
41-50 |
2,535 |
2,523 |
2,526 |
2,525 |
2,532 |
2,522 |
2,502 |
2,530 |
2,522 |
2,514 |
51-60 |
2,533 |
2,510 |
2,542 |
2,524 |
2,530 |
2,521 |
2,522 |
2,535 |
2,540 |
2,528 |
61-70 |
2,525 |
2,515 |
2,520 |
2,519 |
2,526 |
2,527 |
2,522 |
2,542 |
2,540 |
2,528 |
71-80 |
2,531 |
2,545 |
2,524 |
2,522 |
2,520 |
2,519 |
2,519 |
2,529 |
2,522 |
2,513 |
81-90 |
2,518 |
2,527 |
2,511 |
2,519 |
2,531 |
2,527 |
2,529 |
2,528 |
2,519 |
2,521 |
Таблица 2 - Таблица для вычисления размаха
Номер выборки |
Результаты измерений |
Макс в строке |
Мин в строке |
|||||||||
1-10 |
2,510 |
2,517 |
2,522 |
2,510 |
2,511 |
2,519 |
2,532 |
2,543 |
2,525 |
2,522 |
||
11-20 |
2,527 |
2,536 |
2,506 |
2,541 |
2,512 |
2,515 |
2,521 |
2,536 |
2,529 |
2,524 |
||
21-30 |
2,529 |
2,523 |
2,523 |
2,523 |
2,519 |
2,528 |
2,543 |
2,538 |
2,518 |
2,534 |
||
31-40 |
2,520 |
2,514 |
2,512 |
2,534 |
2,526 |
2,530 |
2,532 |
2,526 |
2,523 |
2,520 |
||
41-50 |
2,535 |
2,523 |
2,526 |
2,525 |
2,532 |
2,522 |
2,502 |
2,530 |
2,522 |
2,514 |
||
51-60 |
2,533 |
2,510 |
2,542 |
2,524 |
2,530 |
2,521 |
2,522 |
2,535 |
2,540 |
2,528 |
||
61-70 |
2,525 |
2,515 |
2,520 |
2,519 |
2,526 |
2,527 |
2,522 |
2,542 |
2,540 |
2,528 |
||
71-80 |
2,531 |
2,545 |
2,524 |
2,522 |
2,520 |
2,519 |
2,519 |
2,529 |
2,522 |
2,513 |
||
81-90 |
2,518 |
2,527 |
2,511 |
2,519 |
2,531 |
2,527 |
2,529 |
2,528 |
2,519 |
2,521 |
Таким образом, R =
Для большей наглядности поведения изучаемого показателя, процесса, явления количество интервалов должно быть от 5 до 20. Размер класса можно определить путем деления размаха на выбранное удобное число интервалов. Можно наоборот размах разделить на несколько удобных значений размеров классов и выбрать тот, который дает нужное их количество.
Например, определим по второму способу размер класса, если R = 0,37, n = 50
0,37 ׃ 0,05 = 7,4;
0,37 ׃ 0,02 = 18,5;
0,37 ׃ 0,10 = 3,7.
Таким образом, в первом случае получили, округлив - 7, во втором - 19, в третьем 4 класса. Между 5 и 20 имеется два значения: 7 и 19. Выбираем 7 интервалов, так как, если возникают две возможности, используют более узкий интервал при числе наблюдений 100 и больше, и более широкий - при 99 наблюдениях и меньше. В данном случае 0,05 против 0,02 для 50 наблюдений.
Используя вышеприведенный пример, определить число классов и размер интервала для данных по молоку.
______________________________
_______________________________
1.3 Заполнение таблицы частот (табл. 3).
1.3.1 Определяя классы, необходимо правильно выбрать минимальное значение. В нашем случае его лучше округлить до 2,500, затем прибавить найденный размер класса. Начало каждого класса должно быть на одну долю больше конца предыдущего класса, для того чтобы выборочные значения не могли принадлежать сразу двум соседним классам.
Например, если min = 45,25, а интервал =0,05, то:
1 класс 45,25 45,30; либо 1 класс 45,250 45,300;
2 класс 45,31 45,35 и т.д., 2 класс 45,301 45,350 и т.д.
1.3.2 Определяя середину класса, долю перехода из класса в класс не учитывают, то есть для первого класса суммируют оба значения и делят пополам, а для остальных берут максимальные значения предыдущего и данного класса.
Например,
1 класс ;
2 класс и т.д.
13.3 Используя вышеуказанный пример, заполнить таблицу частот содержания белка в молоке.
Таблица 3 Таблица частот
Номер класса |
Класс |
Середина класса |
Подсчет частот |
Частота ƒ |
Итого |
2 Построение гистограммы.
2.1 Используя данные таблицы частот и п 2.2 общих положений, построить гистограмму, показывающую распределение содержания белка в молоке, поступающего на молочный завод.
2.2 Рядом с гистограммой нанести информационные данные.
2.3 Нанести на гистограмму границы допусков в виде вертикалей, проходящих через предельные значения на оси абсцисс.
2.4 Нанести на гистограмму линию, показывающую среднее значение выборки.
Для получения более точного значения используют формулу:
.
Для ускорения расчетов среднее значение выборки считают по формуле:
,
где ƒ количество частот (выборочных значений) в классе;
-среднее значение класса.
Для второго варианта удобно использовать следующую таблицу
Номер класса |
Середина класса |
Частота ƒ |
ƒ |
|
Итого |
n = |
Σ = |
2.5 Определить тип гистограммы и есть ли смещение относительно центра размаха.
2.6 Определить количество брака и по содержанию белка сделать вывод о качестве молока сырья, поступающего на молочный завод.
PAGE 7