Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Гистограмма

Работа добавлена на сайт samzan.net: 2016-03-30

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 22.5.2024

Лекция 19 Гистограмма

Гистограмма  (от греч. histos, здесь - столб и ...грамма) - это инструмент, позволяющий зрительно оценить распределение статистических данных, сгруппированных по частоте попадания данных в определенный (заранее заданный) интервал.

Гистограмма - это столбиковая диаграмма, служащая для графического представления имеющейся количественной информации, собранная за длительный период времени (неделя, месяц, год и т.д.), которая дает важную информацию для оценки проблемы и нахождения способов ее решения. Гистограмма применяется главным образом для анализа значений измеряемых параметров.

Рис. 1.  Генеральная совокупность, выборка и данные

Вся совокупность рассматриваемых объектов называется генеральной совокупностью. Генеральной совокупностью может служить как партия продукции, так и сам процесс.

Один или несколько элементов, взятых из генеральной совокупности для получения информации о ней,  называется выборкой. Измеряя характеристики выборки, можно  сделать выводы относительно генеральной совокупности, а затем произвести некоторые корректирующие действия.

Процесс необходимо рассматривать как бесконечную генеральную совокупность. Данные, полученные из выборки, служат основой для решения генеральной совокупности. Чем больше объем выборки, тем больше информации об этой совокупности мы получим, но рост объема выборки одновременно означает и рост количества данных, и это затрудняет понимание совокупности по этим данным.

Общий порядок построения гистограмм следующий:

1. Собираются данные контролируемого параметра (Xj ) за определенный период (месяц, квартал, год и т.д.). Число данных должно быть не менее 30-50, оптимальное число порядка 100.

2. Определяются наибольшее Xmax и наименьшее Xmin значения из всех полученных данных и вычисляется размах R:

R =Xmax - Xmin

Размах характеризует разброс контролируемой величины, он определяет ширину гистограммы.

3. Полученный диапазон (размах) делится на несколько интервалов. Число интервалов k зависит от общего числа собранных данных n и некоторых других факторов.

Число интервалов должно быть  достаточным для того, чтобы на графике проявилась изменчивость данных, но не настолько большим, чтобы на графике появились пустоты (провалы) или соседние интервалы слишком различались.

Рекомендуется использовать формулу Стерджесса:

k = 1 +3,322∙lg n

Также можно использовать формулу:

4. Далее определяют ширину интервала:

Все полученные данные распределяют по интервалам. Если какое-то значение попадает на границу, его следует относить к левому по отношению к ней интервалу. Подсчитывается число значений, попавших в каждый интервал mj, где j-номер интервала.

5. Для каждого интервала подсчитывается относительная частота попадания в него данных:

6.   По полученным данным строится гистограмма - столбчатая диаграмма, высота столбиков которой соответствует частоте или относительной частоте попадания данных в каждый из интервалов.

Рассмотрим пример построения гистограммы.

В результате наблюдений получено 90 значений показателя качества (табл.1).

Таблица 1

77,2

86,4

86,0

76,3

68,4

63,9

77,5

93,4

75,8

91,1

74,9

61,8

91,5

74,1

86,9

78,0

72,2

84,2

83,5

88,5

78,6

82,4

76,6

86,3

61,9

71,8

69,8

77,1

82,4

76,7

58,7

68,3

73,0

82,4

78,7

69,8

87,9

62,4

67,7

63,8

74,8

71,3

80,2

77,3

76,0

91,5

51,2

74,8

77,4

80,9

67,0

72,5

85,9

66,6

77,8

84,1

79,2

88,4

72,3

69,4

91,7

79,0

101,0

74,7

71,5

97,7

87,0

70,6

89,3

87,5

95,6

85,9

54,5

75,6

70,9

83,7

72,9

92,6

93,9

77,1

76,3

94,9

78,5

82,9

73,8

79,1

90,8

92,7

61,6

80,6

1. Находим наибольшее и наименьшее значения:

Хmах= 101,0; Xmin=51,2.

2. Размах равен:

R= 101,0 -51,2 = 49,8.

3. Выбираем количество интервалов равное 9 (к = 9).

4. Находим ширину интервала: R/k = 49,8 / 9 = 5,53. Для удобства построения выбираем ширину интервала - 5,6.

Границы интервалов устанавливаем следующими: левая граница первого интервала 51,0 (меньше Хmin), правая отстоит на ширину интервала (5,56) и составляет 56,6. Последующие границы: 62,2; 67,8; 73,8 и т.д. Правая граница последнего интервала 101,4, что больше наибольшего из имеющихся значений.

5. Определяем частоту каждого интервала. В первый интервал попало два значения, во второй - четыре и т.д. Результаты сводим в табл. 2.

Таблица 2

Номер интервала, i 

Границы интервала

Частота, mj 

Относительная частота f*(x)

Накопленная частота F*(x)

1

51,0+56,6

2

0,022

0,02

2

56,6+62,2

4

0,044

0,07

3

62,2+67,8

6

0,067

0,13

4

67,8+73,4

15

0,167

0,30

5

73,4+79,0

25

0,278

0,58

6

79,0+84,6

13

0,144

0,72

7

84,64+90,2

12

0,133

0,86

8

90,2+95,8

11

0,122

0,98

9

95,84+101,4

2

0,022

1,00

(а) Всего

90

1,000

6. Вычисляем относительную частоту попадания данных в каждый интервал:

для первого интервала: f*(x) = 2/90 = 0,022;

для второго: f*(x) = 4/90 = 0,044; ит. д.

7. Вычисляем накопленную относительную частоту, прибавляя каждое последующее

значение относительной частоты к сумме предыдущих значений.

Строим гистограмму распределения. Вид полученной гистограммы приведен на рис.2.

График накопленной относительной частоты, т. е. интегральную функцию распределения, представлен на рис. 3.

Рис. 2 Гистограмма распределения значений показателя качества

Рис 3 Интегральная функция распределения

Полезную информацию о возможном характере распределения можно получить из таблицы 3. Формы, представленные на этом рисунке, типичны, и ими можно воспользоваться как образцами при анализе процессов.

Таблица 3.

а) Обычный тип (симметричный).

Гистограмма с таким распределением встречается чаще всего.

Она указывает на стабильность процесса.

б) Гребенка (мультимодальный тип).

Здесь классы через один имеют более низкие частоты.

Такая форма встречается, когда число единичных наблюдений, попадающих в класс, колеблется от класса к классу или, когда действует определенное правило округления данных.

в) Положительно (отрицательно) скошенное распределение. Среднее значение гистограммы локализуется слева (справа) от центра размаха. Частоты довольно резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Такая (асимметричная) форма встречается, когда невозможно получить значения ниже определенного, например для диаметра деталей и т.д.

г) Распределение с обрывом слева (справа). Это одна из тех форм, которые часто встречаются при 100%-ном контроле изделий из-за плохой воспроизводимости процесса, а также когда, например, отобраны и исключены из партии все изделия с параметрами ниже контрольного нормативы (или выше, или и те и другие).

д) Плато (равномерное и прямоугольное распределение). Такая гистограмма получается в случаях, когда объединяются несколько распределений, в которых средние значения имеют небольшую разницу между собой. Анализ такой гистограммы целесообразно проводить, используя метод расслоения.

е) Двухпиковый тип (бимодальный тип). Такая форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями, например, в случае наличия разницы между двумя видами материалов, двумя операторами и т.д. В этом случае можно провести расслоение по двум видам фактора, исследовать причины различия и принять соответствующие меры для его устранения.

ж) Распределение с изолированным пиком. Рядом с распределением обычного типа появляется маленький изолированный пик. Это форма появляется при наличии малых включений данных из другого распределения, появления ошибки измерения или просто включения данных из другого процесса.

По результатам анализа гистограммы дают заключение о необходимости настройки измерительного прибора или срочного осуществления контроля процесса, однако на основании гистограммы оператор не должен регулировать процесс, иначе изменчивость процесса будет увеличиваться.

Если имеется допуск, то необходимо нанести на гистограмму границы допуска (Sl -нижняя граница допуска, SU - верхняя граница допуска), чтобы сравнить распределение с этими границами. Существует пять типичных случаев, показанных на Рис. 4. Используйте их для справок при оценивании популяций.

Гистограмма удовлетворяет допуску

Гистограмма не удовлетворяет допуску

Рис. 4 Гистограммы и границы поля допуска (Sl - нижняя граница поля допуска, SU -верхняя граница поля допуска)

Если гистограмма удовлетворяет допуску, то в случаях:

а) поддержание существующего состояния - это все, что требуется, поскольку гистограмма вполне соответствует допускам;

б) допуски удовлетворяются, но нет никакого запаса, поэтому необходимо сократить разброс до меньшего значения.

Когда гистограмма не удовлетворяет допуску, то в случаях:

в) необходимо добиться смещения среднего ближе к центру поля допуска;

г) требуются действия, направленные на снижение вариации;

д) одновременно требуются меры, описанные в пунктах в) и г).

По крайней мере, три типа гистограмм доступны для аналитика: построенная с помощью контрольного листа (check sheet), простая гистограмма (simple histogram) и висячая гистограмма (hanging histogram).

Пример гистограммы, построенной с помощью контрольного листа

Специалист по организации труда хочет исследовать распределение времени, требуемое механическому цеху для изготовления некоторой детали. В связи с тем, что обычно известно, сколько времени требуется на это, бланк контрольного листа оформляется перед взятием выборки. По мере выполнения работы, замеры (крестики) проставляются в соответствующих интервалах, как показано на рис. 5, где по горизонтальной оси отложено время выполнения работы в секундах. Полученные замеры аппроксимированы непрерывной кривой распределения. Кривая имеет двугорбый вид (бимодальная кривая), потому что в механическом цехе работали два фрезерных станка. Один из них - новый и работает быстрее, чем другой, более старый.

Рис 5 Контрольный лист времени фрезерования

Пример висячей гистограммы

Этот график аналогичен простой гистограмме с наложенной кривой распределения, но отличается тем, что на графике строится гипотетическая кривая распределения, а частоты событий откладываются вниз от этой кривой, как бы повисая на ней. Подобный график помогает аналитику проверить характер распределения данных процесса (рис. 6).

Такой тип гистограммы служит превосходным инструментом, позволяющим быстро составить представление о совокупности данных, понять закон распределения, увидеть тенденцию центрирования, разброс и судить о потенциальной возможности процесса. Она может применяться для того, чтобы облегчить идентификацию потенциальных возможностей системы и в целях определения вероятных проблемных областей.

Рис. 6. Висячая гистограмма

Пример анализа простой гистограммы в целях управления качеством

Две линии работают для производства транзисторов. Процесс статистически управляем. Гистограмма выходного напряжения транзисторов на рис. 7 показывает значительный разброс. Это свидетельствует о том, что процесс может не обладать потенциальной способностью, так как некоторые из изделий, превышают оба предела технических условий.

Рис. 7. Гистограмма для выходного напряжения транзисторов

а)

б)

Рис. 8. Отдельные гистограммы выходного напряжения транзисторов, выпущенных на двух производственных линиях

Данные разделены на два графика для каждой производственной линий (рис. 8). Отдельные кривые показывают, что работа каждой линии может характеризоваться процессом, не отвечающим требованиям, но обладающим потенциальной способностью; данные указывают на проблему смещения. Производственные линии должны быть подрегулированы так, чтобы центры распределения приблизились к заданным номинальным значениям.

Пример сравнения данных при помощи объемных гистограмм

Рис. 9 Сравнение данных при помощи объемных гистограмм

Рис 10 Использование гистограмм при фотографировании

Пример прикладного использования гистограмм

В цифровой фотографии гистограмма отражает распределение тонов в изображении. Каждый пиксель попадает в одну из 256 групп, где 0 - чёрный, 255 - белый, а все другие числа обозначают различные тона серого. На гистограмме горизонтальная ось обозначает группы пикселей каждой тональности - от 0 (чёрный) до 255 (белый). Вертикальная ось обозначает количество пикселей в каждой группе. На гистограмме вы видите плавный график - хотя на самом деле вы видите 256 вертикальных линий, но они стоят так близко друг к другу, что создаётся впечатление плавного графика.

Но в чём же смысл всей этой информации? О чём говорит гистограмма? Как минимум, она может показать вам недо- или пере-экспозицию. Если с левого края гистограммы вы видите много линий - скорее всего, изображение недоэкспонировано. А если справа - то налицо пересвет. Типичное хорошо экспонированное изображение будет иметь гистограмму с основным распределением тонов по центру с уменьшением по краям, слева и справа - хотя и к этому правилу бывают исключения.

Полигон

Иногда распределения различных эмпирических данных строятся в виде в виде полигона. Полигоны, как правило, применяют для отображения дискретных изменений значений случайной величины, но они могут использоваться и при непрерывных (интервальных) изменениях.

В этом случае ординаты, пропорциональные частотам интервалов, восстанавливаются перпендикулярно оси абсцисс в точках соответствующих серединам данных интервалов. Вершины ординат соединяются прямыми линиями. Для замыкания кривой крайние ординаты соединяются с близлежащей серединой интервала, в которой частота равна 0 (Рис. 17).

Рис. 17 Полигон

Рис. 18. Кумулятивная кривая

По мере роста числа измерений одновременно уменьшается ширина класса, и полигон превращается в так называемую кривую плотности вероятностей, представляющую собой кривую теоретического распределения

Обычно значения случайных величин не являются совершенно произвольными. Каждое значение может появиться с некоторой вероятностью. Зависимость, связывающая значения случайной величины с вероятностью их появления, называется законом распределения случайной величины. Зная закон распределения, можно заранее предсказать, что те или иные значения этой величины могут появиться с той или иной вероятностью. Законы распределения определяются физическим содержанием случайной величины и для многих случаев они могут быть найдены в результате теоретического анализа. Однако при таком анализе не могут быть учтены многочисленные факторы, неизбежно оказывающие влияние на эту величину. Поэтому реальные законы распределения всегда несколько отличаются от теоретических. Знание законов распределения бывает необходимо для принятия определенных решений по управлению процессами.

Использование кумулятивной кривой

Для выяснения того, соответствует ли данное распределение результатов измерения нормальному распределению, иногда используют специальную вероятностную бумагу, называемую нормальной вероятностной бумагой.

Представление данных на такой бумаге осуществляется следующим способом.

1. На основе полученных в результате измерения параметров качества значений абсолютных частот mi, или соответствующих частостей подсчитывают накопленные частоты (частости). Накопленная частота (частость) каждого значения параметра качества получается суммированием всех частот (частостей), предшествующих значениям параметра.

2. График накопленных частот представляет собой кумулятивную кривую (кумуляту). Часто ее называют интегральной кривой. Кумулятивная кривая строится как для дискретного, так и для непрерывного изменения значений параметра.

3. Накопленные частоты (частости) интервального ряда относятся не к серединам интервалов, а к верхним границам каждого из них. Высота последней ординаты соответствует объему наблюдений всего ряда, или 100 %.

Зависимость на рис. 18 представляет собой полигон, построенный на основе таблиц накопленных частот, и носит название накопленного полигона, а ломаная кривая (штриховая линия) представляет собой кумулятивную кривую. (Обратите внимание, как в данном случае соединены отрезки ломаной.)

Кумулятивная кривая имеет более плавный характер изменения, чем гистограмма или полигон частот, ибо накопление приводит к сглаживанию.

4. Значения накопленных частот, соответствующих одно-, двух- и трехкратному стандартному отклонению значения параметра качества от среднего значения исследуемого статического ряда, наносят на нормальную вероятностную бумагу.

Рис. 19. Расположение экспериментальных точек

на нормальной вероятностной бумаге

В результате имеют на ней шесть точек: три точки, соответствующие большему значению параметра качества относительно его среднего значения, и три точки, соответствующие меньшему его значению (рис. 19). Если точки хорошо ложатся на прямую, то можно говорить о соответствии статистических данных нормальному распределению.

В примере точки не легли точно на прямую, но оказались довольно близко к ней. Поэтому можно сделать вывод о том, что результаты измерения имеют распределение, близкое к нормальному. Хотя распределение данных и близко к нормальному, точки на рис. 19 в начале и в конце заметно отклоняются от прямой, что, в общем-то, бывает часто.

Из рассмотренных графических изображений становится понятным преимущество гистограммы при визуальной оценке закона распределения случайной величины, она признана инструментом контроля качества. 

Гистограмма

План

  1.  Определение
  2.  Правила построения
  3.  Пример
  4.  Типы гистограмм
  5.  Анализ гистограммы с использованием полей допуска
  6.  Виды гистограмм и их использование
  7.  Полигон
  8.  Использование кумулятивной кривой

Используемая литература

  1.  Статистические методы повышения качества/Под ред. Хитоси Куме. — М.: Финансы и статистика, 1990.
  2.  Исикава К. Руководство по контролю качества для мастеров и инженеров. Пер. с англ. – НТК «Трек», 1990 г.
  3.  Всеобщее управление качеством: Учебник для вузов / О.П. Глудкин, Н.М. Горбунов, А.И.Гуров, Ю.В. Зорин; Под ред. О.П. Глудкина. – М.: Радио и связь, 1999. – 600 с.
  4.  Басовский Л.Е., Протасьев В.Б. Управление качеством: Учебник. – М.: ИНФРА-М, 2001. - 212 с.
  5.  Мишин В.М. Управление качеством: Учеб. пособие для вузов. – М.: ЮНИТИ-ДАНА, 2000. - 303 с.
  6.  Инструменты качества: гистограмма, диаграмма Парето. Серия «Всё о качестве. Зарубежный опыт». Выпуск 13, 1999. – М.: НТК «Трек», 2002 . – 25 с.




1. А~параттандыру туралы за~ ~ашан ~абылданды 8 мамыр 2003 жыл Мемлекеттік ~~пиялар туралы за~ ~ашан ~абыл
2. 90 взрослого населения
3. САМАРСКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ в г
4.  Состав территория и официальные языки Европейского Союза
5. Педагогические технологии
6. Иудаизм
7. Динамические структуры данных списки
8. Расследование преступлений связанных с получением банковского кредита
9. то в истории болезни
10. Тема 10. Монополия Вопросы для самопроверки Опишите особенности монополистического рынка.html
11. Слагаемые авторитета руководителя
12. ЗАПАДВОСТОК ВОСТОКЗАПАД В ГЛОБАЛИСТИКЕ До недавнего времени в постсоветс
13. МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ДЛЯ СТУДЕНТОВ Учебная дисциплина д
14. тема вищої освіти кваліфікаційні рівні освіти організація навчання академічний рік методи навчання з
15. 700 г н.э. В традиционном японоведении считается что древнейшую основу населения Японии составляли айны
16. Цель работы. Изучение прямых и итерационных методов решения систем алгебраических уравнений с позиций то
17. Принципы организации и этапы разработки комплексной системы защиты информации
18. это принципиальный фактор вашего роста
19. List tremendously ~ дуже значно respective відповідний remrkbly найвищою мірою compe
20. В.Л. Васильев Юридическая психология.html