Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Тема- Гистограммы Цель работы- закрепление знаний умений и навыков по статистической обработке множества д

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 9.11.2024

Практическая работа № 4

Тема: Гистограммы

Цель работы: закрепление знаний, умений и навыков по статистической обработке множества данных о качестве продукции и построению гистограмм

Общие положения

1 Рассеяние и распределение

Если собрать данные о процессе, в котором все факторы (человек, машина, материал, метод и т.п.) строго постоянны, то они оказались бы одинаковыми. Однако в действительности невозможно все время сохранять постоянство всех факторов. Несмотря, на стремление удержать на постоянном уровне те условия, которые подвержены изменениям, в показателях качества изделий все-таки наблюдается рассеивание значений. Строго говоря, даже те несколько факторов, которые считаются постоянными, на самом деле будут изменяться. Такого рода рассеивание можно подразделить на две категории:

а) неизбежное рассеивание значений показателей качества;

б) устранимое рассеивание значений показателей качества.

Поскольку категория а) представляет собой случайные погрешности производства, которые возникают либо из-за колебаний в качестве сырья и материалов (в пределах допустимых отклонений), либо из-за изменений в условиях производства (также в пределах допустимых отклонений), то устранять эту категорию рассеивания, как обусловленную случайными причинами, неэкономично.

Категория б) представляет собой систематическую погрешность производства, которая возникает либо в результате использования нестандартного сырья и материалов, либо из-за нарушений технологического режима при выполнении операций, либо вследствие осуществления их по технологической документации, которая недоработана, либо в результате неожиданной разладки оборудования. Следовательно, это происходит по определенной причине и представляет собой устранимое явление, которое непременно следует устранить. Данные, полученные из выборки, служат основой для принятия решений о значениях параметров/характеристик генеральной совокупности (процесс, партия продукции). Чем больше объем выборки, тем больше информации об этой совокупности получится. Но увеличение объема выборки одновременно означает и увеличение количества данных, что затрудняет понимание совокупности по этим данным, в том числе и тогда, когда они представлены в виде таблицы. В таком случае нужен метод, благодаря которому можно было бы понять некоторые черты генеральной совокупности с первого взгляда. Этому требованию отвечает гистограмма. Организуя множество данных в гистограмму, можно получить общее представление о совокупности. Пример гистограмм можно видеть на рис. 1.

Рисунок 2 - Гистограммы

2 Построение гистограмм

Гистограммы - это графики частотных столбцов, которые показывают статистическую картину поведения процесса. Поэтому построению гистограммы предшествует построение таблицы частот.

2.1 Расчет данных для построения гистограмм

Этапы:

1 Вычисление выборочного размаха R.

Для этого выбираем наибольшее и наименьшее выборочные значения и вычисляем размах - R. 

2 Определение размеров классов.

Размеры классов определяются так, чтобы размах делился на интервалы равной ширины. Для получения ширины интервалов R делят на 1, 2 или 5 (либо 10, 20, 50; 0,1, 0,2, 0,5 и т.д.), чтобы получилось от 5 до 20 интервалов равной ширины. Если возникают две возможности, используют более узкий интервал при числе наблюдений 100 и больше, и более широкий - при 99 наблюдениях и меньше.

3 Подготовка бланка таблицы частот.

Готовят бланк (см. табл. 3), куда можно занести класс, среднюю точку, отметки частот, частоты и т.д.

4 Определение границ класса.

Определить границы интервалов так, чтобы они включали наименьшее и наибольшее значения и положить их в основу таблицы частот (см. табл. 3). Сначала требуется определить нижнюю границу первого класса и прибавить к ней ширину этого класса, чтобы получить границу между первым и вторым классами. После этого необходимо удостовериться, что первый класс включает наименьшее значение, и что его граничное значение приходится на середину принятой единицы. Далее, продолжая прибавлять найденный интервал к предыдущему значению для получения второй границы, затем третьей и т.д., можно удостовериться, что последний класс включает максимальное значение.

5 Вычисление середины класса.

Вычислить, воспользовавшись приведенной ниже словесной формулой, середины классов и записать их в таблицу частот (см. табл. 3):

  •  средняя точка первого класса равна сумме верхней и нижней границ первого класса, деленной пополам;
  •  средняя точка второго класса равна сумме верхней и нижней границ второго класса, деленной пополам; и т.д.

Середины второго, третьего и последующих классов можно еще получить и так:

  •  середина второго класса равна середине первого класса плюс ширина интервала класса;
  •  середина третьего класса равна середине второго класса плюс ширина интервала класса и т.д.

Примечания:

  •  если бы сумма частот ƒ (∑ƒ) оказалась неравной общему числу наблюдаемых значений (n), это означало бы, что в подсчет частот вкралась ошибка.
  •  если понадобятся относительные частоты, то их можно получить, деля абсолютные частоты ƒ на общее число наблюдений n.

6 Для получения частот надо подсчитать, какое количество значений из таблицы исходных данных попадает внутрь каждого из интервалов (2-ая колонка табл. 3) и записать частоты, приходящиеся на каждый интервал, используя наклонные черточки, сгруппированные по пять, как показано ниже:

Частота

1

2

3

Подсчет частоты

/

//

///

Частота

4

5

6

Подсчет частоты

////

////

//// /

Частота

7

8

9

Подсчет частоты

//// //

//// ///

//// ////

2.2 Построение гистограммы

Этапы:

1 Желательно взять лист бумаги в клеточку. Нанесите горизонтальную ось и выберите масштаб на этой оси. Не стоит ориентироваться при этом на интервалы классов, лучше основываться на единицах величин измеряемых данных. Это делается для удобства сравнений множества гистограмм, описывающих похожие факторы и характеристики, а также для сравнения гистограмм с допусками (стандартами).

На горизонтальной оси с обеих сторон (перед первым и после последнего интервалов) оставьте свободное место, приблизительно равное интервалу.

2 Разметьте левую вертикальную ось масштабом частот, а на правую (если понадобится) нанесите шкалу относительных частот. Высоту класса с максимальной частотой стоит выбирать так, чтобы она оказалась между расстояниями от максимума до минимума на горизонтальной оси.

3 Нанесите на горизонтальную ось границы классов.

4 Пользуясь интервалом класса как основанием, постройте прямоугольник, высота которого соответствует накопленной частоте этого класса.

5 Нанесите на график линию, представляющую среднее арифметическое, а также линии, представляющие границы допуска, если они есть.

6 На чистом поле гистограммы укажите происхождение данных (период, в течение которого собирались данные и т.п.), число данных n, среднее арифметическое х и среднее квадратичное отклонение s.

3 Чтение гистограмм

Наиболее типичные формы гистограмм приведены на рисунке 2 (а-ж):

Рисунок 2 – Типы гистограмм

а) Обычный тип (симметричный или колоколообразный)

Среднее значение гистограммы приходится на середину размаха данных. Наивысшая частота оказывается в середине и постепенно снижается к обоим концам. Форма симметрична.

Примечание. Это именно та форма, которая встречается чаще всего.

б) Гребенка (мультимодальный тип)

Классы через один имеют более низкие частоты

Примечание. Такая форма встречается, когда число единичных наблюдений, попадающих в класс, колеблется от класса к классу или когда действует определенное правило округления данных.

в) Положительно скошенное распределение (отрицательно скошенное распределение)

Среднее значение гистограммы локализуется слева (справа) от центра размаха. Частоты довольно резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма асимметрична.

Примечание. Такая форма встречается, когда нижняя (верхняя) граница регулируется либо теоретически, либо по значению допуска или когда левое (правое) значение недостижимо.

г) Распределение с обрывом слева (распределение с обрывом справа)

Среднее арифметическое гистограммы локализуется далеко слева (справа) от центра размаха. Частоты резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма асимметрична

Примечание. Это одна из тех форм, которые часто встречаются при 100 % -ном контроле изделий из-за плохой воспроизводимости процесса, а также когда проявляется резко выраженная положительная (отрицательная) асимметрия.

д) Плато (равномерное и прямоугольное распределения)

Частоты в разных классах образуют плато, поскольку все классы имеют более или менее одинаковые ожидаемые частоты с конечными классами.

Примечание. Такая форма встречается в смеси нескольких распределений, имеющих различные средние.

е) Двухпиковый тип (бимодальный тип)

В окрестностях центра диапазона данных частота низкая, зато есть по пику с каждой стороны.

Примечание. Такая форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями.

ж) Распределение с изолированным пиком

Наряду с распределением обычного типа появляется маленький изолированный пик

Примечание. Это форма, которая появляется при наличии малых включений данных из другого распределения, как в случае нарушения нормальности процесса, появления погрешности измерения или просто включения данных из другого процесса.

4 Нормальное распределение и его характеристики

Всякая гистограмма строится на основе некоторого числа данных. Но что произойдет с гистограммой, если наращивать число данных? Если интервал класса по мере роста числа данных будет все меньше и меньше, то сглаженная кривая распределения частот получится как предел распределения относительных частот. Она как раз и станет представлением для самой генеральной совокупности, поскольку получается из бесконечного числа данных.

Есть множество видов распределений, но самое типичное из них - нормальное распределение (рис. 3). Когда разброс характеристики качества обусловлен суммой большого числа независимых ошибок, вызванных различными факторами, то ее распределение во многих случаях получается приблизительно нормальным. Нормальное распределение можно легко узнать по колоколообразной форме, если:

1) его наибольшая частота приходится на середину интервала и плавно спадает к его концам (хвостам) т.е. большинство точек (данных) располагаются вблизи центральной линии или в середине;

2) центральная линия делит кривую на две симметричные половины;

3) лишь малое число точек разбросано далеко и относится к минимальным или максимальным значениям;

4) нет точек, лежащих за колоколообразной кривой.

Рисунок 3 - Форма нормального распределения

План работы

Провести исследование распределения содержания белка в молоке, поступающего на молочный завод:

  1.  Используя исходные данные (табл. 1) по содержанию белка, полученные в лаборатории при приемке сырья – молока построить таблицу частот (табл. 3);
  2.  Построить гистограмму распределения содержания белка в молоке;
  3.  Сделать вывод о качестве молока – сырья, поступающего на молочный завод от поставщиков, учитывая, что норма по данному показателю составляет – не менее 2,52 %.

Пример: 

Для исследования распределения содержания белка в молоке, поступающего на завод, были измерены 90 проб (n = 90) (табл.1).

Таблица 1 – Содержание белка в молоке – сырье, %

Номер выборки

Результаты измерений

1-10

2,510

2,517

2,522

2,510

2,511

2,519

2,532

2,543

2,525

2,522

11-20

2,527

2,536

2,506

2,541

2,512

2,515

2,521

2,536

2,529

2,524

21-30

2,529

2,523

2,523

2,523

2,519

2,528

2,543

2,538

2,518

2,534

31-40

2,520

2,514

2,512

2,534

2,526

2,530

2,532

2,526

2,523

2,520

41-50

2,535

2,523

2,526

2,525

2,532

2,522

2,502

2,530

2,522

2,514

51-60

2,533

2,510

2,542

2,524

2,530

2,521

2,522

2,535

2,540

2,528

61-70

2,525

2,515

2,520

2,519

2,526

2,527

2,522

2,542

2,540

2,528

71-80

2,531

2,545

2,524

2,522

2,520

2,519

2,519

2,529

2,522

2,513

81-90

2,518

2,527

2,511

2,519

2,531

2,527

2,529

2,528

2,519

2,521

1Расчет параметров гистограммы:

1.1 Определение выборочного размаха R.

Процесс поиска максимального и минимального значений в большом количестве исходных данных можно облегчить. Для этого надо сначала найти наибольшее и наименьшее значения в каждой строке таблицы исходных данных (табл. 2), а затем взять их них самое большое и самое маленькое значения. Это и будет максимум и минимум всех наблюдаемых значений. Выборочный размах R равен разности между максимальным и минимальным значениями:


Таблица 2 - Таблица для вычисления размаха

Номер выборки

Результаты измерений

Макс в строке

Мин в строке

1-10

2,510

2,517

2,522

2,510

2,511

2,519

2,532

2,543

2,525

2,522

11-20

2,527

2,536

2,506

2,541

2,512

2,515

2,521

2,536

2,529

2,524

21-30

2,529

2,523

2,523

2,523

2,519

2,528

2,543

2,538

2,518

2,534

31-40

2,520

2,514

2,512

2,534

2,526

2,530

2,532

2,526

2,523

2,520

41-50

2,535

2,523

2,526

2,525

2,532

2,522

2,502

2,530

2,522

2,514

51-60

2,533

2,510

2,542

2,524

2,530

2,521

2,522

2,535

2,540

2,528

61-70

2,525

2,515

2,520

2,519

2,526

2,527

2,522

2,542

2,540

2,528

71-80

2,531

2,545

2,524

2,522

2,520

2,519

2,519

2,529

2,522

2,513

81-90

2,518

2,527

2,511

2,519

2,531

2,527

2,529

2,528

2,519

2,521

Таким образом, R =

1.2 Определение размеров классов.

Для большей наглядности поведения изучаемого показателя, процесса, явления количество интервалов должно быть от 5 до 20. Размер класса можно определить путем деления размаха на выбранное удобное число интервалов. Можно наоборот размах разделить на несколько удобных значений размеров классов и выбрать тот, который дает нужное их количество.

Например, определим по второму способу размер класса, если R = 0,37, n = 50

0,37 ׃ 0,05 = 7,4;

0,37 ׃ 0,02 = 18,5;

0,37 ׃ 0,10 = 3,7.

Таким образом, в первом случае получили, округлив - 7, во втором - 19, в третьем – 4 класса. Между 5 и 20 имеется два значения: 7 и 19. Выбираем 7 интервалов, так как, если возникают две возможности, используют более узкий интервал при числе наблюдений 100 и больше, и более широкий - при 99 наблюдениях и меньше. В данном случае 0,05 против 0,02 для 50 наблюдений.

Используя вышеприведенный пример, определить число классов и размер интервала для данных по молоку.

______________________________

_______________________________

1.3 Заполнение таблицы частот (табл. 3).

1.3.1 Определяя классы, необходимо правильно выбрать минимальное значение. В нашем случае его лучше округлить до 2,500, затем прибавить найденный размер класса. Начало каждого класса должно быть на одну долю больше конца предыдущего класса, для того чтобы выборочные значения не могли принадлежать сразу двум соседним классам.

Например, если min = 45,25, а интервал =0,05, то:

1 класс 45,25 – 45,30;   либо   1 класс 45,250 – 45,300;

2 класс 45,31 – 45,35 и т.д.,    2 класс 45,301 – 45,350 и т.д.

1.3.2 Определяя середину класса, долю перехода из класса в класс не учитывают, то есть для первого класса суммируют оба значения и делят пополам, а для остальных берут максимальные значения предыдущего и данного класса.

Например,

1 класс ;

2 класс  и т.д.

13.3 Используя вышеуказанный пример, заполнить таблицу частот содержания белка в молоке.

Таблица 3 – Таблица частот

Номер класса

Класс

Середина класса

Подсчет частот

Частота ƒ

Итого

2 Построение гистограммы.

2.1 Используя данные таблицы частот и п 2.2 общих положений, построить гистограмму, показывающую распределение содержания белка в молоке, поступающего на молочный завод.

2.2 Рядом с гистограммой нанести информационные данные.

2.3 Нанести на гистограмму границы допусков в виде вертикалей, проходящих через предельные значения на оси абсцисс.

2.4 Нанести на гистограмму линию, показывающую среднее значение выборки.

Для получения более точного значения используют формулу:

.

Для ускорения расчетов среднее значение выборки считают по формуле:

,

где ƒ – количество частот (выборочных значений) в классе;

-среднее значение класса.

Для второго варианта удобно использовать следующую таблицу

Номер класса

Середина класса

Частота ƒ

ƒ

Итого

n =

Σ =

2.5 Определить тип гистограммы и есть ли смещение относительно центра размаха.

2.6 Определить количество брака и по содержанию белка сделать вывод о качестве молока – сырья, поступающего на молочный завод.

PAGE  7




1. а и женскую б. Инструкция к тесту Тест состоит из ряда утверждений касающихся отдельных сторон характер
2. повод для распродаж
3. - оценочные сведения - положительные тенденции в экономическом развитии страны - как должна развиваться
4. TYPHOID MRY Mry Mllon 18691938 ws n Irish immigrnt who ws the first known helthy crrier of typhoid in the US.
5. Monumentum
6. режим при котором нефть движется в пласте к скважинам под напором краевых или подошвенных вод
7. Тема 910 Теоретичні і методичні основи епідеміології надзвичайних ситуацій
8. реферату- Військові мости римлян на УкраїніРозділ- Архітектура Військові мости римлян на Україні На трьох
9. МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ для студентов педиатрического факультета ВВЕДЕНИЕ В КУРС СТОМАТОЛОГИИМЕТ
10. Деятельность таможенной системы Российской Федерации
11. Изобретение прядильных и ткацких машин
12. по теме Большая буква в именах собственных Подготовила- Белова Лариса Сергеевна у
13. Основные формы предпринимательской деятельности
14. Тема дипломного проекта дипломной работы Информационная система сопро
15. 20гпротокол Председатель подпись расшифровка подписи
16. тема программной документации ТРЕБОВАНИЯ К ПРОГРАММНЫМ ДОКУМЕНТАМ ВЫПОЛНЕННЫМ ПЕЧАТНЫМ СПОСОБОМ
17. Получают путем дистилляции и снижения содержания серы для чего удаляются все примеси меркаптанов очень ле
18. Автономная нервная система
19. агиасма святыня
20. вариантов инфекционных заболеваний