Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Кодирование звуковой информации
Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, завывание ветра и шелест листьев, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют люди начали догадываться очень давно. Еще древнегреческий философ и ученый - энциклопедист Аристотель, исходя из наблюдений, объяснял природу звука, полагая, что звучащее тело создает попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то разряжает, то уплотняет воздух, а из-за упругости воздуха эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны. Достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.
На слух человек воспринимает упругие волны, имеющие частоту где-то в пределах от 16 Гц до 20 кГц (1 Гц - 1 колебание в секунду). В соответствии с этим упругие волны в любой среде, частоты которых лежат в указанных пределах, называют звуковыми волнами или просто звуком. В учении о звуке важны такие понятия как тон и тембр звука. Всякий реальный звук, будь то игра музыкальных инструментов или голос человека, - это своеобразная смесь многих гармонических колебаний с определенным набором частот.
Колебание, которое имеет наиболее низкую частоту, называют основным тоном, другие - обертонами.
Тембр - разное количество обертонов, присущих тому или иному звуку, которое придает ему особую окраску. Отличие одного тембра от другого обусловлено не только числом, но и интенсивностью обертонов, сопровождающих звучание основного тона. Именно по тембру мы легко можем отличить звуки рояля и скрипки, гитары и флейты, узнать голос знакомого человека.
Музыкальный звук можно характеризовать тремя качествами: тембром, т. е. окраской звука, которая зависит от формы колебаний, высотой, определяющейся числом колебаний в секунду (частотой), и громкостью, зависящей от интенсивности колебаний.
Компьютер широко применяют в настоящее время в различных сферах. Не стала исключением и обработка звуковой информации, музыка. До 1983 года все записи музыки выходили на виниловых пластинках и компакт-кассетах. В настоящее время широкое распространение получили компакт-диски. Если имеется компьютер, на котором установлена студийная звуковая плата, с подключенными к ней MIDI-клавиатурой и микрофоном, то можно работать со специализированным музыкальным программным обеспечением.
Условно его можно разбить на несколько видов:
1) всевозможные служебные программы и драйверы, предназначенные для работы с конкретными звуковыми платами и внешними устройствами;
2) аудиоредакторы, которые предназначены для работы со звуковыми файлами, позволяют производить с ними любые операции - от разбиения на части до обработки эффектами;
3) программные синтезаторы, которые появились сравнительно недавно и корректно работают только на мощных компьютерах. Они позволяют экспериментировать с созданием различных звуков;
и другие.
К первой группе относятся все служебные программы операционной системы. Так, например, win 95 и 98 имеют свои собственные программы микшеры и утилиты для воспроизведения/записи звука, проигрывания компакт-дисков и стандартных MIDI - файлов. Установив звуковую плату можно при помощи этих программ проверить ее работоспособность. Например, программа Фонограф предназначена для работы с wave-файлами (файлы звукозаписи в формате Windows). Эти файлы имеют расширение .WAV . Эта программа предоставляет возможность воспроизводить, записывать и редактировать звукозапись приемами, аналогичными приемам работы с магнитофоном. Желательно для работы с Фонографом подключить микрофон к компьютеру. Если необходимо сделать звукозапись, то нужно определиться с качеством звука, так как именно от нее зависит продолжительность звукозаписи. Возможная продолжительность звучания тем меньше, чем выше качество записи. При среднем качестве записи можно удовлетворительно записывать речь, создавая файлы продолжительностью звучания до 60 секунд. Примерно 6 секунд будет продолжительность записи, имеющая качество музыкального компакт - диска.
А как же происходит кодирование звука? С самого детства мы сталкиваемся с записями музыки на разных носителях: грампластинках, кассетах, компакт-дисках и т.д. В настоящее время существует два основных способах записи звука: аналоговый и цифровой. Но для того чтобы записать звук на какой-нибудь носитель его нужно преобразовать в электрический сигнал.
Это делается с помощью микрофона. Самые простые микрофоны имеют мембрану, которая колеблется под воздействием звуковых волн. К мембране присоединена катушка, перемещающаяся синхронно с мембраной в магнитном поле. В катушке возникает переменный электрический ток. Изменения напряжения тока точно отражают звуковые волны.
Переменный электрический ток, который появляется на выходе микрофона, называется аналоговым сигналом. Применительно к электрическому сигналу «аналоговый» обозначает, что этот сигнал непрерывен по времени и амплитуде. Он точно отражает форму звуковой волны, которая распространяется в воздухе.
Звуковую информацию можно представить в дискретной или аналоговой форме. Их отличие в том, что при дискретном представлении информации физическая величина изменяется скачкообразно («лесенкой»), принимая конечное множество значений. Если же информацию представить в аналоговой форме, то физическая величина может принимать бесконечное количество значений, непрерывно изменяющихся.
Виниловая пластинка является примером аналогового хранения звуковой информации, так как звуковая дорожка свою форму изменяет непрерывно. Но у аналоговых записей на магнитную ленту есть большой недостаток - старение носителя. За год фонограмма, которая имела нормальный уровень высоких частот, может их потерять. Виниловые пластинки при проигрывании их несколько раз теряют качество. Поэтому преимущество отдают цифровой записи.
В начале 80-х годов появились компакт-диски. Они являются примером дискретного хранения звуковой информации, так как звуковая дорожка компакт - диска содержит участки с различной отражающей способностью. Теоретически эти цифровые диски могут служить вечно, если их не царапать, т.е. их преимуществами являются долговечность и неподверженность механическому старению. Другое преимущество заключается в том, что при цифровой перезаписи нет потери качества звука.
На мультимедийных звуковых картах можно найти аналоговые микрофонный предусилитель и микшер.
Цифро-аналоговое и аналого-цифровое преобразование звуковой информации.
Кратко рассмотрим процессы преобразования звука из аналоговой формы в цифровую и наоборот. Примерное представление о том, что происходит в звуковой карте, может помочь избежать некоторых ошибок при работе со звуком
Звуковые волны при помощи микрофона превращаются в аналоговый переменный электрический сигнал. Он проходит через звуковой тракт (см. приложения рисунок 1.11, схема 1) и попадает в аналого-цифровой преобразователь (АЦП) - устройство, которое переводит сигнал в цифровую форму.
В упрощенном виде принцип работы АЦП заключается в следующем: он измеряет через определенные промежутки времени амплитуду сигнала и передает дальше, уже по цифровому тракту, последовательность чисел, несущих информацию об изменениях амплитуды (.см. приложения рисунок 1.11, схема 2).
Во время аналого-цифрового преобразования никакого физического преобразования не происходит. С электрического сигнала как бы снимается отпечаток или образец, являющийся цифровой моделью колебаний напряжения в аудиотракте. Если это изобразить в виде схемы, то эта модель представлена в виде последовательности столбиков, каждый из которых соответствует определенному числовому значению. Цифровой сигнал по своей природе дискретен - то есть прерывист, поэтому цифровая модель не совсем точно соответствует форме аналогового сигнала.
Семпл - это промежуток времени между двумя измерениями амплитуды аналогового сигнала .
Дословно Sample переводится с английского как «образец». В мультимедийной и профессиональной звуковой терминологии это слово имеет несколько значений. Кроме промежутка времени семплом называют также любую последовательность цифровых данных, которые получили путем аналого-цифрового преобразования. Сам процесс преобразования называют семплированием. В русском техническом языке называют его дискретизацией.
Вывод цифрового звука происходит при помощи цифро-аналогового преобразователя (ЦАП), который на основании поступающих цифровых данных в соответствующие моменты времени генерирует электрический сигнал необходимой амплитуды (см. приложения рисунок 1.11, схема 3).
Параметры семплирования
Важными параметрами семплирования являются частота и разрядность.
Частота - количество измерений амплитуды аналогового сигнала в секунду.
Если частота семплирования не будет более чем в два раза превышать частоту верхней границы звукового диапазона, то на высоких частотах будут происходить потери. Это объясняет то, что стандартная частота для звукового компакт-диска - это частота 44.1 кГц. Так как диапазон колебаний звуковых волн находится в пределах от 20 Гц до 20 кГц, то количество измерений сигнала в секунду должно быть больше, чем количество колебаний за тот же промежуток времени. Если же частота дискретизации значительно ниже частоты звуковой волны, то амплитуда сигнала успевает несколько раз измениться за время между измерениями, а это приводит к тому, что цифровой отпечаток несет хаотичный набор данных. При цифро-аналоговом преобразовании такой семпл не передает основной сигнал, а только выдает шум.
В новом формате компакт-дисков Audio DVD за одну секунду сигнал измеряется 96 000 раз, т.е. применяют частоту семплирования 96 кГц. Для экономии места на жестком диске в мультимедийных приложениях довольно часто применяют меньшие частоты: 11, 22, 32 кГц. Это приводит к уменьшению слышимого диапазона частот, а, значит, происходит сильное искажение того, что слышно.
Если в виде графика представить один и тот же звук высотой 1 кГц (нота до седьмой октавы фортепиано примерно соответствует этой частоте), но семплированный с разной частотой (нижняя часть синусоиды не показана на всех графиках), то будут видны различия. Одно деление на горизонтальной оси , которая показывает время, соответствует 10 семплам. Масштаб взят одинаковый см. приложения рисунок 1.13). Можно видеть, что на частоте 11 кГц примерно пять колебаний звуковой волны приходится на каждые 50 семплов, то есть один период синусоиды отображается всего при помощи 10 значений. Это довольно неточная передача. В то же время, если рассматривать частоту оцифровки 44 кГц, то на каждый период синусоиды приходится уже почти 50 семплов. Это позволяет получить сигнал хорошего качества.
Разрядность указывает с какой точностью происходят изменения амплитуды аналогового сигнала. Точность, с которой при оцифровке передается значение амплитуды сигнала в каждый из моментов времени, определяет качество сигнала после цифро-аналогового преобразования. Именно от разрядности зависит достоверность восстановления формы волны.
Для кодирования значения амплитуды используют принцип двоичного кодирования. Звуковой сигнал должен быть представленным в виде последовательности электрических импульсов (двоичных нулей и единиц). Обычно используют 8, 16-битное или 20-битное представление значений амплитуды. При двоичном кодировании непрерывного звукового сигнала его заменяют последовательностью дискретных уровней сигнала. От частоты дискретизации (количества измерений уровня сигнала в единицу времени) зависит качество кодирования. С увеличением частоты дискретизации увеличивается точность двоичного представления информации. При частоте 8 кГц (количество измерений в секунду 8000) качество семплированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц (количество измерений в секунду 48000) - качеству звучания аудио- CD.
Если использовать 8-битное кодирование, то можно достичь точность изменения амплитуды аналогового сигнала до 1/256 от динамического диапазона цифрового устройства (28 = 256).
Если использовать 16-битное кодирование для представления значений амплитуды звукового сигнала, то точность измерения возрастет в 256 раз.
В современных преобразователях принято использовать 20-битное кодирование сигнала, что позволяет получать высококачественную оцифровку звука.
Вспомним формулу К = 2a . Здесь К - количество всевозможных звуков (количество различных уровней сигнала или состояний), которые можно получить при помощи кодирования звука а битами
а |
К |
Применение |
8 |
256 |
Недостаточно для достоверного восстановления исходного сигнала, так как будут большие нелинейные искажения. Применяют в основном в мультимедийных приложениях, где не требуется высокое качество звука |
16 |
65536 |
Используется при записи компакт-дисков,так как нелинейные искажения сводятся к минимуму. |
20 |
1048576 |
Где требуется высококачественная оцифровка звука |
Но эти данные истинны только для того сигнала, чей максимальный уровень 0 дБ. Если нужно семплировать сигнал с уровнем 6 дБ с разрядностью 16 бит, то для кодирования его амплитуды будет оставаться на самом деле только 15 бит. Если сигнал с уровнем 12 дБ, то 14 бит. С увеличением уровня сигнала увеличивается разрядность его оцифровки, а значит , уменьшается уровень нелинейных искажений (В технической литературе существует термин «шум квантования»), в свою очередь каждые 6 дБ уменьшающие уровень будут «съедать» 1 бит.
В настоящее время появился новый бытовой цифровой формат Audio DVD, который использует разрядность 24 бита и частоту семплирования 96 кГц. С его помощью можно избежать выше рассмотренного недостатка 16-битного кодирования.
На современные цифровые звуковые устройства устанавливаются 20-битные преобразователи. Звук так и остается 16-битным, преобразователи повышенной разрядности устанавливают для улучшения качества записи на низких уровнях. Их принцип работы заключается в следующем: исходный аналоговый сигнал оцифровывается с разрядностью 20 бит. Затем цифровой сигнальный процессор DSPП онижает его разрядность до 16 бит. При этом используется специальный алгоритм вычислений, при помощи которого можно снизить искажения низкоуровневых сигналов. Обратный процесс наблюдается при цифро-аналоговом преобразовании: разрядность повышается с 16 до 20 бит при использовании специального алгоритма, который позволяет более точно определять значения амплитуды. То есть звук остается 16-разрядным, но имеется общее улучшение качества звучания.
Кодирование звуковой информации
В аналоговой форме звук представляет собой волну с непрерывно меняющейся амплитудой и частотой. При преобразовании звука в цифровую форму производится временная дискретизация, при которой в определенные моменты времени амплитуда звуковой волны измеряется и квантуется, то есть ей присваивается определенное значение из некоторого фиксированного набора. Данный метод называется еще импульсно-кодовой модуляцией РСМ (Pulse Code Modulation).
Преобразование непрерывной звуковой волны в последовательность звуковых импульсов различной амплитуды производится с помощью аналого-цифрового преобразователя, размещенного на звуковой плате. 16-битные звуковые карты обеспечивают возможность кодирования 65536 различных уровней громкости или 16-битную глубину кодирования. Качество кодирования звука зависит и от частоты дискретизации количества измерений уровня сигнала в единицу времени. Эта величина может принимать значения от 8 до 48 кГц.
Пример 1: Оцените информационный объем высококачественного стереоаудиофайла длительностью звучания 1 минута, если «глубина» кодирования 16 бит, а частота дискретизации 48 кГц.
Решение: Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит • 48000 • 2 = 1536000 бит = 187,5 Кбайт.
Информационный объем звукового файла длительностью 1 минута равен:
187,5 Кбайт /с • 60 с ≈ 11 Мбайт.
Пример 2: Запишите звуковой файл длительностью 1 минута с «глубиной» кодирования 16 бит и частотой дискретизации 48 кГц. Сравните его объем с вычисленным значением в предыдущем примере.
Решение: Запишем звуковой файл с помощью стандартного приложения Звукозапись:
В раскрывающемся списке Атрибуты: выберите качество дискретизации, например, 48 кГц; 16 бит; Стерео.
Записанные звуковые файлы можно редактировать, то есть вырезать, копировать и вставлять фрагменты файла. Кроме того, можно увеличивать или уменьшать громкость, применять различные звуковые эффекты (эхо, уменьшение или увеличение скорости воспроизведения, воспроизведение в обратном направлении и др.), а также накладывать файлы друг на друга (микшировать). Можно также изменять качество звука путем уменьшения или увеличения глубины кодирования и частоты дискретизации. Для редактирования звуковых файлов применяются специальные программы звуковые редакторы.
Решение:
Задача № 2
Подсчитать время звучания звукового файла объемом 3.5 Мбайт, содержащего стереозапись с частотой дискретизации 44 100 Гц и разрядностью кода 16 бит на 1 измерение. (Ответ= 20,805 сек)
Решение:
Примеры
Задача 1
Подсчитать, сколько места будет занимать одна минута цифрового звука на жестком диске или любом другом цифровом носителе, записанного с частотой
а) 44.1 кГц;
б) 11 кГц;
в) 22 кГц;
г) 32 кГц
и разрядностью 16 бит.
Решение
Если записывают моносигнал с частотой 44.1 кГц, разрядностью 16 бит (2 байта), то каждую минуту аналого-цифровой преобразователь будет выдавать 441000 * 2 * 60 = 529000 байт (примерно 5 Мб) данных об амплитуде аналогового сигнала, который в компьютере записываются на жесткий диск. Если записывают стереосигнал, то 1058000 байт (около 10 Мб)
Для частот 11, 22, 32 кГц расчеты производятся аналогично.
Задача 2
Какой информационный объем имеет моноаудиофайл, длительность звучания которого 1 секунда, при среднем качестве звука (16 бит, 24 кГц)?
Задача 3
Рассчитайте объем стереоаудиофайла длительностью 20 секунд при 20-битном кодировании и частоте дискретизации 44.1 кГц.
Задача 4
Определить количество уровней звукового сигнала при использовании устаревших 8-битных звуковых карт.
Задание №5 |
Какой информационный объем имеет моноаудиофайл, длительность звучания которого 1 секунда, при среднем качестве звука (16 бит, 24 кГц)? Показать ответ Правильный ответ: 47Кб |
Задание №6 |
Оцените информационный объем высокачественного стереоаудиофайла длительностью звучания 1 минута, если "глубина" кодирования 16 бит,а частота дискретизации 48 кГц. |
Вариант 1.
1. Оцените информационный объем моноаудиофайла длительностью звучания 1 мин, если «глубина» кодирования и частота дискретизации звукового сигнала равны соответственно: 16 бит и 8 кГц.
2. Найдите х из следующего соотношения: 16х бит = 32 Мбайт.
3. Проверьте, является ли формула противоречием: (АВ)(АСВ).
Вариант 2.
1. Определите частоту дискретизации, если известно, что при 16-битном кодировании объем моноаудиофайла длительностью звучания в 10 сек. равен 940 Кбайт.
2. Заполните пропуски числами: 5 Кбайт = _____ байт = _____ бит.
3. Постройте таблицу истинности для следующей формулы: (АВ(СА).
Вариант 3.
1. Рассчитайте время звучания моноаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен 700 Кбайт.
2. Переведите число 245 из шестеричной системы счисления в девятеричную.
3. Проверьте, является ли формула тавтологией: А(ВСА).
Вариант 4.
1. Оцените информационный объем стереоаудиофайла длительностью звучания 1 мин, если «глубина» кодирования и частота дискретизации звукового сигнала равны соответственно: 16 бит и 24 кГц.
2. Найдите х из следующего соотношения: 8х Кбайт = 16 Гбайт.
3. Проверьте, является ли формула законом логики: (ВС)АВС.
Вариант 5.
1. Определите частоту дискретизации, если известно, что при 16-битном кодировании объем стереоаудиофайла длительностью звучания в 10 сек. равен 157 Кбайт.
2. Заполните пропуски числами: _____ Кбайт = _____ байт = 12288 бит.
3. Проверьте, является ли формула противоречием: (ВСАВС).
Вариант 6.
1. Рассчитайте время звучания стереоаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен 6300 Кбайт.
2. Переведите число 624 из семеричной системы счисления в троичную.
3. Постройте таблицу истинности для следующей формулы: А(ВАС).
Вариант 7.
1. Оцените информационный объем моноаудиофайла длительностью звучания 2 мин, если «глубина» кодирования и частота дискретизации звукового сигнала равны соответственно: 8 бит и 22,050 кГц.
2. Заполните пропуски числами: _____ Гбайт = 1536 Мбайт = _____ Кбайт.
3. Проверьте, является ли формула тавтологией: ВСА(ВС).
Вариант 8.
1. Определите частоту дискретизации, если известно, что при 8-битном кодировании объем моноаудиофайла длительностью звучания в 30 сек. равен 210 Кбайт.
2. Переведите число 1110011 из двоичной системы счисления в двенадцатеричную.
3. Проверьте, является ли формула законом логики: (СВ)(АВС).
Вариант 9.
1. Оцените информационный объем моноаудиофайла длительностью звучания 1 мин, если «глубина» кодирования и частота дискретизации звукового сигнала равны соответственно: 16 бит и 8 кГц.
2. Найдите х из следующего соотношения: 16х бит = 32 Мбайт.
3. Проверьте, является ли формула противоречием: (АВ)(АСВ).
Вариант 10.
1. Определите частоту дискретизации, если известно, что при 16-битном кодировании объем моноаудиофайла длительностью звучания в 10 сек. равен 940 Кбайт.
2. Заполните пропуски числами: 5 Кбайт = _____ байт = _____ бит.
3. Постройте таблицу истинности для следующей формулы: (АВ(СА).
Вариант 11.
1. Рассчитайте время звучания моноаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен 700 Кбайт.
2. Переведите число 245 из шестеричной системы счисления в девятеричную.
3. Проверьте, является ли формула тавтологией: А(ВСА).
Вариант 12.
1. Оцените информационный объем стереоаудиофайла длительностью звучания 1 мин, если «глубина» кодирования и частота дискретизации звукового сигнала равны соответственно: 16 бит и 24 кГц.
2. Найдите х из следующего соотношения: 8х Кбайт = 16 Гбайт.
3. Проверьте, является ли формула законом логики: (ВС)АВС.
Вариант 13.
1. Определите частоту дискретизации, если известно, что при 16-битном кодировании объем стереоаудиофайла длительностью звучания в 10 сек. равен 157 Кбайт.
2. Заполните пропуски числами: _____ Кбайт = _____ байт = 12288 бит.
3. Проверьте, является ли формула противоречием: (ВСАВС).
Вариант 14.
1. Рассчитайте время звучания стереоаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен 6300 Кбайт.
2. Переведите число 624 из семеричной системы счисления в троичную.
3. Постройте таблицу истинности для следующей формулы: А(ВАС).
Вариант 15.
1. Оцените информационный объем моноаудиофайла длительностью звучания 2 мин, если «глубина» кодирования и частота дискретизации звукового сигнала равны соответственно: 8 бит и 22,050 кГц.
2. Заполните пропуски числами: _____ Гбайт = 1536 Мбайт = _____ Кбайт.
3.Проверьте, является ли формула тавтологией: ВСА(ВС).