Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
26. Аналоговая и цифровая строки, их временные соотношения и состав.
В течение цифровой строки передается два опорных синхросигнала TRS: один перед началом каждой активной строки НАС (StartofActiveVideo, SAV), а другой после окончания каждой активной строки конец активной строки КАС (EndofActiveVideo, EAV).
27. Параметры цифровых сигналов ТСЧ: (бит/с), .
В современной технологии обработки сигнала в студии применяются ком-
понентные цифровые сигналы для создания всех возможных эффектов (спецэф-
фектов), а на последней стадии они преобразуются в аналоговые и кодируются
по той системе цветного ТВ, которая принята в данной стране. В этом случае ƒД
выбирают ƒД>2Fв=13,5 МГц независимо от стандарта 625/50 или 525/60*. Дока-
жем обоснованность такого выбора.
При выборе ƒДисходят из двух условий. Во-первых, частота дискретизации
должна удовлетворять теореме отсчетов (6.1), т.е. быть равной не менее 12 МГц.
Во-вторых, она должна быть кратной частоте строк
ƒД= n1 ƒСТР.1= n2ƒСТР.2
Наименьшее общее кратное ƒНОК для 15625 Гц и 15734,25Гц является
ƒНОК= k1·15625 = k2·15734,25 = 144·15625 = 143·15734,25 = 2,25 МГц
Ближайшим значением ƒД, удовлетворяющем условиям (6.1) и (6.37), т.е.
ƒД≥ 2FВ и ƒД = nƒСТР, является
ƒД= k3ƒНОК.
в котором k3> 5 для выполнения требования (6.1).
Таким образом, значение частоты дискретизации равно
ƒД = 6 ƒНОК= 6·2,25 = 13,5 МГц.
Количество уровней квантования выбирается предварительно в соответст-
вии с законом Вебера-Фехнера: число различаемых уровней яркости (полуто-
нов), которые можно разместить (и поочередно наблюдать) в диапазонах яркости
L, от Lmin до Lmax определяется по известному выражению
Количество уровней квантования выбирается предварительно в соответст-
вии с законом Вебера-Фехнера: число различаемых уровней яркости (полуто-
нов), которые можно разместить (и поочередно наблюдать) в диапазонах яркости
L, от Lmin до Lmax определяется по известному выражению
M=lnK/ln(1+δ)
где K контраст изображения, K = Lmax /Lmin,
d пороговый контраст. Его значение для крупных деталей с яркостями,
имеющими место в кино и телевидении, равно 0,02 0,05.
Для того, чтобы при квантовании не возникали ложные узоры (контуры),
особенно заметные на участках постоянной или медленно изменяющейся ярости
необходимо выполнить условие
(Li+1-Li) ˂ ΔL
где Li, Li+1 значения яркостей, соответствующих соседним уровням квантования;
ΔL разностный порог, который показывает, что различие по яркости не
должно превышать 2%.
Это свойство зрения (и других систем анализа ощущений) называют зако-
ном Вебера-Фехнера и выражают постоянством так называемого дифференци-
ального или порогового контраста:
δ= ΔL/LФ=const
где Lф яркость фона или яркость участка сравнения, т.е. Li.
Если в (6.47) подставить значение К = 100 и d = 0,02, то получается значе-
ние, равное 230, что соответствует обычно предлагаемой норме
М = 2m= 28= 256,
(6.49)
где m разрядность двоичного кода, которым представляется любой отсчет,
имеющий разрешенный уровень в пределах от 0 до 255.
Определим скорость C цифрового потока для стандарта 4:2:2, в котором в
строке содержится nY= 864 отсчета сигнала яркости и по nЦРС= 432 отсчета ЦРС,
то есть всего
n∑= nY+ 2 nЦРС= 864 + 2·432 = 1728
(6.44)
отсчетов, каждый из них после квантования и кодирования будет представлен m-
разрядным кодовым словом. При этом на активную часть строки приходится
1440 отсчетов. Следовательно, каждую секунду передается n∑/ ТСТР1 кодовых
слов или
221
CК.С.= n∑·ƒCТР.1= 1728 · 15625 = 27 М код. слов/с.
(6.45)
При 8(10)-разрядном кодировании (квантовании на 256 (1024) уровней)
скорость цифрового потока составит
C = CК.С. · m = 27 · 8 (10) = 216 (270) Мбит/с.
(6.46)
Варианты 4:1:1 и 4:2:0 имеют одинаковые скорости С цифровых потоков,
равные С4:1:1= 13,5·8 + 3,375·8 + 3,375·8 = 162 Мбит/с и С4:2:0= 13,5·8 + 6,75·8 =
= 162 Мбит/с, но в первом ЦРС передаются в каждой строке одновременно, а во
втором поочередно через строку. При m = 10 скорости будут равны по
202,5 Мбит/с
28. Взаимосвязь между скоростью цифрового потока, тактовой частотой и требуемой шириной полосы канала.
Цифровые системы допускают временное уплотнение нескольких (n) сиг-
налов, называемое временным разделением каналов (ВРК), например, левого и
208
правого при стереофонии. В этом случае (когда n = 2) импульсы дискретизации
второго канала сдвигаются по времени на Δt = ТД / 2, а длительность символов в
каждом цифровом сигнале уменьшается в 2 раза, чтобы за период дискретизации
передать 2m двоичных символов. В общем случае в системах с ИКМ ВРК так-
товая частота равна
fTn = l /(TД/m×n) = l /(TT/n) = nfT,
где
fТ тактовая частота в одноканальной системе,
ТД период дискретизации, не зависящей от числа уплотняемых сигналов.
Скорость передачи информации С при ИКМ прямо пропорциональна fД и коли-
честву разрядов m кодовой комбинации:
С = fД ×log2 M= fД×m , бит/с.(6.4)
Частота дискретизации fД и число уровней квантования М (или разрядность
кода m) зависят от вида аналогового сигнала и назначения системы или устрой-
ства. При телефонной связи, когда достаточно обеспечить разборчивость речи,
звуковые сигналы передаются в полосе частот 300…3400 Гц. Поэтому частота
дискретизации fД выбрана равной 8 кГц, Число уровней квантования М = 256,
разрядность кодовых комбинаций m = log2 256 = 8. В этом случае скорость циф-
рового потока составляет С = fД×m = 64 кбит/с (таблица 6.1).
Таблица 6.1 Частота дискретизации и разрядность двоичного кода в некоторых
системах передачи информации и цифровой аппаратуры
Конечное число уровней квантования М и, соответственно, разрядности
кода m является причиной появления ш у м о в к в а н т о в а н и я. При равно-
мерной шкале квантования и равновероятных значениях уровней сигнала отно-
шение (в дБ) мощности сигнала РС к мощности шума квантования РШ.КВ.опреде-
ляется выражением:
РС/РШ.КВ.= 6,02m 20 1g K+ 4,8 дБ,
где К пик-фактор сигнала, равный отношению амплитудного значения сигнала
к эффективному.
Его численное значение зависит от вида передаваемого сообщения: для си-
нусоидального сигнала К= √2 (3 дБ); для многоканального телефонного 4
(12 дБ); для речевого 5 (14 дБ). Для звукового вещания К зависит от жанра про-
граммы, его среднее значение 4,5 (13 дБ). Поэтому для вещательного сигнала
Рс/РШ.КВ.= 6,02m 8,2, дБ.
Следовательно, при 14-, 15- или 16-разрядном кодировании обеспечивается
отношение сигнал/шум: 75,8; 81,8 или 87,8 дБ. Из этих выражений следует, что
увеличение числа разрядов m на единицу ведёт к улучшению отношения сиг-
нал/шум квантования на 6 дБ, так как приращение D(Рс/РШ.КВ)пропорционально
6,02m. Скорость цифрового потока при переходе, например, от 14 разрядов ко-
дирования к 15 увеличивается всего на 7 %, так как приращение DС = fД(m2
m1), что в процентах составляет D(С/С1)·100% = [(m2 m1)/m1]·100%. Это является
особенностью импульсно-кодовой модуляции, т. к. ни один другой метод не по-
зволяет так заметно улучшать помехозащищённость за счёт небольшого увели-
чения скорости цифрового потока. Скорость цифрового потока при m = 16 и fД=
=48 кГц составляет: С=48×16=768 кбит/с; при fД=32 кГц С=32×16=512 кбит/с.
Полоса частот канала связи, необходимая для передачи цифрового сигнала, при-
ближённо определяется выражением ΔfK примерно равно 0,7 С
Полученный цифровой сигнал на выходе ИКМ-кодера непосредственно в
линию связи не подаётся и для записи не используется. В нём предварительно
уменьшается избыточность информации, в него вводятся дополнительные слу-
жебные разряды для управления, индикации и синхронизации, корректирующие
коды для защиты от помех и ошибок, осуществляется канальное кодирование.
Последняя операция является обязательной, т. к. согласовывает параметры циф-
рового сигнала и канала связи, а также упрощает выделение колебания тактовой
частоты fТ на приёмной стороне (зная fT, можно сосчитать количество «1» и «0» в
кодовой комбинации и определить значения амплитуд отсчётов). Это увеличива-
ет количество символов в кодовой комбинации на интервале ТД и скорость пере-
дачи.
30. Необходимость уменьшения избыточности в ТВ сигнале: классификация способов и их физическое объяснение.
Избыточность изображений
Типичное изображение, впрочем, как и сформированный телевизионный
сигнал, содержит очень много избыточной информации, что заметно даже при
беглом взгляде. Эта избыточность приводит к экономическим потерям. Ширина
полосы частот, необходимая для передачи изображения в цифровой форме, за-
висит от числа отсчетов изображения, разрядности отсчетов, времени, отведен-
ного на передачу, и от мощности передатчика. С расширением полосы увеличи-
ваются необходимая мощность передатчика и расходы. Деньги и энергия не яв-
ляются проблемой, но электромагнитный спектр предельно загружен. Поэтому
сокращение избыточности при передаче изображений является очень важной
задачей. Столь же важно оно и для хранения изображений в цифровом виде.
Избыточность различают:
- структурную;
- статистическую;
- психофизическую визуальную.
Структурная избыточность определяется TV-стандартом, где определены
fгр, число строк/полей в секунду и т.д. При цифровой передаче изображения нет
необходимости использования кадровых и строчных гасящих импульсов, т.е.
объем информации, передаваемой в секунду, можно сократить за счет исклю-
чения пассивной части полного TV-сигнала. Для fгр= 6 МГц уменьшение скоро-
сти передачи за счет устранения структурной избыточности составляет около
25%.
Статистическая избыточность изображения связана с корреляцией, а, сле-
довательно, и предсказуемостью данных между пикселями в одной строке, в
соседних строках, соседних кадрах. Эта избыточность может быть устранена
без потери информации, а исходное изображение полностью восстановлено.
Так, большая часть изображения одного кадра приходится на фон или задний
план, где яркость постоянна или мало меняется в пространстве. Изображения в
соседних кадрах также малоразличимы даже при наличии движущихся изобра-
жений. Тогда, зная распределение яркости в одной строке (кадре), можно с вы-
сокой вероятностью предсказать распределение яркости в следующей строке
(кадре).
Визуальная (психофизическая) избыточность связана с использованием
свойств зрения, позволяющих устранить часть информации об изображении, не
существенно влияющей на его восприятие. Так, шумы квантования различают-
ся глазом на крупных деталях изображения в виде ложных контуров, однако
малозаметны на мелких деталях и на резких перепадах яркости. Это позволяет
вводить более грубое квантование видеосигнала в окрестнотях переходов ярко-
сти и высокочастотных компонент. Устранение визуальной избыточности изо-
бражений является основным резервом при сжатии изображения. К примеру
цветовая разрешающая способность в 4 раза меньше, чем по сигналу яркости.
Классификация методов устранения избыточности
Целью цифрового сжатия является сокращение объема информации опи-
сывающей, телевизионное изображение, без заметного для глаза ухудшения ка-
чества Сокращение возможно благодаря значительной информационной избы-
точности, заключенной в видеосигнале, и свойствам человеческого зрения, не
воспринимающего отдельные детали изображения. Устранение несущественной
части является необратимым процессом, который характеризуется потерей ин-
формации, в отличии от исключения статистической избыточности, не связан-
ного с потерей информации.
Методы компрессии видеоизображений представлены на рисунке 6.20.
Рисунок 6.20 Классификация методов компрессии видеосигналов
Статистическое кодирование
Методы устранения статистической избыточности не дают сжатие более
3:1. В компьютерной технике для архивации данных давно используется коди-
рование LZW (Лемпеля Зива Уолша), не приводящее к потере информации и
пригодное для сжатия данных любого рода. Кодирование начинается с построе-
ния кодового дерева из короткого блока входного потока данных. Затем проверя-
ется, содержат ли последующие блоки данных кодовые слова из дерева. Если да,
то строятся новые кодовые слова как комбинация существующих и посылаются
только их адреса. Такое построение кодовых слов от кодовых слов приводит к
сжатию длинных последовательностей до коротких адресов. Метод требует гро-
моздких расчетов и не применяется в цифровом телевидении.
К этой же группе кодов, сжимающих без потери информации, относятся
коды с переменной длиной кодового слова и самый известный из них код
Хаффмана. Он присваивает словам с наибольшей вероятностью появления ко-
роткие кодовые комбинации, а более редким словам более длинные. Например,
пусть алфавит источника насчитывает четыре символа a, b, c, d с вероятностями
появления соответственно 0,5, 0,25, 0,125, 0,125. Если каждому из символов при-
своить двухбитовые значения 00, 01, 10, 11, средняя длина кодового слова соста-
вит 2 бита на символ. Присвоив символу а значение 0, символу b значение 10,
символам c и d значения соответственно 110 и 111, то в среднем для передачи
одного символа расходуется 1×0,5 + 2×0,25 + 2×3×0,125 = 1,75 бит. Хотя макси-
мальная длина символа возросла, число битов, необходимых для передачи сооб-
щения, сократилось. По своей Эффективности код приближается к теоретиче-
скому пределу расхода битов и потому называется энтропийным. Адаптивная
версия кода Хаффмана применяется в том случае, когда вероятность появления
кодовых слов изменяется в процессе передачи.
К группе энтропийных относится и так называемый арифметический код.
Процедура кодирования которого, состоит в том, что всей совокупности симво-
лов сообщения ставится в соответствие интервал [0,1]. Этот интервал разбивает-
ся на участки, соответствующие новым вероятностям символов, и это разбиение
сообщается декодеру. После поступления очередного символа интервал пересчи-
тывается на новые пределы, соответствующие вероятности появления этого сим-
вола, и вновь разбивается пропорционально исходным вероятностям. С поступ-
лением каждого нового символа размер интервала уменьшается, причем в стро-
гом соответствии с вероятностями символов. Более часто встречающиеся симво-
лы меньше сужают интервал, чем редкие и добавляют меньше битов в код ин-
тервала. По окончании цикла кодирования формируется некоторый узкий интер-
вал, однозначно характеризующий передаваемую последовательность символов,
и она легко может быть восстановлена в декодере по любому числу из этого ин-
тервала.
Кодированием длин серий называется присвоение длинным непрерывным
последовательностям одинаковых бита отдельных кодовых слов. Этот метод эф-
фективен при дискретно-косинусном преобразовании, когда значительная часть
коэффициентов принимает нулевые значения.
Кодирование с преобразованием
Эффективным методом сжатия изображения является групповое кодирова-
ние с преобразованием. При этом преобразование проводится сразу над группой
пикселей в пределах кадра (или поля) изображения. Массив отсчетов изображе-
ния трансформируется в матрицу коэффициентов. Преимущества кодирования,
получаемые в результате преобразования коэффициентов, заключаются в сле-
дующем:
- значительное количество элементов матрицы коэффициентов имеют
нулевое значение;
- декорреляция связей между пикселями, достигаемая в результате пре-
образования, повышает эффективность статистического кодирования;
- нелинейное квантование коэффициентов, учитывающее психофизиче-
ские особенности визуального восприятия искажений, дополнительно
позволяет сократить объем передаваемой информации без заметного
изменения качества изображения.
Преобразование изображения следует рассматривать как его разложение в
обобщенный двумерный спектр по базисным функциям, где амплитуда каждой
спектральной составляющей характеризует яркость. При этом разложение может
проводиться по различным ортогональным функциям. Здесь рассмотрим наибо-
лее известные преобразования, используемые в реальной аппаратуре.
Дискретное косинусное преобразование (ДКП) является модификацией
дискретного преобразования Фурье и обладает полезными свойствами. Во-
первых, матрица ДКП хорошо апроксимирует матрицу оптимального декоррели-
рующего преобразования Карунена Лоэва и обладает практически такой же
эффективностью, как оптимальное преобразование. Во-вторых, ДКП реализуется
с помощью быстрых преобразований, что существенно снижает вычислительные
затраты на его реализацию по сравнению с оптимальным преобразованием.
После операции ДКП коэффициенты могут принимать не целые значения,
однако дальнейшая обработка требует квантованного представления этих коэф-
фициентов. Проведение процедуры квантования коэффициентов следует прово-
дить с учетом психофизических особенностей зрения. Как уже отмечалось, зри-
тельное восприятие допускает больший уровень шумов и ошибок квантования в
области изображений с большим уровнем высокочастотных компонент. Это оз-
начает, что коэффициенты этих компонент можно квантовать на малое число
уровней, в пределе на два. Постоянная составляющая и амплитуды низкочастот-
ных компонент квантуются на большое число уровней и передаются с высокой
точностью.
Финальной операцией при квантовании является Z-упорядочивание, при
котором оставшиеся коэффициенты выстраиваются в последовательности воз-
растания пространственных частот. Если пространственные частоты одинаковы,
то впереди ставятся коэффициенты для меньших вертикальных частот. Из ряда
коэффициентов образуются пары чисел, одно из которых равно ненулевому ко-
эффициенту, а другие числу предшествующих этому элементу нулей. Далее эти
сочетания чисел кодируются кодом Хаффмана.
Особо большое развитие получило применение вейвлетов для решения за-
дач сжатия и обработки изображений, являющихся нестационарными по своей
природе. В этой области применение преобразований позволило достичь одно-
временного снижения сложности и повышения эффективности кодеров. Их ны-
нешний успех объясняется несколькими причинами. С одной стороны, концеп-
ция вейвлетов может рассматриваться как синтез идей, возникших за последние
двадцать или тридцать лет в технике, физике и чистой математике. С другой сто-
роны, вейвлеты являются довольно простым математическим инструментом с
большим разнообразием возможностей для применения.
Обычно под вейвлетами понимаются функции, сдвиги и растяжения кото-
рых образуют базис многих важных пространств.
Вейвлеты могут быть ортогональными, полуортогональными и биортого-
нальными. Эти функции могут быть симметричными, асимметричными и не-
симметричными. Для кодирования изображений используют биортогональные
вейвлеты.
При Wavelet-преобразовании, также как и при ДКП, осуществляется пере-
ход из плоскости изображения в двумерную частотную область. В отличие от
ДКП это переход осуществляется с помощью гребенки цифровых фильтров.
Блочная структура шумов квантования более ярко проявляется при больших сте-
пенях сжатия, представляющих наибольший интерес в приложениях к специаль-
ной технике.
Сигнал изображения разделяется по спектру на две равные части с помо-
щью фильтров нижних и верхних частот. Поскольку НЧ- и ВЧ- компоненты
имеют полосу в два раза меньше, чем у исходного сигнала, то их частота дискре-
тизации может быть понижена в два раза. Входной сигнал на рисунке 6.22 явля-
ется цифровым, поэтому после цифровой НЧ- и ВЧ- фильтрации производится
децимация (исключение каждого второго отсчета).
После каждого из трех этапов преобразования изображение делится на од-
ну низкочастотную и три высокочастотные компоненты. Первая компонента
отображает горизонтальные высокочастотные составляющие изображения, вто-
рая компонента отображает вертикальные составляющие, третья высокочастот-
ная компонента связана с диагональными пространственными частотами и ото-
бражает яркостные переходы.
Поскольку после каждой процедуры фильтрации количество отсчетов на
выходе фильтра уменьшается в два раза, то результирующее количество отсчетов
на выходе всей гребенки фильтров в точности равно количеству отсчетов в ис-
ходном изображении. Таким образом, при W-преобразовании кадр изображения
переводится в частотную область, где описывается тем же количеством отсчетов,
как и до преобразования. Для кодирования спектральных отсчетов изображения,
полученных в результате W-преобразования, используются те же принципы, что
и при ДКП.
Для восстановления исходного изображения каждая компонента растяги-
вается, т.е. после каждого значащего отсчета вставляется нулевой отсчет.
Затем осуществляется аналогичная рассмотренной выше НЧ- и ВЧ- фильт-
рация, в результате которой нулевые отсчеты заменяются интерполированными.
Кодирование с предсказанием
В результате дискретизации изображения и квантования по уровню фор-
мируются 8-битные слова для представления каждого пикселя. При этом пред-
ставлении используется импульсно-кодовая модуляция (ИКМ). Однако кодиро-
вание на основе ИКМ не позволяет сократить объем исходной информации, т.к.
оно не учитывает корреляционные связи между пикселями. Более эффективной
является дифференциальная ИКМ (ДИКМ). Структурная схема, поясняющая ал-
горитм ДИКМ, представлена на рисунке 6.24.
Рисунок 6.24 - Схема, поясняющая алгоритм ДИКМ
При ДИКМ вместо передачи значения Xn яркости n-го пикселя передается
разность между Xn и его оценкой ошибка предсказания.
Оценка формируется с использованием предсказателя, алгоритм работы
которого должен быть согласован со статистикой передаваемого изображения.
Наибольшее распространение получили методы линейного предсказания.
где αi коэффициенты, получаемые на основе корреляционных связей между
пикселями.
Коэффициенты αi подбираются исходя из функции корреляции пикселей
таким образом, чтобы минимизировать среднеквадратическое значение ошибки
предсказания εn. Диапазон изменения εn существенно меньше диапазона измене-
ния исходных пикселей изображения. Поэтому при одной и той же ошибке кван-
тования для передачи εn требуется меньшее количество уровней квантования, а
следовательно и меньшее количество бит для кодирования. На некоторых изо-
бражениях, например, фон одинаковой яркости, величина ошибки может быть
вообще равна нулю и для передачи таких изображений скорость цифрового по-
тока снижается практически до нуля.
Для кодирования простых изображений используется дельта модуляция
(ДМ). При ДМ предсказание производится только по одному пикселю, а кванто-
вание ошибки предсказания производится на два уровня, т.е. каждый пиксель
кодируется одним битом вместо 8.
На практике метод ДИКМ применяется для межкадрового кодирования. В
стандартном телевизионном сигнале кадры следуют с частотой 25 Гц, т.е. оче-
редной кадр передается через 40 мс. За столь короткий интервал времени изо-
бражение в соседних кадрах практически не успевает измениться. Поэтому весь-
ма эффективно кодировать разность между пикселями изображения, имеющими
одинаковые координаты в соседних кадрах.
В пределах кадра используются методы кодирования с преобразованием,
рассмотренные выше.
Здесь для сформирования вектора оценки в обратной связи использует де-
квантователь и обратный дискретный косинусный преобразователь, которые
восстанавливают блок изображения точно так же, как и в декодере.
Для улучшения результатов предсказания применяют процесс, называемый
компенсацией движения.
При передаче сюжета происходит изменение положения отдельных частей
кадра из-за их движения, это уменьшает межкадровую корреляцию и снижает
точность предсказания. Таким образом, возникает задача оценки вектора движе-
ния и его компенсации. Такая оценка получается проецированием блока на
опорное изображение и сравнением со всеми блоками предыдущего кадра. Сме-
щение между проецируемым блоком и опорным изображением по осям x и y оп-
ределяет вектор движения. Эта информация используется для предсказания сле-
дующего кадра.
Здесь предсказатель работает с учетом информации, полученной от
блока оценки вектора движения ОВ.
Вектор движения кодируется кодом Хаффмана, мультиплексируется и пе-
редается вместе с основным потоком через буфер БУФ, от которого имеется
обратная связь на квантователь. Эта связь обеспечивает постоянную скорость
цифрового потока. При возрастании уровня детальности изображения (высоко-
частотных компонент) число ненулевых элементов матрицы увеличивается и
возрастает скорость цифрового потока, следовательно, буфер заполняется с по-
вышенной скоростью. Обратная связь делает квантование более грубым и ско-
рость поступления данных уменьшается. Если кодируется простое изображение с
малой детальностью, то скорость потока становится ниже среднего значения, т.к.
число нулевых элементов матрицы коэффициентов ДКП увеличивается. Тогда с
помощью обратной связи число уровней квантования увеличивается. Буфер вы-
полняет функцию постоянной времени цепи регулирования.
Фрактальное кодирование
Фрактальная архивация основана на том, что с помощью коэффициентов
системы итерируемых функций изображение представляется в более компактной
форме.
IFS это набор трехмерных аффинных преобразований, переводящих одно
изображение в другое. Преобразованию подвергаются точки в трехмерном про-
странстве (x координата, у координата, яркость).
Фактически, фрактальная компрессия - это поиск самоподобных областей в
изображении и определение для них параметров аффинных преобразований.
В худшем случае, если не будет применяться оптимизирующий алгоритм,
потребуется перебор и сравнение всех возможных фрагментов изображения раз-
ного размера. Даже для небольших изображений при учете дискретности полу-
чится астрономическое число перебираемых вариантов. Даже резкое сужение
классов преобразований, например, за счет масштабирования только в опреде-
ленное число раз, не позволит добиться приемлемого времени. Кроме того, при
этом теряется качество изображения. Подавляющее большинство исследований в
области фрактальной компрессии сейчас направлены на уменьшение времени
архивации, необходимого для получения качественного изображения.
Для фрактального алгоритма компрессии, как и для других алгоритмов
сжатия с потерями, очень важны механизмы, с помощью которых можно будет
регулировать степень сжатия и степень потерь. К настоящему времени разрабо-
тан достаточно большой набор таких методов. Во-первых, можно ограничить
количество преобразований, заведомо обеспечив степень сжатия не ниже фикси-
рованной величины. Во-вторых, можно потребовать, чтобы в ситуации, когда
разница между обрабатываемым фрагментом и наилучшим его приближением
будет выше определенного порогового значения, этот фрагмент дробился обяза-
тельно (для него обязательно заводится несколько линз). В-третьих, можно за-
претить дробить фрагменты размером меньше, допустим, четырех точек. Изме-
няя пороговые значения и приоритет этих условий, можно очень гибко управлять
коэффициентом компрессии изображения: от побитного соответствия, до любой
степени сжатия.
На этапе архивации проводится распознавание изображения, и в виде ко-
эффициентов хранится уже не растровая информация, а информация о структуре
самого изображения. Именно это и позволяет при развертывании увеличивать
его в несколько раз. Но не все так гладко, как может показаться. Если изображе-
ние однородно, то при увеличении получаются отличные результаты, однако,
если сжимать изображение натюрморта, то предсказать, какие новые фракталь-
ные структуры возникнут, очень сложно.
Сравнивая фрактальное кодирование с дискретно-косинусным преобразо-
ванием, во-первых, заметно, что и тот, и другой алгоритмы оперируют 8-
битными (в градациях серого) и 24-битными полноцветными изображениями.
Оба обеспечивают близкие коэффициенты архивации. И у фрактального кодиро-
вания, и у ДКП существует возможность увеличить степень сжатия за счет уве-
личения потерь. Кроме того, оба алгоритма очень хорошо распараллеливаются.
При использовании фрактального кодирования процедура сжатия изобра-
жений в сотни и даже в тысячи раз дольше, чем при использовании ДКП. Распа-
ковка изображения, наоборот, произойдет в 5-10 раз быстрее. Поэтому, если изо-
бражение будет сжато только один раз, а передано по сети и распаковано множе-
ство раз, то выгодней использовать фрактальный алгоритм.