Файл: ВидеостандартыСигналы, форматы, стыкиВ. Л. Штейнберг Содержание 2Видеостандарты.pdf
Добавлен: 12.01.2024
Просмотров: 290
Скачиваний: 5
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Видеокадры. Каждый видеокадр (picture) имеет стартовый код и заголовок, содержащий информацию о структуре кадра, композитному декодированию и т.д. Кадры группируются в ...
• Группы видеокадров (GOP). Каждая группа имеет стартовый код и заголовок, содержащий информацию о временном коде и редакторскую информацию. Группы GOP группируются в ...
• Последовательности. Каждая последовательность имеет стартовый код и заголовок, содержащий информацию о размере кадра и глобальных параметрах кодирования, таких как используемый уровень и профиль кодирования.
Предполагаемые параметры отображения
Документ МОС/МЭК 13818-2 не определяет процесс отображения. Однако, заголовок последовательности может содержать описание координат цветности первичных цветов, характеристики оптоэлектронного преобразования и коэффициенты матрицирования, применявшиеся при формировании сигналов яркости и цветоразностных сигналов.
Сжатие цифровых потоков
71
Кодер и декодер MPEG-2
Предсказание с компенсацией движения
Перегруп- пировка
GOP
Оценка движения
Выбор режима
Мульти- плексор
Управление
Вычитатель
Кодер длин серий
Буфер
ДКП
Обратное
ДКП
Сумматор
Обратное квантование
Квантование
Задержка
Рис. 3.6.10 Кодер MPEG-2
Обратное квантова- ние
Буфер
Демульти- плексор
Обратное
ДКП
Сумматор
Декодер длин серий
Задержка
Предсказание с компенсацией движения
Перегруп- пировка GOP
Рис. 3.6.11 Декодер MPEG-2
Сжатие цифровых потоков
72
Если алгоритм представляется чрезмерно простым, то ...
• Видеокадры могут быть чересстрочными, прогрессивными, отдельными полями или ТВ кадрами, типов I, P или B, причем структура может изменяться на ходу
• Макроблоки могут трактоваться как чересстрочные или прогрессивные, целиком или по половинкам, предсказываться вперед, назад, двунаправленно ... всего 384 возможными способами
• Векторы движения задаются с точностью до половины элемента и передаются разностным методом с кодированием длин серий
• Параметры квантования могут изменяться при переходе от одного макроблока к другому
Сжатие звукоданных MPEG-2
Имеется четыре схемы кодирования: MPEG-1 (Слои 1, 2 и 3), и схема MPEG-2:
• Звуковой сигнал разбивается на полосы частот и процесс распределения битов
позволяетобеспечить маскирование большей части этих полос
• Частоты дискретизации выбираются 32, 44.1 или 48 кГц (16, 22.05 или 24 кГц в варианте MPEG-2 Low Sampling Frequency extension)
• Цифровой поток звука принимает одно из ряда возможных значений от 32 до 448 кбит/с
Слой 1 означает относительно простой кодер, но либо повышенный поток, либо пониженное качество звука. Слой 2, известный также как система MUSICAM (Masking pattern adapted
Universal Subband Integrated Coding And Multiplexing), был первоначально разработан в рамках Европейского Плана Цифрового Радиовещания. Этот слой наилучшим образом отвечает требованиям регулярного вещания. Слой 3 чрезвычайно сложен, но обеспечивает наивысшее качество звука при низких потоках.
По схеме MPEG-2 можно кодировать до 5 звуковых каналов в режимах: моно-, стерео-, многоязычном, и круговом.
Системный уровень
• Обеспечивает мультиплексирование видео и звуковых потоков MPEG совместно со вспомогательными данными в многопрограммные потоки
• Вводит Синхроданные (Clock References), необходимые для восстановления видео и звуковых тактовых частот
• Вследствие кодирования длин серий задержка распространения сигнала в декодере не постоянна. Системный слой вводит Маркеры времени декодирования (Decoding Time
Stamps) и Маркеры времени предъявления (Presentation Time Stamps), что обеспечивает фиксированную задержку в кодеке всех составляющих программы (видео, звука, субтитров) даже при независимой их передаче с разбивкой на пакеты данных.
• Системный слой вводит также Таблицы распределения программ (Programme
Allocation Tables), Таблицы сетевой информации (Network Information Tables), и
Таблицы обусловленного доступа (Conditional Access Tables), которые позволяют декодерувыбирать и восстанавливать конкретную ТВ программу из многопрограммного потока MPEG. При заполнении этих таблиц следует принимать во внимание требования
DVB.
Сжатие цифровых потоков
73
Цифровые потоки MPEG
• Элементарный поток - этокодированный поток видео, звука, или данных MPEG одной
ТВ программы. Пакетированный элементарный поток включает маркеры времени и заголовки.
• Программный поток - это сборка элементарных потоков, относящихся к одной ТВ программе. Они объединяются общей тактовой частотой. Такой поток состоит из пакетов переменной длины и предназначен для записи или передачи по каналам с малой вероятностью ошибки.
• Транспортный поток - другой вид объединения элементарных потоков. Он может содержать несколько программ с независимыми тактовыми частотами. Транспортные потоки состоят из пакетов фиксированной длины и предназначены для передачи по каналам с ошибками. Именно этот тип потока обычно называют просто "сигнал MPEG".
Коммутация и редактирование сжатых потоков
Поскольку MPEG-2 - это полноправный ТВ сигнал, то возникает потребность в его коммутации и редактировании подобно тому, как это делается с традиционными компонентными или композитными сигналами. Однако простое переключение сигналов
MPEG-2 без сброса регистров декодера вряд ли возможно. Как правило, приходится полностью декодировать сжатый поток, переключать обычные видео и звуковые сигналы и вновь сжимать цифровые потоки.
Уровни и профили
MPEG-2 охватывает весьма широкий диапазон сложности кодирования и качества изображения. Совершенно нереалистично требовать, чтобы все декодеры были способны декодировать все возможные виды потоков MPEG-2.
Стандартом определены четыре уровня:
Уровень
Структура
изображения
Поток
Высокий
1920 x 1152 или менее
До 80 Мбит/с
Высокий-1440 1440 x 1152 или менее
До 60 Мбит/с
Основной
720 x 576 или менее
До 15 Мбит/с
Низкий
352 x 288 или менее
До 4 Мбит/с
Независимо от выбора уровня имеются пять профилей:
Профиль
Свойства
Структура
дискретизации
Простой
Видеокадры типа B не допускаются
4:2:0
Основной
Не допускается расширение изображения
4:2:0
Масштабируемый по С/Ш
Масштабируемость 4:2:0
Пространственно масштабируемый
Пространственная масштабируемость
4:2:0
Высокий
Временная масштабируемость
4:2:0 или 4:2:2
Сжатие цифровых потоков
74
Ожидается, что микросхемы, разрабатываемые для основного профиля основного уровня
(MPML), окажутся столь дешевы, что разработка специальных упрощенных микросхем для более низких профилей не будет иметь смысла.
Масштабируемость - это свойство кодека обрабатывать упорядоченный набор из нескольких потоков. Более того, масштабируемый кодек обязан выдавать изображение приемлемого качества даже в отсутствие части потоков набора. Минимально необходимый набор потоков называется базовым слоем. Каждый из других потоков набора называется улучшающим слоем (enhancement layer).
Декодеры, обеспечивающие определенный профиль определенного уровня, обязаны обеспечивать также все нижележащие профили и уровни.
Профиль 4:2:2
• Известен также как Профессиональный Профиль и, в принципе, может стать полноправным отдельным профилем MPEG-2 (вне иерархии)
• Призван обеспечить качество изображения, сравнимое с видеозаписью формата D1, и приемлемое качество коммутации
• Отличительными свойствами являются структура дискретизации 4:2:2 (в отличие от
4:2:0) и возможность работы с повышенными скоростями (50 Мбит/с вместо 15 Мбит/с, обеспечиваемых Основным Профилем)
Повышенные профили
• Большинство придерживается Основного Профиля Основного Уровня MPEG-2 (Main
Level Main Profile)
• Для некоторых применений (например для наземного вещания) представляют интерес масштабируемые профили, в частности, профиль, масштабируемый по отношению сигнал-шум. Однако, пока вообще нет уверенности в целесообразности использования масштабируемых профилей.
Профиль, масштабируемый по отношению сигнал-шум
Для этого типа масштабируемости характерна передача через улучшающий слой дополнительных данных, уточняющих значения коэффициентов ДКП, вычисленных нижним слоем. Пониженная скорость потока нижнего слоя позволяет обеспечить его повышенную помехозащищенность, что собственно и дало название всему профилю.
Сжатие цифровых потоков
75
Сумматор
Грубое обратное квантование
Тонкое квантование
Вычитание
Нижний слой
Улучшающий слой
К блоку обратного ДКП
От блока ДКП
Тонкое обратное квантование
Грубое квантование
Рис. 3.6.12 Кодер MPEG-2, масштабируемый по С-Ш
Сжатие цифровых потоков
76
Стыки MPEG-2
Различные фирмы для различных применений транспортных потоков MPEG используют множество различных (несовместимых) электрических стыков. Наиболее распространенные показаны в следующей таблице:
• DVB LVDS
• Divicom M2P • DMV RS422P
• STB TTL
• ECL serial
• ECL parallel
• DS3 44 Mbit/s
• DVB ASI
• DVB SSI
• DVB Sat Rx
• DVB Cable
Rx
В качестве примера, ниже приведено подробное описание стыков DVB LVDS и Divicom M2P.
Стандартом MPEG предусмотрено мультиплексирование пакетов данных. Рис. 3.6.13 иллюстрирует структуру базового 188-байтового пакета данных транспортного потока.
P ayload
H eader
P ayload
unit
t t
indicator
Transport
priority
P ID
Transport
scram bling
control
A dap tatio
field
control
C ontinuity
count
A dap tation
field
Transport
error
indicator
S ync
byte
1
1
13
2
2
4
...
1
8
A dap tation
field
length
D iscontinuity
indicator
R andom
access
indicator
E lem entary
stream
i it
indicator
Flags
O ptional
fields
8
1
1
1
5
...
188 bytes
Рис. 3.6.13 Структура 188-байтового пакета MPEG-2
Однако, канальное кодирование приводит к увеличению размера пакетов, поэтому многие форматы стыков допускают наличие дополнительных (пустых) байтов.
Параллельный стык DVB LVDS предназначен для головных станций кабельных сетей DVB
CATV/MATV. Этот стык включает 11 линейных балансных передатчиков и 11 линейных балансных приемников. Они должны быть совместимы с требованиями LVDS (подробнее о
LVDS, см. документ EIA/TIA SP 3357).
D[7:0]
Psync
Val
Clk
Передатчик
Приемник
Рис. 3.6.14 Параллельный стык DVB LVDS
Сжатие цифровых потоков
77
В этом формате:
D[7:0]: Слово данных транспортного пакета (8 бит: от Data 0 до Data 7). Data 7 - старший бит кодового слова.
Val:
Флаг действенности данных: данные действительны при состоянии "1". В 188- байтовом режиме этот флаг всегда поднят. В 204-байтовом режиме нижний уровень указывает на отключение байтов кода Рида-Соломона.
Psync: Индицирует начало транспортного пакета, отмечая байт синхронизации уровнем "1".
Clk:
Прямоугольные тактовые импульсы; переход 0-1 (фронт) означает момент считывания данных. Тактовая частота не должна превышать 13.5 МГц. sync
2 1
187 187 186
sync
2 1
D[7:0]
Psync
Clk
Val
Рис. 3.6.15 Базовый формат 188-байтового пакета
При использовании для защиты от ошибок передачи канального кода Рида-Соломона (RS), размер пакета возрастает до 204 байтов. sync
2 1
187 203 202
sync
2 1
D[7:0]
Psync
Val
Clk
Рис. 3.6.16 Формат пакетов с кодом RS (204 байта)
Предусмотрен также 204-байтовый формат пакета без кода RS, в котором первые 188 байтов представляют действующие данные, а 16 пустых байтов в конце пакета служат только для совместимости с потоками, которые на самом деле защищены кодом RS. sync
2 1
187
2
187 186
1
16 sync
2 1
D[7:0]
Psync
Clk
Val
Рис. 3.6.17 Формат с 188 байтами данных и 16 пустыми байтами
Вывод A линейного передатчика имеет положительную полярность относительно вывода B при передаче логического уровня "1" и отрицательную - при передаче логического "0". Если период тактов принять за T, то ширина тактового импульса должна быть в пределах от 0.4T до
0.6T.
Сжатие цифровых потоков
78
Характеристики линейного передатчика (Источника)
Импеданс выхода: 100
Ом максимум
Синфазное напряжение: от 1.125 В до 1.375 В
Амплитуда сигнала: от 247 мВ до 454 мВ
Длительность переднего
и заднего фронтов: не более T/7, измеряется по уровням 20 % и 80 % амплитуды на резистивной нагрузке 100 Ом. Различие переднего и заднего фронтов не должно превышать T/20.
Характеристики линейного приемника (Получателя)
Импеданс входа: от 90 Ом до 132 Ом
Максимальный
входной сигнал:
2.0
В (размах)
Минимальный
входной сигнал: 100 мВ (размах)
В стыкеDVB LVDS применен 25-контактный субминиатюрный разъем типа D, распределение контактов которого показано в следующей таблице:
Контакт
Сигнальная линия Контакт
Сигнальная линия
1 2
3 4
5 6
7 8
9 10 11 12 13
Такты A
Системный корпус
Data 7 A (MSB)
Data 6 A
Data 5 A
Data 4 A
Data 3 A
Data 2 A
Data 1 A
Data 0 A
Val A
Psync A
Экран кабеля
14 15 16 17 18 19 20 21 22 23 24 25
Такты B
Системный корпус
Data 7 B (MSB)
Data 6 B
Data 5 B
Data 4 B
Data 3 B
Data 2 B
Data 1 B
Data 0 B
Val B
Psync B
Контакты кабельных разъемов - штеккеры, а приборных - розетки. Должно быть предусмотрено экранирование не только кабелей, но и самих разъемов.
Сжатие цифровых потоков
79
Параллельный стык DIV M2P предназначен для параллельного порта M2P оборудования фирмы Divicom. Использование тактовых, информационных и вспомогательных сигналов в этом стыке сходно со стыком DVB LVDS, однако уровни сигналов соответствуют стыку RS-
422, а считывание данных происходит по заднему фронту тактовых импульсов. Стык включает 12 линейных балансных передатчиков и 12 линейных балансных приемников. На выходах линейных передатчиков дополнительно включены пассивные фильтры нижних частот RC типа, подавляющие высокочастотные помехи.
D[7:0]
Psync
Val
Clk
RClk
Передатчик
Приемник
Рис. 3.6.18 Параллельный стык Divicom M2P
Линия RClk служит для обратной подачи опционных возвратных тактовых импульсов, вырабатываемых получателем сигнала. Цель этой операции - обеспечить ведение и работу буферных регистров (FiFo) на обоих сторонах стыка. Типичной является конфигурация системы, в которой источником тактов выступает модем или другое сетевое устройство. При этом с точки зрения канального кодера фаза возвратных тактов определена нечетко вследствие задержек в кабелях и в приемнике данных. При правильном использовании возвратных тактов считывание из буферных регистров должно начинаться, когда они заполнены на 50 %; после этого регистры передатчика и приемника тактируются синхронно, т.е. имеет место ведомый режим. В результате возможен прием пакетов данных любой длины. sync
2 1
187
2
187 186
1
N sync
2 1
D[7:0]
Psync
Clk
Val
Рис. 3.6.19 188 информационных и N пустых байтов
Стык DIV M2P использует тот же тип разъема (D25), что и стык DVB LVDS, однако распределение контактов сильно отличается, как показано в следующей таблице:
Контакт Сигнальная линия
Контакт Сигнальная линия
1 2
3 4
5 6
7 8
9 10 11 12 13
RClk +
Clk +
Psync+
Val+
Data 0 +
Data 1 +
Data 2 +
Data 3 +
Data 4 +
Data 5 +
Data 6 +
Data 7 + (MSB)
Не используется
14 15 16 17 18 19 20 21 22 23 24 25
RClk -
Clk -
Psync -
Val -
Data 0 -
Data 1 -
Data 2 -
Data 3 -
Data 4 -
Data 5 -
Data 6 -
Data 7 - (MSB)
Системы производства программ Телевидения Высокой Четкости
80
3.7 Системы производства программ Телевидения Высокой Четкости
В настоящее время имеются две основные системы ТВЧ: 1125/60 and 1250/50.
Еще в 1990 году МККР выпустил Рекомендацию 709 (ITU-R BT.709), содержащую требование, чтобы все будущие системы ТВЧ имели 1920 отсчетов в активной части строки, а частота дискретизации должна быть кратна частоте 2.25 MГц. Обе системы (1125/60 и
1250/50) этим требованиям удовлетворяют. Администрация США заявила, что она не поддерживает принципы этой Рекомендации.
Параметры аналоговой системы 1125/60 описаны в документе SMPTE 240M; цифровые параметры описаны в SMPTE 260M.
Новый стандарт SMPTE 274M фактически заменяет оба стандарта SMPTE 240M и SMPTE
260M в связи с переходом к квадратной форме элемента изображения и возвратом к частоте полей (кадров) 59.94 Гц. Система 1050/59.94 нашла весьма ограниченное применение, но также полностью описана в документах SMPTE. Некоторые модели нового 1125-строчного оборудования способны переключать частоту кадров с 60 Гц на 59.94 (60/1.001) Гц для облегчения понижающего преобразования в сигнал обычного формата NTSC.
Американский Комитет по Новым Телевизионным Системам (ATSC) и некоторые другие организации поддерживают формат разложения и стыка с 1080 активными строками и квадратной формой элемента изображения. 1920 активных элементов в строке при формате кадра 16:9 дают 1920 · 9/16 = 1080 строк вместо ранее использовавшихся 1035 строк (см.
SMPTE 240M).
Уже началось экспериментальное вещание изображений формата 1920 x 1080 посредством сжатых потоков MPEG-2.
Параметры разложения и стыка 1920 x 1080 приведены в стандарте SMPTE 274M. Следует подчеркнуть, что по этому стандарту общее число строк в кадре сохраняется равным 1125, а полное число отсчетов в строке сохраняется равным 2200, как в SMPTE 240M. Допускается как прогрессивное, так и чересстрочное разложение. Продолжаются исследования по стандартизации вариантов формата 1920 x 1080 с иными частотами кадров, включая 24/1.001,
24, 25, 30/1.001, 30 и 50 кадров в секунду. Например, документ SMPTE 295M определяет разложение и стык для формата 1920 x 1080 при частоте полей 50 Гц.
В США предложен также альтернативный стандарт ТВЧ (SMPTE 296M), с прогрессивной разверткой в формате 1280 x 720. Этот вариант принято обозначать "720P".
Параметры аналоговой системы 1250/50/2:1 ("Eureka-95") были в 1992 году дополнены формальным описанием цифровых стыков. Группа DVB работает над новым стандартом
MPEG-2 с чересстрочным разложением 1920 x 1080 и частотой полей 50 Гц; этот стандартом принято обозначать "1080I/50".
Временная координата во всех этих документах задается двояко: в микросекундах и в периодах дискретизации яркости; тем самым проявляется связь между аналоговым и цифровым представлениями сигнала. Структура дискретизации во всех случаях ортогональна и регулярна по строкам, полям и кадрам. Отсчеты Cr и Cb пространственно совпадают с нечетными (первым, третьим, пятым и т.д.) отсчетами Y в каждой строке. Число отсчетов в цифровой активной части строки равно 1920 в обоих системах. Однако в системе 1125/60 аналоговая активная часть строки либо не определена, либо приравнена к цифровой активной части. Напротив, в системе 1250/50 аналоговая активная часть слегка короче цифровой активной части, как в Рекомендации МККР 601.
Ограничение полосы частот сигналов может приводить к распространению выбросов от фронтов гашения в активную часть изображения. Документ SMPTE 274M вводит понятие "производственного окна" ("production aperture") размером 1920 x 1080 элементов. В этом окне должны размещаться все сюжетно важные части изображения. Оно отличается от "чистого окна" ("clean aperture") размером 1888 x 1062 элементов, расположенного симметрично внутри него. Чистое окно должно быть "в основном свободно" от выбросов и краевых эффектов. Длительность активного аналогового видеосигнала, измеренная по уровню
• Группы видеокадров (GOP). Каждая группа имеет стартовый код и заголовок, содержащий информацию о временном коде и редакторскую информацию. Группы GOP группируются в ...
• Последовательности. Каждая последовательность имеет стартовый код и заголовок, содержащий информацию о размере кадра и глобальных параметрах кодирования, таких как используемый уровень и профиль кодирования.
Предполагаемые параметры отображения
Документ МОС/МЭК 13818-2 не определяет процесс отображения. Однако, заголовок последовательности может содержать описание координат цветности первичных цветов, характеристики оптоэлектронного преобразования и коэффициенты матрицирования, применявшиеся при формировании сигналов яркости и цветоразностных сигналов.
Сжатие цифровых потоков
71
Кодер и декодер MPEG-2
Предсказание с компенсацией движения
Перегруп- пировка
GOP
Оценка движения
Выбор режима
Мульти- плексор
Управление
Вычитатель
Кодер длин серий
Буфер
ДКП
Обратное
ДКП
Сумматор
Обратное квантование
Квантование
Задержка
Рис. 3.6.10 Кодер MPEG-2
Обратное квантова- ние
Буфер
Демульти- плексор
Обратное
ДКП
Сумматор
Декодер длин серий
Задержка
Предсказание с компенсацией движения
Перегруп- пировка GOP
Рис. 3.6.11 Декодер MPEG-2
Сжатие цифровых потоков
72
Если алгоритм представляется чрезмерно простым, то ...
• Видеокадры могут быть чересстрочными, прогрессивными, отдельными полями или ТВ кадрами, типов I, P или B, причем структура может изменяться на ходу
• Макроблоки могут трактоваться как чересстрочные или прогрессивные, целиком или по половинкам, предсказываться вперед, назад, двунаправленно ... всего 384 возможными способами
• Векторы движения задаются с точностью до половины элемента и передаются разностным методом с кодированием длин серий
• Параметры квантования могут изменяться при переходе от одного макроблока к другому
Сжатие звукоданных MPEG-2
Имеется четыре схемы кодирования: MPEG-1 (Слои 1, 2 и 3), и схема MPEG-2:
• Звуковой сигнал разбивается на полосы частот и процесс распределения битов
позволяетобеспечить маскирование большей части этих полос
• Частоты дискретизации выбираются 32, 44.1 или 48 кГц (16, 22.05 или 24 кГц в варианте MPEG-2 Low Sampling Frequency extension)
• Цифровой поток звука принимает одно из ряда возможных значений от 32 до 448 кбит/с
Слой 1 означает относительно простой кодер, но либо повышенный поток, либо пониженное качество звука. Слой 2, известный также как система MUSICAM (Masking pattern adapted
Universal Subband Integrated Coding And Multiplexing), был первоначально разработан в рамках Европейского Плана Цифрового Радиовещания. Этот слой наилучшим образом отвечает требованиям регулярного вещания. Слой 3 чрезвычайно сложен, но обеспечивает наивысшее качество звука при низких потоках.
По схеме MPEG-2 можно кодировать до 5 звуковых каналов в режимах: моно-, стерео-, многоязычном, и круговом.
Системный уровень
• Обеспечивает мультиплексирование видео и звуковых потоков MPEG совместно со вспомогательными данными в многопрограммные потоки
• Вводит Синхроданные (Clock References), необходимые для восстановления видео и звуковых тактовых частот
• Вследствие кодирования длин серий задержка распространения сигнала в декодере не постоянна. Системный слой вводит Маркеры времени декодирования (Decoding Time
Stamps) и Маркеры времени предъявления (Presentation Time Stamps), что обеспечивает фиксированную задержку в кодеке всех составляющих программы (видео, звука, субтитров) даже при независимой их передаче с разбивкой на пакеты данных.
• Системный слой вводит также Таблицы распределения программ (Programme
Allocation Tables), Таблицы сетевой информации (Network Information Tables), и
Таблицы обусловленного доступа (Conditional Access Tables), которые позволяют декодерувыбирать и восстанавливать конкретную ТВ программу из многопрограммного потока MPEG. При заполнении этих таблиц следует принимать во внимание требования
DVB.
Сжатие цифровых потоков
73
Цифровые потоки MPEG
• Элементарный поток - этокодированный поток видео, звука, или данных MPEG одной
ТВ программы. Пакетированный элементарный поток включает маркеры времени и заголовки.
• Программный поток - это сборка элементарных потоков, относящихся к одной ТВ программе. Они объединяются общей тактовой частотой. Такой поток состоит из пакетов переменной длины и предназначен для записи или передачи по каналам с малой вероятностью ошибки.
• Транспортный поток - другой вид объединения элементарных потоков. Он может содержать несколько программ с независимыми тактовыми частотами. Транспортные потоки состоят из пакетов фиксированной длины и предназначены для передачи по каналам с ошибками. Именно этот тип потока обычно называют просто "сигнал MPEG".
Коммутация и редактирование сжатых потоков
Поскольку MPEG-2 - это полноправный ТВ сигнал, то возникает потребность в его коммутации и редактировании подобно тому, как это делается с традиционными компонентными или композитными сигналами. Однако простое переключение сигналов
MPEG-2 без сброса регистров декодера вряд ли возможно. Как правило, приходится полностью декодировать сжатый поток, переключать обычные видео и звуковые сигналы и вновь сжимать цифровые потоки.
Уровни и профили
MPEG-2 охватывает весьма широкий диапазон сложности кодирования и качества изображения. Совершенно нереалистично требовать, чтобы все декодеры были способны декодировать все возможные виды потоков MPEG-2.
Стандартом определены четыре уровня:
Уровень
Структура
изображения
Поток
Высокий
1920 x 1152 или менее
До 80 Мбит/с
Высокий-1440 1440 x 1152 или менее
До 60 Мбит/с
Основной
720 x 576 или менее
До 15 Мбит/с
Низкий
352 x 288 или менее
До 4 Мбит/с
Независимо от выбора уровня имеются пять профилей:
Профиль
Свойства
Структура
дискретизации
Простой
Видеокадры типа B не допускаются
4:2:0
Основной
Не допускается расширение изображения
4:2:0
Масштабируемый по С/Ш
Масштабируемость 4:2:0
Пространственно масштабируемый
Пространственная масштабируемость
4:2:0
Высокий
Временная масштабируемость
4:2:0 или 4:2:2
Сжатие цифровых потоков
74
Ожидается, что микросхемы, разрабатываемые для основного профиля основного уровня
(MPML), окажутся столь дешевы, что разработка специальных упрощенных микросхем для более низких профилей не будет иметь смысла.
Масштабируемость - это свойство кодека обрабатывать упорядоченный набор из нескольких потоков. Более того, масштабируемый кодек обязан выдавать изображение приемлемого качества даже в отсутствие части потоков набора. Минимально необходимый набор потоков называется базовым слоем. Каждый из других потоков набора называется улучшающим слоем (enhancement layer).
Декодеры, обеспечивающие определенный профиль определенного уровня, обязаны обеспечивать также все нижележащие профили и уровни.
Профиль 4:2:2
• Известен также как Профессиональный Профиль и, в принципе, может стать полноправным отдельным профилем MPEG-2 (вне иерархии)
• Призван обеспечить качество изображения, сравнимое с видеозаписью формата D1, и приемлемое качество коммутации
• Отличительными свойствами являются структура дискретизации 4:2:2 (в отличие от
4:2:0) и возможность работы с повышенными скоростями (50 Мбит/с вместо 15 Мбит/с, обеспечиваемых Основным Профилем)
Повышенные профили
• Большинство придерживается Основного Профиля Основного Уровня MPEG-2 (Main
Level Main Profile)
• Для некоторых применений (например для наземного вещания) представляют интерес масштабируемые профили, в частности, профиль, масштабируемый по отношению сигнал-шум. Однако, пока вообще нет уверенности в целесообразности использования масштабируемых профилей.
Профиль, масштабируемый по отношению сигнал-шум
Для этого типа масштабируемости характерна передача через улучшающий слой дополнительных данных, уточняющих значения коэффициентов ДКП, вычисленных нижним слоем. Пониженная скорость потока нижнего слоя позволяет обеспечить его повышенную помехозащищенность, что собственно и дало название всему профилю.
Сжатие цифровых потоков
75
Сумматор
Грубое обратное квантование
Тонкое квантование
Вычитание
Нижний слой
Улучшающий слой
К блоку обратного ДКП
От блока ДКП
Тонкое обратное квантование
Грубое квантование
Рис. 3.6.12 Кодер MPEG-2, масштабируемый по С-Ш
Сжатие цифровых потоков
76
Стыки MPEG-2
Различные фирмы для различных применений транспортных потоков MPEG используют множество различных (несовместимых) электрических стыков. Наиболее распространенные показаны в следующей таблице:
• DVB LVDS
• Divicom M2P • DMV RS422P
• STB TTL
• ECL serial
• ECL parallel
• DS3 44 Mbit/s
• DVB ASI
• DVB SSI
• DVB Sat Rx
• DVB Cable
Rx
В качестве примера, ниже приведено подробное описание стыков DVB LVDS и Divicom M2P.
Стандартом MPEG предусмотрено мультиплексирование пакетов данных. Рис. 3.6.13 иллюстрирует структуру базового 188-байтового пакета данных транспортного потока.
P ayload
H eader
P ayload
unit
t t
indicator
Transport
priority
P ID
Transport
scram bling
control
A dap tatio
field
control
C ontinuity
count
A dap tation
field
Transport
error
indicator
S ync
byte
1
1
13
2
2
4
...
1
8
A dap tation
field
length
D iscontinuity
indicator
R andom
access
indicator
E lem entary
stream
i it
indicator
Flags
O ptional
fields
8
1
1
1
5
...
188 bytes
Рис. 3.6.13 Структура 188-байтового пакета MPEG-2
Однако, канальное кодирование приводит к увеличению размера пакетов, поэтому многие форматы стыков допускают наличие дополнительных (пустых) байтов.
Параллельный стык DVB LVDS предназначен для головных станций кабельных сетей DVB
CATV/MATV. Этот стык включает 11 линейных балансных передатчиков и 11 линейных балансных приемников. Они должны быть совместимы с требованиями LVDS (подробнее о
LVDS, см. документ EIA/TIA SP 3357).
D[7:0]
Psync
Val
Clk
Передатчик
Приемник
Рис. 3.6.14 Параллельный стык DVB LVDS
Сжатие цифровых потоков
77
В этом формате:
D[7:0]: Слово данных транспортного пакета (8 бит: от Data 0 до Data 7). Data 7 - старший бит кодового слова.
Val:
Флаг действенности данных: данные действительны при состоянии "1". В 188- байтовом режиме этот флаг всегда поднят. В 204-байтовом режиме нижний уровень указывает на отключение байтов кода Рида-Соломона.
Psync: Индицирует начало транспортного пакета, отмечая байт синхронизации уровнем "1".
Clk:
Прямоугольные тактовые импульсы; переход 0-1 (фронт) означает момент считывания данных. Тактовая частота не должна превышать 13.5 МГц. sync
2 1
187 187 186
sync
2 1
D[7:0]
Psync
Clk
Val
Рис. 3.6.15 Базовый формат 188-байтового пакета
При использовании для защиты от ошибок передачи канального кода Рида-Соломона (RS), размер пакета возрастает до 204 байтов. sync
2 1
187 203 202
sync
2 1
D[7:0]
Psync
Val
Clk
Рис. 3.6.16 Формат пакетов с кодом RS (204 байта)
Предусмотрен также 204-байтовый формат пакета без кода RS, в котором первые 188 байтов представляют действующие данные, а 16 пустых байтов в конце пакета служат только для совместимости с потоками, которые на самом деле защищены кодом RS. sync
2 1
187
2
187 186
1
16 sync
2 1
D[7:0]
Psync
Clk
Val
Рис. 3.6.17 Формат с 188 байтами данных и 16 пустыми байтами
Вывод A линейного передатчика имеет положительную полярность относительно вывода B при передаче логического уровня "1" и отрицательную - при передаче логического "0". Если период тактов принять за T, то ширина тактового импульса должна быть в пределах от 0.4T до
0.6T.
Сжатие цифровых потоков
78
Характеристики линейного передатчика (Источника)
Импеданс выхода: 100
Ом максимум
Синфазное напряжение: от 1.125 В до 1.375 В
Амплитуда сигнала: от 247 мВ до 454 мВ
Длительность переднего
и заднего фронтов: не более T/7, измеряется по уровням 20 % и 80 % амплитуды на резистивной нагрузке 100 Ом. Различие переднего и заднего фронтов не должно превышать T/20.
Характеристики линейного приемника (Получателя)
Импеданс входа: от 90 Ом до 132 Ом
Максимальный
входной сигнал:
2.0
В (размах)
Минимальный
входной сигнал: 100 мВ (размах)
В стыкеDVB LVDS применен 25-контактный субминиатюрный разъем типа D, распределение контактов которого показано в следующей таблице:
Контакт
Сигнальная линия Контакт
Сигнальная линия
1 2
3 4
5 6
7 8
9 10 11 12 13
Такты A
Системный корпус
Data 7 A (MSB)
Data 6 A
Data 5 A
Data 4 A
Data 3 A
Data 2 A
Data 1 A
Data 0 A
Val A
Psync A
Экран кабеля
14 15 16 17 18 19 20 21 22 23 24 25
Такты B
Системный корпус
Data 7 B (MSB)
Data 6 B
Data 5 B
Data 4 B
Data 3 B
Data 2 B
Data 1 B
Data 0 B
Val B
Psync B
Контакты кабельных разъемов - штеккеры, а приборных - розетки. Должно быть предусмотрено экранирование не только кабелей, но и самих разъемов.
Сжатие цифровых потоков
79
Параллельный стык DIV M2P предназначен для параллельного порта M2P оборудования фирмы Divicom. Использование тактовых, информационных и вспомогательных сигналов в этом стыке сходно со стыком DVB LVDS, однако уровни сигналов соответствуют стыку RS-
422, а считывание данных происходит по заднему фронту тактовых импульсов. Стык включает 12 линейных балансных передатчиков и 12 линейных балансных приемников. На выходах линейных передатчиков дополнительно включены пассивные фильтры нижних частот RC типа, подавляющие высокочастотные помехи.
D[7:0]
Psync
Val
Clk
RClk
Передатчик
Приемник
Рис. 3.6.18 Параллельный стык Divicom M2P
Линия RClk служит для обратной подачи опционных возвратных тактовых импульсов, вырабатываемых получателем сигнала. Цель этой операции - обеспечить ведение и работу буферных регистров (FiFo) на обоих сторонах стыка. Типичной является конфигурация системы, в которой источником тактов выступает модем или другое сетевое устройство. При этом с точки зрения канального кодера фаза возвратных тактов определена нечетко вследствие задержек в кабелях и в приемнике данных. При правильном использовании возвратных тактов считывание из буферных регистров должно начинаться, когда они заполнены на 50 %; после этого регистры передатчика и приемника тактируются синхронно, т.е. имеет место ведомый режим. В результате возможен прием пакетов данных любой длины. sync
2 1
187
2
187 186
1
N sync
2 1
D[7:0]
Psync
Clk
Val
Рис. 3.6.19 188 информационных и N пустых байтов
Стык DIV M2P использует тот же тип разъема (D25), что и стык DVB LVDS, однако распределение контактов сильно отличается, как показано в следующей таблице:
Контакт Сигнальная линия
Контакт Сигнальная линия
1 2
3 4
5 6
7 8
9 10 11 12 13
RClk +
Clk +
Psync+
Val+
Data 0 +
Data 1 +
Data 2 +
Data 3 +
Data 4 +
Data 5 +
Data 6 +
Data 7 + (MSB)
Не используется
14 15 16 17 18 19 20 21 22 23 24 25
RClk -
Clk -
Psync -
Val -
Data 0 -
Data 1 -
Data 2 -
Data 3 -
Data 4 -
Data 5 -
Data 6 -
Data 7 - (MSB)
Системы производства программ Телевидения Высокой Четкости
80
3.7 Системы производства программ Телевидения Высокой Четкости
В настоящее время имеются две основные системы ТВЧ: 1125/60 and 1250/50.
Еще в 1990 году МККР выпустил Рекомендацию 709 (ITU-R BT.709), содержащую требование, чтобы все будущие системы ТВЧ имели 1920 отсчетов в активной части строки, а частота дискретизации должна быть кратна частоте 2.25 MГц. Обе системы (1125/60 и
1250/50) этим требованиям удовлетворяют. Администрация США заявила, что она не поддерживает принципы этой Рекомендации.
Параметры аналоговой системы 1125/60 описаны в документе SMPTE 240M; цифровые параметры описаны в SMPTE 260M.
Новый стандарт SMPTE 274M фактически заменяет оба стандарта SMPTE 240M и SMPTE
260M в связи с переходом к квадратной форме элемента изображения и возвратом к частоте полей (кадров) 59.94 Гц. Система 1050/59.94 нашла весьма ограниченное применение, но также полностью описана в документах SMPTE. Некоторые модели нового 1125-строчного оборудования способны переключать частоту кадров с 60 Гц на 59.94 (60/1.001) Гц для облегчения понижающего преобразования в сигнал обычного формата NTSC.
Американский Комитет по Новым Телевизионным Системам (ATSC) и некоторые другие организации поддерживают формат разложения и стыка с 1080 активными строками и квадратной формой элемента изображения. 1920 активных элементов в строке при формате кадра 16:9 дают 1920 · 9/16 = 1080 строк вместо ранее использовавшихся 1035 строк (см.
SMPTE 240M).
Уже началось экспериментальное вещание изображений формата 1920 x 1080 посредством сжатых потоков MPEG-2.
Параметры разложения и стыка 1920 x 1080 приведены в стандарте SMPTE 274M. Следует подчеркнуть, что по этому стандарту общее число строк в кадре сохраняется равным 1125, а полное число отсчетов в строке сохраняется равным 2200, как в SMPTE 240M. Допускается как прогрессивное, так и чересстрочное разложение. Продолжаются исследования по стандартизации вариантов формата 1920 x 1080 с иными частотами кадров, включая 24/1.001,
24, 25, 30/1.001, 30 и 50 кадров в секунду. Например, документ SMPTE 295M определяет разложение и стык для формата 1920 x 1080 при частоте полей 50 Гц.
В США предложен также альтернативный стандарт ТВЧ (SMPTE 296M), с прогрессивной разверткой в формате 1280 x 720. Этот вариант принято обозначать "720P".
Параметры аналоговой системы 1250/50/2:1 ("Eureka-95") были в 1992 году дополнены формальным описанием цифровых стыков. Группа DVB работает над новым стандартом
MPEG-2 с чересстрочным разложением 1920 x 1080 и частотой полей 50 Гц; этот стандартом принято обозначать "1080I/50".
Временная координата во всех этих документах задается двояко: в микросекундах и в периодах дискретизации яркости; тем самым проявляется связь между аналоговым и цифровым представлениями сигнала. Структура дискретизации во всех случаях ортогональна и регулярна по строкам, полям и кадрам. Отсчеты Cr и Cb пространственно совпадают с нечетными (первым, третьим, пятым и т.д.) отсчетами Y в каждой строке. Число отсчетов в цифровой активной части строки равно 1920 в обоих системах. Однако в системе 1125/60 аналоговая активная часть строки либо не определена, либо приравнена к цифровой активной части. Напротив, в системе 1250/50 аналоговая активная часть слегка короче цифровой активной части, как в Рекомендации МККР 601.
Ограничение полосы частот сигналов может приводить к распространению выбросов от фронтов гашения в активную часть изображения. Документ SMPTE 274M вводит понятие "производственного окна" ("production aperture") размером 1920 x 1080 элементов. В этом окне должны размещаться все сюжетно важные части изображения. Оно отличается от "чистого окна" ("clean aperture") размером 1888 x 1062 элементов, расположенного симметрично внутри него. Чистое окно должно быть "в основном свободно" от выбросов и краевых эффектов. Длительность активного аналогового видеосигнала, измеренная по уровню