Обработка видео

Теория цифровой обработки видеоизображения

1. Классификация устройств обработки видеосигналов.

           Сегодня словами "видеообработка" и "цифровое видео" уже никого не удивишь. За последнее десятилетие устройства обработки видеосигналов прошли огромный путь развития, появилось множество специальных терминов и способов обработки видеоизображения. Мы попытаемся рассказать о некоторых устройствах и методах обработки видеосигналов. Все устройства обработки видеосигналов (УОВ) можно разделить на несколько категорий:

    • Специализированные устройства, выполняющие ограниченный набор функций и работающие, как правило, в реальном времени. К этой категории относятся всевозможные видеомикшеры, видеокоммутаторы, генераторы спецэффектов, синхронизаторы, транскодеры и т. д.
    • Устройства обработки видеосигналов на базе компьютеров PC, Macintosh, Silicon Graphics, Amiga, Alfa DEC и т. д. Обычно эти устройства выполняются в виде плат или внешних блоков активно взаимодействующих с компьютером при помощи программного обеспечения. Такие устройства редко работают в реальном времени, но имеют практически неограниченные возможности.
    • Управляющие и вспомогательные устройства, которые управляют видеоаппаратурой (видеомагнитофонами, видеокамерами, видеомикшерами, коммутаторами и т. д.). Они могут быть как автономными, так и входить в состав компьютерного видеокомплекса. К этой категории относятся видеомонтажные контроллеры, платы линейного видеомонтажа, управляющие системы и т. д.

           Следует отметить, что большинство вышеперечисленных устройств используют цифровую обработку сигналов, которая либо имеет ряд преимуществ, либо является единственно возможной. Цифровая техника достаточно специфична, поведение интеллектуальных машин иногда противоречит повседневному опыту человека и трудно воспринимается. Специальное образование, вскрывающее подноготную цифровых процессов, снимает такие трудности.

           Однако приходится считаться с тем, что подавляющее большинство работников вещательных организаций и компаний, а тем более представителей частных и домашних видеостудий не знакомы с математической логикой, теорией и физикой цифровых процессов обработки многомерных массивов данных и другими премудростями соответствующих научных дисциплин и, вероятнее всего, никогда не познакомятся. Все что им надо - это адаптированное изложение основ и особенностей поведения цифровых систем. Специальной литературы этого рода у нас нет, но необходимость в ней - огромная. Мы попытаемся в этом материале дать эти основы, которые необходимы для правильного выбора специальных устройств обработки видеосигналов, что в конечном результате отражается на эффективности работы, получении оптимальных результатов и экономии средств. 
  

2. Что такое видеомонтаж.

          Любой отснятый видеоматериал перед тем как подать в эфир, записать в чистовую видеоролик или видеофильм надо смонтировать, т. е. убрать "лишние" видеосюжеты, состыковать отдельные кусочки видеоматериала, выполнить между ними переходы, добавить спецэффекты и титры. Это и призваны сделать те устройства, о которых мы будем рассказывать. Существует три вида видеомонтажа: линейный, нелинейный и гибридный.

Линейный
подразумевает перезапись видеоматериала с двух (или нескольких) видеоисточников на видеоприемник (видеозаписывающее устройство) с попутным вырезанием ненужных и "склейкой" нужных видеосцен и добавлением эффектов, о которых говорилось выше. Недостаток - потеря качества (исключение составляет, пожалуй лишь профессиональные форматы представления видеоcигнала, напр. Betacam SP), высокая трудоемкость и большое количество видеоаппаратуры.
Нелинейный
осуществляется на базе специализированных компьютерных систем. При этом черновые видеоматериалы сначала заносятся " в компьютер", а затем производятся монтажные процедуры. Достоинства - практически отсутствие потерь качества при многократных "перемещениях" видеосюжетов, значительная экономия видеоаппаратуры. Недостатки - работа не в реальном времени, большое время обработки видеоматериала, высокая трудоемкость (попробуйте оттитровать полчаса видеоматериала, что необходимо, например, при создании учебных фильмов), ограниченный объем заносимого в компьютер видеоматериала.
Гибридный
вид сочетает в себе достоинства первых двух (нелинейная видеомонтажная система выступает в роли видеоисточника). Недостаток - как правило, более высокая цена.

           Теперь расскажем о том, как устроен видеосигнал, в каком виде видеоизображение передается между различными устройствами обработки видеосигналов. Эти знания необходимы для правильного выбора и состыковки устройств, работающих в различных видеоформатах. 


3. Как устроен телевизионный сигнал.

           Известно, что человеческий глаз воспринимает как единое целое красную (Red), зеленую (Green) и синюю (Blue) части видимого спектра. Таким образом, цветовое восприятие человека трехкомпонентное. Конечно, мы воспринимаем больше цветовых оттенков - считается, что 16 миллионов - но для нас, в силу особенностей цветового восприятия, все они сводятся к комбинациям этих трех главных цветов (в теории цвета их называют опорными). Исходя из этого, все телевизионные камеры и другие технические датчики цветных изображений формируют три сигнала - R, G, B, а в телевизионных и компьютерных мониторах экран одновременно сканируют три электронных луча, вызывая световые вспышки красного, зеленого и синего цветов. Глаз же при этом воспринимает только результирующее изображение во всем богатстве цветов реального мира.

           В то же время для телепереноса цветного изображения через эфир технически эффективнее кодировать цвет иным образом. Дело в том, что глаз менее чувствителен к пространственным изменениям оттенков цвета, чем к изменениям яркости. Поэтому цветовая информация может передаваться с меньшей пространственной четкостью (разрешением). В результате исходные RGB-видеосигналы в телевидении перед передачей преобразуют (кодируют) в сигнал яркости Y и два цветоразностных сигнала U и V:
 


Y = 0.299R + 0.587G + 0.114B, U = R - Y, V = B - Y,

при этом U и V передаются с разрешением, в два раза меньшим, чем Y. Такое уменьшение объема передаваемой информации позволяет строить более дешевые системы. Выбор вышеуказанных коэффициентов преобразования определяется жестким требованием двусторонней совместимости черно-белых и цветных приемников - яркостной сигнал Y совпадает с формируемым в ч/б системах, ч/б приемники воспринимают только его. Что касается цветовых сигналов U и V, то они добавляются к яркостному сигналу путем модуляции специального гармонического сигнала (цветовой поднесущей) на частоте, лежащей в пределах спектра сигнала Y. В результате полосы яркостного сигнала и полного видеосигнала совпадают.

           Модуляция поднесущей может осуществляться по амплитуде, фазе или частоте согласно U- и V- значениям. При приеме для точного определения величин модуляции необходима привязка к опорной несущей. Для этого в начале каждой строки передаются пакеты немодулированной несущей - так называемые синхроимпульсы. Таким образом телевизионный видеосигнал, с определенными оговорками, представляет собой композицию трех сигналов Y, U, V и синхроимпульсов. Такой сигнал называют композитным.

           При приеме в цветном телевизоре осуществляется обратный процесс восстановления (декодирования): 
  
  R = Y + U, B = Y + V, G = Y - 0.509U - 0.194V

         Телевизионное изображение воспроизводится путем последовательного сканирования электронными лучами по покрытому электролюминисцирующим веществом экрану. Сканирование происходит слева направо вдоль горизонтальных линий (телевизионных строк) и сверху вниз по строкам. Лучи пробегают строку за строкой сверху вниз до самого низа экрана, а затем возвращаются назад, и опять - слева-направо сверху-вниз. За счет инерционности глаза в процессе подобного сканирования вызываемые цветовые вспышки света сливаются в линии, а затем в полное изображение. В результате полный телевизионный кадр представляет собой совокупность последовательно высвечиваемых линий, передающих пространственное распределение изображения. Установлено, что для восприятия человеческим глазом этой совокупности как целого она должна обновляться не реже 50 раз каждую секунду. В телевидении был реализован чересстрочный режим развертки, при котором за каждый проход луч пробегает только половину линий - сначала четные, затем - нечетные. Таким образом, каждый телевизионный кадр оказывается разделенным на два полукадра - их называют полями. В результате, когда мы говорим о вертикальной частоте в 50 Гц, кадровая оказывается в два раза меньше - 25 Гц.

           В настоящее время в эксплуатации находятся три совместимых системы цветного телевидения - NTSC, PAL, SECAM. Основные различия между ними заключаются в конкретных методах кодирования телевизионного сигнала (см. таблицу).
 


Тип системы NTSC PAL SECAM
Вертикальная частота развертки, Гц 60 50 50
Горизонтальная частота развертки, кГц 15.374 15.625 15.625
Число строк в кадре 525 625 625
Число видимых (активных) строк в кадре 480 576 576
Тип модуляции цветовой поднесущей Амплитудная Амплитудная Частотная
Полоса видеосигнала, МГц 4.2 5 для B/G, 5.5 для I, 6 для D/K
Частота цветовой поднесущей, МГц 3.60 4.43 4.41 по U, 4.25 по V
Разнос несущих видео/звук, МГц 4.5 5.5 для B/G, 6 для I, 6.5 для D/K
Полная ширина сигнала, МГц 6 7 для B/G, 8 для I/D/K

           Кратко остановимся на особенностях этих систем, рассматривая их в хронологическом порядке.

NTSC (National Television System Color) -
первая система цветного телевидения, нашедшая практическое применение. Она была разработана в США и уже в 1953 г. принята для вещания, а в настоящее время вещание по этой системе ведется также в Канаде, большинстве стран Центральной и Южной Америки, Японии, Южной Корее и Тайване. Именно при ее создании были выработаны основные принципы передачи цвета в телевидении. В NTSC каждая телевизионная строка содержит составляющую яркости Y и два сигнала цветности EI = 0.737U - 0.268V, EQ=0.478U+0.413V. Здесь переход от осей цветового кодирования U, V к осям I, Q обусловлен необходимостью сужения ширины полос цветовых поднесущих всего до ± 0.5 Мгц (в NTSC используется самая узкая полоса видеосигнала). Поскольку глаз человека мелкие детали зеленого и пурпурного цветов (ось Q) воспринимает как неокрашеные (ось I - перпендикулярная к Q), то для сигналов EQ и EI это удается без дополнительных потерь в разрешении. Цветоразностные сигналы передаются путем амплитудной модуляции поднесущих на одной и той же частоте, но с фазовым сдвигом на 90° . Последнее обстоятельство является принципиально важным для разделения сигналов при приеме. Однако, из-за неизбежных нелинейных искажений в канале передачи поднесущие оказываются промодулированными сигналом яркости как по амплитуде, так и по фазе. В результате в зависимости от яркости участков изображений изменяются их цветовой тон. Например, человеческие лица на изображении окрашиваются в красноватый цвет в тенях и в зеленоватый - на освещенных участках. Это и является основным недостатком системы NTSC.C целью его устранения немецкой фирмой Telefunken в 1963 г. была разработана система
PAL (Phase Alternation Line).
Здесь использована аналогичная амплитудная модуляция цветоразностных сигналов EU=0.877U и EV=0.493V с фазовым сдвигом на 90° , но через строку дополнительно производится изменение знака амплитуды составляющей EU. В результате при восстановлении в декодере цветовые составляющие надежно разделяются сложением/вычитанием сигналов цветности последовательных телевизионных строк, и паразитная яркостная модуляция приводит лишь к некоторому изменению цветовой насыщенности. Усреднение сигналов двух строк обеспечивает также повышение отношения сигнал/шум, но приводит к снижению вертикальной четкости в два раза. Впрочем частично последнее компенсируется увеличением числа телевизионных строк разложения. Система PAL принята в большинстве стран Западной Европы, Африки и Азии, включая Китай, Австралию и Новую Зеландию.
SECAM (SEquentiel Couleur A Memoire)
первоначально была предложена во Франции еще в 1954 г., но регулярное вещание после длительных доработок было начато только в 1967 одновременно во Франции и СССР. В настоящее время она принята также в Восточной Европе, Монако, Люксембурге, Иране, Ираке и некоторых других странах. Основная особенность системы - поочередная, через строку, передача цветоразностных сигналов (DR= 1.9U, DB=1.5V) с дальнейшим восстановлением в декодере путем повторения строк. При этом в отличие от PAL и NTSC используется частотная модуляция поднесущих. В результате цветовой тон и насыщенность не зависят от освещенности, но на резких переходах яркости возникают цветовые окантовки. Обычно после ярких участков изображения окантовка имеет синий цвет, а после темных - желтый. Кроме того, как и в системе PAL, цветовая четкость по вертикали снижена вдвое.
           Таковы общие принципы кодирования цвета в различных видеосистемах телевидения. Но этим многообразие стандартов не ограничивается. Дело в том, что для формирования полного телевизионного сигнала к видео необходимо добавить звук, а полученный так называемый низкочастотный телевизионный сигнал передать через эфир путем модуляции гармоники одного из доступных радиоканалов (48,5...66 МГц - первый частотный диапазон, 76...100 МГц - второй частотный диапазон, 174...230 МГц - третий частотный диапазон, 470...790 МГц - четвертый частотный диапазон). И здесь даже в рамках одной системы существуют различия, связанные с конкретной шириной спектра видеосигнала и его разносом со звуковой частью, полярностью амплитудной модуляции радиоканала изображения и типом модуляции радиоканала звука. В таблице представлены основные параметры телевизионных стандартов стран мира.





DVD Russian VJ's Vol 2

russian vj Человек не может жить без музыки. И в то же время музыка становится только началом некой цепочки, к которой тянутся люди в свободные часы и во время самых радостных праздников.

Музыка рождает танец, движение вслед за мелодией, вместе с ритмом, способное надолго придать отличное настроение эмоциональный подъем.

Есть и другое направление – к музыке добавляется изображение, уже чужое движение, за которым человек следит, сопереживая.

подробнее

DVD Russian VJ's vol 1

russian vj  Вы когда-нибудь задумывались о том, что за странные и, в то же время завораживающие, картинки двигаются на экранах в клубе на уютной вечеринке или на многотысячном фестивале, на краю земли?

Откуда берутся эти фрагменты? Почему очень сложно описать словами то, что находится перед глазами всю ночь?

Кто следит за тем, чтобы ваши глаза впитывали музыку с экранов?

подробнее

Яндекс.Метрика Copyright by www.Malbred.com 2005