Видео маппинг, видео перформансы

VJ Железо

Targa 3000

Содержание материала


Системы нелинейного монтажа (Non linear editing, NLE) и технологии обработки видео на базе персональных компьютеров существуют уже более 10 лет и сегодня переживают очередной этап бурного развития. По сравнению с традиционным линейным монтажом NLE имеет ряд неоспоримых преимуществ. Прежде всего, это возможность мгновенного доступа к любому фрагменту, отсутствие деградации качества при копировании и практически неограниченные возможности редактирования. Все это способствует тому, что системы нелинейного монтажа находят сегодня все более широкое применение.

При преобразовании аналогового телевизионного сигнала в цифровую форму формируется поток данных от 202 до 540 Мбит/сек (25-67 Мбайт/сек). Операции записи и воспроизведения столь больших объемов информации на персональном компьютере до сих пор сопряжены с серьезными трудностями. Даже самые современные скоростные накопители с трудом обеспечивают такой поток данных, а несколько лет назад, когда системы нелинейного монтажа делали свои первые шаги, даже наиболее быстрые SCSI винчестеры могли обеспечить скорость передачи не более 3-5 Мбайт/сек.

Линейная скорость чтения некоторых современных жестких дисков

Фирма производитель, модель Установившаяся линейная скорость чтения, Мбайт/с
IBM Deskstar 60GXP (7200 об/мин., ATA100, 20 Гбайт на пластину) 21-41
IBM Deskstar 75GXP (7200 об/мин., ATA 100, 15 Гбайт на пластину) 20-40
IBM Ultrastar 36LZX (10000 об/мин., SCSI Ultra 160) 21-36
IBM Ultrastar 36Z15 (15000 об/мин., SCSI Ultra 160) 36-52
Quantum Fireball Plus AS (7200 об/мин., ATA 100) 20-35
Quantum Atlas 10K III (10000 об/мин., SCSI Ultra 160) 34-54
Seagate Barracuda ATA III ST310215A (7200 об/мин. ATA100) 25-41
Seagate Cheetah X15 (15000 об/мин., SCSI Ultra 160) 38-47

Еще одним ограничением является малая пропускная способность внутренней интерфейсной шины. Так, наиболее распространенная 32 битная PCI обеспечивает пиковый поток не более 132 Мбайт/сек, а реальная скорость передачи данных с учетом наличия еще нескольких устройств на шине в несколько раз меньше. Таким образом, для создания системы цифровой обработки видео на базе ПК, до недавнего времени, существовало только два пути. Первый - использовать модульные (блок обработки видео является внешним устройством) программно-аппаратные комплексы, где персональный компьютер выполняет только функции управления. Второй путь - применять настольные системы, активно использующие ресурсы компьютера, но работающие со сжатым видеосигналом на всех этапах обработки. Применение компрессии значительно уменьшает требования к компьютерной платформе, и, прежде всего, к дисковой подсистеме, поэтому платы, использующие тот или иной алгоритм сжатия, и получили столь широкое распространение. В большинстве случаев использование сжатия с небольшой степенью компрессии оправдано и необходимо, поскольку обеспечивает достаточно высокое качество при существенном сокращении потока данных. Благодаря простоте реализации первой стала применяться внутрикадровая Motion JPEG компрессия, которая при степени сжатия 3:1 обеспечивает вещательное качество сигнала. Совсем недавно появились и устройства, использующие более прогрессивный стандарт MPEG, который позволяет устранить не только пространственную, но и временную избыточность при сжатии от 10:1 до 50:1. Однако, как только возникает необходимость реализации сложного многослойного монтажа, применение сжатия становится крайне нежелательным, т.к. в этом случае при просчете каждого кадра происходит многократный цикл компрессии/декомпрессии, который приводит к появлению значительных артефактов. Модульные системы, работающие с некомпрессированным видео, лишены этих недостатков, но, кроме очень высокой стоимости подобные комплексы имеют и еще ряд минусов. Так, например, количество функций, заложенных разработчиками, велико, но все же ограничено, а любая модификация требует значительных финансовых затрат и, ко всему, зачастую сопряжена и с техническими трудностями. Закрытый цикл обработки не позволяет использовать промежуточные результаты, часто делает невозможным операции экспорта и импорта медиаданных и организацию видеопроизводства в структуре локальной рабочей группы. На сегодняшний день это уже серьезное ограничение, так как при подготовке сложного проекта часто возникает ситуация, когда имеет смысл разделить работу и выполнять ее на различных рабочих станциях.

Недостатки модульных систем очевидны, но до недавнего времени альтернативы для работы с некомпрессированным сигналом, особенно в реальном времени, не существовало. Однако интенсивное развитие технологий хранения данных и общий рост производительности персональных компьютеров привел к тому, что появилась возможность создавать настольные системы для обработки видео, которые по своим возможностям приближаются к дорогостоящим модульным комплексам. При этом их цена остается достаточно низкой и, таким образом, чаша весов "возможности/стоимость" постепенно начала склоняться в пользу более гибких и многофункциональных Desktop систем.

Можно отметить, что компьютерные системы для обработки видео развиваются по тем же законам, что и вся высокотехнологичная область вычислительной техники. Происходит постепенный переход от узкоспециализированных комплексов стоимостью в сотни тысяч долларов к настольным ПК, которые успешно выполняют те же задачи. Кроме того, сохраняется и тенденция по переносу функций отдельных аппаратных модулей на центральный процессор. Конечно, можно спорить о достоинствах или недостатках такого подхода, однако, вполне вероятно, что наступит момент, когда мощность центральных процессоров достигнет уровня, который позволит им обрабатывать несжатое видео в реальном времени. Пока делаются лишь первые шаги в этом направлении, однако, начало положено, и подтверждением тому могут служить дополнительные наборы инструкций MMX, SSE, SSE2 и 3DNow!, которые ориентированы на мультимедиа приложения.

И все же, сегодня основная нагрузка при работе с видео ложится на специализированные процессоры, способные быстро обрабатывать огромные массивы графической информации. Долгое время одни и те же чипы использовались как в модульных монтажных станциях, так и в Desktop системах. Но жизнь не стоит на месте, и пришло время, когда, наконец, появились производительные видеопроцессоры специально предназначенные для работы в составе настольного комплекса и тесно интегрированные с архитектурой ПК. Именно в соответствии с этим принципом и был спроектирован чип HUB3 фирмы Truevision.

Прежде, чем перейти к описанию этого многофункционального процессора, хотелось бы вкратце описать общие принципы построения компьютерных систем для обработки видео.

Большинство современных цифровых плат для нелинейного монтажа позаимствовали свою потоковую архитектуру у систем, работающих с аналоговым сигналом. В этом случае все видео и аудио потоки проходят через ряд real-time процессоров и смешиваются в выходном микшере. Схема последовательности обработки задается при проектировании и любые изменения невозможны без изменения дизайна платы.


Схема работы традиционной двухпотоковой монтажной системы

Жестко заложенный алгоритм обработки, невозможность одновременной работы с сигналами различных форматов, работа только с двумя слоями видео - вот основные негативные черты, доставшиеся в наследство от традиционных двухпотоковых монтажных плат. В идеале же современная цифровая система должна удовлетворять принципам масштабирования, расширяемости и иметь возможность перепрограммирования. Все это требует применения мощного видеопроцессора с гибким доступом к емкой и быстрой оперативной памяти. Подобная архитектура получила название "Memory centric".


Схема работы монтажной системы с архитектурой "Memory Centric"

Данная технология подразумевает преобразование любого входного сигнала в цифровой массив, размещаемый в локальной оперативной памяти. Затем видеопроцессор выполняет необходимые преобразования и, в свою очередь, также помещает результаты в ОЗУ. После завершения операции выходной массив снова превращается в цифровой поток. По сравнению с традиционной архитектурой, "memory centric" имеет целый ряд преимуществ. Прежде всего, это исключительное сочетание гибкости, характерной для чисто программных решений и скорости аппаратной акселерации. Кроме того, представление видеопотока в форме числового массива позволяет использовать любые разрешения и одновременно легко работать c любым форматом сигнала.

Первой платой нелинейного видеомонтажа, которая использовала "memory centric" архитектуру, была мультиплатформенная Targa 2000 компании Truevision, построенная на видеопроцессоре HUB2. Она нашла очень широкое применение в профессиональных продуктах самого различного уровня как на платформе PC, так и на MAC системах, и до сих пор пользуется заслуженной популярностью. Следующим шагом стало создание нового процессора HUB3, который по производительности более чем в 4 раза превосходит своего предшественника.

HUB3 - специализированный видеопроцессор с высокой степенью интеграции, выполненный по 0.25-микронной технологии. В соответствии с концепцией "memory centric", при его создании основное внимание было уделено обеспечению высокоскоростного обмена данными с оперативной памятью. Для этого используется 128 - разрядная шина данных с тактовой частотой 100 МГц. В результате пиковая пропускная способность достигает 1.5 ГБайт/с, что дает возможность передавать до 75 потоков некомпрессированного 4:2:2 видео стандарта CCIR 601 в реальном времени. Все внутренние преобразования осуществляются в представлении 4:4:4:4 или 4:2:2:4 при глубине квантования 8, 10 или 16 бит на каждый компонент, что обеспечивает очень высокое качество выходного сигнала. HUB3 имеет два независимо программируемых блока обработки данных, которые могут работать параллельно. Каждый из них способен обрабатывать до 100 Мпиксел/сек, что почти в 8 раз превышает потребности по воспроизведению видео в стандартном разрешении NTSС или PAL. Новый процессор ориентирован на применение современных быстродействующих микросхем ОЗУ типа SDRAM, что позволяет не только обеспечить высокую производительность, но и открывает возможность использования недорогих стандартных чипов памяти. В отличие от большинства представителей предыдущего поколения, HUB3 имеет очень гибкую архитектуру, изменяемую программным путем. Например, имеется возможность перепрограммировать процессор так, чтобы он обрабатывал кадры с соотношением сторон 16:9, или использовал прогрессивную развертку без каких-либо аппаратных изменений.


Структурная схема видеопроцессора HUB3

Основные характеристики видеопроцессоров HUB2 и HUB3 от Truevision

  HUB2 HUB3
Максимальная пропускная способность памяти 320 МБ/с 1500 МБ/с
Тип оперативной памяти DRAM/VRAM SDRAM
Формат пикселя RGBK RGBK и/или YUVK
Глубина цвета (число бит на компонент) 8 8, 10 или 16 (внутреннее представление)
Цветовое представление 4:2:2:4 4:4:4:4
Число уровней белого 0-255 18-235 и/или 0-255
Число потоков 4:4:4:4 (8 бит) 8 37
Число потоков 4:2:2:0 (8 бит) - 75
Число портов ввода /вывода 1 вход, 1 выход, 1 вход/выход 5 входов 5 выходов
Пропускная способность порта 108 МБ/с 310 МБ/с
Формат кадра 4:3 произвольный
Число аудио каналов 2 входа 2 выхода 8 на каждый порт
Формат звука 48/44.1 КГц, 16 бит 48 КГц, 20 или 16 бит
Тип локальной шины 32 бит 32 или 64 бит PCI
Скорость передачи данных по локальной шине 40 Мбайт/с 200 Мбайт/с
Максимальное число кодеков 2 4
Аппаратный хрома кейер Нет Есть
Аппаратный люма кейер Нет Есть

Для того, чтобы обеспечить удовлетворительную работу с несжатым видеосигналом, разработчики использовали много оригинальных технических решений и значительная часть из них касается интерфейсов с внешними устройствами. Так, производительности наиболее распространенной 32 битной PCI шины не хватает для передачи больших потоков некомпрессированного видео и поэтому HUB3 использует собственный встроенный 64 битный DMA (Direct Memory Access) интерфейс, ориентированный на применение 33 МГц промышленной шины PCI64. При этом максимальная скорость обмена между графическим процессором и системной памятью или дисковой подсистемой составляет 200 Мбайт/сек. Для внешнего обмена медиа данными чип имеет по 5 встроенных портов ввода и вывода, каждый из которых может работать с одним слоем некомпрессированного видео и 8 каналами цифрового звука. Все порты имеют собственные внутренние DMA каналы для быстрого и независимого доступа к ОЗУ. В результате процессы кодирования/декодирования видео и звука, микширования, кеинга и многие другие выполняются в реальном времени с использованием локальной оперативной памяти.

В целом, можно сказать, что уникальные возможности HUB3 позволяют создавать монтажные программно-аппаратные комплексы, никак не ограничивающие художественные замыслы, и открыть новую страницу в истории компьютерных систем обработки видео.

EventCatalog.ru — всё для организации мероприятий!