ЦИФРОВОЕ ВИДЕО: MPEG
ЦИФРОВОЕ
ВИДЕО: MPEG
Вопросы
и ответы по MPEG
Словарь
специальных терминов:
Большинству пользователей ПК хорошо знаком термин MPEG. В первую очередь с ним ассоциируется возможность смотреть на компьютере полнометражные полноэкранные видеофильмы (CD-i, Video-CD), что всего несколько лет назад казалось просто невозможным. Правда, до сих пор большинство людей воспринимают идею об использовании компьютера в качестве видеомагнитофона и телевизора как некую экзотику, функцию, предназначенную больше для демонстрации возможностей своего любимца, чем для повседневного применения. Но постепенно цена плат для проигрывания MPEG становится все более доступной, да и большинство современных компьютеров Pentium могут справиться с этой задачей за счет программных средств. Грядущая эра MMX окончательно сделает компьютерное видео привычным элементом на любом домашнем ПК. И если раньше найти Video-CD фильмы было довольно сложно, то сейчас их ассортимент состоит уже из сотен наименований, причем каждый месяц на Российском рынке появляются десятки новых дисков, многие из которых - прекрасные отечественные фильмы.
В отличии от AVI-формата, который обычно использует алгоритмы сжатия Motion-JPEG, MPEG-файлы занимают значительно меньше места. Сейчас, когда идея домашней видео-студии уже витает в воздухе, чтобы оцифровать и отредактировать одну минуту видео с качеством VHS (например, при помощи платы miroVideo DC20) требуется от 100 до 200 Мбайт дискового пространства. Легко подсчитать, что для монтажа получасового свадебного ролика необходимо такое количество свободных Мбайт, которое вряд ли имеется в наличии на вашем жестком диске. В то же время с помощью MPEG-сжатия мы бы без проблем уложились в 1Гбайт. Но здесь есть свои проблемы: во-первых MPEG, в отличии от AVI очень тяжело редактировать и до последнего времени не было соответствующих редакторов; во-вторых, цена систем для оцифровки MPEG несколько выше, чем на обычные платы ввода видео. В материале "Почем нынче MPEG для народа?" мы рассмотрим три новые системы для оцифровки и редактирования MPEG, которые укладываются в ценовые рамки до двух тысяч долларов и предназначены в первую очередь для домашнего и корпоративного применения. Но вначале краткий обзор по структуре и спецификациям MPEG.
MPEG (Moving Picture Experts Group) - объединенный комитет Интернациональной Организации по Стандартизации (ISO) и Интернациональной Электротехнической Комиссии (IEC). Эта группа экспертов встречается примерно четыре раза в год чтобы разработать и утвердить стандарты на сжатие цифрового видео и звука. Основной критерий, который обсуждается комитетом MPEG - это интенсивность потока сжатых данных, определяемая в зависимости от современного уровня компьютерных технологий и сферы применения данного формата. Так, MPEG-1 был разработан с учетом возможностей 2-скоростных дисководов CD-ROM и компьютеров с 486-процессором. Алгоритмы сжатия могут определяться самими производителями оборудования и микросхем, поэтому в этой области идет постоянная конкуренция за достижение лучших результатов.
Статус MPEG
В январе 1992 года комитет MPEG опубликовал общие характеристики MPEG-1, а к декабрю 1993 г. они были приняты в качестве стандарта (дополнительные материалы вы можете найти в статье "Живое видео на выставке Comptek`95", Мир ПК №7-8/95). По этим спецификациям интенсивность потока данных сжатого видео и звука должна укладываться в 1.5 Мбайт/с, хотя были предусмотрены режимы вплоть до 4-5 Мбайт/с. Важность пониженного потока данных определялась существующими на тот момент стандартами Video-CD, CD-i и характеристиками дисководов CD-ROM. Базовый алгоритм ограничивает скорость передачи данных диапазоном 150-225 Кбайт/с с разрешении 352 x 288 (PAL) или 320 x 240 (NTSC) при частоте смены 25 или 30 кадров в секунду соответственно.
Окончательное утверждение MPEG-2 в качестве международного стандарта было дано на 29-м съезде MPEG (Сингапур, ноябре 1994). В его спецификациях определена допустимая интенсивность потока данных от 2 до 10 Мбайт/с. Первично MPEG-2 разрабатывался для цифровой передачи и отображения видео вещательного качества, но позже в нем был предусмотрен формат телевидения высокой четкости (ТВЧ). До этого необходимые спецификации для ТВЧ должны были быть включены в последующий MPEG-3 стандарт, с разрешением вплоть до 1920 x 1080 при частоте 30 Гц и интенсивности потока данных от 20 до 40 Мбайт/с. Оказалось, что с некоторой доработкой код MPEG-2 и даже MPEG-1 работает вполне нормально для задач HDTV. В результате разработка MPEG-3 была прекращена.
Зато начались работы над MPEG-4. Новый стандарт будет рассчитан на очень низкие потоки данных для применения в видеотелефонах, мультимедийной электронной почте, электронных информационных изданиях и т.п. Объявлено об этом было на встрече в Брюсселе в сентябре 1993. MPEG-4 будет оптимизирован для минимальных разрешений, вплоть до 176 x 144 при частоте 10 Гц, с интенсивностью потока данных от 4,800 до 64,000 бит в секунду. Для достижения нормальной производительности и приемлемого качества при столь низких требованиях к ресурсам скорей всего будет применена новая технология сжатия видео и аудио данных. Примерные технические спецификации нового стандарта ожидаются в 1997 году, а официальное его утверждение состоится не ранее ноября 1998 года.
Структура MPEG
В MPEG используется поточное сжатие видео, т. е. обрабатывается не каждый кадр по отдельности (как это происходит при сжатии видео с помощью алгоритмов Motion-JPEG), а анализируется динамика изменений видеофрагментов и устраняются избыточные данные, т. к. в большинстве фрагментов фон остается достаточно стабильным, а действие тем временем происходит на переднем плане. MPEG начинает сжатие с создания исходного (ключевого) кадра, называемого "I" или "Intra" (И) кадр. И-кадры играют роль опорных при восстановлении остальных изображений и размещаются последовательно через каждые 10-15 кадров. Только некоторые фрагменты изображений, которые находятся между И-кадрами претерпевают изменения, и именно эта разница сохраняется при сжатии. Кроме И-кадров в MPEG-последовательности имеется еще два типа изображений:
И-кадры составляют основу MPEG файла и через них осуществляется случайный доступ к какому-либо отрывку видео, но при этом у них довольно низкий коэффициент сжатия. П-кадры кодируются относительно предыдущих кадров (И или П), и, обычно, используются как сравнительный образец для дальнейшей последовательности П-кадров. В этом случае достигается высокий коэффициент сжатия. Д-кадры обеспечивают наибольший коэффициент сжатия, но при этом для их привязки к видеопоследовательности необходимо использовать не только предыдущее, но и последующее изображение. Сами Д-кадры никогда не используются для сравнения. Изображения объединяются в группы (GOP - Group Of Pictures), представляющие собой минимальный повторяемый набор последовательных изображений. Типичной является группа вида:
(И0 Д1 Д2 П3 Д4 Д5 П6 Д7 Д8 П9 Д10 Д11) (И12 Д13 Д14 П15 Д16 Д17 П18 ...)
Отдельные изображения состоят из структурных единиц - макроблоков, соответствующих участку изображения размером 16 x 16 пикселов. Компьютер анализирует изображение и ищет идентичные или практически похожие макроблоки, сравнивая базовый и последующие кадры. В результате сохраняются только данные о различиях между кадрами, называемые вектором смещения (vector movement code). Макроблоки, которые не претерпевают изменений игнорируются, и количество данных для реального сжатия и хранения существенно снижается. Для повышения устойчивости процесса восстановления изображений к возможным ошибкам передачи данных последовательные макроблоки объединяют в независимые друг от друга разделы (slices). В свою очередь каждый макроблок состоит из шести блоков, четыре из которых несут информацию о яркости Y, а по одному определяют цветовые U- и V-компоненты. Блоки являются базовыми структурными единицами, над которыми осуществляются основные операции кодирования, в том числе выполняется дискретное косинусное преобразование (DCT - discrete cosine transform). В результате при использовании MPEG можно добиться рабочего коэффициента сжатия более чем 200:1, хотя это приводит к некоторой потери качества.
Использование MPEG
MPEG-1
MPEG-1 по своим качественным параметрам во многом аналогичен обычному VHS-видео, поэтому ему находится применение в первую очередь там, где неудобно или непрактично использовать стандартные аналоговые видео-носители.
Видео киоски
Видео киоски (или информационные киоски) дают возможность по новому организовать и автоматизировать информационный сервис в рамках вашей организации. Особенно это важно для розничных магазинов, автомобильных салонов и банков. Продавец не всегда способен уделить достаточно внимания сразу нескольким клиентам, тем более он просто не имеет возможности подробно рассказать о всех особенностях и спецификациях того или иного продукта, наглядно и эффектно его продемонстрировать. А видео киоск всегда будет в вашем распоряжении. В нем можно разместить не только подробную информационную базу о имеющихся продуктах и услугах, но и включить туда интерактивные видеофильмы, позволяющие просто и наглядно ответить на многие вопросы. К примеру: "Какие у вас имеются модели автомобилей?", "Расскажите об их особенностях?", "Какой цвет я могу выбрать?". Информация, которая ранее выводилась в виде слайдов и сопроводительного текста теперь становится более доступной и эффектной благодаря внедрению полноэкранного видео. Используя MPEG-1 разработчик может регулярно и без особых дополнительных затрат обновлять содержание видео киоска. Развитие программных средств и эволюция пользовательского интерфейса ведут к все более впечатляющей интерактивности подобных аппаратов.
Видео по требованию (Video on Demand)
Термин "видео по требованию" появился сравнительно недавно. Вначале подобный сервис можно было встретить только в дорогих отелях, а теперь уже полным ходом идет реализация глобальной идеи об интерактивной цифровой телевизионной системе, через которую любой пользователь сможет запросить какой-либо фильм или передачу в определенное время и прямо на дом. Современные технологии позволяют говорить об этом проекте, как о грядущей реальности, хотя до появления подобного устройства в широком употреблении пройдет еще несколько лет.
Видео по телефону
Некоторые телефонные компании сейчас разрабатывают системы, которые позволят нам заказывать фильмы через обыкновенные телефонные линии. Правда, приходится учитывать ограниченную пропускную способность имеющихся телефонных коммуникаций, но повсеместное внедрение ISDN и других новых технологий связи помогут решить эту проблему.
Обучение
Рынок тренажеров и интерактивных учебных комплексов сейчас бурно развивается. Раньше для подобных задач использовались аналоговые видеосистемы и лазерные видеодиски. MPEG стал идеальной альтернативой, т. к. эта технологий при более низких затратах дает целый ряд преимуществ: транспортабельность и компактность, легкость в модернизации и возможность работать в сети. Мне кажется, что для российских фирм этот рынок сегодня так же представляет большой интерес.
Корпоративные презентации
Корпоративный рынок становится все более требовательным к качеству и техническим возможностям презентационного оборудования. Большинство новых программных пакетов, предназначенных для подобных целей, поддерживают работу с видео, в том числе в формате MPEG. Но многие пользователи просто недооценивают возможности, которые предлагают нам современные мультимедиа-системы. Ведь даже если написать хороший, аргументированный проект или доклад, то без эффектного сопровождения и интерактивных иллюстраций ваши идеи могут остаться невостребованными, многие менеджеры уже убедились в этом на собственном опыте.
Видео библиотеки
Организации, имеющие большие видео-архивы, могут существенно выиграть, перекодировав их в цифровой формат и поместив на CD-носители или специальный сервер. В отличии от аналоговых носителей данный метод гарантирует длительное хранение, многократное проигрывание без потери качества и быстрый доступ к любому фрагменту. К тому же, обладая подобным видеоматериалом, вы легко сможете открыть удаленный доступ к нему через внутреннюю локальную сеть (Интранет) или через WWW. Поэтому музеи, библиотеки, государственные предприятия и научные учреждения, так же как рекламные фирмы и информационные агентства переходят сейчас на цифровое видео.
MPEG-2
Спецификации MPEG-2 подразумевают использование высоких разрешений для достижения максимального качества изображения, поэтому этот формат применяется в первую очередь в профессиональных сферах.
Кабельное телевидение (CATV: Cable Television)
Идея перевести кабельное телевидение на цифровое вещание напрашивается сама собой. Имеющиеся магистрали для передачи видеосигнала вполне могут выдержать интенсивность и объем данных, необходимые для вещания MPEG-видео высокого разрешения (MPEG-2). Уже в ближайшее время должны появиться первые подобные системы. Впервые пользователь реально сможет принимать телепередачи в высоком разрешении со стерео и Dolby Surround звуком.
Направленное спутниковое вещание (DBS: Direct Broadcast Satellite)
Консорциум Hughes/USSB собирается использовать MPEG-2 для направленного вещания. Компания Thomson уже производит специальные декодеры, установив которые вы сможете принимать до 150 каналов. Правда, подобные системы работают пока только в Северной Америке.
ТВЧ - телевидение высокой четкости (HDTV: High-Definition Television)
В США создан консорциум компаний (U.S. Grand Alliance), который разрабатывает новый стандарт HDTV для телевидения высокого разрешения. В нем будет использоваться MPEG-2 с поддержкой следующих режимов: 1440 x 960 при 30 Гц и 1280 x 720 при 60 Гц. Легко себе представить, сколь высоко будет качество подобных телепередач.
Заключение
В итоге можно утверждать, что MPEG является доминирующим стандартом для полнометражного цифрового видео, за исключением нелинейного цифрового монтажа, где в данный момент более распространен Motion-JPEG. Однако, по мере того как все большее количество кодирующих MPEG-систем будет появляться на рынке, MPEG-2 внедрится и в эту нишу. В ближайшее время появится большое количество новых сфер применения для технологии MPEG, начиная от высококачественных цифровых DVD-видеодисков и новейших игровых систем и заканчивая совершенными цифровыми вещательными и монтажными комплексами.
- Какое различие между MPEG-1 и MPEG-2?
MPEG-1 и MPEG-2 различаются объемом информации, содержащейся в видео-потоке, сжатом в соответствии с этими форматами, и, как следствие, качеством. Хотя MPEG-1 может работать с разрешениями вплоть до CCIR-601 (720 x 480), обычно он кодируется при значительно более низкой интенсивности потока данных, что приводит к худшему качеству видео. MPEG-1 обычно ассоциируется с SIF-разрешением (352x240), это аналогично качеству VHS. При воспроизведении такое изображение растягивается аппаратными или программными средствами вплоть до полного экрана, и хотя при этом теряется качество, зато остается возможность проигрывать полноэкранное видео даже с двухскоростных дисководов CD-ROM.
MPEG-2 поддерживает более высокие разрешения (в т.ч. CCIR-601). При этом объем данных в MPEG-2 более чем в четыре раза больше относительно MPEG-1, что позволяет записывать с его помощью полноэкранные фильмы "вещательного" (Betacam) качества. Этот формат избран для использования в новом поколении видеодисков на основе технологии DVD, а в скором времени станет доминировать и на PC. В отличии от MPEG-1 для MPEG-2 необязательно наличие GOP-групп, и даже при отсутствии GOP-заголовка можно получить прямой доступ к видеофрагменту. Другой ключевой особенностью MPEG-2 является наличие в нем расширений, которые позволяют при записи видеосигнала разделение его на два или более независимо кодируемых потока данных, представляющих видео в различных разрешениях, с лучшим или худшим качеством изображения. Это делается с целью создания независимых потоков данных определенной интенсивности в рамках одного видео сигнала. Такая функция важна для приложений типа ТВЧ, когда необходимо одновременно транслировать ТВЧ и стандартный телевизионный сигнал.
- Как MPEG сравним с QuickTime или Indeo?
QuickTime и Indeo не позволяют полноэкранного воспроизведения с вещательным качеством и не поддерживают оцифровки изображений с полной разверткой (два поля на кадр), что необходимо для профессионального применения. Это оригинальные разработки компаний Apple и Intel, ориентированные в первую очередь на мультимедиа-рынок. Только MPEG может быть реализован как программно так и аппаратно на обеих платформах (PC и Mac). К тому же, в то время как MPEG позволяет достичь коэффициента сжатия до 200:1, QuickTime предусматривает 50:1, а Indeo обеспечивает уровень сжатия не более 10:1. При этом QuickTime и Indeo даже при низких коэффициентах сжатия не достигают качества MPEG.
- Возможно ли программное воспроизведение MPEG?
Да. В зависимости от конфигурации можно добиться вполне приличного качества программного воспроизведения MPEG и Video-CD на компьютере с процессором Pentium. Три фактора, влияющие на качество проигрывания MPEG:
Программные проигрыватели MPEG обычно прилагаются в поставке с графическими платами; так же их можно найти в Internet.
- Почему имеется столь большая разница в цене между системами для оцифровки и воспроизведения MPEG?
Оцифровка MPEG, особенно если это происходит в режиме реального времени требует очень больших аппаратных и вычислительных ресурсов, поэтому соответствующее оборудование имеет достаточно высокую стоимость. На сегодня минимальные цены на системы записи MPEG колеблются в рамках от 1,000 до 10,000 долл. MPEG-проигрыватель можно купить за 100-300 долл.
- Что такое Video-CD?
Video-CD - это процесс (и соответствующий формат), который позволяет записывать MPEG-видео на CD диск и воспроизводить его на любом оборудовании, поддерживающем данный формат.
AES/EBU (Audio Engineers Society / European Broadcast Union) - Общество Звукоинженеpов / Евpопейское Вещательное Объединение - цифpовой интеpфейс для студийной pадиоаппаpатуpы. Цифpовой интеpфейс позволяет пеpедавать звуковые сигналы между аппаpатуpой без потеpи качества, котоpое неизбежно теpяется пpи пеpедаче сигналов в аналоговой фоpме.
AVI - Audio Video Interleaved, оригинальная аббревиатура для Microsoft Video For Windows
AVI MPEG (Editable MPEG) - разновидность MPEG-формата. Структура AVI MPEG основана только на И-кадрах, поддающихся редактированию в любой видео-редакторе. Для дальнейшего преобразования этого формата в стандартный MPEG-файл необходимо перекодировать его на основе И-, П- и Д-последовательностей (IPB).
CCIR-601 - CCIR является аббревиатурой Интернационального Комитета по Телеграфу и Телефонии (International Committee on Telegraph and Telephones), стандарт 601 описывает формат цифрового видео с разрешением 720 x 486 при частоте 30 Гц
CD-i - Compact Disc - Interactive, разновидность игровой приставки со встроенным дисководом CD-ROM. Аналогичное название получил формат CD-дисков с MPEG-фильмами и играми, разработанный фирмой Philips для этой приставки.
CODEC (кодек) - Coder and Decoder - сокращенная аббревиатура для микросхемы или программного драйвера, осуществляющих кодирование и декодирование определенных данных (например аппаратный CODEC Motion-JPEG)
Decode (декодирование) - термин, определяющий процесс декомпрессии данных
DVI - Digital Video Interactive, схема сжатия видео-данных фирмы Intel, которая не была утверждена комитетом ISO в свете развития MPEG стандарта
Encode (кодирование) - термин, определяющий процесс сжатия данных
Field - Поле. Отдельное изображение в составе видео-потока. Каждый кадр состоит их четных и нечетных строк (черезстрочная развертка). Нечетные строки формируют нечетное поле, четные строки - четное поле. Видеосигнал может записываться с полной разверткой (25 кадров/50 полей) и частичной разверткой (25 кадров/25 полей)
IEC - International Electrotechnical Commission, Интернациональная Электротехническая Комиссия - государственная организация, работающая с ISO
Indeo - оригинальный формат цифровой видеозаписи фирмы Intel
Interpolation - интерполяция, специальный алгоритм масштабирования исходной картинки с целью получить полноэкранное изображение. На этом принципе работают MPEG-распаковщики, "растягивая" кадры с разрешением 352 x 240 до полноэкранного формата
ISO - International Standards Organization, Международная Организация по Стандартам
Киоск - автономная система для предоставления информации
NTSC - National television Standarts Committee, Национальный Комитет по телевизионным Стандартам
Pre-filtering - предварительная фильтрация, - процесс обработки изображения перед сжатием
Post-filtering - последующая фильтрация, - процесс обработки изображения после сжатия
QuickTime - системные расширения фирмы Apple для просмотра и монтажа цифрового видео; соответствующий видео формат
PCM (Pulse Code Modulation) - импульсно-кодовая модуляция - стандаpтный способ цифpового кодиpования звукового сигнала пpи помощи последовательности абсолютных значений амплитуды
Real-Time - процесс, происходящий в режиме реального времени (например, на запись одной минуты MPEG требуется одна минута времени)
SIF - термин, описывающий компьютерное разрешение 352x240 точек, соответствующее разрешению VHS (QSIF - Quarter SIF, т.е. четверть от разрешения SIF: 176x120)
S/PDIF (Sony/Philips Digital Interface Format) - Фоpмат Цифpового Интеpфейса фиpм Sony и Philips - цифpовой интеpфейс для бытовой pадиоаппаpатуpы; S/PDIF пpедставляет собой упpощенный ваpиант AES/EBU и используется, в частности, для вывода в цифpовом фоpмате сигнала с компакт-дисков.
Square Pixel Resolution - компьютерное разрешение видеосигнала, соответствующее стандартному VGA-режиму 320x240
VFW - Video for Windows, интерфейс и формат цифрового видео фирмы Microsoft
VTR - Video Tape Recorder, магнитофон для записи и воспроизведения видео
VOD - Video on Demand, видео по требованию, термин, описывающий возможность для пользователя в данный момент времени затребовать любой выбранный им для просмотра видеофильм
SMPTE - Society of Motion Picture and Television Engineers, Сообщество Инженеров Кино и Телевидения. Одноименный формат кода для синхронизации аудио- и видео-данных.
.WAV - широко распространенный звуковой формат для PC
URL - аббревиатура HTTP адреса в Internet