ФЕДЕРАЛЬНОЕ АГЕНСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ
ФЕДЕРАЦИИ
Государственное образовательное учреждение высшего профессионального образования
Ивановский государственный
химико-технологический университет
Факультет неорганической химии и технологии.
Кафедра ТП и МЭТ.
Реферат
Современные форматы видео
Выполнил:
студент 5 курса 14 группы
дневного отделения:
Поздеев М.Е.
Иваново – 2007
Содержание
Глава 1. Основные характеристики видео
1.2. Эксплуатационные возможности
1.4. Затраты на приобретение и эксплуатацию техники
1.5. Количество кадров в секунду
1.8. Соотношение сторон экрана
1.9. Количество цветов и цветовое разрешение
1.10. Ширина видеопотока (для цифрового видео)
3.1. Форматы аналоговой записи
3.3. Сравнение форматов записи
4.1. Технологии сжатия цифрового видео
4.2. Технологии и алгоритмы сжатия видео
4.3. MPEG (MPEG-1, MPEG-2, MPEG-3, MPEG-4)
Глава 5. Современные мобильные видеоформаты
Глава 6. Программы, необходимые для воспроизведения видео
Глава 7. Современные видеокамеры
Глава 8. Носители цифрового видео
Глава 9. Системы спутникового телевидения
Глава 10. Телевидение высокой четкости (HDTV: High-Definition Television)
Глава 11. Справочная информация и термины
Введение
Ви́део (от лат. Video - дословно «вижу») - под этим термином понимают широкий спектр технологий записи, обработки, передачи, хранения и воспроизведения визуального и аудиовизуального материала. Когда в быту говорят «видео» - то обычно имеют в виду видеоматериал, телесигнал или кинофильм, записанный на физическом носителе (видеокассете, видеодиске и т. п.).
Обычные телевизионные видеоданные представляют собой поток аналоговых сигналов. Компьютерная обработка видеоинформации состоит в преобразовании их в цифровой формат с последующим хранением этих данных на жестком или компакт-диске или другом устройстве хранения информации. Оцифровка видеосигнала, как и оцифровка звука, включает две стадии: дискретизация данных аналогового видеопотока, т. е. снятие отсчетов с определенной частотой, и преобразование каждого такого отсчета в цифровой эквивалент или квантование.
При хранении оцифрованных данных в несжатом формате изображение размером 400x300 пикселов с глубиной цвета 24 бита на пиксел, обновляемое с частотой 25 Гц, потребует скорости передачи информации более 5,5 Мб/с. А хранение данных для показа 5-минутного ролика в указанном формате потребует информационное пространство, превышающее 1,6 Гб. Естественно, что при работе с такими данными невозможно обойтись без сжатия, однако и в этом случае потребуется время, определенные вычислительные мощности на распаковку данных. Достичь оптимального сжатия можно путем совершенствования аппаратных или программных средств, а может быть, совместно тех и других.
В качестве аппаратных средств используются специальные видеопроцессоры, которые поддерживают высокоскоростную компрессию и декомпрессию данных, не загружая центральный процессор компьютера. Второй подход состоит в использовании специализированных методов программного сжатия и распаковки предварительно сжатых видеоданных.
Аналоговый видеосигнал включает в себя несколько различных компонентов, объединенных в единое целое. Такой составной видеосигнал малопригоден для оцифровки. Предварительно его следует разделить на так называемые базовые компоненты. Обычно компоненты представляют собой три различных сигнала, соответствующие определенной модели представления цветового пространства. Если в статической графике используется RGB-цветовое представление, то в цифровом видео чаще используется модель YUV. Видеопоследовательности отображаются в виде серии кадров или фреймов, каждый из которых, no-существу, является графическим изображением и включает в себя определенное число пикселов. Такой видеофрейм может быть сжат с помощью одного из алгоритмов сжатия изображений, с потерями или без потерь.
Основные характеристики видео
Качество изображения
Под качеством изображения обычно понимается разрешение, то есть количество воспроизводимых вертикальных линий. Это оценка, по существу, поверхностная, так как существует много других, не менее важных, параметров, столь же заметных человеческому глазу, как и четкость по строке.
Качество видео измеряется с помощью формальных метрик, таких, как, например, PSNR, или с использованием субьективного сравнения с привлечением экспертов.
Метрика PSNR
В рамках тестирования критерием оценки качества может служит метрика PSNR (peak signal to noise ratio/пиковое отношение сигнала к шуму, измеряется в дБ). Данная метрика, по сути, аналогична среднеквадратичному отклонению, однако пользоваться ей несколько удобнее за счет логарифмического масштаба шкалы. Ей присущи те же недостатки, что и среднеквадратичному отклонению. Эта метрика очень популярна, ее используют во многих научных статьях и сравнениях в качестве меры потери качества. Как и все существующие метрики, она не идеальна и имеет свои достоинства и недостатки. Значение метрики тем больше, чем больше разница между сравниваемыми изображениями.
Смысл графиков PSNR/Frame size
На графике изображена зависимость показателя метрики от среднего размера кадра. Каждая ветвь соответствует определенному кодеку. Ветви построены на опорных точках, каждая из которых соответствует конкретному битрейту. Очевидно, на каждой ветви находится по десять точек (каждая последовательность сжимается на 10 настройках битрейта). Бывает, что кодек не удерживает битрейт и с разными настройками битрейта сжимает одинаково. В таких случаях на ветви кодека расположено менее десяти опорных точек. При сравнении кодеков на этих графиках следует обращать внимание на то, как высоко расположены ветви кодеков. Чем выше находится ветвь - тем выше качество последовательности, сжатой данным кодеком.
Существуют и другие метрики:
MSAD - Значением данной метрики является усреднённая абсолютная разность значений цветовых компонент в соответствующих точках сравниваемых изображений. Используется, например, для отладки кодеков или фильтров.
Delta - Значением данной метрики является усреднённая разность значений цветовых компонент в соответствующих точках сравниваемых изображений.
Bluring measure - Данная метрика позволяет сравнить степень размытия двух изображений, относительно друг друга. Чем ближе её значение к 0, тем больше размыто изображение.
Blocking measure - Метрика строилась так, чтобы ее значение было пропорционально визуальной степени "блочности". Например, в контрастных областях кадра границы блоков почти незаметны, а в однородных та же граница будет хорошо видна.
SSIM Index - Основывается на замере трёх компонент (сходности по яркости, по контрасту и структурного сходства) и объединения их значений в итоговый результат.
Субьективное качество видео измеряется по следующей методике:
Выбираются видеопоследовательности для использования в тесте;
Выбираются параметры системы измерения;
Выбирается метод показа видео и подсчета результатов измерения;
Приглашается необходимое число экспертов (обычно не меньше 15);
Проводится сам тест;
Подсчитывается средняя оценка на основе оценок экспертов.
Несколько методов субъективной оценки описаны в рекомендациях ITU-T BT.500. Один из широко используемых методов оценки - это DSIS (англ. Double Stimulus Impairment Scale), при котором экспертам сначала показывают исходный видеоматериал, а затем обработанный. Затем эксперты оценивают качество обработки, варьируя свои оценки от «обработка незаметна» и «обработка улучшает видеоизображение» до «обработанный видеоматериал сильно раздражает».
Эксплуатационные возможности
В это понятие входит все, что касается работы устройства в системе, рабочие функции, удобство в эксплуатации, возможности интеграции, наличие интерфейсов и входов и выходов, те или иные особенности настроек и т.п.
Плотность записи, стоимость 1 минуты записи и массогабаритные параметры носителя (для видеолент)
Это немаловажные параметры для формата видеозаписи. Они учитывают три фактора: размер и масса видеокассеты, длительности записи, удельную стоимость одной минуты записи. Чем больше вместимость кассеты, и/или меньше ее размер, и/или ниже удельная стоимость - тем выше оценка.
Затраты на приобретение и эксплуатацию техники
Данный параметр учитывает стоимость оборудования, технического обслуживания и запасных частей. Высокая оценка соответствует меньшим суммарным затратам на владение и обслуживания техники того или иного формата.
В каждом новом формате видеозаписи разработчики стремятся улучшить эти показатели, но улучшение одного показателя довольно часто происходит за счет ухудшения других. Однако следует признать, что суммарный уровень показателей всех категорий от формата к формату растет.
Количество кадров в секунду
Количество (частота) кадров в секунду - это число неподвижных изображений, сменяющих друг друга при показе 1 секунды видеоматериала и создающих эффект движения объектов на экране. Чем больше частота кадров в секунду, тем более плавным и естественным будет казаться движение. Минимальный показатель, при котором движение будет восприниматься однородным - примерно 10 кадров в секунду (это значение индивидуально для каждого человека). В традиционном плёночном кинематографе используется частота 24 кадра в секунду. Системы телевидения PAL и SЙCAM используют 25 кадров в секунду (англ. 25 fps или 25 Герц), а система NTSC использует 29,97 кадров в секунду. Компьютерные оцифрованные видеоматериалы хорошего качества, как правило, используют частоту 30 кадров в секунду. Верхняя пороговая частота мелькания, воспринимаемая человеческим мозгом, в среднем составляет 39 - 42 Герца и индивидуальна для каждого человека. Некоторые современные профессиональные камеры могут снимать с частотой до 120 кадров в секунду. А специальные камеры для сверхбыстрой съёмки снимают с частотой до 1000 кадров в секунду, что необходимо, например, для детального изучения траектории полёта пули или структуры взрыва.
Чересстрочная развёртка
Развёртка видеоматериала может быть прогрессивной или чересстрочной. При прогрессивной развёртке все горизонтальные линии (строки) изображения отображаются одновременно. А вот при чересстрочной развёртке показываются попеременно чётные и нечётные строки (называемые также полями кадра). Чересстрочную развёртку часто называют на английский манер интерлейс (англ. interlace) или интерлейсинг. Чересстрочная развёртка была изобретена для показа изображения на кинескопах с электронно-лучевой трубкой и используется сейчас для передачи видео по «узким» каналам, не позволяющим передавать изображение во всём качестве. Системы PAL, SECAM и NTSC - это всё системы с чересстрочной развёрткой. Новые цифровые стандарты телевидения, например, HDTV предусматривают прогрессивную развёртку. Хотя появились технологии, позволяющие имитировать прогрессивную развёртку при показе материала с интерлейсом. Чересстрочную развёртку обычно обозначают символом «i» после указания вертикального разрешения, например 720Ч576iЧ50 для видео в формате PAL.
Разрешение
По аналогии с разрешением компьютерных мониторов, любой видеосигнал также имеет разрешение (англ. resolution), горизонтальное и вертикальное, измеряемое в пикселях. Обычное аналоговое телевизионное разрешение составляет 720Ч576 пикселей для стандартов PAL и SECAM, при частоте кадров 50 Герц (одно поле, 2Ч25); и 640Ч480 пикселей для NTSC, при частоте 60 Герц (одно поле, 2Ч29,97). В выражении 640Ч480 первым числом обозначается количество точек в горизонтальной линии (горизонтальное разрешение), а вторым числом количество самих линий (вертикальное разрешение). Новый стандарт высокочеткого (англ. high-definition) цифрового телевидения HDTV предполагает разрешения до 1920Ч1080 при частоте мелькания 60 Герц с прогрессивной развёрткой. То есть 1920 пикселей на линию, 1080 линий.
Разрешение в случае трёхмерного видео измеряется в вокселях - элементах изображения, представляющих точки (кубики) в трёхмерном пространстве. Например, для простого трёхмерного видео сейчас используется в основном разрешение 512Ч512Ч512.
Соотношение сторон экрана
Соотношение ширины и высоты кадра (англ. aspect ratio) - важнейший параметр в любом видеоматериале. Ещё с 1910 года кинофильмы имели соотношение сторон экрана 4:3 (4 единицы в ширину к 3 единицам в высоту; иногда ещё записывается как 1,33:1 или просто 1,33). Считалось, что зрителю удобнее смотреть фильм на экране такой формы. Когда появилось телевидение, то оно переняло это соотношение и почти все аналоговые телесистемы (и, следовательно, телевизоры) имели соотношение сторон экрана 4:3. Компьютерные мониторы также унаследовали телевизионный стандарт сторон. Хотя ещё в 1950-х годах это представление о 4:3 в корне изменилось. Дело в том, что поле зрения человека имеет соотношение отнюдь не 4:3. Ведь у человека 2 глаза, расположенных на одной горизонтальной линии - следовательно, поле зрения человека приближается к соотношению 2:1. Чтобы приблизить форму кадра к естественному полю зрения человека (и, следовательно, усилить восприятие фильма), был введён стандарт 16:9 (1,78), почти соответствующий так называемому «Золотому сечению». Цифровое телевидение в основном тоже ориентируется на соотношение 16:9. К концу XX века, после ряда дополнительных исследований в этой области, стали появляться даже и более радикальные соотношения сторон кадра: 1,85, 2,20 и вплоть до 2,35 (почти 21:9). Всё это, безусловно, призвано глубже погрузить зрителя в атмосферу просматриваемого видеоматериала.
Количество цветов и цветовое разрешение
Количество цветов и цветовое разрешение видеосигнала описывается цветовыми моделями. Для стандарта PAL применяется цветовая модель YUV, для SECAM модель YDbDr, для NTSC модель YIQ, в компьютерной технике применяется в основном RGB (и αRGB), реже HSV, а в печатной технике CMYK. Количество цветов, которое может отобразить монитор или проектор зависит от качества монитора или проектора. Человеческий глаз может воспринять, по разным подсчётам, от 5 до 10 миллионов оттенков цветов. Количество цветов в видеоматериале определяется числом бит, отведённым для кодирования цвета каждого пикселя (англ. bits per pixel, bpp). 1 бит позволяет закодировать 2 цвета (обычно чёрный и белый), 2 бита - 4 цвета, 3 бита - 8 цветов, …, 8 бит -256 цветов (28 = 256), 16 бит - 65 536 цветов (216), 24 бита - 16 777 216 цветов (224). В компьютерной технике имеется стандарт и 32 бита на пиксель (αRGB), но этот дополнительный α-байт (8 бит) используется для кодирования коэффициента прозрачности пикселя (α), а не для передачи цвета (RGB). При обработке пикселя видеоадаптером, RGB-значение будет изменено в зависимости от значения α-байта и цвета подлежащего пикселя (который станет «виден» через «прозрачный» пиксель), а затем α-байт будет отброшен, и на монитор пойдёт только цветовой сигнал RGB.
Ширина видеопотока (для цифрового видео)
Ширина (иначе говорят скорость) видеопотока или битре́йт (англ. bit rate) - это количество обрабатываемых бит видеоинформации за секунду времени (обозначается «бит/с» - бит в секунду, или чаще «Мбит/с» - мегабит в секунду; в английском обозначении «bit/s» и «Mbit/s» соответственно). Чем выше ширина видеопотока, тем в общем лучше качество видео. Например, для формата VideoCD ширина видеопотока составляет всего примерно 1 Мбит/с, а для DVD составляет около 5 Мбит/с. Конечно, субъективно разницу в качестве нельзя оценить как пятикратную, но объективно это так. Формат же цифрового телевидения HDTV использует ширину видеопотока около 10 Мбит/с. При помощи скорости видеопотока также очень удобно оценивать качество видео при его передаче через Интернет.
Различают два вида управления шириной потока в видеокодеке - постоянный битрейт (англ. constant bit rate, CBR) и переменный битрейт (англ. variable bit rate, VBR). Концепция VBR, ныне очень популярная, призвана максимально сохранить качество видео, уменьшая при этом суммарный объём передаваемого видеопотока. При этом на быстрых сценах движения, ширина видеопотока возрастает, а на медленных сценах, где картинка меняется медленно, ширина потока падает. Это очень удобно для буферизованных видеотрансляций и передачи сохранённого видеоматериала по компьютерным сетям. Но для безбуферных систем реального времени и для прямого эфира (например, для телеконференций) это не подходит - в этих случаях необходимо использовать постоянную скорость видеопотока.
Видеостандарты
Когда говорят о формате файла, подразумевается то, каким образом информация, которая содержится в файле, кодируется в цифровом виде. Для хранения видеоинформации в ПК разработано довольно много форматов, отличающихся способом представления данных, степенью их сжатия и т. п. Чтение и запись аудио- и видеоинформации на компьютере осуществляется с помощью специальных вспомогательных программ - «кодеков» (сокращение от слов «кодирование/декодирование»). Такие программы обычно входят в состав операционной системы либо поставляются с проигрывающими устройствами.
Цифровые
ATSC
ATSC (Advanced Television Systems Committee) - организация, разрабатывающая и утверждающая стандарты для передовых телевизионных систем, в том числе и HDTV. Наиболее широко стандарты ATSC распространены в США и Канаде.
Международная некоммерческая организация Advanced Television Systems Committee (ATSC) была образована в 1982г. с целью разработки новых стандартов телевидения. Именно эта группа специалистов разработала стандарт цифрового вещания ATSC, который теперь является основным на территории США, Канады, Мексики, Аргентины, Тайваня и Южной Кореи.
ATSC-спецификации включают в себя описание HDTV (High Definition TeleVision), SDTV (Standard Definition TeleVision), EDTV (Enhanced Definition TeleVision), многоканальный звук, интерактивное телевидение - в общем все те форматы, в которых возможно цифровое вещание. Набор стандартов ATSC был создан с целью замены NTSC-системы, используемой, главным образом, в Северной Америке. Максимальное качество изображения, которое может предложить ATSC, соответствует разрешению 1920x1080 при формате экрана 16:9 и сжатии с помощью MPEG2. Мало того, качество трансляции приближается к уровню кинотеатрального благодаря тому, что многоканальный 5.1 звук кодируется с помощью формата Dolby Digital AC-3. В целом же спецификация ATSC несёт в себе описание восемнадцати форматов вещания ТВ, причём шесть из этих режимов относятся к HDTV.
DVB
DVB (англ. Digital Video Broadcasting) — семейство европейских стандартов цифрового телевидения.
Принцип действия
Данный стандарт определяет физический уровень и канальный уровень в системе телевещания. Устройства взаимодействуют с физическим уровнем через синхронный параллельный интерфейс (SPI), синхронный последовательный интерфейс (SSI), или асинхронный последовательный интерфейс (ASI). Все данные передаются в транспортном потоке MPEG-2 с некоторыми дополнительными ограничениями (DVB-MPEG).
Способы модуляции в различных версиях DVB:
в DVB-S (SHF) используется QPSK, 8PSK или 16-QAM,
в DVB-S2 используется QPSK, 8PSK, 16APSK или 32APSK,
в DVB-C (VHF/UHF) используется QAM: 16-QAM, 32-QAM, 64-QAM, 128-QAM или 256-QAM,
в DVB-T (VHF/UHF) используется 16-QAM или 64-QAM (или QPSK) совместно с COFDM и иерахической модуляцией.
Способы доставки цифрового сигнала
Существует 4 среды доставки сигнала:
наземное вещание (DVB-T),
вещание для портативных устройств (DVB-H),
спутниковое вещание (DVB-S),
кабельное вещание (DVB-C).
Из-за разницы в частотных каналах и способах модуляции декодеры для различных сред оказываются несовместимыми.
Распространённость в России
Различные спутниковые DVB-передачи принимаются в России давно. DVB-C встречается лишь в крупнейших городах. Внедрение остальных форм DVB-вещания обсуждается.
ISDB
ISDB (Integrated Services Digital Broadcasting) - стандарт цифрового телевидения, разработанный в Японии. Он интегрирует в себя различные виды цифрового контента. Это может быть HDTV, SDTV, звук, графика, текст и т.д.
Японская организация по стандартизации и распределению радиочастот Association of Radio Industries and Businesses (ARIB) разработала стандарты для передачи цифрового телевидения и радио под единым названием Integrated Services Digital Broadcasting (ISDB).
Основных ISDB-стандартов в настоящее время четыре:
наземное (ISDB-T);
спутниковое (ISDB-S);
кабельное (ISDB-C);
мобильное (нет аббревиатуры).
Также как и в спецификациях ATSC и DVB, для сжатия видеопотока при ISDB-вещании используется система кодирования MPEG-2.
Помимо прочего в стандарте ISDB определена поддержка функции защиты цифрового контента - RMP (Rights management & protection). Дело в том, что любой цифровой контент можно легко записать с использованием DVD или HD-рекордера, а далее - использовать при тиражировании пиратских дисков. Голливуд настоял на внесение поправок в цифровой формат вещания ISDB, что и стало причиной появления системы RMP. Любой цифровой контент при использовании данной системы имеет три возможных маркировки – "copy once", "copy free" и "copy never". Пояснить работу системы просто. Если программа идёт в режиме "copy once", то она может быть единожды сохранена на жестком диске рекордера, однако её не возможно будет записать на какой-либо ещё носитель и т.д.
В ISDB используется транспортный поток MPEG-2 для передачи сжатых видео и звука, а также дополнительных данных. Для интерактивных приложений применяется BML (Broadcast Mark-up Language - язык разметки вещания). Определены несколько стандартных разрешений телевизионной трансляции.
В ISDB-T поддерживаются электронные программы передач EPG (Electronic Program Guides) вместе с передачей данных при обратном канале обычного доступа в Интернет (включая доступ через мобильный телефон, проводную локальную сеть 10/100Base-T, модем телефонной линии фиксированной связи, беспроводную локальную сеть IEEE 802.11).
Еще одна особенность ISDB - обязательное шифрование информации, даже при передаче бесплатных общенациональных телепрограмм. Для этого нужны карточки доступа абонента B-CAS одноименной японской компании, предоставляемые с каждым проданным аппаратом. Более того, тщательно проработаны вопросы защиты контента и управления правом доступа RMP (Rights management and protection).
Не меньшее внимание уделяется уверенному приему на внутренние антенны, защите от внешних импульсных помех и передаче на движущиеся приемники. Например, ISDB-T позволяет принимать сигнал HDTV в автомобиле на скорости 100 км/час, тогда как DVB-T допускает «автомобильный» прием только программ SDTV, а формат ATSC вообще не предназначен для приема на подвижную антенну.
Обычно ISDB принято считать чисто японским стандартом, действующим в этой стране с конца 2003 года. Но нужно отметить интересную особенность - во всех спецификациях ISDB в качестве языковых параметров официально утвержден китайский язык, в дополнение ко всем мыслимым алфавитам японского языка. Давно идут разговоры о принятии ISDB-T в Бразилии.
Стандарты цифрового вещания
Аналоговые
Системы телевидения стран мира:
██ SЙCAM
██ PAL, или PAL/SЙCAM (переходят с SЙCAM на PAL)
██ NTSC
██ нет данных
MAC
Multiplexed Analogue Components (MAC) - система уплотнения аналоговых компонент (название стандарта спутникового цветного телевидения).
Разработка и внедрение стандарта МАС явилось частью глобального европейского проекта EUREKA-95, который ставил своей целью формирование концепции единого стандарта для телевидения высокой четкости (ТВВЧ) и разработку полного комплекта оборудования для производства, обработки, передачи, приема и воспроизведения видеопрограмм как для профессиональных, так и для бытовых целей. Было предложено несколько модификаций этого стандарта, включая версии для телевидения повышенного качества (ТВПК) и ТВВЧ.
PAL
PAL (от англ. phase-alternating line) - система аналогового цветного телевидения, рапространённая в мире на ряду с SECAM и NTSC. Разработана инженером немецкой компании Telefunken Вальтером Брухом и представленная как стандарт телевизионного вещания в 1967 году.
PAL (Phase Alternation Line - построчное изменение фазы). Система предусматривает одновременную передачу сигналов яркости и цветности с использованием квадратурной модуляции цветовой поднесущей. Ее основное отличие от системы NTSC - изменение от строки к строке на 180 градусов фазы цветоразностных сигналов. Эта система обладает следующими достоинствами:
Отсутствие помехи от поднесущей на черно-белых участках изображения.
Отсутствие фазовых искажений, нарушающих цветовой тон.
Уменьшены перекрестные искажения между сигналами яркости и цветности.
Вследствие разделения сигналов цветности достигается удвоение амплитуды каждого из них, что повышает отношение сигнал/шум.
Недостатком системы является снижение цветовой четкости изображения из-за усреднения сигнала цветности в двух соседних строках.
NTSC
NTSC (от англ. National Television Standards Committee - Национальный комитет по телевизионным стандартам) - система аналогового цветного телевидения, разработанная в США (30 кадров/сек. 525 линий в кадре). 18 декабря 1953 года впервые в мире было начато цветное телевизионное вещание с применением именно этой системы.
NTSC принята в качестве стандартной системы цветного телевидения также в Канаде, Японии и ряде стран американского континента.
Передача цветоразностных сигналов в системе NTSC осуществляется в спектре яркостного сигнала на одной поднесущей. Два цветоразностных сигнала ER-Y и EB-Y передаются с помощью квадратурной модуляции.
Стандарт NTSC несовместим с большинством компьютерных видео стандартов, которые используют видео сигнал RGB (красный, зеленый, голубой). Можно, однако, установить в компьютер специальный видео адаптер, который преобразует сигнал NTSC в видеосигнал компьютера и наоборот.
SECAM
SECAM (Sequential Couleur avec Memoire, Sequential Color Memory) - система последовательной передачи цветов с памятью (разработана в СССР).
С 1 октября 1967 г. в СССР начались регулярные передачи цветного телевидения в стандарте SECAM. Со временем систему приняли 25 стран, включая страны Восточной Европы (бывший социалистический лагерь, кроме Югославии), франкоговорящие страны Африки и Азии, часть Греции и Иран.
К достоинствам SECAM следует отнести большую помехоустойчивость системы, что было особенно актуально при передаче видеосигнала на огромных просторах Советского Союза. Сигналы цветности передавались в разные строки, поэтому перекрестные искажения между ними были исключены. В телевизоре информация о каждой строке запоминалась до прихода следующей строки. Телевизионный приемник в данной системе более сложен, следовательно, дороже в изготовлении, чем приемник системы NTSC. Цветная информация, записанная в SECAM, может потерять цвет в системе PAL. Однако запись PAL не теряет цвет в системе SECAM.
К недостаткам системы следует отнести то, что цветовая четкость в ней снижена вдвое, так как сигналы цветности передаются через строку, а в телевизионном приемнике недостающий сигнал берется из предыдущей строки.
Технические характеристики SECAM:
Разрешение 625 строк;
Количество кадров в секунду – 25;
Количество полей – 50;
Развертка луча чересстрочная (интерлейсинг).
MUSE
MUSE (Multiple Sub-Nyquist Sampling Encoding - кодирование с многократной субдискретизацией) - японская система, предназначенная для передачи сигналов ТВЧ по спутниковому каналу с полосой 27 (24) МГц, одна из систем с временным разделением, наиболее известна и одно время даже претендовавшая на роль мирового стандарта. Передача сигналов изображения в спутниковом канале осуществляется с помощью ЧМ сигнала звукового сопровождения - методом четырехпозиционной ФМ.
Основные характеристики сигнала MUSE:
Развертка - чересстрочная с перемежением 2:1;
Число строк исходного изображения – 1125;
Частота полей - 60 Гц;
Формат изображения - 16:9;
Разрешающая способность, пиксель
в канале яркости – 1496;
в канале цветности – 374;
Частота дискретизации - 48,6 МГц;
Полоса частот видеосигнала по уровню -3 дБ, 8,1 МГц;
Метод модуляции несущей – ЧМ;
Девиация частоты - 10,2 МГц;
Полоса частот радиоканала - 24 МГц;
Отношение несущая - шум на приеме - 17 дБ;
Число звуковых каналов - 2/4.
Япония достаточно далеко продвинулась в деле внедрения ТВЧ. Разработано необходимое студийное оборудование, поступили в продажу ТВ приемники, ведутся регулярные передачи в стандарте MUSE через вещательный спутник BS-3.
Форматы записи
Форматы аналоговой записи
Первая видеозаписывающая аппаратура была аналоговых форматов. Первым форматом был формат Q (начальная буква слова Quadruplex (четырехкратная)), в котором использовалась поперечно-строчная запись 4-мя вращающимися магнитными головками. Запись производилась на магнитную ленту шириной 2 дюйма (50.8 мм). В рабочем слое магнитной ленты использовался магнитный порошок из оксида железа. Скорость лента-головка составляла 41.27 м/с, продольная скорость движения ленты - 39.7 см/с.
Следующий формат видеозаписи B уже использовал наклонно-строчную запись. Он был разработан фирмой Bosch. Как и предыдущий Q он относится к типу "сегментных", т.е. таких, в которых за каждый проход видеоголовки по ленте передается только часть поля телевизионного изображения. Запись производилась на магнитную ленту шириной 1 дюйм (25.4 мм). В рабочем слое магнитной ленты использовался магнитный порошок из кобальтированного оксида железа или диоксида хрома. Скорость лента-головка составляла 24.0 м/с, продольная скорость движения ленты 24.3 см/с. Именно с формата B начался выпуск видеокассетной аппаратуры. Видеомагнитофоны формата B выпускались двух типов - катушечные и кассетные.
Следующий формат С, в отличие от предыдущих, несегментный. Важным преимуществом этого формата является легкость выполнения таких операций как стоп-кадр, замедленное и ускоренное изображение. Дорожки образовывают с осью ленты угол в 2,56 градусов. Ширина ленты составляет 1 дюйм (25,4 мм), продольная скорость движения ленты - 23,98 см/с, скорость лента-головка - 21, 39 м/с. В формате С используется система слежения за дорожкой записи.
Все эти три первых формата записывали композитные (полные цветовые) сигналы.
VHS
VHS (англ. Video Home System) - самый распространённый формат записи видеокассет. Разработан японской компанией JVC (Victor Company of Japan, Ltd.), представлен в 1976 году.
С разработки VHS началась эра домашнего видео. На 2002 год, по оценкам JVC, в мире было продано свыше 900 млн видеоустройств этого формата и ещё больше видеокассет.
Одной из первых причин, затруднивших распространение U-matic формата, был формат VHS (Video Home System), разработанный фирмой JVC в 1976 году. А в 1984 году этот формат был утвержден в качестве стандарта бытовой видеозаписи. Для VHS характерна полудюймовая (12,65 мм) лента, запись на которую производится с помощью двух вращающихся видеоголовок, расположенных на барабане под углом 180 градусов. Каждый кадр телевизионного изображения записывается за один оборот барабана с видеоголовками на 2-х соседних дорожках видеозаписи. Угол наклона дорожек - 5,96 градусов, ширина дорожек видеозаписи - 58 мкм. Вдоль ленты располагаются две звуковые дорожки и одна управляющая. Разрешение по горизонтали составляет 240 твл.
Видеомагнитофоны VHS имеют одну особенность: модели, оборудованные дополнительно к двум основным одной или двумя видеоголовками, могут обеспечивать три режима работы: SP (стандартная), LP (повышенная), EP (высокая продолжительность), которые характеризуются разными скоростями движения ленты при записи/воспроизведении, соответственно, SP: для PAL - 23,39 мм/с, для NTSC - 33,5 мм/с; LP: для PAL - 11,7 мм/с, для NTSC - 16,67 мм/с; EP: для NTSC - 11,12 мм/с. В рабочем слое магнитной ленты используется кобальтированный оксид железа или диоксид хрома.
Betacam SP
Качество конечного
материала
полностью
зависит от
уровня используемого
оборудования,
от того качества
изображения,
которое можно
получить, применяя
видеооборудование
того или иного
формата. Лучшими
параметрами
обладает аппаратура
аналоговых
форматов Betacam
(Betacam, Betacam SP, Betacam SP 2000PRO, Betacam SP 1000PRO).
Формат
Betacam основан на
бытовом формате
Betamax. Запись в формате
Betacam производится
наклонно-строчным
способом на
полудюймовые
ленты, в рабочем
слое магнитной
ленты используется
кобальтированный
оксид железа.
Скорость движения
ленты - 101,5мм/с.
Запись сигнала
компонентная:
сигналы яркости
(Y) и цветности
(Сr, Сb) записываются
на отдельные
видеодорожки
разными видеоголовками.
В верхней части
видеоленты
расположены
две продольные
для записи
звуковых сигналов,
а в нижней части
ленты размещаются
дорожки управления
и дорожки
адресно-временного
кода. Особенностью
Betacam является
сочетание
высокого качества
передачи изображения,
технико-экономических
показателей
и эксплуатационной
гибкости.
Возможность
совместной
работы с оборудованием
других форматов
видеозаписи,
высокая степень
автоматизации
существенно
облегчают
работу по
обслуживанию
и регулированию
оборудования.
Дальнейшим
развитием этого
формата, благодаря
новым схемотехническим
решениям и
высококачественной
элементной
базе, является
Betacam SP. Здесь используется
металлопорошковая
лента, более
расширенный
частотный
диапазон яркостного
сигнала, полученный
за счет сдвига
в высокочастотную
область спектра
цветоразностных
сигналов.
Оборудование
форматов Betacam и
Betacam SP совместимы.
Аппараты Betacam SP
воспроизводят
записи Betacam. Наличие
компонентных
входов-выходов
упрощает сопряжение
аппаратуры
Betacam SP с компонентным
цифровым
оборудованием
и цифровыми
системами
видеоэффектов.
Video-8
Формат Video-8 был разработан фирмой Sony в 1984 году, а на его основе портативные видеомагнитофоны и автономные моноблочные камеры - Handycam. И благодаря главным образом малым размерам и массе аппаратуры при достаточно хорошем качестве изображения и звука и удобству ее эксплуатации этот формат получил широкое распространение и дальнейшую заинтересованность фирм в его развитии. Этот формат ориентирован только на бытовую технику, т.к. его разрешающая способность по горизонтали составляет 250 твл. Для записи используются 8 мм металлопорошковая лента и лента с напылением металла.
В 1989 году представители ряда фирм-изготовителей аппаратуры 8мм формата совместно разработали и утвердили перечень технических и эксплуатационных условий для широкополосного формата видеозаписи Hi8. Этот формат предназначен для бытовой и полупрофессиональной аппаратуры с записью на 8мм металлопорошковую ленту, с улучшенными техническими характеристиками, с разрешающей способностью по горизонтали до 400 твл, при хорошем отношении сигнал/шум в канале яркости (девиация составляет 2 МГц). Звуковой канал отвечает требованиям Hi-Fi. За счет возможности работы с раздельными сигналами повышена совместимость с другими форматами.
MII
В конце 1990 года компания Matsushita Electronic Industrial (торговая марка "Panasoniс") выпустила на рынок семейство новых моделей профессиональных видеомагнитофонов, объединенных названием MII Pro. Это событие открыло новую страницу в развитии и широком распространении аналоговой компонентной видеозаписи во всех сферах человеческой деятельности. Разработанный еще в 1986 году формат MII предназначен для профессиональной видеожурналистики и студийного производства. Для записи компонентного сигнала используется S-VHS-кассета с высококачественной полудюймовой металлопорошковой лентой. В формате MII сигнал яркости поочередно записывается на одной дорожке, а на другой два скомпрессированных по времени цветоразностных сигнала. Скорость лента-головка составляет 5.9 м/с.
U-matic
В 1971 году фирма Sony предложила 3/4-дюймовый (19.01 мм) формат U-matic. Благодаря этому впервые удалось создать репортажный видеокомплект. Известны 3 версии формата - U-matic-L (узкий диапазон), U-matic -H (широкий диапазон), U-matic -SP (самый широкий диапазон). В этом формате записывается композитный видеосигнал; сигнал цветности переносится ниже сигнала яркости по шкале частот. Изображение записывается 2-мя вращающимися головками: на одной магнитной дорожке записывается одно поле. В верхней части ленты расположена продольная дорожка для записи управляющего сигнала, а в нижней - 2 дорожки для записи звукового сигнала и дорожка временного кода, которую перекрывают дорожки с изображением. Ширина видеоленты составляет 19,01 мм, ширина наклонных дорожек 85 мкм, угол наклона 4,97 градусов. В рабочем слое магнитной ленты используется кобальтированный оксид железа. Видеооборудование этого формата выпускался долгое время.
Betamax
Betamax - формат полудюймовых видеокассет (12,7 мм) для профессионального использования, разработанный корпорацией «Sony» в 1975 году на основе прежнего профессионального формата U-matic (19,1 мм).
Видеомагнитофон формата «Betamax» был разработан «Sony» для записи и воспроизведения кассет с 12,7-миллиметровой металлопорошковой лентой максимальной толщины 25 мкм, и обеспечивал разрешающую способность по горизонтали 500 строк. Кассета формата «Betamax» имела примерно на 20 % меньшие размеры по сравнению с кассетой формата VHS: 156Ч96Ч25 мм. Формат «Betamax» являлся широкополосным. В магнитофоне применялись ферритовые головки с сендастовым напылением. Формат обеспечивал три режима записи и воспроизведения: Beta, Beta II и Beta III (нормальная, замедленная в два и в четыре раза скорость; аналогично SP, LP и EP в формате VHS).
Видеомагнитофон формата «Betamax» зачастую оснащён такими же выходами и входами, как и видеомагнитофоны формата S-VHS: с разделением сигналов яркости и цветности. Видеомагнитофоны «Betamax» используют наклонно-строчную запись, которую обеспечивают две вращающиеся видеоголовки. Максимальная продолжительность воспроизведения колеблется от 30 до 220 минут и зависит от длины ленты в кассете. Отсутствие защитных промежутков между дорожками требует высокой равномерности хода ленты. Лентопротяжный механизм (ЛПМ) включает в себя специальные стабилизаторы, гасящие ударные искажения, возникающие при соприкосновении ленты с головкой.
2" Quadruplex
Ширина ленты видна из названия; скорость движения - 15 дюймов в секунду; запись - сегментированная; сигнал - полный.
Quadruplex означает счетверенный. Это говорит о наличии четырех головок (heads) на вращающемся блоке, расположенных со сдвигом в 90 градусов. Плоскость вращения блока головок расположена перпендикулярно движению магнитной ленты, которая в месте контакта изгибается, охватывая блок. Такая конструктивная особенность приводит к быстрому износу ленты. Дорожки (tracks) расположены почти перпендикулярно направлению движения ленты. За время одного прохода головки записывается 19,5 строк развертки, а полное телевизионное поле записывается за четыре оборота барабана. Поэтому формат называют сегментированным, то есть видеосигнал записывается сегментами. Это свойство формата не позволяет реализовать режимы стоп-кадра (still frame) и замедленного/убыстренного воспроизведения (slow motion) без применения внешних электронных устройств, так как за один оборот блока головок (head assembly) нельзя считать телевизионное поле.
1" Type C
Наиболее распространенный "добетакамовский" формат. Сам же формат является результатом компромисса между Sony и Ampex, разработавшими свои форматы. Скорость движения ленты - 9,606 дюйм/с (244 мм/с); ширина ленты - 1 дюйм; запись - несегментированная, наклонно-строчная; сигнал - полный.
Для этого формата характерен практически полный охват лентой блока видеоголовок. Две универсальные головки записывают полное телевизионное поле. Причем основная головка записывает собственно телевизионные линии, а другая - сигналы кадровой синхронизации и сопутствующие им импульсы, в том числе вертикальный код. Соответственно имеется и две стирающие головки. И те и другие расположены на блоке головок несимметрично. Для обеспечения работы в режимах стол-кадр и замедленное ускоренное воспроизведение применяются дополнительные головки AST (automatic scan tracking - автоматический поиск дорожки), позволяющие считывать одновременно два соседних поля. Формат С, как и В, имеет три звуковые дорожки (по третьей записывается адресно-временной код) и дорожку управляющего сигнала, которая расположена вдоль ленты между основной частью видеодорожки и, как бы отсеченным от нее, участком с синхросигналами.
Формат С был первым несегментированным форматом записи. В частности поэтому, точность монтажа была улучшена до одного кадра. Кроме того, часто видеомагнитофоны этого формата комплектовались не обычными ЦКВИ (ТВС), а специальными видеопроцессорами (например, Zeus фирмы Ampex), позволяющими запоминать целый телевизионный кадр и имеющими отдельный видеовыход. Такое решение позволяет делать микширование или другие спецэффекты при наличии всего двух магнитофонов. Однако, план, с которого происходит переход на другой, в момент перехода будет стоп-кадром, так как сигнал для такого перехода берется с выхода кадровой памяти ЦКВИ.
S-VHS
Появление новых форматов записи всегда имеет целью устранение каких-либо недостатков предыдущих, так, дальнейшим развитием формата VHS явился формат S-VHS, который позволяет получить цветное изображение более высокого качества. Скорость лента-головка - 4.85 м/с, ширина наклонных дорожек - 49 мкм, угол наклона дорожек - 5.96 градусов. Скорость движения ленты - 23.39 мм/с. Каждый кадр записывается на 2 дорожки. По сравнению с VHS этот формат обладает большим значением отношения сигнал/шум (45дБ), улучшенной контрастностью изображения и меньшими перекрестными искажениями. Благодаря существенному расширению полосы частот сигнала яркости, удалось увеличить разрешающую способность по горизонтали на 160 твл. В рабочем слое магнитной ленты используется кобальтированный оксид железа или диоксид хрома.
Аппаратура формата S-VHS хорошо стыкуется с оборудованием других форматов, поэтому, например, в монтажных системах можно использовать в качестве мастера аппарат другого формата. К достоинствам также можно отнести весьма высокую разрешающую способность, возможность разделения сигналов, сравнительно низкую стоимость аппаратуры.
VHS-C
Формат VHS-C был одним из наиболее распространенных среди любительских камер.
Основными производителями, поддерживающими формат VHS-C являются Panasonic и JVC.
Главным преимуществом формата VHS-C является возможность проигрывания записанных кассет на видеомагнитофоне стандарта VHS с использованием специального адаптера (который обычно имеется в комплекте с видеокамерой).
Основным недостатком в сравнении с Video8 является меньшее время записи на кассету. Основная масса кассет VHS-С имеет продолжительность записи в 30 и 45 минут на стандартной скорости против 90 и 120 минут на кассетах Video8.
Hi8
Формат разработанный фирмой Sony является усовершенствованием формата Video 8. За счет применения более совершенных технологий обработки сигналов изображения, и использования новых, с улучшенными характеристиками, лент, в камерах этого формата удалось преодолеть основной недостаток формата Video 8 - плохую четкость изображения, при сохранении всех его достоинств. Видеокамеры Hi8 обеспечивают четкость изображения на уровне 424 линий по горизонтали. В 1998 году Sony выпустила усовершенствованные видеокамеры Hi8 XR, теоретически обеспечивающие разрешение до 440 линий, с меньшим уровнем помех цветности и яркости. Звук Hi-Fi в камерах Hi 8 чаще стерео.
Форматы цифровой записи
Оборудование цифровых форматов видеозаписи позволяет получать материалы высокого качества и обладает стабильностью функционирования, большой надежностью и эффективностью. Еще одно немаловажное преимущество цифровой видеозаписи - это возможность многократной перезаписи без потери качества изображения.
Video CD
Стандарт записи видео в формате MPEG-1 на обычный Compact Disk (диаметр 120 мм, толщина 1.2 мм, одна информационная сторона).
Один диск обычно позволяет хранить до 74 минут видео, качество соизмеримо с VHS стандартом. Для воспроизведения достаточно односкоростного CD-ROM.
DVD
Формат DVD-диска принят 8 декабря 1995 года. Первоначально аббревиатура DVD расшифровывалась, как Digital Video Disc (цифровой видеодиск), несколько позже появилась расшифровка аббревиатуры DVD, как Digital Versatile Disc (универсальный цифровой диск).
Особенности dvd-видео
- Около 2 часов высококачественного цифрового видео (более 8 на двухстороннем, двухслойном диске).
- Поддержка для широкоэкранных фильмов и телефильмов на стандартных или широкоэкранных телевизорах (4:3 и 16:9 коэффициенты сжатия).
- До 8 звуковых дорожек на разных языках, до 8 каналов каждая.
- До 32 дорожек субтитров/караоке.
- "Бесшовное видео"
- До 9 углов камеры (различные точки зрения могут быть выбраны в течение воспроизведения).
- Меню и простые интерактивные возможности (для игр, quizzes, и т.д.).
- Многоязычный текст идентификации для имени заголовка, имени альбома, имени песни, и т.д.
- "Мгновенная" перемотка и быстрая перемотка вперед, включая поиск по заголовку, главе, дорожке, и коду времени.
- Долговечность (никакого износа от использования, только от физического повреждения).
- Не восприимчив к магнитным полям. Устойчив к нагреву.
- Небольшой размер.
- Noncomedogenic.
Качество dvd-видео
Качество DVD значительно лучше видеозаписи и даже лучше, чем laserdisc. Однако качество зависит от многих промышленных факторов. Так как большие количества видео уже были закодированы для Видео CD, с использованием MPEG-1, некоторые низкобюджетные DVD использует этот формат (который - не лучше, чем VHS), вместо более высококачественного MPEG-2.
DVD-Video упаковывается с цифровой мастер-ленты на студии в формат MPEG-2. Это сжатие с потерями удаляет избыточную информацию (например, области изображения, которые не изменяются) так, что это трудно заметно для человеческого глаза. Возникающее в результате видео, особенно, когда оно сложно или быстро изменяется, может содержать "артефакты" (местные искажения) типа blockiness, fuzziness, и видеошума, в зависимости от качества обработки и степени сжатия. При средней пропускной способности 3.5 Mbps, искажения сжатия могут быть иногда заметны. Более высокие пропускные способности данных могут почти исключить появление искажений, при первоначальной пропускной способности мастер-ленты в 6 Mbps. Так как MPEG технология сжатия улучшается, более высокое качество достигается при более низких пропускных способностях.
Термин "артефакт" относится к тому, что первоначально не было представлено в изображении. Артефакты иногда вызываются недостаточным кодированием MPEG, но чаще артефакты вызываются плохо настроенными телеприемниками, плохими кабелями, электрическими помехами, недостаточной передачей film-to-video, зерном пленки, неисправностью воспроизводящего устройства, ошибками чтения диска, и т.д.
DivX
Формат Divx (Digital video express) был разработан компанией Circuit City как альтернатива DVD. В результате получилась своеобразная система, в чем-то напоминающая прокат. В основе концепции лежала идея о том, что кодированный видеоформат может предотвратить нелегальное копирование оригинала. Покупая фильм в формате DivX за 4,5 долл., можно было смотреть его в течение двух суток, продлить лицензию для повторного просмотра за 2,5 долл. или приобрести годичную лицензию дополнительно за 15-25 долл.
Идея проката фильмов на дисках в формате DivX была поддержана некоторыми большими голливудскими компаниями. В список компаний, входят такие, как Disney, Dreamworks SKG, Paramount и Universal. Для просмотра фильмов в формате DivX был нужен специальный проигрыватель, который также может воспроизводить и обычные DVD-диски. В проигрывателе DivX также присутствовал модем, играющий важную роль во всей этой системе. С его помощью происходило соединение со специальной системой для составления счетов, а также обновления информации в модуле памяти проигрывателя. После оплаты дальнейшего использования диска, сигнал об этом поступал с сервера на проигрыватель и диск можно было просматривать после двухдневного срока. Необходимо было хотя бы раз в месяц делать запрос на сервер, в противном случае система блокировалась.
Система не прижилась, фирма-разработчик понесла убытки, а название перекочевало в новую технологию. Позднее форматом DivX стали называть несколько усовершенствованный формат MPEG4 (которым он по существу и является).
DV (miniDV)
DV - это бытовой формат цифровой компонентной видеозаписи с обработкой по стандарту 4:2:0 (PAL) и 4:1:1 (NTSC) на 1/4-дюймовую (6.35 мм) ленту с напылением металла. Этот формат разработан консорциумом DV, объединившим основных производителей бытовой аппаратуры. Каждый кадр располагается на 12-ти наклонных дорожках шириной 10 мкм. На наклонные дорожки записывается видео / аудиоданные, субкод, служебные данные (ITI - Insert and Track Information). Продольных дорожек нет. Применяется алгоритм внутрикадрового сжатия, использующий метод DCT. Коэффициент компрессии - 5:1. Обеспечивается разрешение по горизонтали - 500 твл. В DV предусмотрена специальная схема исправления и маскирования ошибок. Кассеты, записанные в формате DV, могут воспроизводиться на некоторых моделях аппаратов форматов DVCPRO и DVCAM. Для передачи данных в оборудовании этого формата предусмотрен универсальный последовательный интерфейс IEEE-1394, позволяющий переносить цифровые файлы напрямую на жесткий диск компьютера.
SVCD, ASF, RM
Стандарт Super VideoCD (SVCD) установлен Китайским Национальным Комитетом Стандартизации совместно с Philis, Sony, Matsushita и JVC. Он базирован на технологии сжатия MPEG-2 с переменным потоком (VBR). SVCD может обеспечить в два раза более четкое видео, чем предыдущий формат VideoCD, разрешение 480x576 более чем в четыре раза превышает ограничения MPEG-1.
SVCD обратно совместим с VCD 1.1, 2.0 и Interactive VCD 3.0. Более того, тогда как VCD требует встраивания текста в видео, SVCD использует отдельный поток данных для интеграции субтитров (вернее до 4-х таких потоков). Так как это не текст, а графические изображения, в субтитрах могут использоваться символы любых языков и шрифтов, а также графические изображения. При этом субтитры не имеют артефактов сжатия алгоритмом MPEG.
ASF - формат Windows Media. Основан на MPEG-4, оптимизирован для передачи видео с низким и средним битрейтом в интернет. Воспроизводится только на компьютере с Windows Media Player.
RM - RealVideo. Предназначен для низкоскоростной передачи видео в интернет в реальном времени. Небольшое разрешение, низкое качество. Воспроизводится только на компьютере. Требует специального программного декодера.
Digital Betacam
Digital Betacam - этот цифровой формат видеозаписи был разработан фирмой Sony. Для записи используется та же полудюймовая лента, что и в аппаратах Betacam SP. Имеются продольные дорожки управления, режиссерская и временного кода. Все видео- и аудиосигналы записываются сегментным наклонно-строчным способом. Каждое телевизионное поле записывается на 6-ти наклонных дорожках. Соседние дорожки записываются с азимутальным разворотом рабочих зазоров видеоголовок на +/- 15 градусов. Записываемый цифровой поток составляет 125.58 Мбит/с. Digital Betacam обеспечивает запись 10-битного компонентного цифрового сигнала с соотношением частот дискретизации 4:2:2 для сигналов яркости и цветности. Поддерживаются 4 канала звукового сопровождения, частота дискретизации аудиосигнала 48 кГц при 20-битном квантовании. Миникассеты Digital Betacam обеспечивают 40 минут цифровой записи, а большие - более 2-х часов.
В системе Digital Betacam используется очень эффективный способ обработки информации - BRR (уменьшение скорости потока данных). Благодаря этому одно и тоже количество видеоинформации может быть представлено меньшим объемом данных, чем раньше. Способ компрессии сигнала внутриполевой (intraframe) с использованием дискретного косинусного преобразования (DCT), коэффициент компрессии сигнала - 2:1. Имеется мощная система коррекции и маскирования ошибок.
Betacam SX
Betacam SX - видеоформат фирмы Sony, который обеспечивает запись 8-битных компонентных цифровых видеосигналов с соотношением частот дискретизации 4:2:2 для сигналов яркости и цветности. Поддерживает 4 канала цифрового звука (16 бит/48 кГц). Схема сжатия, используемая в Betacam SX, основана на алгоритме 4:2:2 P@ML стандарта MPEG2 с коэффициентом компрессии 10:1. Поток видеоданных составляет 18 Мбит/с. Запись производится на полудюймовую (12.65 мм) металлопорошковую ленту. Максимальное время записи - 184 минуты на кассету типа L и 60 минут на кассету типа S.
Формат Betacam SX обеспечивает вещательное качество изображения от съемки до компоновки программ. Оборудование этого формата позволяет монтировать материал прямо на месте и передавать его с высокой скоростью без потери качества. При переносе видеоматериалов между аппаратами формата Betacam SX используется последовательный цифровой интерфейс SDDI (последовательный цифровой интерфейс передачи данных), обеспечивающий четырехкратную скорость передачи, с аппаратурой цифровых форматов используется интерфейс SDI (последовательный цифровой интерфейс). Оборудование Betacam SX совместимо с аналоговой аппаратурой форматов Betacam, Betacam SP.
HDV
Стандарт HD ( High Definition - Высокое разрешение ) - это новый улучшенный стандарт видео. Существует много форматов, но основных стандартов установлено два: 1080i и 720p . Оба эти стандарта значительно превосходят стандарт SD в цвете и разрешающей способности (резкость изображения и детали). Почти всё HD оборудование изначально рассчитано на 'широкоформатное' изображение 16:9.
Стандарт HD в любом проявлении намного лучше 'традиционных' систем. Появившийся стандарт HDV (High Definition Video - Видео высокого разрешения) - это попытка дать возможность записи видео высокого разрешения, при скорости передачи 25 Мбит/с на существующие устройства MiniDV , используя сжатие MPEG2. Многие производители уже являются приверженцами стандартов HDV . Стоит отметить, что любая домашняя запись, сделанная в HDV, будет превосходить общепринятые на сегодняшний день SD DV записи, обладающие, к сожалению, ограниченными способностями.
ProHD
DVCProHD - формат записи на магнитную ленту фирмы Panasonic, являющийся дальнейшим развитием DVCPro. В связи с необходимостью записи более высокого цифрового потока, скорость ленты увеличена в четыре раза. Как и для всех версий формата DVCpro, компрессия DVCproHD основана на алгоритме DV. Несжатые HD-сигналы распределяются по четырем устройствам сжатия DV, работающим параллельно, которые все вместе сжимают сигнал с коэффициентом 1:6.7. Результирующий поток данных составляет 100 Мбит/с.
D-VHS
Полностью цифровой формат D-VHS (Digital VHS) позволяет вести запись цифрового видео максимально возможного качества (поток видеоданных до 14,1 Мбит/с), длительностью до 8 часов в режиме STD (Standard), или 21 час, на скорости в три раза меньшей (LS3) - с качеством DVD-видео ( 4,7 Мбит/с). Данные записываются в том виде, в котором они поступают на вход видеомагнитофона, без восстановления сжатых данных.
Привлекательность формата заключается в его востребованности, ведь до сих пор не существовало перезаписываемого бытового цифрового видеоносителя достаточной емкости с качеством не только равным, но даже превосходящем DVD.
Для оценки потенциальных возможностей D-VHS достаточно сказать, что если скорость цифрового потока (битрейт) в DVD-формате достигает только 10 мегабит/сек. (обычно она не превышает 4–6 мегабит/сек.), и емкость диска составляет максимум 18 гигабайт (2 стороны/2 слоя), то в D-VHS ее максимальное значение составляет 28,2 мегабит/сек. при емкости кассеты до 44 гигабайт. Формат D-VHS дает возможность записывать даже HDTV-программы (т.е. ТВ повышенной четкости). Понятно, DVD со своим максимально достижимым разрешением в 540 ТВ-линий значительно уступает 1080 линиям в HDTV.
Поэтому если HD-телевидение станет широко распространенным, то запись такой программы на D-VHS-магнитофон обеспечит несравненно лучшее качество, чем DVD-плейер. Более того, такой битрейт и емкость видеокассеты позволяет в LS-режиме хранить до 14 часов видео с качеством, не уступающим обычному DVD, а с качеством, сравнимым с VHS - до 21 часа.
MicroMV
MicroMV - первый, разработанный фирмой Sony, формат записи для любительских видеокамер, использующий стандарт сжатия MPEG2. MPEG является открытым промышленным стандартом видео- и компьютерной индустрии и используется как новый формат, естественный преемник DV, поскольку обеспечивает высокое качество изображения и звука, а также открывает новые возможности дизайна видеокамер, благодаря компактному размеру носителя. Размер новой кассеты составляет 30 процентов от размера кассеты miniDV. Кассета оснащена модулем памяти. Скорость передачи данных нового формата составляет 12 Мбит/с, что в два раза ниже, чем в формате miniDV.
Digital8
С появлением цифровых видеокамер формата miniDV оказалось, что видеолюбители, стремящиеся к повышению качества изображения, должны отказаться от старых, накопленных годами архивов, записанных на кассетах Hi8. Компания Sony пошла навстречу требованиям рынка и выпустила промежуточный вариант цифровой видеозаписи на кассетах формата Hi8 (возможно, хотя и не рекомендуется использовать кассеты Video8). Правда пришлось поступиться временем записи (на кассете Hi8 можно записать видео в стандарте D8 на треть меньше по времени). Оправдывается это значительным улучшением качества изображения (оно приближается к вещательному) и различными преимуществами, такими как цифровые эффекты, цифровой порт по стандарту IEEE 1394 и др. Режим LP в этих камерах не предусмотрен. Естественно, что камера D8 может использоваться для просмотра старых кассет Hi8 и Video8. При этом, стоимость такой камеры несколько дешевле чем камер miniDV.
D1, D2, D3, D5, D6
D1 - цифровой формат, разработанный фирмой Sony. Запись осуществляется на магнитную ленту шириной 19,01 мм в соответствии со стандартом CCIR601 в варианте 4:2:2. Запись видео- и аудиосигналов сегментная, четырехканальная; скорость движения ленты - 286,9 мм/с. Одно телевизионное поле записывается на 12 наклонных дорожках шириной 30 мкм. Кроме наклонных дорожек имеются 3 продольные - монтажная звуковая дорожка, дорожка управления и дорожка временного кода. В центре наклонных дорожек для записи видеоданных размещены 4 сектора с сигналами звука. Запись производится на кассеты трех размеров, которые обеспечивают 11, 34, 76 минут непрерывной записи при толщине ленты 16 мкм. При меньшей толщине ленты длительность записи, соответственно, увеличивается.
Этот формат один из наилучших для студийной работы, так как используется компонентный сигнал, сохраняется полная полоса частот сигналов, которая позволяет делать высококачественные плавные переходы в рир-проекции, обеспечивается высокое качество при копировании и монтаже. Оборудование формата D1 можно подсоединять без дополнительного транскодирования почти ко всем системам цифровых видеоэффектов, кинотелепреобразователям, дисковым запоминающим устройствам и т.п.
Формат D2 был предложен фирмами Ampex и Sony для обработки, записи и воспроизведения композитного сигнала стандартов PAL и NTSC. Запись сигнала производится на 19,01 мм металлопорошковую ленту, упакованную в кассеты трех видов: малые, средние и большие. Способ записи наклонно-строчный сегментированный. Одно телевизионное поле записывается на 8-ми дорожках шириной 35 мкм. Уровневое квантование - 8 бит. Частота дискретизации аудиосигнала - 48 кГц, квантование - 20 бит. Записываемый цифровой поток достигает 154 Мбит/с. Кроме наклонных дорожек имеются 3 продольные - управления, монтажная звуковая, дорожка временного кода. Звуковые сектора располагаются в начале и конце программных строчек. D2 характеризуется более низкой стоимостью оборудования по сравнению с аппаратурой формата D1, способностью воспроизведения изображения в широком интервале скоростей и его просмотре в цвете при 60-кратном превышении номинальной скорости и возможностью многократной перезаписи с минимальными потерями качества.
Формат D3 цифровой видеозаписи на полудюймовую ленту разработан мощной вещательной корпорацией NHK в 1991 году, и его аппаратурная реализация стали значительным достижением фирмы Panasonic. Оборудование D3 работает с композитными 8-битовыми видеосигналами стандартов PAL и NTSC. Видеофонограмма примерно такая же, как и у формата D2, разница только в числовых характеристиках. Так ширина наклонных дорожек составляет 18 мкм, общая длина программной дорожки - 117.71 мм, а видеосектора - 108.9 мм, угол наклона дорожек - 4.9 градуса. Дорожка временного кода примыкает к нижнему краю наклонных дорожек. Длительность записи на одну кассету D3 - от 50 до 245 минут. Характеристики оборудования в целом такие же, как в D2. Благодаря использованию полудюймовой ленты создана полная линейка оборудования формата D3, обеспечивающая студийное и внестудийное производство, репортажные съемки, запись, монтаж и выдачу программ в эфир, все этапы которых выполняются в едином стандарте. При этом расход ленты оказался в два раза меньше, чем у 19 мм композитных форматов. Плотность записи - 13.7 Мбит на квадратный сантиметр. При заметно более низкой стоимости и массе аппаратура формата D3 не уступает по функциональным возможностям, качеству сигнала и защите от ошибок аппаратам форматов D1 и D2. Впервые стал возможен режим предварительного чтения (Pre-read), при котором один и тот же аппарат используется и как источник сигнала, и как мастер, т.е. можно проводить на 2-х аппаратах монтаж, рассчитанный на 3 аппарата.
Оборудование компонентного формата D5 использует те же кассеты, что и D3, но составляющие цветового сигнала снимаются с изображения в соответствии с рекомендациями для 10-битовой записи, изложенными в документе CCIR601, который распространяется на цветоразностные цифровые и RGB-сигналы, определяет уровни и частоты квантования, матрицирование RGB/Y, R-Y, B-Y и характеристики фильтров. Видеофонограмма такая же, как и у D3, только видеодорожки сдвоенные, т.к. сигнал в D5 компонентный. Записываемый цифровой поток составляет 270 Мбит/с. Используется металлопорошковая лента шириной 12.65 мм в такой же кассете, как и у D3. Продолжительность записи в зависимости от величины кассеты составляет - 32, 62, 132 минуты.
Видеомагнитофоны D5 имеют встроенные декодеры и могут воспроизводить запись с ленты формата D3, а также выдавать на линейный выход составляющие цвета. Они обладают возможностью формировать изображение как в формате растра 4:3, так и в широкоэкранном формате 16:9. Поскольку цифровая запись ведется без компрессии сигнала, формат D5 обладает всеми преимуществами D1 и дает абсолютное качество изображения. Такая техника пригодна и для высококачественного компоновочного монтажа, и для более простых операций. В дополнение к требованиям телевизионных систем на 625 и 525 строк данный формат пригоден и для ТВЧ (телевидение высокой четкости) с компрессией сигнала 4:1. Формат D5 обеспечивает "прозрачную запись" (отсутствие искажений от входа до выхода) сигнала в цифровом стандарте 4:2:2 при 8 и 10-битовом квантовании при его многоступенчатой обработке, особенно в отношении активной части изображения, что делает оборудование формата D5 очень привлекательным для потребителя, особенно в профессиональном видеопроизводстве. И не случайно видеомагнитофоны D5 фирмы Panasonic установлены во многих известных телестудиях по всему миру.
Цифровой широкополосный формат D6 разработан фирмами Toshiba и BTS в 1993 году специально для записи цифровых сигналов ТВЧ с соотношением сторон изображения 16:9. Он рассчитан на исключительно высокую пропускную способность до 1,2 Гбит/с. Первый видеомагнитофон формата D6 - DCR 6000 фирма BTS выпустила в 1994 году. Он позволяет записывать цифровые сигналы ТВЧ обоих стандартов 1250/50/2:1 и 1125/60/2:1 на кассету с 19,01мм лентой наклонно-строчным способом в виде блоков цифровых данных. В каждом блоке находятся данные о видеосигнале и звуке, вспомогательной и служебной информации, а также содержится запись параметров и местоположения специальных зазоров, облегчающих монтажные операции. Запись производится на металлопорошковую ленту улучшенного качества толщиной 11мкм. Шаг дорожки записи - 21 мкм, угол наклона дорожек - +/-15 градусов. Продолжительность записи в зависимости от величины кассеты составляет 8, 28, 64 минуты. Отличительной чертой аппаратуры D6 является невероятно эффективная встроенная система коррекции ошибок. При вероятности появления сбоев на ленте (обусловленных системой лента-головка) не более 4х10-4, выходной сигнал с аппаратуры D6 может содержать битовые ошибки, но их вероятность появления не превышает 10-11.
S(X)VCD
Формат SVCD расшифровывается как Super Video CD. На таком компакт-диске можно разместить вдвое больше информации чем на обычном Video CD. До сих пор эти диски наиболее широко распространены в Китае.
Стандарт SVCD был разработан в Китае в конце 1998 года и в настоящее время проходит процедуру регистрации как международный. Проигрыватели и диски SVCD сейчас довольно активно продаются в Китае, Гонк-Конге, Тайване, Малайзии, Сингапуре и Индии. Для воспроизведения таких дисков используются специальные SVCD проигрыватели, поддерживающие также VCD 3.0, VCD 2.0, CD-DA и иногда MP3 форматы. Некоторые проигрыватели DVD также могут воспроизводить SuperVCD, даже если об этом не сказано в инструкции, другие требуют лишь модификации внутренней программы (замены или пере-программирования одной микросхемы - некоторые модели JVC, Philips, Pioneer, Samsung). И конечно такие диски могут воспроизводиться на компьютере с 2х скоростным или более быстрым дисководом CD-ROM и аппаратным или программным (Pentium-II 350 МГц или лучше) декодером MPEG2.
Формат XVCD уступает SVCD по таким показателям, как поток данных и разрешение.
Сравнение форматов записи
Методы сжатия
Цифровые технологии обеспечивают неоспоримые преимущества по сравнению с аналоговыми. Преобразованный в цифровую форму сигнал может сохранять всю информацию, заложенную в аналоговой форме. Современные технологии передачи, записи и хранения цифровых данных практически не подвергают сигнал искажениям.
Одно из неоспоримых преимуществ цифровых технологий - возможность применения к оцифрованному сигналу мощного математического аппарата сжатия видео и аудио информации. В отличие от "аналога", "цифра" в любой момент может быть воспроизведена со 100%-ной повторяемостью. Соответственно, для оцифрованного сигнала открываются удобные возможности последующей обработки, анализа и моделирования.
Основные методы сжатия видео сводятся к компрессии данных внутри отдельного кадра и оптимизации в передаче изменений между кадрами. Даже при рассмотрении статичного изображения видно, что в нем много однотипной и дублирующейся информации. Например, интенсивность фона чаще всего имеет постоянное значение; многие отдельные участки изображения, занимающие значительные размеры кадра, тоже имеют одинаковый уровень цифрового сигнала. Естественно, передавать всю эту информацию без компрессии не имеет смысла. С применением специализированных методов сжатия видео, плавно меняющегося по кадрам, возможно еще больше снизить результирующую плотность передачи информации по сети.
В отличие от универсальных архиваторов (вроде WinRar или WinZip), сжатие видео может происходить с некоторыми потерями, величина которых зависит от выбранного кодека. Современные алгоритмы сжатия прибегают к всестороннему логическому анализу видеоролика с целью извлечь повторяющиеся куски между кадрами и уменьшить размер конечного файла. При воспроизведении сжатая информация «раскрывается», и уже после этого демонстрируется пользователю. Раскрытие изображений, сжатых некоторыми кодеками, может потребовать большого времени от маломощного компьютера.
Технологии сжатия цифрового видео
Существует множество технологий сжатия цифрового видео. Некоторые из рассматриваемых компрессоров используют не одну технологию сжатия, а некоторую их совокупность. Например, и Indeo 3.2, и Cinepak используют векторную квантизацию. Международные стандарты MPEG-1, MPEG-2, MPEG-4, H.261 и H.263 используют комбинированную технологию БДКП и компенсацию движения. Некоторые современные алгоритмы используют технологию ДВП (Discrete Wavelet Transform, или DWT). Другие технологии включают Фрактальное сжатие изображений (Fractal Image Compression).
Сжатие без потерь качества
Сжатие изображений может осуществляться без потерь качества лишь в том случае, если в процессе сжатия не было потерь данных. В результате полученное после декомпрессии изображение будет в точности (побитно) совпадать с оригиналом. Примером такого сжатия может служить формат GIF для статической графики и GIF89a для видео.
Сжатие с потерями качества
Сжатие может происходить с потерями качества, если в процессе сжатия информация была потеряна. Однако с точки зрения человеческого восприятия сжатием с потерями следует считать лишь такое сжатие, при котором возможно на глаз отличить результат сжатия от оригинала. Таким образом, несмотря на то что два изображения - оригинал и результат сжатия с использованием того или иного компрессора - побитно могут не совпадать, тем не менее разница между ними может быть совсем незаметной. Примером может служить алгоритм JPEG для сжатия статической графики и алгоритм M-JPEG для сжатия видео.
Сжатие без потерь с точки зрения восприятия
Формально являясь сжатием с потерями качества, схема сжатия может в то же время казаться сжатием без потерь с точки зрения восприятия ее человеком. Большинство технологий сжатия с формальной потерей качества имеют так называемый Фактор Качества Сжатия (ФКС), характеризующий именно воспринимаемую сторону качества и варьирующийся в пределах от 0 до 100. При факторе качества сжатия равном 100 воспринимаемые характеристики качества сжатого видео неотличимы от оригинала.
Сжатие с естественной потерей качества
JPEG и MPEG и другие технологии сжатия с потерей качества иногда сжимают, без потерь переступая за грань сжатия с точки зрения восприятия видеоинформации. Тем не менее сжатые видео и статические изображения вполне приемлемы для адекватного восприятия их человеком. Иными словами, в данном случае наблюдается так называемая естественная деградация изображения, при которой теряются некоторые мелкие детали сцены. Похожее может происходить и в естественных условиях, например при дожде или тумане. Изображение в таких условиях, как правило, различимо, однако детализация его уменьшается.
Сжатие с неестественными потерями качества
Низкое качество сжатия, в значительной степени искажающее изображение и вносящее в него искусственные (не существующие в оригинале) детали сцены, называется неестественным сжатием с потерей качества. Примером тому может служить некоторая «блочность» в сильно сжатом MPEG-е и в других компрессорах, использующих технологию БДКП. Неестественность заключается в первую очередь в нарушении самых важных с точки зрения восприятия человеком характеристик изображения - контуров. Опыт показывает, что именно контуры позволяют воспринимающему аппарату человека правильно идентифицировать тот или иной визуальный объект.
Все широко используемые видеокомпрессоры используют технологии сжатия с потерями качества. При достаточно высоких коэффициентах сжатия все они будут сжимать с неестественной потерей качества.
Таким образом, выбирая тот или иной компрессор для сжатия цифрового видео, необходимо достичь сжатия, по крайней мере с естественными потерями качества.
Для сжатия видео используют различные кодеки
Технологии и алгоритмы сжатия видео
Run Length Encoding
Компрессорами, использующими технологию RLE, являются:
Microsoft RLE (MRLE) RLE используется также для кодирования коэффициентов в БДКП, применяющемся в MPEG-1234, H.261, H.263 и JPEG.
Достоинства и недостатки
Работает исключительно с 8-битовыми изображениями.
Не подходит для сжатия полноцветного видео.
Обзор
RLE кодирует последовательность повторяющихся элементов изображения или одноцветных элементов одним кодовым словом. Например, последовательность элементов изображения 77 77 77 77 77 77 77 может быть закодирована как 7 77 (для семи 77-рок). RLE хорошо сжимает изображения, в которых наблюдается повторение контуров или цветов отдельных элементов. В полноцветных изображениях повторений цвета значительно меньше, поэтому сжатие полноцветного видео с использованием технологии RLE лишено всякого смысла.
Векторная квантизация (Vector Quantization,VQ)
Компрессорами, использующими технологию VQ, являются Indeo 3.2 и Cinepak. Оба они применяют цветовую схему YUV (а не RGB).
Достоинства и недостатки
Процесс кодирования очень трудоемок и практически неосуществим без специального дополнительного оборудования.
Процесс декодирования очень быстр.
Блоковые искажения при высоких коэффициентах сжатия.
Технологии, использующие алгоритмы БДКП, ДВП могут достигать более высоких уровней сжатия.
Обзор
Основная идея векторной квантизации заключается в разбиении изображения на блоки (размером 4x4 пиксела в цветовой схеме YUV для компрессоров Indeo и Cinepak). Как правило, некоторые блоки оказываются похожими друг на друга. В этом случае компрессор идентифицирует класс похожих блоков и заменяет их одним общим блоком. Кроме того, генерируется двоичная таблица (карта) таких общих блоков из самых коротких кодовых слов. VQ-декодер затем, используя таблицу, собирает изображение поблочно из общих блоков. Ясно, что данный способ кодирования с потерями качества, так как, строго говоря, схожесть блоков весьма относительна. Здесь допускается аппроксимация реальных блоков изображения к общему, их объединяющему. Процесс кодирования длителен и трудоемок, так как кодеру необходимо выявлять принадлежность каждого блока изображения к какому-нибудь общему блоку. Однако задача декодирования в этом случае сводится к задаче построения изображения по заданной карте из общих блоков и не занимает много аппаратных и временных ресурсов. Таблицу или карту также называют еще и кодовой книгой, а двоичные коды, входящие в нее, - кодовыми словами, соответственно. Наибольшее сжатие с использованием алгоритма VQ достигается путем уменьшения числа классов общих блоков, то есть предположением о схожести относительно большего числа блоков изображения, и, как следствие, уменьшением кодовой книги. По мере уменьшения размеров кодовой книги качество воспроизводимого видео ухудшается. В результате на изображении появляется искусственная «блочность».
Простой пример: сравним три следующих блока 4 x 4.
(Блок 1) 128 128 128 128 128 128 128 128 128 128 128 128 128 128 128 128 |
(Блок 2) 128 127 128 128 128 128 128 128 128 128 127 128 128 128 128 128 |
(Блок 3) 128 127 126 128 128 128 128 128 127 128 128 128 128 128 128 128 |
Эти три блока для человеческого глаза неотличимы. Таким образом, 2-ой и 3-ий блоки можно спокойно заменить первым. Тогда кодовая книга будет иметь следующий вид:
Кодовая Книга[1] = 128 128 128 128
128 128 128 128
128 128 128 128
128 128 128 128
Важной особенностью технологии VQ является то, что при сжатии видео одна и та же кодовая книга может использоваться для нескольких кадров изображения.
Дискретное Косинусное Преобразование (ДКП)
Компрессоры, использующие ДКП: Motion JPEG; Editable MPEG; MPEG-1; MPEG-2; MPEG-4.
Достоинства и недостатки
«Блочность» при высокой компрессии.
Закругление острых углов изображения. Случайное «размывание» острых краев изображений.
Кодирование очень трудоемко. Только в последнее время удалось осуществить процесс кодирования программно, а не аппаратно.
Обзор
ДКП является широко используемым при сжатии изображений преобразованием. Стандарт сжатия статической графики JPEG, используемый в видеоконференциях стандарт H.263, цифровые видеостандарты MPEG (MPEG-1, MPEG-2 и MPEG-4) — все они используют ДКП. В этих стандартах используется, в частности, 2-мерное ДКП, применяемое последовательно к блокам изображения размерностью 8 x 8 пикселов. ДКП вычисляет 64 (8x8 = 64) коэффициента, которые затем квантизуются, обеспечивая тем самым реально сжатие. В большинстве изображений большинство ДКП-коэффициентов в силу своей малости после квантизации обнуляется. Это свойство ДКП и лежит в основе множества алгоритмов сжатия, использующих ДКП.
Вдобавок известно, что человеческий глаз гораздо менее чувствителен к высокочастотным компонентам изображения, представляемым большими коэффициентами ДКП. К этим большим значениям коэффициентов может быть применен (и, как правило, применяется) больший фактор квантизации. В частности, матрица 64 факторов квантизации для каждого из 64 коэффициентов ДКП, применяемая в алгоритме JPEG, имеет большие факторы квантизации для коэффициентов ДКП, соответственно, большей частоты. После квантизации коэффициенты подвергаются алгоритму RLE. Далее для частых комбинаций используются короткие кодовые слова, для более редких - относительно длинные. Осуществляется вероятностное кодирование.
ДКП, в свою очередь, лучше всего объяснять на примере одномерного ДКП. Двухмерное ДКП представляет собой одномерное ДКП, применяемое последовательно для каждого ряда (строки) блока пикселов и каждой колонки блока пикселов, полученного от одномерного ДКП строк. Одномерное ДКП, применяемое к N выборкам (пикселам в изображении или выборкам в звуковом файле). ДКП есть матрица размерности NxN, строки которой представляют собой косинусные функции:
ДКП(m,n) = sqrt( (1 - delta(m,1) ) / N ) * cos( (pi/N) * (n - 1/2) * (m-1) )
, где
ДКП (m,n) есть одномерная матрица ДКП
m, n = 1,...,N
pi = 3.14159267...
N = число выборок в блоке
delta(m,1) = 1 если m = 1 и 0 в противном случае
cos(x) = косинус x, измеряемый в радианах.
Естественно, применение ДКП на блоке из N выборок потребует N*N операций умножения и суммирования. Однако благодаря рекурсивной структуре матрицы ДКП реально потребуется гораздо меньшее количество математических операций, а именно N log(N). Это свойство делает ДКП реально применимым на современных математических процессорах персональных ЭВМ.
Дискретное Wavelet-преобразование (DWT)
Компрессоры, использующие DWT (Discrete Wavelet Transform): Intel Indeo 5.x; Intel Indeo 4.x
Достоинства и недостатки
Большинство как статических, так и динамических изображений, сжатых при помощи алгоритма DWT, не имеет характерной для алгоритма ДКП блочной структуры.
Относительное качество изображений, сжатых с использованием DWT, превосходит качество изображений, сжатых при помощи ДКП, при тех же коэффициентах сжатия.
DWT несколько размазывает, закругляет острые контуры изображения. Так называемый контурный шум или эффект Гиббса.
Обзор
DWT-алгоритм основан на передаче сигнала, например изображения, через пару фильтров: низкочастотный и высокочастотный. Низкочастотный фильтр выдает грубую форму исходного сигнала. Высокочастотный фильтр выдает сигнал разности или дополнительной детализации.
В свою очередь, результат на выходе высокочастотного фильтра (добавочный сигнал детализации) может быть подвернут той же процедуре и так далее.
Простым примером DWT является DWT Хара:
Входной сигнал x[n] есть множество выборок с индексом n. Низкочастотный фильтр Хара (Haar Low Pass Filter) есть арифметическое среднее двух удачных выборок:
g[n] = 1/2 * ( x[n] + x[n+1] )
Высокочастотный фильтр Хара (Haar High Pass Filter) есть средняя разность двух удачных выборок:
h[n] = 1/2 * ( x[n+1] - x[n] )
Заметьте, что:
x[n] = g[n] - h[n] x[n+1] = g[n] + h[n]
Выходные последовательности g[n] и h[n] содержат избыточную информацию. Таким образом, ясно, что для воспроизведения исходного сигнала x[n] достаточно взять только четные или только нечетные его выборки. Как правило, берутся четные выборки. Таким образом, исходный сигнал x[n] получается только из: g[0], g[2], g[4], .... h[0], h[2], h[4], .....
x[0] = g[0] - h[0]
x[1] = g[0] + h[0] x[2] = g[2] - h[2] x[3] = g[2] + h[2] и так далее...
Выход низкочастотного фильтра представляет собой грубую аналогию исходного сигнала. Если исходным сигналом является изображение, то на выходе низкочастотного фильтра получится расплывчатое, размытое изображение с низким разрешением. Выход высокочастотного сигнала добавляет детали к изображению. В сочетании с выходом низкочастотного фильтра может быть воспроизведено, таким образом, исходное изображение. Грубая форма исходного сигнала (сигнал на выходе низкочастотного фильтра) иногда называют основным уровнем (base layer), а дополнительный сигнал детализации - уровнем улучшения (enhancement layer). Сигнал на выходе высокочастотного фильтра h[n] может быть пропущен снова через пару фильтров, и процесс, таким образом, может быть повторен, пока не будет достигнута достаточная степень детализации исходного сигнала x[n]. Однако ясно, что никакого сжатия здесь не достигается. Преобразование попросту воспроизводит то же количество битов, которое было в исходном сигнале. Выходные значения называются коэффициентами преобразования, или коэффициентами wavelet-преобразования.
Преобразование Хара используется в основном в области сжатия изображений. Для других целей используются более сложные фильтры преобразований. Сжатие же достигается в основном за счет применения некоторой формы квантизации (скалярной или векторной) к добавочному сигналу детализации. Далее к полученным коэффициентам преобразования применяется техника вероятностного (энтропийного) кодирования.
Допустим, что в приведенном выше примере входной сигнал x[n] представляет собой последовательность 8-битных выборок растра полутонового изображения. Для выхода низкочастотного фильтра g[n] теперь можно использовать те же 8 бит, а для высокочастотного h[n] — уже меньше, например 4. Это, по сути, скалярная квантизация. Далее выход высокочастотного фильтра будет стремиться к нулю, так как коэффициенты преобразования будут убывать по мере применения алгоритма. Таким образом, возможно применить вероятностное кодирование к сигналу детализации h[n].
На самом деле для большинства реальных изображений сигнал g[n] на выходе низкочастотного фильтра будет похож на предыдущие g[n-1] выборок за исключением граней контуров. g[n] будет стремиться, таким образом, к g[n-1], вследствие того, что реальные объекты имеют относительно постоянный коэффициент отражения поверхностей.
Разница кадров
Компрессорами, использующими технологию разницы кадров, являются: Cinepak
Достоинства и недостатки
В целом может обеспечивать сжатие, лучшее, чем независимое сжатие отдельных кадров.
Возникающие в ходе кодирования ошибки накапливаясь, требуют наличия дополнительного ключевого кадра.
Обзор
Алгоритм разницы кадров использует то обстоятельство, что во многих видео изображение от кадра к кадру мало чем различается. По мере применения алгоритма векторной квантизации для кодирования каждого следующего кадра и получения при этом малых коэффициентов, которые трудно кодируются, в кадры постепенно вкрадывается ошибка. Это требует включения в видеоряд так называемых ключевых кадров, которые кодируются без учета предыдущих и являются так называемыми «опорными точками» в видео.
Компенсация движения
Компрессорами, использующими технологию компенсации движения, являются: MPEG-1,2 и 4.
Достоинства и недостатки
По сравнению с механизмом разницы кадров механизм компенсации движения позволяет достигать большей степени сжатия.
Кодирование весьма трудоемко и требует специальной аппаратуры.
Технология компенсации движения используется в таких международных стандартах сжатия цифрового видео, как: MPEG, H.261 и H.263.
Наибольшее сжатие достигается в сценах с пониженным движением.
Обзор
Компенсация движения основана на использовании ряда сложных алгоритмов. Сфера, где данная технология сжатия эффективна, как правило, сводится к видеоряду, в котором объект изменяет свое местоположение относительно неподвижного фона. Объекты, изменяющиеся по форме, приближающиеся или удаляющиеся (движущаяся камера), не подлежат эффективному сжатию посредством алгоритма компенсации движения. Сжатие возможно заданием вектора смешения элементов изображения вместо хранения больших значений новых координат данных элементов изображения. Основным блоком (относительно которого задается вектор смещения остальных блоков) может являться любой блок изображения размером 16x16 пикселов, максимально похожий на кодируемый (предсказываемый) блок. Ясно, что кадр, на который ссылаются таким образом другие кадры, должен быть декодирован ранее. Однако совсем не обязательно, чтобы опорный кадр предшествовал предсказываемому кадру. MPEG позволяет производить предсказание в обоих направлениях путем введения так называемых B- (bi-directionally predicted) кадров.
MPEG (MPEG-1, MPEG-2, MPEG-3, MPEG-4)
MPEG - это аббревиатура от Moving Picture Experts Group. Эта экспертная группа работает под совместным руководством двух организаций - ISO (Организация по международным стандартам) и IEC (Международная электротехническая комиссия). Официальное название группы - ISO/IEC JTC1 SC29 WG11. Ее задача - разработка единых норм кодирования аудио- и видеосигналов. Стандарты MPEG используются в технологиях CD-i и CD-Video, являются частью стандарта DVD, активно применяются в цифровом радиовещании, в кабельном и спутниковом ТВ, Интернет-радио, мультимедийных компьютерных продуктах, в коммуникациях по каналам ISDN и многих других электронных информационных системах.
MPEG-1
Очень популярный формат во всём мире, с основой, взятой от кодека JPG. Сжатие в нем производится сериями по три кадра. Это один из самых старых кодеков, так что, практически на любых, даже самых «слабых» машинах можно просмотреть видео со стереозвуком в этом формате. Однако и качество изображения невысокое: оно сравнимо с привычным аналоговым форматом VHS. Картинка имеет разрешение 352х288 точек, да и качество ее оставляет желать лучшего. И хотя MPEG-1 не требователен к ресурсам, его судьба предрешена: с развитием ёмкости и скорости передачи данных в компьютерах и интернете формат будет постепенно забываться.
Как происходит сжатие информации в этом формате? Предположим, что у нас есть следующая сцена: автомобиль движется из пункта "А" в пункт "Б". Перемещение машины можно описать двумя параметрами: вектором перемещения из точки "А" в точку "Б" и углом поворота вокруг своей оси. Задний план при этом остается неизменным или почти неизменным - зритель вряд ли обратит внимание на колебания мелких веток у дальних деревьев. Следовательно, можно разбить кадр на две составные части - задний план, который сохраняется один раз, а затем подставляется при воспроизведении всех кадров, и область, где движется машина, - ее придется записывать отдельно для каждого кадра.
В формате MPEG-1 все кадры видеоролика подразделяются на три типа: I-, P- и B-кадры. К первому типу (I-кадры, Intra Frames) относятся опорные кадры. Их изображения сохраняются в полном объеме в формате JPEG. Для P-кадров (Predicted Frames) записываются только отличия от предыдущего i-кадра, что требует намного меньше дискового пространства. Для B-кадров (Bi-DirectiOnally Interpolated Frames) сохраняются отличия от предыдущего и следующего I- или P-кадра.
В итоге размер сжатого файла составляет примерно 1/35 от исходного. Это значит, что полуторачасовой фильм с качеством, эквивалентным аналоговой записи на кассете VHS, в формате MPEG-1 поместится на два компакт-диска. Для передачи через Internet или в сетях спутникового вещания этот стандарт, конечно же, не подходит.
MPEG-2
MPEG-2 представляет собой дальнейшее расширение MPEG-1. В нем увеличен рекомендуемый размер кадра - теперь он составляет 1920 x 1080 точек, добавлена поддержка шестиканального звука. Однако для воспроизведения видео в этом формате требуется более высокая вычислительная мощность компьютера.
Следует отметить, что велась работа над созданием стандарта MPEG-3 (не нужно путать с популярным форматом сжатия звука - MPEG-1 Audio Layer 3). Он должен был стать базовым для систем цифрового телевидения высокой четкости HDTV. Но работа над ним была прервана, поскольку нужные для HDTV требования удалось реализовать в виде небольших расширений к MPEG-2.
Доминирующий формат на сегодня это MPEG-2 с разрешением 720х576 точек. Все DVD-video диски работают в формате MPEG-2. Трансляции со спутников в несколько каналов на одной частоте, эфирная трансляция, в том числе ТВ высокой четкости, разнообразные плееры DVD, microMV-видеокамеры используют этот формат сжатия. И это не удивительно. После триумфального успеха MPEG-1, новый формат, обеспечивающий практически профессиональное качество картинки, утверждался довольно долго, и получился очень удачным. MPEG-2 подходит для записи полуторачасового фильма отличного качества на стандартный диск DVD (4,7 Гб). Кроме того, в этом формате можно записывать на двойные DVD (9 Гб) фильмы повышенного качества с использованием нескольких разных дорожек звука (дубляж), разных форматов многоканального звучания, субтитров, разных углов обзора видеоматериала (несколько синхронных дорожек видео) и других цифровых новшеств. Среди них, например, присутствует произвольный мгновенный доступ к любой части видеоматериала на диске и отсутствие перемотки при достижении конца видеоматериала, что раньше являлось довольно большой проблемой.
MPEG-2 позволяет использовать разрешения вплоть до 1920х1080 пикселов (25 кадров в секунду, с полями и без полей, с прогрессивной разверткой) и поддерживает 6-канальный звук.
Особенности этого формата широко использует компания Sony в своем расширенном стандарте microMV, хотя поток информации там повышен до 12 Мбит/с (по сравнению с максимальным стандартом DVD 9,8 Мбит/с), а размер кассеты уменьшен (по сравнению с DV). И всё же стандарт DV отличается большей устойчивостью и большим распространением по всему миру.
Недавно появились камеры, которые пишут сразу на miniDVD диски в формате MPEG-2. Они имеют несколько важных достоинств - перезапись дисков до 1000 раз без потери качества, доступность материала и некоторые другие преимущества. Но очевиден и недостаток - ограниченный объем записанного материала (до 30 минут на 1 miniDVD диск). Хотя для любительских съемок это очень подходящий вариант: миниDVD диски прекрасно воспроизводятся на бытовых плеерах и ПК, а программы идущие с такими камерами позволяют проводить монтаж на любом компьютере, оснащенном DVD-приводом.
MPEG-3
Предназначался для использования в системах телевидения высокой чёткости (high-defenition television, HDTV) со скоростью потока данных 20-40 Мбит/с, но позже стал частью стандарта MPEG-2 и отдельно теперь не упоминается. Кстати, формат MP3 , который иногда путают с MPEG-3, предназначен только для сжатия аудиоинформации и полное название MP3 звучит как MPEG Audio Layer III.
MPEG-4
Форматы MPEG-1 и MPEG-2 не обеспечивали реальной возможности трансляции видео по сети Internet и создания интерактивного телевидения на их основе - слишком уж большим был размер файлов. Для его радикального уменьшения, а также реализации других функций, необходимых для передачи потокового видео, была начата работа над спецификациями нового формата - MPEG-4. По сути, он ориентирован не столько на сжатие видео, сколько на создание так называемого "мультимедийного контента" - слияния интерактивного телевидения, 3D-графики, текста и т. д.
Формат MPEG-4 сочетает отличный звук и максимальное уплотнение видеосигнала (до 30-40% лучше чем у предшественника). Разница заключается в том, что кодируется последовательность более чем из трех кадров (обычно до 250 кадров). Тем самым достигается большее сжатие и возможность смотреть в режиме реального времени качественное потоковое видео в интернет. Динамическое сжатие также эффективно использует ресурсы, и на обычный компакт-диск помещается 1,5 часа видео в достаточно хорошем качестве. Однако, в большинстве случаев, внимательный зритель сможет увидеть на хорошем экране разницу между изображением, закодированном в MPEG2 и MPEG4.
Интересной особенностью формата является то, что для типовых объектов даже разработаны отдельные алгоритмы предсказания и описания их движений - это касается, в частности, походки людей, наиболее распространенных жестов, мимики. Теперь такие изменения в кадрах нет нужды записывать вообще - их можно рассчитать программно.
В MPEG-4 поддерживается отображение текста различными шрифтами поверх видеоизображения. Более того, этот текст может быть озвучен с помощью синтезатора речи с возможностью имитации мужских и женских голосов. При необходимости голос синхронизируется с движениями лица диктора в соответствии с произносимыми фонемами. Также может синтезироваться звучание некоторых музыкальных инструментов. Сжатие оцифрованных звукозаписей осуществляется более эффективно с помощью специально разработанного кодека AAC (Advanced Audio Codec).
Некоторые видеокамеры позволяют записывать в формате MPEG-4 видео на собственную карту памяти или работать как web-камера, передавая по USB кабелю видео со звуком в формате MPEG-4.
Кроме того, современные технологии позволяют даже воспроизводить цифровое телевидение (сжатое в формате MPEG-4 или MPEG-2) с помощью мобильных телефонов, используя GPRS.
На сегодня, MPEG-4 - это наиболее популярный формат распространения видео в интернете и на персональных компьютерах. Рациональное использование памяти при хорошем качестве видео дают о себе знать. Каждая последующая версия кодека MPEG-4 (на сегодня используются 3.хх, 4.хх и 5.хх версии) привносит всё новые и новые прогрессивные улучшения. Большое количество бытовых плееров, КПК и прочих устройств без проблем работают с этим форматом. MPEG-4 будет актуален еще, как минимум, лет десять, пока ему на смену не придёт что-то принципиально новое.
MJPEG
MPEG-компрессия использует следующие основные идеи:
Устранение временной избыточности видео, учитывающее тот факт, что в пределах коротких интервалов времени большинство фрагментов сцены оказываются неподвижными или незначительно смещаются по полю.
Устранение пространственной избыточности изображений подавлением мелких деталей сцены, несущественных для визуального восприятия человеком;
Использование более низкого цветового разрешения при yuv-представлении изображений (y - яркость, u и v - цветоразностные сигналы) - установлено, что глаз менее чувствителен к пространственным изменениям оттенков цвета по сравнению с изменениями яркости.
Повышение информационной плотности результирующего цифрового потока путем выбора оптимального математического кода для его описания (например, использование более коротких кодовых слов для наиболее часто повторяемых значений).
Изображения в Mpeg-последовательности подразделяются на следующие типы:
I (intra), играющие роль опорных при восстановлении остальных изображений по их разностям;
P (predicted), содержащие разность текущего изображения с предыдущим I или P с учетом смещений отдельных фрагментов;
B (bidirectionally predicted), содержащие разность текущего изображения с предыдущим и последующим изображениями типов I или P с учетом смещений отдельных фрагментов.
Изображения объединяются в группы (GOP - Group Of Pictures), представляющие собой минимальный повторяемый набор последовательных изображений, которые могут быть декодированы независимо от других изображений в последовательности. Типичной является группа вида (I0 B1 B2 P3 B4 B5 P6 B7 B8 P9 B10 B11) (I12 B13 B14 P15 B16 B17 P18…), в которой I тип повторяется каждые полсекунды. Обратим внимание, что в изображении P3 основная часть фрагментов сцены предсказывается на основании соответствующих смещенных фрагментов изображения I0. Собственно кодированию подвергаются только разности этих пар фрагментов. Аналогично P6 «строится» на базе P3, P9 - на базе P6 и т.д. В то же время большинство фрагментов B1 и B2 предсказываются как полусумма смещенных фрагментов из I0 и P3, B4 и B5 - из P3 и P6, B7 и B8 - из P6 и P9 и т.д. Наряду с этим B-изображения не используются для предсказания никаких других изображений. В силу зависимости изображений в процессе их кодирования меняется порядок следования. Для вышеприведенной последовательности он будет следующим: I0 P3 B1 B2 P6 B4 B5 P9 B7 B8 I12 B10 B11 P15 B13 B14 P18 B16 B17…
Ясно, что точность кодирования должна быть максимальной для I, ниже - для P, минимальной - для B. Установлено, что для типичных сцен хорошие результаты достигаются при отведении числа бит для I в 3 раза больше, чем для P , и для P в 2-5 раз больше, чем для B. Эти отношения уменьшаются для динамичных сцен и увеличиваются для статичных.
Отдельные изображения состоят из макроблоков. Макроблок - это основная структурная единица фрагментации изображения. Он соответствует участку изображения размером 16*16 пикселов. Именно для них определяются вектора смещения относительно I- или P-изображений. Общее число макроблоков в изображении - 396. Для повышения устойчивости процесса восстановления изображений к возможным ошибкам передачи данных последовательные макроблоки объединяют в независимые друг от друга разделы (slices), максимальным числом 396. В предельном случае «чистой» передачи на изображение приходится всего один раздел из 396 макроблоков. В свою очередь каждый макроблок состоит из шести блоков, четыре из которых несут информацию о яркости Y, а по одному определяют цветовые U- и V-компоненты. Каждый блок представляет собой матрицу 8*8 элементов. Блоки являются базовыми структурными единицами, над которыми осуществляются основные операции кодирования, в том числе выполняется дискретное косинусное преобразование (DCT - Discrete Cosine Transform) и квантование полученных коэффициентов.
Таким образом, компрессия MJPEG [Motion JPEG] основывается на независимом кодировании каждого кадра и объединении полученной последовательности в файл. Сжатие видео осуществляется по JPEG-алгоритму: каждое изображение разбивается на квадраты 8x8 точек и представляется в векторной форме путем дискретного преобразования и высокочастотной фильтрации полученного спектра. По сути, сжатое видео представляет собой последовательность независимых JPEG-изображений.
Поскольку каждый кадр кодируется отдельно от других, возможно последующее покадровое редактирование изображения. Существенным преимуществом этого алгоритма сжатия видео является его симметричность, то есть для кодирования и декодирования необходимы одни и те же вычислительные затраты.
Применительно
к MJPEG степень
сжатия видео
до 1:15 позволяет
сохранять
видеоинформацию
практически
без потери
качества, от
1:15 до 1:25 приводит
к небольшой
потере разрешения.
При большом
коэффициенте
компрессии
[1:30 и выше] сжатие
видео по алгоритму
MJPEG сопровождается
характерными
для формата
JPEG искажениями:
на границах
сетки разбиения
[квадраты 8x8 точек]
нарушается
гладкость
изображения,
что приводит
к уже известному
"мозаичному"
эффекту.
Из
других недостатков
формата сжатия
MJPEG можно отметить
не очень большую
эффективность
сжатия, а также
невозможность
создания
видеофрагментов
размером более
2 Гб, - структура
файла не позволяет
увеличить его
размер. В настоящее
время применяются
программные
методы "склейки"
MJPEG-файлов, позволяющие
переключаться
между ними
практически
незаметно.
Несколько лет назад компрессия MJPEG стала стандартом в области мультимедиа, что побудило разработчиков аппаратного и программного обеспечения к созданию собственных MJPEG-кодеков.
Формат использует простую обработку кодированного аналогового видеосигнала по стандарту JPG (с разрешением 768х576 точек). Расшифровывается как Motion-JPEG (движущийся JPEG). На сегодняшний день этот формат практически не используется, т.к. качественно сжатые ролики занимают достаточно много места. В некоторых моделях устройств (например, фотокамерах с функцией видео) встречается упрощенный вариант M-JPEG с разрешением 320х240 точек.
Wavelet
Относительно новый алгоритм сжатия видео при котором, в отличие от JPEG, изображение обрабатывается без разбиения на квадраты. После того, как фирма Analogue Devices выпустила специализированную микросхему аппаратного wavelet-сжатия видео, данный формат стал базисом многоканальных цифровых систем видеонаблюдения и цифровых видеорегистраторов.
Как и в случае формата JPEG, в Wavelet сжатие осуществляется с необратимыми потерями информации, но изображение не имеет "мозаичных" дефектов даже при очень больших степенях компрессии. Достоинство - отсутствие видимых дефектов даже при большом коэффициенте сжатия видео, - снижается резкость, и изображение просто становится менее четким.
С математической точки зрения основной особенностью wavelet-преобразования является возможность разложить изображение на две компоненты - низкочастотную часть, содержащую основную информацию, и высокочастотную часть, содержащую лишь малую долю информации. Низкочастотную часть можно опять разложить на две части, и т.д. Оставшаяся часть изображения содержит лишь малые высокочастотные компоненты. В результате последовательного применения wavelet-преобразований получается изображение, занимающее небольшой объем места на диске.
JPEG
JPEG [ Joint Photographic Experts Group ] - алгоритм сжатия неподвижного изображения. Формат JPEG изначально предусматривает контролируемое, но необратимое ухудшение качества. Основная идея этого алгоритма сжатия заключается в том, что вся "картинка" разбивается на квадраты 8x8 точек, а изображение в каждом квадрате раскладывается на гармоники [преобразование Фурье]. Сохраняются только основные гармоники, а значения остальных грубо округляются. Особенностью формата сжатия JPEG является действительно быстрая [полный кадр за 1/50 секунды] и высокая компрессия [в 10 … 100 раз].
Традиционно формат JPEG применяется для компрессии полноцветных изображений и изображений в градациях серого без резких переходов яркости, обеспечивая, пожалуй, наилучшее цифровое сжатие. Переход от монохромного изображения к цветному RGB увеличивает объем картинки всего в полтора раза, а не в три.
Формат JPEG используют web-камеры и web-видеосерверы, - видеонаблюдение в этом случае возможно вести в окне стандартного браузера. Необходимо иметь в виду, что "живая" полноформатная картинка в формате JPEG может передаваться по каналам связи не менее 64К.
При сжатии видео по алгоритму JPEG теряется часть информации, но достигаются большие коэффициенты компрессии. В некоторых случаях проявляется эффект Гиббса - "ореол" вокруг резких горизонтальных и вертикальных границ изображения. Программное обеспечение решает, является ли конкретный квадрат 8х8 существенным в данном изображении или же его можно интерполировать. По мере повышения степени компрессии число выброшенных блоков возрастает, и на изображении начинают проступать артефакты - характерные прямоугольные дефекты.
Apple QuickTime
Формат файлов с расширением MOV был разработан Apple для компьютеров Macintosh и позже перенесен на платформу PC. С 1993 по 1995 г. этот формат был доминирующим. Последняя его версия за номером 4.1 позволяет передавать данные в потоковом режиме. Это значит, что нет необходимости полностью загружать файл, чтобы начать просмотр видеоролика. Однако с появлением спецификаций MPEG данный формат постепенно теряет популярность. Основная его проблема заключается в том, что стандарт QuickTime - закрытый. Способы, с помощью которых кодируется видео, Apple держит в секрете. Следовательно, сторонние программисты не могут написать программ, сжимающих видео в этот формат.
Intel Indeo
Данный формат был разработан корпорацией Intel для сжатия видеоданных с использованием новых возможностей процессоров Intel Pentium MMX. Кроме поддержки потоковой передачи данных и функций защиты авторских прав, этот стандарт реализует несколько новаторских на момент его появления функций. Он позволяет применять к видеопоследовательности различные эффекты (например, изменять яркость или контрастность) в реальном времени, декодировать не весь кадр, а, к примеру, центральный фрагмент, делать часть кадра одного видеоролика прозрачной и накладывать две видеозаписи друг на друга. Последний эффект часто используют в программах телевизионных новостей, когда комментатор изображается на фоне видеорепортажа с места событий.
Однако формат Indeo не получил большого распространения. А с выходом MPEG-4, в котором также присутствуют все эти возможности, данный стандарт вообще оказался не у дел.
CCIR 601
CCIR-601 - стандарт, описывающий формат цифрового видео с разрешением 720x576 (PAL) и 720x480 (NTSC).
Стандарт цифрового телевидения, опубликованный ITU-R (CCIR) в 1990 г. Определяет форматы кадра (например CIF, QCIF), правила преобразования стандартного аналогового видеосигнала (NTSC, PAL, SECAM) в цифровые компонентные сигналы и методы кодирования цифрового видеосигнала.
H.261
Рекомендация ITU-T H.261 - Video codec for audiovisual services at p x 64 kbit/s. Данная рекомендация описывает метод кодирования/декодирования видеоизображения для использования в системах видеоконференций при скоростях передачи данных p x 64 Кбит/с, где p может принимать значение от 1 до 30. H.261 определяет использование форматов кадра CIF и QCIF (при p < 3).
H.263
H.263 - это видеокодек, ITU-T, предназначенный для передачи видео по каналам с довольно низкой пропускной способностью (обычно ниже 128 кбит/с). Применяется в программном обеспечении для видеоконференций.
Стандарт H.263 был первоначально разработан для использования в системах, базирующихся на H.324 (PSTN и другие системы видеоконференций и голосовой связи), но впоследствии нашёл применение в H.323 (видеоконференции, основанные на RTP/IP), H.320 (видеоконференции, основанные на ISDN), RTSP (потоковое аудио и видео) и SIP (Интернет-конференции).
H.263 представляет собой развитие стандарта H.261, предыдущей разработки ITU-T - стандарта видеосжатия, и алгоритмов MPEG-1 и MPEG-2. Первая версия была завершена в 1995 году и представляла собой хорошую замену для устаревшего H.261 на каналах с любой пропускной способностью. Дальнейшим развитием проекта является H.263v2 (также известный как H.263+ или H.263 1998) и H.263v3 (известный как H.263++ или H.263 2000).
Новый расширенный кодек от ITU-T (в партнёрстве MPEG) после H.263 - это стандарт H.264, также известный как AVC и MPEG-4, часть 10. Поскольку H.264 имеет существенно расширенные возможности по сравнению с H.263, он стал основным при разработке программного обеспечения для видеоконференций. Большинство современного программного обеспечения этого направления поддерживает H.264, также как и H.263 или H.261.
Ogg-Theora
Ogg – это контейнер метаданных, обеспечивающий хранение в одном файле нескольких дорожек данных, позволяющий обнаруживать ошибки потока и искать неповрежденные места.
Кодек Theora разработан Фондом Xiph.org.. Его алгоритм основан на коде свободного кодека VP3, созданного компанией On2 Technologies и распространяемого под лицензией, позволяющей пользоваться им на безвозвратной основе (т.е. бесплатно) и не требующей каких-либо патентных отчислений за использование как самого VP3, так и производных от него кодеков. Theora - это высокоэффективный видеокодек, составляющий реальную конкуренцию формату MPEG-4 и другим технологиям видеосжатия, использующим узкую полосу канала передачи данных.
AVI
AVI-файлы - особый случай файлов RIFF. (сокращенно от Resource Interchange File Format). Этот формат, изначально предназначавшийся для обмена мультимедийными данными, был Microsoft совместно с IBM. Данный формат является наиболее распространенной формой представления видео на персональных компьютерах. В зависимости от формы представления видеоданных файлы AVI бывают различных стандартов.
Editable MPEG
Editable MPEG, так же как и M-JPEG, используется для редактирования цифрового видео представляет собой AVI-файл, состоящий только из кадров MPEG типа i. Однако все другие механизмы сжатия MPEG тут задействованы. Входит в стандартную поставку Microsoft Video for Windows 1.1. и используется такой настольной системой редактирования цифрового видео, как, например, Adobe Premiere.
Хотя вышеперечисленные компрессоры достаточно популярны, тем не менее это далеко не все стандарты сжатия AVI-файлов. Характеризуя эту группу компрессоров, можно отметить, что они проектировались и создавались в первую очередь как средства сжатия видео- и аудиоданных, хранящихся на жестких дисках и компакт-дисках, а это, в свою очередь, свидетельствует об их небольших возможностях при сжатии и относительно высоком качестве при воспроизведении.
С приходом Интернета все большую популярность получают методы и средства сжатия видео- и аудиоданных, позволяющих, применяя передовые технологии (sophisticated motion estimation and compensation, wavelets, fractals и другие), достичь наименьших соотношений «килобит/секунда», позволивших проводить, например, сеансы видеоконференций средствами Интернета. Ясно, что такие методы сжатия обеспечивают существенно большую степень сжатия, при относительно низком качестве.
VDOWave
VDONet выпускает wavelet-основанный видеокомпрессор, включенный в комплект реализации 32-битной версии Video for Windows. Microsoft использует VDOWave как часть NetShow. В настоящее время существуют две версии компрессора VDOWave:
VDOWave 2.0 is a fixed rate video codec.
VDOWave 3.0 is a "scalable" video codec.
Стандартный набор NetShow 2.0 устанавливает только декодер VDOWave. Средство разработки NetShow 2.0 устанавливает как кодер, так и декодер VDONet VDOWave. По некоторым тестам, VDOWave существенно превосходит по сжатию MPEG-1 и другие компрессоры, базирующиеся на алгоритме блокового ДКП (block Discrete Cosine Transform), но лишь при низких отношениях «килобит/секунда».
Cinepak
Один из наиболее распространенных и используемых компрессоров Video for Windows. Обеспечивает наиболее быстрое воспроизведение видео. В отличие от Indeo 32, которая обеспечивает чуть лучшее качество, однако заметно отягощает процессор при декомпрессии, Cinepak максимально разгружает процессорный ресурс.
На сегодняшний день существует по крайней мере три стандарта для Cinepak.
Cinepak SuperMac (изначальный, 16-битный компрессор);
Cinepak Radius (новый, улучшенный 16-битный компрессор);
Cinepak Radius[32] (32-битная версия Radius Cinepak, поставляемая совместно с Windows 95).
Особенностью метода является использование алгоритма векторной квантизации изображений совместно с алгоритмом разницы кадров (см. ниже).
Microsoft Video (MSVC)
Microsoft Video 1 поддерживает только 8- или 16-битную цветовую палитру.
Современные мобильные видеоформаты
Естественным и логическим этапом развития мобильной связи является возможность передачи и просмотра видео на мобильных телефонах. В сетях GSM в настоящее время возможен достаточно комфортный просмотр видеоинформации, предварительно скачанной из сети, или приготовленной собственноручно.
В настоящее время практически все вендоры мобильного рынка оснащают свои аппараты встроенными камерами с возможностью записи и воспроизведения видеофайлов. Используемый при этом видео-формат основан на протоколе MP4/3gp, однако это совсем не значит, что современные телефоны не умеют понимать и другие форматы представления видеоданных.
3GPP
3GPP является частным случаем MP4 Video. Этот стандарт вошел в обиход сравнительно недавно, благодаря компании Philips, приложившей немало усилий для адаптации стандарта MPEG-4 для потокового вещания.
Сандарт 3GPP стал основным в камерофонах с возможностью записи видео. Изначально он являлся базовым в смартфонах SonyEricsson, для них был даже разработан специальный софт для просмотра компанией PacketVideo - PVPlayer, позволяющий проигрывать видео на полный экран. В настоящее время этот проигрыватель доступен практически для всех смартфонов на базе операционных систем Symbian, Windows Mobile, а также для КПК класса PocketPC.
К достоинствам формата можно отнести то, что при несовпадении размеров изначальной картинки, она автоматически преобразуется в размер, поддерживаемый телефоном. Однако качество видеороликов очень низкое, т.к. изначально этот формат предназначался для оперативной записи видеоматериала с помощью встроенной камеры, последующего просмотра и отправки в качестве вложения в MMS (ограничение в 100 Кб).
Низкое качество видео обусловлено низким разрешением картинки, которое может быть либо QCIF (176x144), либо sub-QCIF (128x96), низкой частотой кадров - не более 15 в секунду, и особенностями записи звука. Звук, сопровождающий видеофрагмент, может быть записан в формате AMR (максимальный поток 12.2 кбит/c), либо WB AMR (поток 23.05 кбит/с).
Real Video
Real Video - самый распространенный сетевой потоковый аудио/видео стандарт, предложенный фирмой RealOne, широко используемый для представления в Интернете и кабельных сетях музыки и видео. Стандарт завоевал огромную популярность во всем мире как средство размещения в Интернете аудио/видео контента с малым размером файлов и вполне приличным качеством. Небольшой размер выходного файла позволяет существенно экономить трафик при трансляции по каналам связи, в том числе и в GSM-сетях. Файлы RealVideo обычно имеют расширение ".rm", ".ram" или ".rmvb".
Для воспроизведения на телефоне файл должен иметь геометрию изображения не больше 208x176 точек и содержать общий поток данных не выше 340 кБит/с.
VICS Video
VICS Video - формат, успешно применяемый в европейских беспроводных сетях TV-вещания.
Формат является потоковым и предназначен для просмотра он-лайн видео. Файлы этого стандарта имеют расширение .vic . Плеер для просмотра такого видео (под названием VICS NanoPlayer) существует для различных платформ, в том числе и для Symbian S60. Особого интереса формат не представляет.
MobiClip Video
MobiClip Video - классический MPEG-1. В октябре 2003 компания MobiClip представила очень интересный формат. Формат является по сути универсальным. Файлы, сконвертированные в этом формате, имеют расширение *.mo и могут нести в себе звук, видео и flash-анимацию.
На сайте производителя этот формат рекламируется как мобильное полноэкранное видео без тормозов. Существенным его ограничением является его непотоковый характер, то есть для просмотра необходимо загрузить весь файл целиком. Другим, не принципиальным, но существенным ограничением формата является большой объем полученных файлов. Таким образом, на телефонах появился формат видео, способный обеспечить высокое качество изображения при практически кинематографической частоте кадров. Качество воспроизведения зависит лишь от объема доступной памяти. Видеоролик проигрывается на полный экран.
В современных устройствах возможен также просмотр видео в форматах DivX и AVI.
Программы, необходимые для воспроизведения видео
Проигрыватели мультимедиа
Для воспроизведения видео- и аудиофайлов можно пользоваться стандартным средством Microsoft - программой Проигрыватель Widows Media, входящей в состав операционной системы Windows. Основное достоинство этой программы - наличие большого количества кодеков. Однако ей присущ и ряд недостатков: она требует значительных системных ресурсов и долго загружается. Описание других наиболее популярных проигрывателей приводится далее.
Можно выделить несколько общих особенностей этих программ.
Основное окно подобно панели управления обычного проигрывателя (например, видеомагнитофона) и содержит кнопки для управления процессом воспроизведения. Название каждой из них отображается в виде подсказки, возникающей при наведении на кнопку указателя мыши.
Помимо основного окна, доступно окно списка воспроизведения. В нем можно устанавливать очередность воспроизведения файлов (последовательно или в произвольном порядке).
При просмотре видеофайлов изображение выводится в отдельном окне.
Отсутствует стандартное для Windows-программ меню. Функции, недоступные из основного окна приложения, можно вызвать с помощью команд контекстного меню, которое открывается щелчком правой кнопкой мыши в основном окне.
Winamp
Одной из самых популярных программ воспроизведения файлов в аудиоформатах является Winamp. В последних версиях этого проигрывателя появилась также возможность воспроизводить видеофайлы. Модульная архитектура Winamp позволяет легко превратить компьютер в устройство, ничем не уступающее по эргономике управления стационарному музыкальному центру.
Этот универсальный проигрыватель распознает практически все аудио- и видеоформаты, поддерживает списки воспроизведения, имеет встроенный эквалайзер, с помощью которого можно точно отрегулировать качество звучания, и даже минибраузер. Для Winamp разработано множество обложек (причем не только компанией-производителем), позволяющих изменить его интерфейс до неузнаваемости, а также большое количество дополнительных модулей, как визуальных (зрительных образов), так и аудио (допускающих различные манипуляции со звуком).
Проигрыватель Winamp имеет понятный интерфейс, элементы управления которого напоминают кнопки обычного магнитофона. Помимо этих стандартных кнопок здесь предусмотрен также ползунок воспроизведения (вместо кнопок ускоренной перемотки). Все это делает работу с Winamp простой и удобной.
Кроме того, в программе предусмотрена возможность без прерывания процесса проигрывания пополнять список воспроизведения новыми файлами, удалять и менять их местами.
QCD Player
Проигрыватель QCD Player ориентирован в основном на воспроизведение музыки, хотя и позволяет открывать видеофайлы. Он имеет удобный интерфейс, обеспечивает все возможности, которые могут понадобиться при воспроизведении аудиофайлов, и позволяет производить большое число различных настроек. Кроме того, можно использовать дополнительные модули, расширяющие возможности программы.
LightAlloy
Программа LightAlloy используется относительно небольшим количеством пользователей, поскольку ее интерфейс не слишком удобен. Основное преимущество программы заключается в функциональности. Проигрыватель LightAlloy позволяет работать с внешней аудиодорожкой (в форматах WAV или MP3), может автоматически воспроизводить находящийся в одной папке с фильмом одноименный аудиофайл. Кроме того, этот проигрыватель совместим с программой WinLIRC, поддерживает внешние субтитры (SSA, SUB, SRT, форматированный текст), позволяет делать скриншоты (фотографии экрана), создавать списки проигрываемых файлов и настраивать фильтры.
В программе предусмотрена интересная функция тестирования видеокодека - LightAlloy воспроизводит фильм с максимально возможной скоростью и параллельно выстраивает график производительности (количество кадров в секунду). Программа поддерживает многие форматы файлов, а также позволяет использовать большое количество «горячих» клавиш. Однако следует отметить, что далеко не все они привычны для тех, кто использует другие проигрыватели.
Кроме непривычного интерфейса неудобство вызывает то, что программа требует набора компонентов DirectX 8.0 и выше, так что некоторые пользователи вынуждены будут обновить DirectX.
PowerDVD
Одним из самых популярных программных DVD-проигрывателей является PowerDVD. К его основным достоинствам относятся высокое качество изображения, удобный интерфейс с обложками и гибкие средства настройки. Кроме просмотра фильмов с компакт-дисков и DVD-дисков PowerDVD позволяет воспроизводить файлы форматов, поддерживаемых Windows MediaPlayer.
Программа обладает всеми присущими аппаратному DVD-проигрывателю цифровыми функциями, такими как масштабирование изображения, непрерывное проигрывание выбранного эпизода, установка маркеров для быстрого нахождения нужной сцены, ускоренный просмотр и т. п. Предусмотрена даже такая возможность, как одновременный показ субтитров на двух языках. В том случае, если изображение выводится не на широкоэкранный, а на простой телевизор или монитор компьютера, очень удобно пользоваться функцией преобразования широкоэкранного формата кинофильма в полноэкранный с соотношением ширины к высоте 4:3 (при этом исчезают черные полосы внизу и вверху экрана).
WinDVD
Данная программа предназначена для воспроизведения файлов в формате DVD. Она является коммерческим продуктом. Ее особенности -отсутствие поддержки смены интерфейса и вызов основного меню из окна с воспроизводимым видео. Проигрыватель предоставляет все функции, необходимые для полноценной работы с DVD-дисками.
BSplayer
Проигрыватель BSPlayer способен работать с программой WinLIRC для дистанционного управления ПК, что позволяет при наличии инфракрасного пульта дистанционного управления превратить компьютер в полноценный телевизор. В программе также предусмотрено большое количество «горячих клавиш» и поддержка внешних субтитров трех форматов: SUB, SRT и STF.
Программа позволяет настраивать все используемые фильтры, поскольку для проигрывателя такого уровня это условие является обязательным. А вот воспроизведение видеофайлов с несколькими звуковыми дорожками (с выбором любой из них) и система закладок (с возможностью их преобразования в разделы фильма), получение копии изображения на экране - это прекрасные дополнительные возможности программы.
Современные видеокамеры
Век аналоговых видеокамер уже заканчивается. Поэтому сейчас это самые дешевые видеокамеры. Недостатки таких камер следующие: невысокая четкость изображения, снижение качества изображения при создании уже первой копии, запись монозвука, большие размеры и вес, высокое энергопотребление. Для подключения аналоговых видеокамер к компьютеру требуется специальный TV-тюнер или карта видеозахвата. Дополнительно будет нужна специальная программа, преобразующая сигнал в цифровой режим. Форматы, которые используются в аналоговых видеокамерах: VHS, VHS-C, S-VHS, S-VHS-C.
Но если вы хотите получить лучшее из возможного в домашних условиях, то ваш выбор – современная цифровая видеокамера.
Существует ошибочное мнение о том, что выбрать цифровую видеокамеру можно по тем же критериям, что и цифровой фотоаппарат. Но это далеко не так. При выборе цифрового фотоаппарата одним из основных критериев является количество пикселей в матрице (чем больше, тем лучше и дороже), а у цифровой видеокамеры «больше» зачастую не означает «лучше». Это связано с тем, что разрешение видеокамеры ограничено стандартом телевидения (для PAL - 720x576), а цифровая фотокамера ограничений по разрешению не имеет. Поэтому, каковы же главные критерии выбора цифровой видеокамеры.
Для любительского класса сейчас существует три формата цифровых видеокамер - Digital 8, microMV, miniDV.
Формат Digital 8 предлагается только фирмой Sony. Плюсами являются: большая продолжительность записи на одну кассету (до 120 минут SP и 240 минут LP), доступная цена, возможность длительного хранения отснятого материала без перезаписи на специальную дорогую кассету. Недостатки: воспроизведение записей возможно только с самой видеокамеры или дорогого видеоплеера/видеомагнитофона Video 8 (обычный VHS плеер для этого не подходит), малая четкость изображения, качество которого при создании первой копии сильно ухудшается.
MicroMV предлагается опять же только фирмой Sony и является полной противоположностью камерам Digital 8. MicroMV-камеры очень малы, даже, миниатюрны, но эту особенность с трудом можно отнести к преимуществам, поскольку снимать в обычных условиях такими камерами очень неудобно, т.к. рука практически не чувствует веса камеры, держать и управлять microMV-камерой не очень удобно. Кроме того, самый большой недостаток microMV-камер заключается в нестандартном формате записи видео на ленту. Записанное на такой видеокамере видео понимает только специальная программа от Sony. К тому же кассеты microMV стоят в два раза дороже других кассет для цифровых камер.
Формат miniDV сейчас стал самым распространенным для любительских цифровых видеокамер. Абсолютно все производители выпускают камеры в этом формате. Камеры с таким форматом легкие, компактные, с хорошим качеством картинки. Цифровое видео записывается на кассету с хорошей вмещаемостью - 60 минут SP (90 минут LP). Разрешение изображения приближено к профессиональному – до 540 линий по горизонтали; стереозвук качества CD. Ценовой диапазон очень широк, поэтому вы легко сможете выбрать подходящую видеокамеру.
На сегодняшний день самыми популярными являются два вида - это кассета с магнитной лентой (MiniDV) и диск DVD (MiniDVD диаметром 8 см).
Формат miniDV обеспечивает высокое качество видео и удобство для редактирования на компьютере. Запись ведется на 6-мм ленту. На стандартной кассете умещается 60 минут записи с нормальной скоростью. MiniDV-камеры снабжаются инфракрасным освещением, позволяющим вести видеосъемку в темноте. Помимо видеосъемки формат miniDV-камер позволяет делать фотографии. Но основной недостаток – это огромный размер несжатого видео, который на жестком диске занимает около 12 ГБ для часового фильма.
Видеокамеры формата DVD позволяют записывать видео сразу на DVD-Video-диск (он же miniDVD: DVD-R, DVD-RAM и DVD-RW), который можно просто вынуть из камеры, вставить в DVD-плеер и сразу же посмотреть результат съемки. Что касается звука, то здесь предусмотрен формат, создающий эффект домашнего кинотеатра. При покупке выбирайте видеокамеру, которая записывает видео на диски того формата, который поддерживает ваш DVD-плеер: DVD-RAM или DVD-RW. К особенностям DVD-видеокамер следует также отнести то, что эти камеры более чувствительны к тряске и вибрации, чем видеокамеры, снимающие на пленку.
Не так давно появились видеокамеры, использующие в качестве носителя флэш-память и HDD. Камеры, использующие в качестве носителя флэш-память по качеству съемки пока уступают miniDV, зато они компактные, обладают незначительным энергопотреблением и повышенной надежностью. Запись ведется в формате MPEG4. В таком формате видео занимает мало места. Отснятые клипы легко копируются с флэш-карты на компьютер при помощи порта USB 2.0. HDD - пожалуй, наиболее перспективное направление. Пока таких камер немного и стоят они дорого. С помощью такой видеокамеры есть возможность записывать видео 21 час без перерыва, примером может служить Sony DCR-SR100.
Носители цифрового видео
Объединение кассеты с камерой было первым шагом по замене любительских кинокамер. Однако их размеры из-за используемой кассеты VHS были очень большими. Первым существенным шагом на пути миниатюризации видеоаппаратуры было создание кассеты формата VHS-C, а затем и Video8 (1985). Кассета Video8, например, имеющая габариты 95х62,5х15 мм, более чем в пять раз меньше по объему стандартной кассеты VHS. Но это были еще аналоговые форматы.
Первый бытовой цифровой формат DV появился в 1995 году. Поскольку кассета DV с лентой меньше, чем кассеты формата VHS-C или Video8, цифровые камкордеры меньше и легче, чем их аналоговые двойники.
В 1999 году корпорация Sony модернизировала свой аналоговый формат Video8 в цифровой Digital8. При использовании магнитной ленты категории Hi8 качество записи изображения и звука сопоставимо с качеством формата DV. Специалисты Sony на этом не остановились и в 2001 году разработали новый формат MICROMV. Кассета имеет габариты всего 46х30,2х8,5 мм, то есть ее объем на 30% меньше, чем у DV-кассеты. В режиме SP на кассету можно записать до 60 минут высококачественного видео.
Еще один вариант цифровой видеозаписи Digital HD на DV-кассете представила в марте прошлого года компания JVC. Камкордер GR-DH1 может записывать видео в формате MPEG с эффективным числом строк до 720.
Популярность цифровых камкордеров в мире очень велика, хотя и существенно разнится по регионам. Так, в Японии до 95% всех видеокамер цифровые, в то время как в Европе они составляют 60%, а в США - вообще только 30%.
Сегодня магнитный носитель (лента в кассете) уже не является единственным для записи цифрового видео. Все больше фирм предлагают модели, в которых видеозапись осуществляется на оптический носитель. Записываемые DVD в качестве носителя в камкордерах стали использоваться в 2001 году. Первую камеру с использованием диска DVD-RAM диаметром 8 см разработала фирма Hitachi. Эта камера также позволяет делать записи на одноразовые DVD-R. Камкордеры с аналогичными носителями сегодня производит и Panasonic. Sony в своих последних дисковых видеокамерах использует в качестве носителя диски DVD-R/RW такого же диаметра. Поскольку запись на DVD ведется в формате MPEG-2, то свое видео можно сразу воспроизвести на DVD-проигрывателе. И здесь можно только приветствовать выбор Sony, поскольку число бытовых проигрывателей, понимающих DVD-RAM, ограничено, а DVD-R/RW - родные почти для всех.
Совершенствование цифровых методов обработки изображений (появление алгоритмов сжатия MPEG-4 и WMV) привело к существенному снижению объема данных, которые нужно записать без заметной потери качества. Поэтому естественным было появление моделей камкордеров с использованием жесткого диска в качестве носителя видеоинформации. Корпорация Toshiba уже разработала прототип цифрового камкордера с микровинчестером размером с PC-карту. Samsung Electronics планирует выпускать цифровой камкордер с записью на встроенный жесткий диск в формате MPEG-4 и позволяет переносить изображения на компьютер. Мы уже писали о разработке фирмой Philips привода для малогабаритных (диаметром 30 мм) дисков Blu-ray, которые фирма рассматривает в качестве носителя для будущих моделей цифровых камкордеров.
Использование полупроводниковой памяти началось с фотокамер: поскольку емкость флэш-карт была мала, ее хватало только на неподвижные изображения. Удобство сменного носителя быстро оценили не только фотолюбители, но и изготовители видео. И практически сразу в цифровых камкордерах формата DV появились слоты для флэш-карт, на которые можно было записывать фотоизображения. Однако с увеличением емкости положение изменилось. И вот уже Panasonic предлагает модели, которые позволяют записывать видео в формате MPEG-4 на карточки памяти Security Digital (SD). Сейчас происходит сближение и взаимное проникновение фотокамер и камкордеров. Не только последние цифровые фотокамеры, но и мобильные телефоны и карманные персональные компьютеры (КПК или «наладонники») имеют функцию записи цифрового видео. КПК компании Sony могут записать до 120 минут видео на Memory Stick емкостью 128 МБ. Конечно, для записи цифрового видео хорошего качества и достаточной продолжительности при современных методах сжатия требуется емкость не менее 1 ГБ.
Характерный последний пример: карманная комбинированная фотовидеокамера Sanyo FVD-C1 - самый легкий в мире камкордер с записью MPEG-4 высокого разрешения на флэш-карту SD. Фото записываются с максимальным разрешением 3,2 мегапикселя, а информация хранится на SD-карте емкостью 512 МБ (входит в комплект). Если выбрано максимальное качество, соответствующее, по мнению фирмы, DVD (разрешение VGA 640х480, частота 30 кадров секунду), то на карту помещается до получаса видео. Если устраивает VHS-качество, то на карте умещается уже 80 минут видеозаписи. В режиме фотосъемки можно сделать 491 снимок в режиме 3,2 мегапикселя (2048х1536) или до 3931 снимка в режиме 0,3 мегапикселя (640х480).
Сменные флэш-карты удобны и еще по одной причине. Уже сегодня многие производители предлагают телевизоры и DVD-проигрыватели со слотами для флэш-карт, что позволяет осуществить просмотр слайдов или видеозаписи без копирования на другой носитель.
Вместе с тем необходимо отметить, что именно цифровой характер записи позволяет копировать ее и редактировать, используя компьютер и сохраняя при этом исходное качество. Практически все современные камкордеры с записью на DV оборудованы портами i.Link для передачи информации в компьютер или на DVD-рекордер. В случае использования в качестве носителя видео записываемых DVD или сменной флэш-карты осуществить его перенос в компьютер еще проще.
Запись на флэш-карту фото или видео в формате MPEG-4 или WMV уже практически реализована во многих моделях, основным препятствием их распространения остается ограниченная емкость памяти и высокая цена. Сегодня за сотню-другую долларов можно купить карту емкостью 512 МБ. Технологически уже возможно создание флэш-карты емкостью 4 ГБ и даже вдвое большей путем объединения чипов в одном корпусе, вопрос только в приемлемой для рынка цене.
Тем не менее создается впечатление, что производители искусственно сдерживают снижение цен на флэшки. Ведь появление малогабаритного дешевого твердотельного носителя ставит под сомнение дальнейшее существование и DV, и записываемых DVD. Значит — прощай, прибыли. И гиганты мировой индустрии заранее подготавливают плацдарм для отступления — HD-DVD. Причем пока даже не важно, будет ли это диск Blu-ray или какой-то другой. Важно, что это даст новое качество изображения, недоступное другим носителям.
Системы спутникового телевидения
Категории систем СТВ
Системы спутникового телевидения (СТВ) могут рассматриваться с двух точек зрения: используемой технологии и оборудования, а также организационной структуры.
С технической точки зрения удобно разделить системы спутникового телевидения по типу пользователей. Большая часть телевизионных программ распределяется по спутниковым каналам следующим категориям пользователей:
Вещательные компании, принимающие передачи крупных телекомпаний и формирующие на их основе пакеты программ для распределения по наземным эфирным сетям. Электронный сбор новостей и передача готовых пакетов программ для эфирной ретрансляции также попадают в эту категорию.
- Головные станции систем кабельного телевидения, распределяющие принимаемые со спутника пакеты программ по кабельным сетям.
- Приемные станции коллективного пользования TV Receive Only или TVRO, обслуживающие небольшие группы зрителей.
- Индивидуальные (домашние) приемные системы Direct To Home (DTH), рассчитанные на использование одним лицом или семьей.
Три последние группы пользователей заинтересованы в использовании минимального количества антенн для приема максимального количества телевизионных каналов. Поэтому они всегда отдают предпочтение многопрограммным системам СТВ, позволяющим принимать на одну антенну, т.е. с одного спутника, не менее 10-15 программ.
С организационной точки зрения системы СТВ удобно подразделять в зависимости от участия оператора спутниковой системы в формировании пакета транслируемых программ. В этом случае основными категориями систем будут следующие:
- Оператор сдает в аренду или продает ресурсы спутниковой системы и не принимает никакого участия в формировании программ. Т.е. он просто транслирует чьи-то другие программы. В качестве примера можно привести системы "Астра", "Хьюз Галакси", "Евтелсат Хот Берд".
- Оператор также формирует программные пакеты и получает доход от размещения в них рекламы и платежей от операторов кабельных сетей за использование этих программ. Непосредственно со зрителей плата не взимается. Примером такой системы СТВ является "СтарТВ" на спутнике "АзияСат".
- Оператор спутниковой системы полностью формирует программный пакет и транслирует его в закодированном виде. Плата за пользование каналами взимается со зрителей напрямую с использованием оборудования авторизации доступа к сети. Зачастую также взимается плата с рекламодателей за размещение рекламы в каналах сети. В качестве примера можно назвать системы "ДирекТВ", "Би-Скай-Би" и НТВ+.
Методы формирования сигналов
Качество телевизионного изображения во многом определяется методами его формирования и передачи. В середине семидесятых, когда спутниковые системы передачи телевизионных программ только создавались, в них использовался аналоговый телевизионный сигнал, как и в наземном вещании. До настоящего времени большое число спутниковых систем по-прежнему продолжают использовать этот метод при передаче телевизионных сигналов. Однако, такой тип сигнала не очень хорош для спутниковых систем, и активизировались поиски новых, более совершенных методов трансляции. Весьма привлекательным было бы использование цифровых методов передачи, но из-за технических сложностей, в первую очередь из-за огромной полосы частот, требуемой для передачи стандартного телевизионного сигнала в цифровом виде, в то время это не представлялось возможным.
В связи с этим в начале восьмидесятых годов в Европе был разработан и принят комбинированный цифро-аналоговый стандарт, получивший название МАС (Multiplexing Analogue Components, т.е. мультиплексирование аналоговых компонент). Стандарт МАС нашел достаточно широкое распространение в европейских системах спутникового телевизионного вещания, но так и не смог завоевать серьезную нишу на рынке. Наконец, в конце восьмидесятых были разработаны алгоритмы сжатия цифрового видеосигнала, т.н. видеокомпрессии, на основе которого был принят широко используемый в настоящее время в спутниковом вещании стандарт MPEG-2 (Motion Picture Expert Group). Именно этот стандарт цифровой видеокомпрессии стал в последние несколько лет главной движущей силой бурного развития непосредственного спутникового вещания. На цифровое телевизионное вещание с использованием этого стандарта планируется постепенно перевести не только спутниковые, но и наземные эфирные и кабельные системы.
Таким образом, в настоящее время используются три вида передачи телевизионного сигнала: аналоговый, цифро-аналоговый и цифровой со сжатием.
Аналоговый метод
Стандартный телевизионный сигнал представляет собой электрический ток, изменяющийся во времени. Форма этих изменений повторяет распределение яркости и цвета на пути развертки изображения по строкам. Он также включает в себя различные синхронизирующие и управляющие сигналы, а также сигнал звукового сопровождения. Такой сигнал является аналогом изображения и называется комплексным телевизионным сигналом. Поступая на вход телевизионного приемника этот сигнал с помощью кинескопа и громкоговорителя, а также электронных систем, которые ими управляют, преобразуется в изображение и звук.
Телевизионный сигнал характеризует совокупность его параметров: число кадров в секунду, количество строк в кадре, длительность и форма синхронизирующих и гасящих импульсов, полярность сигнала, частота поднесущей звука, метод кодирования сигнала цветности совместно с сигналом яркости. Совокупность значений этих параметров составляет стандарт телевизионного сигнала.
Наиболее широко распространены стандарты с числом строк в кадре 625, частотой смены кадров 25 (50 полукадров) в секунду и частотой строчной развертки 15625 Гц. Однако в нескольких системах число кадров в строке составляет 525, а число кадров - 30 (60 полукадров) в секунду. Звуковое сопровождение обычно передается на частоте 5,5 - 6,5 МГц.
С появлением цветного телевидения возникла необходимость создания стандартов на передачу в дополнение к сигналам яркости и звука сигналов цветности. В настоящее время используются три системы цветного телевидения, различающиеся способом кодирования сигналов цветности: PAL, SECAM и NTSC. Все они совместимы с ранее действующими стандартами черно-белого телевидения и сигнал цветности добавлен к основному сигналу яркости. При этом черно-белый телевизор просто не воспринимает сигнала цветности.
Стандарт SECAM используется в странах Восточной Европы, России и во Франции. Система PAL - в странах Западной Европы и Ближнего Востока. Система NTSC распространена главным образом на американском континенте.
Цифро-аналоговый метод
Компромиссом между аналоговыми и цифровыми методами передачи телевизионного сигнала по спутниковым каналам стала цифро-аналоговая система МАС (Multiplexed Analogue Components - мультиплексирование аналоговых компонент).
Разработка и внедрение стандарта МАС явилось частью глобального европейского проекта EUREKA-95, который ставил своей целью формирование концепции единого стандарта для телевидения высокой четкости (ТВВЧ) и разработку полного комплекта оборудования для производства, обработки, передачи, приема и воспроизведения видеопрограмм как для профессиональных, так и для бытовых целей. Было предложено несколько модификаций этого стандарта, включая версии для телевидения повышенного качества (ТВПК) и ТВВЧ.
Во всех ныне используемых вариантах системы МАС применяется временное разделение аналоговых составляющих сигналов яркости и цветности. Это позволяет не только свести практически к нулю фазовые и перекрестные искажения видеосигнала, но и добиться сокращения спектра сигнала за счет применения систем его частичного сжатия.
Эти системы обеспечивают следующие, улучшенные по сравнению с традиционными аналоговыми системами, характеристики телевизионного вещания:
- Отсутствие перекрестных искажений сигналов яркости и цветности.
- Значительное снижение шумов в канале цветности.
- Передачу сигналов звукового сопровождения, синхронизации, телетекста и другой служебной и дополнительной информации в цифровой форме.
- Повышение разрешения (четкости изображения) за счет большей полосы частот сигналов яркости и цветности.
На основании базового стандарта МАС в различных странах было разработано несколько его версий для систем спутникового телевизионного вещания. Они различаются главным образом способами передачи цифровых и аналоговых сигналов.
Несмотря на заметное преимущество перед аналоговыми методами передачи телевизионной информации, стандарт МАС так и не смог завоевать значительной доли на рынке спутникового телевидения.
Во-первых, он по сути своей является компромиссным и не в состоянии полностью устранить все недостатки аналоговых систем. Качество изображения оказалось не намного лучше, чем в хорошо отлаженных аналоговых системах. А внедрение систем ТВПК и ТВВЧ, где стандарт МАС заметно выигрывал, сильно затянулось.
Во-вторых, установка декодеров МАС в приемники СТВ и обычные телевизионные приемники приводило к заметному повышению их стоимости, что отрицательно сказалось на спросе на них.
В-третьих, появление в каждой из стран своей версии стандарта МАС привело к появлению проблем несовместимости оборудования различных фирм. В результате, попытка создания единого стандарта привела к противоположному - появлению нескольких новых. В-четвертых, серьезный удар по стандарту МАС был нанесен весьма успешным выходом на европейский рынок системы многоканального СТВ "Астра", отказавшейся от использования технологии МАС. В результате, более дешевые приемники для этой системы стали весьма популярными и очень быстро система "Астра" смогла завоевать до 90% зрительской аудитории спутникового телевидения в Европе.
Существенный перелом на рынке спутникового телевидения произошел лишь после разработки чисто цифровой системы вещания, использующей технологию видеокомпрессии.
Цифровой метод
Возрастающие требования к качеству телевизионного вещания, подготовки программ и их сохранения, а также необходимость снижения расходов на всех этапах производства и трансляции, требуют разработки новых эффективных методов обработки и передачи телевизионных сигналов. Всем этим требованиям отвечает использование цифровых методов в телевидении.
Цифровое телевидение - область телевидения, в которой операции обработки, записи и передачи телевизионного сигнала связаны с его преобразованием в цифровую форму. Системы цифрового телевидения можно условно разделить на два основных типа:
1. Аналоговый телевизионный сигнал преобразуется в цифровую форму только для его цифровой обработки, сохранения телевизионной программы (видеозапись) или передачи их по каналам связи, а затем трансформируется назад в аналоговую форму. При этом используются существующие телевизионные передающие и ретрансляционные станции, и приемное оборудование.
2. Преобразование передаваемого изображения в цифровой сигнал производится непосредственно в преобразователе свет-сигнал (обычно видеокамера), а обратное преобразование - в преобразователе сигнал-цвет (телевизионном приемнике). Во всех остальных звеньях тракта телевизионная информация обрабатывается и передается в цифровой форме.
В настоящее время в основном применяются системы цифрового телевидения первого типа. Цифровые методы уже достаточно давно используются в профессиональном телевидении. Это, в первую очередь, цифровая обработка изображений, создание специальных эффектов, цифровая видеозапись и так далее. Цифровые методы начали также применяться в бытовой видеоаппаратуре.
А несколько лет назад, наконец, появилась цифровая система спутникового телевидения. Единственным аналоговым прибором в тракте остался телевизионный приемник. Однако внедрение цифровых методов в телевидении идет настолько быстро, что недалеко то время, когда весь телевизионный тракт станет цифровым. Главными факторами, влияющими на темпы перехода от аналогового телевидения к цифровому, являются время и средства, необходимые на модернизацию распределительных и вещательных сетей и замену огромного парка аналоговых телевизионных приемников цифровыми.
Телевидение высокой четкости (HDTV: High-Definition Television)
Под телевидением высокой четкости (ТВЧ) понимают передача изображения с числом строк, приблизительно вдвое превышающим показатель у существующих стандартов, и форматом кадра (отношение ширины кадра к его высоте) 16:9. Объем информации содержащийся в каждом кадре ТВЧ изображения, возрастает в пять-шесть раз по сравнению с обычным телевидением. На ТВЧ изображении отсутствуют дефекты, свойственные принятым сегодня стандартам ТВ вещания, - недостаточная разрешающая способность, заметность поднесущей, перекрестные искажения сигналов яркости и цветности, мерцание изображения из-за недостаточно высокой частоты кадров, дрожание строк и т.д. ТВЧ обеспечивает существенное повышение качества ТВ изображения, приближая его восприятие к зрительному восприятию естественных, натуральных сцен и сюжетов. Такое радикальное улучшение качества изображения не может быть достигнуто ни модификацией существующих стандартных систем цветного ТВ, ни ТВ системами повышенного качества.
В США, Японии, европейских странах в последние пять-семь лет ведутся многочисленные разработки новых ТВ стандартов с улучшенным качеством изображения. Разработаны совместимые системы телевидения повышенного качества (ТВПК), в которых устранены наиболее характерные искажения ТВ сигнала, несколько увеличена разрешающая способность, введен формат изображения 16:9 (стандарты МАС, PAL-плюс).
HDTV (High Definition Television - Телевидение Высокой Четкости) - сегодня это самая передовая и высокотехнологичная область цифрового телевидения, сравнимая по своему значению с появлением цветного телевидения в 60-х годах 20 века. В буквальном смысле англоязычных аббревиатур - HDTV (High Definition Television) - это часть DTV (Digital Television).
HDTV поддерживает стандарты 1080i и 720p, обладает широкоэкранным 16:9 изображением, звуком Dolby Digital 5.1., соответственно, является наивысшей точкой развития телевизионных технологий.
Посредством HDTV обеспечивается доставка в каждый дом необыкновенно чистого, яркого и четкого изображения, практически совпадающего по качеству с 35-мм кинопленкой, и с многоканальным звуковым сопровождением.
Высокая четкость (HD) означает, что число линий и число пикселей в каждой линии телевизионной картинки существенно увеличены по сравнению с телевидением стандартной четкости (SD). В то время, как телевизионное SD-изображение передается с разрешением 720х576 пикселей, HD-изображение имеет разрешение 1920х1080 пикселей. Число элементов изображения, передаваемых за одну секунду, увеличено в 5 раз. Это позволяет существенно увеличить чистоту, четкость и детализацию изображения и объясняет тот восторг, который вызывает просмотр HDTV-картинки на высококачественных плоскопанельных дисплеях или на проекторах в домашних кинотеатрах.
Преимущества цифрового кодирования в телевидении очевидны: даже при приеме «цифры» на обычный телевизор качество изображения повышается из-за отсутствия искажений на различных этапах телевизионного тракта. При этом развертка луча остается чересстрочной и разрешающая способность экрана не возрастает. Для существенного повышения качества телеизображения необходимо ввести новые стандарты для формирования и приема видеосигнала, такой системой является телевидение высокой четкости (ТВЧ). Американский стандарт (ATSC) рассчитан на просмотр передачи как на телеэкране, так и на мониторе компьютера. При этом высокое качество картинки можно получить лишь на экране специального широкоформатного телевизора с 1080 активными строками, чересстрочной разверткой.
Для ТВ-приемников
Число активных строк – 1080;
Полевая частота, Гц. – 60;
Перемежение в развертке - (2:1) интерлейсинг;
Формат кадра - 16:9.
Для мониторов ПК
Число активных строк – 720;
Полевая частота, Гц. – 60;
Перемежение в развертке - (1:1) прогрессивная развертка луча;
Формат кадра - 16:9.
Согласно ATSC-стандарту, каждый ТВ-приемник должен декодировать любой из многочисленных (а всего их 18 разновидностей) ATSC-форматов и выводить его точно в соответствии с возможностями конкретного подключенного приемника.
Внешне цифровой приемник ТВЧ отличается от аналогового более широким экраном: если соотношение сторон обычного телевизора составляет 4:3 (ширина к высоте), то в цифровом варианте - 16:9. Качество телевизионного изображения заметно повышается за счет двукратного увеличения строк разложения и прогрессивной развертки (впрочем, развертка может быть и чересстрочной). При прогрессивной развертке яркость экрана может быть повышена на 40% . Количество воспроизводимых деталей на экране возрастает в несколько раз. В новой системе расширена частота сигнала яркости и цветоразностных сигналов, поэтому оптимизирована цветопередача. Многоканальная система передачи звука позволяет добиться эффекта присутствия, так как аудиоинформация поступает к зрителю с разных сторон.
Внедрение ТВЧ требует дорогостоящей модернизации аппаратно-студийного комплекса, но практика вещания в США показала, что уже сегодня число программ ТВЧ в общем времени цифрового ТВ постоянно растет.
Для просмотра телевидения высокой четкости потребуется цифровой спутниковый HDTV ресивер или HD-DVD плеер, а также телевизор у которого есть логотип HD TV или HD Ready. Такая техника появилось на российском рынке совсем недавно.
На российском рынке пока немного ТВ устройств, отображающих HDTV картинку полностью, без уменьшения разрешения. Одним из интересных вариантов как в плане цены, так и в плане возможности отображения картинки Full HD является телевизор ACER AT3705-MGW. MGW в названии означает MediaGateway - "ворота в мир медиа". Право так называться ему дает встроенный сетевой плеер.
Справочная информация и термины
Aspect Ratio - отношение ширины к высоте экрана. Соотношение 4:3 означает, что размеры по горизонтали на треть больше размеров по вертикали. Стандартный телевизионный размер 4:3 (или 1.33:1). Широкоформатные (widescreen) DVD и HTDV имеют соотношение 16:9 (или 1.78:1).
Bitrate - количество бит - характеристика скорости потока видео и/или аудио информации. Измеряется в тысячах килобит за секунду. Чем больше bitrate, тем больше места на диске занимает данная информация и, как правило, при этом улучшается качество изображения. Bitrate в 8000 kbit/s соответствует 1 мегабайту в секунду. Например, 60 секунд видео, закодированного с bitrate 8000 kbit/s, займет на диске 60 мегабайт.
Capture - Процесс захвата видео или ТВ сигнала на жесткий диск компьютера. Может выглядеть как захват с DV камеры через порт Firewire.
CBR - Constant Bit Rate. Постоянная скорость при кодировании - термин, применяемый для описания параметров кодирования в ряде вариантов MPEG формата и означает, что при кодировании в MPEG формат скорость получаемого на выходе кодера MPEG потока всегда постоянна и не зависит от вида кодируемой видеоинформации.
Codec – Сокращение от "compression/deccompression" (компрессия/декомпрессия). Кодеком называют алгоритм или специальную компьютерную программу позволяющую обработать (применить компрессию) и уменьшить размеры большого файла. Файл закодированный (компрессия) каким-либо кодеком, требует тот же кодек для декопмпрессии.
Component Video - компонентный видеосигнал. Метод обработки изображения, при котором сигнал цветности и сигнал яркости обрабатываются отдельно, в аналоговой или цифровой форме. Качество такой обработки выше, чем при композитном сигнале. Betacam - это аналоговый компонентный формат, D1 - это цифровой компонентный формат. Видео стандарт США - NTSC - это аналоговый композитный видео сигнал, D2 - это цифровой композитный формат.
Composite Video - композитный видео сигнал. Метод обработки изображения, при котором сигнал цветности и сигнал яркости обрабатываются вместе, в аналоговой или цифровой форме. Качество такой обработки ниже, чем при компонентном сигнале. Форматы S-VHS и VHS - это аналоговые композитные аппараты, D2 - это цифровой компрозитный метод. Формат Betacam - это аналоговый компонентный видео сигнал, D1 - это цифровой компонентный метод.
Compositing - композиция. Этот термин обозначает процесс сборки готовой графики или анимации из различных элементов, путем монтажа с видео магнитофонов, видео дисков или на цифровых композиционных аппаратах.
Compression - Процесс удаления избыточной информации для уменьшения занимаемого файлами места. Компрессия без потери качества позволяет восстановить оригинальные (первоначальные) данные, компрессия с потерей качества удаляет часть полезной информации для наилучшего сжатия размеров файлов и не позволяет восстановить оригинальные данные.
Convert - Преобразование одного формата в другой. Например DivX в MPEG, QuickTime в AVI, и т.д.
CSS - Content Scrambling System. В DVD-Video система шифрования предназначенная для защиты информации от копирования.
Deinterlace - Процесс объединения двух "половинчатых" полей кадра в одно поле. Применяется, например, для убирания артефактов черестрочного видео ("гребенка") при создании неподвижных изображений.
Encoding - Процесс перевода (кодирование) данных из одного формата в другой с помощью специальных кодеков. Данные - обычно файл содержащий аудио, видео или слайды (неподвижные изображения). Чаще всего применяется для достижения совместимости с различным оборудованием, например DVD плеерами, или для уменьшения места занимаемого файлами.
Field - В черестрочном видео половина полного кадра (Frame) называется полем (field), называемым также Field A или Field B. При работе с черестрочным видео, особенно при кодировании, очень важно знать порядок следования полей, т.е. какое поле идет первым A или B. Если указать неправильный порядок следования полей, то полученное видео будет мерцать. В стандарте NTSC развертка осуществляется с частотой 60 полукадров в секунду, а в формате PAL - с частотой 50 полукадров.
fps - (frames per second) - кадры в секунду.
Frame - кадр. Единица видео изображения. Если видео чересстрочное (Interlace) кадр состоит из двух чересстрочных полей (полукадров), если видео с прогрессивной разверткой, то кадр формируется построчной разверткой. Количество линий в кадре зависит от TV системы - в системе PAL используется 625 строк, а в NTSC 525 строк.
High Definition Television - High Definition Television, телевидение высокой четкости в сочетании со звуком Dolby Digital Surround (AC-3). Для HDTV необходимо новое оборудование как для передачи, так и для приема пользователями. Более высокое разрешение является изюминкой HDTV. Изображение в 720 или 1080 линий не идет ни в какое сравнение с изображением в 525 (NTSC) или 625 (PAL) линий!
Форматы используемые в HDTV:
720p - 1280x720 точек. прогрессивная развертка
1080i - 1920x1080 точек. чересстрочная развертка
1080p - 1920x1080 точек. прогрессивная развертка
Interlace - Черестрочное изображение. Т.е. каждый кадр такого изображения формируется из двух полей. Сначала на экран выводятся нечетные линии изображения, затем четные. Каждый набор нечетных/четных линий называется полем.
Lossless Compression - Технология сжатия позволяющая восстанавливать исходные данные без потерь.
Lossy Compression - Технология сжатия позволяющая получить высокую компрессию за счет полного удаления части информации, сохраняя при этом как можно больше полезной информации. Использует особенности человеческого восприятия, при котором часть информации может быть утрачена без заметного на глаз ухудшения качества.
Noise - Шум. Ошибочная информация в сигнале приводящая к ухудшению изображения. Преимущество цифровых форматов перед аналоговыми заключается в том, что такие помехи можно полностью удалить, между тем появление шума возможно при компрессии.
Progressive Scan - Система развертки которая показывает все линии кадра за один проход.
Quantisation - Процесс удаления избыточной информации из видеопотока и управления компрессией.
Resolution - Размер изображения. Обычно указывается как размер ширины и высоты.
RGB - (Red, Green, Blue) - сокращение, обозначающее цветовую схему видеосигнала. Реально видимый оттенок на экране определяется соотношением трех основных цветов Красного, Зеленого и Синего.
Список литературы
Источники интернета:
http://ru.wikipedia.org - Википедиа - проект свободной многоязычной энциклопедии;
http://www.ixbt.com/divideo/codex-psnr.shtml - Сравнение видеокодеков при помощи метрики PSNR;
http://www.compression.ru/video/codec_comparison/ - Проведенные в МГУ сравнения видеокодеков;
http://zoom.cnews.ru/ru/publication/index.php?art_id80=343 - Разбираемся с форматами цифрового видео;
http://www.techdeal.ru/ - Системы безопасности;
http://www.stereo.ru/whatiswhat.php?article_id=225 -Носители цифрового видео;
http://www.compress.ru/Archive/CP/1999/10/16/#01 - Методы сжатия цифрового видео;
http://www.bhv.kiev.ua/books/book.php?id=8&book_id=225&content=2 – Краткий самоучитель работы на персональном компьютере (Глава 8: Звук, видео и графика);
http://broadcasting.ru/wiki/index.php - Энциклопедия@Broadcasting.ru;
http://www.mteleport.ru/print.aspx?id=19&tb=1 - Системы спутникового телевидения;
http://www.refodrom.ru/satellite_tv_the_author_marchuk_av/s/44439/1.7.html – Спутниковое телевидение;
http://www.diapaz.kz/source/tv_format.html – Форматы видеозаписи;
http://www.svcd.ru/docs/glossary/ - Глоссарий;
http://www.ovideo.ru/articles.htm – Статьи о видео;
http://itc.ua/article.phtml?ID=6185&IDw=45&pid=20 – Цифровое видео: обзор форматов;
http://rus.625-net.ru/625/1993/03/videom.htm – Видеомонтаж;
http://www.stereo.ru/whatiswhat.php?article_id=342 - Остановись, мгновенье! Ты прекрасно! (Часть вторая);
http://www.stereo.ru – Stereo&Video.