Важнейшее из искусств
АрхивВидеоКстати, а зачем вообще нужна высокая чёткость? Повышенное количество пикселей, следствием чего и является "высокая чёткость", - не единственное, и даже не главное в этом формате.
Кстати, а зачем вообще нужна высокая четкость? Повышенное количество пикселов, следствием чего и является "высокая четкость", - не единственное, и даже не главное в этом формате. На рис. 1 показано соотношение размеров экрана (предполагается, что размер элементарной ячейки у них одинаков) для трех форматов телевидения - стандартного ТВ (SDTV) с соотношением сторон 4:3, и двух реализаций ТВЧ с соотношением сторон 16:9 (720 и 1080 строк). Если разместить такие экраны на одинаковом расстоянии от глаз (что дает, очевидно, одинаковую четкость), то ТВЧ перекроют значительно больший процент поля зрения, тем самым приближаясь к кино. Считается, что экран в кинотеатре перекрывает 90% поля зрения, HDTV 16:9 - 70%, а SDTV при прочих равных всего 25%.
Первые передачи в формате HDTV осуществила японская компания NHK еще во время Олимпийских игр 1964 года. Понятно, что это был чистый эксперимент, хотя бы потому, что адекватных приемников тогда не существовало: на самых распространенных в те времена (и еще много лет спустя) телевизорах с небольшими экранами, 14–20 дюймов по диагонали и соотношением сторон 4:3, ТВЧ смотреть бессмысленно, так как придется либо обрезать изображение по бокам, превратив его в стандартное, либо сузить экран сверху и снизу, потеряв в четкости даже по сравнению с обычным форматом.
В 1980-е в Европе была разработана система HD-MAC, основанная на том же цифро-аналоговом спутниковом стандарте МАС, но формирующая изображение из 1225 строк, однако появление чисто цифрового ТВ помешало этой системе распространиться хоть сколько-нибудь широко. В середине 1990-х организации ATSC (США, Канада, Корея и еще ряд стран), DVB (Европа, Новая Зеландия, Австралия, Тайвань) и ISDB (Япония) приняли ряд стандартов цифрового ТВ (всего около двух десятков), в том числе пять стандартов ТВЧ: 1125i, 1080i, 1035i, 720p и 1080p (число означает количество строк). На практике используются три варианта HDTV: 720p, 1080i и в последнее время, в связи с распространением носителей Blu-ray, становится актуальным 1080p. А что означают буквы i и p?
Некоторые аббревиатуры
Термины, сокращения и аббревиатуры, относящиеся к видео и телевидению, столь многочисленны, что иногда можно встретить тексты на эту тему, почти сплошь из подобной абракадабры и состоящие. Далее расшифровывается только небольшая часть наиболее употребительных аббревиатур (еще некоторые объясняются в тексте статьи).
MPEG (Moving Picture Experts Group - экспертная группа по движущимся изображениям), название совместной рабочей группы международного комитета по стандартизации ISO и международной электротехнической комиссии IEC (официальное название группы - ISO/IEC JTC1 SC29 WG11). Этой же аббревиатурой стали называть разработанные группой стандарты сжатия видеоинформации. Всего их разработано шесть (от MPEG-1 до MPEG-4, а также MPEG-7 и MPEG-21), из которых на практике используются три: MPEG-1, MPEG-2 и MPEG-4 (MPEG-3 вошел составной частью в MPEG-2, а остальные существуют только в виде проектов).
MJPEG (Motion JPEG) - алгоритм для сжатия потока изображений в реальном времени. По сути представляет собой обычный JPEG, применяемый к каждому кадру в отдельности. Степень сжатия - в 5–10 раз. Например, сжатый таким способом формат SVHS даст поток примерно 4 Мбайт/с (30–40 Мбит/с). Наиболее эффективен для сжатия видео с небольшими значениями fps - 1–4 кадра/с.
AVI (Audio Video Interleave - чередование аудио и видео) - стандарт для представления озвученного видео, представленный Microsoft в 1992 году. Одна из реализаций RIFF-контейнеров (другой пример подобных контейнеров - звуковой формат WAV). Очень редко содержит несжатое видео, значительно чаще использует различные алгоритмы сжатия (от MJPEG до AVC).
SIF (Source Input Format - входной формат источника) - усеченный ТВ-формат, определенный в спецификациях MPEG-1, и существующий в двух вариантах: происходящий от NTSC 352х240, 30 fps, и от PAL 352х288, 25 fps, оба с прогрессивной разверткой. В компьютерном мире аналогом SIF стал QVGA 320х240. Не путать с CIF (Common Intermediate Format - общий промежуточный формат), 352х288, 30 fps, разработанным специально для видеоконференций по телефонным сетям ISDN, и определенным в стандарте ITU H.261.
VHS (Video Home System - домашняя система видео) - аналоговый формат записи видео на магнитную ленту, разработанный в 1976 году фирмой JVC. До 2003 года, когда впервые продажи DVD в США превысили продажи кассет VHS, считался самым популярным форматом домашнего видео. Имеет пониженное разрешение по горизонтали - 240 линий[Напомним, что телевизионная "линия" эквивалентна двумя рядам пикселов: собственно линии и промежутку до следующей, иначе линии будут сливаться.]. Усовершенствованный вариант - Super VHS, S-VHS, - имел увеличенное разрешение по горизонтали (до 420 линий, фактически - от 330 до 400), но не успел стать популярным, так как его вытеснили более совершенные цифровые форматы.
В 2001 году той же JVC был разработан формат Digital VHS (D-VHS), который был предназначен для записи видео на магнитную ленту. Этот формат так и не стал распространенным, а зря: на стандартную видеокассету можно было уместить 4 часа несжатого видео с разрешением 1080 линий! Однако пользователи предпочли более надежные и дешевые DVD.
VHS-C, S-VHS-C, Video 8, Hi-8 - стандарты аналоговой записи на мини-кассеты, разработанные специально для видеокамер. Последние два предназначены для записи на узкую (8 мм) ленту. Качество Video8 соответствует VHS, Hi-8 имеет увеличенное разрешение по горизонтали, соответствующее S-VHS.
Чересстрочные проблемы
Как мы помним, в аналоговом телевидении передача идет полукадрами с чересстрочной разверткой, что явилось следствием компромисса между необходимостью, с одной стороны, уменьшить полосу частот, с другой - обеспечить немерцающее изображение на экране кинескопа. Но компьютерные мониторы, даже традиционные на основе ЭЛТ, ничего про чересстрочность "не знают": в них используется прогрессивная развертка, когда все строки кадра выводятся за один раз (это не говоря уж о плоских, где понятие развертки вообще практически теряет смысл)[Большинство ЭЛТ-мониторов чересстрочный режим все же понимали, хотя различий в принципе развертки для разных режимов не было, просто для чересстрочного режима требовалось установить больший размер изображения по вертикали, чтобы полукадр занимал не половину экрана, а полный его размер, при этом сдвиг между полукадрами автоматически обеспечивался сигналами кадровой синхронизации. - С.Л.]. Буквы i и p в упомянутых стандартах ТВЧ и обозначают - первая чересстрочную развертку (interlacing), вторая - прогрессивную (progressive).
При приеме аналогового ТВ на цифровой монитор приходится как-то превращать чересстрочную развертку в прогрессивную - или, как говорят, производить деинтерлейсинг (deinterlacing). Лобовое решение заключается в объединении двух полукадров (полей) в один полный кадр, который и выводится на экран. Но такое простое решение на деле оказывается самым плохим и более-менее проходит лишь для небольших экранов (порядка 14 дюймов и менее). Дело в том, что при даже не слишком быстром движении объекта в поле зрения камеры соседние полукадры начинают отличаться друг от друга: начало первого полукадра от начала второго при 25 fps отстоит по времени на 40 мс; легко подсчитать, что при скорости объекта 1 м/c (спокойно идущий человек), он успевает за это время сдвинуться на 4 см. Поэтому простое объединение полей приводит к образованию так называемой гребенки на границах движущихся объектов, особенно заметной в динамичных сценах.
По этим причинам устройства преобразования чересстрочной развертки в прогрессивную (деинтерлейсеры) используют различные способы сглаживания: простейшим из них является усреднение между полукадрами (Motion Adaptive Deinterlacing), в более продвинутых системах используется способы синтеза изображений с предсказанием движения. Это особенно важно при демонстрации фильмов, где на все эти проблемы накладывается еще и необходимость как-то синхронизировать 24-герцовую частоту повторения кинокадров с 60-герцовой (или более высокой) частотой обновления экрана дисплея. Соответствующая "технология распознавания фильмов" в технических характеристиках телевизоров обозначается, как "режим 3/2 - 2/2 Motion Pull Down".
Все эти ухищрения ничего хорошего в смысле качества картинки не приносят - любой способ деинтерлейсинга и подгонки частоты кадров размывает изображение и приводит к потере четкости.[Кроме всего прочего, в свете сказанного становится понятной бессмысленность приобретения широко рекламируемых 100-герцовых телевизоров: все равно исходные полукадры идут с частотой 50/60 Гц, а преобразования лишь ухудшают картинку даже при самом современном аппаратном обеспечении, причем в том, что в каждый такой телевизор установлено именно "самое современное аппаратное обеспечение", существуют понятные сомнения.] Соответствующие исследования показали, что человеческое зрение лучше приспособлено к четким стробоскопичным изображениям, которые показываются друг за другом с достаточной скоростью, чем к постепенно перетекающим друг в друга размытым картинкам (это, кстати, объясняет феномен ухудшения качества движущихся изображений на ЖК-дисплеях по сравнению с ЭЛТ, даже если время реакции ячейки формально достаточно для отображения кадров с частотой 50 или 60 Гц). В современные видеопроцессоры даже закладывают возможность синхронного выключения подсветки между кадрами или отображения каждого второго кадра темным - как показали эксперименты, это значительно увеличивает четкость, хотя, естественно, порождает иные проблемы: снижение яркости, стабильности цветопередачи и т. п.
Заметим, что 1080i и 720p при одинаковой частоте повторения полей дают примерно одинаковый поток данных: в 1080i 1920 точек по ширине дают 2-мегапиксельную картинку на каждый кадр, получается примерно 1 мегапиксел на каждое поле; в 720р по горизонтали укладывается 1280 точек, что также дает около 1 мегапиксела, и с этой точки зрения они одинаковы. Однако есть формальный критерий, так называемый kell-фактор, согласно которому разрешение i-режима по вертикали составляет 70% от номинального. То есть для 1080i фактическое разрешение составит около 750 строк! Кроме того, эксперименты показали, что с увеличением степени сжатия MPEG, качество изображения формата 1080i деградирует быстрее, чем 720p. Потому в конечном счете 1080i однозначно выигрывает в качестве только для неподвижных изображений, а в динамичных сценах 720р оказывается даже впереди, с учетом несовершенства существующих систем деинтерлейсинга.
По этим причинам выбор между чересстрочным стандартом 1080i и прогрессивным 720p оказывается, мягко говоря, неоднозначным. Очевидный с точки зрения повышения качества режим 1080p используется фактически лишь на носителях Blu-ray (и не факт, что во всех записях), а в эфирном вещании в обозримом будущем придется выбирать из двух зол. И не глупо ли усложнять аппаратуру всякими "чересстрочностями", если компьютерные дисплеи изначально были заточены под прогрессивную развертку?
Оказывается, нет, для кое-кого совсем не глупо - как и в случае с мегапикселами фотоматриц или - еще недавно - с гигагерцами тактовой частоты процессоров, большая цифра лучше продается. И хотя Европейский союз вещателей (EBU) рекомендовал для использования в Европе HD-формат 720p, считая это наиболее эффективным и экономически оправданным, большинство вещателей выбрали формат 1080i.
Еще хуже обстоят дела с так называемым up conversion - преобразованием стандартного чересстрочного ТВ-сигнала с 525 или 625 строками в 1080 строк современных приемников. Большинство имеющихся на рынке плоских телевизоров выполняют такое преобразование, особенно при приеме эфирного сигнала, из рук вон плохо, в результате чего без особого раздражения на них можно лишь воспроизводить DVD, а новости лучше посмотреть на кухонной ЭЛТ-малютке десятилетнего возраста. И пока цифровое ТВ не станет реальностью, данной нам в ощущениях, для просмотра только лишь эфирных программ приобретать HD-телевизор с большим экраном нет никакого смысла (и тем более это касается недоносков с логотипом "HDTV Ready").
Ну, милая, еще капельку…
Теперь вернемся с цифровому телевидению, как таковому - как мы уже говорили, без сжатия его использовать нереально даже в случае обычного SDTV, а для HDTV все объемы и скорости еще в 3–6 раз выше. Для начала разработчики методов сжатия попытались урезать ТВ-картинку вдвое по вертикали и горизонтали[При переходе от аналогового к цифровому ТВ оригинальные PAL 625 и NTSC 525 были усечены до 576 и 480 строк соответственно, что соответствует реально показываемому количеству строк в аналоговом ТВ.] (что сокращает количество данных вчетверо), в результате чего возникло два стандарта под общим названием SIF: 352х240, 30 fps и 352х288, 25 fps (второй используется чаще). Но как вы уже могли убедиться, это не решает проблему принципиально: первым носителем цифровых форматов ТВ был обычный компакт-диск, в котором скорость чтения данных в те времена была ограничена 150 Кбайт/с (1,2 Мбит/с).
Так в 1992 году возник стандарт MPEG-1, который стал основным для записи фильмов на стандартный CD (Video CD). При скоростях передачи данных около 1,15 Мбит/с MPEG-1 по качеству сравним с аналоговым VHS, а один полнометражный фильм в этом формате умещается на два CD. В MPEG-1 были заложены и большие разрешения, чем SIF (с соответствующим увеличением потока данных), но на практике использовался только урезанный стандарт.
Метод сжатия в MPEG-1 основан на том, что полностью записывается лишь один опорный кадр (I-кадр, Intra frame) из группы примерно в десять кадров. Слово "полностью" тут, правда, тоже не совсем уместно, так как I-кадры сами по себе сжимаются алгоритмом JPEG, то есть с потерями информации. Но с промежуточными кадрами поступают еще хуже: в так называемых P-кадрах (Predirected frame) сохраняются лишь предсказанные специальным алгоритмом изменения по сравнению с предыдущими и последующими I-кадрами. А для того, чтобы сгладить ошибки предсказания движения, между этими кадрами вставляют еще более грубые B-кадры (Bidirectional frame), которые сохраняют интерполированные значения между двумя I- или P-кадрами. P-кадры в среднем имеют объем втрое меньший, чем I-кадры, а B-кадры еще примерно в 2,5 раза меньше. Типовой порядок следования кадров примерно такой: IBBPBBPBBIBBPBBPBB...
Из-за того, что предсказание движения в MPEG-1 производится не для каждого пиксела, а для блоков размером 8х8, типичным искажением был, например, распад однотонной заливки на квадратики. В сочетании с урезанным вдвое разрешением качество ТВ-картинки оставляло желать лучшего (но при этом, как ни странно, качество передачи цвета было даже выше, чем у аналогового VHS). Добрым словом следует помянуть MPEG-1 только в одном отношении: именно для него был разработан знаменитый способ кодирования звука MPEG-1 Layer 3, который позднее зажил своей жизнью под именем МР3 и стал своеобразным символом наступления "цифрового века".
В эфирном цифровом вещании MPEG-1 не употреблялся никогда. В 1995 году был создан стандарт MPEG-2, свободный от ограничения по скорости передачи в 150 кбит/с и предусматривающий поток данных 3–15 Мбит/с (а в некоторых вариантах повышенного качества и до 80 Мбит/с). По принципу устройства MPEG-2 аналогичен MPEG-1, но рассчитан, во-первых, на кодирование полного ТВ-формата (а не урезанного SIF), в том числе и ТВЧ, во-вторых, на передачу шестиканального звука вместо стерео. Считается, что MPEG-2, начиная со сжатия до 15 Мбит/с, по качеству аналогичен студийному SDTV.
При этом, как ни странно, степень сжатия в MPEG-2 в общем случае значительно выше, чем в MPEG-1. Здесь долго перечислять все ухищрения, которые позволили добиться такого эффекта (к тому же MPEG-2 не фиксирует конкретные алгоритмы сжатия, которые могут дорабатываться фирмами самостоятельно, и различные кодеки MPEG-2 могут давать заметно различающиеся результаты). В качестве иллюстрации используемых приемов приведем такой: из исследований комитета MPEG выходило, что 95% видеоданных так или иначе повторяется в разных кадрах. Соответственно, на место повторяющихся участков при воспроизведении можно подставить один-единственный оригинальный фрагмент - практически без ущерба для качества. И подобных нововведений в этом стандарте - десятки.
Наибольшее распространение MPEG-2 получил для записи фильмов на DVD, но не только: сейчас это базовый стандарт сжатия и для спутникового ТВ, и для эфирного цифрового вещания. В частности, MPEG-2 позволяет вместить в полосу стандартного спутникового транспондера (38 Мбит/с) пять-шесть каналов вещания SDTV или один-два канала HDTV. Увы, существенного повышения качества эфирной картинки от цифрового ТВ (пока) ждать не следует.
Правда, стандарт MPEG-4, могущий обеспечить лучшее качество, быстрыми темпами вытесняет MPEG-2. MPEG-4 представляет собой язык управления контентом, в котором массивы и потоки данных представлены в виде медиа-объектов. В частности, если в MPEG-1/2 предсказание движения осуществляется для жестко заданной группы пикселов (например, для квадратика 8х8), то в MPEG-4 такое предсказание может делаться для объекта произвольной формы (например, для человеческой фигуры целиком).
Подобные приемы в теории позволяют уместить на обычный CD полнометражный телефильм с качеством не хуже DVD. На практике же все зависит от реализации; кроме того, MPEG-4 требует и для сжатия, и для воспроизведения гораздо больше вычислительных ресурсов. Тем не менее по крайней мере один вариант реализации MPEG-4 уже завоевал популярность: это MPEG-4 Part 10 (ISO 14496-10), он же ITU H.264, известный еще как Advanced Video Coding.
Итог всех наших рассуждений: современному телевидению еще расти и расти. Разумеется, проблемы постепенно решаются, трудности преодолеваются, качество обработки растет и т. п. и т. д. Но все же не стоит думать, что любой современный телевизор однозначно лучше любого старого. Увы, пока это не совсем так.
Некоторые аббревиатуры
Video CD (VCD) - формат записи цифровых компакт-дисков с видеоинформацией и звуком (с поддержкой меню). Первая версия предложена в 1993 году фирмами Philips и JVC. Использует стандарт сжатия MPEG-1 с фиксированной скоростью потока 1,15 Мбит/с и размером кадра 352х288 (25 fps) или 352х240 (24 или 30 fps). Звук - один стереоканал или два моно. Позднее был разработан формат SVCD (Super VCD), предполагающий использование MPEG-2 с потоком (переменным) до 2,6 Мбит/с и размерами кадра до 576х480.
DVD (Digital Versatile Disk - цифровой универсальный диск) - оптический носитель информации. Под названием DVD также часто понимают совокупность способов записи видео на этот носитель. Видео на DVD может записываться в различных форматах, в основном использующих сжатие MPEG-2 (PAL/SECAM - 720х576 25 fps, NTSC - 720х480 30 fps) с переменным потоком 2–9 Мбит/с. При этом фильм с высоким качеством умещается на один двухслойный (или два однослойных) диска.
miniDV, Digital 8 - варианты формата высококачественной цифровой записи DV (Digital Video), используются в видеокамерах с магнитной лентой в качестве носителя. Почти идентичны по характеристикам, имеют горизонтальное разрешение 500 линий (miniDV использует кассету 6,35 мм, Digital 8 - 8 мм). Видео записывается в сжатом формате, аналогичном MJPEG, то есть независимо для каждого кадра. Усовершенствование по сравнению с MJPEG состоит в том, что коэффициент сжатия может быть переменным в пределах одного кадра: критичные области картинки сжимаются с меньшим коэффициентом, а второстепенные - с большим. При задании соответствующих характеристик сжатия (примерно 1:5) DV-форматы могут быть визуально неотличимы от несжатого видео, и практически не теряют качества при последующем монтаже, поэтому запись оригиналов рекомендуется вести именно в этих форматах.
ASP (Advanced Simple Profile, расширенный простой профиль) - часть стандарта MPEG-4 (Part 2), которая обычно и понимается под MPEG-4. В настоящее время постепенно вытесняется более качественным, но требующим более дорогого оборудования AVC/H.264 (см. далее).
DivX - название одного из популярных кодеков (программ, производящих компрессию/декомпрессию изображения) для стандарта MPEG-4/ASP. Первоначально такой кодек разрабатывала Microsoft, затем бросила, а хакеры доработали оказавшуюся в их распоряжении бета-версию, самая популярная открытая модификация которой известна, как DivX 3.11. Позднее разработчики DivХ 3.11 организовали собственную фирму DivX Networks, во избежание патентных сложностей полностью переписали код, и коммерциализировали свой продукт (версии DivX 5 и выше).
AVC (Advanced Video Coding - продвинутое видеокодирование, иначе известен как ITU H.264) - часть стандарта MPEG-4 [Part 10], определяющая один из самых качественных форматов записи видео при достаточно большой степени сжатия - примерно в два раза по сравнению с MPEG-2 при субъективно одинаковом качестве. Большее сжатие (или лучшее качество при той же степени сжатия) обеспечивается за счет возрастания необходимых вычислительных ресурсов для декодирования. AVC/H.264 заявлен как основной стандарт для носителей Blu-ray. О готовности к переходу на вещание HDTV по спутниковым каналам в стандарте AVC/H.264 вместо MPEG-2 объявили практически все европейские операторы. Соответствующая система спутникового вещания носит название DVB-S2, и, вероятно, к ней присоединится и Россия.