Cолнечные собачки не кусаются
АрхивСудя по анонсам, новейший суперускоритель Parhelia от Matrox Graphics обещал совершить очередную революцию среди графических чипов - благодаря первому в мире 512-разрядному GPU с 80 миллионами транзисторов, 256-разрядному интерфейсу памяти, технологии GigaColor и другим наворотам. И вот карта оказалась в нашей лаборатории…
Судя по анонсам, новейший суперускоритель Parhelia 1 от Matrox Graphics обещал совершить очередную революцию среди графических чипов - благодаря первому в мире 512-разрядному GPU с 80 миллионами транзисторов, 256-разрядному интерфейсу памяти (при частоте 600 МГц DDR это дает теоретическую пропускную способность до 20 Гбайт/с!), технологии GigaColor и другим наворотам (подробности см. в «КТ» #445). И вот карта оказалась в нашей лаборатории…
«Железо» и софт
Первое, что на что обращаешь внимание, глядя на Parhelia-512, - необычное расположение микросхем памяти. Они сгруппированы попарно, и две верхние пары расположены под углом к GPU. Это сделано для сохранения примерно равного расстояния от них до видеопроцессора. Память в BGA-упаковке (DDR SGRAM от Infineon) маркирована как 3,3 нс и работает на тактовой частоте 275 МГц (то есть 550 МГц DDR, хотя обещали 600). Приняв во внимание 128-битную шину и двухканальную архитектуру ОЗУ, нетрудно подсчитать, что теоретически пиковая пропускная способность равна 17,6 Гбайт/с. Огромное число. Видимо, оно произвело такое сильное впечатление на инженеров Matrox, что они не сочли нужным оптимизировать работу с памятью. Кроме того, было официально заявлено об отсутствии поддержки чипом режима AGP 8x. Впрочем, реальной разницы между 4х и 8х еще довольно долго не будет видно.
Карта оснащена двумя разъемами DVI-I - самыми универсальными из всего семейства. Для использования обычного VGA-интерфейса в комплект включен переходник DVI-VGA. Прибегнуть к его помощи придется и при выводе сигнала на TV. Также имеется разветвитель DVI на два VGA-разъема, необходимый при включении функций TripleHead Desktop и Surround Gaming. За вывод сигнала через DVI-коннекторы отвечают трансмиттеры CH7301A-T производства Chrontel. Но самое впечатляющее скрыто под кулером - чип GPU, прикрытый металлической крышкой. Он ОГРОМЕН. Такова цена за 80 миллионов транзисторов при 0,15-микронном производственном процессе. В целом исполнение карты оставляет приятное впечатление. Большое количество элементов, призванных повысить надежность и качество, серьезно усложнили разводку. Очевидно, разработчикам пришлось постараться, чтобы «главное солнце» Matrox продолжало светить ярче всех.
Основу пользовательского интерфейса драйвера карты составляет утилита PowerDesk. Она красива, удобна и функциональна (именно в таком порядке). Для педантов, привыкших начинать знакомство с новым устройством с внимательного чтения инструкции, имеется Мастер (куда же теперь без них?), помогающий разобраться во всех настройках. К сожалению, в жертву простоте была принесена детальность. Впрочем, большей части пользователей вполне хватит предоставляемых возможностей.
В работе драйвер показал себя достаточно надежным продуктом. Лишь однажды (при переключении из режима вывода изображения на три монитора в стандартный режим) видеокарта залила экран голубым цветом и выдала сообщение о неустранимой ошибке, повесившей систему намертво. Есть, правда, один постоянно возникающий глюк, связанный с фирменной технологией шестнадцатикратного фрагментного сглаживания (16x Fragment Antialiasing - FAA-16x). Но об этом ниже.
Кроме драйвера в комплект поставки входят демонстрационные программы. И первая среди них, безусловно, Reef Demo - «Один день из жизни рифа». Это - потрясающие виды морского царства, при рендеринге которых используются эксклюзивные технологии Parhelia, и красавица акула - одно из главных действующих лиц подводного представления. Terrain Demo от Westwood Studios позволяет просматривать сложные рельефы и даже менять в реальном времени некоторые характеристики модели (например, варьировать высоту гор, включать/выключать тени от облаков и т. д.)
Есть и более полезные утилиты. Очень хорошее впечатление оставила система калибровки изображения Coloreal производства Waytech. К тому же программа умеет работать с десятибитным каналом цвета, а потому способна полностью контролировать два цифро-аналоговых преобразователя (RAMDAC), интегрированных в чип Parhelia-512. Они используют технологию GigaColor, которая позволяет отводить на каждый канал цвета по десять бит вместо стандартных восьми. Для использования все той же GigaColor в популярном Adobe Photoshop поставляется специальный plug-in.
Вниманию любителей игрушек предлагается демо-версия Imperium Galactica III: Genesis. Не очень много света и цвета и не самая простая геометрия. Но выглядит красиво. Плюс неизменные звуки выстрелов и взрывов в космосе, о которых уже не раз говорилось.
Из заметного софта осталось упомянуть, пожалуй, только бенчмарк от Matrox - SharkMark, тестирующий работу видеокарты с вершинными шейдерами. По понятным причинам относиться к его результатам всерьез не стоит - тут Parhelia легко вырвалась вперед (примерно 50% преимущества над ближайшим конкурентом - GeForce 4 Ti4600).
Тестирование
Для испытаний новинки использовался процессор Intel Pentium 4 2 ГГц на плате Intel D845BG с 2х256 Мбайт памяти PC2100 от Samsung (CL2.5), Creative SB Live! Player 5.1 и винчестер IBM DTLA-307030 с установленной Microsoft Windows XP Professional. Для сравнения были выбраны ATI Radeon 8500 и ASUS V8460.
Таблица 1. Сравнение основных характеристик конкурентов.
Параметр |
Parhelia-512 |
Radeon 8500 |
GF4 Ti 4600 |
Производственный процесс GPU, мкм |
0,15 |
0,15 |
0,15 |
Разрядность GPU, бит |
512 |
256 |
256 |
Количество транзисторов, млн. |
80 |
60 |
63 |
Частота GPU, МГц |
220 |
275 |
300 |
Частота памяти, МГц |
275 |
275 |
375 |
Объем памяти, Мбайт |
128 |
128 |
128 |
Разрядность/тип памяти, бит |
256/DDR |
128/DDR |
128/DDR |
Пиковая пропускная способность памяти, Гбайт/с |
17,6 |
8,8 |
12 |
Версия DirectX |
8/9 |
8.1 |
8 |
Версия вершинных шейдеров |
2.0 |
1.1 |
1.1 |
Количество вершинных шейдеров |
4 |
1 |
2 |
Версия пиксельных шейдеров |
1.3 |
1.4 |
1.3 |
Количество конвейеров рендеринга |
4 |
4 |
4 |
Количество текстурных модулей на конвейер |
4 |
2 |
2 |
Версия драйвера |
1.00.04.231 |
Catalyst 2.1 |
Detonator 29.42 |
Как видно из табл. 1, по части технических характеристик Parhelia не теряется на фоне признанных лидеров. А вот в популярных тестах все оказалось немного по-другому. Посмотрим на результаты DirectX-теста 3DMark 2001 SE (табл. 2). Не считая провала в Point Sprites и, мягко говоря, невыразительной работы с пиксельными шейдерами, Parhelia показывает неплохие, но и не рекордные цифры. Правда, если вспомнить архитектуру чипа, результаты предстают в несколько ином свете. Например, при использовании режима мультитекстурирования Matrox вырывается в лидеры, но отрыв от преследователей минимален. И хотя рабочая частота ядра Parhelia составляет лишь 220 МГц (против 275 или 300 у конкурентов), не забывайте, что у продуктов ATI и Nvidia работает формула 4x2 (количество конвейеров рендеринга, помноженное на количество текстурных блоков на конвейер), а у новичка - 4x4. Нетрудно подсчитать, что пиковое значение равно 3520 MTex/s, и показанный результат (2391,5 MTex/s) весьма далек от идеала. Удручающие 70%. Неужели опять софт не соответствует возможностям «железа»? Впрочем, данные этого теста все же ближе к теории, чем к практике, а как новичок поведет себя в реальных играх, могут показать лишь сами игры, к тестированию которыми и перейдем.
Таблица 2. Результаты тестовой программы 3DMark 2001 SE build 330.
Тест |
Parhelia-512 |
Radeon 8500 |
GF4 Ti 4600 |
Fillrate - Single-Texturing, MTexels/s |
752,3 |
813,7 |
1024,4 |
Fillrate - Multi-Texturing, MTexels/s |
2391,5 |
2053,1 |
2321,4 |
High Polygon Count - 1 Light, MTriangles |
25,2 |
39,6 |
50,9 |
High Polygon Count - 8 Light, MTriangles |
11,1 |
9,5 |
12,6 |
EMBM, FPS |
119,2 |
109,9 |
150,1 |
DOT3, FPS |
101,8 |
95,7 |
152,3 |
Vertex Shader, FPS |
90,4 |
91,7 |
97,7 |
Pixel Shader, FPS |
67 |
103,2 |
120,9 |
Advanced Pixel Shader, FPS |
73,3 |
82,1 |
94,1 |
Point Sprites, MSprites/s |
13,9 |
26,8 |
30,4 |
3Dmarks |
7604 |
8923 |
10891 |
Чтобы не перегружать обзор, приведу данные о производительности только в Max Payne и «старичке» Quake 3: Arena, выбор на которые пал по двум причинам. Во-первых, результаты в них достаточно точно отражают взаимоотношения видеокарт. Во-вторых, эти игры представляют два самых популярных на сегодняшний день API - DirectX и OpenGL. Глядя на диаграммы, невольно напрашивается грустная шутка: Parhelia заняла почетное третье место, Radeon 8500 пришел предпоследним. Эти реальные данные отличаются от оптимистичной «теории», выданной 3DMark’ом. Parhelia заметно проигрывает обоим конкурентам. В DirectX-играх ситуация немного лучше, но и здесь Radeon 8500 на 5-10% опережает «собачью упряжку».
1 (обратно к тексту) - Parhelia (паргелии) - это природное явление, которое англичане поэтично называют Sundogs («солнечные собачки»). Оно представляет собой светлые пятна на небе по обе стороны от Солнца, возникающие вследствие преломления лучей в ледяных кристаллах, взвешенных в атмосфере. Таким образом, наблюдатель видит сразу как бы три солнца. По мнению Matrox, название нового продукта символизирует гармоничное сочетание в нем трех важнейших черт: высокой производительности, улучшенного качества визуализации и фирменных технологий. Причем «центральное солнце» символизирует качество, которое должно стать визитной карточкой графических ускорителей на этом чипе.
Впрочем, по заверениям Matrox, «производительное солнце» должно засветить по-настоящему в условиях, несколько отличающихся от стандартных. А именно - при включенных анизотропной фильтрации и антиалиасинге. Первая функция должна повысить четкость картинки, а вторая - избавить от раздражающего эффекта «лестницы» по краям объектов. И то и другое повышает качество выводимого изображения, работая на «главное солнце».
Напомню, что общепринятого (математического) определения анизотропии не существует. ATI вообще исповедует принцип «умной» анизотропии. Эта функция выключается драйвером автоматически, если он «решит», что ее применение в данный момент нецелесообразно. Именно этой «недобросовестностью» и объясняется довольно «дешевая» (с точки зрения производительности) анизотропия в исполнении Radeon 8500. Учитывая вышесказанное, до дальнейшего тестирования продукт от ATI не допускается.
Как правило, GeForce4 Ti 4600 при включении анизотропии LV2 (а в Q3 даже LV8 при 1280x1024) показывает результаты выше, чем Parhelia при стандартных настройках. А производительность чипа Nvidia при LV8 немного, но все же лучше, чем производительность чипа Matrox при включенной анизотропии (см. диаграммы внизу). Сразу вспоминаются результаты тестов мультитекстурирования. Похоже, часть драйвера, ответственная за работу с 64 Super Sample Texture Filtering, требует серьезной доработки. Зато качество анизотропной фильтрации Parhelia практически идентично качеству фильтрации LV2 GeForce 4.
Теперь об эффекте «лестницы» по краям объектов и методах борьбы с ним. Появляется он во многом благодаря дискретной природе нынешних устройств отображения. Если край объекта не совпадает с рядом или колонкой составных частиц устройства, то некоторые промежуточные точки края приходится сдвигать в ближайшую ячейку, что и создает эффект ступенчатости.
Бороться с этим можно по-разному. Например, уменьшить шаг между точками на экране (как правило, повышением разрешения). Глаз не замечает переломов линий при достаточно малых расстояниях между ячейками, но уменьшение шага точки значительно повышает стоимость продукта, к тому же существуют некоторые технологические ограничения. А можно ячейки, соседствующие с точкой перелома, закрасить специальным цветом. Правда, процесс его получения довольно трудоемкий: приходится выполнять рендеринг сцены в более высоком разрешении, а затем выбирать цвет отображаемого пикселя как среднее значение между несколькими пикселями изображения в более высоком разрешении. Эффект ступенчатости исчезает, но появляется размытость, которая порой мешает разглядеть мелкие детали. К недостаткам такого способа относится и колоссальное увеличение объема вычислений, не терпящих отлагательства. Примерно в этом состоит суть стандартных способов полноэкранного сглаживания (FSAA), используемых Parhelia и GeForce 4, - SuperSampling (SS) и MultiSampling (MS). Последний представляет собой несколько усовершенствованную версию первого - в основном улучшения касаются экономии пропускной способности памяти.
Но есть и фирменные технологии. У Nvidia таковой является Quincunx. Не вдаваясь в подробности, скажу, что, по сути, это эволюция MultiSampling’a, позволяющая по качеству приблизится к четырехкратному FSAA при производительности, близкой к двукратному. А вот в Matrox представили свой революционный метод - 16x Fragment Antialiasing (FAA-16x) - шестнадцатикратное фрагментное сглаживание. Зачем обрабатывать все изображение, когда можно вплотную заняться только краями объектов? Применение этого «умного» метода теоретически обещает потрясающее качество при небольшом падении производительности, так как края объектов составляют лишь незначительную долю изображения. К тому же, не затрагивая внутренностей полигона, мы уменьшаем размытость изображения. Но хватит теории, давайте посмотрим на практику.
В наших тестах (полные тесты см. в обзоре на www.ferra.ru/online/video/19536) GeForce4 Ti 4600 при использовании Quincunx показывает результаты лучше, чем Parhelia при стандартных настройках. И хотя монстр от Nvidia и здесь одержал верх, результаты применения нового метода сглаживания впечатляют. При качестве даже несколько лучшем по сравнению с четырехкратным полноэкранным сглаживанием, потери в производительности примерно вдвое меньше, чем при применении MSAA (про SSAA и говорить не стоит). Особенно это заметно на высоких разрешениях, когда лавина избыточной информации с головой накрывает GPU, использующий старый метод.
О качестве можете судить по скриншотам в упомянутом обзоре. Впрочем, с реализацией этой новинки не все гладко. Присмотритесь, например, к линии рукоятки пистолета, которая осталась несглаженной. Это недостаток интеллектуального метода. Он не всегда способен правильно определить объекты для обработки. Вероятно, для реализации антиалиасинга создается некий буфер, в который заносятся пиксели, требующие обработки. А вот как определить, какие пиксели принадлежат краю (границе) объекта, а какие нет? Опять-таки, скорее всего это происходит на стадии перехода от виртуальной трехмерности (когда сцена представлена вершинами и всем, что необходимо для корректного формирования изображения, - текстурами, нормалями и т. д.) к псевдотрехмерности двухмерного пространства. На этом этапе формируются полигоны, и можно отследить, какой из пикселей образует край полигона, а какой лежит внутри него.
К сожалению, этот механизм не всегда срабатывает. Например, при использовании так называемого трафарета метод FAA-16x не способен «заметить» ступенчатость. Тем не менее, фрагментное сглаживание является, пожалуй, самой эффектной и, что более важно, эффективной технологией нового чипа. Если удастся разрешить проблемы с опознаванием целей для сглаживания, FAA-16x может стать новым стандартом индустрии. Простота такого метода позволит использовать сглаживание потрясающего качества даже на видеокартах умеренной производительности.
Для полноты картины осталось сказать пару слов о востребованности антиалиасинга. Экстремальные игроки, ценящие каждый FPS, предпочтут не включать эту функцию. Даже на разрешениях 1024x768 и выше, отстреливая монстров в темпе ошпаренной кошки, трудно заметить разницу между сглаженным изображением и обычным. А тем более - между Quincunx и 4x или FAA-16x. А вот любителям чего-нибудь поспокойнее (например, стратегий) эта функция наверняка придется по душе.
При попытке получить максимальное качество изображения (фрагментное сглаживание одновременно с анизотропной фильтрацией, см. крайнюю правую диаграмму тестов) Parhelia лучше чувствует себя на более высоких разрешениях (благодаря преимуществу FAA перед MSAA), а также при работе в DirectX-приложениях. Разница между ней и GeForce4 Ti 4600 практически незаметна. Однажды ей даже удалось вырваться вперед на разрешении 1280x1024.
Немного о фирменных технологиях
Пока мы не успели остыть от сглаживания ступеней (каламбур), напомню еще об одной интересной инновации от Matrox в этой области - функции Glyph Antialiasing. Ее включение задействует аппаратную реализацию сглаживания шрифтов. В принципе, при стандартных настройках аппаратное сглаживание ничем не отличается от программного, предоставляемого операционной системой Windows XP. Но отличает эту функцию возможность гамма-коррекции, регулировка которой теперь доступна. Использование же гамма-коррекции позволяет выбрать наиболее подходящий вид отображения шрифтов.
Зачастую новые технологии направлены не на массового потребителя, а на относительно небольшой круг профессионалов. Пожалуй, именно так обстоит дело с функцией TripleHead Desktop. Для обычного пользователя в ней ничего интересного нет. А вот дизайнеру, редактору и другим людям, которым не хватает площади одного и даже двух мониторов, эта новинка явно понравится. Максимальное разрешение 3840x1024 при 32-битном цвете. Вы мечтали об этом, дамы и господа!
Зато другая технология, тоже связанная с использованием трех мониторов, Surround Gaming, адресована не профессионалам или массовому пользователю, а игрокам-энтузиастам. Игровая обстановка делится между тремя мониторами таким образом, чтобы крайние выводили информацию для периферийного зрения игрока (по крайней мере так должно быть по задумке Matrox).
Честно говоря, режим Surround Gaming не слишком впечатлил. Боковые мониторы дают некоторое дополнительное ощущение погружения в игру, однако воспринимаются скорее пятнами по бокам, нежели дополнительным источником информации. А поскольку угол обзора на центральном мониторе уменьшается, игра превращается в муку. Можно легко заблудиться в трех соснах. Буквально. Есть и еще один неприятный момент. Для включения этого режима в играх на движке Quake3 нужно вручную проделать весьма витиеватую процедуру по изменению системного реестра и конфигурационного файла игрушки (подробности см. на www.ferra.ru/online/video/19536). Возможно, позже появятся специальные утилиты для этого.
Разговор про двухголовость Matrox не имеет смысла: ее реализация практически идеальна. Доступны все стандартные режимы независимого вывода, клонирования и растягивания изображения на оба монитора. Качество картинки выше всяких похвал. Кто-нибудь ожидал иного? Разговора про TV-Out и проигрывание DVD тоже не получится - нет слов, одни восторженные восклицания. На том позвольте закончить этот раздел.
Перспективы на рынке
Подведение итогов начнем с маркетинговой политики Matrox. На данный момент существует два варианта поставки Parhelia: Retail и OEM. Отличаются они только частотами работы ядра/памяти. 220/275 МГц DDR для Retail-упаковки (как нетрудно догадаться, именно этот вариант мы только что и протестировали) и 200/250 МГц DDR. Соответственно, отличаются и цены - $399 и $349 (возможно). Поставки начались в августе. В дальнейшем планируется поставлять также версии с 64 и 256 Мбайт локальной оперативной памяти и более высокочастотные варианты.
Первое, что бросается в глаза при рассмотрении результатов испытаний, это - Качество. В Matrox добились своего. Духом Качества пропитано практически все, связанное с Parhelia, начиная от исполнения карты и заканчивая выходным сигналом. Вот только быстродействие подкачало… В принципе, канадцы и не обещали выпустить эдакого убийцу GeForce4 Ti, но «думали» они об этом слишком громко. В самом деле, чего еще можно было ожидать от чипа с такими фантастическими характеристиками? Сейчас же в Matrox подчеркивают, что новый продукт не является игровым решением.
Несмотря ни на что, Parhelia удалась. Если вспомнить о производительности последних продуктов от Matrox, например G550 (который не дотягивал даже до GeForce2 MX), становится очевидным огромный шаг компании вперед.
Между тем, возвращаясь к производительности, нельзя не отметить некоторые странные результаты: посредственное использование четырех текстурных блоков, низкая производительность в тестах пиксельных и вершинных шейдеров и недоработки с режимом FAA-16x. Надеюсь, связано все это с драйверами. Нередко на начальном этапе производитель отключает часть блоков чипа: работающий не на пределе своих возможностей продукт оставит лучшее впечатление, чем поддерживающий все функции, но постоянно вводящий систему в ступор. Будем надеяться, что в следующих версиях драйверов мы увидим всю мощь формулы 4x4 и Quad DX9 Vertex Array, а также идеальную работу великолепного метода сглаживания от Matrox.
Что же касается фирменных технологий, то массового пользователя ими не заманишь. Технология GigaColor, похоже, останется невостребованной. Весьма спорная формула 30+2 (альфа-канал) вместо стандартной 24+8 вряд ли найдет поддержку у конкурентов, которые, вероятнее всего, обойдутся без переходного состояния, сразу же освоив 64-битный цвет. Пользователям лишние цвета не нужны - они их просто не увидят. А программистам уже не хватает двух бит, оставленных альфа-каналу. Наиболее интересная в этом смысле функция Surround Gaming нацелена именно на энтузиастов. Ведь придется приобретать еще два монитора, искать место для них… И это ради неоднозначной технологии. Не многие отважатся.
Так что говорить о триумфальном возвращении Matrox на сцену 3D-ускорителей нельзя. Конечно, продукт найдет своего покупателя в лице профессионалов. Но это также означает, что Matrox останется в той же нише рынка, где и сейчас. Перспективы в борьбе за массового пользователя появятся у Parhelia только при снижении цены до $200-250. Вряд ли это случится скоро.
Видеокарта Matrox Parhelia-512 была любезно предоставлена для тестов компанией Sturm IT Distribution, а за ускоритель ASUS V8460 мы благодарим компанию «Никс».