ATI Radeon X800 (R420): смена поколений
АрхивВидеоВслед за Nvidia, объявившей месяц назад о запуске в производство GeForce 6800 Ultra (кодовое имя NV40), ее основной конкурент на рынке видеоускорителей — компания ATI — представила на суд публике свой топовый чип следующего поколения — Radeon X800 (R420).
Вслед за Nvidia, объявившей месяц назад о запуске в производство GeForce 6800 Ultra (кодовое имя NV40), ее основной конкурент на рынке видеоускорителей — компания ATI — представила на суд публике свой топовый чип следующего поколения — Radeon X800 (R420).
Презентация нового VPU (Video Processing Unit) российской прессе состоялась 3 мая. На этот раз известная поговорка сработала в обратную сторону: что немцу здорово, то русскому смерть. Наши национальные весенние каникулы были в самом разгаре, а потому на безусловно важное мероприятие собралось не так уж много пишущей братии. Если представление NV40 было пышным шоу с множеством приглашенных, то знакомство с R420 проходило в спокойной, почти камерной обстановке в узком кругу специалистов.
Чип Radeon X800 (R420). |
Вопреки ожиданиям было анонсировано сразу два продукта на базе нового чипа — Radeon X800 Pro и Radeon X800 XT (их основные характеристики в сравнении с GeForce 6800 Ultra приведены в табл. 1). Младшую версию можно будет увидеть на прилавках уже через пару недель по цене в районе 400 долларов, старшая выйдет позже. По всей видимости, пройдет не меньше месяца, пока жаждущие потратить 500 долларов увидят ее в продаже. Когда появится (и появится ли вообще) «чистая» версия X800 безо всяких суффиксов — неизвестно. Более того, неизвестна и архитектура чипа для такой карты. Вполне возможно, что это будет восьмиконвейерный вариант R420 с обычной памятью DDR. Но это пока догадки.
Таблица 1. Основные технические характеристики чипов | |||
Radeon |
Radeon |
||
Технологический процесс, мкм |
0,13 |
0,13 |
0,13 |
Число транзисторов, млн. |
160 |
160 |
222 |
Рабочая частота GPU, МГц |
475 |
525 |
400 |
Тип памяти |
GDDR3 |
GDDR3 |
GDDR3 |
Шина памяти, бит |
256 |
256 |
256 |
Рабочая частота памяти, МГц |
890 |
1150 |
1100 |
Пиковая пропускная |
28,5 |
36,8 |
35,2 |
Блоков вершинных шейдеров |
6 |
6 |
6 |
Версия вершинных шейдеров |
2.0b |
2.0b |
3.0 |
Конвейеров пиксельных шейдеров |
12 (4x3) |
16 (4x4) |
16 |
Версия пиксельных шейдеров |
2.0b |
2.0b |
3.0 |
Версия DirectX |
9.0b |
9.0b |
9.0c |
Снова, как и в случае с R300, ATI использует частично годные чипы для производства младших карт. Очевидно, что Radeon X800 Pro есть версия X800 XT с отключенными пиксельными конвейерами. Конечно, сразу возникает вопрос, отключены ли они программно и можно ли заставить их работать (читай, получить работоспособную старшую карту по цене младшей)? Представители компании так прокомментировали этот момент: если на этапе проверки в чипе периодически (при штатных частотах или в определенных приложениях и т. д.) возникают ошибки, то бракованный блок (пиксельные конвейеры реализованы блоками по четыре) просто отключают. Его включение и вся ответственность за этот шаг перекладываются на покупателя. Но в случае капитальной дисфункции блока он уничтожается физически, что, разумеется, исключает возможность его активации.
Видеокарта на базе чипа Radeon X800. |
Неудивительно, что карты на новых чипах очень похожи. Единственное отличие заключается в установленной памяти — относительно медленной, со скоростью доступа 2,0 нс (соответствует эффективной частоте 1000 МГц) у версии Pro и 1,6 нс (1300 МГц) для XT. Нельзя не отметить и еще один отрадный факт. Карты внешне очень напоминают Radeon 9800 XT. Та же система охлаждения, состоящая из массивного (но низкого, так что соседний PCI-слот доступен — см. фото) медного радиатора и большого вентилятора, и один разъем питания.
Во время презентации R420 работал в маленьком корпусе со слабеньким 230-ваттным блоком питания, подчеркивая свои скромные потребности. На фоне монструозного GeForce 6800 Ultra, требующего почти 500-ваттный БП и два свободных шлейфа питания, к тому же из-за высоты радиатора, перекрывающего соседний слот PCI, это выглядит потрясающим достижением. Впрочем, в NV40 почти на 40% больше транзисторов, которые нужно и питать энергией, и охлаждать.
Чипы памяти GDDR3 в чистом виде, |
Предположительно еще выигрышнее будет выглядеть R420 на PCI-Express. Такие карты уже готовы (модифицированный чип называется R423), но анонс откладывается до официального запуска Intel новой шины. В отличие от прожорливого GeForce 6800 Ultra предоставляемой слотом x16 энергии должно хватить Radeon X800 XT. Так что подпитки извне ему не потребуется. И все же требования близки к максимуму. Если следующий hi-end-чип от ATI будет изменен примерно так же, как R350 по отношению к R300, то небольшого запаса шины еще хватит. А вот R5xx без перехода на 0,09-нм техпроцесс, видимо, уже вылезет за пределы спецификаций PCI-Express. Отметим также, что в чипах ATI поддержка новой шины реализована напрямую, а GPU Nvidia будут использовать специальный адаптер. Такое половинчатое решение в текущих приложениях практически никак себя не проявит, но уже в недалеком будущем может вызвать определенные затруднения. Впрочем, об этом мы поговорим, когда соответствующие продукты нам представят официально.
Блок-схема Radeon X800 XT. |
Завершая осмотр карт, отметим наличие чипа Rage Theater, как всегда отвечающего за функции VIVO. Правда, пока не известно, будут ли им оснащаться все серийные топовые карты.
Часть работы с видео берет на себя VPU. Еще со времен Radeon 9700 появилась возможность с помощью функций, объединенных в блок Videoshader, избавить центральный процессор от задач по кодированию/декодированию. X800 в этой области недалеко ушел вперед. Вся разница — в скорости обработки. Читать дальше >>>
Основным новшеством стала технология 3Dc. При создании эффектов неровной поверхности уже давно используются карты нормалей. По сути, они представляют собой те же текстуры, но влияющие не на цвет пиксела, а на то, как луч света отражается от данной точки. Это позволяет без геометрических изменений модели получать реалистичные эффекты всякого рода шероховатостей. К сожалению, стандартная технология сжатия текстур DXTC плохо работает с картами нормалей. А в естественном виде они занимают слишком много места. Поэтому приходится поступаться качеством детализации.
На работу с этими объектами и ориентирована 3Dc. С ее помощью производится аппаратная распаковка сжатой карты нормалей. Технология позволяет достигнуть коэффициента 4:1 практически без потерь. Более того, 3Dc можно использовать по отношению к любым двухкомпонентным данным.
Зависимость производительности R420 и NV40 |
Еще один плюс — в простоте модификации имеющегося кода. На презентации была показана демонстрационная сценка из «Serious Sam 2». На включение поддержки 3Dc у разработчиков ушло примерно два часа. И это изменение в механизме загрузки текстур влияет не только на данную сцену, но и на всю игру! Таким образом, при наличии высокодетализированных карт нормалей требуется совсем немного времени, чтобы модели в игре вышли на новый уровень реализма, не потеряв в производительности.
К сожалению, программная эмуляция 3Dc непомерно медленна, и ждать поддержку этой интересной технологии на старых картах не приходится. Но радует, что ATI не требует ровным счетом ничего за лицензирование этой разработки. Так что стоит ожидать аппаратную поддержку распаковки сжатых карт нормалей и на продуктах конкурентов.
Temporal Antialiasing. При быстрой смене сглаженных |
Надо заметить, что Nvidia для повышения качества изображения рекомендует разработчикам использовать шейдеры версии 3.0. Однако у этого подхода есть несколько недостатков.
Во-первых, другой код, который, к сожалению, не сможет исполняться на огромном количестве карт. По сути, ни один ускоритель, кроме построенного на базе NV40, не поддерживает шейдеры третьей версии. А значит, разработчики все равно будут создавать эффекты еще и посредством другой версии шейдера.
К тому же, по некоторым данным, новые спецификации направлены не столько на создание недоступных ранее эффектов, сколько на ускоренное исполнение подпрограмм на NV40. То есть никакого выигрыша в визуальном качестве не будет.
Мелкие трещинки на ухмыляющихся губах |
Более того, похоже, что Nvidia сама роет себе яму. Дело в том, что спецификации третьей версии поощряют написание более длинных шейдеров и, как следствие, использование большего числа регистров. А с ростом числа использованных временных регистров, согласно докладу одной из независимых исследовательских компаний, производительность NV40 заметно снижается. Уже начиная с трех регистров при 32-битной точности (соответственно, шести при
16-битной) падение составляет примерно 30% (при девяти 32-битных регистрах — уже 70%), в отличие от R420, для которого в пределах максимально допустимых 32 регистров скорость исполнения шейдеров практически не меняется. Предположительно, это происходит из-за того, что в чипе ATI регистры выполнены на самом кристалле, а в NV40 для хранения таких данных используется относительно медленная локальная память.
Интересно, что при возросшей в целом производительности R420 по сравнению с R3xx самые перспективные технологические новинки практически не влияют на производительность. Помимо 3Dc этим свойством обладает функция под названием «Temporal Antialiasing» (видимо, лучше всего перевести как «Попеременное сглаживание»).
При включении этого типа полноэкранного сглаживания для четных и нечетных кадров используются разные шаблоны выборки пикселов. При быстрой (более 30 fps) смене кадров глаз уже не способен разложить изображение на отдельные картинки. Так что для нашего мозга изображение становится эквивалентным полученному при использовании вдвое большего числа отсчетов. То есть при использовании 2х FSAA и включении Temporal AA будет казаться, что применяется 4x FSAA.
Поскольку результатом является обман зрения (в хорошем смысле, эдакий честный обман), заснять его технически тяжело. К тому же на данный момент еще не готова финальная версия драйвера, а в бета-версии функция включается только через реестр. Так что оценку этой интересной технологии отложим до появления серийных карт и WHQL-драйверов. В завершение отмечу: теоретически эта функция может использоваться и на чипах R3xx, но из маркетинговых соображений ее поддержка включена только для X800. Читать дальше >>>
В табл. 2 приведены результаты1 в специализированных синтетических тестах из пакета 3DMark 2001 SE. Влияние CPU здесь минимально, а потому практически везде заметен огромный отрыв от старых лидеров и очевидная разница между X800 Pro и XT. Однако в тестах вершинных и пиксельных шейдеров результаты довольно странные. Неужто и здесь все же уперлись в процессор? Результаты всех четырех карт практически идентичны.
Таблица 2. Результаты в характерных тестах пакета 3DMark 2001 SE | ||||
Radeon |
Radeon |
Radeon |
Gigabyte | |
Fill Rate (Single-Texturing), MTexels/s |
2738,0 |
3719,5 |
2169,3 |
1743,8 |
Fill Rate (Multi-Texturing), MTexels/s |
5501,2 |
8163,8 |
3191,0 |
3442,9 |
High Polygon Count (1 Light), MTriangles/s |
146,4 |
162,8 |
87,8 |
103,8 |
High Polygon Count (8 Light), MTriangles/s |
34,9 |
39,0 |
20,2 |
29,1 |
Vertex Shader, fps |
178,6 |
175,9 |
178,8 |
174,4 |
Pixel Shader, fps |
203,6 |
205,8 |
203,8 |
197,4 |
Advanced Pixel Shader, fps |
314,3 |
475,0 |
265,1 |
147,8 |
Point Sprites, MSprites/s |
62,2 |
95,6 |
47,0 |
42,5 |
Влияние центрального процессора в тесте Aquamark 3 уже значительно, но и на долю видеокарты выпадает немало. Труднее всего дается полноэкранное сглаживание. И все же наиболее мощный участник и вовсе снижает показатели только при самом высоком разрешении и включении полноэкранного сглаживания — явный признак недостаточной производительности CPU.
Несмотря на то что режим «flyby» минимально использует ресурсы центрального процессора, при тестировании в «Unreal Tournament 2003» карты на R420 не допускают резкого падения производительности даже при переходе в максимальное разрешение. Сравните результаты в простом режиме при разрешении 1280х1024 и в самом тяжелом — при разрешении 1600х1200. Ускорители предыдущего поколения потеряли примерно 60%, а новинки — около 25%!
Ситуацию в «Serious Sam: The Second Encounter» комментировать не буду, и так все яснее ясного.
Результаты тестов (сверху вниз) |
Как видим, при использовании старых тестов центральный процессор средней мощности не дает новинкам развернуться и показать все, на что они способны. При исследовании производительности серийных образцов мы воспользуемся более мощной системой и более свежими играми, предъявляющими повышенные требования к видеоускорителям. Но и по результатам этого тестирования можно сказать, что отрыв от бывших лидеров существенный. Даже упрощенный вариант X800 Pro наголову впереди, и это при том, что его явно сдерживает относительно слабый CPU.
Конечно, карты на R420 будут соревноваться не с флагманами прошлого, а с прямыми конкурентами на основе NV40. Вот только прошел уже месяц с момента его презентации, но не то что серийных карт не видно, инженерный образец в Москве один на всех! В этом смысле дела у ATI обстоят лучше. Проблем с версией Pro нет никаких, а задержка XT связана с дефицитом быстрой памяти GDDR3.
Однако уже сейчас можно сказать, что ATI явно выигрывает по тепловыделению, а главное — по энергопотреблению. Найти сейчас 500-ваттный блок питания для NV40 не так-то просто, да и стоит он больше 100 долларов. Так что GeForce 6800 Ultra должен быть на порядок быстрее (что, по предварительным данным, не так) или гораздо дешевле (что сомнительно, особенно, если вспомнить NV30), чтобы компенсировать в глазах покупателей свои недостатки.
По материалам еженедельника «Компьютерра» #542–543.
1. Мы использовали процессор Pentium 4 2,53 ГГц (на материнской плате ASUS P4G8X Deluxe), 2х256 Мбайт памяти (TwinMOS) и жесткий диск Seagate Barracuda IV ATA (ST380021A). Операционная система — Windows XP Professional с установленным SP1, а также драйверы Nvidia ForceWare 60.72 и ATI Catalyst 4.4 (для X800 использовалась бета-версия 6.444). Все тесты проводились при 32-битной глубине цвета. При включении анизотропной фильтрации использовался максимально доступный режим (8xQ для чипов Nvidia и 16xQ для чипов ATI). [вернуться]