Архивы: по дате | по разделам | по авторам

Кленовый сироп

Архив
автор : Марат Зиннатов   29.11.2002

Имидж правит обществом. Люди работают на него, поскольку он, возможно, поможет им подняться на следующую ступеньку иерархической лестницы. А хороший образ немыслим без качественного материального окружения человека.

Жажда - ничто…

Имидж правит обществом. Люди работают на него, поскольку он, возможно, поможет им подняться на следующую ступеньку иерархической лестницы. А хороший образ немыслим без качественного материального окружения человека. Безусловно, компании-производители прекрасно это понимают и делают все, чтобы их товар ассоциировался с лучшим образом жизни. На эти цели выделяются огромные не только по абсолютным, но и по относительным показателям средства. И получается замкнутый круг. Компании работают на имидж, чтобы он работал на них, выманивая деньги у людей, которым нужен лучший имидж, чтобы жить лучше, то есть иметь возможность оплатить продукцию компаний, и т. д.

Именно на PR-составляющей выпуска Radeon 9700 (кодовое имя R300) я и хотел бы сделать акцент. О том, что в пиаре нет мелочей, говорит хотя бы такой факт: канадская фирма ATI просит называть чип VPU (Video Processing Unit - блок обработки видео), подчеркивая тем самым, что с его появлением открываются новые горизонты качества. Вспомним, кстати, что предыдущий термин для графических чипов - GPU (Graphic Processing Unit - блок обработки графики), был предложен заклятым другом ATI - калифорнийцами из компании Nvidia. С выходом R300 ATI надеется не просто захватить лидерство на рынке, а стать рулевым отрасли. Новое название должно символизировать не только качественно иной уровень производительности и функциональности чипа, но и новый уровень компании.

…но и имиджем не напьешься

Понятное дело, на одном названии далеко не уедешь, и у серьезных производителей, к коим можно смело отнести ATI, за именем должно стоять нечто весомое. Посмотрев на Radeon 9700, мы увидим следующее:

  • примерно 110 млн. транзисторов при 0,15-микронном процессе производства;
  • чип в корпусе типа Flip Chip;
  • частота работы ядра 325 МГц;
  • частота работы DDR-памяти 310 МГц (возможна поддержка DDR II);
  • шина памяти 256 бит (четыре контроллера по 64 бита);
  • AGP 8x;
  • полная поддержка DirectX 9;
  • четыре конвейера вершинных шейдеров;
  • восемь пиксельных конвейеров с одним текстурным блоком на каждом;
  • технология HyperZ III;
  • технология VideoShader;
  • встроенные TV-Out, TDMS-трансмиттер и два RAMDAC (400 МГц).

Впечатляет, не правда ли? На данный момент ATI, несомненно, выбилась в технологические лидеры графического рынка (рассмотрение «бумажного» запуска NV30 пока отложим).

Старый друг лучше новых двух?

До сих пор помню, какое сильное впечатление произвел на меня внушительный размер чипа Matrox Parhelia-512. А ведь в нем было (всего-то) 80 млн. транзисторов. ATI пошла дальше, при этом также не сменив производственный процесс на 0,13-микронный. Что скрывается за этим шагом? Вы угадали - тактика. Причем опирающаяся на пиар - ведь обкатанная технология производства имеет свои плюсы именно в тактической борьбе.

Во-первых, канадцам не пришлось форсировать разработку и доводить до ума решения, работающие при 0,13-микронном техпроцессе. Подобный аврал чреват не только обильными финансовыми затратами, но и всевозможными мелкими ошибками, всплывающими в самый неподходящий момент и портящими что?.. правильно - имидж. Во-вторых, это позволяет надеяться на минимизацию брака на начальной стадии выпуска, а значит, удовлетворить ажиотажный спрос первого этапа продаж. Хотя, конечно, сложность производства чипов со 110 млн. транзисторов при старом техпроцессе может сыграть злую шутку с ATI и снизить процент работоспособной продукции на выходе. К тому же встает вопрос о заметно возросшем энергопотреблении. Да и себестоимость чипов, изготовленных по 0,15-микронной технологической норме, не внушает оптимизма. Наконец, не стоит забывать о более высоком частотном потенциале «утонченных» чипов.

Как поступит канадский производитель с этими минусами, не ясно. Проблему повышенного энергопотребления решили просто. Не хватает питания от AGP-слота? - Подведем энергию извне (для чего на видеокарте имеется стандартный разъем питания). А вот что делать с устаревшим процессом производства, не соответствующим новому поколению видеочипов?

По слухам, работоспособные 0,13-микронные чипы станут подарком для боссов ATI лишь к новогодним праздникам (а то и позже). Тогда, возможно, ATI пойдет по пути AMD и выпустит через некоторое время практически идентичный продукт, но изготовленный по усовершенствованному процессу. И все предстанет именно как грамотный тактический шаг.

А если нет? Тогда тягаться с NV30 от Nvidia, который обещает стать главным конкурентом R300 и (скорее всего) будет производиться по 0,13-микронному техпроцессу, нашему герою будет трудно. И ATI придется значительно снижать стоимость Radeon 9700.

Что-то с памятью моей стало

Несомненно, 256-разрядная шина - это козырь. При частоте 310 МГц пропускная способность DDR-памяти вплотную приближается к 20 Гбайт/с. Но еще больше радует, что и ATI наконец-то перешла на применение четырех контроллеров.

Казалось бы, какая разница - один, два или четыре контроллера, если пропускная способность не изменяется. Но это только на первый взгляд.

Представьте два склада. На первом работает один грузчик-силач, а на другом четыре обычных мужичка. И вот возникает необходимость выдать товар суммарным весом 256 кг. На первом складе силач, подхватив всю эту кипу, несет ее к выходу, на втором - четверо, взяв по 64 кг, тоже донесли. Пока разницы никакой. Однако допустим, что нужно перенести 64 кг товара. Наш Поддубный отнесет и его, но пока он будет ходить, прием/выдача товара застопорится. А на втором складе на эту задачу выделят только одного грузчика, а трое оставшихся будут готовы выполнить другую работу, не задерживая обработку следующих запросов.

Думаю, этот простенький пример хорошо показывает преимущества мультиконтроллерной архитектуры памяти. Конечно, и у нее есть недостатки - скажем, повышенные требования к качеству чипов памяти. Но в многопоточных задачах (надеюсь, никто не сомневается, что тенденция развития программных продуктов именно такова?) плюсы, бесспорно, перевешивают.

Раз уж разговор зашел о памяти, скажем пару слов о HyperZ III. Это усовершенствованная (хотя и предшественница была очень эффективна) технология экономии пропускной способности памяти. Она основана на разбиении буферов на блоки, которые можно передавать в сжатом виде с распаковкой по месту получения. Также есть возможность быстрого сброса флагов Z-буфера за счет обработки не каждого пикселя, а блока очистки.

Чтобы ускорить закраску, применяется иерархическая организация буфера глубины. Для наглядности сравним этот процесс с покраской однотонной стены, имеющей узор посередине. Всю стену можно закрасить каким-нибудь «грубым» инструментом, например валиком, а дойдя до «тонкого» узора, взять изящную кисть. Hierarchical-Z использует похожий принцип. Сначала буфер анализируется блоками 4х4, затем, если необходимо, 2х2 и, наконец, попиксельно.

DirectX 9

Официального релиза DirectX 9 до сих пор нет, так что говорить о его полной поддержке чипом Radeon 9700 не совсем некорректно. Да и производители «железа», как правило, вкладывают в свои продукты возможности, перекрывающие требования оригинальных спецификаций от Microsoft. Поэтому дальше мы рассмотрим реализацию DirectX 9 в Radeon 9700, а не сами спецификации.

Вершинные и пиксельные шейдеры стали основной темой для обсуждения после выхода DirectX 8. В нижеследующих таблицах показано, каким изменениям они подверглись.

Вершинные шейдеры.


DirectX 8

DirectX 9

Версия шейдеров

1.1

2.0

Максимальное количество команд

128

1024

Максимальное количество констант

96

256

Возможность управления потоком команд

нет

да


Несомненно, самое важное - это возможность управления потоком инструкций с помощью условных переходов, циклов и подпрограмм, обрабатывать которые будут четыре конвейера вершинных шейдеров (предыдущий лидер - GeForce4 Ti - имеет в своем арсенале только два), что, конечно же, дает преимущества новинке.

Пиксельные шейдеры.


DirectX 8

DirectX 8.1

DirectX 9

Версия шейдеров

1.1

1.4

2.0

Максимальное количество текстур

4

6

16

Максимальное количество команд выборки текстур

4

12

32

Максимальное количество команд обработки цвета

8

16

64

Максимальное количество констант

8

8

16

Формат данных

Целочисленный

целочисленный

с плавающей запятой

Максимальная разрядность

32 бит

48 бит

128 бит


Пиксельные шейдеры получили немного больше. Хотя по-прежнему нельзя управлять потоком инструкций, этот недостаток представляется лишь ложкой дегтя (пусть и достаточно большой) в бочке меда, когда узнаешь о возможности использования чисел с плавающей запятой 64- и 128-битной точности (по 16 и 32 бита соответственно на каждый цветовой и альфа-канал). Человеческий глаз физически не способен уловить столько цветов, сколько можно отобразить, используя новые форматы. Но эти «незаметные излишки» позволят производителям программных продуктов добиться большей реалистичности сложных эффектов.

А вот с пиксельными конвейерами R300 сделали что-то труднообъяснимое. Их количество увеличили вдвое - с четырех до восьми, но текстурные блоки урезали до одного на конвейер (хотя в сумме их осталось столько же, сколько и в R200, - восемь). А значит, при закраске «канадец» может частенько притормаживать только из-за того, что конвейер будет простаивать в ожидании результатов от единственного текстурника.

Зато можно вспомнить о PR. К количеству текстурных блоков он, скорее всего, отношения не имеет (хотя по Сети гуляют слухи о новом подходе ATI к организации взаимодействия «конвейер - текстурник», о котором компания просто не хочет распространяться до поры до времени, и это уже явный пиар). А вот полная поддержка новой версии DirectX является чисто рекламным ходом.

Поймите меня правильно. Я вовсе не хочу сказать, что все эти технологии - пустой звук. Нет, они весьма интересны и наверняка будут активно применяться. Но лишь тогда, когда начнется их реальное внедрение в полноценные программные продукты. Я имею в виду игры, поскольку всевозможные демки и бенчмарки явно не то, чего мы ждем…

Первой видеокартой с поддержкой DirectX 8 был GeForce3 от Nvidia, выпущенный более года назад. И где, спрашивается, поток игр, использующих хотя бы часть функций этой версии? А нет его. Ожидается не раньше начала следующего года… И это при том, что разработку новых игр должна была стимулировать майкрософтовская консоль Xbox. А уж о легкости портирования софта с этой платформы на PC нам все уши прожужжали.

Так что сегодняшней новинке эта разрекламированная поддержка вряд ли понадобится скоро. Можно смело сказать, что к тому моменту Radeon 9700 успеет морально устареть, то есть окажется примерно в той же ситуации, в какой сейчас находится GeForce3.

Анизотропная фильтрация

Свершилось! Долго, очень долго ругали ATI за ее реализацию этой функции. Конечно, она была быстрее, чем аналогичная от Nvidia, но и качество было пониже. И дело вовсе не в «избирательности» драйвера, которому позволяли самостоятельно определять целесообразность включения анизотропной фильтрации. На самом деле, претензии сводились к двум моментам.

Во-первых, торонтцы использовала для получения цвета пикселя билинейные сэмплы, а не трилинейные, как Nvidia. Но отныне можно выбрать тот способ, который вам более по душе: в пункте «Анизотропная фильтрация» драйвера - см. скриншот - есть варианты «Производительность» (используется соответствующее количество предварительно отфильтрованных билинейных сэмплов) и «Качество» (трилинейные сэмплы).

Во-вторых, предыдущие продукты в силу особенностей алгоритма не хотели работать над поверхностями, расположение которых близко к 45 градусам. Точнее, они-то работали, да вот только результаты этой работы визуально были практически незаметны. Усовершенствованный алгоритм позволил наконец-то избавиться и от этого недостатка.Антиалиасинг

Еще одно коренное изменение в технологической политике компании ATI. В настоящее время в сфере полноэкранного сглаживания главенствуют два подхода: более простой в реализации, но не слишком в производительный суперсэмплинг (который и исполняли предыдущие чипы канадской компании) и более прогрессивный, но уступающий первому в качестве картинки мультисэмплинг (которым баловали пользователей продукты Nvidia).

Напомню, что антиалиасинг, или сглаживание, - это смягчение неровностей, так называемых «ступенек» в таких графических элементах, как диагональные линии, кривые и окружности. Radeon 9700 реализует эту функцию, сочетая оба подхода: для большей части сцены используется «дешевый» мультисэмплинг, а когда нужно обработать полупрозрачную текстуру (с альфа-каналом), чип переключается на дотошный суперсэмплинг. И волки сыты, и овцы… хм… ну, по крайней мере, их все еще много.

Так нам было обещано. Правда, выяснилось, что браться за «проржавевший» суперсэмплинг R300 не желает. По крайней мере, заставить его сделать это пока не получается…Всякая всячина

Отнесем в этот раздел давно известную технологию ATI TrueForm, суть которой состоит в динамическом изменении количества полигонов, образующих объект. Понятно, что на еле заметную фигурку человека на заднем плане не стоит тратить производственные мощности в том объеме, которого требует обработка оригинальной модели, так что можно сильно уменьшить количество составляющих его треугольников - никто и не заметит. В производительности выиграем, не потеряв в качестве. И наоборот, при обработке лица, показанного крупным планом, можно выделить модели побольше полигонов, чем было изначально, - все равно лицо занимает подавляющую часть сцены, и обрабатывать кроме него нечего. Выиграем в качестве, не потеряв в производительности.

Сюда же добавлю известную со времени презентации Matrox Parhelia технологию Hardware Displacement Mapping (у R300 она логически входит в состав TrueForm 2.0), которая, как и предыдущая «изюминка», влияет на геометрию сцены. При ее использовании на объект накладывается карта высот (помните, как на географических картах изображают горы с линиями высот, тут то же самое). При этом появляется возможность создавать сложные сцены с относительно малыми потерями в скорости их обработки. В принципе, Hardware Displacement Mapping входит (по крайней мере, должна входить) в спецификации DirectX 9, но почему-то меня терзают смутные сомнения по поводу перспектив использования этой интересной «всячины». TrueForm тоже заманчива, да вот только кроме ATI ее никто не воплощает в «железе». Одно время Nvidia позволяла своим чипам эмулировать эту функцию, но из-за диких потерь в производительности, плохо сказывающихся на имидже, быстро забросила эту идею. А потому и серьезной поддержки от игростроителей не наблюдается. К сожалению.

Еще одна интересная новинка от ATI - технология VideoShader. Теперь появилась возможность взвалить на окрепшие плечи пиксельных шейдеров некоторые задачи по декодированию видео. Интересно это по большей части тем, что мы наблюдаем начало использования шейдерных блоков для решения не предназначенных специально для них проблем. Можно предположить, что вскоре они обретут статус полноценных процессоров и будут обрабатывать все более сложные и разнообразные задачи. Да и наметки языков программирования высокого уровня (Си-подобные) для этого стали вылезать как грибы после дождя - CineFX и Cg от Nvidia, HLSL от Microsoft и RenderMonkey от ATI.

Пожалуй, во всячину занесем и новый формат выходного сигнала. Опять вспоминаем Matrox Parhelia, а точнее, технологию GigaColor. Несмотря на мои опасения, ее поддержали. По крайней мере, ATI. Напомню, что в этом формате на каждый канал цвета выделяется не по восемь бит, как сейчас, а по десять. Честно говоря, ценность этой технологии сомнительна, поскольку мы с вами не увидим «лишних» цветов. Возможно, она найдет применение в аналоговых мониторах, для которых подобного рода запас прочности всегда полезен.

Ну и до кучи укажу на откровенно пиаровскую «всячину» - поддержку протокола AGP 8х. В статье о Xabre 400 от Silicon Integrated Systems (см. «КТ» #461), который стал первым чипом, освоившим новые скорости, я уже говорил о целесообразности использования этого интерфейса. Не буду повторяться, скажу лишь, что сия новинка нужна сегодня видеокартам как собаке пятая нога. Но это становится модно, а значит, наличие поддержки AGP 8х положительно скажется сами знаете на чем…Производительность

Основные характеристики чипов Radeon 9700 Pro и GF4 Ti 4600.


Radeon 9700 Pro

GF4 Ti 4600

Производственный процесс GPU, мкм

0,15

0,15

Чиcло транзисторов, млн.

~110

63

Частота GPU, МГц

325

300

Частота памяти, МГц

310

375

Объем памяти, Мбайт

128

128

Разрядность памяти, бит

256

128

Пиковая пропускная способность памяти, Гбайт/с

19,8

12

Версия DirectX

9

8

Версия вершинных шейдеров

2.0

1.1

Количество вершинных шейдеров

4

2

Версия пиксельных шейдеров

2.0

1.3

Количество пиксельных конвейеров

8

4

Количество текстурных модулей на конвейер

1

2

Версия драйвера

Catalyst 2.4

Detonator 29.42


С помощью первой таблицы освежим в памяти основные характеристики сравниваемых чипов, поблагодарим за предоставленные для тестирования видеокарты - Sapphire Atlantis Radeon 9700Pro и ASUS V8460 Ultra - торговую компанию «Никс» и приступим к практике начиная, как всегда, с пакета 3DMark 2001 SE build 330 (см. таблицу ниже).

Бывшему лидеру GeForce4 недвусмысленно намекают, что пора как минимум потесниться. Преимущество по всем статьям за Radeon 9700. Только при использовании мультитекстурирования он позволил конкуренту приблизиться к себе почти вплотную (вот он, единственный текстурный блок - показывает, как ему одиноко).

Производительность в тестах 3DMark 2001 SE.


Radeon 9700 Pro

GF4 Ti 4600

Fillrate — Single-Texturing, MTexels/sec

1736,1

1024,4

Fillrate — Multi-Texturing, MTexels/sec

2520,9

2321

High Polygon Count — 1 Light, MTriangles

65,4

50,9

High Polygon Count — 8 Light, MTriangles

14,9

12,6

EMBM, FPS

184,6

150,1

DOT3, FPS

192,7

152,3

Vertex Shader, FPS

142,4

97,7

Pixel Shader, FPS

151

120,9

Advanced Pixel Shader, FPS

185,7

94,1

Point Sprites, MSprites/sec

37

30,4

3Dmarks

12372

10891


Подчеркну, что в 3DMark тестируются вершинные шейдеры версии 1.1, пиксельные шейдеры версий 1.1 - в Pixel Shader Test, а в Advanced Pixel Shader Test наш герой использует продвинутую версию 1.4 (GeForce4 Ti, незнакомый с нею, «мучается» все с той же 1.1 и в этом тесте). Как R300 обрабатывает шейдеры 2.0, мы, к сожалению, не знаем.

В игровых приложениях приведу результаты из поразительно живучего в качестве бенчмарка «Quake 3: Arena» (OpenGL, см. первый блок диаграмм.). Эта игра снова показывает потрясающую масштабируемость (все тесты проводились при 32-битной глубине цвета). Затем включим анизотропную фильтрацию. Для того чтобы карты находились в сходных условиях, оба конкурента использовали восемь трилинейных сэмплов.

Диаграммы наглядно показывают преимущество R300. При включении анизотропной фильтрации, когда влияние центрального процессора на общий результат снижается, Radeon 9700 заметно опережает GeForce4 Ti 4600. Более того, его результаты при этом даже несколько выше, чем у чипа Nvidia при стандартных настройках!

Перейдем к антиалиасингу (второй блок диаграмм). Обе карты используют режим 4х. И здесь похожая картина - почти двукратное преимущество за ATI. Наконец, посмотрим на результаты при экстремальных настройках - мы заставили ускорители совместить анизотропную фильтрацию и антиалиасинг.

Результат вполне предсказуем и в комментариях не нуждается - цифры говорят сами за себя. Подробный отчет о других тестах читайте в материале на сайте Ferra.ru.The End. Happy End

Radeon 9700 удался. Помимо рассмотренного варианта Pro, свет увидят просто Radeon 9700, Radeon 9500 Pro и Radeon 9500. Первый полностью идентичен «нашему», но работает на пониженных (вернее, это у Pro они завышены) частотах - 275МГц/ 270МГц DDR.

В версии 9500 Pro по сравнению с 9700 (обычным) шина памяти урезана до 128 бит, и максимальный объем локальной памяти сокращен до 128 Мбайт против 256. Но в остальном - все то же самое. А вот в стандартном Radeon 9500 в «дополнение» вырезали половину пиксельных конвейеров (осталось четыре), при этом оставив только один текстурник на каждом, «плюс» максимальный объем локальной памяти сократили до 64 Мбайт. Впрочем, поддержка DirectX 9 сохранилась во всех вариантах. Как видите, нам предоставили весьма широкий выбор. Осталось только не забыть, что где.

Все это должно внушать оптимизм поклонникам канадской компании. На данный момент она, несомненно, правит на графическом рынке. Но все же на душе у боссов ATI неспокойно. Темной тучей висит над ними NV30 - оглашенные характеристики GeForce FX не предвещают ничего хорошего для ATI. Разразится гроза или все ограничится легким дождиком, мы пока не знаем.

В продаже конкурент появится, судя по всему, не ранее февраля следующего года. До этого момента у ATI есть время подготовить ответный удар на еще не состоявшийся, по сути, вызов нынешнему лидерству. Какой вариант выберет руководство компании? Наиболее простой в реализации ценовой? Или изыщет возможности для «драйверного» ответа, как это ранее делала Nvidia? Или же успеет внедрить 0,13-мкм техпроцесс с последующим увеличением рабочей частоты? А может быть, все сразу? Или не надо будет что-то предпринимать вообще (кто знает, как себя покажет в деле NV30)? Нам остается только гадать и ждать сражения, которое обещает стать самым серьезным за всю историю противостояния ATI и Nvidia.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.