Архивы: по дате | по разделам | по авторам

ATI Radeon HD 2900 XT: первенец нового поколения графических ускорителей AMD

АрхивПлатформа
автор : Вячеслав Ландау   16.05.2007

Первые карты на базе долгожданного процессора R600 с поддержкой программного интерфейса DirectX 10, а также видео и звука высокого разрешения, наконец-то поступили в продажу.

Судя по всему, объединение канадского разработчика графических контроллеров ATI Technologies с американской компанией AMD продолжает сказываться на сроках презентации новых продуктов. Графические ускорители нового поколения "двухтысячной" серии, как ожидалось, должны были быть представлены ещё месяц назад, однако реальная их презентация состоялась лишь 14 мая. Более того, из всей серии ускорителей прямо сейчас можно приобрести лишь самый мощный из них - ATI Radeon HD 2900 XT, а в конце июня должны появиться более скромные модификации ATI Radeon HD 2600 и ATI Radeon HD 2400.

Обратите внимание, на то, что в названиях новых видеокарт присутствует слово "ATI". Это вовсе не ошибка: как мы уже писали, в течение переходного периода для графических решений AMD будет сохранена марка ATI, прекрасно знакомая всем, кто когда-либо имел дело с компьютерными графическими контроллерами.

Карта ATI Radeon HD 2900 XT построена на базе долгожданного чипа с кодовым названием R600, однако, судя по её возможностям, она не будет возглавлять новую "двухтысячную" линейку, хотя и войдёт в число топовых моделей. Независимые тесты, которые уже появились в интернете, свидетельствую о том, что она уверенно опережает по производительности nVidia GeForce 8800 GTS, но заметно отстаёт от топовой модели конкурента, GeForce 8800 GTX/Ultra. Объявленная цена на ATI Radeon HD 2900 XT - 399 долларов США. Примерно столько же просят и за nVidia GeForce 8800 GTS, так что новинка может предложить более выгодное соотношение цены и производительности.

Новое "двухтысячное" семейство появляется спустя всего два года после выпуска ускорителей "тысячной" серии, однако новинки весьма заметно отличается от предшественников. Прежде всего, это касается поддержки видео и звука высокого разрешения, которые могут передаваться через полностью цифровой универсальный интерфейс HDMI, а также поддержки программного интерфейса DirectX 10.

К сожалению, AМD остаётся в положении догоняющего: nVidia выпустила видеокарты "восьмитысячной" серии с поддержкой DirectX 10 ещё в ноябре прошлого года. С другой стороны, инженеры AMD могли наблюдать за работой продукции конкурента и её успехами на рынке, и сделать свой продукт ещё лучше. В этом небольшом обзоре мы коснёмся конструктивных особенностей R600 и основных отличий новинки от графических процессоров ATI предыдущего поколения.

Архитектуру R600 можно считать самым значительным конструкторским прорывом инженеров AMD (ATI) со времён презентации R300 - это чрезвычайно мощный процессор, рассчитанный на многопоточные параллельные вычисления. Принципиальные изменения архитектуры связаны также с необходимостью поддержки более гибкого и программируемого интерфейса DirectX 10 (шейдеры версии 4.0), чем API предыдущих поколений.

Одно из важнейших инноваций в R600 - унифицированная шейдерная архитектура, при которой вычислительные блоки одного типа способны обрабатывать три типа графических инструкций - пиксельные, вершинные и геометрические шейдеры. Благодаря этому новый процессор может динамически распределять нагрузку, предоставляя большую часть вычислительных ресурсов для обработки самых важных в конкретный момент времени инструкций. Поэтому графический ускоритель с унифицированной шейдерной архитектурой теоретически должен обеспечивать более высокую производительность, чем чипы со специализированными блоками обработки шейдеров, рассчитанные на DirectX более ранних версий.

ATI уже имела возможность обкатать унифицированную шейдерную архитектуру - первым её таким чипом стал Xenos, устанавливающийся в популярной игровой приставке XBox 360. R600 - дальнейшее развитие этого процессора, который стал гораздо сложнее. Унифицированную архитектуру использовала и nVidia в своём чипе G80 (серия GeForce 8800), однако между чипами конкурентов имеются заметные отличия. К примеру, если в GeForce 8800 GTX имеются 128 скалярных потоковых процессоров, работающих на тактовой частоте 1,35 ГГц, то в Radeon HD 2900 XT их гораздо больше - 320, при этом их тактовые частоты ниже - 742 МГц.

Графический процессор R600 заметно вырос в размерах, однако всё равно меньше своего конкурента от nVidia: габариты R600 составляют порядка 21 х 20 мм, а площадь, соответственно - около 420 мм2. При этом он выпускается по 0,08-микронному технологическому процессу и состоит примерно из 700 миллионов транзисторов. Для сравнения, G80 состоит примерно из 680 миллионов транзисторов, а его площадь, по разным данным, составляет от 420 до 490 мм2.

Взглянем на схему:

Если предыдущие графические процессоры ATI оснащались логикой для обработки потока команд от драйвера, то в R600 этим занимается полноценный процессор, оснащённый памятью и работающий под управлением микропрограммы, загружаемой при каждом запуске. Командный процессор потребовался для аппаратной разгрузки графического драйвера, поскольку фактически работа программы-драйвера возлагается на центральный процессор. По эаявлению представителей AMD, это позволило снизить нагрузку на ЦП в приложениях для DirectX 9 до 30%.

За командным процессором в R600 идёт "движок настроек" (setup engine), который распределяет потоки, подготавливая данные к обработке. Он имеет три функции, соответствующие трём типа шейдерных программ в DirectX 10: сборку вершин - для вершинных шейдеров, сборку геометрии - для геометрических шейдеров, а также сканирующее преобразование и интерполяцию - для пиксельных шейдеров. К блоку сборки вершин также подключён аппаратный программируемый блок для разбиения поверхностей или тесселяции (tessellation), позволяющий благодаря специальному алгоритму сжатия с минимумом памяти создавать поверхности с очень большим числом полигонов. Что-то более конкретное сказать об этом блоке нельзя, поскольку информацию о нём в AMD не раскрывают, а сам он не предусмотрен спецификациями DirectX 10. Будет ли он востребован разработчиками игр, неизвестно, но в AMD утверждают, что Microsoft планирует включить функции разбиения поверхностей в следующие версии DirectX.

После выполнения всех этих функций потоки данных направляются в диспетчер потоков (dispatch processor). Задача этого модуля заключается в том, чтобы все шейдерные блоки были загружены работой. Иными словами, именно здесь распределяются сотни потоков данных разных типов - вершинные, пиксельные и геометрические шейдеры. Здесь же оценивается нагрузка на те или иные блоки, доступность данных в памяти, отсюда подаются команды на включение или отключение шейдерных блоков.

Как видно на схеме, каждый из четырёх SIMD-массивов (т.е. работающих с одним потоком команд и многими параллельными потоками данных), каждый из которых, в свою очередь, состоит из 80 потоковых процессоров, снабжён двумя арбитражными блоками и двумя секвенсорными блоками. Арбитражный блок определяет последовательность обработки потоков на базе целого ряда переменных, а сексенсорный - наилучший порядок выполнения инструкций выбранного для обработки потока. Сортировщики вершинных и текстурных шейдеров оснащены независимыми от прочих арбитражными и секвенсорными блоками.

Основу шейдерного процессора составляют блоки обработки потока данных. На схеме изображён один из таких блоков:

Базовый блок состоит из пяти суперскалярных арифметико-логических устройств (ALU), каждый из которых может исполнять свою команду независимо от другого. Обратите внимание, что левый ALU на схеме вдвое толще других - это символизирует его расширенные возможности: в частности, именно он отвечает за выполнение вычислений с синусами и косинусами. Все пять ALU рассчитаны на выполнение одной инструкции умножения/сложения за такт при 32-разрядных расчётах с плавающей запятой. В каждом блоке также есть отдельный модуль для выполнения ветвлений, ответственный за управление потоками.

Потоковые процессорные блоки организованы в массивы по шестнадцать штук в каждом и управляются VLIW-командами (VLIW - very long instruction word, очень длинная машинная команда), представляющими собой шесть инструкций (пять математических и одну - для ветвлений), сгруппированных в одной, которая, в свою очередь, управляет всеми шестнадцатью потоковыми блоками, параллельно обрабатывающими данные.

Четыре блока обработки текстур в R600 работают независимо от шейдерного ядра этого процессора. Каждый текстурный блок состоит из восьми блоков адресации, 20 блоков выборки и четырёх блоков фильтрации. Адресация и фильтрация текстур здесь осуществляется по схеме, аналогичной использованной в Radeon X1950 XTX, но в неё были внесены важные изменения. Среди них - возможность фильтрации текстур формата FP16, часто использующихся для освещения в широком динамическом диапазоне, на полной скорости, т.е. 16 пикселей за такт, а также текстур формата FP32 на половинной скорости. Трилинейная и анизотропная фильтрация может осуществляться в R600 во всех форматах, в то время как Radeon X1950 XTX похвастаться этим не мог.

Благодаря возможностям выборки каждый текстурный блок может также захватывать из памяти и обрабатывать четыре дополнительные неотфильтрованные текстур за такт - за это отвечают четыре крохотных блоков адресации и выборки, изображённые на схеме.

Контроллер памяти в R600 - дальнейшее развитие контроллера, применявшегося в R580. Здесь мы видим уже не гибридную а полностью распределённую кольцевую 1024-разрядную шину памяти с четырьмя пунктами для записи и чтения и примерно 2000 проводниками. В кольцевой шине предусмотрено порядка 84 клиентов для чтения и 70 клиентов для записи, так что шина PCI Express занимает лишь одну из многих потенциальных линий.

Кольцевая шина обеспечивает поддержку восьми 64-разрядных каналов памяти, что означает 512-битную ширину интерфейса памяти - заметно большую, чем 384-разрядную в G80. Пиковая пропускная способность 512 Мб видеопамяти GDDR3, работающей на карте Radeon HD 2900 XT с эффективной частотой 1,65 ГГц, составляет 105,6 Гб/с, что заметно больше, чем может предложить GeForce 8800 GTX, однако пиковая скорость заполнения текстурами достигает всего 12 Гтекстелей/с - меньше, чем у GeForce 8800 GTX, но больше, чем у GeForce 8800 GTS.

В графическом процессоре R600 реализовано новое поколение фирменной технологии для работы с цифровым видео - ATI Avivo HD. В чипе предусмотрены отдельные блоки UVD (универсальный видеодекодер) и AVP (видеопроцессор), обеспечивающие полностью аппаратное декодирование видео, включая форматы H.264 и VC-1 с разрешением до 1920 x 1080 точек и битрейтом до 40 Мбит/с.

Процессор R600 также обзавёлся встроенным графическим контроллером, благодаря чему появилась возможность реализовать полноценную передачу видео- и аудиосигналов по цифровому интерфейсу HDMI. Кроме того, полностью HDCP-защищённый цифровой тракт получить сертификат Vista Premium.

Несмотря на "родную" поддержку интерфейса HDMI, знакомого по бытовой технике разъёма HDMI на карте нет: вместо него используется физический разъём DVI с дополнительными выводами, к которому подключается специальный переходник. Разумеется, порт DVI может выполнять и свою непосредственную задачу - вывод цифрового видеосигнала на компьютерный монитор.

Вот, вкратце, ключевые особенности конструкции долгожданного графического процессора AMD R600. Напомним, что пока официально выпущена в продажу только наиболее мощная карта новой "двухтысячной" серии, ATI Radeon HD 2900 XT, а более доступные решения ожидаются лишь к концу июня. Надеемся, что в скором времени у нас будет возможность познакомиться с новинками "вживую" и оценить их потенциал.


Иллюстрации - из материалов компании AMD
© ООО "Компьютерра-Онлайн", 1997-2019
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.