Архивы: по дате | по разделам | по авторам

Встроенные видеоускорители: Часть II

АрхивВидео
автор : Сергей Озеров   22.12.2004

Подробно об интегрированных видеоконтроллерах наборов системной логики nVidia nForce 2 IGP, ATI Radeon 9100 IGP, ATI Radeon Xpress 200 и Intel GMA 900 (i915G).

Часть первая

nVidia nForce 2 IGP

Начнем мы с легендарного чипсета, не упомянуть который при обзоре интегрированной графики невозможно. Для все еще популярной платформы Socket A (AMD Athlon XP/Sempron) он просто не имеет альтернативы! Достаточно сказать, что до появления nForce(2) фирма nVidia была никем на рынке системных чипсетов и благодаря ему всего за пару лет смогла стать производителем «номер 1» чипсетов для процессоров AMD (ее рыночная доля сейчас составляет порядка 50%). Даже спустя два года после выхода (Целая эпоха прошла! Для сравнения: за это же время сменилось три поколения графических ускорителей, два поколения (и четыре ядра) процессоров, появился новый тип оперативной памяти и принципиально новая шина для плат расширения — PCI Express. А nForce 2 как был лучшим, так и остался) северный мост nForce2 IGP (IGP = Integrated Graphics Processor, распространенное обозначение для чипсета с интегрированной графикой) (особенно в варианте Ultra 400) является лидером по производительности в своем классе — догнать (но не перегнать) его смог разве что вышедший полгода назад чипсет VIA (без ИГ). Первоклассный интегрированный контроллер памяти (до выхода Athlon 64 удерживавший пальму первенства по времени доступа к оперативной памяти) дополняется отличными возможностями для разгона (фиксированные частоты шин PCI и AGP, хорошая разгоняемость чипсета — отдельные экстремалы даже вручную делали «вольтмоды», не без помощи паяльника повышая напряжение на северном мосте) и одним из лучших южных мостов (отличный интегрированный звук с аппаратным ускорением, целых два сетевых контроллера, FireWire, быстрая шина HyperTransport).

И интегрированное графическое ядро у nForce2 тоже отменное — NV17, то есть аналог GeForce4 MX 420 (от которого его и взяли). По маркетинговым соображениям nVidia, к сожалению, лишила линейку GeForce4 MX поддержки каких-либо шейдеров, ограничившись полной функциональностью DirectX 7 (включая Hardware T&L) и поддержкой фирменных технологий, вроде DOT3. Поэтому считать nForce2 IGP современным интегрированным решением нельзя — все-таки без шейдеров в нынешних играх «уже никуда» (подробнее см., например, в «КТ» #566). В принципе, поиграть в Doom 3 и FarCry это не помешает, но картинка будет гораздо хуже, чем при использовании новейших графических чипсетов. Зато в старых играх производительности этого морально устаревшего ядра хватает с лихвой, популярность Socket A все еще велика, да и nVidia не так давно обновила линейку южных мостов для nForce2, добавив туда гигабитную сеть, SATA и RAID, которых не хватало чипсету, дабы соответствовать нынешним реалиям. Так что мы решили включить его в наш обзор в качестве «отправной точки» и представителя уходящего поколения чипсетов и процессоров. Подробнее об nForce2 можно почитать в наших статьях на www.terralab.ru/system/35548  и .../35549, а характеристики nForce2 в сравнении с соперниками представлены в таблице 1.

*      Только для 400 и Ultra 400. **      Кроме nForce2 400. ***      Только для Ultra 400. ****      Под формулой графического ядра здесь понимается число вершинных и пиксельных конвейеров соответственно (см. «КТ» #566, с. 29).

ATI Radeon 9100 IGP

Radeon 9100 IGP (RS300) появился на свет почти год назад и с тех пор завоевал славу одного из лучших ИГ-решений для платформы Pentium 4. Вообще говоря, «трехсотка» — далеко не первый интегрированный чипсет канадской компании (тут можно вспомнить Radeon 320 IGP, 340 IGP и 7000 IGP), однако ранние образцы, как и у ее «заклятого приятеля» nVidia, были не слишком удачными и в массовую продажу в сегменте настольных компьютеров так и не попали (хотя для мобильных применений шли бойко). Итак, 9100 IGP стал первым «общедоступным» чипсетом компании, предназначенным для процессоров Pentium 4. Его интегрированное графическое ядро построено на урезанном варианте старого доброго Radeon 8500, который маркетологи в свое время переименовали для «совместимости» с остальной линейкой продуктов компании в Radeon 9100 (отсюда, видимо, и пошло название самого чипсета). Только оригинальный 9100 — это четыре конвейера рендеринга по одному TMU на конвейер, а 9100 IGP урезан вдвое — всего два конвейера рендеринга, хотя и функционирующих на довольно высокой для интегрированной графики частоте 300 МГц. Шейдеры поддерживаются, но только «эпохи DirectX 8.1» — пиксельные версии 1.4 и вершинные версии 1.1. Не смертельно, но неприятно: хотя в игрушках и будет в большинстве случаев естественная и живая картинка, к некоторым играм, к сожалению, это правило не относится — например, свежий Half-Life 2 без поддержки шейдеров второй версии не умеет толком рисовать воду. За вывод картинки на экран отвечает далеко не новый, но более или менее приличный блок 2D (10-битный 300 МГц RAMDAC). В итоге — полноценное, но все же относительно старое (конечно, по меркам нынешних дискретных ускорителей) графическое решение.

Оставшийся набор функций северного моста у 9100 IGP вполне достойный: поддержка FSB 400, 533 и 800 МГц и Hyper-Threading, быстрый двухканальный контроллер памяти DDR400 (не такой быстрый, как у Intel 865G, поэтому по общесистемной производительности 9100 IGP он уступает мэйнстриму от Intel) и возможность подключения внешней видеокарты по графической шине AGP 8x. Выпускается и «облегченный» вариант этого чипсета — 9000 IGP, который отличается от старшего собрата отсутствием второго канала для DDR-памяти, что сразу снижает его шансы на получение выдающейся производительности 3D-графики, но делает привлекательным для мобильных применений. Есть, наконец, и «профессиональная» версия северного моста — 9100 PRO IGP, поддерживающая технологию FullStream, которая улучшает качество картинки в видеофильмах (аппаратное декодирование MPEG2/DVD поддерживают все современные интегрированные чипсеты ATI). Формально 9100 PRO IGP обладает еще и усовершенствованным контроллером памяти, оптимизированным для работы с процессорами на ядре Prescott, но на практике если какие-то различия там и имеются, то эффект от них гомеопатический.

«Червоточинка» 9100 IGP заключается в южном мосте, а вернее, в том жалком его подобии, которое этот мост обычно заменяет. Функциональность линейки IXP 150/200/250 ограничена двумя каналами UATA/100, шестью портами USB 2.0, стомегабитной сетью да звуком AC’97. Для 2004 года, прямо скажем, маловато. Формально существует и «продвинутый» южный мост IXP 300, поддерживающий пару каналов SATA и простейший RAID, но используют его почему-то редко, предпочитая ставить контроллеры сторонних производителей. Связь между южным и северным мостами — по довольно медленной вариации на тему PCI (32 бит, 66 МГц). Словом, восхищаться здесь нечем — возможности северного моста с его устаревающей графической подсистемой большинство геймеров пока что удовлетворят (и даже позволят вполне комфортно играть в игры недалекого прошлого), но южного — устроят только самых непритязательных пользователей.

Intel GMA 900 (i915G)

Intel Graphics Media Accelerator 900 — плод долгих исканий микропроцессорного гиганта. К решению, поддерживающему DirectX 9, Intel шла три года, в течение которых она не решалась отказаться от безнадежно устаревающей тайловой архитектуры ускорителя (позаимствованной у Kyro еще во времена Riva TNT2). Ранее выходившие решения (i815G, i845G, i865G) (Подробные обзоры прошлых интегрированных графических решений Intel читайте на нашем сайте (www.terralab.ru/system/17920, …/33612, …/33401, …/33613, …/33871, …/34451 и …/34567)) ничего кардинально нового, кроме постепенно возраставших тактовых частот ядра и памяти, не приносили — и в конечном счете над «экстремальной» графикой от Intel (официальное название для ИГ чипсетов i845G/i865G — Intel Extreme Graphics) не посмеивался только ленивый. Сохранена тайловая архитектура и в GMA 900 (подробности во врезке на предыдущей странице) — подобный подход довольно экономично расходует полосу пропускания оперативной памяти, а именно ее интегрированным графическим решениям зачастую и не хватает. Разумеется, никуда не делись и присущие этой архитектуре недостатки — например, чрезмерная сложность организации соответствующего геометрического сопроцессора. Впрочем, решение проблемы в данном случае оказалось несложным: инженеры попросту выкинули из ускорителя геометрический блок (в отличие от решений ATI и nVidia, где сопроцессор все же присутствует) и возложили его функции на центральный процессор. Поэтому вершинные шейдеры GMA 900 не поддерживает, а эмулирует и с этой точки зрения не является полноценным DirectX9-решением. Зато блоки закраски у этого графического ядра совершенно новые, построенные по современной схеме и полностью поддерживающие пиксельные шейдеры 2.0. Говорят даже, что в их разработке принимали участие специалисты ATI. Причем число конвейеров по сравнению с предыдущим поколением графики увеличили сразу вчетверо, а частоту ядра повысили до 333 МГц, так что по основным техническим характеристикам интеловский чипсет теперь (по крайней мере на бумаге) наголову обходит конкурентов (см. табл. 1) и примерно вдвое обгоняет своего (кстати, весьма неплохого, см. www.terralab.ru/system/34567) предшественника i865G в тестах.

Кроме того, при помощи простенькой карточки расширения ADD2 (на фото справа), которую можно вставить в имеющийся на платах с чипсетом i915G разъем PCI Express x16 (реально такая платка использует лишь PCIE x4), процессор Intel GMA 900 позволяет подключать к системе второй независимый монитор (по DVI) или даже телевизор (по TV-out) — в зависимости от того, что реализовано на платке ADD2. Эта новая для Intel фича (прежние чипсеты Intel позволяли подключать второй монитор, но он не мог быть полностью независимым) предназначена, в частности, для поддержки концепции цифрового дома, когда семья с одного компьютера сможет делать сразу несколько дел — например, играть в игру и смотреть фильм. К сожалению, в Intel (в отличие от ATI) пока не предусмотрели возможность одновременного использования встроенной и внешней графики — при установке обычной видеокарты в слот PCI Express x16 сможет работать только что-нибудь одно из них.

Прибавьте сюда поддержку двухканальной памяти DDR2-533, любых процессоров с FSB 533 и 800 МГц, а также весьма перспективный слот PCI Express x16 для подключения внешней видеокарты и еще несколько линков PCI Express x1 в южном мосте чипсета, четыре порта SATA и RAID с поддержкой фирменной технологии Intel Matrix Storage Technology (то есть возможность организации RAID из отдельных разделов на жестком диске), великолепную аудиоподсистему, поддерживающую воспроизведение «звука высокого разрешения» (например, 192 кГц/32 бит и до восьми каналов ввода-вывода), и станет понятно, что монополии Intel на рынке чипсетов для Pentium 4 еще долго ничего угрожать не будет. Расстраивает лишь то, что i915G поддерживает всего один IDE-канал, на который почти наверняка будет «повешен» оптический накопитель — соответственно, волей или неволей, владельцу подобной системы придется использовать SATA-винчестеры или дополнительные контроллеры. Во всем остальном GMA 900 — отличный и даже в чем-то революционный продукт.

ATI Radeon Xpress 200

Продав за последние три года 15 млн. чипсетов, ATI решила повести более агрессивное наступление в сегменте системных чипсетов с ИГ. И первенец «новой волны» — Xpress 200, известный также под кодовым названием RS480, — это очень перспективный на данный момент чипсет для процессоров микроархитектуры AMD64. Появившийся совсем недавно — официальное объявление состоялось 8 ноября 2004 года, он интересен не столько как новый системный чипсет (здесь с nVidia, VIA и SiS конкурировать трудно), сколько как первый на рынке чипсет с интегрированной графикой для AMD Athlon 64. Впрочем, и в первом качестве он выгодно отличается от конкурентов-предшественников. Судите сами: 22 линии шины PCI Express в северном мосте, идеальный для разгона полностью асинхронный чипсет, интегрированное графическое ядро на базе младшей модели в линейке полноценных дискретных 3D-ускорителей, оригинальный встроенный контроллер видеопамяти, очень интересный набор интегрированной периферии…

Следуя легендарному примеру nVidia nForce 2, канадская компания включила в свой «топовый» чипсет несколько урезанное графическое ядро начального уровня, которым в данном случае является самое дешевое PCI Express-решение ATI — Radeon X300 (кстати, цены на эти видеокарты в Москве на момент написания обзора — 80–100 долларов). Только nVidia в nForce2 значительно (до 200 МГц) снизила частоту ядра, а канадцы вместо этого вдвое сократили число конвейеров (с четырех до двух) — решение довольно спорное, но как мы вскоре увидим, вполне конкурентоспособное. Между прочим, в Intel GMA900 конвейеров вдвое больше, их частота выше (см. табл. 1), доступная оперативная память — в среднем более быстрая, и вдобавок похоже, что интеловское решение еще и греется меньше. Судя по всему, сложность даже X300 для интегрированной графики оказалась неоправданно большой — в более или менее разумных размеров, цены и тепловыделения кристалл четыре конвейера уже не помещались.

Казалось бы, точно такой же подход (с более старым графическим ядром) был использован в 9100 IGP, но на самом деле это не совсем так: у RS480 (помимо достойной производительности) есть два уникальных отличия. Прежде всего, это первый интегрированный чипсет на рынке, полностью аппаратно поддерживающий все функции DirectX 9.0 (вершинные и пиксельные шейдеры версии 2.0) — даже GMA 900 от Intel этим похвастаться не может; кроме того, аппаратно поддерживаются антиалиасинг (сглаживание) уровней 2, 4 и 6. И вдобавок Xpress 200 может работать не только с «обычной» системной оперативной памятью компьютера, но и с отдельной видеопамятью, интегрируемой на материнскую плату, — здесь используется фирменная технология ATI HyperMemory (см. врезку). Нечто подобное (отдельная видеопамять для интегрированного графического ядра) можно встретить, например, на серверных материнских платах (для Opteron и Xeon/P4), но для «домашнего» рынка такой подход в общем-то в новинку. Решение довольно сложное, и пошли на него, конечно, не от хорошей жизни. Интегрировав контроллер оперативной памяти непосредственно в процессор, AMD выиграла ровно столько же, сколько потеряли лишенные собственной графической памяти видеокарты: ведь раньше они могли обращаться к системной памяти напрямую (а процессору приходилось в это время «стоять в очереди» северного моста), а теперь все наоборот — напрямую работает с памятью процессор, а интегрированная графика каждый раз обращается через чипсет и относительно медленную (для графики) шину к центральному процессору. Особенно неприятно то, что обращаться к оперативной памяти приходится постоянно, а значит, при использовании интегрированной графики процессор архитектуры K8 всегда будет загружен какой-то работой (и не сможет, например, перейти в энергосберегающий режим). Поэтому инициатива ATI по организации отдельной «видеопамяти» выглядит здраво (да и пара лишних процентов скорости, которую она в любом случае обеспечивает, тоже лишними не будут).

Чисто технически контроллер RS480 позволяет подключить до 128 Мбайт локальной видеопамяти (форматов DDR/GDDR) с 32- или 64-разрядной шиной и рабочей частотой от 200 до 350 МГц. По производительности это примерно эквивалентно от PC100 SDRAM до одноканальной PC2700 DDR, что даже в лучшем случае заметно меньше, чем обеспечивает простейший двухканальный DDR-чипсет или процессор K8. Но зато вся эта память подключена напрямую и находится в монопольном распоряжении графического процессора. На практике же на попавшей к нам в руки референсе-плате от ATI были установлены скромные 16 Мбайт 32-разрядной DDR350 (примерно уровень системной памяти PC166, популярной несколько лет назад у оверклокеров).

«Плоская» (то есть 2D) часть графического ядра — это отличный 10-разрядный 400-МГц RAMDAC с двумя независимыми выходами на мониторы (или монитор+TV), встроенной поддержкой TV-out (приятно удивило наличие в BIOS Setup десятка вариантов его функционирования, включая несколько подвидов PAL) и цифрового видеовыхода DVI. Кроме того, интегрированную графику можно (в отличие от Intel 915G) использовать одновременно с дискретной, в частности — работать сразу с тремя (а в будущем — и с четырьмя) мониторами, установив в слот PCI Express x16 видеокарту от ATI (традиционные драйверы Catalyst это позволяют). И это не просто маркетинговые заявления: на протестированной материнской плате действительно было разведено два независимых видеовыхода, один из которых был цифровым (см. фото), что выглядело очень непривычно.

Кстати, как и 9100 PRO IGP, чипсет Xpress 200 поддерживает аппаратное декодирование видеопотока MPEG2 и технологию FullStream, обеспечивающую значительное улучшение качества (по сравнению с обычными декодерами). Например, специальные технологии аппаратного деинтерлейсинга позволяют на ходу улучшать картинку с TV-тюнера.

Впрочем, одного лишь интегрированного графического ядра, пусть даже превосходного, для коммерческого успеха чипсета недостаточно. nForce2 подкупал еще своей непревзойденной системной производительностью, став на долгие годы самым быстрым чипсетом для платформы AMD Athlon XP. Но здесь ATI блеснуть, увы, не удастся: все по той же архитектурной причине (интегрированный контроллер памяти) производительность систем на процессорах Athlon 64 практически не зависит от используемого чипсета. Зато Xpress 200 может похвастаться отличной разгоняемостью (полноценная поддержка всех мыслимых видов разгона, асинхронный режим работы с раздельным тактированием всех шин и интерфейсов) и прекрасной периферией на основе модной сегодня шины PCI Express. Северный мост поддерживает рекордные 22 линии (К слову, у Intel 915G, например, лишь шестнадцать линий PCIE у северного моста и четыре — у южного, который подключен к северному проприетарной шиной Direct Media Interface (DMI), являющейся по сути слегка модифицированной PCI Express x4) этой последовательной шины, две из которых, правда, уходят на подключение южного моста и шестнадцать — на графическую шину PCI Express x16. Оставшиеся четыре линии могут задействоваться для прямого подключения к северному мосту любой периферии. В первую очередь — гигабитного сетевого контроллера, поскольку интегрированную сеть инженеры ATI выкинули из чипсета совсем, рассудив, что качественное производительное решение все равно целесообразнее ставить дискретное и напрямую подключать к северному мосту, а дешевую сеть, в крайнем случае, подключат к южному мосту по стандартному интерфейсу PCI.

Остальной набор функций южного моста хоть и не оригинальный, но вполне современный: AC’97, два канала UltraATA/133, четыре порта SATA с возможностью организации массива RAID уровней 0 и 1. Так что чипсету можно заслуженно поставить пятерку и за наличие всего принципиально необходимого, и за интегрированную графику, и за инновации. Жаль только, что, в отличие от nForce 2 IGP, «пятерки с плюсом» он не заслуживает: за исключением отсутствующего пока графического ядра чипсет nVidia nForce4 привлекательнее по всем параметрам. Вот выйди Xpress месяца на три раньше (как и полагается «экспрессу» и как, собственно, изначально и планировалось) — и его вариант без интегрированной графики (200P) смотрелся бы неплохо, а на сегодня, пожалуй, интерес представляет лишь интегрированный 200. ATI, кстати, готовит аналогичный чипсет и для платформы Intel. Он носит условное название RS400 и, думается нам, уже практически готов для выхода на рынок, однако (возможно, по каким-то кросс-маркетинговым соображениям) ATI не спешит с его объявлением, отложив его до января 2005 года.

ATI HyperMemory/SidePort и особенности функционирования интегрированной графики в системах на AMD Athlon 64


Традиционная архитектура современного ПК — это связка процессор-северный мост-южный мост. Процессор занят исключительно выполнением программного кода, северный мост обеспечивает связь CPU с ключевыми компонентами компьютера (в первую очередь — с оперативной памятью), южный мост — интегрирует основную часть периферии. Гибкость у такой схемы почти неограниченная — одинаковые во всем остальном системы могут использовать процессоры с разными сокетами, различные типы оперативной памяти, разную периферию. Однако расплата за универсальность всегда одна и та же — падение скорости работы. Здесь мы не будем рассматривать вопрос, почему интеграция контроллера памяти в процессоры Athlon 64 позволила AMD радикально повысить быстродействие подсистемы памяти, отметим лишь одно из практических следствий этого шага: если раньше интегрированная графика (а иногда и дискретная видеокарта) работала с оперативной памятью практически напрямую (через северный мост, частью которого ИГ и является), то теперь все запросы к памяти графическое ядро вынуждено проводить через процессор. Со всеми вытекающими последствиями — ограниченным быстродействием системной шины (даже HyperTransport 1 ГГц имеет пропускную способность в одну сторону лишь 4,0 Гбайт/с из максимально возможных 6,4 Гбайт/с), несколькими посредниками в цепочке, ограниченными возможностями по оптимизации работы с памятью. Интегрированная графика, по сути дела, оказывается в том же положении, в котором в классических системах находится центральный процессор, — и судя по результатам тестов нашего обзора, положении далеко не самом выигрышном. С другой стороны, в северном мосте, «освобожденном» от контроллера памяти и сопутствующей логики (DMA, GART), остается так много свободного места, что это даже позволило nVidia объединить в своих чипсетах оба моста в одном кристалле. И если все дискретные графические ускорители используют специальную графическую память, интегрируемую непосредственно на плату, так почему бы не распаять на материнской плате выделенную графическую память и для интегрированной графики? Вероятно, так рассуждали и инженеры ATI, проектируя технологию под названием HyperMemory.

Само по себе решение ATI не ново — похожие подходы использовались с незапамятных времен, но в нынешних десктопных материнских платах его не встретишь. Как уже говорилось, SidePort — это от 16 до 128 мегабайт интегрированной на материнскую плату видеопамяти DDR или GDDR с шириной шины 32 или 64 разряда и частотой от 200 до 350 МГц — довольно скромные, конечно, цифры, которых, однако, интегрированному видеоядру вполне хватает — ведь память подключена к нему напрямую и находится в его монопольном распоряжении. Впрочем, классическая системная оперативная память тоже не забыта: настройки BIOS Setup позволяют Xpress 200 функционировать в трех различных режимах. В первом (UMA) «бортовая» видеопамять не используется вообще. Во втором (SidePort) — используется только она. И, наконец, в режиме UMA+SidePort ИГ старается максимально задействовать возможности обоих подсистем памяти.

Результаты, полученные нами в ходе испытаний (см. следующую статью), показывают, что режим UMA — самый медленный: в нем интегрированное графическое ядро и в нетрехмерных приложениях притормаживает процессор, и в играх показывает себя не с лучшей стороны. Включение SidePort сразу избавляет от всех негативных эффектов воздействия интегрированного ядра на «повседневную» производительность CPU, однако использование на нашем тестовом ATI Reference RS480 всего 16 мегабайт 32-разрядной DDR-350 (на фото внизу; слишком малый объем и ПСП в районе жалких 1,4 Гбайт/с) все же не дает графическому ядру развернуться в полную силу (это особенно заметно в синтетических тестах и старых играх, сильнее нагружающих оперативную память, нежели графический процессор). А вот связку UMA+SP следует считать оптимальной — и овцы целы (процессор не «отвлекается по пустякам»), и волки сыты (в режиме максимальной нагрузки системная память приходит на выручку маломощной графической).

- По материалам еженедельника "Компьютерра"

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.