Архивы: по дате | по разделам | по авторам

Встроенный ускоритель

Архив
10.12.2004

Графический ускоритель (видеокарта) — неотъемлемый компонент любого компьютера.

Графический ускоритель (видеокарта) — неотъемлемый компонент любого компьютера. В свете повальной интеграции всего и вся на материнскую плату мы практически забыли о существовании сетевых карт PCI, почти не покупаем звуковые платы, но графический ускоритель предпочитаем по-прежнему отдельный — невзирая даже на то, что за самый простой, непритязательный, провалявшийся на складах года два кусочек текстолита приходится платить примерно тысячу рублей (то есть около 10% стоимости недорогого системного блока). А не слишком старая видеокарта начального уровня (GeForce FX 5200, Radeon 9200) или последние решения вроде GF6200 и X300 обойдутся в два-три раза дороже — примерно в ту же сумму, что и пять сетевых или две звуковые карты (или одна-две «сетевухи» и одна «звуковуха» — если рассматривать продвинутые варианты), на покупке которых мы, тем не менее, стараемся экономить, часто предпочитая решения, интегрированные в материнскую плату.

Справедливо ли это? И правильно ли, что многие отечественные продавцы компьютеров — от менеджеров в торговых залах до руководителей крупных и известных компаний-производителей ПК — зачастую пренебрегают интегрированными графическими решениями и по старинке рекомендуют несведущему покупателю потратиться на видеокарту, когда необходимости в этом покупатель фактически не испытывает?

Ведь объективных причин недолюбливать современную интегрированную графику (ИГ) нет! Чтобы убедиться в этом, достаточно обратиться к опыту западных производителей — например, крупнейшего поставщика компьютеров в Америке, гиганта Dell. В персоналках серии Dell Dimension 3000 для конфигурации начального уровня (~$550) графическая плата не предусматривается вообще — то есть по желанию заказчика в системный блок установят процессор вплоть до Pentium 4 3.0E и два гигабайта оперативной памяти, но только не видеокарту. А в «средней» по функциональности модели Dimension 4700 (~$800) видеокарта хоть и внесена в список «рекомендованных» аксессуаров, но предлагается за отдельные деньги. Более 60% персональных компьютеров в мире сегодня продается именно с ИГ. И хотя в России любят идти своим путем (Покупая видеокарты «на вес», то есть руководствуясь объемом установленной оперативной памяти, а не реальными характеристиками производительности), недооценивать чужой опыт не стоит.

Что же может предложить современный чипсет с ИГ? Как ни странно — почти все, что необходимо пользователю домашнего или офисного ПК! В первую очередь — прекрасное качество выходного сигнала («2D-картинку»). От видеокарты ожидают кристально четкого отображения графики и текста, любые огрехи в этой «повседневной» пользовательской деятельности совершенно недопустимы. «Плохое качество 2D» — один из устаревших мифов об ИГ, который имел под собой основания еще два-три года назад, но только не сейчас: разработчики графических ядер и материнских плат прекрасно понимают свои задачи и на блоках формирования видеосигнала не экономят. Например, в чипсете Intel 915G с графическим ядром Intel Graphics Media Accelerator 900 установленные для вывода сигнала ЦАПы (их называют RAMDAC) работают на частоте 400 МГц — такой же, как у самых навороченных ускорителей. И это, кстати, на 40 МГц больше, чем у славившегося своей непревзойденной «профессиональной» картинкой культового когда-то Matrox Millennium G450! Качество изображения обеспечивается, конечно, не только RAMDAC’ом, но прогресс в этой области очевиден.

Ограничения ИГ здесь кроются в другом: большинство современных видеокарт несут на борту телевизионный выход (TV-out), выход на второй монитор, цифровой DVI-выход, а интегрированные решения их, как правило, пока лишены — например, многие интегрированные чипсеты Intel в принципе позволяют добавить и DVI-, и видеовыход, но для этого требуется установить в слот AGP (или PCI Express x16) карточку ADD (или ADD2, см. ниже), но видели ли вы такую карточку в магазине? Между тем большинство пользователей не сочтет это серьезным недостатком: второй монитор нужен немногим, DVI имеет свои ограничения, а терпение для подключения и настройки телевизионного выхода есть далеко не у всех (тем более что на современных материнских платах уже разводят и TV-out).

Во-вторых, современный чипсет с ИГ может предложить отменную производительность в нетрехмерных приложениях. Вопреки еще одному мифу, родившемуся во времена, когда типичной оперативной памятью в компьютере была SDRAM PC100, ИГ почти не уменьшает производительность компьютера в задачах, не использующих возможности 3D-ускорителя. Графическое ядро, конечно, забирает от 70 до 700 Мбайт/с пропускной способности оперативной памяти (например, в типичном случае при экранном разрешении 1280x1024 и 32-битном цвете с частотой обновления картинки 85 Гц на формирование картинки расходуется 400 Мбайт/с), однако по нынешним меркам это немного — при пересчете в относительные цифры мы получим скромные 5–15% потери по далеко не самому важному для производительности системы показателю. В реальных же приложениях, как показывает тестирование, различия становятся и вовсе незаметными.

В-третьих, как ни странно, на нынешних интегрированных графических чипсетах можно вполне комфортно играть в трехмерные игры. Производительность ИГ, как и три года назад, соответствует самым дешевым «полноценным» ускорителям, однако если пересчитать ее в «абсолютные», а не относительные значения, то окажется, что в большинстве случаев хватает и этой малости. Раньше многие интегрированные чипсеты «славились» несовместимостью с половиной игр (и серьезными проблемами — со второй половиной), но сегодня половину приличных ИГ выпускают такие брэнды, как ATI и Nvidia, собаку съевшие на этом деле, а вторую половину — безраздельно доминирующая на графическом рынке Intel, которой принадлежит почти треть рынка всей графики (больше, чем у ATI или Nvidia) и под которую так или иначе подстраиваться приходится всем.

И последний довод за интегрированную графику — добавить мощную видеокарту в систему никогда не поздно.

Итак, наш рассказ — о лучших современных чипсетах с ИГ, которые не только не стыдно иметь в своих ПК, но и рекомендуется использовать как можно чаще.



 

Особенности интегрированной графики Intel Graphics Media Accelerator 900


Помимо непривычно мощной для ИГ подсистемы из четырех графических конвейеров закраски, работающих на 333 МГц, и превосходной подсистемы памяти, Intel GMA 900 включает в себя две принципиально важные технологии — Intel Zone Rendering Technology 3 и Dynamic Video Memory Technology (DVMT) версии 3.0.

ZRT — это «конек» всех ИГ от Intel, начиная еще с чипсетов i830 и i845. Предыстория такова: в эпоху зарождения индустрии 3D-графики компания PowerVR выработала оригинальный подход к построению 3D-изображения: картинка строится не «одним большим куском», как в большинстве ускорителей, а «маленькими кусочками» — тайлами (от англ. tile — кусочек). Чтобы не выводить на экран всю сцену треугольник за треугольником (определяя с помощью Z-буфера, какие треугольники расположены ближе, а какие дальше), тайловый акселератор разбивает экран на сетку из небольших прямоугольников (тайлов), а затем по очереди отрисовывает каждый тайл. Это, казалось бы, небольшое отличие позволяет оптимизировать процесс построения изображения, резко повысив КПД использования памяти. PowerVR успела даже выпустить на основе тайловой технологии небезызвестную линейку ускорителей Kyro — линейку неплохую, но, увы, не выдержавшую острейшей рыночной конкуренции того времени.

Но тайловая архитектура не погибла, а была лицензирована Intel для использования в своих графических ядрах. Только вот вызывающее мрачные ассоциации слово «тайл» корпорация всюду заменила на «зону» (zone) — имя другое, а смысл тот же.

Техника зонного рендеринга подразумевает предварительную сортировку образующих сцену треугольников по тайлам: прежде чем приступить к рендерингу картинки, процессор должен составить списки треугольников, попадающих в каждый из тайлов. Переложить работу по сортировке списка треугольников на традиционный аппаратный вершинный конвейер, используемый современными ускорителями классической организации, к сожалению, слишком сложно, так что этот этап работы выполняется исключительно центральным процессором, а блок T&L в GMA 900 вообще отсутствует. С учетом мощности современных CPU это обычно не становится серьезной проблемой, но в играх типа Far Cry, в которых в кадре ежесекундно отображаются сотни тысяч треугольников, GMA 900 оказывается в невыгодном положении по сравнению с конкурентами (сортировка такого массива треугольников — процесс небыстрый). Кроме того, тайловый ускоритель не может одновременно рассчитывать геометрию и строить сцену; отрисовку картинки он начинает только с того момента, как центральный процессор закончит сортировать мегабайты исходных данных и передаст их ускорителю. Все это — минусы ZRT, однако для ИГ они, как правило, компенсируются двумя плюсами. Первый из них — работа с предварительно отсортированным массивом треугольников на кусочке экрана «локальна»; она затрагивает малую область памяти и эффективно кэшируется. Запихнуть в небольшой буфер ускорителя все данные сцены невозможно, а вот данные малого ее участка — вполне реально. Во-вторых, изображение строится «по кусочкам», и интенсивно задействуемый в ходе этих вычислений фрейм-буфер (область памяти, где хранится построенная картинка) тоже удается целиком разместить в графическом процессоре. Да и оптимизировать построение отдельно взятого тайла, в который попадет лишь несколько треугольников, гораздо проще, чем всей сцены. В целом — где-то ZRT тормозит GPU, где-то наоборот; но то, что этот подход корпорация Intel активно эксплуатирует несколько лет, говорит о том, что преимущества ZRT3 все же перевешивают недостатки.

Вторая ключевая технология, DVMT, гораздо проще и состоит лишь в том, что интегрированное графическое ядро может на лету изменять объем используемой видеопамяти. Классические ИГ с архитектурой UMA (Unified Memory Architecture, то есть когда используется оперативная память компьютера), как правило, резервируют под свои нужды некий довольно большой кусок оперативной памяти — от 32 до 128 мегабайт (см. фото), который становится недоступным другим программам (в системе видно не 512 мегабайт, а, скажем, 448), хотя большую часть времени он простаивает. DVMT позволяет исправить эту ситуацию: ускоритель резервирует лишь минимально необходимый объем памяти (Pre-Allocated, от 1 до 16 мегабайт под фрейм-буфер и служебные данные) плюс некий фиксированный (Fixed, 32–128 Мбайт) или динамический (DVMT, не менее 32 Мбайт) объем для «пользовательских» данных. При объеме памяти не менее 256 мегабайт можно совместно использовать фиксированную и динамическую память DVMT и Fixed (64 + 64 Мбайт). «Служебная» Pre-allocated и фиксированная часть графической памяти скрыты от операционной системы и пользователя — это «традиционный» подход. А вот DVMT-память — это обычная оперативная память (находящаяся в распоряжении операционной системы), которую драйвер DVMT запросил под свои цели у ОС, зафиксировал и прописал в таблице трансляции виртуальной графической памяти (GTT). Изменение в архитектуре UMA совсем небольшое, а в итоге пользователь при работе с обычными системными приложениями получает дополнительные мегабайты оперативной памяти. Отметим, что аналоги DVMT используют и другие производители — в частности, выделять графическую память на лету умеет и Xpress 200.

Nvidia nForce 2 IGP

Начнем мы с легендарного чипсета, не упомянуть который при обзоре интегрированной графики невозможно. Для все еще популярной платформы Socket A (AMD Athlon XP/Sempron) он просто не имеет альтернативы! Достаточно сказать, что до появления nForce(2) фирма Nvidia была никем на рынке системных чипсетов и благодаря ему всего за пару лет смогла стать производителем «номер 1» чипсетов для процессоров AMD (ее рыночная доля сейчас составляет порядка 50%). Даже спустя два года после выхода (Целая эпоха прошла! Для сравнения: за это же время сменилось три поколения графических ускорителей, два поколения (и четыре ядра) процессоров, появился новый тип оперативной памяти и принципиально новая шина для плат расширения — PCI Express. А nForce 2 как был лучшим, так и остался) северный мост nForce2 IGP (IGP = Integrated Graphics Processor, распространенное обозначение для чипсета с интегрированной графикой) (особенно в варианте Ultra 400) является лидером по производительности в своем классе — догнать (но не перегнать) его смог разве что вышедший полгода назад чипсет VIA (без ИГ). Первоклассный интегрированный контроллер памяти (до выхода Athlon 64 удерживавший пальму первенства по времени доступа к оперативной памяти) дополняется отличными возможностями для разгона (фиксированные частоты шин PCI и AGP, хорошая разгоняемость чипсета — отдельные экстремалы даже вручную делали «вольтмоды», не без помощи паяльника повышая напряжение на северном мосте) и одним из лучших южных мостов (отличный интегрированный звук с аппаратным ускорением, целых два сетевых контроллера, FireWire, быстрая шина HyperTransport).

И интегрированное графическое ядро у nForce2 тоже отменное — NV17, то есть аналог GeForce4 MX 420 (от которого его и взяли). По маркетинговым соображениям Nvidia, к сожалению, лишила линейку GeForce4 MX поддержки каких-либо шейдеров, ограничившись полной функциональностью DirectX 7 (включая Hardware T&L) и поддержкой фирменных технологий, вроде DOT3. Поэтому считать nForce2 IGP современным интегрированным решением нельзя — все-таки без шейдеров в нынешних играх «уже никуда» (подробнее см., например, в «КТ» #566). В принципе, поиграть в Doom 3 и FarCry это не помешает, но картинка будет гораздо хуже, чем при использовании новейших графических чипсетов. Зато в старых играх производительности этого морально устаревшего ядра хватает с лихвой, популярность Socket A все еще велика, да и Nvidia не так давно обновила линейку южных мостов для nForce2, добавив туда гигабитную сеть, SATA и RAID, которых не хватало чипсету, дабы соответствовать нынешним реалиям. Так что мы решили включить его в наш обзор в качестве «отправной точки» и представителя уходящего поколения чипсетов и процессоров. Подробнее об nForce2 можно почитать в наших статьях на www.terralab.ru/system/35548  и .../35549, а характеристики nForce2 в сравнении с соперниками представлены в таблице 1.

*      Только для 400 и Ultra 400. **      Кроме nForce2 400. ***      Только для Ultra 400. ****      Под формулой графического ядра здесь понимается число вершинных и пиксельных конвейеров соответственно (см. «КТ» #566, с. 29).

ATI Radeon 9100 IGP

Radeon 9100 IGP (RS300) появился на свет почти год назад и с тех пор завоевал славу одного из лучших ИГ-решений для платформы Pentium 4. Вообще говоря, «трехсотка» — далеко не первый интегрированный чипсет канадской компании (тут можно вспомнить Radeon 320 IGP, 340 IGP и 7000 IGP), однако ранние образцы, как и у ее «заклятого приятеля» Nvidia, были не слишком удачными и в массовую продажу в сегменте настольных компьютеров так и не попали (хотя для мобильных применений шли бойко). Итак, 9100 IGP стал первым «общедоступным» чипсетом компании, предназначенным для процессоров Pentium 4. Его интегрированное графическое ядро построено на урезанном варианте старого доброго Radeon 8500, который маркетологи в свое время переименовали для «совместимости» с остальной линейкой продуктов компании в Radeon 9100 (отсюда, видимо, и пошло название самого чипсета). Только оригинальный 9100 — это четыре конвейера рендеринга по одному TMU на конвейер, а 9100 IGP урезан вдвое — всего два конвейера рендеринга, хотя и функционирующих на довольно высокой для интегрированной графики частоте 300 МГц. Шейдеры поддерживаются, но только «эпохи DirectX 8.1» — пиксельные версии 1.4 и вершинные версии 1.1. Не смертельно, но неприятно: хотя в игрушках и будет в большинстве случаев естественная и живая картинка, к некоторым играм, к сожалению, это правило не относится — например, свежий Half-Life 2 без поддержки шейдеров второй версии не умеет толком рисовать воду. За вывод картинки на экран отвечает далеко не новый, но более или менее приличный блок 2D (10-битный 300 МГц RAMDAC). В итоге — полноценное, но все же относительно старое (конечно, по меркам нынешних дискретных ускорителей) графическое решение.

Оставшийся набор функций северного моста у 9100 IGP вполне достойный: поддержка FSB 400, 533 и 800 МГц и Hyper-Threading, быстрый двухканальный контроллер памяти DDR400 (не такой быстрый, как у Intel 865G, поэтому по общесистемной производительности 9100 IGP он уступает мэйнстриму от Intel) и возможность подключения внешней видеокарты по графической шине AGP 8x. Выпускается и «облегченный» вариант этого чипсета — 9000 IGP, который отличается от старшего собрата отсутствием второго канала для DDR-памяти, что сразу снижает его шансы на получение выдающейся производительности 3D-графики, но делает привлекательным для мобильных применений. Есть, наконец, и «профессиональная» версия северного моста — 9100 PRO IGP, поддерживающая технологию FullStream, которая улучшает качество картинки в видеофильмах (аппаратное декодирование MPEG2/DVD поддерживают все современные интегрированные чипсеты ATI). Формально 9100 PRO IGP обладает еще и усовершенствованным контроллером памяти, оптимизированным для работы с процессорами на ядре Prescott, но на практике если какие-то различия там и имеются, то эффект от них гомеопатический.

«Червоточинка» 9100 IGP заключается в южном мосте, а вернее, в том жалком его подобии, которое этот мост обычно заменяет. Функциональность линейки IXP 150/200/250 ограничена двумя каналами UATA/100, шестью портами USB 2.0, стомегабитной сетью да звуком AC’97. Для 2004 года, прямо скажем, маловато. Формально существует и «продвинутый» южный мост IXP 300, поддерживающий пару каналов SATA и простейший RAID, но используют его почему-то редко, предпочитая ставить контроллеры сторонних производителей. Связь между южным и северным мостами — по довольно медленной вариации на тему PCI (32 бит, 66 МГц). Словом, восхищаться здесь нечем — возможности северного моста с его устаревающей графической подсистемой большинство геймеров пока что удовлетворят (и даже позволят вполне комфортно играть в игры недалекого прошлого), но южного — устроят только самых непритязательных пользователей.

Intel GMA 900 (i915G)

Intel Graphics Media Accelerator 900 — плод долгих исканий микропроцессорного гиганта. К решению, поддерживающему DirectX 9, Intel шла три года, в течение которых она не решалась отказаться от безнадежно устаревающей тайловой архитектуры ускорителя (позаимствованной у Kyro еще во времена Riva TNT2). Ранее выходившие решения (i815G, i845G, i865G) (Подробные обзоры прошлых интегрированных графических решений Intel читайте на нашем сайте (www.terralab.ru/system/17920, …/33612, …/33401, …/33613, …/33871, …/34451 и …/34567)) ничего кардинально нового, кроме постепенно возраставших тактовых частот ядра и памяти, не приносили — и в конечном счете над «экстремальной» графикой от Intel (официальное название для ИГ чипсетов i845G/i865G — Intel Extreme Graphics) не посмеивался только ленивый. Сохранена тайловая архитектура и в GMA 900 (подробности во врезке на предыдущей странице) — подобный подход довольно экономично расходует полосу пропускания оперативной памяти, а именно ее интегрированным графическим решениям зачастую и не хватает. Разумеется, никуда не делись и присущие этой архитектуре недостатки — например, чрезмерная сложность организации соответствующего геометрического сопроцессора. Впрочем, решение проблемы в данном случае оказалось несложным: инженеры попросту выкинули из ускорителя геометрический блок (в отличие от решений ATI и Nvidia, где сопроцессор все же присутствует) и возложили его функции на центральный процессор. Поэтому вершинные шейдеры GMA 900 не поддерживает, а эмулирует и с этой точки зрения не является полноценным DirectX9-решением. Зато блоки закраски у этого графического ядра совершенно новые, построенные по современной схеме и полностью поддерживающие пиксельные шейдеры 2.0. Говорят даже, что в их разработке принимали участие специалисты ATI. Причем число конвейеров по сравнению с предыдущим поколением графики увеличили сразу вчетверо, а частоту ядра повысили до 333 МГц, так что по основным техническим характеристикам интеловский чипсет теперь (по крайней мере на бумаге) наголову обходит конкурентов (см. табл. 1) и примерно вдвое обгоняет своего (кстати, весьма неплохого, см. www.terralab.ru/system/34567) предшественника i865G в тестах.

Кроме того, при помощи простенькой карточки расширения ADD2 (на фото справа), которую можно вставить в имеющийся на платах с чипсетом i915G разъем PCI Express x16 (реально такая платка использует лишь PCIE x4), процессор Intel GMA 900 позволяет подключать к системе второй независимый монитор (по DVI) или даже телевизор (по TV-out) — в зависимости от того, что реализовано на платке ADD2. Эта новая для Intel фича (прежние чипсеты Intel позволяли подключать второй монитор, но он не мог быть полностью независимым) предназначена, в частности, для поддержки концепции цифрового дома, когда семья с одного компьютера сможет делать сразу несколько дел — например, играть в игру и смотреть фильм. К сожалению, в Intel (в отличие от ATI) пока не предусмотрели возможность одновременного использования встроенной и внешней графики — при установке обычной видеокарты в слот PCI Express x16 сможет работать только что-нибудь одно из них.

Прибавьте сюда поддержку двухканальной памяти DDR2-533, любых процессоров с FSB 533 и 800 МГц, а также весьма перспективный слот PCI Express x16 для подключения внешней видеокарты и еще несколько линков PCI Express x1 в южном мосте чипсета, четыре порта SATA и RAID с поддержкой фирменной технологии Intel Matrix Storage Technology (то есть возможность организации RAID из отдельных разделов на жестком диске), великолепную аудиоподсистему, поддерживающую воспроизведение «звука высокого разрешения» (например, 192 кГц/32 бит и до восьми каналов ввода-вывода), и станет понятно, что монополии Intel на рынке чипсетов для Pentium 4 еще долго ничего угрожать не будет. Расстраивает лишь то, что i915G поддерживает всего один IDE-канал, на который почти наверняка будет «повешен» оптический накопитель — соответственно, волей или неволей, владельцу подобной системы придется использовать SATA-винчестеры или дополнительные контроллеры. Во всем остальном GMA 900 — отличный и даже в чем-то революционный продукт.

ATI Radeon Xpress 200

Продав за последние три года 15 млн. чипсетов, ATI решила повести более агрессивное наступление в сегменте системных чипсетов с ИГ. И первенец «новой волны» — Xpress 200, известный также под кодовым названием RS480, — это очень перспективный на данный момент чипсет для процессоров микроархитектуры AMD64. Появившийся совсем недавно — официальное объявление состоялось 8 ноября 2004 года, он интересен не столько как новый системный чипсет (здесь с Nvidia, VIA и SiS конкурировать трудно), сколько как первый на рынке чипсет с интегрированной графикой для AMD Athlon 64. Впрочем, и в первом качестве он выгодно отличается от конкурентов-предшественников. Судите сами: 22 линии шины PCI Express в северном мосте, идеальный для разгона полностью асинхронный чипсет, интегрированное графическое ядро на базе младшей модели в линейке полноценных дискретных 3D-ускорителей, оригинальный встроенный контроллер видеопамяти, очень интересный набор интегрированной периферии…

Следуя легендарному примеру Nvidia nForce 2, канадская компания включила в свой «топовый» чипсет несколько урезанное графическое ядро начального уровня, которым в данном случае является самое дешевое PCI Express-решение ATI — Radeon X300 (кстати, цены на эти видеокарты в Москве на момент написания обзора — 80–100 долларов). Только Nvidia в nForce2 значительно (до 200 МГц) снизила частоту ядра, а канадцы вместо этого вдвое сократили число конвейеров (с четырех до двух) — решение довольно спорное, но как мы вскоре увидим, вполне конкурентоспособное. Между прочим, в Intel GMA900 конвейеров вдвое больше, их частота выше (см. табл. 1), доступная оперативная память — в среднем более быстрая, и вдобавок похоже, что интеловское решение еще и греется меньше. Судя по всему, сложность даже X300 для интегрированной графики оказалась неоправданно большой — в более или менее разумных размеров, цены и тепловыделения кристалл четыре конвейера уже не помещались.

Казалось бы, точно такой же подход (с более старым графическим ядром) был использован в 9100 IGP, но на самом деле это не совсем так: у RS480 (помимо достойной производительности) есть два уникальных отличия. Прежде всего, это первый интегрированный чипсет на рынке, полностью аппаратно поддерживающий все функции DirectX 9.0 (вершинные и пиксельные шейдеры версии 2.0) — даже GMA 900 от Intel этим похвастаться не может; кроме того, аппаратно поддерживаются антиалиасинг (сглаживание) уровней 2, 4 и 6. И вдобавок Xpress 200 может работать не только с «обычной» системной оперативной памятью компьютера, но и с отдельной видеопамятью, интегрируемой на материнскую плату, — здесь используется фирменная технология ATI HyperMemory (см. врезку). Нечто подобное (отдельная видеопамять для интегрированного графического ядра) можно встретить, например, на серверных материнских платах (для Opteron и Xeon/P4), но для «домашнего» рынка такой подход в общем-то в новинку. Решение довольно сложное, и пошли на него, конечно, не от хорошей жизни. Интегрировав контроллер оперативной памяти непосредственно в процессор, AMD выиграла ровно столько же, сколько потеряли лишенные собственной графической памяти видеокарты: ведь раньше они могли обращаться к системной памяти напрямую (а процессору приходилось в это время «стоять в очереди» северного моста), а теперь все наоборот — напрямую работает с памятью процессор, а интегрированная графика каждый раз обращается через чипсет и относительно медленную (для графики) шину к центральному процессору. Особенно неприятно то, что обращаться к оперативной памяти приходится постоянно, а значит, при использовании интегрированной графики процессор архитектуры K8 всегда будет загружен какой-то работой (и не сможет, например, перейти в энергосберегающий режим). Поэтому инициатива ATI по организации отдельной «видеопамяти» выглядит здраво (да и пара лишних процентов скорости, которую она в любом случае обеспечивает, тоже лишними не будут).

Чисто технически контроллер RS480 позволяет подключить до 128 Мбайт локальной видеопамяти (форматов DDR/GDDR) с 32- или 64-разрядной шиной и рабочей частотой от 200 до 350 МГц. По производительности это примерно эквивалентно от PC100 SDRAM до одноканальной PC2700 DDR, что даже в лучшем случае заметно меньше, чем обеспечивает простейший двухканальный DDR-чипсет или процессор K8. Но зато вся эта память подключена напрямую и находится в монопольном распоряжении графического процессора. На практике же на попавшей к нам в руки референсе-плате от ATI были установлены скромные 16 Мбайт 32-разрядной DDR350 (примерно уровень системной памяти PC166, популярной несколько лет назад у оверклокеров).

«Плоская» (то есть 2D) часть графического ядра — это отличный 10-разрядный 400-МГц RAMDAC с двумя независимыми выходами на мониторы (или монитор+TV), встроенной поддержкой TV-out (приятно удивило наличие в BIOS Setup десятка вариантов его функционирования, включая несколько подвидов PAL) и цифрового видеовыхода DVI. Кроме того, интегрированную графику можно (в отличие от Intel 915G) использовать одновременно с дискретной, в частности — работать сразу с тремя (а в будущем — и с четырьмя) мониторами, установив в слот PCI Express x16 видеокарту от ATI (традиционные драйверы Catalyst это позволяют). И это не просто маркетинговые заявления: на протестированной материнской плате действительно было разведено два независимых видеовыхода, один из которых был цифровым (см. фото), что выглядело очень непривычно.

Кстати, как и 9100 PRO IGP, чипсет Xpress 200 поддерживает аппаратное декодирование видеопотока MPEG2 и технологию FullStream, обеспечивающую значительное улучшение качества (по сравнению с обычными декодерами). Например, специальные технологии аппаратного деинтерлейсинга позволяют на ходу улучшать картинку с TV-тюнера.

Впрочем, одного лишь интегрированного графического ядра, пусть даже превосходного, для коммерческого успеха чипсета недостаточно. nForce2 подкупал еще своей непревзойденной системной производительностью, став на долгие годы самым быстрым чипсетом для платформы AMD Athlon XP. Но здесь ATI блеснуть, увы, не удастся: все по той же архитектурной причине (интегрированный контроллер памяти) производительность систем на процессорах Athlon 64 практически не зависит от используемого чипсета. Зато Xpress 200 может похвастаться отличной разгоняемостью (полноценная поддержка всех мыслимых видов разгона, асинхронный режим работы с раздельным тактированием всех шин и интерфейсов) и прекрасной периферией на основе модной сегодня шины PCI Express. Северный мост поддерживает рекордные 22 линии (К слову, у Intel 915G, например, лишь шестнадцать линий PCIE у северного моста и четыре — у южного, который подключен к северному проприетарной шиной Direct Media Interface (DMI), являющейся по сути слегка модифицированной PCI Express x4) этой последовательной шины, две из которых, правда, уходят на подключение южного моста и шестнадцать — на графическую шину PCI Express x16. Оставшиеся четыре линии могут задействоваться для прямого подключения к северному мосту любой периферии. В первую очередь — гигабитного сетевого контроллера, поскольку интегрированную сеть инженеры ATI выкинули из чипсета совсем, рассудив, что качественное производительное решение все равно целесообразнее ставить дискретное и напрямую подключать к северному мосту, а дешевую сеть, в крайнем случае, подключат к южному мосту по стандартному интерфейсу PCI.

Остальной набор функций южного моста хоть и не оригинальный, но вполне современный: AC’97, два канала UltraATA/133, четыре порта SATA с возможностью организации массива RAID уровней 0 и 1. Так что чипсету можно заслуженно поставить пятерку и за наличие всего принципиально необходимого, и за интегрированную графику, и за инновации. Жаль только, что, в отличие от nForce 2 IGP, «пятерки с плюсом» он не заслуживает: за исключением отсутствующего пока графического ядра чипсет Nvidia nForce4 привлекательнее по всем параметрам. Вот выйди Xpress месяца на три раньше (как и полагается «экспрессу» и как, собственно, изначально и планировалось) — и его вариант без интегрированной графики (200P) смотрелся бы неплохо, а на сегодня, пожалуй, интерес представляет лишь интегрированный 200. ATI, кстати, готовит аналогичный чипсет и для платформы Intel. Он носит условное название RS400 и, думается нам, уже практически готов для выхода на рынок, однако (возможно, по каким-то кросс-маркетинговым соображениям) ATI не спешит с его объявлением, отложив его до января 2005 года.

ATI HyperMemory/SidePort и особенности функционирования интегрированной графики в системах на AMD Athlon 64


Традиционная архитектура современного ПК — это связка процессор-северный мост-южный мост. Процессор занят исключительно выполнением программного кода, северный мост обеспечивает связь CPU с ключевыми компонентами компьютера (в первую очередь — с оперативной памятью), южный мост — интегрирует основную часть периферии. Гибкость у такой схемы почти неограниченная — одинаковые во всем остальном системы могут использовать процессоры с разными сокетами, различные типы оперативной памяти, разную периферию. Однако расплата за универсальность всегда одна и та же — падение скорости работы. Здесь мы не будем рассматривать вопрос, почему интеграция контроллера памяти в процессоры Athlon 64 позволила AMD радикально повысить быстродействие подсистемы памяти, отметим лишь одно из практических следствий этого шага: если раньше интегрированная графика (а иногда и дискретная видеокарта) работала с оперативной памятью практически напрямую (через северный мост, частью которого ИГ и является), то теперь все запросы к памяти графическое ядро вынуждено проводить через процессор. Со всеми вытекающими последствиями — ограниченным быстродействием системной шины (даже HyperTransport 1 ГГц имеет пропускную способность в одну сторону лишь 4,0 Гбайт/с из максимально возможных 6,4 Гбайт/с), несколькими посредниками в цепочке, ограниченными возможностями по оптимизации работы с памятью. Интегрированная графика, по сути дела, оказывается в том же положении, в котором в классических системах находится центральный процессор, — и судя по результатам тестов нашего обзора, положении далеко не самом выигрышном. С другой стороны, в северном мосте, «освобожденном» от контроллера памяти и сопутствующей логики (DMA, GART), остается так много свободного места, что это даже позволило Nvidia объединить в своих чипсетах оба моста в одном кристалле. И если все дискретные графические ускорители используют специальную графическую память, интегрируемую непосредственно на плату, так почему бы не распаять на материнской плате выделенную графическую память и для интегрированной графики? Вероятно, так рассуждали и инженеры ATI, проектируя технологию под названием HyperMemory.

Само по себе решение ATI не ново — похожие подходы использовались с незапамятных времен, но в нынешних десктопных материнских платах его не встретишь. Как уже говорилось, SidePort — это от 16 до 128 мегабайт интегрированной на материнскую плату видеопамяти DDR или GDDR с шириной шины 32 или 64 разряда и частотой от 200 до 350 МГц — довольно скромные, конечно, цифры, которых, однако, интегрированному видеоядру вполне хватает — ведь память подключена к нему напрямую и находится в его монопольном распоряжении. Впрочем, классическая системная оперативная память тоже не забыта: настройки BIOS Setup позволяют Xpress 200 функционировать в трех различных режимах. В первом (UMA) «бортовая» видеопамять не используется вообще. Во втором (SidePort) — используется только она. И, наконец, в режиме UMA+SidePort ИГ старается максимально задействовать возможности обоих подсистем памяти.

Результаты, полученные нами в ходе испытаний (см. следующую статью), показывают, что режим UMA — самый медленный: в нем интегрированное графическое ядро и в нетрехмерных приложениях притормаживает процессор, и в играх показывает себя не с лучшей стороны. Включение SidePort сразу избавляет от всех негативных эффектов воздействия интегрированного ядра на «повседневную» производительность CPU, однако использование на нашем тестовом ATI Reference RS480 всего 16 мегабайт 32-разрядной DDR-350 (на фото внизу; слишком малый объем и ПСП в районе жалких 1,4 Гбайт/с) все же не дает графическому ядру развернуться в полную силу (это особенно заметно в синтетических тестах и старых играх, сильнее нагружающих оперативную память, нежели графический процессор). А вот связку UMA+SP следует считать оптимальной — и овцы целы (процессор не «отвлекается по пустякам»), и волки сыты (в режиме максимальной нагрузки системная память приходит на выручку маломощной графической).

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.