Чипсет Intel 845G: интегрированный графический ускоритель
АрхивПлатформаОбзор встроенного графического ускорителя чипсета i845G. Заочное соперничество с nForce продолжается.
В предыдущем материале мы рассказали о новых чипсетах Intel для памяти DDR и системной шины 533 МГц. Два из новых чипсетов - i845G и i845GL - имеют принципиально новое интегрированное графическое ядро Brookdale-G, сравнимое по скорости со знаменитым nForce 420 от NVIDIA. Поэтому не останавливаясь на деталях новых чипсетов (их вы найдете в предыдущем материале), рассмотрим теперь ядро Brookdale-G подробнее.
Графическое ядро Brookdale-G одинаково для чипсетов i845G и i845GL и работает на тактовой частоте 200 МГц. Оно частично напоминает ядро чипсета i830M, широко используемого нынче в мобильных компьютерах (даже драйверы у этих ядер общие, см. скриншот ниже). Благодаря его наличию в этих чипсетах главный («северный») чип носит название GMCH вместо MCH для чипсетов i845/845E. Внутри ядра используется 256-разрядная шина данных. Разумеется, граф. ядро употребляет для своих нужд часть общей системной памяти, однако предусмотрен ряд механизмов сбалансированного использования памяти для получения оптимальной производительности приложений с двумерной и трехмерной графикой. При проектировании нового графического ядра корпорация опиралась на свой большой опыт в этой области, поскольку за предыдущие годы Intel выпустила свыше 100 млн. наборов микросхем с интегрированной графикой, а легендарный i740, перевоплотившийся затем в граф. ядро чипсетов i810/815, был некоторое время эталоном качества (и наверное массовости тоже) среди карт для AGP 2x.
В систему установлен драйвер для i845G. |
Прежде, чем перейти к рассмотрению особенностей трехмерного движка нового ядра (а именно о нем почему-то обычно заходит речь при оценке качеств Brookdale-G, хотя в реальности лишь небольшой процент пользователей будет в силу тех или иных причин нуждаться в использовании его 3D-возможности в полной мере), мы коснемся качеств ядра при работе с 2D-графикой, видео и дисплеями. Ведь, исходя из рыночной направленности чипсетов i845G и GL, именно эти возможности будут наиболее востребованы в обычной работе.
Новое ядро Intel поддерживает графические интерфейсы GDI/GDI+ и DirectDraw/DirectVA по следующим функциям (исходные термины я намеренно переводить не буду, чтобы избежать кривотолков):
- Alpha Stretch Blits (прозрачные DirectDraw-поверхности на рабочем столе)
- Hardware Alpha Blended RGB Cursor (курсор более высокого качества и производительности)
- Color Space Conversion (пространственное преобразование цветов будет полезно при работе с видео)
- Faster Hardware Motion Comp Engine (аппаратное декодирование MPEG, обеспечит 30 кадров в секунду при проигрывании DVD с загрузкой процессора менее 20%)
- Alpha Blended Sub picture Support (обеспечивает более плавный ввод подписей и субтитров в изображение)
- 5x2 Overlay Support (более плавное масштабирование картинки при проигрывании DVD)
- Anisotropic Filtering (высококачественное отображение сложных поверхностей)
- Rotate, Scale and Translate Ops (используются для работы интерфейса GDI+)
- Anti-Aliased Text (удаляет острые углы и сглаживает отображаемый текст).
Возможности по работе Brookdale-G с дисплеями включают в себя VBE, DDC2b, EDID, DVI1.0 и AIM 3.0. Это:
- 350 МГц RAMDAC с поддержкой аналоговых мониторов вплоть до QXGA-разрешения
- 330 МP/s Dual Digital Ports (поддержка цифровых мониторов вплоть до QXGA)
- Dual DVO Ports (поддержка дисплеев различных стандартов: LVDS, DVI, TV-out, dCRT)
- ADD Card Support - для поддержки цифровых дисплеев и т. п. (см. ранее)
- Independent Overlay Gamma Correction (компенсирует потери интенсивности цвета)
- Dual Display Support (синхронное изображение на двух дисплеях одновременно - аналоговом и цифровом, см. ранее)
Как видим, здесь присутствует почти полный джентльменский набор современных функций. Огорчает, пожалуй, только отсутствие поддержки двух дисплеев с разными изображениями (это бы расширило область применения чипсетов) и отсутствие простейших возможностей по видеозахвату - они бы пригодились для видеоконференций, видеомониторинга и пр., поскольку USB-камерам присущ ряд заметных недостатков.
Переходим к трехмерному движку Brookdale-G. Здесь обещается усиление широкого спектра трехмерных приложений через поддержку движком функций OpenGL 1.3 и DirectX 8.x (последний термин, к сожалению, не расшифровывается). Для OpenGL 1.3 заявлена полная поддержка его возможностей для сжатых текстур, кубических (cube map) текстур, мультитекстурирования и texture dot3 environment mode, причем оптимизированный для Pentiun 4 движок (ICD) OpenGL встроен в драйвер данного чипсета. Через DirectX 8.x аппаратно чипсетом поддерживаются следующие новые (для Intel) функции:
- мультитекстурирование (полезно для создания карт освещенности, атмосферных эффектов и пр.)
- текстуры Non-Pow 2 (они используются при создании рабочего стола и видеорадактировании)
- 2Кх2К-текстуры (двухкилобайтные текстуры, то есть размером с рабочий стол или больше; они уже давно поддерживаются 3D-движками большинства конкурентов)
- Cube Reflection текстуры (кубические отражения используются при создании эффектов окружения)
- Render to Texture (рендеринг текстур позволяет генерировать текстуры на лету)
- Projected Textures (продолжение текстур на другие объекты позволяет делать картинку более реалистичной)
- DOT3 Bump-Mapping (моделирует реалистичные детали поверхностей)
- Destination Alpha Blend (эффекты типа силового поля, пламени, пучков плазмы и т. п.)
- Point Sprites (точечные спрайты помогают накладывать мелкочастичные изображения, например, атмосферные эффекты типа дождя и снега)
- Per Pixel Fog (позволяет использовать очередь по глубине изображения и скрытые объекты, например, при создании эффектов типа тумана)
Для достижения оптимальной производительности в новом графическом ядре Intel применяется несколько оригинальных технологий:
- Технология зонального рендеринга;
- Интеллектуальное распределение памяти;
- Технология динамической видеопамяти;
- Архитектура быстрого пиксельного и тексельного рендеринга.
Познакомимся с ними немного подробнее.
В систему на i845G установлено 512 Мбайт памяти, 8 Мбайт ушло на графику. |
По умолчанию при загрузке BIOS жестко резервирует лишь до 8 Мбайт системной памяти под нужды видеоакселератора (см., например, скриншот программы WCPUid выше, где из установленных в системе на чипсете i845G 512 Мбайт памяти для операционной системы осталось лишь 504 Мбайт). Остальное оставляется на усмотрение операционной системы (драйвера).
Технология динамической видеопамяти (Dynamic Video Memory Technology или DVMT) позволяет графическому акселератору использовать дополнительно до 48 Мбайт (или до 64 Мбайт, в зависимости от используемого драйвера, версии 11.2) системной памяти, причем эта дополнительная память может изменяться динамически и использоваться совместно с операционной системой и приложениями. В процессе работы приложения сообщают интеловскому графическому драйверу, когда им необходимо больше, чем 8 Мбайт памяти, драйвер отравляет соответствующий запрос операционной системе, и она выделяет определенное количество памяти в зависимости от имеющегося в данный момент в наличии. Когда приложению эта востребованная память больше не нужна, она автоматически переходит обратно к операционной системе. Таким образом этот механизм экономит системную память и освобождает ее для других приложений, когда она не нужна интегрированной графике. Повышается коэффициент использования памяти для получения оптимальной производительности и графики, и системы.
Технология интеллектуального распределения памяти (Intelligent Memory Management Technology или IMM) разделяет на части адресное пространство видеопамяти, чтобы выделить отдельные аппаратные участки для всех графических нужд (текстур, кадрового буфера, Z-буфера, видеоповерхностей и др.). Большой буфер дисплея встроен в дисплейный движок чипсета и предназначен для обновления изображения на экране, чтобы улучшить визуальную производительность. Схема динамического менеджмента данными управляет глубиной очереди и закрытием страниц при доступе к памяти. Для этого, в частности, используется оригинальная архитектура Intel по менеджменту памяти. Все вместе это снижает задержки при работе с процессором, позволяет работать с большей очередью страниц и улучшает эффективность использования памяти при работе со страницами для повышения производительности системы. Например, данные механизмы весьма эффективны при загрузке текстур, компенсации движений в MPEG2, при выполнении функций 2D Blits и Color/Z.
Архитектура быстрого пиксельного и тексельного рендеринга (Rapid Pixel and Texel Rendering Architecture или RPTR) ускоряет создание визуальных эффектов без замедления производительности системы. Эта архитектура использует определенную иерархию кэшей и набор оригинальных подходов при рендеринге трехмерных сцен:
- Чтобы ускорить заполнение сцен, двумерный blitter-движок (BLT) имеет разрядность 256 бит; при этом blitter-последовательность с одинаковыми адресами может обращаться к кэш-памяти, разгружается пропускная способность памяти, очищается кэш после завершения последовательности операций.
- Специальная неблокирующая и многоцелевая структура кэш-памяти: отдельные внутренние кэши предназначены для текстур, цветов, глубины кадра (Z) и вертексного рендеринга.
- Поддержка четырех текстур за один проход: драйвер может предлагать трехмерному движку обработать до 4 текстур одновременно.
- Чипом поддерживается декомпрессия текстур как DXT, так и FXT1-формата. При этом обеспечивается сжатие до восьми крат, уменьшается загрузка шины памяти при чтении текстур и снижается объем памяти, требуемый для их хранения.
- Динамическое мульти-контекстное переключение: специальные каналы предназначены для для операций в 2D- и 3D-модах, они позволяют этим операциям перекрываться, графическое ядро может переключаться между двухмерными и трехмерными операциями без завершения всех операций для одной моды. Это минимизирует время, необходимое при переключении между модами.
Наконец, уникальная технология зонального рендеринга (Zone Rendering (ZR) technology), развиваемая Intel, предназначена для рендеринга трехмерных сцен. Принцип ее работы показан на рисунке. Графический 3D-движок разбивает кадровый буфер на прямоугольные зоны и затем сортирует все треугольники, описывающие 3D-объекты, в памяти по этим зонам. Затем 3D-движок полностью обрабатывает одну зону, записывая данные пикселей в память, и потом перемещается к следующей зоне.
Технология зонального рендеринга |
При обработке графический движок использует внутренний кэш рендеринга, чтобы рассортировать работу по зонам и рисует каждый пиксель в каждой сцене только один раз. Такой подход уменьшает полосу пропускания системной памяти, необходимую для рендеринга каждой сцены (а полоса пропускания системной памяти DDR266 для чипсетов i845 и так достаточно низкая по меркам современных графических движков и системной (процессорной) шины), то есть в конечном итоге ускоряет работу с памятью. Кроме того, зональный рендеринг помогает использовать системную память более эффективно для оптимизации производительности как графики, так и системы в целом (например, один и тот же участок памяти может использоваться при рендеринге одного кадра многократно). В частности, этот подход позволяет уменьшить требования к объему оперативной памяти, установленной в системе, для компьютеров начального уровня (дешевых).
Хорошо, с теорией в первом приближении разобрались, переходим к практике. Испытания нового графического движка Intel проходили на плате самой же Intel модели D845GBVL, подробно описанной ранее. Графический драйвер (вета версии)...
Информация об использованном для тестов Brookdale-G драйвере. |
...без проблем распознал интегрированный графический адаптер и выделил ему до 48 Мбайт системной памяти дополнительно:
Определение ядра Brookdale-G в Display Properties Windows XP. |
Однако судя по информации, выданной программой 3DMark 2001 Second Edition, реально память для графики распределилась несколько по-другому:
Информация о Brookdale-G в пограмме 3DMark 2001 SE. |
Возможно, что в данном случае как раз сработал один из вышеперечисленных механизмов управления памятью, и для данной задачи просто потребовалось меньше графической памяти. Отсюда же видно, что ни вертексные, ни пиксельные шейдеры аппаратно чипом не поддерживаются, как, впрочем и Hardware T&L. Но этого, наверное, никто от чипсета Intel и не ждал.
В данной версии драйверов имеется поддержка очень высоких разрешений (до 2048 на 1536, если позволяет монитор) и, естественно, 32-битного цвета:
Макисмальные разрешения, поддерживаемые Brookdale-G. |
На разрешениях до 1200х1024 к качеству картинки с платы Intel не было никаких нареканий (что будет на платах других производителей, ручаться не берусь).
Более того, в закладках настроек дисплея обнаружилась такая приятная вещь, как поворот дисплея на 90 и более градусов:
Возможность поворота дисплея в Brookdale-G. |
Это очень полезно, например, при работе с текстами на жидкокристаллическом мониторе. Работоспособность "поворотного узла" была протестирована на обычном электроннолучевом мониторе и не вызвала нареканий (за исключением перекрученной на 270 градусов шеи испытателя).
Предварительные испытания производительности встроенного графического ядра i845G проводились на указанной выше версии драйверов. На момент выхода чипсета уже доступны драйверы более свежей версии 11.0.2.1. В следующем материале мы посмотрим, как изменилась производительность Brookdale-G с драйверами новой версии, сейчас же все результаты будут относиться к указанной бета-версии. В силу этого, мы не станем здесь обсуждать небольшие проблемы с функционированием ускорителя в некоторых трехмерных задачах, хотя справедливости ради надо сказать, что даже на этих бета-драйверах все наши тесты трехмерной графики успешно прошли, и ускоритель показал вполне достойные результаты. Качество картинки также в большинстве случаев не вызывало нареканий (кликните, например, на скриншот слева из теста 3DMark 2001 SE - работа по DirectX 8).
Для оценки производительности ядра Brookdale-G использовалась та же конфигурация тестовой системы, которая была описана в предыдущей статье: плата Intel D845GBVL на чипсете i845G, процессоры Intel Pentium 4 c частотой 2,4 ГГц и системной шиной 533 МГц (по умолчанию на всех диаграммах) и 400 МГц (если отмечено на диаграммах), внешний графический ускоритель ASUS V8200 (в тестах, отмеченных GF3), винчестер Segate Barracuda ATA IV на 80 Гбайт и 512 Мбайт системной памяти DDR266 и DDR333 (на чипах Samsung). В дополнение, для сравнения использовался внешний AGP-ускоритель GeForce2 MX200 (c 32 Мбайт набортной памяти) производства Gainward (он был предоставлен компанией "Атлантик Компьютерс"). В некоторых тестах привлекались результаты для чипсета NVIDIA nForce 420/220, позаимствованные из наших предыдущих тестирований. Все тесты встроенной графики проводились только с памятью DDR266, поскольку с памятью DDR333 плата Intel D845GBVL заводилась только с внешним AGP-ускорителем, и даже не стартовала со внутренним. Возможно, при работе с памятью DDR333 результаты на внутреннем учскрителе были бы более внушительными.
Здесь нас будут интересовать два основных вопроса:
1. Как влияет присутствие встроенной графики на производительность системы в повседневных задачах, не связанных с трехмерной графикой, то есть насколько присутствие встроенной графики тормозит работу памяти в системе (как мы помним, например, для nForce 420 этот эффект был почти незаметен, тогда как для nForce 220, VIA KM266 или SiS 650 эффект торможения от встроенной графики ощущался достаточно сильно)?
2. Какова же собственно производительность самого ядра Brookdale-G в различных трехмерных задачах, например, по сравнению с популярным и дешевым внешним решением на GeForce2 MX (основной "неинтегрированный" конкурент) и nForce 420 (гипотетический конкурент среди интегрированных решений)?
Прежде всего, посмотрим на скорость работы памяти. Скорость потоковой работы с памятью при активации внутренней графики сильно падает: более 20% по тесту Sandra 2002. При этом латентность памяти также ухудшается: на 10% по тесту Cachemem 2.22. Разумеется, это должно сказаться на общей производительности системы. Как видим, оригинальные технологии Intel работы с памятью пока не дают уж очень большого положительного эффекта, если даже в чипсете SiS650, например, падение производительности памяти при работе встроенной графики было меньше в процентном отношении.
Производительность при работе с системной памятью. |
В тестах и приложениях, не связанных с трехмерной графикой, падение производительности от встроенного ядра чувствуется, хотя и не всегда велико. Так, в тесте SYSmark 2002 оно составляет около 2% для офисной работы и менее 4% при работе с графикой и видео (Internet Content). При кодировании потока видео в MPEG4 (см. результаты FlasK) и архивировании WinRAR 2.90 проигрыш возрастает до 6% и 12% соответственно, а в научных расчетах Science Mark V1.0 - не более 4%. таким образом, можно сделать вывод, что замедление работы при использовании встроенной графики для чипсета i845G есть, и порой оно доходит до 5-10%, но в реальной работе обычный пользователь его вряд ли почувствует, хотя, конечно, 5-10% - это более медленный (на одну ступень) и, значит, более дешевый центральный процессор (а разницу в цене процессоров, да и цену GeForce2 MX200 вы сами прекрасно знаете).
Тесты SYSmerk 2002 и WinRAR 2.90 . |
Переходим к трехмерной графике. Как и ранее, отметим, что наша многочисленная практика тестирований показала, что для определения типовой (или средней) производительности платформы, а также ее сильных и слабых сторон (в плане быстродействия) совершенно не обязательно рассматривать результаты нескольких десятков в общем-то достаточно похожих друг на друга и поэтому бесполезных тестов (приложений), а достаточно внимательно изучить лишь нескольких специально отобранных и наиболее показательных тестов (приложений). Поэтому здесь мы не станем демонстрировать все полученные нами результаты, а покажем лишь самые характерные.
Прежде всего, радует , что в тестах DirectX 7 и 8 встроенная графика оказалась быстрее внешней GeForce2 MX200 (см. тесты 3DMark 2000 и 2001SE). Хотя по сравнению с nForce 420 есть, куда расти. Радует также достаточно быстрая работа с 32-битным цветом: падение производительности при переходе с 16-битного на 32-битный цвет для i845G не так уж велико. Более того, по данным самой Intel, ядро Brookdale-G дает прирост производительности от 1 до 10% по сравнению с внешней картой на GeForce2 MX200 в задачах визуализации трехмерных объектов в тесте WebMark 2001 и при использовании технологии Macromedia Flash (тоже по тесту WebMark 2001). Однако в OpenGL ускоритель Brookdale-G пока проиграл даже GeForce2 MX200 по всем статьям. В частности, играбельным (не менее 50 кадров в секунду) в Quake III и Serious Sam можно считать лишь низкие разрешения 640х480 при неплохом качестве или разрешения повыше (800х600) при посредственно качестве картинки. Тем не менее, в Серьёзном Сэме при разрешении 800х600 и цвете 32 бит картинка была вполне сносная по качество и можно даже было немного поиграть в синглплей. Остается надеяться, что с драйверами более свежей версии, где должен, в частности возрасти до 64 Мбайт объем выделяемой графической памяти, производительность Brookdale-G в OpenGL возрастет достаточно сильно (читайте об этом в нашей следующей статье).
Для профессиональных трехмерных расчетов данный интегрированный ускоритель, естественно, малопригоден, что и демонстрируют результаты тестов пакета SPEC viewperf v6.1.2.
Тест SPEC viewperf v6.1.2. |
Таким образом, дебют нового интегрированного графического ядра Intel показал, что корпорация проделала в этом направлении большую работу, и ее новое детище вплотную приближается по быстродействию к нынешнему лидеру - интегрированной графике чипсета NVIDIA nForce 420. Прекрасная функциональность при работе с видео и двумерной графикой сочетается с неплохой по нынешним меркам скоростью в простых трехмерных приложениях, то есть свое рыночное предназначение чипсет оправдывает сполна (напомню, что разница в оптовой цене на i845G и i845E сейчас составляет всего 5 долларов, то есть платы на i845G не должны быть такими уж дорогоми, как, например, были платы на nForce). Падение поизводительности системы при использовании встроенной графики для чипсета i845G все же есть, и порой оно доходит до 5-10%, но в реальной работе обычный пользователь его вряд ли почувствует, а в офисных приложениях оно и вовсе ничтожно - около 2%. Будем надеяться, что с выходом новых драйверов это падение уменьшится, а переход на память DDR333 в чипсете i845GE позволит сделать его еще меньше. А идеальным, конечно, следует считать создание интегрированного чипсета для двухканальной DDR-памяти (как nForce 420). Но это уже совсем другая история.