Серьезный Сэм
АрхивВ мае корпорация Intel явила миру сразу три новых процессора Pentium 4 для новой системной шины с частотой 533 МГц, а также четыре новых чипсета к ним. Подробнее особенности новых DDR-чипсетов Intel и работу южного хаба ICH4 мы рассмотрим в другой раз, а сейчас поговорим о самом интересном - о графическом ядре Brookdale-G.
В мае корпорация Intel явила миру сразу три новых процессора Pentium 4 для новой системной шины с частотой 533 МГц (см. www.ferra.ru/online/system/17702), а также четыре новых чипсета к ним: i850E для памяти RDRAM PC800, принципиально не отличающийся от предшественника i850, и три для памяти DDR (см. www.ferra.ru/online/system/17860). Два из них (i845E и i845G) поддерживают системную шину FSB 533 МГц. Кроме того, i845G и третий чипсет - i845GL имеют принципиально новое интегрированное графическое ядро Brookdale-G, сравнимое по производительности со знаменитым nForce 420 от Nvidia. Все три свежих DDR-чипсета содержат новый южный хаб ввода-вывода ICH4, который пришел на смену устаревшему ICH2, вышедшему почти два года назад. Подробнее особенности новых DDR-чипсетов Intel и работу южного хаба ICH4 мы рассмотрим в другой раз, а сейчас поговорим о самом интересном - о графическом ядре Brookdale-G.
Ядро, одинаковое для чипсетов i845G и i845GL, работает на тактовой частоте 200 МГц. Оно частично напоминает ядро чипсета i830M, широко используемого нынче в мобильных компьютерах (даже драйверы у этих ядер общие). Благодаря его наличию в чипсетах главный (северный) чип носит название GMCH вместо MCH для чипсетов i845/845E. Внутри ядра используется 256-разрядная шина данных. Разумеется, Brookdale-G употребляет для своих нужд часть общей системной памяти (DDR или SDR), однако предусмотрен ряд механизмов сбалансированного использования памяти для получения оптимальной производительности приложений с двух- и трехмерной графикой. При проектировании ядра корпорация опиралась на свой большой опыт в этой области: за предыдущие годы Intel выпустила больше 100 млн. наборов микросхем с интегрированной графикой, а легендарный i740, перевоплотившийся затем в графическое ядро чипсетов i810/815, был некоторое время эталоном качества (и, наверное, массовости тоже) среди карт для AGP 2x.
Прежде чем перейти к рассмотрению особенностей трехмерного движка (почему-то именно о нем обычно заходит речь при оценке качеств Brookdale-G, хотя в силу тех или иных причин нуждаться в использовании его 3D-возможности в полной мере будет лишь небольшой процент пользователей), мы коснемся качеств ядра при работе с 2D-графикой, видео и дисплеями. Ведь, исходя из рыночной направленности чипсетов i845G и GL, именно эти возможности будут востребованы в первую очередь.
Новое ядро от Intel поддерживает графические интерфейсы GDI/GDI+ и DirectDraw/DirectVA по следующим функциям (я намеренно не перевожу термины, дабы избежать кривотолков):
- Alpha Stretch Blits (прозрачные DirectDraw-поверхности на рабочем столе);
- Hardware Alpha Blended RGB Cursor (аппаратная поддержка курсора);
- Color Space Conversion (пространственное преобразование цветов, полезно при работе с видео);
- Faster Hardware Motion Comp Engine (аппаратное декодирование MPEG, при проигрывании DVD обеспечивает 30 кадров в секунду с загрузкой процессора менее 20%);
- Alpha Blended Sub picture Support (обеспечивает более плавный ввод подписей и субтитров в изображение);
- 5x2 Overlay Support (более плавное масштабирование картинки при проигрывании DVD);
- Anisotropic Filtering (высококачественное отображение сложных поверхностей);
- Rotate, Scale and Translate Ops (используются для работы интерфейса GDI+);
- Anti-Aliased Text (удаляет острые углы и сглаживает отображаемый текст).
Возможности Brookdale-G по работе с дисплеями включают в себя VBE, DDC2b, EDID, DVI1.0 и AIM 3.0. А именно:
- 350 МГц RAMDAC с поддержкой аналоговых мониторов вплоть до QXGA-разрешения;
- 330 МP/s Dual Digital Ports (поддержка цифровых мониторов вплоть до QXGA);
- Dual DVO Ports (поддержка дисплеев различных стандартов: LVDS, DVI, TV-out, dCRT);
- ADD Card Support - для поддержки цифровых дисплеев и т. п. (см. выше);
- Independent Overlay Gamma Correction (компенсирует потери интенсивности цвета);
- Dual Display Support (синхронное изображение на двух дисплеях одновременно - аналоговом и цифровом, см. ранее).
Как видим, имеет место почти полный джентльменский набор современных функций. Огорчает, пожалуй, лишь отсутствие поддержки двух дисплеев с разными изображениями (это бы расширило область применения чипсетов) и простейших возможностей по видеозахвату - они бы пригодились для видеоконференций, видеомониторинга и пр., поскольку USB-камерам присущ ряд существенных недостатков.
Кроме того, в чипсете i845G присутствует и прежняя шина AGP 4x (поддерживаются только карты полуторавольтового стандарта; все современные видеокарты ему удовлетворяют). Нужно отметить, что установка в платы, построенные на чипсетах i845x, старых карт AGP 2x, которые используют трехвольтовый интерфейс для сигналов шины, приведет к выходу материнской платы из строя (напомню, что у конкурентов Intel дела с этим в чипсетах для Pentium 4 обстоят получше). В самом дешевом (из интеловских) чипсете i845GL, предназначенном для использования в low-end-системах на Pentium 4 с системной шиной 400 МГц, шина AGP вообще отсутствует, то есть он, как и i810, предназначен для использования только интегрированного графического ядра, которое идентично встроенному в i845G.
Чипсет i845G предоставляет максимально широкую свободу выбора подключаемого монитора: помимо слота AGP 4x и встроенной графики с выдачей аналогового SVGA-сигнала (ЭЛТ), можно подключить к слоту AGP специальную карту расширения, называемую Advanced Digital Display (ADD, рис.1). Она позволяет дополнительно реализовывать аналоговый TV-out и цифровой интерфейс DVO для цифровых мониторов, а также настраивать видеокодер для TV-out, LVDS- и TMDS-трансмиттера и получать изображение даже на двух мониторах одновременно (одно - VGA с интегрированной графической системы на материнской плате, а другое - с карты ADD). Правда, практическая польза от такого решения (разве что для презентаций) вызывает сомнения, поскольку картинка на оба монитора выдается одинаковая. С другой стороны, освобождение системной платы от цепей цифрового видеовыхода (DVO) и вынесение их на отдельную плату, приобретаемую по мере необходимости, можно только приветствовать. Картами ADD используются не стандартные сигналы шины AGP, а свои собственные. В число поставщиков устройств ADD стандарта Intel DVO уже входят компании Chrontel, Silicon Image, Focus, Multimedia Bundle, National, SmartASIC, Philips и Thine.
Переходим к трехмерному движку Brookdale-G. Здесь Intel обещает усиление широкого спектра трехмерных приложений через поддержку функций OpenGL 1.3 и DirectX 8.x. Заявлена полная поддержка возможностей Open-GL 1.3 для сжатых текстур, кубических (cube map) текстур, мультитекстурирования и texture dot3 environment mode, причем оптимизированный для Pentium 4 движок OpenGL встроен в драйвер чипсета. Через DirectX 8.x чипсет аппаратно поддерживает следующие новые (для Intel) функции:
- мультитекстурирование (полезно для создания карт освещенности, атмосферных эффектов и пр.);
- текстуры Non-Pow 2 (они используются при создании рабочего стола и видеоредактировании);
- 2Кх2К-текстуры (двухкилобайтные текстуры, то есть размером с рабочий стол или больше; давно поддерживаются 3D-движками большинства конкурентов);
- текстуры Cube Reflection (кубические отражения используются при создании эффектов окружения);
- Render to Texture (рендеринг текстур позволяет генерировать текстуры на лету);
- Projected Textures (продолжение текстур на другие объекты позволяет делать картинку более реалистичной);
- DOT3 Bump-Mapping (моделирует реалистичные детали поверхностей);
- Destination Alpha Blend (эффекты типа силового поля, пламени, пучков плазмы и т. п.);
- Point Sprites (точечные спрайты помогают накладывать мелкозернистые изображения, например атмосферные явления типа дождя и снега);
- Per Pixel Fog (позволяет использовать очередь по глубине изображения и скрытые объекты, например, при создании эффектов типа тумана).
Для достижения оптимальной производительности в Brook-dale-G применяется несколько оригинальных технологий:
- технология зонального рендеринга;
- интеллектуальное распределение памяти;
- технология динамической видеопамяти;
- архитектура быстрого пиксельного и тексельного рендеринга.
Познакомимся с ними подробнее.
Технология динамической видеопамяти (Dynamic Video Memory Technology). По умолчанию BIOS при загрузке жестко резервирует под нуж-ды видеоакселератора лишь до 8 Мбайт системной памяти. Остальное оставляется на усмотрение операционной системы (драйвера). Эта технология позволяет графическому акселератору использовать дополнительно до 48 Мбайт (или, в зависимости от драйвера, до 64 Мбайт) системной памяти, причем эта память может изменяться динамически и использоваться совместно с операционной системой и приложениями. В процессе работы приложения сообщают интеловскому графическому драйверу, если им необходимо больше, чем 8 Мбайт памяти. Драйвер отравляет запрос операционной системе, и та выделяет определенное количество памяти в зависимости от имеющегося в данный момент в наличии. Когда приложению востребованная память больше не нужна, она автоматически снова переходит «под крыло» операционной системы. Таким образом, этот механизм экономит системную память и, если она не нужна интегрированной графике, освобождает ее для других приложений, Благодаря чему повышается коэффициент использования памяти и оптимизируется производительность и графики, и системы.
Технология интеллектуального распределения памяти (Intelligent Memory Management Technology) разделяет на части адресное пространство видеопамяти, чтобы выделить отдельные аппаратные участки для всех графических нужд (текстур, кадрового буфера, Z-буфера, видеоповерхностей и др.). Большой буфер дисплея встроен в дисплейный движок чипсета и предназначен для обновления изображения на экране, чтобы улучшить визуальную производительность. Схема динамического менеджмента данными управляет глубиной очереди и закрытием страниц при доступе к памяти, для чего, в частности, используется оригинальная архитектура Intel по менеджменту памяти. Все вместе это снижает задержки при работе с процессором, позволяет работать с большей очередью страниц и рациональнее использовать память при работе со страницами для повышения производительности системы. Например, эти механизмы весьма эффективны при загрузке текстур, компенсации движений в MPEG-2 и выполнении функций 2D Blits и Color/Z.
Архитектура быстрого пиксельного и тексельного рендеринга (Rapid Pixel and Texel Rendering Architecture) ускоряет создание визуальных эффектов, не снижая производительности системы. Эта архитектура использует определенную иерархию кэшей и набор оригинальных подходов при рендеринге трехмерных сцен:
- Чтобы ускорить заполнение сцен, двухмерный blitter-движок имеет разрядность 256 бит; при этом blitter-последовательность с одинаковыми адресами может обращаться к кэш-памяти, разгружается шина памяти, очищается кэш после завершения последовательности операций.
- Специальная неблокирующая и многоцелевая структура кэш-памяти: отдельные внутренние кэши предназначены для текстур, цветов, глубины кадра (Z) и вертексного рендеринга.
- Поддержка четырех текстур за один проход: драйвер может предлагать трехмерному движку обработать до четырех текстур одновременно.
- Поддержка декомпрессии текстур DXT- и FXT1-формата. При этом обеспечивается сжатие до восьми крат, уменьшается загрузка шины памяти при чтении текстур и снижается объем памяти, требуемый для их хранения.
- Динамическое мультиконтекстное переключение: специальные каналы, предназначенные для операций в 2D- и 3D-модах, позволяют этим операциям перекрываться, графическое ядро может переключаться между двухмерными и трехмерными операциями без завершения всех операций для одной моды. Это минимизирует время, необходимое при переключении между модами.
Наконец, уникальная технология зонального рендеринга (Zone Rendering Technology) предназначена для рендеринга трехмерных сцен. Принцип ее работы показан на рис. 2. Графический 3D-движок разбивает кадровый буфер на прямоугольные зоны и сортирует треугольники, описывающие 3D-объекты, в памяти по этим зонам. Затем 3D-движок полностью обрабатывает одну зону, записывая данные пикселей в память, и переходит к следующей зоне.
При обработке движок использует внутренний кэш рендеринга, чтобы рассортировать работу по зонам, и рисует каждый пиксель в каждой сцене только один раз. Такой подход уменьшает полосу пропускания системной памяти, необходимую для рендеринга каждой сцены (полоса пропускания системной памяти DDR266 для чипсетов i845 и так довольно низкая по меркам современных графических движков и процессорной шины), то есть, в конечном счете, ускоряет работу с памятью. Кроме того, зональный рендеринг помогает использовать системную память более эффективно - для оптимизации производительности графики и системы в целом (например, один и тот же участок памяти может многократно использоваться при рендеринге одного кадра). В частности, этот подход позволяет уменьшить требования к объему оперативной памяти.
С теорией в первом приближении разобрались, переходим к практике. Подробности испытания нового графического движка на плате Intel D845GBVL с памятью DDR266 и процессором Intel Pentium 4 2,4 ГГц на системной шине 533 МГц вы сможете найти на нашем сайте (www.ferra.ru/online/system/17920), а здесь мы отметим лишь основные закономерности. Драйвер Brookdale-G поддерживает очень высокие разрешения (до 2048х1536, если позволяет монитор) и 32-битный цвет. На разрешениях до 1200х1024 к качеству картинки с платы Intel не было никаких претензий (за платы других производителей не ручаюсь). В закладках настроек дисплея обнаружилась такая приятная вещь, как поворот дисплея на 90, 180 и 270 градусов, что очень полезно, например, при работе с текстами на жидкокристаллическом мониторе. Работоспособность «поворотного узла» была протестирована на обычном электроннолучевом мониторе и не вызвала нареканий (за исключением перекрученной на 270 градусов шеи испытателя).
Подробные тесты производительности нового ядра и его сравнение с внешними картами, например GeForce2 MX200, показали следующее:
-
Встроенная графика влияет на производительность системы в повседневных задачах, не связанных с трехмерной графикой, то есть тормозит работу системной памяти (как мы помним, например, для nForce 420 этот эффект был очень слабым, тогда как для nForce 220 или SiS 650 торможение от встроенной графики ощущалось заметно). Скорость потоковой работы с памятью при активации внутренней графики падает более чем на 20% по тесту Sandra 2002, причем латентность памяти тоже ухудшается - на 10% по тесту Cachemem. То есть интеловские технологии работы с памятью пока не дают большого положительного эффекта, если даже в чипсете SiS650, например, падение производительности памяти при работе встроенной графики было меньше в процентном отношении. В тестах и приложениях, не связанных с трехмерной графикой, падение производительности от встроенного ядра чувствуется, хотя и не всегда велико. Так, в тесте SYSmark 2002 оно составляет около 2% для офисной работы и менее 4% при работе с графикой и видео (Internet Content). При кодировании потока видео в MPEG-4 и архивировании WinRAR 2.90 проигрыш возрастает до 6% и 12% соответственно, а в некоторых научных расчетах (Science Mark V1.0) - не превышает 4%. Тем не менее, в реальной работе пользователь вряд ли почувствует замедление, хотя, с другой стороны, 5-10% - это более медленный (на одну ступень) и, значит, более дешевый центральный процессор (а разницу в цене процессоров, да и цену GeForce2 MX200, вы сами прекрасно знаете).
-
Производительность самого ядра Brookdale-G в различных трехмерных задачах по сравнению, например, с популярным и дешевым внешним решением на GeForce2 MX200 (основной «неинтегрированный» конкурент) и nForce 420 (гипотетический конкурент среди интегрированных решений) можно оценить двояко. С одной стороны, в DirectX 7 и 8 встроенная графика оказалась быстрее внешней GeForce2 MX200 (см. тесты 3DMark 2000 и 2001SE). Хотя по сравнению с nForce 420 есть куда расти. Радует также достаточно быстрая работа с 32-битным цветом: падение производительности при переходе с 16-битного на 32-битный цвет для i845G не так уж велико. Более того, по данным Intel, ядро Brookdale-G дает прирост производительности от 1% до 10% по сравнению с внешней картой на GeForce2 MX200 в задачах визуализации трехмерных объектов в тесте WebMark 2001 и при использовании технологии Macromedia Flash (тоже по тесту WebMark 2001). Однако с другой стороны, в OpenGL ускоритель Brookdale-G пока проигрывает по всем статьям даже GeForce2 MX200. В частности, играбельным (не менее 50 кадров в секунду) в Quake III и Serious Sam можно считать лишь низкие разрешения 640х480 при неплохом качестве или разрешения повыше (800х600) при посредственном качестве картинки. Тем не менее, в «Серьезном Сэме» при разрешении 800х600 и цвете 32 бит картинка была вполне сносной, и можно было даже немного поиграть в сингл-плей. Остается надеяться, что с драйверами будущих версий производительность Brookdale-G в OpenGL повысится.
Таким образом, дебют нового интегрированного графического ядра от Intel показал, что корпорация проделала в этом направлении большую работу и ее новое детище вплотную приближается по быстродействию к нынешнему лидеру - интегрированной графике чипсета Nvidia nForce 420. Прекрасная функциональность при работе с видео и двухмерной графикой сочетается с неплохой скоростью в простых трехмерных приложениях, то есть свое рыночное предназначение чипсет оправдывает сполна (напомню, что разница в оптовой цене i845G и i845E сейчас составляет всего 5 долларов, то есть платы на i845G не должны быть слишком дорогими, как, например, были платы на nForce). Новая интегрированная графика от Intel уже сейчас способна отхватить огромный кусок рынка у недорогих внешних AGP-карт. Падение производительности системы при использовании встроенной графики для чипсета i845G все же имеет место, порой оно доходит до 5-10%, но в реальной работе обычный пользователь вряд ли его почувствует, а в офисных приложениях оно и вовсе ничтожно - около 2%. Будем надеяться, что новые драйверы улучшат ситуацию, а переход на память DDR333 в чипсете i845GE позволит свести снижение производительности к минимуму. Идеальным же, конечно, следует считать создание интегрированного чипсета для двухканальной DDR-памяти (как nForce 420). Но это уже совсем другая история.