Архивы: по дате | по разделам | по авторам

Встроенные видеоускорители: Часть I

АрхивВидео
автор : Сергей Озеров   20.12.2004

Графический ускоритель (видеокарта) - неотъемлемый компонент любого компьютера. В свете повальной интеграции всего и вся на материнскую плату мы практически забыли о существовании сетевых карт PCI, почти не покупаем звуковые платы, но графический ускоритель предпочитаем по-прежнему отдельный. Справедливо ли это? В целом ряде случаев - нет.

Графический ускоритель (видеокарта) — неотъемлемый компонент любого компьютера. В свете повальной интеграции всего и вся на материнскую плату мы практически забыли о существовании сетевых карт PCI, почти не покупаем звуковые платы, но графический ускоритель предпочитаем по-прежнему отдельный — невзирая даже на то, что за самый простой, непритязательный, провалявшийся на складах года два кусочек текстолита приходится платить примерно тысячу рублей (то есть около 10% стоимости недорогого системного блока). А не слишком старая видеокарта начального уровня (GeForce FX 5200, Radeon 9200) или последние решения вроде GF6200 и X300 обойдутся в два-три раза дороже — примерно в ту же сумму, что и пять сетевых или две звуковые карты (или одна-две «сетевухи» и одна «звуковуха» — если рассматривать продвинутые варианты), на покупке которых мы, тем не менее, стараемся экономить, часто предпочитая решения, интегрированные в материнскую плату.

Справедливо ли это? И правильно ли, что многие отечественные продавцы компьютеров — от менеджеров в торговых залах до руководителей крупных и известных компаний-производителей ПК — зачастую пренебрегают интегрированными графическими решениями и по старинке рекомендуют несведущему покупателю потратиться на видеокарту, когда необходимости в этом покупатель фактически не испытывает?

Ведь объективных причин недолюбливать современную интегрированную графику (ИГ) нет! Чтобы убедиться в этом, достаточно обратиться к опыту западных производителей — например, крупнейшего поставщика компьютеров в Америке, гиганта Dell. В персоналках серии Dell Dimension 3000 для конфигурации начального уровня (~$550) графическая плата не предусматривается вообще — то есть по желанию заказчика в системный блок установят процессор вплоть до Pentium 4 3.0E и два гигабайта оперативной памяти, но только не видеокарту. А в «средней» по функциональности модели Dimension 4700 (~$800) видеокарта хоть и внесена в список «рекомендованных» аксессуаров, но предлагается за отдельные деньги. Более 60% персональных компьютеров в мире сегодня продается именно с ИГ. И хотя в России любят идти своим путем (Покупая видеокарты «на вес», то есть руководствуясь объемом установленной оперативной памяти, а не реальными характеристиками производительности), недооценивать чужой опыт не стоит.

Что же может предложить современный чипсет с ИГ? Как ни странно — почти все, что необходимо пользователю домашнего или офисного ПК! В первую очередь — прекрасное качество выходного сигнала («2D-картинку»). От видеокарты ожидают кристально четкого отображения графики и текста, любые огрехи в этой «повседневной» пользовательской деятельности совершенно недопустимы. «Плохое качество 2D» — один из устаревших мифов об ИГ, который имел под собой основания еще два-три года назад, но только не сейчас: разработчики графических ядер и материнских плат прекрасно понимают свои задачи и на блоках формирования видеосигнала не экономят. Например, в чипсете Intel 915G с графическим ядром Intel Graphics Media Accelerator 900 установленные для вывода сигнала ЦАПы (их называют RAMDAC) работают на частоте 400 МГц — такой же, как у самых навороченных ускорителей. И это, кстати, на 40 МГц больше, чем у славившегося своей непревзойденной «профессиональной» картинкой культового когда-то Matrox Millennium G450! Качество изображения обеспечивается, конечно, не только RAMDAC’ом, но прогресс в этой области очевиден.

Ограничения ИГ здесь кроются в другом: большинство современных видеокарт несут на борту телевизионный выход (TV-out), выход на второй монитор, цифровой DVI-выход, а интегрированные решения их, как правило, пока лишены — например, многие интегрированные чипсеты Intel в принципе позволяют добавить и DVI-, и видеовыход, но для этого требуется установить в слот AGP (или PCI Express x16) карточку ADD (или ADD2, см. ниже), но видели ли вы такую карточку в магазине? Между тем большинство пользователей не сочтет это серьезным недостатком: второй монитор нужен немногим, DVI имеет свои ограничения, а терпение для подключения и настройки телевизионного выхода есть далеко не у всех (тем более что на современных материнских платах уже разводят и TV-out).

Во-вторых, современный чипсет с ИГ может предложить отменную производительность в нетрехмерных приложениях. Вопреки еще одному мифу, родившемуся во времена, когда типичной оперативной памятью в компьютере была SDRAM PC100, ИГ почти не уменьшает производительность компьютера в задачах, не использующих возможности 3D-ускорителя. Графическое ядро, конечно, забирает от 70 до 700 Мбайт/с пропускной способности оперативной памяти (например, в типичном случае при экранном разрешении 1280x1024 точек и 32-битном цвете с частотой обновления картинки 85 Гц на формирование картинки расходуется 400 Мбайт/с), однако по нынешним меркам это немного — при пересчете в относительные цифры мы получим скромные 5–15% потери по далеко не самому важному для производительности системы показателю. В реальных же приложениях, как показывает тестирование, различия становятся и вовсе незаметными.

В-третьих, как ни странно, на нынешних интегрированных графических чипсетах можно вполне комфортно играть в трехмерные игры. Производительность ИГ, как и три года назад, соответствует самым дешевым «полноценным» ускорителям, однако если пересчитать ее в «абсолютные», а не относительные значения, то окажется, что в большинстве случаев хватает и этой малости. Раньше многие интегрированные чипсеты «славились» несовместимостью с половиной игр (и серьезными проблемами — со второй половиной), но сегодня половину приличных ИГ выпускают такие брэнды, как ATI и nVidia, собаку съевшие на этом деле, а вторую половину — безраздельно доминирующая на графическом рынке Intel, которой принадлежит почти треть рынка всей графики (больше, чем у ATI или nVidia) и под которую так или иначе подстраиваться приходится всем.

И последний довод за интегрированную графику — добавить мощную видеокарту в систему никогда не поздно.

Итак, наш рассказ — о лучших современных чипсетах с ИГ, которые не только не стыдно иметь в своих ПК, но и рекомендуется использовать как можно чаще.



 

Особенности интегрированной графики Intel Graphics Media Accelerator 900


Помимо непривычно мощной для ИГ подсистемы из четырех графических конвейеров закраски, работающих на 333 МГц, и превосходной подсистемы памяти, Intel GMA 900 включает в себя две принципиально важные технологии — Intel Zone Rendering Technology 3 и Dynamic Video Memory Technology (DVMT) версии 3.0.

ZRT — это «конек» всех ИГ от Intel, начиная еще с чипсетов i830 и i845. Предыстория такова: в эпоху зарождения индустрии 3D-графики компания PowerVR выработала оригинальный подход к построению 3D-изображения: картинка строится не «одним большим куском», как в большинстве ускорителей, а «маленькими кусочками» — тайлами (от англ. tile — кусочек). Чтобы не выводить на экран всю сцену треугольник за треугольником (определяя с помощью Z-буфера, какие треугольники расположены ближе, а какие дальше), тайловый акселератор разбивает экран на сетку из небольших прямоугольников (тайлов), а затем по очереди отрисовывает каждый тайл. Это, казалось бы, небольшое отличие позволяет оптимизировать процесс построения изображения, резко повысив КПД использования памяти. PowerVR успела даже выпустить на основе тайловой технологии небезызвестную линейку ускорителей Kyro — линейку неплохую, но, увы, не выдержавшую острейшей рыночной конкуренции того времени.

Но тайловая архитектура не погибла, а была лицензирована Intel для использования в своих графических ядрах. Только вот вызывающее мрачные ассоциации слово «тайл» корпорация всюду заменила на «зону» (zone) — имя другое, а смысл тот же.

Техника зонного рендеринга подразумевает предварительную сортировку образующих сцену треугольников по тайлам: прежде чем приступить к рендерингу картинки, процессор должен составить списки треугольников, попадающих в каждый из тайлов. Переложить работу по сортировке списка треугольников на традиционный аппаратный вершинный конвейер, используемый современными ускорителями классической организации, к сожалению, слишком сложно, так что этот этап работы выполняется исключительно центральным процессором, а блок T&L в GMA 900 вообще отсутствует. С учетом мощности современных CPU это обычно не становится серьезной проблемой, но в играх типа Far Cry, в которых в кадре ежесекундно отображаются сотни тысяч треугольников, GMA 900 оказывается в невыгодном положении по сравнению с конкурентами (сортировка такого массива треугольников — процесс небыстрый). Кроме того, тайловый ускоритель не может одновременно рассчитывать геометрию и строить сцену; отрисовку картинки он начинает только с того момента, как центральный процессор закончит сортировать мегабайты исходных данных и передаст их ускорителю. Все это — минусы ZRT, однако для ИГ они, как правило, компенсируются двумя плюсами. Первый из них — работа с предварительно отсортированным массивом треугольников на кусочке экрана «локальна»; она затрагивает малую область памяти и эффективно кэшируется. Запихнуть в небольшой буфер ускорителя все данные сцены невозможно, а вот данные малого ее участка — вполне реально. Во-вторых, изображение строится «по кусочкам», и интенсивно задействуемый в ходе этих вычислений фрейм-буфер (область памяти, где хранится построенная картинка) тоже удается целиком разместить в графическом процессоре. Да и оптимизировать построение отдельно взятого тайла, в который попадет лишь несколько треугольников, гораздо проще, чем всей сцены. В целом — где-то ZRT тормозит GPU, где-то наоборот; но то, что этот подход корпорация Intel активно эксплуатирует несколько лет, говорит о том, что преимущества ZRT3 все же перевешивают недостатки.

Вторая ключевая технология, DVMT, гораздо проще и состоит лишь в том, что интегрированное графическое ядро может на лету изменять объем используемой видеопамяти. Классические ИГ с архитектурой UMA (Unified Memory Architecture, то есть когда используется оперативная память компьютера), как правило, резервируют под свои нужды некий довольно большой кусок оперативной памяти — от 32 до 128 мегабайт (см. фото), который становится недоступным другим программам (в системе видно не 512 мегабайт, а, скажем, 448), хотя большую часть времени он простаивает. DVMT позволяет исправить эту ситуацию: ускоритель резервирует лишь минимально необходимый объем памяти (Pre-Allocated, от 1 до 16 мегабайт под фрейм-буфер и служебные данные) плюс некий фиксированный (Fixed, 32–128 Мбайт) или динамический (DVMT, не менее 32 Мбайт) объем для «пользовательских» данных. При объеме памяти не менее 256 мегабайт можно совместно использовать фиксированную и динамическую память DVMT и Fixed (64 + 64 Мбайт). «Служебная» Pre-allocated и фиксированная часть графической памяти скрыты от операционной системы и пользователя — это «традиционный» подход. А вот DVMT-память — это обычная оперативная память (находящаяся в распоряжении операционной системы), которую драйвер DVMT запросил под свои цели у ОС, зафиксировал и прописал в таблице трансляции виртуальной графической памяти (GTT). Изменение в архитектуре UMA совсем небольшое, а в итоге пользователь при работе с обычными системными приложениями получает дополнительные мегабайты оперативной памяти. Отметим, что аналоги DVMT используют и другие производители — в частности, выделять графическую память на лету умеет и Xpress 200.

Продолжение следует...

- По материалам еженедельника "Компьютерра"

© ООО "Компьютерра-Онлайн", 1997-2019
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.