Архивы: по дате | по разделам | по авторам

Большие скачки

Архив
автор : Александр Медведев   20.10.1998

Увлеченные неравными боями с монстрами "Quake", мы почти не обратили внимания на нулевое поколение 3D-ускорителей - NV1, Rendition V1000... Оно было маленьким, слабеньким и незаметненьким. Затем на нас обрушилась лавина первого поколения - Voodoo, Permedia 2, Riva 128... Свое веское слово сказала и Intel, выпустив i740. В течение весны и лета до нас доносился информационный гул приближающегося второго поколения. И вот, в продаже первый его представитель - Riva TNT. Ну, а вышедшие чуть ранее Matrox G200 и чуть позже - 3Dfx Banshee, похоже, стали лишь переходным звеном, поколением "1.5".

Мысли вслух

Графические ускорители развиваются сейчас настолько быстро, что в этом с ними не могут тягаться ни память, ни процессоры с их законом Мура. Производительность процессоров удваивается каждые два года, это хорошо. Цена памяти падает каждый год вдвое - это еще лучше. С пропускной способностью памяти дело раньше обстояло туго: помните, сколько лет подряд мы слышали одни и те же цифры - 70 нс, 60 нс? Теперь лед тронулся, скорость обмена стала удваиваться каждые два года, подстать процессорам.

Производительность ускорителей растет еще быстрее и удваивается каждые полгода. Ни процессоры, ни память уже не удовлетворяют потребностей современных ускорителей. Как следствие - нужно ожидать кардинальных изменений либо в технологиях памяти и процессоров (примеры - Rambus DRAM или 3Dnow! и Katmai new instructions), либо в архитектурах самих ускорителей (примеры - tiled based architecture, семейство PowerVR).

Самое смешное, что за всем этим феерическим взрывом технологий никак не может угнаться программное обеспечение (читай - программисты). Создаются потрясающие 3D-игры, но их основная проблема вовсе не в недостаточной производительности компьютеров, а, скорее, в понижаемых взрывоопасным развитием аппаратных средств требованиях к продуманности и эффективности их программирования. Ну, скажете вы, накинулся на бедных работяг, ночами читающих все новые и новые спецификации расширений OpenGL или очередных версий Direct3D. Да я сам программист, мне можно...

Так пусть наши возможности...

Оставим далекое архитектурное будущее в покое, а сами займемся подведением итогов, анализом тенденций и классификацией представителей столь динамического мира 3D-хищников (Монстров, Вампиров и прочих Дикарей). Речь пойдет о 3Dfx Banshee и представителях второго поколения - Riva TNT от nVidia, Rage 128 от ATI и RRedline (V3300) от Rendition.

  • Пожалуй, самым главным явлением этого года следует признать провал шины AGP. Провал не в смысле исчезновения ее с рынка под влиянием конкуренции - о какой конкуренции может идти речь в случае Intel (ВторойСамойЛюбимойКомпании)? Да и затянувшиеся роды PCI64 сказываются положительно на судьбе AGP. Все гораздо более буднично, AGP не оправдала возложенных на нее надежд как средство от непомерного разрастания памяти, отводимой ускорителями под хранение текстур. Именно поэтому чип i740 - неплохой, но не умеющий хранить текстуры в локальной памяти, так зависит от частоты шины памяти и ее типа. И именно поэтому карты с 16 Мбайт памяти становятся сейчас стандартной конфигурацией 3D-ускорителей, а с приходом Rage 128 и RRedline объем видеопамяти возрастет до 32 Мбайт. Тем временем шина PCI 2.1 поддерживается практически всеми многообещающими чипами, да и карты на ее основе продолжают выходить. Потребности современных ускорителей в полосе пропускания текстурной памяти слишком высоки, и AGP используется лишь как второе после большого буфера текстур средство.
  • Событие два - появление аппаратных средств декодирования DVD в современных 3D-ускорителях. Ранее подобной возможностью обладал лишь Rendition V2200. Это вполне насущная возможность, учитывая столь сильную загрузку процессора программными декодерами и их низкое качество. Важным преимуществом этих чипов является аппаратное IDCP (инверсное дискретное косинусоидальное преобразование; подробнее - быстрое аппаратное умножение каждого целого 8-битного числа из матрицы 8х8 на специальную таблицу значений косинусов, которые выбираются тоже с помощью матрицы 8х8). Да-да, именно так и распаковываются хорошо всем известные MPEG и DVD-фильмы. И если большинство других карт аппаратно только масштабирует и сглаживает результирующее изображение, а также преобразует цвета из YUV-пространства в RGB, для ускорения воспроизведения уже декодированных данных, то новые чипы Rage 128 и RRedline еще и производят этот довольно "тактоемкий" для процессора шаг декодирования. Благодаря подобному ускорению можно будет просматривать DVD-фильмы с высоким качеством и 10-30-процентной загрузкой центрального процессора, в отличие от программных DVD-декодеров, легко перегружающих Pentium II 266.
  • Событие три - повсеместная поддержка ускорения трехмерной графики в 32-битных (TrueColor) режимах. Несмотря на многократное увеличение необходимой для этого полосы пропускания памяти, все чипы второго поколения способны работать в таком режиме, более того, все они поддерживают 24-битный Z-буфер и необходимый для быстрой реализации различных эффектов (например, отражения или преломления света в прозрачных предметах) 8-битный буфер шаблонов, известный в OpenGL как Stencil Buffer. Разумеется, стали необходимыми новые форматы текстур - 24- и 32-битные, а также палитры соответствующей точности. Более того, даже в 16-битных режимах все вычисления проходят с 32-битной точностью, а потом результат округляется. Качество изображения просто потрясает, но за него приходится платить падением скорости, впрочем, уже не превышающим 50 процентов, а в режимах с низким разрешением (640х480) - и 10 процентов. Еще одно новшество - аппаратная поддержка процедурных текстур, вещь очень полезная, но пока программами не используемая. Например, огонь и вода в "Unreal" - это процедурные текстуры, которые динамически рассчитываются процессором и оживляются анимацией палитры (локальной палитры данной текстуры, разумеется).
  • Событие четыре - все чипы второго поколения поддерживают мультитекстурирование, то есть имеют два независимых параллельных конвейера обработки текстур. Известны два способа повышения производительности любых вычислительных устройств - увеличение скорости выполнения элементарных операций (попросту тактовой частоты) и распараллеливание обработки данных (будем считать, что реализованные в железе алгоритмы оптимальны). Оба требуют затрат на реализацию и связаны с ужесточением проектных норм производства чипа и увеличением его размеров. В данный момент становятся выгодны параллельные решения, к тому же современные графические алгоритмы могут быть на удивление легко распараллелены. Большинство известных и популярных сейчас 3D-игр используют многопроходное построение изображения. "Quake" и "Quake 2" требуют два прохода для построения изображения: вначале накладывается сама текстура предмета, а затем с ней комбинируется карта освещенности (специальная небольшая текстура, на значение которой в каждой точке умножается исходная текстура предмета), -таким образом, создается эффект неравномерной освещенности предметов. "Unreal" строит изображения в четыре прохода. Но если ускоритель имеет два конвейера и может за один проход комбинировать две текстуры (то есть поддерживает мультитекстурирование), изображение в "Quake" и "Quake 2" строится вдвое быстрее.

    Rage 128, RRedline и Riva TNT, как и Voodoo2, способны за один такт обрабатывать две текстуры параллельно. Причем, в отличие от последнего, новые чипы способны не только комбинировать две разные текстуры, но и рассчитывать две соседние точки изображения за один такт, увеличивая (в полтора раза) производительность игр, не поддерживающих мультитекстурирование. При использовании одновременно обоих конвейеров можно за один такт осуществлять трилинейную фильтрацию текстур, различные эффекты типа наложения карт освещенности, можно накладывать на поверхность рельеф. Возможна также анизотропная фильтрация, но иногда она требует двух проходов, то есть фактически эмулируется.
  • Событие пять - закон 2 х 64 > 128. Появились первые карты, использующие две независимые шины памяти. Давайте посчитаем, сколько данных необходимо перекачать из памяти в чип и обратно для построения одной точки в современной 3D-программе. Запись: 32 бита цвет, 24 бита Z-буфер, 8 бит буфер шаблонов. Чтение: 32 бита цвет, 24 бита Z-буфер, 8 бит буфер шаблонов, 32 бита х 4 - текстура с билинейной фильтрацией х 2 штуки. Итак, в худшем случае 48 байт, то есть три такта шины памяти на один такт ядра ускорителя. Конечно, в случае более простых приложений и 16-битных режимов, в частности, в "Quake" и "Quake 2", ситуация не столь напряженная, но все равно пропускная способность памяти является самым узким местом подобных ускорителей. Именно поэтому, несмотря на возможности шины AGP, выходят карты с большим объемом локальной памяти - ведь пропускная способность AGP пока в четыре (!) раза ниже, чем у локальной памяти, а игры используют все более сложные и объемные текстуры. Наличие двух независимо работающих шин памяти позволяет повысить ее производительность в полтора-два раза, не только благодаря возможности одновременного чтения и записи и уменьшению количества переключений между ними, но и благодаря большему числу поддерживаемых банков памяти. Дело в том, что чем больше банков памяти поддерживает контроллер, тем реже случаются непопадания в текущую страницу SDRAM или SGRAM и, как следствие, тем быстрее работает память. А еще подобное решение снижает цену памяти: например, сейчас выгодно с точки зрения цены ставить 8 Мбайт SGRAM, а не SDRAM; и наоборот, более выгодны 16 Мбайт SDRAM, чем SGRAM. Когда чип поддерживает две шины памяти, возможен выбор из большего числа вариантов - например, недорогая конфигурация с 16 Мбайт SGRAM.
  • Время 3D-дополнений (таких, как Voodoo2) уходит, большинство новых ускорителей являются комбинированными решениями. Дело в том, что современные 2D-ускорители, реализованные в новых чипах, имеют 2D-производительность, близкую к теоретическому пределу и, как следствие, - практически равную. Тесты в 2D-графике показывают, что слабое место современного 2D-ускорителя - GDI Windows (если можно так выразиться). Судя по всему, большую часть времени ускоритель простаивает, ожидая команд от GDI, а не наоборот. Более того, 3D-чипы настолько сложны, что площадь кристалла, отведенная под 2D-ускоритель, не превышает 10-15 процентов и разница в себестоимости комбинированного и просто 3D-решений минимальна.
  • Тактовые частоты взлетают на новые высоты. Чипы, сделанные по технологии 0,35 мкм, сильно греются и не могут перешагнуть через барьер100 МГц, но все фирмы объявили о скором переводе производства своих чипов на 0,25-микрометровую технологию. Здесь нас ждет лишь слабый нагрев и частота 125 МГц и более. Характерным явлением становится отличная от частоты ядра частота шины памяти (от 125 МГц вплоть до 200 МГц, когда появятся соответствующие микросхемы памяти) и наличие встроенной в чип кэш-памяти для данных.

И последнее. Хотя уже год как хорошим тоном считается выпускать в продажу ускоритель, имеющий полные драйверы OpenGL ICD и Direct 3D, фирмы 3Dfx Interactive и Matrox Graphics, похоже, об этом не знают. Как недавно выяснилось, выпуск драйвера OpenGL для ускорителя Matrox MGA200 откладывается на несколько месяцев, да и с 3Dfx дела обстоят не лучше. Ох уж эти программисты...

Прежде чем описывать возможности отдельных чипов, давайте бросим взгляд на сравнительную таблицу их основных параметров (см.табл.).

Riva TNT

Лучший. Сейчас, пока еще не появились в продаже другие карты на базе чипов второго поколения, Riva TNT стал по всем параметрам "самым-самым" на данный момент ускорителем. Впервые более или менее достоверную информацию о новом детище nVidia можно было почерпнуть на выставке "Electronic Entertainment Expo", а также увидеть собственными глазами опытный образец, "собранный на коленке", с недоделанными драйверами. Но эта "недоделка" демонстрировала "Quake 2" в режиме 1280х1024х32 бит (TrueColor) со скоростью около 30 кадров в секунду.

Карты на базе Riva TNT уже появились в продаже. Впрочем, пока (до конца ноября) чип будет производиться по технологии 0,35 мкм. Продаваемые сейчас карты на его основе имеют тактовую частоту 90-95 МГц, такую же, как и у Voodoo2, но память SGRAM на этих картах уже сейчас работает на частоте 125 МГц. На таких частотах производительность закраски составляет 180 млн. пикселов в секунду, а пиковая пропускная способность - порядка 6 млн. треугольников в секунду (эти параметры, как и результаты тестов, ниже, чем у двух Voodoo2 в режиме SLI). Но при цене 190 долларов за карту с 16 Мбайт памяти это не является недостатком, тем более что более поздние варианты TNT будут обрабатывать 250 млн. пикселей и 8 млн. треугольников в секунду и обмениваться данными с памятью на частоте 200 МГц. Это если не лучше, то и не намного хуже Voodoo2 SLI.

Качество изображения. Три самых существенных недостатка ускорителей первого поколения: низкая скорость, малый объем памяти, низкое качество изображения. В общем, получается, что все они - сплошной недостаток. Как же обстоит дело с качеством изображения (больной вопрос для Riva 128) у TNT? Здесь nVidia проделала огромную работу над ошибками. Субъективно, качество на уровне признанного сейчас лидера - Matrox G200. Но при этом производительность гораздо выше, да и набор аппаратно реализованных функций шире. Есть аппаратная поддержка процедурных текстур. Преимущество чипа - наличие полного OpenGL ICD не только для Windows 95/98, но и для Windows NT. Причем благодаря поддержке чипом буфера шаблонов и полного набора режимов совмещения (blend modes) это действительно полная и профессиональная реализация OpenGL 1.1, которая блестяще справляется с предназначенными для профессиональных рабочих станций тестами. Хотя можно указать один недостаток - в текущих драйверах вместо трилинейной фильтрации реализована аппроксимация, приводящая к появлению слабо заметных, но неприятных артефактов.

Результаты тестов. Обратите внимание на таблицу. На разрешениях 1024х768 и выше начинает сказываться нехватка скорости заполнения (как следствие - проигрыш Voodoo2 SLI увеличивается); кроме того, Riva TNT больше зависит от процессора: экономным владельцам младших моделей Pentium II имеет смысл приобрести менее дорогой Banshee. Правда, качество изображения, 32-битные режимы и возможности дальнейшего роста с лихвой окупают 60 долларов экономии. В случае производительного центрального процессора Riva TNT вне конкуренции (Voodoo2 SLI не в счет). TNT также выигрывает в сложном отношении цена/скорость-качество. По-прежнему 640х480 и 800х600 остаются "крейсерскими" режимами. А в случае 32-битного цвета и достаточно требовательных игр лучше 1024х768 и не пробовать.

Заключение. Единственное, что может покачнуть выбор в сторону другого чипа, - цена карт на базе TNT. Впрочем, уже есть информация об OEM-вариантах карт на TNT за 145 долларов!

Когда подобные предложения появятся на нашем рынке (больной сейчас вопрос, особенно в связи с двукратным "утоньшением" номеров "Компьютер Прайс" и прочими последствиями кризиса), TNT не будет равных даже в случае не очень сильных компьютеров. Хочется отметить, что чип довольно сильно греется (экземпляры, выполненные по 0,35-мкм технологии) и обязательно требует эффективного охлаждения (радиатора, а лучше вентилятора) для стабильной работы. Правда, с переходом на 0,25-мкм технологию эта проблема уйдет сама собою.

Voodoo Banshee

Лидирующее положение Voodoo2 не могло сохраняться вечно. Очень простой и удобный для производителей игр API Glide или феноменально высокая для того времени производительность - еще не повод для вечного господства. Появляются новые 2D/3D-решения, лишенные связанных с традиционным для Voodoo "сквозным" подключением недостатков (замыливание изображения на высоких частотах развертки и больших разрешениях, невозможность работы не на полный экран), обладающие сравнимой производительностью и, что самое главное, меньшей ценою. А это новые рынки - не только "профессиональные" игроки, но и сверхприбыльные OEM-поставки, и простые пользователи, иногда играющие в игры. Доходы компании 3Dfx Interactive стали падать, пожарными темпами был доведен до ума и выпущен на рынок проект Banshee, недорогое и качественное 2D/3D-решение с поддержкой Glide. Но все же с небольшим опозданием. Произойди это на полгода раньше, до выхода Matrox G200, - Banshee без проблем завоевал бы рынок. Ну а сейчас ему предстоит тяжелая ценовая борьба за место под солнцем для своей ранее "самой-самой" компании.

Попытаюсь описать этот продукт одной фразой: Современное 2D + Voodoo2 без возможности мультитекстурирования (то есть без второго текстурного чипа).

Еще задолго до появления первой информации о 3D-возможностях (тщательно скрываемой практически до момента появления reference-платы) было объявлено, что новый чип будет иметь феноменальную 2D-производительность, аппаратно реализуя все функции GDI Windows. Но, как уже было замечено, в современных картах 2D-ускорение доведено до теоретического предела, и подобные заявления звучат несколько странно. Результаты комплексных 2D-тестов TNT, Banshee и G200 практически не отличаются, и только в случае 32-битных режимов можно обратить внимание на отсутствие падения производительности у TNT.

3D. Теперь о насущном. Главное преимущество - поддержка Glide. Главный недостаток - отсутствие конвейера обработки текстур и, как следствие, возможности мультитекстурирования. Чип работает на частоте 100 МГц и в играх, не использующих возможности мультитекстурирования, должен превосходить Voodoo2. Реально дело обстоит не всегда так (см. тесты), и этому есть простое объяснение. Давайте вспомним архитектуру Voodoo2 - три чипа, каждый с раздельным буфером памяти. Один для кадра и Z-буфера (64 бита), два для текстур (64 бита каждый). Когда программа не поддерживает мультитекстурирование, работает только один текстурный чип, совсем как в случае с Banshee. Но есть существенное различие - у Banshee шина не может одновременно работать на чтение и запись, а два буфера Voodoo2 могут. И если пакетное чтение или запись в SDRAM происходит каждый такт, то переключение между ними занимает как минимум пять тактов. Правда, существует еще внутренний кэш для текстур и (иногда) для данных буфера кадра, но он не способен окончательно поправить положение.

Качество изображения. Здесь нас не ждет ничего нового за исключением возможности вывода 3D-изображения в окне (а не только на полный экран, как у Voodoo2) и полного сглаживания сцены. Все те же 16-битная глубина цвета, 16-битный Z-буфер и т. д. Текстуры - размером не более 256х256, впрочем, это требование вполне соответствует современным играм. Но на примере "Unreal", которая быстро и качественно работает пока только с Glide, становится ясно - все это можно простить за воспитанную годами привычку программистов писать игры в расчете на Glide-подобные возможности и Voodoo-набор поддерживаемых 3D-функций. Что поделаешь, стандарт де-факто в течение нескольких лет -способен оставить неизгладимый след в сознании. Даже в Direct3D-игры от Microsoft вкладывались бумажки с надписью "3Dfx required"! Но, мало-помалу, Glide-мания стала проходить, и дела у 3Dfx пошли гораздо хуже. Сейчас же они вздумали судиться с nVidia по поводу использованного ею в TNT мультитекстурирования - старой как мир идеи, к тому же вовсе не 3Dfx придуманной, хотя и ею запатентованной.

AGP? PCI 66! Да-да Voodoo Banshee не поддерживает AGP. То есть несмотря на выпускаемые варианты карт с AGP-разъемами, которые вставляются в AGP-слот и успешно там функционируют, Banshee использует AGP лишь как обычную однослотовую модификацию PCI-шины, на частоте 66 МГц, и, как следствие, не способен хранить текстуры в основной памяти компьютера или пересылать данные с пиковой скоростью AGP - 512 Мбайт/с. Только 132 Мбайт/с в сторону компьютера и 264 Мбайт/с в сторону Banshee.

Результаты тестов. А результаты не так уж и плохи, особенно там, где дело касается "Quake" и, тем более, средних и слабых процессоров. Те, кто собирается оснастить свой Pentium 200 MMX или Celeron 266 (не разогнанный по каким-либо соображениям) новой видеокартой, обязательно должны приглядеться к Banshee, который будет выпускаться как в псевдо-AGP-, так и в PCI-вариантах. Очень привлекательна и цена.

ATI RAGE 128

Честно говоря, мне не нравится фирма ATI. Разумеется, не из-за высокого качества исполнения видеокарт или отличной технической поддержки, нет. Просто нехорошо заявлять, что ее продукт (например, Rage Pro) является лидером в 3D-индустрии и приводить при этом цифры 3D-WinBench, которые благодаря специально оптимизированным под этот тест драйверам были "впереди планеты всей". Но стоило только запустить какую-либо распространенную игру, и все становилось на свои места - если игра и запускалась, то уже никак не претендовала на результаты, подобные Voodoo Graphics. Вдобавок ко всему - несколько неправильно реализованных 3D-функций и нестабильные драйверы. В итоге Rage Pro перестал восприниматься владельцами компьютеров как адекватный современным запросам 3D-ускоритель (что-то подобное произошло несколько лет назад и с S3 Virge).

Rage 128 VR - ориентированный на широкий потребительский рынок вариант, при разработке которого главным считалось соотношение цена/производительность. Вообще, это довольно опасный подход: цены в наше время падают настолько быстро, что лучше "переложить" в чип возможностей, чем лишний раз понизить стартовую цену ускорителя, которая и так способна за несколько месяцев упасть в полтора раза. Я уже не говорю об OEM-ценах. А попытка сознательно урезать возможности приведет, в конце концов, к быстрому вытеснению чипа с рынка своевременными и, тем более, последующими конкурентами. Да что тут говорить - посмотрите на Banshee. Много сознательных упущений, например, отказ от мультитекстурирования, все для снижения себестоимости. Но не успел он появиться в продаже, как на пятки (в смысле цены) ему уже наступила OEM Riva TNT за 145 долларов. Такая же опасность существует и здесь, тем более что ATI никогда не отличалась низкими стартовыми ценами.

В отличие от своего старшего собрата (Rage 128 GL) VR имеет только 64-разрядную шину памяти и выпускается в исполнении, аналогичном Rage Pro Turbo, - 256-контактном корпусе BGA. Подобное решение направлено на рынок интегрированных в материнскую плату видеоконтроллеров; уже существует множество подобных плат, рассчитанных на Rage Pro Turbo, и замена графического чипа на Rage 128 не потребует практически никаких усилий со стороны производителей материнских плат. Но как быть с недостаточной пропускной способностью 64-разрядной шины? Вот тут и начинается самое интересное: оказывается, что Rage 128 VR поддерживает кроме обыкновенных SDRAM и SGRAM достаточно новые для массового рынка типы памяти - DDR (Double Data Rate) SDRAM и SGRAM. Как вы уже, наверное, догадались, эти модификации способны передавать два слова данных за один такт, используя для этой цели и передний, и задний фронты тактовых импульсов в качестве опорных сигналов. В результате достигается практически вдвое большая пропускная способность шины памяти на той же тактовой частоте, что и у обычных чипов SDRAM и SGRAM.

Чип Rage 128 GL, по словам представителей ATI, ориентирован на рынок графических рабочих станций и мощных игровых компьютеров. Тут они опять несколько загнули - несмотря на отличные характеристики, этот чип не является чем-то выдающимся по сравнению с остальными представителями второго поколения - Riva TNT, RRedline или Permedia 3. Скорее, он выглядит равным среди равных, хотя в некоторых применениях Riva TNT будет ему проигрывать, поскольку как Rage 128, так и RRedline или Permedia 3 способны поддерживать до 32 Мбайт памяти. Шина у Rage 128 GL развернулась во все полноценные 128 бит, но при этом утратила возможность работать с DDR-памятью. Так, пропускная способность не превысит 2 Гбайт в секунду для самой быстрой ныне SGRAM 143 МГц. В ATI планировали 3,2 Гбайт в секунду и три раздельных кэша - для текстур, для данных буфера кадров и для Z-буфера. Но соображения экономии (хотя какая может быть экономия в профессиональной версии чипа для рабочих станций и трехсотдолларовых карт с 32 Мбайт памяти?) опять взяли верх, и кэш для Z-буфера "попал под сокращение". Туда же отправилась и первоначальная идея двух независимо работающих конвейеров, каждый с возможностью обработки двух текстур за такт. То есть конвейеры могли бы рассчитать две точки за такт, каждую с мультитекстурированием.

Чипы Rage 128 будут производиться по технологии 0,25 мкм (представители ATI утверждают, что их 2,5-вольтный чип практически не греется, и это вполне соответствует действительности) и иметь номинальную тактовую частоту 100 МГц, частоту шины памяти до 143 МГц (в первых картах 125 МГц) в случае SGRAM и 125 МГц для DDR-типов памяти. Обеспечивается мультитекстурирование. Шины - PCI 2.1 и AGP 2x. Заявлена и поддержка AGP 4x, будет очень приятно, если ее реализация совпадет с окончательной версией AGP 4x.

2D. Важным преимуществом чипов Rage 128 является аппаратное декодирование MPEG и DVD. Не будем делать поспешных заключений о 2D-производительности, до первых результатов тестов, но я не удивлюсь, если она будет такой же, "как у всех".

3D. В отличие от Rage Pro, здесь все в порядке. Все те же возможности, что и у TNT, плюс действительно интересное преимущество - аппаратное удаление задних треугольников (обратных граней) и процессор команд - устройство, способное без вмешательства процессора выбирать из памяти команды и данные для ускорителя. Такой джентльменский набор позволяет надеяться на возможность полноценного ускорения практически любой OpenGL- или DirectX-программы.

Заключение, тесты и перспективы. К сожалению, результаты практических тестов, как и полноценные образцы плат и драйверов, пока недоступны, а говорить о месте этой платы на рынке тем более преждевременно. Хочется верить, что драйверы (особенно OpenGL) будут действительно работоспособными. Плата на базе чипа Rage 128 запланирована к выходу на ноябрь этого года - это будет Xpert 128 (16 Мбайт SDRAM) ценою 180 долларов. Затем на рынке появятся более солидные решения - Rage Magnum и Rage Fury, c 32 Мбайт SDRAM, причем первая карта ориентированна на профессионалов, а вторая на игроков. Они отличаются комплектом ПО, к тому же Fury имеет TV-выход. Ориентировочная цена - 300 долларов.

Результаты тестов 2D Winstone 98

Rendition RRedline

Я всегда симпатизировал продуктам фирмы Rendition; они не обладали рекордной производительностью, но всегда демонстрировали завидное качество изображения и множество новаторских возможностей. Не известно, как RRedline (V3300), а все их предыдущие продукты (V1000, V2200 и V2100) представляли собой очень интересные и единственные в своем роде ускорители - специальные RISC-процессоры, снабженные дополнительными модулями для ускорения графики. Как следствие - возможность добавлять в ускоритель новые функции просто путем обновления драйверов и входящей в них микропрограммы для ускорителя, не говоря уже о слабой загрузке центрального процессора, так как, например, многие функции OpenGL полностью перекладывались на процессор ускорителя. Хорошо, если новый продукт продолжит эту оригинальную архитектуру.

Пока еще не известно множество параметров нового чипа (планируется, что он выйдет в декабре), но та информация, которая доступна на данный момент, впечатляет. Как и Permedia 3, это будет настоящее событие в мире 3D-графики. Самое кардинальное преимущество RRedline - наличие двух встроенных контроллеров дисплея и двух RAMDAC. Это открывает множество возможностей - разумеется, для тех, у кого есть два монитора или монитор и телевизор. Каждый из контроллеров может работать со своим собственным разрешением, частотой развертки и глубиной цвета. Например, можно смотреть на одном экране DVD-фильм, а на втором в это время работать с Windows или подключить один выход к огромному телевизору и играть на нем в игры. Могут быть одновременно использованы 2D- и 3D-буферы кадров, каждый из контроллеров может быть подключен к LCD-дисплею через стандартный цифровой интерфейс. Как и Matrox G200, RRedline работает одновременно с двумя 64-разрядными шинами памяти. Поддерживается мультитекстурирование, и уникальная особенность - оба конвейера способны одновременно производить трилинейную фильтрацию без какого либо снижения производительности. Конвейеры могут работать независимо, закрашивая две соседние точки за такт. И последнее - аппаратная поддержка и декодирование MPEG и DVD, как и в случае Rage 128. Желающим больше узнать о RRedline я рекомендую регулярно посещать еженедельно обновляемую страничку их сайта www.rendition.com/FOW. Кроме того, огромное количество полезной информации о любых аппаратных средствах можно почерпнуть на сайте технической информации ixbt.stack.net.

 

Профессиональные и игровые: в чем разница?

Владислав Бирюков <vvbir@geol.msu.ru>

В настоящее время между 3D-ускорителями, предназначенными для игр и профессиональной деятельности, существует достаточно четкая граница, определяющаяся рядом более жестких требований к последним.

  1. Профессиональным картам совершенно необходимо наличие устойчиво работающего и отлаженного ICD-драйвера OpenGL для Windows NT. Большинство приложений, требующих для производительной работы 3D-акселератор, - а это в основном системы автоматизированного проектирования (I-DEAS, Pro/Engineer, SolidWorks), а также программы создания трехмерного видео и анимации (SoftImage, Lightwave 3D, 3D Studio MAX), - используют API OpenGL. При работе с некоторыми приложениями не помешает также аппаратная поддержка Heidi (фирменного API компании Autodesk).

    Производители игровых ускорителей часто пренебрегают ICD-драйверами OpenGL из-за сложности и дороговизны их разработки. Типичный пример: даже такая многоуважаемая фирма, как Matrox, до сих пор не выпустила ICD для Millennium G200. Следует учитывать, что, как и любой другой сложный программный продукт, только что появившиеся ICD-драйверы зачастую далеко не идеальны и требуют длительной шлифовки.
  2. Следующим критичным условием является, пожалуй, высокая производительность под OpenGL. Одного лишь хорошего драйвера, увы, недостаточно. Например, карты на базе Intel 740 на роль профессиональных ускорителей явно не тянут, в частности, из-за невысокого быстродействия. С другой стороны, в Direct 3D-играх многие серьезные акселераторы показывают результаты намного худшие, чем более дешевые, но для этого специально "заточенные".
  3. Так как профессиональная работа с трехмерными объектами подразумевает использование большого монитора, то от ускорителя требуется поддержка соответствующих видеорежимов. Как правило, считается, что необходимо разрешение не менее 1280х1024 с 32-битной глубиной цвета, частотой вертикальной развертки от 75 Гц и как минимум 24-разрядным Z-буфером. Не последнюю роль играет и качество изображения. Длительная работа за монитором невозможна без высокой четкости и хорошей прорисовки деталей видеоадаптером. Следовательно, карта должна содержать достаточно большой объем памяти (не менее 8 Мбайт), а также быстрый и качественный RAMDAC.

Стоимость профессиональных акселераторов в среднем значительно выше, чем игровых. Отчасти это связано с необходимостью установки большого объема видеопамяти и дороговизной разработки качественного ICD-драйвера. Нижняя ценовая граница для профессиональных карт составляет около 200 долларов (например Diamond FireGL 1000 Pro на базе Permedia 2), верхняя же иногда превышает 5 тыс. долларов (Intergraph RealiZm II, NeTpower ULTRAfx).

Все эти причины привели к тому, что компании-производители обычно четко позиционируют свои изделия для того или иного сегмента еще в процессе разработки. В то же время одной из последних тенденций на рынке стало постепенное сближение недорогих профессиональных 3D-акселераторов с игровыми, обусловленное ростом производительности, расширением функциональных возможностей и снижением стоимости новых чипсетов. В качестве примера таких универсальных продуктов можно назвать Matrox Millennium G200, ускорители на Riva TNT и ожидающиеся в конце года карты на базе Permedia 3.

© ООО "Компьютерра-Онлайн", 1997-2021
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.