Архивы: по дате | по разделам | по авторам

Intel Pentium 4 Prescott. Часть 4. Производительность в ряде профессиональных графических приложений

АрхивПлатформа
автор : Алекс Карабуто   12.02.2004

Изучаем быстродействие систем на десяти самых мощных настольных процессорах, включая ядро Intel Prescott, в некоторых профессиональных пакетах 3D-моделирования и программе Adobe Photoshop.

После того, как мы познакомились с основными архитектурными особенностями нового ядра Prescott процессоров Intel Pentium 4, а также с результатами многочисленных тестов быстродействия этого и других современных процессоров в математических расчетах, мультимедиа-кодировании и трехмерных играх, см.:

Часть 1. Введение.
Часть 2. Простые вычисления, работа кэш-памяти и системной памяти и производительность при работе с видео и аудио.
Часть 3. Быстродействие в играх.

самое время взглянуть, как новичок чувствует себя в некоторых профессиональных программах по работе с графикой, часто используемых на персональных компьютерах. Тем более, что по усредненным результатам тестов в предыдущих двух частях мы могли убедиться, что Prescott немного, на 2-4%, отстает от ядра Northwood при той же тактовой частоте. Может быть, в профессиональных графических задачах он сможет взять реванш?

В данной, четвертой части обзора Prescott мы не ставили перед собой задачи объять всевозможные графические приложения — ведь исследование даже нескольких базовых из них требует нескольких статей, см., например, вышедший в декабре обзор-сравнение в четырех частях — от www.terralab.ru/system/31241 до www.terralab.ru/system/31244.

Поэтому в данной статье мы пока ограничимся лишь несколькими характерными графическими пакетами, которые, на наш взгляд, способны отразить разные стороны возможностей Prescott. Во-первых, мы используем хорошо оптимизированную для микроархитектуры NetBurst программу трехмерного моделирования Maxon CINEMA 4D в лице специального теста CineBench 2003. Во-вторых, мы используем набор тестов пакета SPEC viewperf v7.1, которые представляют несколько относительно старых, то есть неоптимизированных для NetBurst пакетов трехмерного моделирования. А в-третьих, мы рассмотрим работу различных операций и фильтров во всем известной и архипопулярной программе Adobe Photoshop 7.0, не пользуется которой, пожалуй, только ленивый. Photoshop 7.0 имеет некоторую, но не очень полную оптимизацию для Pentium 4.

Как и прежде, результаты тестов представлены на диаграммах, причем в трех нижних строчках мы для лучшей наглядности сравниваем в чистом виде три Pentium 4 на частоте 3,2 ГГц, тогда как в верхней части диаграмм результаты для всех исследованных процессоров проранжированы в порядке от худшего к лучшему.

 

CINEMA 4D

Мощный пакет трехмерного моделирования Maxon Cinema 4D с собственным трехмерным движком, используемый даже в Голливуде для создания спецэффектов в кино, нами оценивался по специальному популярному тесту CineBench 2003 v1, одна из тестовых сцен в котором взята из реального профессионального проекта — знаменитого мультика «Pump Action». Диаграммы иллюстрируют производительность платформ в этом приложении (использовалось экранное разрешение 1024х768). Эта программа не только хорошо оптимизирована для архитектуры Intel NetBurst, но и умеет эффективно использовать Hyper-Threading (ускорение от использования HT здесь достигает 20%). Поэтому при рендеринге мы наблюдаем полную гегемонию Pentium 4 по сравнению с процессорами AMD. Между тем, Prescott ведет себя при рендеринге крайне вяло и проигрывает даже Pentium 4 3,06 ГГц! Проигрыш же ядру Northwood с такой же частотой составляет в этом тесте более 13%! А поскольку большой объем кэш-памяти в этом тесте не помогает повысить производительность (прирост для Extreme Edition — менее одного процента), то «вина» за провал Prescott целиком и полностью ложится на удлиненный конвейер и высокий процент промахов в предсказаниях переходов.

Вместе с тем, при работе с шейдерами мы наблюдаем прямо противоположную картину: Prescott уверенно лидирует на движке Cinema 4D, опережая такой же по частоте Northwood на 6,6% и даже Extreme Edition — на 3,7%. Признаться, лишь в очень редких тестах «Прескотту» удается побороть более «кэшастый» Extreme Edition.

Однако в двух других шейдерных тестах — с использованием OpenGL-движка — успехи Prescott куда скромнее. Так, при hardware-операциях (то есть с использованием возможностей графического ускорителя) Prescott фактически одинаков по скорости с Northwood (и на 3% отстает от extreme Edition).

А при software-операциях, то есть когда все расчеты производятся средствами CPU, Prescott снова проигрывает «Нортвуду» — теперь около 6%. И едва способен опередить Pentium 4 3,06 ГГц.

Попутно отметим, что при OpenGL-шейдинге прекрасно себя чувствуют обе старшие модели Athlon 64, тогда как на движке Cinema 4D и при рендеринге «Атлоны» заметно медленнее, чем Pentium 4.

 

SPEC viewperf 7.1

Еще шесть различных профессиональных пакетов трехмерного моделирования включены в комплексный тест 3D-графики SPEC viewperf v7.1 (www.spec.org). Изначально он был создан компанией IBM, а позже обновлен и существенно дополнен при непосредственном участии компаний SGI, Digital (Compaq, HP), 3Dlabs (Creative Labs) и других членов группы SPECopc. Тест SPECviewperf обеспечивает хорошую гибкость при измерении OpenGL-производительности систем. Он может выполняться под различными операционными системами: UNIX, Windows XP, Windows 2000, and Linux. Этот пакет тестов использует реальные приложения для работы с трехмерной графикой, созданные независимыми производителями. При этом каждое приложение запускается несколько раз с различными целями, а затем подсчитывается усредненная производительность в каждом из пакетов с использованием весовых коэффициентов, определяемых чаще самими производителями приложений исходя из относительно важности каждого теста внутри всего приложения (подробности см. на сайте www.spec.org).

В седьмой версии теста SPECviewperf используются шесть стандартных реальных приложений класса high-end в профессиональном проектировании:

• 3dsmax-02 основан на тесте SPECapc для программы 3ds max 3.1 (уже достаточно старой) включает три модели, содержащие в среднем полтора миллиона вершин (углов) каждая, и тестирует производительность при различном уровне освещенности сцен.

dx-08, основанный на приложении Data Explorer от IBM, содержит десяток различных тестов.

drv-09 базируется на программе DesignReview компании Intergraph и производит 5 тестов.

light-06 использует 4 теста в приложении Lightscape от Discreet с моделированием многих источников освещения.

proe-02 основан на тесте SPECapc для программы Pro/ENGINEER 2000i и измеряет две модели в трех режимах — shaded, wireframe и hidden-line removal (HLR).

ugs-03 использует SPECapc для Unigraphics V17 и тестирует производительность при работе с моделью на 2,1 миллиона вершин.

В версии 7.1 приняты специальные меры, чтобы исключить оптимизацию оборудования и драйверов под паттерны этого конкретного теста. Мы здесь использовали четыре из шести перечисленных пакетов (тестов), который наиболее чувствительны к типу процессора и платформы. Традиционно данный тест очень хорошо чувствует разницу в быстродействии системной памяти, чипсета и процессора даже с одинаковой видеокартой (за исключением теста ugs-03, где производительность систем, как правило, ограничена возможностями видеокарты, а не процессора и памяти). Однако порой результаты паттернов SPEC viewperf непросты в интерпретации. В частности, поскольку все пакеты моделирования из этого теста — достаточно давних версий, об оптимизации под Pentium 4, и тем более — под Hyper-Threading вряд ли можно говорить.

Тем не менее, оказалось, что в большинстве из этих «неоптимизированных» тестов Prescott лидирует с огромным отрывом от остальных соперников! В частности, для теста drv-09 его отрыв от Northwood на одинаковой частоте равен 9,3%, для теста light-06 он повышается до 13,7%, а в тесте dx-08 он равен даже 18%!!!

Если учесть, что возросшая кэш-память здесь не играет практически никакой роли (Extreme Edition фактически равен по быстродействию обычному Northwood), то остается только догадываться, что же помогло «Прескотту» сделать столь впечатляющий рывок. Возможным объяснением здесь могут являться две вещи: возросший объем кэш-памяти первого уровня вкупе с улучшенным механизмом предвыборки и повышенной скоростью работы с системной памятью, и/или усовершенствованный Hyper-Threading. Очевидно, данный класс задач отлично поддается предсказанию переходов, поэтому удлиненный конвейер не стал обузой.

На базе показанных выше восемь тестов различных задач в профессиональных трехмерных пакетах моделирования мы обобщили условный средний индекс «профессиональной 3D-производительности» процессоров.

Как видим, Prescott тут, наконец, опередил предшественников на одинаковой частоте - «Нортвуда» на 3,6%, а «Экстрим Эдишна» — на 2,3%. В общем, это хороший результат. В среднем, в этом классе задач настольные процессоры Intel оказываются шустрее аналогичных процессоров AMD.

 

Adobe Photoshop 7.0

Теперь посмотрим на производительность платформ в сверхпопулярной программе Adobe Photoshop. Для оценки скорости выполнения системой различных операций в этой программе я использовал широко известный сценарий PS7bench 1.11 (файл PS7benchAdvanced.atn), подробности см. на www.geocities.com/Paris/Cafe/4363/download.html#ps7bench. Единственное, что я в нем поменял — это размер тестового файла изображения, увеличив его вдвое до 100 Мбайт, поскольку со стандартным тесты выполнялись слишком быстро и точность измерений была недостаточно высока.

Данный тест позволяет измерять скорость выполнения следующих распространенных операций:

– Вращение на 90 градусов;
 Вращение на 9 градусов;
 Вращение на 0,9 градуса;
 Gaussian Blur на 1 пиксел;
 Gaussian Blur на 3,7 пиксела;
 Gaussian Blur на 85 пикселов;
 Unsharp Mask на 1 пиксел;
 Unsharp Mask на 3,7 пиксела;
 Unsharp Mask на 10 пикселов;
 Despeckle;
 Преобразование RGB в CMYK;
 Уменьшение размера на 60%.

Кроме этих 12 операций, которые можно считать общеупотребительными и фактически непременными при почти любой работе с программой Adobe Photoshop, скрипт исполняет еще несколько специфических фильтров, которые, в общем, нельзя отнести к «повседневным нуждам» дизайнера, и скорость их выполнения платформами носит скорее академический, чем сугубо практический интерес:

 Lens Flare;
 Color Halftone;
 NTSC Colors;
 Accented Edges;
 Pointillize;
 Watercolor;
 Polar Coordinates;
 Lighting Effects.

Поэтому мы при анализе будем отдельно рассматривать первую группу из 12 тестов — как наиболее актуальную для пользователя, и вторую из восьми тестов — как «познавательную». Тесты выполнялись в экранном разрешении 1024x768 при 24-битной цветности, бикубической интерполяции, временный файл Photoshop располагался на отдельном пустом разделе винчестера, время выполнения каждой операции измерялось встроенным в Photoshop таймером. Результаты по скорости выполнения каждой из операций приведены в таблице 1, а на диаграммах показаны итоговые средние значения по каждой из категорий и в целом.

Для пущей наглядности первый столбец данных в таблице, принадлежащий процессору на ядре Prescott, расцвечен таким образом, что красный цвет соответствует случаям, когда Prescott опережает остальные Pentium 4 на той же частоте (то есть для этих действий наблюдается улучшение производительности для Prescott), а синим — наоборот, ухудшение (черным отмечены случаи неизменности показаний). В крайнем правом столбце отмечен процессор-победитель по каждой из операций.

Таблица 1. Время выполнения (в секундах) процессорами операций теста PS7bench 1.11 в программе Adobe Photoshop 7.0

Операция

Prescott
3,2 ГГц

Pentium 4
3,2 ГГц EE

Pentium 4
3,2 ГГц

Pentium 4
3,06 ГГц

Athlon XP
3200+

Athlon 64
FX-51

Athlon 64
3200+

Процессор-
победитель

Вращение на
90 градусов

0,3

0,3

0,3

0,4

0,4

0,3

0,4

=

Вращение на
9 градусов

5,3

5,6

5,7

6,1

6,4

4,8

6,3

A64FX

Вращение на
0,9 градуса

4,1

4,6

4,6

5

5,1

3,7

4,1

A64FX

Gaussian Blur на
1 пиксел

1,2

1,3

1,3

1,6

1,7

1,2

1,4

=

Gaussian Blur на
3,7 пиксела

3,5

3,3

3,3

3,8

5,4

3,5

3,8

P4 3,2

Gaussian Blur на
85 пикселов

3,8

3,7

3,7

4,2

6

3,8

4,2

P4 3,2

Unsharp Mask на
1 пиксел

1,4

1,6

1,6

1,9

1,9

1,6

1,8

Prescott

Unsharp Mask на
3,7 пиксела

3,8

3,6

3,6

4

5,6

3,8

4,1

P4 3,2

Unsharp Mask на
10 пикселов

3,8

3,7

3,7

4,1

5,7

3,8

4,2

P4 3,2

Despeckle

4,7

4,1

4,2

4,5

5,2

4,8

5,3

P4 3,2

Преобразование RGB в CMYK

12,1

14,1

14,3

15,2

16,5

12,7

13,8

Prescott

Уменьшение размера на 60%

1,4

1,8

1,8

1,9

2,4

1,8

1,9

Prescott

Среднее время по 12 популярным операциям

2,725

2,837

2,850

3,224

3,797

2,783

3,161

Prescott

Lens Flare

5,1

4,6

4,6

5,3

7,5

6,9

7,6

P4 3,2

Color Halftone

4,4

3,9

4,2

4,8

5,5

4,4

4,8

P4 3,2

NTSC Colors

4,7

4,3

4,5

4,8

4,7

4

4,4

A64FX

Accented Edges

23,3

19,7

20,2

21,7

20,6

19,6

21,4

A64FX

Pointillize

27,4

22,3

22,3

23,4

34,1

31,9

34

P4 3,2

Watercolor

52

48

48,9

52,6

44,7

42

45,7

P4 3,2

Polar Coordinates

11

10,6

10,6

11,3

15,5

13,1

14,3

P4 3,2

Lighting Effects

3,2

3,2

3,2

3,6

3,9

3,4

3,8

P4 3,2

Среднее время по 8 специфическим фильтрам

10,265

9,284

9,475

10,360

11,769

10,448

11,424

P4 3,2

Общее среднее время

4,632

4,558

4,609

5,143

5,970

4,724

5,284

P4 3,2

Легко видеть, что в шести из двенадцати распространенных действий Photoshop 7.0 применение Prescott позволяет заметно ускорить работу даже по сравнению с Extreme Edition! Прирост скорости на той же частоте ядра составляет от 5 до почти 30% (!!!), чаще в районе 10-15%. Среди ускоренных операций — вращение на 9 и 0,9 градусов, гауссианово размытие и Unsharp Mask на 1 пиксел, преобразование RGB в CMYK и ресемплирование (уменьшение размера). Благодаря этому Prescott вышел абсолютным победителем (правый столбец) сразу по трем операциям, вытеснив с этих позиций Athlon 64 FX-51!

Вместе с тем, в пяти из 12 действий мы видим некоторое ухудшение скорости работы Prescott по сравнению с Northwood — от 3 до 12%. В среднем же по указанным 12 действиям (операциям) Prescott обошел все предыдущие Pentium 4 и вышел абсолютным победителем, опередив Northwood почти на 5%, Extreme Edition — на 4%, а Athlon 64 FX-51 — на 2%. То есть снова мы видим, что Prescott ведет себя в профессиональных графических приложениях заметно лучше, чем в бытовых и игровых.

Однако, если мы взглянем на скорость выполнения фильтров в Photoshop 7.0, то нас ждет холодный душ: в семи из восьми фильтров Prescott работает медленнее, чем Northwood! Замедление составляет от 4 до 23% в зависимости то вида фильтра. «Хуже всего» стало фильтрам Pointillize, Accented Edges и Lens Flare. В среднем же по фильтрам Prescott уступает Northwood’у 8,2%, см. диаграмму.

На итоговой диаграмме приведен средний индекс производительности в Adobe Phtotshop 7.0. За счет «неудач» в фильтрах Prescott в целом уступил Northwood’у пол процента, хотя эту цифру нельзя назвать уж очень показательной, поскольку фильтры применяются в работе значительно реже, чем некоторые вышеперечисленные операции. Разумеется, все результаты были усреднены геометрически.

Подводя краткие итоги по всем трем тестовым частям нашего обзора, повторим сказанное ранее. Приложений, в которых Prescott быстрее одночастотного с ним «Нортвуда», как оказалось, пока не так уж много (по крайней мере, в процентном соотношении к общему числу программ). Чаще наблюдается ситуация, когда Prescott проигрывает Northwood от 5 до 15% — этим, например, «грешат» многие современные и недавнего прошлого игры, медиакодеки, простые математические расчеты. На относительно старых приложениях, неоптимизированных под NetBurst, мы наблюдаем существенный проигрыш Prescott своему предшественнику (Northwood) — временами до 15% (иногда Prescott 3,2 ГГц работает даже медленнее, чем Northwood 3,06 ГГц на шине 533 МГц). А вот некоторые профессиональные графические пакеты благоприятствуют «Прескотту», и его преимущество над Northwood доходит в отдельных случаях до 10-20 процентов.

Таким образом, изменения в микроархитектуре NetBurst в процессорах с яром Prescott фактически потребовали новой волны оптимизации приложений. Без такой оптимизации новый процессор часто будет работать даже медленнее, чем одинаковый с ним по частоте старый, невзирая на вдвое увеличившуюся кэш-память. На одинаковой частоте Prescott не может (в среднем) соперничать пока с Pentium 4 Extreme Edition. Однако у первого есть ресурсы по заметному наращиванию частоты примерно до 4,5 ГГц, в то время как P4EE и Northwood свои ресурсы практически исчерпали. Хотим мы этого или нет, но будущее Pentium 4 однозначно за Prescott. Хотя на первых порах (при частотах от 2,8 до 3,4 ГГц) более выгодным, видимо, будет все же приобретение процессоров на прежнем ядре. Особенно если учесть, что «Прескотты» заметно более горячие в работе, чем аналогичные Northwood и даже Extreme Edition.

Предлагаем обсудить этот материал в нашем форуме

© ООО "Компьютерра-Онлайн", 1997-2019
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.