AMD Athlon 64 и конкуренты в профессиональных задачах. Часть 4. Photoshop 7.0, Maya 4.5, Cinema 4D и другие
АрхивПлатформаЗаключительная серия тестов по оценке скорости быстродействия процессоров. Подводим итоги и делаем выводы.
См. остальные части нашего обзора:
Часть 1: Введение. Основные архитектурные особенности и характеристики процессоров семейства AMD Athlon 64 по сравнению с AMD Athlon XP и Intel Pentium 4.
Часть 2: Исследование быстродействия процессоров в AutoCAD 2002.
Часть 3: Детальное тестирование быстродействия в системе трехмерного моделирования 3ds max 5.0, оптимизированной для архитектуры Intel NetBurst и технологии Hyper-Threading.
Maya 4.5
Для проверки скорости проигрывания анимации в окнах проекции использовалась сцена ImportFinal.mb из комплекта поставки Maya 4.5 (папка UnlimitedLessonData\Cloth\Scenes), где моделируются идущий человек, его футболка и брюки, которые колышутся в такт шагам. Анимация получается достаточно сложная. Она проигрывалась как в одном основном окне, так и в четырех квадрантах (везде, кроме основного окна, модели были каркасными, и только в главном окне модель «обтягивалась», см. скриншоты). Для ImportFinal.mb производилась также анимация без использования предварительно созданного файла ImportFinal.mcc (который ускорял проигрывание), что было эквивалентно финальному рендерингу ролика. Все тесты выполнялись при экранном разрешении 1280х1024 и 32-битном цвете. Измерялось время проигрывания ролика целиком, и по нему вычислялась средняя скорость анимации в кадрах в секунду.
По двум другим методикам, описанным на сайте www.maya-testcenter.de, измерялась скорость анимации модели «искусственного ежика» (файл 3D-Test.ma) в режимах shaded и textured. В другом тесте с этого сайта выполнялся финальный рендеринг кадра размером 512х512 (на рисунке). Модель для рендеринга (Rrendertest.ma) изобилует неровными поверхностями, отражающими свет, и использует технологии shadowmaps, raytracing, displacement mapping, 3D-текстуры и постэффекты, такие как glow.
Тесты скорости проигрывания анимации (слева) |
В целом этот пакет моделирования оптимизирован для архитектуры Intel NetBurst немного хуже, чем 3ds max 5.0, — при проигрывании анимации с большим отрывом лидируют процессоры AMD. Однако при рендеринге старший Pentium догоняет (и даже чуть обгоняет) «Атлоны» 64, причем именно при рендеринге прирост производительности Pentium 4 за счет большого кэша L3 в этом пакете составляет от 7,5 до 15,5% (!), тогда как для анимации такой кэш оказался бесполезным. Новая архитектура AMD обеспечивает прибавку скорости от 18 до 28%, а второй канал памяти у Athlon 64 часто оказывается почти ненужным.
CINEMA 4D
Этот пакет с собственным трехмерным движком, используемый даже в Голливуде, нами оценивался как непосредственно — по времени финального рендеринга двух одиночных кадров (модели автомобиля и чайника), так и по специальному тесту CineBench 2003 v1, одна из тестовых сцен в котором взята из реального профессионального проекта — знаменитого мультика Pump Action. Для рендеринга в Cinema 4D использовалось экранное разрешение 1280x1024, а для теста CineBench 2003 — 1024х768 при глубине цвета 24 бита.
Тесты в программе Maxon Cinema 4D и |
Эта программа не только хорошо оптимизирована для архитектуры Intel NetBurst, но и умеет эффективно использовать Hyper-Threading (ускорение достигает 20%). Поэтому при рендеринге P4 уверенно лидируют. Однако при работе с шейдерами две старшие модели Athlon 64 все же обходят Pentium 4 в расчетах с помощью программного OpenGL и движка Cinema 4D, тогда как при использовании аппаратного ускорения OpenGL (мощной видеокартой) старшие Pentium 4 немного обгоняют Athlon 64. Средняя прибавка от кэша L3 для Pentium 4 в этом пакете составляет 2-3%, на двухканальности памяти Athlon 64 выигрывает примерно 2% на шейдерах (0% при рендеринге), а новая архитектура AMD дает прирост от 10 до 25%.
Усредненная скрость систем в пакетах |
SPEC viewperf 7.1
Еще шесть различных профессиональных пакетов трехмерного моделирования включены в комплексный тест 3D-графики SPEC viewperf v7.1 (www.spec.org). Он был разработан компанией IBM, а позже обновлен и существенно дополнен при непосредственном участии SGI, Digital (Compaq, HP), 3Dlabs (Creative Labs) и других членов группы SPECopc. Тест SPECviewperf обеспечивает хорошую гибкость при измерении OpenGL-производительности систем и использует реальные приложения для работы с трехмерной графикой, созданные независимыми производителями. Каждое приложение запускается несколько раз с разными целями, а затем подсчитывается усредненная производительность с использованием весовых коэффициентов, определяемых чаще самими разработчиками приложений с учетом важности каждого теста внутри всего приложения (подробности см. на www.spec.org).
В седьмой версии теста SPECviewperf используются шесть стандартных реальных приложений класса high-end в профессиональном проектировании:
– 3dsmax-02 основан на тесте SPECapc для программы 3ds max 3.1; он включает три модели, содержащие в среднем полтора миллиона вершин (углов) каждая, и тестирует производительность при различном уровне освещенности сцен;
– dx-08, основанный на приложении Data Explorer от IBM, содержит десяток различных тестов;
– drv-09 базируется на программе DesignReview от компании Intergraph и выполняет пять тестов;
– light-06 использует четыре теста в приложении Lightscape от Discreet с моделированием многих источников освещения;
– proe-02, основанный на тесте SPECapc для программы Pro/ENGINEER 2000i, измеряет две модели в трех режимах — shaded, wireframe и hidden-line removal (HLR);
– ugs-03 использует SPECapc для Unigraphics V17 и тестирует производительность при работе с моделью на 2,1 млн. вершин.
Тесты шести профессиональных 3D-приложений |
В версии 7.1 приняты специальные меры, чтобы исключить оптимизацию оборудования и драйверов под его паттерны. Традиционно этот тест очень хорошо чувствует разницу в быстродействии системной памяти, чипсета и процессора даже с одинаковой видеокартой (за исключением теста ugs-03, где производительность систем, как правило, ограничена возможностями видеокарты, а не процессора и памяти). Однако порой результаты паттернов SPEC viewperf трудно интерпретировать.
В частности (поскольку все пакеты моделирования из этого теста выпущены довольно давно), об оптимизации под Pentium 4, и тем более — под Hyper-Threading, вряд ли можно говорить. Однако и для Athlon 64 FX в некоторых случаях наблюдается необъяснимое ухудшение быстродействия в тестах пакета SPEC viewperf v7.1, даже с самыми последними версиями драйверов, из-за чего P4 в целом победил.
На финальной диаграмме приведена усредненная производительность платформ в 3D-пакетах, представленных на этом развороте: с отрывом 7% победил P4 EE.
Усредненная производительность платформ в пакетах |
Photoshop 7.0
Для оценки скорости выполнения системой различных операций в этой программе мы использовали широко известный сценарий PS7bench 1.11 (файл PS7benchAdvanced.atn); подробности см. на www.geocities.com/Paris/Cafe/4363/download.html#ps7bench. Единственное, что мы в нем поменяли, — это размер тестового файла изображения, увеличив его до 100 Мбайт, поскольку со стандартным тесты выполнялись слишком быстро и точность измерений была недостаточно высока.
Тест позволяет измерять скорость выполнения дюжны распространенных операций, перечисленных в правой колонке таблицы 4. Кроме них скрипт запускает еще несколько специфических фильтров (см. нижнюю часть таблицы), которые нельзя отнести к «повседневным нуждам» дизайнера, и скорость их выполнения платформами представляет скорее академический, чем насущный практический интерес.
Таблица 4. Время выполнения системами (в секундах) операций теста PS7bench 1.11 в программе Adobe Photoshop 7.0. Операция в Athlon 64 Athlon 64 Athlon 64 Athlon XP Pentium 4 Pentium 4 Pentium 4 Победитель Вращение на 0,3 0,4 0,4 0,4 0,3 0,3 0,4 = Вращение на 4,8 4,8 6,3 6,4 5,6 5,7 6,1 A64FX Вращение на 3,7 3,9 4,1 5,1 4,6 4,6 5,0 A64FX Gaussian Blur на 1,2 1,4 1,4 1,7 1,3 1,3 1,6 A64FX Gaussian Blur на 3,5 3,6 3,8 5,4 3,3 3,3 3,8 P4 3,2 Gaussian Blur на 3,8 4,0 4,2 6,0 3,7 3,7 4,2 P4 3,2 Unsharp Mask на 1,6 1,7 1,8 1,9 1,6 1,6 1,9 = Unsharp Mask на 3,8 4,0 4,1 5,6 3,6 3,6 4,0 P4 3,2 Unsharp Mask на 3,8 4,0 4,2 5,7 3,7 3,7 4,1 P4 3,2 Despeckle 4,8 4,9 5,3 5,2 4,1 4,2 4,5 P4 3,2 Преобразование 12,7 12,7 13,8 16,5 14,1 14,3 15,2 A64FX Уменьшение 1,8 1,8 1,9 2,4 1,8 1,8 1,9 = Среднее время 2,78 2,96 3,16 3,80 2,84 2,85 3,22 A64FX Lens Flare 6,9 7,0 7,6 7,5 4,6 4,6 5,3 P4 3,2 Color Halftone 4,4 4,6 4,8 5,5 3,9 4,2 4,8 P4 3,2 NTSC Colors 4,0 4,0 4,4 4,7 4,3 4,5 4,8 A64FX Accented Edges 19,6 19,7 21,4 20,6 19,7 20,2 21,7 A64FX Pointillize 31,9 31,2 (!) 34,0 34,1 22,3 22,3 23,4 P4 3,2 Watercolor 42,0 42,0 45,7 44,7 48,0 48,9 52,6 P4 3,2 Polar Coordinates 13,1 13,2 14,3 15,5 10,6 10,6 11,3 P4 3,2 Lighting Effects 3,4 3,5 3,8 3,9 3,2 3,2 3,6 P4 3,2 Среднее время 10,45 10,55 11,42 11,77 9,28 9,48 10,36 P4 3,2 Общее среднее 4,724 4,926 5,284 5,970 4,558 4,609 5,143 P4 3,2
Photoshop 7.0
FX-51
3400+
3200+
3200+
3,2 ГГц EE
3,2 ГГц
3,06 ГГц
90 градусов
9 градусов
0,9 градуса
1 пиксел
3,7 пиксела
85 пикселов
1 пиксел
3,7 пиксела
10 пикселов
RGB в CMYK
размера на 60%
по двенадцати
популярным
операциям
по восьми
специфическим
фильтрам
время
Тесты выполнялись в экранном разрешении 1024x768 при 24-битной цветности и бикубической интерполяции; временный файл Photoshop располагался на отдельном пустом разделе винчестера; время выполнения каждой операции измерялось встроенным в Photoshop таймером. Итоговые результаты приведены в таблице, а на диаграммах показаны значения, усредненные для каждого из блоков.
Усредненное время выполнения (в секундах) |
Необходимо отметить, что при усреднении результатов теста было бы некорректно использовать сложение времени выполнения каждой операции (или вычисление их среднего арифметического). В этом случае, например, быстрое выполнение самой долгой операции может исказить картину. Поэтому мы проводили усреднение при помощи среднего геометрического (или, в простейшем случае, — произведения, а не суммы всех показаний).
Заключение
В качестве краткого резюме приведем диаграмму с итоговым индексом производительности, усредненным (геометрическим способом, естественно) по всем рассмотренным тестам в популярных профессиональных пакетах моделирования и дизайна.
Итоговая диаграмма. |
Судя по всему, борьба между Athlon 64 (FX-51) и Pentium 4 (Extreme Edition) отнюдь не закончена и явного победителя пока нет: примерно в половине тестов Athlon 64 FX-51 победил Pentium 4 EE, а в другой половине — уступил. В целом оба процессора можно считать равноценными при работе в традиционной 32-битной среде, хотя если разработчики рано или поздно переведут эти профессиональные пакеты на инструкции x86-64, то чаша весов может качнуться в сторону первого (впрочем, об этом пока еще очень рано говорить). Примерно то же самое можно сказать и о соперничестве Athlon 64 3400+ с Pentium 4 3,2 ГГц EE, тогда как Athlon 64 3200+ в этом классе задач все же уступает своему прямому конкуренту — Pentium 4 3,2 ГГц. Любопытно, что далеко не всегда использование в Athlon 64 одного канала памяти вместо двух приводит к ощутимой потере быстродействия, чаще — как раз наоборот, Athlon 64 3400+ почти так же шустр в этих задачах, как и Athlon 64 FX-51, и скоро грозит стать хитом продаж.
И если, благодаря более прогрессивной архитектуре, Athlon 64 FX прибавил в 32-битных приложениях от 10 до 30% скорости по сравнению с Athlon XP, то резкое увеличение кэш-памяти у Pentium 4 не принесло в профессиональных приложениях столь же ощутимого прироста (в среднем лишь около 5%).
Поскольку перспективы роста частоты у всех этих 0,13-микронных ядер весьма туманны (потенциал практически исчерпан), будущее связывается с их миграцией на более тонкие техпроцессы — 90 нм в 2004 году и 65 нм в 2005-06 годах. И если Intel уже почти готова выбросить на рынок свои Prescott, то соответствующее ядро San Diego для Athlon 64 можно ожидать, видимо, не раньше конца 2004 года.
Предлагаем обсудить этот материал в нашем форуме