Архивы: по дате | по разделам | по авторам

Oбзор современных платформ для настольных процессоров Intel. Часть третья: тестирование быстродействия.

АрхивПлатформа
автор : Алекс Карабуто   30.01.2003

Детальный сравнения производительности более 30 платформ c Pentium 4 на различных чипсетах с разной памятью.

В двух первых частях нашего обзора современных платформ для настольных процессоров Intel мы подробно рассмотрели характеристики и функциональные возможности текущих чипсетов, варианты типов оперативной памяти, доступной сейчас для использования с этими чипсетами, а также более десятка характерных материнских плат, наглядно представляющих возможности и быстродействие этих чипсетов. Поэтому здесь мы сразу перейдем к обсуждению результатов наших сравнительных испытаний производительности этих чипсетов с различными типами памяти. Если при прочтении данной части будут возникать вопросы по тем или иным аспектам функционирования или устройства чипсетов и плат, рекомендуем прочитать две предыдущие части нашего обзора:

Часть 1: www.terralab.ru/system/23543
Часть 2: www.terralab.ru/system/23586

В наших экспериментах участвуют следующие характерные конфигурации платформ:

С процессором Intel Pentium 4 2,80 ГГц:
1. ASUS P4G8X Deluxe (чипсет Intel E7205) c двухканальной DDR266
2. ASUS P4G8X Deluxe (чипсет Intel E7205) c одноканальной DDR266
3. ASUS P4T533-C (чипсет 850E) с RDRAM PC1066
4. ASUS P4T533-C (чипсет 850E) с RDRAM PC800
5. ASUS P4T533 (чипсет 850E) c RIMM4200
6. ASUS P4T533 (чипсет 850E) c RIMM3200
7. Intel D850EMVR (чипсет 850E) c PC1066
8. ASUS P4PE (чипсет 845PE) с DDR355
9. ASUS P4PE (чипсет 845PE) с DDR333
10. ASUS P4PE (чипсет 845PE) с DDR266
11. Intel D845PEBT2 (чипсет 845PE) с DDR333
12. Intel D845GEBV2 (чипсет 845GE) с DDR333
13. Intel D845GEBV2 (чипсет 845GE) с DDR266
14. Soltek SL-85DR2 (чипсет 845E) c DDR266
15. ASUS P4S8X (чипсет SiS648) c DDR400
16. ASUS P4S8X (чипсет SiS648) c DDR333
17. ASUS P4S8X (чипсет SiS648) c DDR266
18. SiS Reference Board (чипсет SiS648) c DDR400
19. SiS Reference Board (чипсет SiS648) c DDR333
20. ASUS P4S533 (чипсет SiS645DX) c DDR333
21. ASUS P4S533-MX (чипсет SiS651) c DDR333
22. Soltek SL-85ERV (чипсет VIA Apollo P4X400) c DDR333
23. Soltek SL-85ERV (чипсет VIA Apollo P4X400) c DDR266

С процессором Intel Pentium 4 3,06 ГГц:
24. ASUS P4G8X c DDR266, Hyper-Threading активирован
25. ASUS P4G8X c DDR266, Hyper-Threading дезактивирован
26. Intel D850EMVR c PC1066, Hyper-Threading активирован
27. Intel D850EMVR c PC1066, Hyper-Threading дезактивирован
28. ASUS P4T533-C с PC1066, Hyper-Threading активирован
29. ASUS P4PE (чипсет 845PE) с DDR333

Альтернативная платформа:
30. AMD Athlon XP 2800+ на ASUS A7N8X с двухканальной DDR333
31. AMD Athlon XP 2700+ на ASUS A7N8X с двухканальной DDR333

Для базовых сравнительных испытаний всех платформ применялся процессор Intel Pentium 4 2,80 ГГц, поскольку не все платы обзора поддерживали технологию Hyper-Threading. Но для некоторых платформ на самых производительных чипсетах Intel мы дополнительно использовали и процессор Intel Pentium 4 3,06 ГГц с включенной и отключенной в BIOS плат технологией Hyper-Threading. Это позволит нам оценить величину прироста быстродействия за счет повышения тактовой частоты в зависимости от используемой подсистемы памяти, а также посмотреть на действие технологии Hyper-Threading в отдельных приложениях (как известно, она может дать значительный эффект в многозадачной среде, см. www.terralab.ru/system/21320, однако и в некоторых отдельно взятых программах ее плюсы налицо). Для сравнения с альтернативной платформой мы выбрали старшие на данный момент процессоры AMD - Athlon XP 2700+ и 2800+ на ядре Thoroughbred ревизии B на системной плате ASUS A7N8X с двухканальной DDR333 (см. www.terralab.ru/system/20800).

В остальном конфигурации платформ были идентичны: видеоускоритель ASUS V8460 Ultra (шина AGP 4X), жесткий диск IBM Deskstar 120GXP объемом 80 Гбайт (любезно предоставлен интернет-магазином www.arkanoid.ru) и системная память суммарным объемом 512 Мбайт (за качественную память Kingston ValueRAM PC3200, см. www.terralab.ru/system/21352, мы благодарим компанию «AK-Цент Микросистемс» www.ak-cent.ru). В качестве памяти RDRAM использовались 16-битные модули PC1066 производства Samsung и 32-битные модули RIMM4200 того же производителя (любезно предоставлены компанией «Никс» www.nix.ru). Память DDR в наших тестах работала по таймингу 2-2-2 (где это было возможно), для RDRAM активировался режим «Performance mode» в BIOS Setup плат ASUS.

Основной пакет наших тестов включает следующие приложения и тестовые пакеты:

1. BAPCo SYSmark 2002 (www.bapco.com) - тесты Internet Content Creation и Office Productivity для измерения скорости работы систем при выполнении задач соответствующего профиля.
2. PC Magazine Business Winstone 2002 v.1.0.1 (www.etestinglabs.com) - комплексный тест для оценки продуктивности ПК при работе в распространенных офисных приложениях.
3. PC Magazine Multimedia Content Creation Winstone 2003 v.1.0 (www.etestinglabs.com) - комплексный тест для оценки продуктивности ПК при обработке мультимедиа (видео, аудио, графика).
4. MadOnion PCMark 2002 Pro (www.madonion.com) - комплексная оценка производительности ПК, включая тесты процессора и памяти.
5. PassMark Performance Test v4.0 (www.passmark.com) - комплексная оценка производительности ПК, включая тесты процессора, памяти, графики, диска и пр.
6. MadOnion Video 2000 (www.madonion.com) - комплексный тест для оценки быстродействия платформ при работе с двумерной графикой (в частности, ресемплинг) и видео.
7. SiSoft Sandra 2003 Professional - измерение полосы пропускания памяти и математических способностей процессора при несложных вычислениях.
8. ZiffDavis CPUmark 99 (www.etestinglabs.com) - экспресс-оценка быстродействия системы процессор-память.
9. Cachemem 2.65MMX - измерение скорости чтения/записи и латентности при работе с памятью.
10. AIDA32 v3.20 - подробная информация о системе и тесты скорости чтения/записи памяти.
11. Science Mark V2.0 beta (www.sciencemark.org) - скорость ряда современных научных и других математических расчетов и измерение полосы пропускания и латентности при работе с памятью.
12. FlasK 0.78 с кодеком DivX версии 5.02 Pro - кодирование DVD-потока в формат MPEG 4 с одновременным кодированием звуковой дорожки в формат MP3 (кодек от Fraunhofer).
13. Перекодирование потока MPEG2 в формат MPEG4 кодеком DivX версии 5.02 Pro в программе Virtual Dub 1.4.13 с одновременным кодированием звуковой дорожки в формат MP3.
14. Перекодирование несжатого видео и потока MPEG2 в формат WME программой Windows Media Encoder 9 с различным качеством и одновременным кодированием звуковой дорожки.
15. Перекодирование массива из 1024 фотографий общим объемом 650,0 Мбайт в формат JPEG программой ACDsee 5.0.
16. WinRAR 3.00 - популярный архиватор, очень чувствительный к скорости работы системной памяти и других компонент системы (использовалась максимальная компрессия и размер словаря 4 Мбайт).

Далее следуют тесты трехмерной графики:

17. MadOnion 3DMark 2001 Second Edition (build 330) (www.madonion.com) - мировой стандарт для оценки быстродействия платформ в игровых приложениях DirectX 8.
18. Популярнейшая игра Unreal Tournament 2003 (Demo Benchmark версии 1.080) под DirectX 8.
19. Comanche 4 Demo Benchmark - еще один популярный игровой бенчмарк для DirectX 8.
20. Codecreatures Benchmark Pro - свежий DirectX 8.1-бенчмарк на собственном движке (развернутый аналог фрагмента Nature из 3DMark 2001SE), для тестов платформ использовалось разрешение 1024х768 в труколоре.
21. AMD Ninja Bench 2 (известный ранее N-bench новой версии) - трехмерный DirectX-тест от самой AMD, оптимизированный для набора процессорных инструкций 3Dnow!
22. DOOM III alpha 0.02 - неофициальная предварительная версия грядущей игры под OpenGL.
23. Quake III Arena версии 1.17, демо Quaver с большими текстурами - традиционный, но староватый OpenGL-бенчмарк процессоров и памяти.
24. Return To Castle Wolfenstein (RTCW) (стандартный demo checkpoint) - более новая игра на том же движке, что и Quake III.
25. DroneZ Benchmark - достаточно «тяжелый» игровой тест под OpenGL.
26. Vulpine GLMark 1.1p - насыщенный и чувствительный игровой тест под OpenGL.
27. Serious Sam: Second Encounter Demo - еще одна популярная 3D-игра под OpenGL (использовались стандартные демо-ролики).
28. SPEC viewperf v7.0 (www.spec.org) - обновленный тест профессиональных трехмерных расчетов в различных пакетах моделирования под OpenGL.

Все тесты проводились под управлением операционной системы Microsoft Windows XP Professional Service Pack 1. На чистый системный раздел (8 Гбайт) диска для каждой платформы устанавливалась свежая копия операционной системы. Для тестов SYSmark использовалась только свежая и «голая» операционная система. Для чипсетов Intel использовались Intel Chipset Software Installation Utility 4.10.1012 и Intel Applications Accelerator 2.2.2, для чипсетов SiS устанавливался драйвер AGP версии 1.13 (и SiS IDE-драйвер из состава самой операционной системы), а для микросхем Nvidia - официальные (WHQL) драйверы Detonator 40.72 (поскольку здесь речь пойдет лишь о сравнении чипсетов между собой, применение видеодрайвера не самой свежей версии не носит принципиального характера, гораздо важнее совместимость накопленных результатов) и набор драйверов версии 2.0 (WHQL) для чипсета nForce2. Между блоками тестов компьютер перезагружался. Тесты повторялись по несколько раз и усреднялись. Результаты тестов представлены на диаграммах.

На первой диаграмме показана тактовая частота процессоров для каждой из использованных нами плат - как видим, ее разброс достаточно велик (почти 1,5%), причем это отклонение имеет такую же величину и для частот шин процессора и памяти, что, несомненно, должно повлиять на результаты тестов. В частности, некоторые производители иногда повышают ее относительно стандартной, чтобы придать своим изделиям дополнительное преимущество перед конкурентами (на стабильности небольшое повышение не сказывается). Постараемся учесть это при анализе результатов. Наиболее точно частота (шины FSB, ядра CPU и памяти) соблюдается у DDR-плат Intel и некоторых плат ASUS на чипсетах SiS, хотя плата Intel для RDRAM немного недобирает частоты, а на платах ASUS на SiS при использовании тактовой частоты шины памяти 167 МГц частота FSB немного падает по сравнению со случаями использования памяти DDR266 или DDR400. Платы ASUS P4PE и P4G8X заметно превысили стандартную частоту, тогда как ASUS P4T533(-C) почти придерживаются стандартных значений.

Прежде, чем перейти к тестам в реальных задачах, посмотрим на быстродействие при работе чипсетов с памятью (первый блок диаграмм). Это позволит нам быстро сориентироваться в чипсетах и выявить их преимущества при работе с разными типами памяти.

По пиковой полосе пропускания памяти в программе SiSoftware Sandra 2003 последний чипсет Intel E7205 с двухканальной памятью DDR266 догнал, но все же не смог обогнать многочисленные системы на i850E с двухканальной памятью RDRAM PC1066. Эти два чипсета составляют уверенную группу лидеров, на много опережая остальных преследователей. Хотя одноканальная DDR400 на чипсете SiS648 (даже при тайминге устойчивой работы 2-3-2-7; здесь RAS2CAS=3) в состоянии обойти RDRAM PC800 (в турбо-режиме) и DDR355 на чипсетах Intel. Память DDR333 на всех чипсетах имеет примерно одинаковую пропускную способность и такие платформы образуют следующую тесную группу в тесте SiSoftware Sandra 2003 Memory Bandwidth, причем на SiS648 (по 2-2-2-5) она порой ничуть не медленнее, чем на чипсетах Intel, а двухканальная DDR333 на чипсете nVidia nForce2 для последних AMD Athlon XP показывает такую же полосу пропускания, что и одноканальная на Intel Pentium 4 из-за ограничений системной шины процессоров AMD. Замыкает эту диаграмму тесная группа чипсетов с памятью DDR266, причем тут одноканальное использование памяти на чипсете Granite Bay имеет ряд преимуществ перед остальными из-за жесткой синхронности чипсета при работе с FSB и RAM. «Альтернативный» чипсет VIA P4X400 работал с DDR333 медленнее всех остальных, хотя с DDR266 он не самый последний.

Немного иная картина полосы пропускания памяти для чипсетов является нам в тесте памяти из пакета Science Mark 2.0. Тут уже Intel E7205 в двухканальной DDR266 уверенно отрывается от всех остальных, DDR400 на SiS648 подтягивается вплотную к RDRAM PC1066, а в спину ей дышит нестандартная DDR355 на чипсете Intel 845PE. Память PC800 по-прежнему немного быстрее, чем DDR333, хотя в этом тесте ее преимущество уже не так велико. Чипсеты SiS работают с DDR333 и DDR266 чуть медленнее, чем наборы логики от Intel (при тех же таймингах), а чипсет VIA P4X400 оказался в самом хвосте.

Теперь посмотрим на скорость чтения и записи памяти в программах AIDA 3.20 и Cachemem 2.65 MMX. Для этих тестов мы привели по две диаграммы, различающиеся тем, что в одном случае данные выстроены в порядке возрастания скорости записи, а в другом - скорости чтения (для удобства анализа). Быстрее всех читает память двухканальный DDR266-чипсет Intel E7205, с отрывом опережая i850E с PC1066. Это наглядно видно как в AIDA 3.20, так и в Cachemem 2.65. Далее ситуация в этих двух тестах немного различна. В AIDA 3.20 память DDR400 на SiS648 по чтению явно уступает PC1066, но заметно обходит остальных участников сравнения, включая DDR355 на 845PE, тогда как в тесте Cachemem 2.65 чтение у DDR400 порой такое же быстрое, как у PC1066 (теоретически это не так), а DDR355 на 845PE обогнала всех, кроме Granite Bay! В тесте Cachemem скорость чтения DDR333 на чипсетах Intel почти вплотную приближается к таковой для PC1066 (и сильно опережает PC800, хотя теоретически должна проигрывать, см. таблицу 2 в первой части нашего обзора), а для двухканальной DDR333 на nForce2 вообще наблюдается необъяснимое падение, тогда как в тесте AIDA скорость чтения для разных конфигураций имеет более разумные и легко интерпретируемые значения, хорошо согласующиеся с результатами тестов полосы пропускания памяти в Science Mark 2.0 и Sandra 2003.

А вот по скорости записи в память мы можем наблюдать ряд очень интересных результатов, отличных от общей картины, виденной нами ранее. Высочайшую скорость записи демонстрирует память RDRAM PC1066 (и даже PC800) в турбо-режиме на платах ASUS (без использования этого режима, на плате Intel, скорость записи для RDRAM тоже высока, хотя и заметно ниже). С такой высокой скоростью записи могут сравниться лишь двухканальная DDR333 на чипсете nForce2 для Athlon XP и (внимание) одноканальная DDR400 на SiS648 при оптимальных настройках таймингов в BIOS Setup (на плате ASUS P4S8X с DDR400 случился конфуз и скорость записи резко упала, хотя по остальным параметрам DDR400 на этой плате работала нормально). Двухканальная DDR266 на E7205 показывает неплохую скорость записи, хотя заметно уступает в этом многим, включая некоторые конфигурации с одноканальной DDR333. По результатам теста Cachemem картина скорости записи немного другая: снова безоговорочный лидер - PC1066 в турбо-режиме, но DDR400 на SiS648 взяла серебро, опередив даже nForce2, а DDR333 на чипсетах SiS (особенно 648) пишется быстрее, чем на чипсетах от Intel и VIA.

Помимо полосы пропускания и скорости чтения/записи, важным параметром, влияющим на производительность системы в приложениях, является латентность памяти (то есть задержки при обращении к ней и количество тактов ожидания поступления большого блока данных из памяти). Латентность памяти на чипсетах измерялась нами при помощи двух тестов - Science Mark 2.0 и Cachemem 2.65. По первому из них наилучшей (наименьшей) латентностью обладают нестандартная DDR355 на i845PE и двухканальная DDR266 на синхронном E7205 - всего 83-85 наносекунд. Это даже немного быстрее, чем для двухканальной DDR333 на выдающемся чипсете nForce2 в синхронном с FSB режиме (87 нс). Последние DDR-чипсеты Intel работают с чрезвычайно малыми задержками и с более медленной памятью - DDR333 и даже DDR266. Так, одноканальная DDR266 на синхронном E7205 дышит в спину лидерам, а чипсеты 845PE/GE/E даже с DDR266 показывают латентность менее 100 нс, что очень хорошо! Порадовал невысокой латентностью не блиставший в потоковой скорости чипсет VIA P4X400. А вот чипсеты SiS продемонстрировали самую высокую латентность среди DDR-аналогов, сравнимую даже с памятью RDRAM (лишь DDR400 на плате SiS648 при оптимальных настройках смог догнать чипсеты VIA)! При таком положении большие задержки при работе SiS с DDR333 могут свести на нет многие их преимущества в полосе пропускания, скорости чтения и записи DDR333 на этих чипсетах. Традиционный минус памяти RDRAM - высокая латентность - здесь находит прямую иллюстрацию. Лишь PC1066 (RIMM4200) в турбо-режиме может хоть как-то приблизиться по задержкам к аутсайдерам среди DDR-систем, тогда как PC800, работающая на более низкой частоте, отстала безнадежно и даже турбо-режим ее не спасает.

Если же судить о латентности по тесту Cachemem 2.65, то при двух прежних лидерах (DDR355 на 845PE и двухканальной DDR266 на E7205) память PC1066 неожиданно вырывается в призеры, обходя многие системы на DDR-чипсетах! Лично у меня результаты этого теста вызывают меньше доверия хотя бы заметно более высокими (в пересчете на наносекунды) значениями задержек для памяти DDR.

Переходим к тестам в приложениях и посмотрим, как отмеченные выше особенности при работе современных чипсетов с памятью повлияют на производительность систем в реальных приложениях и комплексных тестах. Тут необходимо отметить, что из множества тестов мы специально выбрали только те, которые наиболее сильно зависят от типов чипсета и памяти, то есть наиболее наглядно позволят нам выявить преимущества той или иной платформы. Для множества других тестов и реальных приложений зависимость быстродействия платформ от чипсета или памяти куда менее выражено и разница между системами почти незаметна. Поэтому приводимые нами здесь тесты фактически дают оценку только верхней границы разницы скорости платформ, а в большинстве реальных ситуаций эта разница, как правило, меньше.

Сначала - несколько комплексных тестов. Наиболее авторитетными здесь являются многозадачные тесты имитации реальной работы пользователя - тесты BAPCo SYSmark 2002 Internet Content Creation и Office Productivity. Они измеряют скорость работы (среднее время отклика на действие) всевозможных систем при выполнении программ пакета Microsoft Office в компании с архиватором, антивирусом и пр., а также при типичных операциях при создании web-сайта (работа с графикой в Adobe Photoshop, с видео в Adobe Premiere, кодирование в WME 7, работа в программах компании Macromeida (веб-дизайн) и т. п. Специальная модель «поведения» обеспечивает получение результатов, отражающих близкую к реальности картину при повседневной работе пользователей. Измеренное время отклика преобразуется в рейтинг по обратно пропорциональному закону. Результаты тестов Internet Content Creation и Office Productivity показаны на двух диаграммах.

В офисной работе однозначно лидируют низколатентные системы с памятью DDR, причем одноканальная DDR355 на 845PE сумела даже чуточку обойти двухканальную DDR266 на E7205, которой не уступают DDR400 на SiS648 и DDR333 на 845PE. Системы на RDRAM PC1066 идут за ними следом, хотя разница между большинством платформ в этом тесте почти ничтожна (менее 3% для верхней половины систем на Pentium 4 2.80 ГГц) и совсем не будет заметна при реальной офисной работе. Да и традиционные системы с DDR266 отстают от лидеров в этом тесте мало - на 5-10%, что не является чем-то критичным.

В тесте «более профессиональной работы» SYSmark 2002 Internet Content Creation новый двухканальный DDR-чипсет Intel вырывается вперед и с ним может соперничать лишь PC1066 в турбо-режиме, хотя «одноканальные» DDR400 на SiS648 и DDR355 на 845PE почти не уступают лидерам (всего 1% проигрыша). Память DDR333 в этом тесте работает быстрее на чипсетах Intel (они тут в среднем равноценны системам с RDRAM PC800), а для DDR333 на чипсетах SiS есть небольшой проигрыш в районе 1-2%, причем в этом случае платформы с DDR333 на SiS работают примерно с той же скоростью, что платформы с DDR266 на чипсетах Intel. Чипсет VIA P4X400 - на последнем месте, проигрывая лидеру не так уж много - около 7%. В этом тесте работа технологии Hyper-Threading обеспечивает дополнительный прирост производительности до 5%, тогда как простой прирост частоты процессора дает 7-8%.

Альтернативный и не менее заслуженный комплексный тест для оценки деловой производительности ПК - это Business Winstone 2002. Он оценивает быстродействие при многозадачной работе с такими приложениями как Lotus Notes, Microsoft Access 2002 SP-1, Microsoft Excel 2002 SP-1, Microsoft FrontPage 2002 SP-1, Microsoft PowerPoint 2002 SP-1, Microsoft Word 2002 SP-1, Microsoft Project 2000, WinZip 8.0, Norton AntiVirus 2001 и Netscape 6.2.1. Как и в офисном тесте от BAPCo, здесь в лидерах низколатентные DDR-системы на чипсетах Intel, а высоколатентные чипсеты SiS отстают, хотя их проигрыш лидеру не превышает 12%, что вряд ли можно назвать критичным для такой работы, поскольку в подобных ситуациях куда важнее бывает дешевизна, в чем у систем на чипсетах SiS с памятью DDR266 конкурентов нет. Да и прироста от Hyper-Threading в подобной работе никто особо не требует. Интересно, что в этом тесте прирост частоты процессора почти не дает прироста скорости системы в целом, и быстрая платформа приносит зачастую большие дивиденды.

Достаточно свежий комплексный тест для оценки производительности ПК при работе с мультимедиа-контентом, Multimedia Content Creation Winstone 2003 v.1.0, включает в себя многозадачную работу с такими приложениями как LightWave 3D 7.5, Macromedia Director Version 8.5.1, Macromedia Dreamweaver 4, Microsoft Windows Media Encoder Version 7.01.00.3055, Netscape 6.2.3, Adobe Photoshop 7.0, Adobe Premiere 6.0 и Sound Forge version 6.0. Снова мы видим лидерство Granite Bay, хотя «турбо»-PC1066 и низколатентная DDR355 на 845PE следуют вплотную за лидером, уступая ему около 1%. Радует и DDR400 на SiS648 (в призерах). Ниже в тесной группе идут системы с DDR333 на чипсетах Intel 845PE/GE и SiS648 (отставание от лидера менее 4%) и RDRAM, причем «турбо»-PC800 оказывается в этом случае быстрее, чем PC1066 в обычном режиме. Дешевые системы с DDR266 на чипсетах Intel и SiS проигрывают лидеру в этом тесте всего 7%, что в некоторых случаях с трудом может служить оправданием двукратной разнице в цене J. И снова мы видим, что преимущества от использования более высокочастотного процессора в этом тесте меньше, чем от использования более грамотной и высокоскоростной платформы.

Кроме этого, мы привлекли еще несколько комплексных синтетических тестов общей производительности ПК. Каждый из них достаточно хорошо известен (например, PCMark 2002 и Video 2000 разработаны практически той же «конторой», что и SYSmark) и популярен среди разных категорий пользователей, хотя я бы предостерег читателя делать далеко идущие выводы на основе результатов каждого из этих тестов в отдельности (все же они не настолько объективны и идеальны как измерительный инструмент). Заодно, сопоставив их результаты с общей ситуацией по многочисленным разносторонним тестам нашего обзора, внимательный читатель сможет сделать выводы о мере объективности каждого их этих синтетических тестов.

В тесте PCMark 2002 снова налицо преимущество DDR333 на чипсете Intel 845PE (опережает даже RDRAM), а DDR266 на стареньком 845E не хуже многих. В тесте Video2000 (для оценки быстродействия платформ при работе с двумерной графикой и видео) великолепны чипсеты SiS, особенно с DDR400, а большинство систем на DDR333 не уступает лучшим платформам с RDRAM, да и DDR266 не так уж плоха (ее низкая латентность компенсирует недостаток пропускной способности).

Относительно свежий тест PassMark Performance Test v4.0 оценивает быстродействие многих компонент ПК по отдельности (см., например, эти подробные результаты теста img.terralab.ru/pubimages/47351.gif), и затем на их основе вычисляет суммарный рейтинг системы. В этом тесте лидирует чипсет SiS648 (причем с DDR400 и DDR333), обгоняя даже Granite Bay и RDRAM, да и другие чипсеты SiS с DDR333 выглядят очень достойно, обходя DDR333 на платах Intel! Системы же с PC800 не лучше многочисленных дешевых платформ с DDR266, хотя в целом по этому тесту разница между платформами на одном процессоре не превышает 5%. Налицо также небольшое (2-3%) ухудшение при использовании Hyper-Threading.

Наконец, простенький комплексный тест CPUmark99 для оценки вычислительных способностей платформ, несмотря на свой возраст (уже 4 года скоро), неплохо чувствует разницу между современными платформами и типами памяти. Тут, как и ранее в некоторых более сложных тестах, лидируют платформы на двухканальном E7205 и на 845PE с нестандартной, но низколатентной DDR355. Далее вровень следуют системы с «турбо»-PC1066 и DDR333 на плате ASUS P4PE, а также DDR400 на SiS648, а Intel-системы на DDR266 и PC800 примерно равноценны SiS-системам на DDR333. Чипсет VIA идет последним, уступая лидеру около 6%. Этот тест неплохо отражает общую усредненную по многим нашим тестам картину сравнительной производительности платформ на одном процессоре.

От комплексных тестов перейдем к некоторым интересным частным тестам и приложениям. Сперва посмотрим на несколько специализированных математических тестов (современные научные расчеты) из пакета Science Mark 2.0. Он содержит несколько независимых научных расчетов, часть из которых достаточно чувствительны к скорости платформы (чипсета и памяти). Их мы и показали на четырех диаграммах ниже. Оказалось, что этот тест, по всей видимости, не очень хорошо адаптирован для работы на процессорах Intel Pentium 4: их проигрыш процессорам AMD везде бросается в глаза, но для выявления разницы между платформами для одного процессора эти тесты вполне пригодны.

В криптографическом тесте Chiper Bench AES мы видим явное преимущество систем с памятью RDRAM PC1066 и неожиданно хорошее выступление чипсета VIA P4X400, хотя традиционно сильны и DDR400/333 на SiS648 и DDR355/333 на 845PE. Неожиданно провалился до уровня дешевых DDR266-систем двухканальный Granite Bay, а общий разброс скорости систем на Pentium 4 2.80 доходит до 10%. Вместе с тем, мы наблюдаем прирост от использования Hyper-Threading до 9% (с памятью RDRAM).

При расчетах орбиталей атомов серебра (Ag) и аргона (Ar) картина несколько различна. Для аргона лучше всего оказались DDR355 на 845PE и PC1066 на 850E, тогда как двухканальный E7205 с DDR266 занял лишь 4-ю строчку вместе с DDR333 на 845PE. С другой стороны, при использовании технологии Hyper-Threading мы видим существенный прирост скорости расчетов (до 20%) именно для двухканальной DDR-системы, которая и вырывается в лидеры с последним процессором Intel. На RDRAM-системах прирост от HT оказался заметно меньше (всего 2%), что может быть связано именно с высокой латентностью системы для второго потока данных для процессора. В целом, разница между платформами для Pentium4 2.80 ГГц в этом тесте доходит до 10%.

При расчете атома серебра лидеры совсем другие: это относительно высоколатентные системы SiS648 с DDR400 и 850E с PC1066 (и лишь следом идут DDR355/845PE и DDR266/E7205). Видимо, в данном случае быстрая потоковая передача крупных блоков данных из памяти (атом серебра заметно больше атома аргона) и высокая скорость записи в память важнее, чем низкая латентность. Более того, тут DDR333 в среднем быстрее на чипсетах SiS, чем на Intel (вспомним про скорость записи), а общий разброс скорости платформ меньше (6,5%). Прирост производительности от использования Hyper-Threading доходит до 15% (именно на Granite Bay, видимо, второй поток требует низкой латентности памяти).

Еще один тест из пакета Science Mark 2.0 производит расчеты популярными в настоящее время методами молекулярной динамики. Результаты этого теста несколько необычны: Granite Bay сильно отстал от основной группы платформ, среди платформ наблюдается большой и трудно объяснимый разнобой (большая погрешность теста), хотя в остальном все не так уж плохо, поскольку в лидерах DDR355/333 на плате ASUS P4PE и DDR400/333 на плате SiS648. Прирост от использования Hyper-Threading в это тесте равен 9,2% для двухканальной DDR266 и чуть больше (11,3%) - для PC1066.

Оценить математические способности различных платформ нам поможет также архивирование в WinRAR версии 3.00, учитывающей также особенности работы современных процессоров Intel и AMD. К тому же тест архивирования в WinRAR с максимальной компрессией и размером словаря традиционно является одним из самых чувствительных в производительности подсистемы памяти, в частности - к ее латентности. И действительно, разброс скорости между нашими платформами с одним процессором здесь достигает 44% (!!!), причем в лидерах неожиданно оказались достаточно высоколатентные системы на RDRAM PC1066, а низколатентные P4G8X и P4PE с DDR355 лишь на 4-5 местах. DDR-чипсеты Intel здесь выступили однозначно лучше чипсетов SiS и VIA, причем DDR400 на SiS648 необъяснимым образом сильно затормозила работу. В этом тесте мы снова видим, что иногда скорость платформы (чипсета и памяти) важнее, чем частота процессора: RDRAM-системы на Pentium 4 2.80 и 3.06 ГГц почти одинаковую скорость работы.

Теперь взглянем на поведение систем в другом прикладном математическом тесте - чтения с последующим JPEG-перекодированием 1024 фотографий общим объемом 650,0 Мбайт (один CD) в очень популярной программе ACDsee свежей версии 5.0. Фотографии (в произвольном JPEG) имели размер около 2000х1500, находились на «быстром» разделе винчестера, списком читались и перекодировались в JPEG со сжатием 65% (впрочем, от степени сжатия результат почти не зависел) без последующей записи на диск (то есть скорость винчестера практически не влияла на результат этого теста). Разброс скорости между чипсетами на одном процессоре здесь уже не так велик (10%), процессоры Intel работают заметно быстрее процессоров AMD, а лидером среди платформ для Pentium 4 является «турбо»-RDRAM PC1066 вперемешку c резвой DDR400 на SiS648 и DDR355 на 845PE, тогда как двухканальный Granite Bay - лишь пятый, уступая лидеру почти 3%. В этом тесте снова достигнут паритет между чипсетами Intel и SiS при работе как с DDR333, так и c DDR266. Выигрыша от Hyper-Threading не наблюдается.

Поскольку в последнее время задачи работы с видео на ПК встречаются все чаще, мы включили в наше рассмотрение целый блок из шести тестов кодирования видео/аудио в популярные форматы популярными современными программами (аудио везде присутствует как звуковая дорожка видеоролика и кодировалась нами одновременно с видео в формат MPEG1 layer 3 для видеоформата MPEG4 или в формат WME; тесты отдельного кодирования аудио на данный момент уже можно считать неактуальными). Первый тест кодирует видео из формата DVD в формат MPEG4 кодеком DivX 5.02 Pro при помощи программы FlasK 0.78. Этот тест также традиционно отлично чувствует разницу в скорости платформ и памяти. Здесь лидеры оказались традиционными с некоторой перестановкой: сначала «турбо»-PC1066, затем низколатентные DDR355 на 845PE, двухканальная DDR266/E7205 и одноканальная DDR400 на SiS648. DDR333 на чипсете SiS648 работает порой быстрее, чем на чипсетах Intel, включая и память PC800. Зато чипсет VIA отстает то лидера на 16%. Судя по всему, в этом тесте немаловажной оказывается потоковая скорость записи в память. Видим мы здесь и солидный выигрыш от использования технологии Hyper-Threading: 17% на двухканальной DDR266 и до 22% с памятью RDRAM. Притом, что прирост от тактовой частоты заметно меньше - 7-8% (сама тактовая частота возросла на 9,5%).

Перекодирование (компактирование) видео из MPEG2 в MPEG4 мы производили программой Virtual Dub 1.4.13 (есть версия, оптимизированная для Pentium 4) c использованием того же кодека DivX 5.02 Pro. В этом тесте вперед вырвались двухканальная DDR266 на E7205 и одноканальная DDR400 на SiS648, хотя «турбо»-PC1066 почти не уступает им. Общая разница между платформами с одним процессором доходит до 10% (а это уже час при десятичасовом кодировании фильма), чистый выигрыш от HT на Granite Bay составил 9% при еще 7,6% прироста от частоты CPU.

Еще четыре теста кодирования видео мы провели в недавно вышедшем кодере Windows Media Encoder 9. Мы кодировали в формат WME как несжатое (файл размером 4 Гбайт), так и сжатое MPEG2 видео, причем для выходного файла выбирали два типа сжатия: DVD(1MB/s)+CD или VHS+FM (согласно стандартным предустановкам программы WME 9). При кодировании несжатого видео (AVI) первым всегда оказывалась палтформа с двухканальной DDR266 на чипсете E7205, второй - DDR355 на 845PE, третье место делили «турбо»-PC1066 и DDR400 на SiS648. Чипсеты от Intel оказывались чуточку шустрее аналогов от SiS (и тем более - VIA P4X400). Чистый выигрыш от применения технологии Hyper-Threading для платформы на Granite Bay в отдельно взятом приложении составлял 13% при DVD-качестве и аж 44% (!!!) при VHS-качестве! Очень неплохо. А разница в скорости платформ с Pentium 4 2.80 была равна всего 4-5% (некритичная величина). То есть в данном случае выгоднее использовать быстрый процессор с Hyper-Threading на медленном чипсете/памяти, чем наоборот.

При перекодировании MPEG2 в WME лидеры слегка поменялись, хотя тенденции остались прежними: среди лучших - PC1066, DDR400 на SiS648, DDR355 на P4PE и, конечно, Granite Bay. Разница скорости платформ на P4 2.80 равна 6%, чистый выигрыш от Hyper-Theading на E7205 - 15% для VHS-качества и 25% для DVD-качества. С одинаковой памятью чипсеты SiS почти так же хороши, как чипсеты Intel, а VIA - аустайдер.

Переходим к блоку тестов при работе с трехмерной графикой. Сперва - о работе под DirectX. Сверхпопулярный MadOnion 3Dmark 2001SE (его не использует только ленивый, хотя я настоятельно не рекомендую ограничиваться в своих выводах только его результатами) показывает, что RDRAM PC1066 (в турбо-режиме) безусловно лидирует, а DDR355 на P4PE может обойти двухканальную DDR266. Отлично смотрится и DDR400 на SiS648, хотя менее латентная DDR333 на чипсетах Intel чуть лучше, чем на чипсетах SiS, а PC800 по сравнению с ними теряет очки. В этом тесте неплохо выступил чипсет VIA, разброс между платформами с Pentium 4 2.80 доходит до «стандартных» уже 10%, и процессоры Intel немного пошустрее «однорейтинговых» атлонов на самых быстрых платформах. Выигрыш от HT в этом тесте минимален, и зачастую важнее более быстрая платформа, чем более высокочастотный процессор (например, самые быстрые системы с P4 2.80 в этом тесте быстрее даже, чем P4 3.06 на P4PE и DDR333).

Другой комплексный DirectX-тест - Ninja Bench 2 от самой AMD - неправильно было бы использовать для сравнения Pentium 4 и Athlon XP (в силу вполне понятных причин), однако для сравнения чипсетов и памяти внутри одного типа процессоров он вполне подходит. Ситуация напоминает тест 3Dmark 2001, хотя здесь Granite Bay обогнал всю RDRAM, DDR400 на SiS648 быстрее остальных вариантов одноканальной DDR, хотя с DDR333 чипсеты Intel работают все же чуток быстрее. Разброс производительности между системами с одним процессором - 9,5%, а выигрыш от более быстрого процессора около 8% (HT выигрыша не дает).

Два других теста представляют два собственных DirectX-движка. В тесте Comanche 4 снова уверенно лидирует RDRAM PC1066, за ними идут E7205, DDR355/845PE и DDR400/SiS648. Выигрыш от HT минимален, а разница в скорости между системами с Pentium 4 2.80 доходит до 13% (и это при едва «играбельных» 50 кадрах в секунду). Тут Pentium4 быстрее Athlon XP. На более современном и продвинутом движке теста Codecreatures Benchmark Pro от Codecult, предназначенном для игр следующего поколения (для нынешних игр производительности ускорителей пока не хватает, чтобы обсчитывать сцены на полмиллиона треугольников с приличным количеством fps в разрешении даже 1024х768), процессоры Intel явно отстают, и разница между платформами минимальна (3%), хотя лидеры все те же.

Наконец, для оценки быстродействия систем в DirectX-игре Unreal Tournament 2003 мы использовали наиболее сбалансированный и чувствительный демо-ролик Botmatch-Anubis (см. www.terralab.ru/system/21634). Ситуация с платформами для P4 в точности повторила Команч: уверенно лидирует RDRAM PC1066, за ними идут E7205, DDR355/845PE и DDR400/SiS648, а DDR-чипсеты Intel чуть выгоднее чипсетов SiS и VIA при одинаковой памяти. Выигрыш от HT призрачен (около 1%), зато разница в скорости между системами с Pentium 4 2.80 доходит до 16,5% (при весьма «играбельных» 60-90 кадрах в секунду). Самые быстрые системы с P4 2.80 в этом тесте примерно равны по скорости P4 3.06 на P4PE и DDR333.

Теперь - о работе с игровыми OpenGL-движками. В стареньком, но гиперпопулярном Quake III Arena («тяжелое» демо Quaver) мы в который раз наблюдаем безоговорочное лидерство RDRAM (и полную победу Pentium 4 над Athlon XP). Быстрая одноканальная DDR355/845PE и DDR400/SiS648 смогли опередить двухканальную DDR266. Память DDR333 на чипсетах Intel - чуть быстрее, а разница в скорости между системами с Pentium 4 2.80 доходит до 19% при гипотетических 300 кадрах в секунду. Невзирая на победу PC1066, память PC800 стремительно теряет свою привлекательность, уступая даже DDR333 на дешевых чипсетах SiS.

В более современной игре на том же движке, Return To Castle Wolfenstein, атлоны слегка «подтянулись», хотя «расклад» по чипсетам и памяти почти такой же. По прежнему, нет выигрыша от Hyper-Threading, и разница между системами на P4 2.80 равна 14% при вполне реальных fps.

В тесте Serious Sam: Second Encounter ничего нового по сравнению с двумя предыдущими OpenGL-игрушками нет: снова на коне RDRAM PC1066 и DDR400/SiS648, отлично смотрится DDR355 на 845PE, почти догоняя двухканальную DDR266, память DDR333 на чипсете VIA обошла часть систем на SiS, почти догнала PC800, но не дотягивает до чипсетов Intel. Стандартен и 10-процентный разброс систем.

Очень популярный в прошлом тест DroneZ Benchmark держит в безусловных фаворитах процессоры Intel и память RDRAM, хотя DDR400 на SiS648 снова одержала вверх над двухканальной DDR266 и DDR355. В этом тесте старушка PC800 еще пытается харахориться, но хватит ее не на долго. Неплох здесь и чипсет VIA. Разница между системами с P4 2.80 доходит до 28%, но практической ценности эта цифра вряд ли имеет - уж слишком велики fps.

Любимый мной за отличную платформозависимость и повторяемость тест Vulpine GLMark 1.1 лишний раз подтверждает, что игровой OpenGL очень неравнодушен к памяти RDRAM PC1066, предпочитая ее даже дешевой двухканальной DDR266. Здесь DDR400 на SiS равноценна DDR355 на Intel, а PC800 - памяти DDR333 на чипсетах Intel, и быстрее DDR333 на SiS и тем более VIA. При разрешении 640х480 разница скорости платформ составляет 23%, и старшие (RDRAM) системы на P4 2.80 быстрее одноканальных DDR-систем на более высокочастотном процессоре.

Завершает наш блок игровых OpenGL-тестов неофициальная демо-версия игры DOOM III alpha 0.02 (см. www.terralab.ru/system/21634). Снова мы можем убедиться, что порой более быстрый чипсет и память важнее, чем более быстрый процессор, память PC1066 пока непревзойдённа для игр, хотя двухканальная DDR266 и одноканальные DDR400/355 вплотную к ней подбираются. Разница скорости платформ в этом тесте при вполне реальных и играбельных условиях составляет 12% (это уже не мало), что находится в русле общих тенденций нашего сравнения трех десятков платформ на различных чипсетах и памяти. Вместе с тем, даже на дешевых и устаревших чипсетах с памятью DDR266 c с хорошим ускорителем можно добиваться вполне приемлемой производительности, то есть непременно гнаться за самой дорогой и навороченной платформой в данном случае нет острой необходимости.

И напоследок посмотрим на результаты профессиональных OpenGL-тестов пакета SPEC viewperf v7.0. В принципе, для десятка платформ мы их уже рассматривали в обзоре ситем для рабочих станций начального уронвня на www.terralab.ru/system/23058, однако здесь мы преведем результаты для всех 30 платформ, поскольку тесты этого пакета едва ли не лучше всех чувствуют разницу в производительности между однотипными системами с разной памятью (или на разных чипсетах с одинаковой памятью).

В старенькой 3dsmax высшие Атлоны немного обогнали высших Pentium 4, а среди платформ для Pentium 4 безусловным лидером является Granite Bay, за ним идет одноканальная DDR355 на P4PE и DDR400 на SiS648, обгоняя высоколатентные системы с RDRAM PC1066. Этот тест - явно не конек RDRAM, поскольку даже типовые системы с DDR333 нередко обходят платормы с памятью Rambus. Разница скорости между платформами на одном процессоре в этом подтесте доходит почти до 17%.

А тест DRV-08, пожалуй, - самый выскокчувствительный, поскольку разница скорости платформ на Pentium 4 2.80 в нем доходит аж до 65%!!! Хотя это, скорее, исключение, чем правило. Здесь безоговорочно лучшие - системы на RDRAM PC1066, хотя двухканальная DDR266 к ним вплотную приближается. Одноканальные же DDR400/355/333 (уже не говоря о DDR266) в этом подтесте явно уступают RDRAM.

Тест DX-07 (приложение Data Explorer от IBM) традиционно очень любит процессоры AMD Athlon XP, но в данном случае нам важна разница скорости между платформами на Pentium 4 2.80 ГГц, которая здесь составляет "стандартные" 11%, причем расстановка лидеров повторяет многие наши тесты выше: чуть впереди DDR266 на E7205, следом вплотную - PC1066 в турбо-режиме и низколатентная DDR355 на 845PE, хотя DDR400 на SiS648 почти догнала лидеров. А DDR333 на чипсетах SiS и Intel работает почти одинаково быстро. Чипсет VIA P4X400 отстал.

В подтесте Light-05 сильны чипсеты SiS: так, SiS648 с DDR400 даже лидирует, обгоняя PC1066 и двухканальную DDR, а DDR333 на SiS64x работает заметно быстрее, чем на чипсетах Intel. Объяснение этому может скрываться в несколько лучшей скорости записи в эту память, судя по тесту AIDA. Разница скорости платформ на одном процессоре здесь доходит до 22%.

Подтест PROE-01 на базе пакета проектирования Pro/ENGINEER 2000 снова демонстрирует нам громадную разницу в быстродействии платформ на Pentium 4 2.80 - почти 40%. При этом старшие системы на этом процессоре (с турбо-PC1066 и двухканальной DDR) оказываются быстрее неплохих систем на более высокочастотном процессоре 3.06 ГГц с одноканальной памятью DDR333 или PC1066 с обычном режиме! Чипсеты SiS здесь немного хуже DDR-чипсетов Intel, хотя SiS648 с DDR400 все же обошел все остальные одноканальные DDR-системы.

В последнем из шести подтестов, UGS-01, мы видим практическую независимость сскорости от платформы, поскольку скорость лимитируется быстродействием видеоускорителя.

В заключение кратко отметим основные выводы, которые следуют из нашего анализа тестов производительности систем.

1. Безусловным лидером среди настольных ПК на процессорах Intel на данный момент является чипсет E7205, который при двухканальном использовании памяти DDR266 в большинстве тестов обходит даже старичка 850E с памятью PC1066 (RIMM4200), хотя последняя конфигурация по прежнему является одной из самых высокопроизводительных платформ. Интересно, что системы на PC1066, работающей в турбо-режиме, до сих пор в ряде приложений побеждают (и даже с отрывом) остальных конкурентов. Корпорация Intel будет поддерживать платформу на RDRAM до тех пор, пока она будет показывать самые высокие результаты, хотя с грядущим приходом нового покодения двухканальных DDR-чипсетов Intel (Canterwood/Springdale) шансы RDRAM на выживание в настольных системах станут призрачными.

2. Выход чипсетов Intel с поддержкой памяти DDR333 (845PE/GE) позволил создавать одноканальные DDR-системы, даже немного превосходящие по скорости традиционную PC800 на i850 (в силу чего привлекательность PC800 стремительно падает), а возможность использования нестандартной DDR355 на некоторых платах с чипсетом 845PE/GE поднимает их почти на уровень самых быстрых двухканальных систем на Granite Bay и 850E (поглядим, что нам даст грядущий приход чипсетов Intel для DDR400)! Заметим, что одноканальное использование памяти на чипсете E7205 нецелесообразно, поскольку при этом он заметно теряет в производительности и опускается почти до уровня других чипсетов Intel с памятью DDR266 (845E/PE/GE). Альтернативный чипсет от VIA даже с памятью DDR333 пока не радует скоростью (уступает аналогам от Intel и SiS) и годится лишь для самых дешевых систем.

3. Отдельной похвалы заслуживают одноканальные чипсеты SiS. Так, SiS648 и его предшественники SiS645DX/651 при работе с памятью DDR333 (официальный режим) позволяют получать почти такую же производительность, как с памятью DDR333 или PC800 на чипсетах Intel, но по заметно меньшей цене. А неофициальное использование DDR400 на SiS648 (при условии качественных модулей памяти и платы) возносит такую платформу почти до уровня самых высокоскоростных на PC1066 или двухканальной DDR266! Правда, хорошие модули PC3200 пока недешевы. Кроме того, новейший чипсет SiS655 для двухканальной DDR333/400 наверняка способен поспорить за абсолютное лидерство с самыми быстрыми чипсетами Intel, но об этом мы поговорим уже в следующий раз.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.