Платы для Athlon 64 и Opteron. Часть 8. ASUS SK8N на чипсете Nvidia nForce3 Pro 150 и конфигурирование регистровой памяти
АрхивПлатформаКак конфигурировать регистровую память для систем на базе процессоров AMD Opteron и AMD Athlon 64 FX-5x: влияние настроек BIOS и вариантов установки модулей в плату.
Продолжаем знакомство с платами для процессоров AMD Athlon 64. Основные чипсеты и характерные платы на них для Socket 754 мы рассмотрели ранее:
Часть 1. Платы для Athlon 64. Часть 1. ECS KV1 Deluxe (Photon Series) и Soltek SL-K8AV2-RL — хорошие недорогие решения
Часть 2. Платы для Athlon 64. Часть 2. ASUS K8V Deluxe (WireLess Edition) и Gigabyte K8VNXP — платы высшего ранга
Часть 3. Платы для Athlon 64. Часть 3. Плата MSI K8T Neo на чипсете VIA K8T800: динамический оверклокинг Athlon 64
Часть 4. Платы для Athlon 64. Часть 4. Секрет режима Turbo платы ASUS K8V Deluxe
Часть 5. Платы для Athlon 64. Часть 5. Чипсет SiS755 и плата ECS 755-A — low-end-вариант платформы AMD64
Часть 6. Платы для Athlon 64. Часть 6. Чипсет NVIDIA nForce3 150 и плата Chaintech ZNF3-150
Часть 7. Платы для Athlon 64. Часть 7. Как грамотно устанавливать и настраивать системную память.
Причем в последней статье (Часть 7) мы самым подробным образом остановились на различных вопросах использования памяти в этих системах.
Теперь пришла очередь поговорить о «тяжелой артиллерии» в сегменте ПК и рабочих станций начального уровня — платах для процессоров AMD Athlon 64 FX-5x и AMD Opteron (пока однопроцессорных), то есть с разъемом Socket 940.
Безусловно, для пользователя, желающего собрать себе систему подешевле, платы для Socket 940 представляют лишь чисто теоретический интерес — такой пользователь не станет покупать себе серверный процессор AMD Opteron, а элитный AMD Athlon 64 FX-51/53 стоит порядка семи сотен долларов и дешевых его вариантов не будет. Более того, эти процессоры требуют себе более дорогую «профессиональную» регистровую память, которая, к тому же, работает немного медленнее, чем небуферизованная DDR400. Единственным (пока) утешением является то, что эти системы, в отличие от более дешевых с Socket 754, подерживают два канала памяти DDR400, что, в идеале, должно заметно повышать быстродействие систем.
Однако в недалеком будущем AMD выпустит новые процессоры для нового Socket 939, также поддерживающие два канала DDR400, но уже более дешевой и быстрой — нерегистровой. Впрочем, первое время платы для Socket 939 и двухканальной памяти будут стоить немалых денег, тогда как платы с Socket 940 уже достаточно подешевели. Более того, мелькали сообщения, что во втором квартале этого года AMD поставит на рынок всего лишь 10 тыс. процессоров для Socket 939. Так что Socket 940 (и платы для него) будут жить еще достаточно долго — как минимум, до конца этого года для систем с Athlon 64 FX и значительно дольше — для профессиональных однопроцессорных систем с AMD Opteron. А регистровая память, уступающая примерно несколько процентов быстродействия обычной, способствует зато более стабильной работе системы и позволяет задействовать коррекцию ошибок (ECC).
Экран начальной загрузки платы ASUS SK8N |
Исторически первыми появились платы для Socket 940 на чипсете NVIDIA nForce3 (Pro) 150. Подробно об этом чипсете мы уже писали ранее, поэтому здесь просто отмечу, что это пока единственный из присутствующих уже на рынке однокристальных чипсетов для AMD Athlon 64. Здесь «северный» мост (точнее, то, что от него осталось — контроллер шины AGP 8Х и системной шины HyperTransport) и южный (вся периферия) соединены вместе.
Чипсет Nvidia nForce3 Pro 150 — «два в одном». |
Это, в частности, должно экономить место на плате и снижать ее цену, однако до сих пор большинство плат на nForce3 150 стоят ничуть не меньше своих двухчиповых аналогов на чипсетах VIA и SiS, да и не являются более компактными. Так что плюсы от «одночиповости» пока чисто «бумажные».
Чипсет nForce3 150 уже достаточно старый и обладает рядом недостатков (в частности, более медленной шиной HyperTransport и отсутствием портов SerialATA), однако давно объявленный nForce3 250, где многие из этих неодстатков устранены (ускоренный HyperTransport, поддержка двух Serial ATA портов плюс еще двух через внешние PHY-чипы, два канала UATA/133 с функциями RAID 0/1/0+1, опционально гигабитный сетевой контроллер), как-то не спешит на рынок — обещанный зимой, он до сих пор где-то застрял и платы на нем пока демонстрируются лишь на выставках и в пресс-релизах.
Начнем рассмотрение плат с разъемом Socket 940 с одного из наиболее популярных изделий — ASUS SK8N. Помимо описания самой платы, мы в этом обзоре продолжим линию, начатую в предыдущей части, и проанализируем различные варианты использования регистровой двухканальной памяти в системах с Athlon 64 (тогда мы рассмотрели только нерегистровую одноканальную). И нас поджидает здесь несколько интересных сюрпризов, исходя из которых мы можем сформулировать несколько рекомендаций по конфигурированию и настройке памяти в таких системах. Ну а с другими платами для Socket 940 мы сравним ASUS SK8N в следующей части нашего обзора плат для Athlon 64.
ASUS SK8N
Плата ASUS SK8N на чипсете Nvidia nForce3 Pro 150. |
Полноразмерная плата ASUS SK8N отличается необычной, но удобной компоновкой (например, оба разъема питания ATX 2.03 и разъемы IDE расположены в очень правильных местах), слотами памяти наверху платы (в вертикальных корпусах это несколько затрудняет воздуховод вверху корпуса и естественный отвод тепла от самих модулей),
Плата ASUS SK8N — чипсет снизу, память сверху. |
шестислойной, но достаточно компактной по площади разводкой двухканальной шины памяти, причем по спецификациям поддерживается до 8 Гбайт системной памяти (хотя 2-гигабайтных регистровых модулей DDR400 придется еще обождать),
Плата ASUS SK8N — разводка двух каналов |
мощными импульсными стабилизаторами питания процессора и памяти, причем на элементах старались не экономить,
Плата ASUS SK8N — мощные импульсные стабилизаторы |
Плата ASUS SK8N — основные активные элементы |
достаточно свободным размещением элементов на плате (чему способствует интегрированный чипсет всего из одного кристалла, прикрытый небольшим радиатором; перед слотами PCI пустого места - хоть куда!), достаточно насыщенной задней панелью (разведен, но не установлен VGA-разъем),
Плата ASUS SK8N — задняя панель. |
наличием второго COM-порта в виде pin-разъема,
Плата ASUS SK8N — аудиокодек и сетевой PHY, |
и развитыми периферийными возможностями — к чипсетным UltraATA/133, шести портам USB 2.0, 100-мегабитному контроллеру LAN (подчеркнем — здесь, в отличие от nForce2, лишь один сетевой контроллер) и высокопроизводительному звуковому процессору добавлены контроллер Serial ATA RAID на чипе Promise PDC20378 и двухпортовый контроллер IEEE 1394a от Texas Instruments. Для «озвучивания» используется не самый последний шестиканальный аудиокодек ALC650 с pin-разъемом для S/PDIF-выхода.
Плата ASUS SK8N, дополнительный контроллер от Promise — SerialATA RAID . |
Из мелких недостатков отметим неудобно расположенный разъем FDD, горизонтально вверху расположенные слоты памяти (см. выше) и отсутствие (на момент тестирования) в BIOS платы фирменного асусовского автоматического рестарта со сброшенными параметрами частоты/таймингов памяти, если пользователь переусердствовал при разгоне и настройках работы памяти. Кстати, на плате всего три коннектора для подключения вентиляторов, что для платы профессионального или «энтузиастского» уровня все же маловато.
В общем, плата ASUS SK8N до сих пор является весьма неплохой и относительно недорогой платформой для высокопроизводительных Athlon 64 FX и Opteron. Читать дальше >>>
BIOS Setup платы ASUS SK8N, в общем, традиционен для плат этой компании.
Из отличий можно отметить подробное меню для настройки конфигурации ECC,
подробное меню мониторинга состояния платы
с обширными настройками функции интеллектуального управления скоростью вращения двух вентиляторов (точнее - трех, два из которых управляются синхронно) в зависимости от температуры (см. фото выше - всё ясно из названий соответствующих пунктов меню).
Частоту памяти при стандартной тактовой частоте FSB (200 МГц) можно менять от DDR200 до DDR400.
Из других настроек памяти присутствуют изменение напряжение питания памяти (повышать можно только до 2,7 вольт),
и лишь 4 базовых тайминга памяти (без излишков). Удобно, что на информационном экране в пункте меню "NorthBrodge Chipset Configuration" показываются текущие тайминги работы памяти (см. на одно фото выше).
Разумеется, есть обычные возможности оверклокинга (повышение FSB с шагом 1 МГц), причем по дефолту плата работает строго на частоте 200,0 МГц.
Тестирование конфигураций регистровой памяти
Испытания различных конфигураций и настроек памяти на плате ASUS SK8N проводились под MS Windows XP Professional SP1 при помощи процессора AMD Athlon 64 FX-51 с частотой 2,2 ГГц (кристалл ревизии C0).
Среди других компонентов тестовой системы — видеоускоритель GeForce FX 5900 Ultra (референс NVIDIA) с драйверами версии 52.16 и винчестер Samsung SP1614N (буфер 8 Мбайт и 80-гигабайтные пластины). В качестве базовой системной памяти для испытаний производительности различных конфигураций использовалась 512-мегабайтная пара регистровых модулей PC3200 компании OCZ (за них мы благодарим компанию «Патриарх»). Поскольку контроллер двухканальной памяти встроен в кристалл процессора, подмеченные в данном тестировании закономерности справедливы и для других плат с Socket 940 на этом и аналогичных чипсетах.
Результаты наиболее наглядных тестов скорости памяти и общей производительности платформ в различных приложениях приведены в соответствующих таблицах, в последней строчке которых дан суммарный рейтинг быстродействия плат, вычисленный как геометрическое среднее от результатов всех проведенных нами бенчмарков (кроме прямых тестов памяти) и приведенный к 100%. Этот рейтинг также проиллюстрирован на соответствующих диаграммах (желтым цветом даны базовые конфигурации, красным — отличающиеся тем или иным параметром настройки/конфигурирования памяти).
Попутно отметим, что некоторые вопросы, связанные с настройкой таймингов памяти DDR400 и ниже для других платформ, мы уже не раз освещали, поэтому интересующимся рекомендуем обратиться к соответствующим статьям:
1. Платы на чипсетах Intel 875/865: исчерпывающий обзор. Часть 2. Как грамотно использовать два канала памяти
2. Тесты модулей DDR400 семи типов от разных производителей. Влияние настроек памяти в BIOS Setup на быстродействие чипсета nVIDIA nForce2.
3. VIA KT266A — ускоряем настройками BIOS
4. Платы для Athlon 64. Часть 7. Как грамотно устанавливать и настраивать системную память
Прежде всего, посмотрим, как влияют базовые тайминги на скорость работы регистровой двухканальной памяти. В последнем столбце таблицы 1 показаны для сравнения результаты с более старым драйвером чипсета nForce3 150.
Таблица 1. Влияние таймингов tCL, tRP и tRAS. | ||||
Системная плата |
ASUS SK8N, Dual Channel Reg. DDR400 | |||
Параметр, тест |
2-2-3-5 |
2.5-2-3-5 |
2.5-3-3-6 |
2-2-3-5 Drv 3.13 |
AIDA32 3.88, Memory Read Speed, Мбайт/с |
5465 |
5414 |
5355 |
5464 |
AIDA32 3.88, Memory Write Speed, Мбайт/с |
1797 |
1787 |
1732 |
1797 |
CPU-Z 1.20a, Memory Latency, циклов CPU |
113 |
123 |
125 |
113 |
WStream, RAM Copy, Мбайт/с |
5193 |
5143 |
5076 |
5193 |
WStream, RAM Scale, Мбайт/с |
4910 |
4857 |
4804 |
4908 |
WStream, RAM Triad, Мбайт/с |
4843 |
4800 |
4770 |
4843 |
ScienceMark 2.0, Primordia (Ar), с |
24,24 |
23,6 |
24,26 |
24,24 |
MPEG2 to MPEG4 encoding (DivX 5.11), c |
155 |
155 |
156 |
154 |
Архивирование WinRAR 3.30 beta 3, с |
148,95 |
150,5 |
150,9 |
148,95 |
3Dmark03 (b330), Graphic score |
6191 |
6166 |
6185 |
6147 |
3Dmark03 (b330), CPU score |
1022 |
1019 |
1014 |
1002 |
Unreal Tournament 2003 Demo, dm-anubis, fps |
142,22 |
140,95 |
140,5 |
141,91 |
Unreal Tournament 2003 Demo, dm-asbestos, fps |
116,77 |
115,72 |
115,39 |
116,63 |
Vulpine GLMark 1.1p, 1024x768x32 bit, fps |
171,7 |
171,1 |
171,3 |
171,8 |
Quake III Arena, demo Quaver, 1024x768x32 bit, fps |
382,8 |
379,3 |
377,7 |
380,1 |
SPEC viewperf v7.1, drv-09, index |
48,49 |
48,3 |
48,32 |
45,79 |
SPEC viewperf v7.1, dx-08, index |
74,23 |
73,77 |
74,19 |
69,27 |
SPEC viewperf v7.1, light-06, index |
16,5 |
16,41 |
16,44 |
15,69 |
SPEC viewperf v7.1, proe-02, index |
13,91 |
13,87 |
13,89 |
13,19 |
Усредненная производительность, % |
100,60 |
100,30 |
100 |
98,61 |
В принципе, результаты вполне закономерны: при переходе с tCL=2.5 на tCL=2.0 для регистровой памяти мы получаем прибавку средней скорости системы в 0,3%, что заметно меньше, чем для случая нерегистровой (правда - одноканальной) памяти - 0,6-0,8% (см.www.terralab.ru/system/31598). Столько же (0,3%) мы теряем, если увеличиваем на один такт значения таймингов tRP и tRAS в двухканальной регистровой системе. И снова - это примерно вдвое меньше, чем на одноканальной нерегистровой системе.
Теперь - о влиянии работы коррекции ошибок (ECC) и одноканальности памяти.
Таблица 2. Влияние работы ECC и одноканальности памяти. | |||
Системная плата |
ASUS SK8N, Reg. DDR400 | ||
Параметр, тест |
Dual Channel |
Single Channel |
ECC Dual Channel |
AIDA32 3.88, Memory Read Speed, Мбайт/с |
5465 |
3025 |
5465 |
AIDA32 3.88, Memory Write Speed, Мбайт/с |
1797 |
1277 |
1794 |
CPU-Z 1.20a, Memory Latency, циклов CPU |
113 |
113 |
113 |
WStream, RAM Copy, Мбайт/с |
5193 |
3709 |
5185 |
WStream, RAM Scale, Мбайт/с |
4910 |
3534 |
4909 |
WStream, RAM Triad, Мбайт/с |
4843 |
3833 |
4843 |
ScienceMark 2.0, Primordia (Ar), с |
24,24 |
24,22 |
24,21 |
MPEG2 to MPEG4 encoding (DivX 5.11), c |
155 |
160 |
172 |
Архивирование WinRAR 3.30 beta 3, с |
148,95 |
153,58 |
148,87 |
3Dmark03 (b330), Graphic score |
6191 |
6131 |
6190 |
3Dmark03 (b330), CPU score |
1022 |
933 |
1020 |
Unreal Tournament 2003 Demo, dm-anubis, fps |
142,22 |
138,1 |
142,2 |
Unreal Tournament 2003 Demo, dm-asbestos, fps |
116,77 |
113,54 |
116,8 |
Vulpine GLMark 1.1p, 1024x768x32 bit, fps |
171,7 |
167,1 |
171,9 |
Quake III Arena, demo Quaver, 1024x768x32 bit, fps |
382,8 |
369,5 |
381,6 |
SPEC viewperf v7.1, drv-09, index |
48,49 |
45,31 |
48,32 |
SPEC viewperf v7.1, dx-08, index |
74,23 |
73,5 |
74,27 |
SPEC viewperf v7.1, light-06, index |
16,5 |
16,37 |
16,48 |
SPEC viewperf v7.1, proe-02, index |
13,91 |
13,28 |
13,87 |
Усредненная производительность, % |
100,60 |
97,45 |
99,74 |
В итоговом усредненном индексе мы не используем тесты непосредственной скорости памяти (AIDA, CPU-Z, WStream). А по ним видно, что с ECC скорость работы регистровой двухканальной памяти практически такая же, как без ECC! Ухудшение средней производительности системы на 0,9% в приложениях при использовании ECC в данном случае связывается преимущественно с провалом в тесте WinRAR, тогда как в остальном система работает с той же скоростью!
Интересно и другое - одноканальная система с регистровой памятью теряет в скорости в среднем лишь 3% по сравнению с двухканальной, что совершенно некритично для обычного пользователя. В данном случае использовался один и тот же объем памяти, но в одноканальном случае было задействовано больше банков, поскольку в одном канале стояло два двухсторонних модуля, а в двухканальном случае - по одному двухстороннему модулю в каждом из каналов. Почему это так важно - см. ниже.
В таблице 3 показано влияние установки на плату двух или четырех регистровых модулей памяти. Суммарный объем памяти в данном случае не важен, поскольку мы использовали тесты, которым вполне достаточно 1 Гбайт системной памяти и увеличение ее объема до 2 Гбайт (при прочих равных) практически не влияет на скорость их исполнения (это было проверено ранее). Здесь гораздо важнее другое - использованные нами модули были двухсторонними (подробности об этом см., например, на www.terralab.ru/system/28953), то есть содержали наибольшее количество банков памяти. Поэтому при установке в плату четырех модулей вместо двух пропорционально увеличивается количество банков и одновременно доступных страниц памяти. Именно это, в конечном итоге, и позволило системе с 4 модулями работать (внимание!) на ПЯТЬ процентов быстрее, чем система с двумя модулями. И в этом заслуга контроллера памяти, встроенного в процессор AMD. Напомню, что похожую тенденцию интеллектуальной работы с банками памяти мы уже наблюдали ранее для двухканальных чипетов Intel 875/865.
Таблица 3. Влияние многобанковых конфигураций памяти. | ||||
Системная плата |
ASUS SK8N, Dual Channel Reg. DDR400 2 DIMMs | |||
Параметр, тест |
2-2-3-5 |
2.5-3-3-6 |
4 DIMMs |
4 DIMMs |
AIDA32 3.88, Memory Read Speed, Мбайт/с |
5465 |
5355 |
5506 |
5329 |
AIDA32 3.88, Memory Write Speed, Мбайт/с |
1797 |
1732 |
1974 |
1890 |
CPU-Z 1.20a, Memory Latency, циклов CPU |
113 |
125 |
124 |
-- |
WStream, RAM Copy, Мбайт/с |
5193 |
5076 |
5527 |
5338 |
WStream, RAM Scale, Мбайт/с |
4910 |
4804 |
5309 |
5091 |
WStream, RAM Triad, Мбайт/с |
4843 |
4770 |
5127 |
4945 |
ScienceMark 2.0, Primordia (Ar), с |
24,24 |
24,26 |
23,91 |
-- |
MPEG2 to MPEG4 encoding (DivX 5.11), c |
155 |
156 |
154 |
155 |
Архивирование WinRAR 3.30 beta 3, с |
148,95 |
150,9 |
83 |
84 |
3Dmark03 (b330), Graphic score |
6191 |
6185 |
-- |
-- |
3Dmark03 (b330), CPU score |
1022 |
1014 |
-- |
-- |
Unreal Tournament 2003 Demo, dm-anubis, fps |
142,22 |
140,5 |
-- |
-- |
Unreal Tournament 2003 Demo, dm-asbestos, fps |
116,77 |
115,39 |
116,37 |
113,02 |
Vulpine GLMark 1.1p, 1024x768x32 bit, fps |
171,7 |
171,3 |
171,5 |
171,7 |
Quake III Arena, demo Quaver, 1024x768x32 bit, fps |
382,8 |
377,7 |
382,9 |
372,2 |
SPEC viewperf v7.1, drv-09, index |
48,49 |
48,32 |
48,82 |
-- |
SPEC viewperf v7.1, dx-08, index |
74,23 |
74,19 |
74,88 |
-- |
SPEC viewperf v7.1, light-06, index |
16,5 |
16,44 |
16,61 |
-- |
SPEC viewperf v7.1, proe-02, index |
13,91 |
13,89 |
14,02 |
-- |
Усредненная производительность, % |
100,6 |
100 |
105,12 |
-- |
Выигрыш от перехода на 4-банковую конфигурацию использования памяти никак нельзя назвать малым - почти столько же дает повышение частоты процессора на одну ступень! К сожалению, наша достаточно "ранняя" тестовая система со "старым" кристаллом процессора (выпущенным еще летом прошлого года) в случае установки 4 модулей DDR400 работала не всегда стабильно - некоторые тесты подвисали. Еще один сюрприз приподнес все тот же WinRAR, показав почти ДВУКРАТНОЕ ускорение в такой системе - при вычислении среднего индекса производительности именно результат WinRAR привел к 5-прцентному приросту средней скорости. Если же его в расчет не принимать при вычислении среднего, то прирост скорости на 4-банковой конфигурации составит 1,02%, то есть значительно скромнее, но прирост все же есть и он заметен почти на всех тестах.
Если же попробовать проанализировать, почему в данном случае 4-банковая система быстрее 2-банковой, то исходя из непосредственных тестов памяти можно заключить, что при неизменной латентности памяти немного возросла скорость чтения и существенно возросла скорость записи в память. А именно последнее является доказательством более эффективной работы со страницами памяти (большее их количество открыто одновременно). Скорость записи памяти в 4-банковой системе увеличилась на 14%! И примерно на 10% возросло быстродействие при более сложных операциях с памятью, показанных в тестах WStream. Что с очевидностью подтверждает наши догадки и частично оправдывает результат WinRAR и средние 5% прироста..
Если пытаться посмотреть немного в будущее, отмеченные нами в этом обзоре закономерности при конфигурировании системной памяти на двухканальных платформах с AMD Athlon 64/Opteron при грядущем переходе на нерегистровую память должны сохраниться, но их количественное выражение может быть более явным, поскольку нерегистровые модули работают немного шустрее регистровых. Впрочем, мы это скоро уже сможем проверить.