Архивы: по дате | по разделам | по авторам

Платы на чипсетах Intel 875/865: исчерпывающий обзор. Часть 2. Как грамотно использовать два канала памяти

АрхивПлатформа
автор : Алекс Карабуто   10.09.2003

Основные правила и особенности использования двухканальной памяти с чипсетами Intel 875/865. Зависимость быстродействия системы от таймингов памяти и конфигурации модулей.

См. остальные части нашего обзора:
Часть 1: Характеристики новых двухканальных чипсетов.
Часть 3: Сравнение быстродействия чипсетов в стандартных режимах на примере шестнадцати плат.
Часть 4: Описание тринадцати топовых моделей от ABIT, ASUSTeK, EPoX, Gigabyte и Intel.

Продолжаем разговор об особенностях применения двухканальных DDR-чипсетов Intel серий 875/865 (Canterwood и Springdale), начатый в первой части нашего обзора чипсетов Intel 875/865. Как я и обещал, мы поговорим не столько о самих чипсетах, сколько о новых технологиях работы с DDR SDRAM, о модулях памяти и правилах их использования с интеловскими наборами системной логики. Как мы помним, северный мост MCH у 875P и 865PE/P - это топологически один и тот же кристалл, отсортированный по скоростным параметрам кремния на финальной стадии производства и упакованный в разный конструктив. Мы не будем заострять внимание на отличиях чипсетов 875 и 865 друг от друга, а поговорим об их общих чертах при работе с памятью.

В чипсеты серий 875 и 865 заложено достаточно много нововведений и интеллектуальных возможностей по работе с системной памятью. Поэтому для грамотного конфигурирования памяти и получения максимально возможного быстродействия системы необходимо понимать ряд вещей. В частности, режим работы чипсета с памятью здесь определяется не только настройками частоты и таймингов в BIOS Setup и/или содержимым SPD самих модулей, но и тем, что это за модули и каким образом они установлены в плату.

В зависимости от занятости слотов памяти и структуры (типа) используемых модулей чипсет может автоматически подстраивать свои режимы работы: это происходит как при включении питания, так и непосредственно в процессе работы - в зависимости от текущих терморежимов компонентов, условий электромагнитного окружения и пр. Например, может интеллектуально подстраиваться фаза и амплитуда тактовых импульсов и других сигналов работы с памятью, могут оптимизироваться активные терминаторы шины с целью улучшения качества сигналов на высокой частоте и др. Как утверждают разработчики, процедуры оптимизации чипсет проводит сам в паузах между полезной работой. Режим работы чипсета с памятью (включая тонкие настройки скрытых от обычных пользователей таймингов и конфигурирование шины при двухканальной работе) также сильно зависит от того, что за модули и каким образом установлены в плату. Нередки случаи (я сталкивался с этим неоднократно), когда чипсет после смены модулей памяти некоторое время подбирает нормальный режим работы с новыми параметрами, и пока он этого не сделал, плата не может запуститься или работает нестабильно. Зато после оптимизации стабильность системы заметно повышается. Всё это неминуемо сказывается на конечной производительности системы «плата-память», и если для предыдущих чипсетов Intel все было предельно ясно - включил, настроил тайминги на максимум возможного, измерил быстродействие и уверен, что так оно и будет дальше, - то сейчас ситуация куда сложнее и требует неспешного и внимательного подхода при тестировании, особенно если планируется использовать чипсет и память при максимально агрессивных настройках быстродействия и применять нештатные режимы ускорения производительности. Кстати, Intel настоятельно рекомендует использовать согласованные производителем пары модулей памяти (на фото), чтобы избежать недоразумений в работе.

В первом приближении основное правило для активирования двухканального режима памяти на новых чипсетах Intel достаточно простое: следует установить одинаковые модули памяти в слоты с одинаковым цветом (они разделены промежутком на плате). Но если подойти к вопросу подробнее, то возникает масса нюансов. Во-первых, что считать «одинаковыми» модулями памяти? Во-вторых, как быть, если все слоты DIMM на плате имеют один и тот же цвет (как на платах Intel, например), или цветность слотов «перепутана» (как, скажем, на платах от MSI)? Поэтому будем рассматривать эти вопросы методически, неспешно и последовательно.

Вот два основных нововведения, примененных в чипсетах 875/865 для улучшения производительности при работе с памятью:
- двухканальный интерфейс;
- динамическая адресация.

Оба режима независимы друг от друга, то есть, например, для работы динамической адресации совершенно необязательно наличие двухканального режима (она прекрасно работает и в одноканальном режиме), и наоборот, работа памяти в двухканальном режиме не означает, что динамический режим активирован (хотя на практике чаще всего бывает именно так).

Двухканальный режим

Двухканальный режим возможен благодаря наличию на плате (и в чипсете) двух отдельных 64-битных каналов работы с памятью, каждый из которых полностью разведен в одном «своем» слое металлизации. Этот режим использует параллельное (то есть одновременное) обращение к двум стандартным модулям памяти с использованием 128-разрядной шины данных (два канала по 64 бита; каждый стандартный DIMM памяти имеет 64-разрядную шину), тогда как в одноканальном режиме эти же модули будут опрашиваться последовательно, то есть в рамках стандартной модели 64-разрядной шины данных (как было в серии i845). Чипсеты серии 875/865 автоматически распознают конфигурацию подключенной памяти и активируют двухканальный режим, если это возможно. Ручное управление режимами одноканальный/двухканальный (например, в BIOS Setup или джамперами на плате) в этом случае невозможно (в отличие, скажем, от SiS655, где в BIOS Setup есть соответствующая опция). Использование двухканального режима работы в Intel 875/865 накладывает ограничения на конфигурацию и порядок установки модулей на плату. При несоблюдении этих правил плата не сможет использовать возможности двухканальной работы с памятью, автоматически переводя чипсет в одноканальный режим, что сразу снизит быстродействие системы.

Основные заявленные разработчиками требования компоновки памяти на этих чипсетах для активирования двухканального режима таковы:

Необходимо выполнение следующих условий:

1) Согласование каналов памяти в Channel A и Channel B - заполняются симметричные слоты памяти (DIMM0+DIMM2 и/или DIMM1+DIMM3, см. рисунки 1 и 2 далее; часто эти слоты имеют одинаковый цвет).

2) Согласование конфигурации модулей DIMM в каждом из каналов
- Одинаковый объем модулей (128, 256, 512 Мбайт и т. д.).
- Одинаковая технология памяти DRAM (чипы по 128, 256 или 512 Мбит).
- Одинаковая ширина шины памяти DRAM (x8 или x16).
- Оба модуля должны быть или односторонние, или двухсторонние (поясним чуть ниже).

Не обязательно выполнение следующих условий:
- Одинаковые торговые марки.
- Одинаковые временные спецификации (тайминги по SPD).
- Одинаковое быстродействие (частота) модулей памяти.

Если использовать «разночастотные» и «разнотайминговые» модули, по умолчанию будет установлена скорость интерфейса, соответствующая характеристикам самого медленного модуля.

Фактически двухканальный режим работы ограничен всего тремя комбинациями одинаковых модулей: заполнены слоты DIMM0 и DIMM2, заполнены слоты DIMM1 и DIMM3, симметрично заполнены все четыре слота DIMM. Во всех остальных случаях будет работать лишь одноканальный режим. В том числе, когда, например, в слотах DIMM0 и DIMM1 стоят 256-мегабайтные 8-чиповые модули, а в слоте DIMM2 - 512-мегабайтный 16-чиповый (аналогичный по технологии). Это заметно отличается от правил использования двух каналов памяти в чипсетах SiS655/FX и NVIDIA nForce2, где допускаются «более вольные» (в том числе трехмодульные) конфигурации.



Организация модулей

Платы на чипсетах Intel 875/865 поддерживают только небуферизованные 2,5-вольтовые (по стандарту; реально напряжение можно повышать) одно- и двухсторонние модули DDR SDRAM с 184 позолоченными контактами. Чипсеты не поддерживают двухсторонние «диммы» с организацией x16 (чипы DRAM с 16-битной шиной данных), а также «нечетные» и «смешанные» (x8 и x16 на одном модуле) двухсторонние DIMM даже для одноканального режима. Все конфигурации DDR-модулей памяти, поддерживаемые этими наборами системной логики, показаны в таблице 1.

Сейчас самыми распространенными являются модули на 256-мегабитных чипах с организацией 32Mx8. Таким образом, максимально на такую плату можно установить 4 Гбайт памяти - только четырьмя двухсторонними гигабайтными модулями.

Под односторонними (SS) и двухсторонними (DS) здесь понимаются модули, имеющие одну и две строки (ряда) электрической организации DRAM (у двухсторонних каждые два чипа параллельно используют одну 8-битную шину). Физически это отнюдь не совпадает с односторонним или двухсторонним монтажом чипов на самом модуле (например, восемь 256-мегабитных чипов могут быть расположены как по одну, так и по обе стороны одной «подложки» DIMM при одинаковой «односторонней» организации), что наглядно продемонстрировано на наших диаграммах производительности: пятая и шестая снизу двухканальные конфигурации памяти идентичны по производительности (в пределах погрешности измерений), хотя одна из них составлена из двух внешне («механически») разных модулей - одностороннего (восемь чипов только на одной стороне подложки) и двухстороннего (такие же восемь чипов «раскиданы» по обеим сторонам модуля) от разных производителей (имеющих, тем не менее, одинаковую «одностороннюю» электрическую банковую организацию).

Динамическая адресация

Вторым новым режимом в чипсетах Intel 875/865 является динамическая адресация страниц памяти (Dynamic Paging Mode). Этот режим минимизирует потери скорости путем уменьшения количества операций доступа к памяти. Чипсеты 875/865 поддерживают до 16 одновременно открытых страниц памяти (по четыре на строку) для двухканальной конфигурации и до 32 - для одноканальной конфигурации памяти. Размер страниц выбирается индивидуально для каждой строки: 4, 8 или 16 Кбайт для одноканального и 8, 16 или 32 Кбайт для двухканального режимов.

Однако оперировать адресацией страниц при этом можно по-разному. Приведем для примера четыре схемы распределения обращений чипсета по адресам памяти RAS и CAS (трансляции адресов DRAM) при одноканальном и двухканальном использовании в обычном режиме (линейной адресации) и в режиме динамической адресации (Address-Multiplexing Dynamic mode) для наиболее популярных сейчас чипов с организацией 32Mx8 (см. таблицу 2).

Видно, что при динамической адресации используется замещение некоторых «линейных» адресов строки (row, то есть электрической «стороны» DIMM) старшими, что позволяет экономить на обращениях к памяти. Дело в том, что при обычной «линейной» адресации выбор строки сигналом ChipSelect производится исходя из размера всей строки (от 64 до 512 Мбайт), и при этом количество открытых страниц памяти не всегда максимально возможное, что снижает производительность (увеличивает задержки чтения), если большинство обращений производится к одной этой строке (открытие и закрытие страниц в строке). Динамическая адресация «перемешивает» старшие адреса, благодаря чему снижаются издержки на открытие/закрытие страниц памяти, позволяя строке переключаться реже.

Главным условием для активации динамического режима адресации является четное (или единичное) число строк («электрических» сторон модулей памяти) независимо от наличия двухканального режима. Для одноканального варианта размещения - это один модуль или два «одинаковых» (SS или DS). Для двухканального варианта Dynamic Mode не активирован, только если симметрично скомпонованы SS и DS (см. также рисунок 2 ниже). То есть динамическая мода «боится» трехбанковых конфигураций и по-разному организованных модулей в одноканальном режиме.

В таблице 3 просуммированы четыре конфигурации использования двух новых режимов (двухканального и динамической адресации) в порядке возрастания общей производительности системы (снизу вверх). Эти же конфигурации также проиллюстрированы на рисунках ниже. Наши собственные измерения быстродействия всех четырех режимов полностью подтверждают таблицу 3 (см. четыре нижние строчки всех диаграмм тестов в конце статьи).

Таким образом, если при установке сразу четырех DIMM на одном канале используются несогласованные модули, то динамический режим не может быть активирован, хотя двухканальный режим работает исправно.

Разработчики чипсетов Intel 875/865 отмечают и более тонкие моменты, следующие из специфики работы чипсета и динамической адресации: наивысшую производительность имеют системы, использующие пару двухсторонних модулей DDR400, хотя в случае четырех модулей можно достичь того же результата и с одинаковыми односторонними DIMM. Ширина шины x8 внутри модуля (см. таблицу 1) также повышает производительность системы.

Помимо исследования влияния Dynamic Paging Mode в двухканальном и одноканальном режиме, мы также провели подробные испытания быстродействия самых разнообразных конфигураций памяти, включая одно- и двухсторонние модули разного объема и разного количества. Испытания мы проводили под MS Windows XP Professional SP1 на системных платах Intel D875PBZ и ABIT IC7-G (см. «КТ» #506) с процессором Intel Pentium 4 3,2 ГГц (шина 800 МГц). В качестве системной памяти использовались элитные пары модулей от компании OCZ (серии EL Platinum) и Kingston (HyperX), любезно предоставленные компанией «Патриарх» (www.memory.ru), а также модули Corsair PC3200, TwinMOS PC3200 и NCP PC2700 (за них благодарим компанию «Никс», www.nix.ru). Для получения «правильных» результатов в тестах «таймингов» использовалась согласованная пара модулей OCZ PC3200 512MB EL Platinum Dual CH. Среди других компонентов - видеоускоритель GeForce FX 5900 Ultra (референс NVIDIA) с драйверами Detonator 44.03 и винчестер Maxtor 6Y120P0 с буфером 8 Мбайт и 80-гигабайтными пластинами.

Результаты представлены на диаграммах производительности - во втором снизу «блоке» из шести строк. Для экономии места мы показываем только самые «чувствительные к памяти» тесты - в большинстве других тестов и приложений разница между конфигурациями не столь заметна. На отдельной (финальной) диаграмме мы усреднили («геометрически») производительность конфигураций в двадцати тестах: суммарный рейтинг быстродействия систем показывает в процентном соотношении разницу в скорости конфигураций. Эти «проценты» дают верхнюю оценку разницы скорости конфигураций памяти - в большинстве реальных задач она все же не так заметна.

Тесты подтвердили, что 16-чиповые (электрически «двухсторонние») модули при прочих равных условиях позволяют добиться заметно лучшей производительности, чем 8-чиповые (односторонние)! Это вызвано большей скоростью записи в память у первых (см. диаграмму выше). Как сказал Билл Лезински, директор подразделения Intel по разработке настольных чипсетов, в этом случае большее количество банков для записи экономит время CAS-to-RAS Precharge при записи в разные банки и почти не влияет на скорость чтения (полосу пропускания и латентность). Это умеют использовать чипсеты 875/865 и не умеет E7205. Интересно, что на чипсете SiS655 (вышедшем ранее i875P) 16-чиповые модули также пишут быстрее, чем 8-чиповые.

Более того, использование четырех двухсторонних модулей вместо двух также приносит дивиденды на i875/865, заметно ускоряя потоковый тест памяти WStream и ряд реальных приложений. При этом влияние собственно объема (а не организации) памяти на нашем наборе тестов можно исключить, поскольку ее увеличение с 512 до 1024 Мбайт при одинаковой структуре модулей (двусторонние 16-чиповые с шиной х8) не привело к какому-либо росту результатов (в рамках погрешности). Вместе с тем односторонние модули проигрывают двухсторонним более 3,5%! А четверка двухсторонних модулей обогнала пару таких же почти на 2%. Активирование динамической адресации памяти (по сравнению с традиционной линейной адресацией) позволяет прибавить до 3% скорости (при работе с двухсторонними модулями) в двухканальном режиме и более 2% в одноканальном режиме.

Все эти достаточно тонкие и неочевидные (судя по предыдущим чипсетам) моменты способны существенно повлиять на «правильность» сравнительного тестирования системных плат, процессоров и пр. - ведь в сумме эти «небольшие проценты» могут дать до 8% разницы скорости одной и той же системной платы при одних и тех же настройках в BIOS Setup (частота, тайминги и пр.) лишь за счет «немного другой» памяти! Нет нужды говорить, что 8% - это примерная разница производительности старших Pentium 4, различающихся всего одной ступенью частоты ядра. Вот где простор для подтасовок.

Тайминги памяти

Напоследок нас ждет еще одно увлекательное исследование с нетривиальными выводами - как влияют основные тайминги памяти на общее быстродействие плат на чипсетах 875/865. Для определенности мы ограничились согласованной парой двухсторонних модулей и i875P - на сходные конфигурации найденные нами закономерности распространяются фактически без изменений. Влияние базовых таймингов памяти (tCL, tRP, tRCD, tRAS, как они обозначены в BIOS Setup платы Intel) мы исследуем на плате Intel D875PBZ Bonanza (см. «КТ» #506) - два верхних блока результатов на диаграммах. Кое где нам помогут платы ABIT IC7, EPoX 4PCA3+ и Gigabyte GA-8KNXP.

Но прежде, чем перейти к описанию таймингов и их влиянию на производительность, кратко отметим «частотные» возможности по конфигурированию памяти. В спецификациях i875P/865 (и в BIOS Setup плат Intel) указано, что при частоте системной шины 800 МГц память может работать в режимах DDR400, DDR333 и даже DDR266 (режиму DDR333 в этом случае реально соответствует частота именно 320 МГц - при этом латентность чипсета оказывается ниже, чем в случае 333 МГц, ведь используется более простое соотношение частот FSB/DRAM=5/4). При системной шине 533 МГц память тактируется на 333 МГц и 266 МГц (псевдосинхронный режим), а для FSB 400 МГц - только как DDR266. Плата будет «разгоняться» по шине, отталкиваясь от этих базовых соотношений между частотами FSB и памяти (это справедливо и для серии 865), а режимы двухканальной памяти и динамической адресации - работать без изменений. Разницу в производительности этих чипсетов при FSB 800 МГц с разной частотой памяти (400/320/266) и при FSB 533 МГц c DDR333 мы уже иллюстрировали (см. «КТ» #506): при FSB 800 достойно выглядит лишь DDR400, однако на FSB 533 в «продвинутых» режимах работы чипсета с памятью DDR333 производительность системы может быть не намного хуже.


Теперь - к таймингам. Сперва - о четырех базовых.

CAS Latency (tCL) - этот, пожалуй, самый «популярный» тайминг означает задержку сигнала выборки столбца (CAS): временная задержка (в тактах частоты шины) до начала чтения данных памятью после поступления команды чтения. Обычно используются три значения: 2, 2,5 и 3 (такта). Исторически считается, что 2 (такта) существенно увеличивают производительность системы (так было, например, во времена SDRAM PC133), однако взглянем на наши диаграммы: при изменении tCL с 3 до 2 производительность двухканальной DDR-системы меняется менее чем на 0,1%!!! Фактически этот тайминг не влияет на производительность таких систем (в пределах погрешности измерений)! Недаром Intel в пункте BIOS Setup установки наиболее агрессивных таймингов памяти по умолчанию использует CL=2.5, хотя многие модули памяти DDR400 уже позволяют работать с CL=2. Однако для внимательного читателя это не в новинку: еще год назад при исследовании влияния таймингов в двухканальной системе на чипсете NVIDIA nForce2 мы также обнаружили крайне слабое влияние параметра tCL (см. www.terralab.ru/online/system/21352). Наша рекомендация проста: tCL надо устанавливать только из соображений стабильности системы. Значения 2,5 в большинстве случаев вполне достаточно, но если придется увеличить его до 3 - не беда. tCL=2 - бесполезная роскошь на этих чипсетах.


RAS Active to Precharge Delay (tRAS)
- задает время задержки для подзарядки строки памяти. Значения: 5, 6, 7 или 8 тактов. Считается, что он тоже способен заметно повлиять на скорость памяти. Однако для двухканального i875P это не так - по нашим тестам разница в скорости платформы при изменении тайминга с 8 до 5 тактов менее 0,5%. Не густо, хотя и не пусто. Учитывая, что большинство модулей отлично работает с tRAS=6 или 7, эти значения следует считать лучшим выбором. И снова - для двухканального NVIDIA nForce2 этот тайминг также практически не влиял на скорость.

RAS Precharge (tRP) - время подзаряда сигналом RAS. Определяет количество тактов задержки после установки сигнала RAS, необходимых для подзарядки ячейки динамической памяти перед началом цикла обновления. Уменьшение этого значения повышает быстродействие, но чрезмерное для конкретной памяти его снижение может привести к потере данных. Значения: 2, 3 или 4 такта. Вот здесь уже стало поинтереснее - каждая ступень этого тайминга повышает производительность системы примерно на 1%. Огорчает другое - как назло, не всякий модуль памяти DDR400 способен осилить tRP=2. Впрочем, большинство «нормальных» все же способно.

RAS to CAS Delay (tRCD) - задержка между сигналами RAS и CAS. Когда память находится в режиме регенерации, строки и столбцы адресуются раздельно. Этот параметр позволяет задать время перехода от сигнала RAS (row address strobe) к сигналу CAS (column address strobe). Естественно, чем меньше значение, тем выше скорость памяти. Значения: 2, 3 или 4 такта. Влияние на производительность двухканальной системы по нашим тестам - самое большое: почти 2% при переходе от 4 к 3 тактам и еще около 2%, если добиться tRCD=2. К сожалению, редкая птица осилит середину великой реки - на «двойке» у нас смогли работать лишь Kingston HyperX PC3500/ 256MB и Corsair PC3200/ 256MB, а все остальные (включая многие из перепробованных OСZ EL Platinum и пр.) тянули лишь на «троечку». Неплохо, если бы производители памяти меньше внимания уделяли снижению tCL и tRAS, а больший упор делали именно на tRCD. Ведь вместе с tRP он способен добавить до 6% к скорости платы. Взгляните - система с таймингами 2-4-4-5 и 3-4-4-8 работает одинаково «медленно», а на 2-2-3-5 почти «летает» - именно за счет tRP и tRCD. С другой стороны, не каждая плата в наших тестах была способна стабильно работать с tRCD=2. Например, та же Intel D875PBZ даже с DDR266 и DDR320 отказывалась!

Напоследок о нескольких более редких таймингах.

Intel CPC (Command Per Clock) - аналог прежнего параметра 1T Command. В положении Enabled увеличивает производительность системы примерно на 0,4%, но, как правило, сильно ухудшает стабильность платформы. Наша рекомендация - ставить в Auto или Disabled.

Intel Fast CS (Chip Select) - ускоренный выбор кристалла памяти. При активировании добавил в среднем около 1,3% производительности и немного ухудшил стабильность. Где это позволяют условия, его можно активировать.

CPU Bus Park - парковка шины CPU теоретически должна улучшать быстродействие, но ни на одной плате, где была эта опция, она не позволила плате даже запуститься. Видимо, пока бесполезна.

Burst Length - длина конвейера (очереди). Позволяет установить размер конвейера для памяти. Конвейер памяти - это технология, при которой ОЗУ самостоятельно вычисляет следующий адрес при последовательном считывании. Чтобы использовать эту технологию, необходимо сначала определить длину конвейера, которая соответствует количеству считываемых последовательных данных, затем начальный адрес данных и уже потом разрешить внутреннему счетчику вычислять последовательные адреса. Чем больше размер конвейера, тем выше производительность последовательного чтения. Значения: 4, 8. По нашим экспериментам (результаты здесь не показаны) влияние этого параметра незначительно - доли процента. На стабильность системы практически не влияла.

Результаты тестов быстродействия

Результаты тестирований различных конфигураций памяти представлены на диаграммах. Использованные тестовые системы были описаны выше. Как мы уже отмечали, мы показываем здесь только самые «чувствительные к памяти» тесты - в большинстве других тестов и приложений разница между конфигурациями не столь заметна. На отдельной (финальной) диаграмме мы усреднили («геометрически») производительность конфигураций в двадцати тестах: суммарный рейтинг быстродействия систем показывает в процентном соотношении разницу в скорости конфигураций. Эти «проценты» дают верхнюю оценку разницы скорости конфигураций памяти - в большинстве реальных задач она все же не так заметна.

Основные, общие закономерности, которые следуют из результатов наших тестов, мы уже отметили выше в соответствующих разделах, поэтому здесь кратко обсудим каждый из частных тестов.

По скорости чтения памяти (тест AIDA32) у таймингов tCL и tRAS есть некоторое влияние - чем меньше, тем лучше. И наоборот, вличние tRCD в этом тесте относительно мало. Это контрастирует с общей тенденцией, где первые два тайминга влияют крайне слабо, а tRCD - наоборот, весьма сильно. Зависимость от организации (количества чипов) модулей здесь также весьма слабо выражено. Но динамическая моде влияет достаточно сильно - более 3%.

По скорости записи в программе AIDA32, напротив, tRCD влияет ощутимо, выраженной тенденции зависимости от tCL и tRAS не просматривается, зато "чиповость" модулей очень важна: 16-чиповые обгоняют 8-чиповые более, чем на 30%!!! Очень выражено и влияние динамической адресации - более 40% прибавки в двухканальной конфигурации!!!

Тест памяти программой SiSoftware Sandra 2003 SP1, как оказалось, почти нечувствителен к разнице конфигураций памяти и не может служить адекватным инструментом для их исследования.

Зато тесты латентности подсистемы памяти в программах Science Mark 2.0 и CPU-Z 1.19a на это очень годны: tCL и tRAS почти не сказываются на латентности, а другие тайминги влияют на латентность достаточно заметно.

Тест потоковой работы с памятью WStream также тонко чувствует изменения конфигурации памяти и ее настроек: к tCL и tRAS он почти индеферентен, зато к tRP и tRCD весьма чувствителен - каждый из них влияет примерно на 4-5% при изменении величины на одну ступеньку. Еще болшее влияние (до 10%) здесь оказывают динамическая адресация и разное количество чипов в модулях.

Переходим от тестов собственно памяти к тестам общей (пользовательской) производительности систем.

Процессорный тест пакета 3DMark03 достаточно чуток к скорости памяти. tCL и tRAS эдесь почти не влияют, зато tRP и tRCD влияют ощутимо. 16-чиповые модули безусловно быстрее 8-чиповых, а динамическая адресация добавляет 1-2% скорости.

Архивирование WinRAR традиционно один из "коньков" для тестов памяти. Снова мы видим полное безразличие к tCL и tRAS, но огромную зависимость от tRP и tRCD. Динамическая адресация здесь не столь влиятельна, хотя "чиповость" модулей может добавть почти 3% скорости.

Комплексное кодирование видео и аудио (MPEG4+MP3) оказалось слабо чувствительным к настройкам памяти. Тем не менее, "разночиповость" и дингамическая мода и здесь способны добавить 1-2%.

В игре Unreal Tournament 2003 (мы использовали самое чувствительую демо-сцену) снова видим индеферрентность системы к tCL и tRAS, ощутимое влияние двух других базовых таймингов (вспомните скорость записи в память) и неярко выраженную зависимость от конфигурации модулей памяти и динамической моды.

Зато два других игровых OpenGL-теста демонстрируют большую разборчивость к памяти: Vulpine GLMark и Quake III Arena, как и большинство других тестов,. мало зависят от настроек tCL и tRAS, сильно зависят от настроек tRP и tRCD и весьма придирчивы к организации модулей памяти и работе динамической адресации

Чего не скажешь об игре Return to Castle Wolfenstein: тут все эти зависимости гораздо менее выражены (а порой и вовсе отсутствуют), и даже одноканальный вариант едва проигрывает двухканальному.

В четырех тестах пакета профессиональных трехмерных приложений SPEC viewperf 7.1 мы наблюдаем подтверждение ранее подмеченных закономерностей:

снова мы видим  независимость от настроек tCL и tRAS, сильную зависимость от настроек tRP и tRCD (особенно в случае тестов DRV-09 и PROE-02), ощутимую зависимость от количества банков памяти и оттдинамической адресации (то есть тоже количества открытых страниц памяти).

Усредненный по всем нашим тестам итоговый рейтинг систем подводит черту под нашими наблюдениями (подробности см. в предыдущих разделах этой статьи): производительность двухканальных систем на чипсетах Intel 875/865 мало зависит от значений таймингов tCL и tRAS, достаточно сильно зависят от настроек tRP и особенно tRCD, весьма придирчива к тому, сколько банков памяти оккупировано (то есть используются ли 8-чиповые или 16-чиповые модули и сколько слотов памяти ими занято), а также от того, работает ли динамическая адресация или нет. Процентные соотношения быстродействия различных конфигураций памяти вы можете посмотреть на этой диаграмме самостоятельно.

Продолжение читайте в следующей части на www.terralab.ru/system/28980.


Предлагаем обсудить этот материал в нашем форуме

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.