Архивы: по дате | по разделам | по авторам

Платы для Athlon 64. Часть 7. Как грамотно устанавливать и настраивать системную память

АрхивПлатформа
автор : Алекс Карабуто   31.03.2004

Исчерпывающее изучение влияния настроек BIOS Setup на скорость работы Athlon 64 с системной памятью — все возможные тайминги памяти, многие конфигурации модулей, разные типы памяти.

Продолжим знакомиться с платами для процессоров с архитектурой AMD64. В предыдущих шести частях нашего обширного обзора плат для процессоров AMD Athlon 64 мы подробно рассмотрели основыне чипсеты, которые пристуствуют сейчас на этом сегменте рынка, и познакомились с несколькими характерными и популярными материнскими платами для процессоров с разъемом Socket 754, то есть для Athlon 64 с одноканальным контроллером памяти (не FX-5х), см. статьи:

Часть 1. Платы для Athlon 64. Часть 1. ECS KV1 Deluxe (Photon Series) и Soltek SL-K8AV2-RL — хорошие недорогие решения
Часть 2. Платы для Athlon 64. Часть 2. ASUS K8V Deluxe (WireLess Edition) и Gigabyte K8VNXP — платы высшего ранга
Часть 3. Платы для Athlon 64. Часть 3. Плата MSI K8T Neo на чипсете VIA K8T800: динамический оверклокинг Athlon 64
Часть 4. Платы для Athlon 64. Часть 4. Секрет режима Turbo платы ASUS K8V Deluxe
Часть 5. Платы для Athlon 64. Часть 5. Чипсет SiS755 и плата ECS 755-A — low-end-вариант платформы AMD64
Часть 6. Платы для Athlon 64. Часть 6. Чипсет NVIDIA nForce3 150 и плата Chaintech ZNF3-150

Однако для полноты картины использования Athlon 64 с материнскими платам нам следует разобраться еще в одном важнейшем вопросе — как правильно устанавливать и настраивать системную память при работе с Athlon 64. Этому и будет посвящена нынешняя, седьмая по счету и весьма концептуальная часть обзора плат для Athlon 64.

 

Введение

Как вы хорошо знаете, контроллер системной памяти встроен непосредственно в кристалл процессоров AMD Athlon 64 и AMD Opteron. С одной стороны, это дает массу преимуществ всей платформе (существенно повышается скорость работы с памятью и общее быстродействие системы, дешевеют чипсеты, упрощается разработка печатных плат и, как следствие, может быть снижена их цена), но с другой — есть и недостатки (меньшая гибкость при поддержке новых типов памяти, новых частот, структуры модулей и пр., бoльшая латентность при работе графического ускорителя с системной памятью). Оставим на время недостатки и сосредотовимся на достоинствах такого подхода. Тем более что это позволяет нам убить почти всех зайцев сразу: на примере одного чипсета (и даже одной платы) мы можем выяснить все тонкости использования памяти с процессорами Athlon 64 без ущерба для общности применения найденных закономерностей для всех остальных плат и чипсетов этого же класса (сокета).

Таким образом, задачей этой статьи будет выяснение влияния всех доступных обычному пользователю (через меню BIOS Setup материнских плат) настроек (например, таймингов) работы процессора Athlon 64 (Socket 754) с памятью, оценки прироста или потери производительности при их изменении относительно неких оптимальных значений, влияние порядка установки и объема модулей памяти, а также оценка потери производительности при использовании более медленной, чем DDR400, памяти с Athlon 64. Соответственно этому, статья разбита на шесть глав:

1. Влияние таймингов CAS Latency (tCL) и RAS Active Time (tRAS);
2. Влияние таймингов RAS-to-CAS Delay (tRCD) и Row Precharge Time (tRP);
3. Влияние таймингов tRC, tRFC, tRWT, tWTR, tWR и tRRD4;
4. Влияние Refresh-периода (tREF) системной памяти;
5. Влияние порядка установки и объема модулей памяти;
6. Влияние частоты работы памяти (DDR400/333/266/200).

Наше исследование носит не столько теоретический, сколько сугубо практический характер — на основе непосредственных тестирований около сорока различных конфигураций памяти с одним процессором (и на одной плате) в двух десятках разноплановых тестов (специально отобраны те из них, которые наиболее чувствительны к скорости работы платформы с памятью) мы постарались сформулировать прикладные закономерности, которые позволят лучше понять, каким образом грамотному пользователю лучше конфигурировать и настраивать свою систему на базе процессоров AMD Athlon 64. Вопросы более общего, теоретического плана (сходной тематики) выходят за рамки данной статьи и будут освещены нами позднее. Итак, приступим.

Испытания различных конфигураций и настроек памяти проводились под MS Windows XP Professional SP1 при помощи процессора AMD Athlon 64 3200+ с частотой 2,0 ГГц (кристалл ревизии C0). В качестве основной платформы для испытаний послужила материнская плата Gigabyte GA-K8VNXP, BIOS Setup которой наиболее богат возможностями настроек памяти (см. фото). При этом базовым вариантом настроек BIOS Setup платы мы считали те, которые появляются по умолчанию при исполнении пункта Load High Performance Defaults самого BIOS Setup (они показаны на фото ниже).

Возможности настроек работы контроллера Athlon 64 с памятью в BIOS Setup платы Gigabyte GA-K8VNXP (подменю становится доступным при нажатии Ctrl-F1).

Остальные из попадавшихся нам плат для Athlon 64 (Socket 754) в той или иной степени пока уступали этой плате в плане возможностей настроек памяти. Впрочем, и у GA-K8VNXP обнаружились два недостатка: с использованной (самой свежей на момент испытаний) версией BIOS (плата ревизии 1.0 версией BIOS M02), эта плата не позволяла корректно и произвольно изменять тайминг CAS Latency (мы проверили несколько различных модулей памяти), а также не позволяла присвоить таймингу RAS Active Time значение 5 циклов (минимальным для этой платы было 6 циклов). Поэтому для проверки влияния CAS Latency и RAS Active Time мы также использовали материнскую плату ASUS K8V Deluxe, которая в этом плане была безукоризненна, но не обладала столь же богатыми возможностями по настройке многих других тайминов (см. фото).

Возможности настроек работы контроллера Athlon 64 с памятью в BIOS Setup платы ASUS K8V Deluxe.

При этом плата ASUS работала в режиме Performance Mode = Standard (тонкости использования режимов Performance Mode на этой плате мы описали ранее на www.terralab.ru/system/31505).

Плата ASUS K8V Deluxe работала в режиме Performance Mode = Standard.

Разумеется, возможности оверклокинга нами при таких испытаниях не использовались и все компоненты работали на своих стандартных (дефолтных) частотах. Исключение систавляло напряжение питания памяти — оно было повышено до 2,8 вольт с целью повышения стабильности работы памяти при минимальных значениях таймингов.

В качестве базовой системной памяти для испытаний производительности различных конфигураций использовалась 512-мегабайтные и 256-мегабайтные пары модулей PC3500/PC3200 серии Platinum LE от компании OCZ (за них мы благодарим компанию «Патриарх»). Они без проблем работали не только по 2-2-2-5 на частоте 400 МГц, но даже позволяли дополнительно "издеваться" настройками. Разумеется, с другими, более дешевыми модулями памяти стабильная работа процессоров AMD Athlon 64 в некоторых жестких из использованных с этой статье режимов отнюдь не гарантирована. Во всех тестах, кроме тестов на порядок установки и объем модулей, мы использовали пару модулей объемом по 512 Мбайт каждый. При этом системы не испытывали проблем со стабильностью работы. Подчеркнем еще раз, что у нынешних Athlon 64 (не FX) всего один канал работы с памятью, поэтому вопросы, связанные с двухканальным использованием памяти на AMD64, мы отложим до другого раза. Все конфигурации памяти в этой статье принципиально одноканальные!

Среди других компонентов тестовой системы — видеоускоритель GeForce FX 5900 Ultra (референс NVIDIA) с драйверами версии 52.16 и винчестер Samsung SP1614N (буфер 8 Мбайт и 80-гигабайтные пластины).

Результаты наиболее наглядных тестов скорости памяти и общей производительности платформ в различных приложениях приведены в соответствующих таблицах, в последней строчке которых дан суммарный рейтинг быстродействия плат, вычисленный как геометрическое среднее от результатов всех проведенных нами бенчмарков (кроме прямых тестов памяти) и приведенный к 100%. Этот рейтинг также проиллюстрирован на соответствующих диаграммах (желтым  цветом даны базовые конфигурации, красным — отличающиеся тем или иным параметром настройки/конфигурирования памяти).

Попутно отметим, что некоторые вопросы, связанные с настройкой таймингов памяти DDR400 и ниже для других платформ, мы уже не раз освещали, поэтому интересующимся рекомендуем обратиться к соответствующим статьям:

1. Платы на чипсетах Intel 875/865: исчерпывающий обзор. Часть 2. Как грамотно использовать два канала памяти
2. Тесты модулей DDR400 семи типов от разных производителей. Влияние настроек памяти в BIOS Setup на быстродействие чипсета nVIDIA nForce2.
3. VIA KT266A — ускоряем настройками BIOS

 

1. Влияние таймингов CAS Latency (tCL) и RAS Active Time (tRAS).

Сперва поговорим о двух наиболее популярных таймингах — CAS Latency (tCL) и RAS Active Time (tRAS).

CAS Latency (tCL) — этот, пожалуй, самый «известный» тайминг означает задержку сигнала выборки столбца (CAS): временная задержка (в тактах частоты шины) до начала чтения данных памятью после поступления команды чтения. Для памяти DDR SDRAM обычно используются три значения: 2, 2,5 и 3 (такта). Исторически считается, что 2 (такта) существенно увеличивают производительность системы (так было, например, во времена SDRAM PC133), однако оказалось, что в ряде двухканальных DDR-чипсетов (Intel 875/865 и Nvidia nForce2) это не совсем так — подробнее см. два первых линка выше этого заголовка.

Пункт меню настройки тайминга CAS Latency (tCL) для платы ASUS K8V.

Пункт меню настройки тайминга CAS Latency (tCL) для платы Gigabyte GA-K8VNXP.

RAS Active Time (tRAS) - задает время задержки для подзарядки строки памяти. Прежде значения этого тайминга были 5, 6, 7 или 8 тактов. Однако для Athlon 64 диапазон его изменения заметно расширился — см. фото ниже. Считается, что этот тайминг тоже способен заметно повлиять на скорость памяти, однако для современных систем это далеко не всегда так. Учитывая, что большинство модулей отлично работает с tRAS=6, 7 или 8 тактов, эти значения следует считать лучшим выбором, не злоупортебляя значением в 5 тактов. Более высокие значения tRAS, как правило, использовать смысла нет.

Пункт меню настройки тайминга RAS Active Time (tRAS) для платы ASUS.

Пункт меню настройки тайминга RAS Active Time (tRAS) для платы Gigabyte.

Посмотрим, как изменяются результаты тестов и усредненная производительность системы при изменении значений CAS Latency и tRAS (остальные настройки — по умолчанию, см. фото во введении).

Таблица 1. Зависимость быстродействия системы от настроек таймингов CAS Latency (tCL) и RAS Active Time (tRAS)

Системная плата

ASUS K8V Deluxe CL-2-2-5-(7-10-2-2)

Gigabyte GA-K8VNXP 2-2-2-6 & High Performance Defaults

Параметр, тест

CAS
Latency = 2.0

CAS
Latency = 2.5

CAS
Latency = 3.0

RAS to CAS
Delay = 6, CL = 2.0

tRAS=6
(Default)

tRAS=7

tRAS=8

AIDA32 3.88, Memory Read Speed, Мбайт/с

3110

3110

3110

3113

3103

3103

3102

AIDA32 3.88, Memory Write Speed, Мбайт/с

1352

1339

1335

1335

1377

1368

1370

Sandra 2004 Pro, Memory Bandwidth, Мбайт/с

3091

3085

3084

3086

3085

3085

3084

ScienceMark 2.0, Memory Bandwidth, Мбайт/с

3010

3005

3004

3004

2988

2989

2990

ScienceMark 2.0, Memory Latency, циклов CPU

89

98

99

89

90

89

89

CPU-Z 1.20a, Memory Latency, циклов CPU

90

99

100

90

90

90

90

ScienceMark 2.0, Primordia (Ar), с

26,8

26,66

26,9

26,07

26,67

26,74

26,64

MPEG2 to MPEG4 encoding (DivX 5.11), c

190

191

192

190

170

171

170

Архивирование WinRAR 3.30, с

151,33

153,41

155,13

151,45

152,92

152,95

153,1

3Dmark03 (b330), Graphic score

6135

6136

6117

6139

6131

6136

6142

3Dmark03 (b330), CPU score

873

857

854

867

907

908

908

Unreal Tournament 2003 Demo, dm-anubis, fps

136,08

134,83

133,49

136,01

135,64

135,72

135,73

Unreal Tournament 2003 Demo, dm-asbestos, fps

111,43

110,45

109,5

111,35

111,22

111,21

111,28

Vulpine GLMark 1.1p, 1024x768x32 bit, fps

169,9

169,5

169

169,7

169,9

170

169,8

Quake III Arena, demo Quaver, 1024x768x32 bit, fps

362

358,7

354,9

362,9

363,1

363,5

363,6

SPEC viewperf v7.1, drv-09, index

69,09

67,53

67,37

67,73

65,11

65,24

65,24

SPEC viewperf v7.1, dx-08, index

80,59

80,2

80,12

81,5

80,64

80,35

81,62

SPEC viewperf v7.1, light-06, index

16,04

15,99

15,95

16,06

16,1

16,06

16,04

SPEC viewperf v7.1, proe-02, index

16,12

15,88

15,85

15,89

15,58

15,61

15,63

Усредненная производительность, %

100,009

99,186

98,639

100

100

99,948

100,041

Очевидно, что в этот раз (в противопроложность чипсетам Intel 875/865 и Nvidia nForce2) параметр CAS Latency в случае одноканального использования памяти с Athlon 64 существенно влияет на производительность системы.

Усредненная производительность систем.

При переходе с tCL=3 на значения 2.5 или 2.0 (что требует качественных модулей памяти и материнской платы) среднее быстродействие системы повышается на 0,5 или почти 1,5% соответственно! Происходит это во многом благодаря заметному снижению общей латентности памяти и повышению скорости записи в память (см. таблицу). С другой стороны, тайминг tRAS оказался крайне маловлиятелен на быстродействие системы - прирост от перехода с 6 на 5 тактов практически незаметен, да и в ряду от 6 к 8 тактов флуктуации находятся в пределах погрешности измерений. Так что можно считать, что в данных системах величина этого тайминга на быстродействие не влияет, а оптимальным с точки зрения стабильности можно считать значения от 6 до 8 тактов.

Читать дальше >>>

2. Влияние таймингов RAS-to-CAS Delay (tRCD) и Row Precharge Time (tRP).

Эти два тайминга тоже входят в четверку базовых и, как правило, доступны для настроек в меню BIOS Setup большинства серьезных материнских плат. Более того, в современных двухканальных DDR-чипсетах именно эти два тайминга больше остальных влияют на общее быстродействие платформы.

RAS Precharge (tRP) - время подзаряда сигналом RAS. Определяет количество тактов задержки после установки сигнала RAS, необходимых для подзарядки ячейки динамической памяти перед началом цикла обновления. Уменьшение этого значения повышает быстродействие, но чрезмерное для конкретной памяти его снижение может привести к потере данных. Типичные значения: 2, 3 или 4 такта, однако для Athlon 64 они расширены до 7 тактов.  Как назло, не всякий модуль памяти DDR400 способен осилить tRP=2. Впрочем, большинство «нормальных» все же способно.

Пункт меню настройки тайминга Row Precharge Time (tRP) для платы Gigabyte GA-K8VNXP.

RAS to CAS Delay (tRCD) - задержка между сигналами RAS и CAS. Когда память находится в режиме регенерации, строки и столбцы адресуются раздельно. Этот параметр позволяет задать время перехода от сигнала RAS (row address strobe) к сигналу CAS (column address strobe). Естественно, чем меньше значение, тем выше скорость памяти. Типичные значения: 2, 3 или 4 такта, однако для Athlon 64 они расширены до 7 тактов.  Влияние на производительность двухканальных систем по нашим тестам - самое большое: почти 2% при переходе от 4 к 3 тактам и еще около 2%, если добиться tRCD=2. К сожалению, редкая птица осилит середину великой реки - на «двойке» могут работать лишь очень редкие модули DDR400 и выше.

Пункт меню настройки тайминга RAS-to-CAS Delay (tRCD) для платы Gigabyte GA-K8VNXP.

Посмотрим, как изменяются результаты тестов и усредненная производительность системы при изменении значений этих двух таймингов.

Таблица 2. Зависимость быстродействия системы от настроек таймингов RAS-to-CAS Delay (tRCD) и Row Precharge Time (tRP)

Системная плата

Gigabyte GA-K8VNXP @ 2-2-2-6 & High Performance Defaults (tRC=11, tRFC=15, tRWT=3, tWTR=2 tWR=3, tRRD=2)

Параметр, тест

tRCD=2,
tRP=2
(2-2-2-6)

tRP=3
(2-2-3-6)

tRP=4
(2-2-4-6)

tRCD=3
(2-3-2-6)

tRCD=4
(2-4-2-6)

tRP=3,
tRCD=3
(2-3-3-7)

tRP=4,
tRCD=4
(2-4-4-8)

AIDA32 3.88, Memory Read Speed, Мбайт/с

3103

3095

3093

3094

3085

3085

3077

AIDA32 3.88, Memory Write Speed, Мбайт/с

1377

1354

1338

1364

1336

1338

1301

Sandra 2004 Pro, Memory Bandwidth, Мбайт/с

3085

3080

3080

3078

3070

3075

3065

ScienceMark 2.0, Memory Bandwidth, Мбайт/с

2988

2986

2981

2983

2976

2981

2975

ScienceMark 2.0, Memory Latency, циклов CPU

90

90

92

92

94

93

97

CPU-Z 1.20a, Memory Latency, циклов CPU

90

91

93

93

95

94

98

ScienceMark 2.0, Primordia (Ar), с

26,67

26,73

26,82

26,74

26,88

26,87

26,996

MPEG2 to MPEG4 encoding (DivX 5.11), c

170

170

171

172

173

172

173

Архивирование WinRAR 3.30, с

152,92

153,41

153,56

156,4

160,45

156,76

161,22

3Dmark03 (b330), Graphic score

6131

6121

6129

6114

6110

6121

6108

3Dmark03 (b330), CPU score

907

908

904

901

890

899

887

Unreal Tournament 2003 Demo, dm-anubis, fps

135,64

135,34

134,86

133,71

131,36

133,16

130,61

Unreal Tournament 2003 Demo, dm-asbestos, fps

111,22

110,95

110,69

109,695

107,98

109,27

107,24

Vulpine GLMark 1.1p, 1024x768x32 bit, fps

169,9

169,5

169,8

168,7

168,3

169

165,4

Quake III Arena, demo Quaver, 1024x768x32 bit, fps

363,1

362,2

361,3

359,8

353,2

357,4

350,7

SPEC viewperf v7.1, drv-09, index

65,11

64,41

63,45

65,02

64,83

63,5

62,94

SPEC viewperf v7.1, dx-08, index

80,64

80,08

81,36

80,11

79,9

80,13

79,5

SPEC viewperf v7.1, light-06, index

16,1

16,02

15,99

15,98

15,86

15,95

15,8

SPEC viewperf v7.1, proe-02, index

15,58

15,6

15,55

15,58

15,54

15,56

15,44

Усредненная производительность, %

100

99,716

99,531

99,188

98,28

98,824

97,566

Видно, что для одноканальной памяти с Athlon 64 скорость системы улучшается всего на 0,5% при переходе с tRP=4 на tRP=2. Зато tRCD по-прежнему влияет весьма заметно - производительность падает на 0,8-0,9% при увеличении значения этого тайминга всего на один такт! При этом ухудшаются сразу все практические параметры памяти - скорость чтения, записи и латнетность.

Усредненная производительность систем.

В целом, если перейти от 2-2-2-6 к 2-3-3-7, скорость системы упадет примерно на 1,2%, если ваша память работает по 2-4-4-8, то вы теряете сразу 2,5% скорости, а если и tCL при этом неважнецкий, то, например, с 3-4-4-8 вы получите систему, работающую примерно на 4% (!) медленне, чем точно такая же, но с хорошими модулями памяти и грамотными базовами настройками.

Читать дальше >>>

3. Влияние таймингов tRC, tRFC, tRWT, tWTR, tWR и tRRD.

Теперь оценим влияние некоторых менее распространенных таймингов памяти. Они сами (и диапазоны их изменения в BIOS Setup платы Gigabyte) показаны на фото ниже.

Row cycle time (tRC):

Row refresh cycle time (tRFC):

Row to Row delay (tRRD):

Пункт меню настройки тайминга tRRD для платы Gigabyte GA-K8VNXP.

Read to Write delay (tRWT):

Пункт меню настройки тайминга Read to Write delay (tRWT) для платы Gigabyte GA-K8VNXP.

Write recovery time (tWR):

Пункт меню настройки тайминга Write recovery time (tWR) для платы Gigabyte GA-K8VNXP.

Write to Read delay (tWTR):

Пункт меню настройки тайминга Write to Read delay (tWTR) для платы Gigabyte GA-K8VNXP.

Посмотрим, как изменяются результаты тестов и усредненная производительность системы при изменении значений этих таймингов относительно базовых по умолчанию.

Таблица 3. Зависимость быстродействия системы от настроек некоторых второстепенных таймингов памяти

Системная плата

Gigabyte GA-K8VNXP @ 2-2-2-6 & High Performance Defaults (tRC=11, tRFC=15, tRWT=3, tWTR=2 tWR=3, tRRD=2)

Параметр, тест

Default

tWR=2
(not 3)

tWTR=1
(not 2)

tRWT=1
(not 3)

tRC=7
(not 11)

tRFC=10
(not 15)

tRRD=4
(not 2)

BEST (tRC=7
tRFC=10 tRWT=1
tWTR=1 tWR=2)

AIDA32 3.88, Memory Read Speed, Мбайт/с

3103

3103

3094

3102

3103

3118

3103

3121

AIDA32 3.88, Memory Write Speed, Мбайт/с

1377

1384

1375

1418

1373

1371

1371

1428

Sandra 2004 Pro, Memory Bandwidth, Мбайт/с

3085

3085

3085

3090

3085

3101

3083

3110

ScienceMark 2.0, Memory Bandwidth, Мбайт/с

2988

2992

2990

2991

2988

3014

2990

3018

ScienceMark 2.0, Memory Latency, циклов CPU

90

89

89

89

89

89

89

90

CPU-Z 1.20a, Memory Latency, циклов CPU

90

90

90

90

90

90

90

90

ScienceMark 2.0, Primordia (Ar), с

26,67

26,74

26,74

26,65

26,76

26,68

26,67

25,97

MPEG2 to MPEG4 encoding (DivX 5.11), c

170

170

170

170

170

171

171

169

Архивирование WinRAR 3.30, с

152,92

152,86

152,9

152,58

152,63

152,61

153,09

151,78

3Dmark03 (b330), Graphic score

6131

6138

6140

6138

6134

6135

6137

6152

3Dmark03 (b330), CPU score

907

907

907

916

909

906

907

922

Unreal Tournament 2003 Demo, dm-anubis, fps

135,64

135,62

135,8

135,75

135,75

135,69

135,61

136,25

Unreal Tournament 2003 Demo, dm-asbestos, fps

111,22

111,27

111,25

111,45

111,31

111,32

111,14

111,68

Vulpine GLMark 1.1p, 1024x768x32 bit, fps

169,9

169,9

169,9

169,8

169,9

170,1

169,9

170,3

Quake III Arena, demo Quaver, 1024x768x32 bit, fps

363,1

363,7

364,3

364,3

363,7

363,9

363,5

365,3

SPEC viewperf v7.1, drv-09, index

65,11

65,17

65,19

67,35

65,14

65,17

65,28

67,89

SPEC viewperf v7.1, dx-08, index

80,64

80,31

80,54

80,63

80,44

80,37

81,56

80,95

SPEC viewperf v7.1, light-06, index

16,1

16,08

16,06

16,12

16,04

16,06

16,06

16,14

SPEC viewperf v7.1, proe-02, index

15,58

15,64

15,64

15,94

15,63

15,65

15,6

15,99

Усредненная производительность, %

100

100,002

100,039

100,597

100,015

99,997

100,053

101,168

Усредненная производительность систем.

В общем и целом все эти тайминги не так уж "влиятельны" в плане быстродействия - большинство из них "дают" менее 0,1% прибавки скорости системы, однако некоторые наиболее заметные отметить все же можно. Прежде всего, это tRWT - его уменьшение с 3 до 1 такта (не каждый модуль памяти это позволит) прибавляет системе 0,6% скорости. Во-вторых, это tRC - он обеспечил 0,15%. Тем не менее, если все эти тайминги уменьшить вместе, как показано на нижней строчке диаграммы и в правом столбце таблицы, то суммарный выигрыш скорости может оказаться вполне приличным - почти 1,2%! Если при этом стабильность системы не страдает, почему бы не воспользоваться бесплатной прибавкой скорости? Вместе с оптимизациями, рассмотренными в двух предыдущих переграфах, мы получим уже более 5% средней прибавки производительонсти системы в чувствительных к скорости памяти приложениях!

Читать дальше >>>

4. Влияние Refresh-периода (tREF) системной памяти.

Влияение периода обновления (рефреша) информации в ячейках динамической памяти (tREF) мы вынесли на отдельную страницу, поскольку для настройки доступны многие значения.

Пункт меню настройки тайминга периода обновления содержимого памяти (tREF) для платы Gigabyte GA-K8VNXP.

Все из показанных выше значений мы, естественно, не тестировали, но для вывода тенденции достаточно попробовать лишь часть наиболее характерных из них.

Посмотрим, как изменяются результаты тестов и усредненная производительность системы при изменении значения tREF относительно базового уровня 2x3120.

Таблица 4. Зависимость быстродействия системы от периода обновления содержимого памяти (tREF)

Системная плата

Gigabyte GA-K8VNXP @ 2-2-2-6 & High Performance Defaults (tRC=11, tRFC=15, tRWT=3, tWTR=2 tWR=3, tRRD=2)

Параметр, тест

tREF= 2x3120
(Default)

tREF= 1x3120

tREF= 1x1552

tREF= 1x4672

tREF= 2x4672

tREF= 2x1552

tREF= 4x4672

tREF= 4x3120

tREF= 128

AIDA32 3.88, Memory Read Speed, Мбайт/с

3103

3144

3094

3149

3131

2991

3068

2996

1935

AIDA32 3.88, Memory Write Speed, Мбайт/с

1377

1371

1371

1368

1366

1361

1370

1361

910

Sandra 2004 Pro, Memory Bandwidth, Мбайт/с

3085

3120

3083

3128

3112

2982

3050

2983

1920

ScienceMark 2.0, Memory Bandwidth, Мбайт/с

2988

3034

2983

3038

3023

2887

2954

2889

1850

ScienceMark 2.0, Memory Latency, циклов CPU

90

89

89

89

89

90

89

89

91

CPU-Z 1.20a, Memory Latency, циклов CPU

90

90

90

90

90

90

90

90

92

ScienceMark 2.0, Primordia (Ar), с

26,67

25,92

26,71

26,72

26,79

26,75

26,75

26,76

26,72

MPEG2 to MPEG4 encoding (DivX 5.11), c

170

171

171

170

171

171

170,5

171

177

Архивирование WinRAR 3.30, с

152,92

152,86

152,96

152,75

152,78

153,42

153,24

153,37

160,02

3Dmark03 (b330), Graphic score

6131

6133

6138

6135

6135

6133

6134

6126

6072

3Dmark03 (b330), CPU score

907

908

906

907

909

902

906

904

797

Unreal Tournament 2003 Demo, dm-anubis, fps

135,64

135,71

135,59

135,79

135,7

135,23

135,44

135,49

131,49

Unreal Tournament 2003 Demo, dm-asbestos, fps

111,22

111,27

111,22

111,34

111,26

110,87

111,02

110,99

107,95

Vulpine GLMark 1.1p, 1024x768x32 bit, fps

169,9

170,1

169,9

170,1

170

169,8

169,8

169,9

165,4

Quake III Arena, demo Quaver, 1024x768x32 bit, fps

363,1

363,9

363,3

363,4

363,2

362,5

362,9

362,9

349,2

SPEC viewperf v7.1, drv-09, index

65,11

64,95

64,9

64,17

64,41

64,15

64,27

64,3

41,65

SPEC viewperf v7.1, dx-08, index

80,64

80,56

81,52

81,59

81,39

81,28

80,4

81,41

65,89

SPEC viewperf v7.1, light-06, index

16,1

16,06

16,04

16,04

16,04

16,06

16,06

16,02

14,33

SPEC viewperf v7.1, proe-02, index

15,58

15,68

15,63

15,68

15,63

15,49

15,58

15,49

12,15

Усредненная производительность, %

100

100,225

99,998

100,03

99,946

99,685

99,758

99,74

90,017

Усредненная производительность систем.

Во-первых, выбор 1x вместо 2х или 4х способен ускорить работу системы в приложениях - примерно на 0,25-0,5% соответственно. Во-вторых, значение 3120 является, по-видимому, наиболее оптимальным для этой конфигурации в плане быстродействия. Его увеличение и уменьшение приводит к небольшому падению скорости системы. Наконец, значение "интенсивного обновления" (tREF=128) замедляет систему почти на 10% и явно не рекомендуется в обычной работе. Таким образом, лучший выбор - это tREF=1x3120.

Читать дальше >>>

5. Влияние порядка установки и объема модулей памяти.

С таймингами мы в первом приближении разобрались. Теперь взглянем. какие конфигурации модулей обеспечивают нам наилучшее быстродействие системы. Обычно на платах для AMD Athlon 64 (Socket 754) расположено по 3 слота DIMM. Однако они поддерживают лишь 4-банковое заполнение в сумме, то есть во второй и третий слот мы можем поместить либо один двухсторонний модуль DDR400 (оставив ворой слот пустым), либо два односторонних модуля (можно разной емкости). Первый слот при этом может содержать любой модуль (односторонний или двухсторонний).

Слоты памяти на плате Gigabyte GA-K8VNXP.

На текущий момент Athlon 64 поддерживает до 2 Гбайт памяти в сумме и допустимо одновременное испольщзование всех 4 банков памяти DDR400 (два двухсторонних модуля), если при этом память достаточно качественная (с некачественной такая система может работать нестабильно).

Посмотрим, как изменяются результаты тестов и усредненная производительность системы при изменении конфигурации модулей памяти в слотах. Базовой, как и ранее, считаем вариант, когда два двухсторонних модуля DDR400 объемом по 512 Мбайт каждый установлены в первый и второй слоты DIMM. Тайминги работы памяти во всех случаях были строго одинаковы.

Таблица 5. Зависимость быстродействия системы от порядка установки и объема модулей памяти

Системная плата

Gigabyte GA-K8VNXP & DDR400 @ 2-2-2-6 & High Performance Defaults (tRC=11, tRFC=15, tRWT=3, tWTR=2 tWR=3, tRRD=2)

Параметр, тест

2x512 MB
(dimm1 & 2)

1x512 MB

2x512 MB
(dimm1 & 3)

2x256 MB

1x256 MB

512+256 MB

512+256 +256 MB

AIDA32 3.88, Memory Read Speed, Мбайт/с

3103

3139

3094

3144

3131

3131

3102

AIDA32 3.88, Memory Write Speed, Мбайт/с

1377

1320

1322

1322

1209

1366

1361

Sandra 2004 Pro, Memory Bandwidth, Мбайт/с

3085

3117

3082

3115

3120

3105

3085

ScienceMark 2.0, Memory Bandwidth, Мбайт/с

2988

3024

2988

3032

3024

3018

2989

ScienceMark 2.0, Memory Latency, циклов CPU

90

90

89

89

90

89

89

CPU-Z 1.20a, Memory Latency, циклов CPU

90

91

90

91

91

90

90

ScienceMark 2.0, Primordia (Ar), с

26,67

26,86

26,93

26,86

27,3

26,8

26,82

MPEG2 to MPEG4 encoding (DivX 5.11), c

170

169

170

170

171

171

169

Архивирование WinRAR 3.30, с

152,92

153,34

153,69

154,22

157,53

153,39

153,14

3Dmark03 (b330), Graphic score

6131

6131

6129

6125

6115

6137

6130

3Dmark03 (b330), CPU score

907

899

899

901

880

902

902

Unreal Tournament 2003 Demo, dm-anubis, fps

135,64

134,84

135,08

134,68

132,94

135,49

135,47

Unreal Tournament 2003 Demo, dm-asbestos, fps

111,22

110,49

110,81

110,41

109,53

110,98

111,04

Vulpine GLMark 1.1p, 1024x768x32 bit, fps

169,9

169,4

169,6

169,5

168,9

169,6

169,7

Quake III Arena, demo Quaver, 1024x768x32 bit, fps

363,1

361,5

361,1

361,1

357,5

362,5

362,3

SPEC viewperf v7.1, drv-09, index

65,11

64,93

64,07

65,35

64,57

65,35

65,07

SPEC viewperf v7.1, dx-08, index

80,64

80,18

80,12

80,05

80,7

80,31

80,24

SPEC viewperf v7.1, light-06, index

16,1

15,99

15,99

15,99

15,92

16,02

16,04

SPEC viewperf v7.1, proe-02, index

15,58

15,74

15,56

15,74

15,61

15,64

15,59

Усредненная производительность, %

100

99,71

99,465

99,649

98,735

99,796

99,833

Усредненная производительность систем.

Тесты показывают, что базовая конфигурация (два двухсторонних модуля DDR400 объемом по 512 Мбайт каждый установлены в первый и второй слоты DIMM) оказывается и наиболее быстродействующей - остаьлные проигрывают ей в той или иной мере. И если проигрыш в 1,2%единственного модуля объемом 256 Мбайт вполне объясним недостатком опреативки, похожие выводы можно применить и для некоторых тестов с суммарным объемом памяти 512 Мбайт, то для случая 768 или 1024 Мбайт памяти проседание связано лишь с не самым оптимальным использованием страниц памяти. Особенно настораживает случай, когда один модуль перенесен из слота 2 в слот 3 - система при этом потеряла сразу пол процента скорости!

Читать дальше >>>

6. Влияние частоты работы памяти (DDR400/333/266/200).

В заключение рассмотрим наиболее простой и очевидный вопрос - как снижается скорсоть системы, если вместо одноканальной DDR400 использовать одноканальную DDR333 или, чего хуже, DDR266/DDR200.

Пункт меню настройки частоты работы системной памяти для платы Gigabyte GA-K8VNXP.

Посмотрим, как при этом изменяются результаты тестов и усредненная производительность системы. Во всех случаях использовался 1 Гбайт памяти двумя модулями и одинаковые тайминги.

Таблица 6. Зависимость быстродействия системы от частоты работы системной памяти

Системная плата

Gigabyte GA-K8VNXP @ 2-2-2-6 & High Performance Defaults (tRC=11, tRFC=15, tRWT=3, tWTR=2 tWR=3, tRRD=2)

Параметр, тест

DDR400

DDR333

DDR266

DDR200

AIDA32 3.88, Memory Read Speed, Мбайт/с

3103

2575

2077

1569

AIDA32 3.88, Memory Write Speed, Мбайт/с

1377

1150

930

700

Sandra 2004 Pro, Memory Bandwidth, Мбайт/с

3085

2560

2066

1552

ScienceMark 2.0, Memory Bandwidth, Мбайт/с

2988

2493

2010

1512

ScienceMark 2.0, Memory Latency, циклов CPU

90

106

120

142

CPU-Z 1.20a, Memory Latency, циклов CPU

90

107

120

143

ScienceMark 2.0, Primordia (Ar), с

26,67

27,35

28,13

29,42

MPEG2 to MPEG4 encoding (DivX 5.11), c

170

175

185

200

Архивирование WinRAR 3.30, с

152,92

162,5

177,18

202,59

3Dmark03 (b330), Graphic score

6131

6089

6002

5829

3Dmark03 (b330), CPU score

907

846

765

653

Unreal Tournament 2003 Demo, dm-anubis, fps

135,64

129,78

121,18

109,08

Unreal Tournament 2003 Demo, dm-asbestos, fps

111,22

106,59

100,13

90,78

Vulpine GLMark 1.1p, 1024x768x32 bit, fps

169,9

164,9

156,2

144,2

Quake III Arena, demo Quaver, 1024x768x32 bit, fps

363,1

345,4

318,8

284,9

SPEC viewperf v7.1, drv-09, index

65,11

56,72

46,72

35,35

SPEC viewperf v7.1, dx-08, index

80,64

76

66,7

54,79

SPEC viewperf v7.1, light-06, index

16,1

15,35

14,06

11,74

SPEC viewperf v7.1, proe-02, index

15,58

14,34

12,41

10,01

Усредненная производительность, %

100

94,861

87,115

76,373

Усредненная производительность систем.

Что ж, результат легко прогнозируется - чем низкочастотнее память, тем медленнее система. Однако тут есть интересная особенность - усредненная производительность падает заметно медленнее, чем частота памяти, то есть система с одноканальной DDR200 на Athlon 64 потеряла всего 23% скорости из-за ВДВОЕ более медленной памяти, а система с DDR333 - лишь 5%, хотя частота памяти упала на 20%! То есть большая кэш-память Athlon 64 творит порой очень полезные вещи.

И тут уместно вспомнить, что те же 5%, которые мы теряем при смене DDR400 на DDR333, точно так же можно потерять (или выиграть), не меняя DDR400, а просто неоптимальным образом используя настройки и конфигурацию памяти (см. выше). А это уже заставляет задуматься и является определенным стимулом для совершенствования своего подхода к оптимизации системы. 

На этом седьмая часть нашего обзора плат для Athlon 64 закончилась, но скоро выйдут 8 и 9 части. Следите за сайтом.

© ООО "Компьютерра-Онлайн", 1997-2019
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.