AMD Athlon 64 и конкуренты в профессиональных задачах. Часть 1. Введение
АрхивПлатформаПроцессоры AMD Athlon 64 и Intel Pentium 4 EE — это отнюдь не только мощные игровые решения. Исследуем их быстродействие в професиональных приложениях.
См. остальные части нашего обзора:
Часть 2: Исследование быстродействия процессоров в AutoCAD 2002.
Часть 3: Детальное тестирование быстродействия в системе трехмерного моделирования 3ds max 5.0, оптимизированной для архитектуры Intel NetBurst и технологии Hyper-Threading.
Часть 4: Тестирование в Photoshop 7.0, Maya 4.5, Cinema 4D и других 3D-пакетах. Подводим итоги.
Если говорить откровенно, самым интересным и интригующим событием года 2003 на рынке процессоров для настольных персональных компьютеров стало появление в сентябре семейства AMD Athlon 64 и сопутствующих ему продуктов. Разумеется, мы не могли пройти мимо и уже неоднократно писали об этом (cм., например, www.terralab.ru/system/29365 и www.terralab.ru/system/29375). Но теперь пришло время подвести некоторые итоги и провести детальные испытания возможностей как самих Athlon 64 (в сравнении с предшественниками и конкурентами), так и чипсетов и системных плат для этих процессоров.
Тестового материала по этим вопросам у нас накопилось уже достаточно много, поэтому мы решили разбить его изложение на несколько тематических обзоров. В первом обзоре (этот выпуск из четырех частей) мы рассмотрим преимущественно сами процессоры как базис для построения той или иной высокопроизводительной настольной платформы или, если угодно, - рабочей станции начального уровня.
Не секрет, что дорогие новинки, каковыми, безусловно, сейчас являются системы на базе Athlon 64, на первых порах приобретаются не столько массовым покупателем, сколько профессионалами и не слишком многочисленными энтузиастами. А их в первую очередь интересует не столько скорость системы в бытовых, игровых и «потребительских» задачах (о которой мы, кстати, уже писали ранее), сколько производительность в профессиональных приложениях. Поэтому данный материал мы целиком посвятим детальному исследованию быстродействия новых процессоров именно в популярных профессиональных приложениях в лице пакетов Adobe Photoshop 7, Autodesk AutoCAD 2002, Discreet 3Dsmax 5, CINEMA 4D, Maya 4.5 и ряде других систем трехмерного моделирования, которые с неплохой степенью достоверности отражают типичную скорость выполнения процессорами задач этого класса в настоящее время.
Несколько позднее выйдет обзор по многочисленным системным платам и чипсетам для процессоров семейства AMD Athlon 64, их функциональной насыщенности и удобствам, так и с «бытовой» и игровой производительностью этих платформ. К тому времени, как мы надеемся, эти системы уже выйдут из ранга сугубо элитных и начнут приобретаться в массовом порядке для выполнения широкого спектра повседневных задач. К тому же, платы для новых процессоров AMD представлены на рынке пока недостаточно широко, часть весьма интересных новинок на момент написания этих строк (конец ноября 2003 года) еще даже не появилось, а без них подобный сводный обзор платформ был бы неполноценным.
Наконец, у нас в работе находится еще одна часть разностороннего обзора семейства Athlon 64, в которой мы планируем детально исследовать производительность этих настольных систем в новой 64-битной вычислительной среде. Как известно, одним из главных козырей, которые корпорация AMD заложила в продукты с архитектурой AMD64, является именно возможность (впервые в истории компьютерной индустрии для x86-совместимых процессоров) использования 64-битных вычислений в настольных компьютерах. Ранее процессоры с 64-разрядной архитектурой (например, семейства Intel Itanium и др.) использовались лишь в мощных серверах, высокопроизводительных рабочих станциях стоимостью от десяти тысяч долларов и суперкомпьютерах (исключение - выпущенный в начале лета IBM PowerPC G5 для настольных компьютеров). Но с выходом AMD Athlon 64 появилась принципиальная возможность использовать 64-битные вычисления и в недорогих ПК — причем не только в профессиональных дизайнерских пакетах типа продуктов тех же Adobe, Autodesk и Discreet, но и в сугубо потребительском сегменте — офисных приложениях, играх, мультимедиа и пр.
Схема кристалла Athlon 64. |
Другой вопрос, насколько в последнем случае это нужно потребителю. Если с профессиональными задачами все более или менее понятно — чем быстрее считается/обрабатывается сложная задача, тем выше продуктивность работы и, в конечном счете, прибыли компании (а некоторые задачи серверного характера теперь даже практически невыполнимы без использования 64-битной вычислительной среды), — то зачем нужны 64-битные вычисления для нынешних офисных или мультимедиа-приложений и игр, где пока вполне хватает 32-бит, не совсем ясно. Впрочем, если переход на «64 бита» обычному пользователю ПК обойдется сравнительно недорого (при этом надо учитывать не только стоимость самого «железа» с Athlon 64, но и новую 64-битную операционную систему с драйверами для всего оборудования и массу новых приложений, специально разработанных для такой среды), то почему бы этой «дешевой» прибавкой производительности не воспользоваться?
Ближайшие «процессорные» планы корпорации AMD. |
С другой стороны, всерьез обсуждать целесообразность массового перевода настольных ПК на 64-битные вычисления явно преждевременно. Разработчики программного обеспечения не так давно начали осваивать новые (или портировать прежние) 64-битные продукты, а те крайне малочисленные программы (Linux 64, например), которые уже готовы для использования «всех 64 бит» на Athlon 64, погоды явно не делают и годятся лишь на то, чтобы «прикинуть крутизну подхода».
Именно поэтому корпорация AMD оставила процессорам Athlon 64 возможность полноценно работать со всеми текущими 16- и 32-битными операционными системами и приложениями (полная x86-совместимость) и, более того, даже обеспечила при этом прирост производительности на традиционных 32-битных задачах 20-30% по сравнению с предшественниками — AMD Athlon XP — на той же тактовой частоте ядра лишь за счет усовершенствования архитектуры. Именно с этой точки зрения нас сейчас и интересуют Athlon 64.
Предвидя возражения поклонников AMD, отмечу также, что наша тестовая лаборатория исповедует принцип тестирования оборудования на финальных (еще лучше — сертифицированных всеми заинтересованными сторонами) релизах операционных систем, драйверов и приложений. По нашему мнению, применение сырых бета-версий (особенно — операционных систем и драйверов) может ввести читателя в заблуждение относительно истинных качеств того или иного оборудования и практикуется нами редко и со специальными оговорками. Поэтому мы и не спешим, в отличие от некоторых сетевых изданий, делать выводы о «мощи» Athlon 64 на примере единичных и достаточно экзотических 64-битных приложений. Давайте дождемся более или менее законченных и многочисленных программ и, прежде всего, новой Windows, тогда и посчитаем цыплят. Не исключено, что к тому времени ситуация с процессорным «железом» заметно изменится и эйфория от пресловутых «64 бит» у новых Athlon пройдет.
Прежде чем перейти к исследованию производительности современных настольных процессоров в профессиональных приложениях, кратко напомним основные архитектурные особенности и характеристики процессоров семейства AMD Athlon 64 по сравнению с AMD Athlon XP и Intel Pentium 4.
AMD Athlon 64
Вычислительное ядро и кристалл (на фото внизу) процессоров с архитектурой AMD64 немногим отличается от ядра прежних Athlon XP (этого не отрицает и сама AMD).
Взяв за основу весьма удачные разработки 0,13-микронного ядра Thoroughbred, корпорация внесла в него несколько изменений, которые в совокупности позволили существенно улучшить быстродействие и повысить надежность процессора. Вот основные отличия новой архитектуры AMD64 и конструкции процессоров Athlon 64:
– введена 64-битная адресация памяти (приложению теперь может быть выделено более 2 Гбайт памяти; уже используется 48-битная виртуальная адресация и 40-битная физическая адресация);
– введен набор дополнительных инструкций x86-64; сохранена полная совместимость с прежними 32-битными приложениями;
– регистры общего назначения стали 64-разрядными, и их число увеличено вдвое (с 8 до 16);
– также вдвое (с 8 до 16) увеличено число 128-разрядных регистров для вычислений с плавающей запятой (блок SSE/SSE2);
– увеличено число ступеней вычислительных конвейеров: с 10 до 12 для целочисленных вычислений и с 15 до 17 для вычислений с плавающей запятой (ускоряется выполнение ряда команд и улучшается масштабируемость ядра по частоте);
– улучшена система предсказания переходов и в четыре раза увеличена ее таблица;
– введена поддержка интеловских инструкций SSE2 (теперь даже AMD в своих документах рекомендует разработчикам приложений использовать SSE2 вместо 3DNow!);
– вдвое (до 128 бит) увеличена ширина шины кэш-памяти второго уровня L2;
– объем кэш-памяти L2 увеличен до 1 Мбайт, при этом сохранена ее эксклюзивность;
– вдвое (с 256 до 512 «входов») увеличился размер TLB кэш-памяти L2, больше стал и TLB кэш-памяти инструкций L1 (40 «входов» вместо 24);
– в кристалл процессора встроен контроллер памяти с поддержкой DDR вплоть до частоты 400 МГц, поддерживается также ECC-память;
– контроллер памяти имеет два независимых канала (в процессорах с разъемом Socket 754 один из каналов отключен);
– для связи процессора с чипсетом используется высокоскоростная шина HyperTransport (аналог системной шины прежних процессоров) 16x16 бит с суммарной полосой пропускания до 6,4 Гбайт/с (по 3,2 Гбайт/с в каждую сторону);
– наряду с диодным термодатчиком на кристалле процессора теперь присутствует электронная схема для защиты от перегрева (выключает CPU при превышении порога температуры);
– кристалл процессора защищен металлической теплорассеивающей крышкой (хитспредером; она отсутствует только у мобильных Athlon 64).
Ключевыми нововведениями, позволяющими улучшить производительность новых процессоров AMD на традиционных 32-разрядных приложениях, являются вдвое увеличенный объем кэш-памяти L2, возросшая скорость работы с ней (благодаря более широкой шине), а также интегрированный в кристалл процессора контроллер DDR-памяти. Причем во всех этих трех случаях имеет значение как полоса пропускания, так и латентность работы.
На данный момент в арсенале AMD есть следующие процессоры серии Athlon 64:
– Athlon 64 FX-51 с тактовой частотой 2200 МГц для разъема Socket 940 с двухканальным контроллером регистровой памяти DDR400 (аналог AMD Opteron без многопроцессорной работы);
– Athlon 64 3200+ с тактовой частотой 2000 МГц для разъема Socket 754 с одноканальным контроллером памяти DDR400;
– две версии мобильных Athlon 64 — модели 3200+ и 3000+ с частотами 2000 и 1800 МГц соответственно, которые предназначены для применения в ноутбуках класса «замена десктопа».
По неофициальной информации, вскоре ожидается появление Athlon 64 3400+ для разъема Socket 754 (одноканальный контроллер памяти) с частотой 2200 МГц, а чуть позже (возможно) — и Athlon 64 FX-53 с тактовой частотой 2400 МГц для разъема Socket 940. Все эти процессоры используют одно и то же ядро ClawHammer. Их основные характеристики в сравнении с AMD Athlon XP 3200+ и конкурентами от Intel приведены в табл. 1.
По сведениям из заслуживающих доверия источников, в первой половине 2004 года должны также появиться процессоры для Socket 939 с поддержкой обычной (нерегистровой) двухканальной DDR400 и недорогие процессоры на 0,13-микронном ядре Newcastle для Socket 754 с уменьшенным вдвое (до 512 Кбайт) объемом кэш-памяти L2. Ну а ближе к концу 2004 года мы должны увидеть серию процессоров на 90-нанометровом ядре San Diego (и его клонах Winchester и Odessa, см. также роадмэп AMD на предыдущей странице).
Таблица 1. Характеристики старших моделей процессоров AMD Athlon 64, Athlon XP и Intel Pentium 4 | |||||||
Процессор |
Athlon 64 |
Athlon 64 3400+ |
Athlon 64 3200+ |
Athlon XP 3200+ |
Pentium 4 Extreme Edition 3,2 ГГц |
Pentium 4 |
Pentium 4 |
Ядро |
ClawHammer |
ClawHammer |
ClawHammer |
Barton |
Gallatin (?) |
Northwood |
Northwood |
Технология производства |
0,13 мкм |
0,13 мкм |
0,13 мкм |
0,13 мкм |
0,13 мкм |
0,13 мкм |
0,13 мкм |
Площадь кристалла, кв. мм |
193 |
193 |
193 |
101 |
230 |
131 |
131 |
Количество транзисторов, млн. штук |
105,9 |
105,9 |
105,9 |
54,3 |
169 |
55 |
55 |
Разъем |
Socket 940 |
Socket 754 |
Socket 754 |
Socket 462 |
Socket 478 |
Socket 478 |
Socket 478 |
Частота ядра, МГц |
2200 |
2200 |
2000 |
2200 |
3200 |
3200 |
3067 |
Кэш-память L1, Кбайт |
128 (64+64) |
128 (64+64) |
128 (64+64) |
128 (64+64) |
20 (8+12) |
20 (8+12) |
20 (8+12) |
Кэш-память L2 |
1 Мбайт |
1 Мбайт |
1 Мбайт |
512 Кбайт |
512 Кбайт + 2 Мбайт L3 |
512 Кбайт |
512 Кбайт |
Наборы SIMD-инструкций |
SSE2, SSE и 3DNow! |
SSE и 3DNow! |
SSE2, SSE |
SSE2, SSE |
SSE2, SSE | ||
Количество ступеней конвейеров (ALU/FPU) |
12/17 |
12/17 |
12/17 |
12/17 |
20 |
20 |
20 |
Многопоточность вычислений |
нет |
нет |
нет |
нет |
Hyper-Threading |
Hyper-Threading |
Hyper-Threading |
Системная шина, Мбайт/с |
HyperTransport, 6400 |
EV6, 3200 |
QuadPumped Bus, 6400 |
QuadPumped Bus, 6400 |
QuadPumped Bus, 4267 | ||
Скорость работы системы с памятью, Мбайт/с |
6400 |
3200 |
3200 |
6400 |
6400 |
6400 |
до 6400 (SiS655) |
Встроенный контроллер памяти |
двухканальный |
одноканальный |
нет |
нет |
нет |
нет | |
Поддержка памяти через чипсеты |
– |
– |
– |
двухканальная |
двухканальная DDR400/ | ||
Поддержка памяти ECC |
да |
да |
да |
нет |
да |
да |
да |
Напряжение питания, В |
1,5 |
1,5 |
1,5 |
1,65 |
1,55 |
1,55 |
1,55 |
Максимальная рассеиваемая мощность, Вт |
89 (TDP) |
89? (TDP) |
89 (TDP) |
76,8 (TDP) |
93,9 (TDP) |
82,0 (TDP) |
81,6 (TDP) |
Intel Pentium 4 Extreme Edition
Как мы уже писали (см. «КТ» #512 и www.terralab.ru/system/29365), в ответ на Athlon 64 корпорация Intel оперативно придумала свой высокопроизводительный «геймерский» процессор Pentium 4 Extreme Edition с частотой 3,2 ГГц (P 4 EE) и огромной по «настольным» меркам кэш-памятью: к обычным «нортвудовским» 512 килобайтам кэша L2 добавили еще 2 Мбайт кэш-памяти третьего уровня (L3), также работающей на частоте ядра (3,2 ГГц), но с чуть меньшей скоростью. Но поскольку кэш-память у Pentium 4 инклюзивная, ее суммарный объем при кэшировании данных из системной памяти будет не 2,5 Мбайт, а «всего» 2 Мбайт. Тогда как кэш-память L2 в этом случае будет с большей скоростью кэшировать данные из L3, а не из системной памяти. Ядро P 4 EE берет начало от серверного 0,13-микронного Gallatin (процессоры Xeon MP) с адаптацией для более быстрой системной шины 800 МГц. Огромный по размерам (см. табл. 1) кристалл процессора P 4 EE 3,2 ГГц расположен в таком же, как и Northwood, корпусе для разъема Socket 478 и может работать со всеми современными материнскими платами на двухканальных чипсетах Intel 875/865 — порой даже без обновления BIOS.
В момент официального выхода на процессор Pentium 4 EE 3,2 ГГц была назначена заоблачная по «настольным» меркам цена — более 900 долларов США! Мало того, в розничной продаже эти процессоры до конца 2003 года, по-видимому, так и не появятся — их небольшие запасы разойдутся по производителям ПК, уже анонсировавшим системы на этом процессоре. Нашелся даже производитель — калифорнийская компания Liebermann (см. www.go-l.com/news/press_releases), которая объявила о выпуске ноутбуков (!) на базе P 4 EE 3,2 ГГц. Эти «монстры» имеют экраны с диагональю 15, 16 и 17 (широкоформатный) дюймов, оснащены двухканальной памятью DDR433 (интересно, на каком чипсете?), видеокартой ATI Radeon 9600 Pro и мобильным винчестером со скоростью вращения 7200 об./мин. и интерфейсом UltraATA/133 (последнее — вообще загадка, поскольку ни у Maxtor, ни у Samsung мобильных дисков до сих пор не наблюдалось, а этот интерфейс больше никто из «дискостроителей» пока не использует, включая новенький Hitachi 7K60).
Плата ASUS K8V Deluxe для Athlon 64. |
Можно долго иронизировать по поводу высокой цены и малой доступности Pentium 4 Extreme Edition 3,2 ГГц, однако с его прямыми конкурентами AMD Athlon 64 FX-51 ситуация, на самом деле, очень похожая: при объявленной в момент анонса оптовой цене 733 доллара, реальная цена в тех немногих магазинах, где они есть, доходит до 850 долларов, что не намного ниже, чем у Extreme Edition. Между тем, если последний прекрасно работает на самых обычных платах на чипсетах Intel 875P и даже дешевых (но не менее шустрых при использовании режима «квази-PAT») 865PE с обычной DDR400, то Athlon 64 FX требует себе почти «серверную» плату с разъемом Socket 940 и, что куда хуже, более дорогие регистровые модули DDR400 (уже не говоря об их большей латентности/таймингах), которых пока днем с огнем не найдешь. Так что привлекательность обеих платформ для пользователя в плане цены и доступности примерно одинакова. Не стоит забывать и о других конкурирующих решениях - более доступных по цене и наличию в магазинах, но не сильно проигрывающих двум первым в производительности. Это традиционный Pentium 4 3,2 ГГц и новый Athlon 64 3200+. Для рабочих станций начального уровня подойдут даже прежние Pentium 4 3,06 ГГц или Athlon XP 3200+, которые тоже участвуют в наших сегодняшних испытаниях и на фоне новичков смотрятся не так уж плохо.
Платформы
Поскольку и AMD Athlon 64 FX-51, и Intel Pentium 4 EE 3,2 ГГц берут начало именно от «серверных» процессоров AMD Opteron и Intel Xeon MP, то логично предположить, что именно на них профессиональные приложения будут «летать». Сразу оговоримся, что двух- и четырехпроцессорные системы на AMD Opteron и Intel Xeon мы пока оставим в стороне, а рассмотрим только однопроцессорные системы из категорий «высокопроизводительные настольные ПК» или «рабочие станции начального уровня». Вместе с тем, поскольку однопроцессорные системы на базе AMD Opteron и Intel Xeon — это фактически полные аналоги (при условии равенства частот ядра, системной шины и памяти) соответствующих настольных ПК на базе AMD Athlon 64 FX и Intel Pentium 4 (или Extreme Edition), некая параллель с простыми системами на Opteron и Xeon явно будет прослеживаться.
Таблица 2. Конфигурации и возможности испытанных платформ | ||||||
Процессор |
Athlon 64 |
Athlon 64 |
Athlon 64 |
Athlon XP |
Pentium 4 3,2 ГГц и Extreme Edition 3,2 ГГц |
Pentium 4 |
Системная плата |
ASUS SK8N |
ASUS SK8N |
ASUS K8V Deluxe |
EPoX 8RDA3+ |
Intel D875PBZ |
Intel D875PBZ |
Чипсет |
NVIDIA nForce3 Pro 150 |
NVIDIA nForce3 Pro 150 |
VIA K8T800 |
NVIDIA nForce2 Ultra 400 |
Intel 875P |
Intel 875P |
Системная шина, МГц |
– |
– |
– |
400 |
800 |
533 |
Точное значение тактовой частоты шины, МГц |
200,0 |
200,0 |
201,4 |
200,5 |
200,0 |
133,3 |
Шина памяти (данных), МГц |
2x400 |
1x400 |
1x400 |
2x400 |
2x400 |
2x333 |
Полоса пропускания «процессор-память», Мбайт/с |
6400 |
3200 |
3200 |
3200 |
6400 |
4267 |
LAN |
1000 Мбит/с PCI |
1000 Мбит/с PCI |
1000 Мбит/с PCI |
2x100 Мбит/с PCI |
1 Гбит/с CSA |
1 Гбит/с CSA |
Порты UltraATA |
2xUATA/133 |
2xUATA/133 |
2xUATA/133 |
2xUATA/133 |
2xUATA/100 |
2xUATA/100 |
Порты SerialATA |
2 на SiI3112, PCI |
2 на SiI3112, PCI |
2 на VIA VT8237 |
2 на SiI3112, PCI |
2 на ICH5R |
2 на ICH5R |
Порты FireWire |
3 |
3 |
3 |
2 |
нет |
нет |
Четкой границы между понятиями «высокопроизводительный ПК» и «рабочая станция, по-видимому, не существует. Если под высокопроизводительными рабочими станциями понимают все-таки более мощные специфические двух- и даже многопроцессорные машины на Intel Xeon, Intel Itanium и AMD Opteron и пр., использующие видеоускорители профессионального (а не бытового/игрового) класса и дисковые массивы SCSI RAID, то рабочие станции послабее вполне могут иметь один процессор Pentium 4 или Athlon 64, «десктопную» материнскую плату с памятью DDR SDRAM даже без ECC и один из старших бытовых видеоускорителей, а в качестве накопителя — либо массив ATA RAID, либо и вовсе быстрый ATA-винчестер. Часто высокопроизводительный ПК приобретается для выполнения несложных профессиональных задач, поскольку сравнимая с ним по мощности специализированная рабочая станция стоит в несколько раз дороже. Вместе с тем о производительности ПК в таких приложениях, как AutoCAD, 3D Studio Max или Photoshop, вряд ли можно объективно судить по популярным «бытовым» и игровым тестам. В данном обзоре мы рассмотрим скорость работы систем в следующих профессиональных приложениях:
– Adobe Photoshop 7.0;
– Autodesk AutoCAD 2002;
– Disсreet 3D Studio Max 5.0;
– Alias|Wavefront Maya 4.5;
– Maxon Cinema 4D;
– пакеты трехмерного инженерного проектирования Pro/ENGINEER и др.
Для экспериментов выбраны следующие характерные конфигурации платформ (описание плат см. на www.terralab.ru/system/30337, .../29365 и .../25249):
– AMD Athlon 64 FX-51 на плате ASUS SK8N (чипсет NVIDIA nForce3 Pro 150) с двухканальной регистровой памятью DDR400;
– AMD Athlon 64 «3400+» на плате ASUS SK8N (чипсет NVIDIA nForce3 Pro 150) с одноканальной регистровой памятью DDR400;
– AMD Athlon 64 3200+ на плате ASUS K8V Deluxe (чипсет VIA K8T800) с одноканальной памятью DDR400;
– AMD Athlon XP 3200+ на плате EPoX 8RDA3+ (чипсет NVIDIA nForce2 Ultra 400) с двухканальной памятью DDR400;
– Intel Pentium 4 Extreme Edition 3,2 ГГц на плате Intel D875PBZ (чипсет Intel 875P) с двухканальной памятью DDR400;
– Intel Pentium 4 3,2 ГГц на плате Intel D875PBZ (чипсет Intel 875P) с двухканальной памятью DDR400;
– Intel Pentium 4 3,06 ГГц на плате Intel D875PBZ (чипсет Intel 875P) с двухканальной памятью DDR333.
Тут нужно сделать два пояснения.
Во-первых, на момент написания этих строк процессора AMD Athlon 64 3400+ не было и в помине, поэтому для его имитации мы воспользовались процессором Athlon 64 FX-51 (с той же тактовой частотой 2,2 ГГц), задействовав один канал памяти вместо двух. С одной стороны, такая имитация не полностью адекватна будущему истинному Athlon 64 3400+, поскольку использует более медленную регистровую память, работающую с чуть худшими таймингами, чем обычная небуферизованная DDR400 в остальных пяти системах. Но с другой стороны, именно при таком подходе мы сможем понять в чистом виде (на одной и той же плате, с одинаковой памятью), что теряем, используя один канал памяти вместо двух.
Во-вторых, систему на Pentium 4 3,06 ГГц мы тоже включили сюда не случайно. Ровно год назад она стала победительницей в нашем обзоре рабочих станций начального уровня (см. «КТ» #475). Правда, тогда этот процессор «обитал» на других чипсетах и памяти: Intel 850E с RDRAM PC1066 и Intel E7205 с двухканальной DDR266. Сейчас же мы «пересадили» его на современную конфигурацию — чипсет Intel 875P (в данном случае используется системная шина 533 МГц, а не 800 МГц) с двухканальной памятью DDR333 — которая, судя по нашим тестам, даже слегка опережает обе прежние связки.
Память DDR400/333 (OCZ Platinum PC3500, два 16-чиповых модуля по 512 Мбайт каждый) работала по таймингам 2-2-3-5 (tRCD=3) во всех системах, кроме платы ASUS SK8N, где аналогичные по объему и организации регистровые модули PC3200 от Infineon были способны в лучшем случае на 2,5-2-3-5. В остальном конфигурации систем были идентичны: видеоускоритель GeForce FX 5900 Ultra (256 Мбайт памяти) с драйверами Detonator 44.03 или 52.16 (в зависимости от приложения), винчестер Samsung SP1614N, блок питания мощностью 400 Вт. В данном случае использовать более скоростную дисковую подсистему не было необходимости, поскольку в процессе испытаний «дискозависимость» была минимальна — в отобранных нами тестах вполне хватало 1 Гбайт оперативной памяти, хотя в реальности для ряда задач может потребоваться и больше. Все тесты проводились под управлением операционной системы Microsoft Windows XP Professional SP1. Для чипсета Intel использовалась Intel Chipset Software Installation Utility версии 5.02.1003, для чипсета NVIDIA nForce3 — набор драйверов версии 3.0 (WHQL), а для чипсета VIA — драйвер 4-in-1 версий 4.49 и 4.51. Между блоками тестов компьютер перезагружался, а для каждого паттерна в пакетах моделирования приложение запускалось снова (чтобы очистить память и свопы самого приложения). Тесты неоднократно повторялись, и результаты усреднялись.
Но прежде чем перейти к результатам тестов, взглянем на производительность систем при работе с памятью (см. диаграммы ниже). Именно здесь во многом кроются разгадки тех результатов, которые мы увидим позднее.
Скорость работы платформ |
Быстрее всего с памятью работает система на Athlon 64 FX-51. Это вполне закономерно, поскольку она оснащена интегрированным в процессор двухканальным контроллером памяти DDR400. За ней идут интеловские системы на шине 800 МГц, причем Extreme Edition порой отстает от обычного Pentium 4. Далее следует Pentium 4 с системной шиной 533 МГц, и замыкают список два Athlon 64 с одним каналом памяти и Athlon XP 3200+ с двумя каналами, но медленной системной шиной, равной по скорости одному каналу DDR400. В общем, ничего неожиданного — все платформы выстроились в соответствии со своими теоретическими возможностями. Интересно, что самая высокая эффективность использования потенциальных возможностей полосы пропускания двухканальной памяти DDR400 — у Athlon 64 FX (около 87%), тогда как Pentium 4 за счет «чипсетного» контроллера памяти утилизирует лишь 76% от возможной полосы (и 82% для FSB 533 МГц). Другое дело — одноканальные системы. Тут и Athlon 64, и Athlon XP «выбирают» почти всю доступную ширину полосы. Подтверждают это и тесты скорости чтения памяти в AIDA32. Однако по скорости записи в память картина существенно меняется: вперед с солидным отрывом вырвался Extreme Edition, имеющий огромный L3 (заметим — вырвался именно за счет эффективного кэширования).
По латентности работы с памятью тоже с большим отрывом лидирует Athlon 64 благодаря встроенному контроллеру. Латентность около 50 нс — уникально низкое для настольных систем значение, причем оно наблюдается как для двухканальной, так и для одноканальной работы с памятью (регистровая память при этом имеет процентов на 10 более высокую латентность, чем обычная). Справедливости ради отметим, что использованная здесь «классическая» плата на i875P для Pentium 4 — не самая продвинутая в плане латентности. На некоторых других современных платах (особенно в режимах ускорения чипсета) наблюдалась латентность в районе 65 нс для Pentium 4 с двухканальной DDR400, что приближается к значениям для Athlon 64 и намного опережает синхронный режим для Athlon XP 3200+ на nForce2.
Продолжение читайте во второй части обзора.
Предлагаем обсудить этот материал в нашем форуме