Профцессоры
АрхивНа мой взгляд, самым интересным и интригующим событием года 2003 на рынке процессоров для настольных персональных компьютеров стало появление в сентябре семейства AMD Athlon 64 и сопутствующих ему продуктов.
На мой взгляд, самым интересным и интригующим событием года 2003 на рынке процессоров для настольных персональных компьютеров стало появление в сентябре семейства AMD Athlon 64 и сопутствующих ему продуктов. Разумеется, мы не могли пройти мимо и уже неоднократно писали об этом на страницах «КТ».
Пришло время подвести некоторые итоги и провести детальные испытания возможностей как самих Athlon 64 (в сравнении с предшественниками и конкурентами), так и чипсетов и системных плат для этих процессоров.
Дорогие новинки, каковыми сейчас являются системы на базе Athlon 64, поначалу приобретаются не столько массовым покупателем, сколько профессионалами и не слишком многочисленными энтузиастами. А их в первую очередь интересует не столько скорость системы в бытовых, игровых и «потребительских» задачах, сколько производительность в профессиональных приложениях. Сегодняшнюю «КомпьюФерру» мы посвятим исследованию быстродействия новых процессоров именно в популярных профессиональных приложениях в лице пакетов Adobe Photoshop 7, Autodesk AutoCAD 2002, Discreet 3ds max 5.0, Cinema 4D, Maya 4.5 и ряде других систем трехмерного моделирования, которые достоверно отражают типичную скорость выполнения процессорами задач этого класса.
А в одном из следующих выпусков журнала речь пойдет о системных платах и чипсетах для Athlon 64. К тому времени Athlon 64 уже выйдут из ранга сугубо элитных платформ и должны появиться весьма интересные новинки, которые на момент написания этих строк (конец ноября 2003 года) еще только планировались, а без них такой обзор бым бы неполноценным.
Как известно, одним из главных козырей, которые корпорация AMD заложила в продукты с архитектурой AMD64, является именно возможность (впервые в истории компьютерной индустрии для x86-совместимых процессоров) использования 64-битных вычислений в настольных компьютерах. Ранее процессоры с 64-разрядной архитектурой (например, семейства Intel Itanium и др.) использовались лишь в мощных серверах, высокопроизводительных рабочих станциях стоимостью от десяти тысяч долларов и суперкомпьютерах (исключение — выпущенный в начале лета IBM PowerPC G5 для настольных компьютеров). Но с выходом AMD Athlon 64 появилась принципиальная возможность использовать 64-битные вычисления и в недорогих ПК — причем не только в профессиональных дизайнерских пакетах типа продуктов тех же Adobe, Autodesk и Discreet, но и в сугубо потребительском сегменте — офисных приложениях, играх, мультимедиа и пр.
Другой вопрос, насколько в последнем случае это нужно потребителю. Если с профессиональными задачами все более или менее понятно — чем быстрее считается/обрабатывается сложная задача, тем выше продуктивность работы и, в конечном счете, прибыли компании (а некоторые задачи серверного характера теперь даже практически невыполнимы без использования 64-битной вычислительной среды), — то зачем нужны 64-битные вычисления для нынешних офисных или мультимедиа-приложений и игр, где пока вполне хватает 32-бит, не совсем ясно. Впрочем, если переход на «64 бита» обычному пользователю ПК обойдется сравнительно недорого (при этом надо учитывать не только стоимость самого «железа» с Athlon 64, но и новую 64-битную операционную систему с драйверами для всего оборудования и массу новых приложений, специально разработанных для такой среды), то почему бы этой «дешевой» прибавкой производительности не воспользоваться?
С другой стороны, всерьез обсуждать целесообразность массового перевода настольных ПК на 64-битные вычисления явно преждевременно. Разработчики программного обеспечения не так давно начали осваивать новые (или портировать прежние) 64-битные продукты, а те крайне малочисленные программы (Linux 64, например), которые уже готовы для использования «всех 64 бит» на Athlon 64, погоды явно не делают и годятся лишь на то, чтобы «прикинуть крутизну подхода».
Именно поэтому корпорация AMD оставила процессорам Athlon 64 возможность полноценно работать со всеми текущими 16- и 32-битными операционными системами и приложениями (полная x86-совместимость) и, более того, даже обеспечила при этом прирост производительности на традиционных 32-битных задачах 20–30% по сравнению с предшественниками — AMD Athlon XP — на той же тактовой частоте ядра лишь за счет усовершенствования архитектуры. Именно с этой точки зрения нас сейчас и интересуют Athlon 64.
Предвидя возражения поклонников AMD, отмечу также, что наша тестовая лаборатория исповедует принцип тестирования оборудования на финальных (еще лучше — сертифицированных всеми заинтересованными сторонами) релизах операционных систем, драйверов и приложений. По нашему мнению, применение сырых бета-версий (особенно — операционных систем и драйверов) может ввести читателя в заблуждение относительно истинных качеств того или иного оборудования и практикуется нами редко и со специальными оговорками. Поэтому мы и не спешим, в отличие от некоторых сетевых изданий, делать выводы о «мощи» Athlon 64 на примере единичных и достаточно экзотических 64-битных приложений. Давайте дождемся более или менее законченных и многочисленных программ и, прежде всего, новой Windows, тогда и посчитаем цыплят. Не исключено, что к тому времени ситуация с процессорным «железом» заметно изменится и эйфория от пресловутых «64 бит» у новых Athlon пройдет.
Прежде чем перейти к исследованию производительности современных настольных процессоров в профессиональных приложениях, кратко напомним основные архитектурные особенности и характеристики процессоров семейства AMD Athlon 64 по сравнению с AMD Athlon XP и Intel Pentium 4.
AMD Athlon 64
Вычислительное ядро и кристалл (на фото внизу) процессоров с архитектурой AMD64 немногим отличается от ядра прежних Athlon XP (этого не отрицает и сама AMD). Взяв за основу весьма удачные разработки 0,13-микронного ядра Thoroughbred, корпорация внесла в него несколько изменений, которые в совокупности позволили существенно улучшить быстродействие и повысить надежность процессора. Вот основные отличия новой архитектуры AMD64 и конструкции процессоров Athlon 64:
- введена 64-битная адресация памяти (приложению теперь может быть выделено более 2 Гбайт памяти; уже используется 48-битная виртуальная адресация и 40-битная физическая адресация);
- введен набор дополнительных инструкций x86-64; сохранена полная совместимость с прежними 32-битными приложениями;
- регистры общего назначения стали 64-разрядными, и их число увеличено вдвое (с 8 до 16);
- также вдвое (с 8 до 16) увеличено число 128-разрядных регистров для вычислений с плавающей запятой (блок SSE/SSE2);
- увеличено число ступеней вычислительных конвейеров: с 10 до 12 для целочисленных вычислений и с 15 до 17 для вычислений с плавающей запятой (ускоряется выполнение ряда команд и улучшается масштабируемость ядра по частоте);
- улучшена система предсказания переходов и в четыре раза увеличена ее таблица;
- введена поддержка интеловских инструкций SSE2 (теперь даже AMD в своих документах рекомендует разработчикам приложений использовать SSE2 вместо 3DNow!);
- вдвое (до 128 бит) увеличена ширина шины кэш-памяти второго уровня L2;
- объем кэш-памяти L2 увеличен до 1 Мбайт, при этом сохранена ее эксклюзивность;
- вдвое (с 256 до 512 «входов») увеличился размер TLB кэш-памяти L2, больше стал и TLB кэш-памяти инструкций L1 (40 «входов» вместо 24);
- в кристалл процессора встроен контроллер памяти с поддержкой DDR вплоть до частоты 400 МГц, поддерживается также ECC-память;
- контроллер памяти имеет два независимых канала (в процессорах с разъемом Socket 754 один из каналов отключен);
- для связи процессора с чипсетом используется высокоскоростная шина HyperTransport (аналог системной шины прежних процессоров) 16x16 бит с суммарной полосой пропускания до 6,4 Гбайт/с (по 3,2 Гбайт/с в каждую сторону);
- наряду с диодным термодатчиком на кристалле процессора теперь присутствует электронная схема для защиты от перегрева (выключает CPU при превышении порога температуры);
- кристалл процессора защищен металлической теплорассеивающей крышкой (хитспредером; она отсутствует только у мобильных Athlon 64).
Ключевыми нововведениями, позволяющими улучшить производительность новых процессоров AMD на традиционных 32-разрядных приложениях, являются вдвое увеличенный объем кэш-памяти L2, возросшая скорость работы с ней (благодаря более широкой шине), а также интегрированный в кристалл процессора контроллер DDR-памяти. Причем во всех этих трех случаях имеет значение как полоса пропускания, так и латентность работы.
На данный момент в арсенале AMD есть следующие процессоры серии Athlon 64:
- Athlon 64 FX-51 с тактовой частотой 2200 МГц для разъема Socket 940 с двухканальным контроллером регистровой памяти DDR400 (аналог AMD Opteron без многопроцессорной работы);
- Athlon 64 3200+ с тактовой частотой 2000 МГц для разъема Socket 754 с одноканальным контроллером памяти DDR400;
- две версии мобильных Athlon 64 — модели 3200+ и 3000+ с частотами 2000 и 1800 МГц соответственно, которые предназначены для применения в ноутбуках класса «замена десктопа».
По неофициальной информации, вскоре ожидается появление Athlon 64 3400+ для разъема Socket 754 (одноканальный контроллер памяти) с частотой 2200 МГц, а чуть позже (возможно) — и Athlon 64 FX-53 с тактовой частотой 2400 МГц для разъема Socket 940. Все эти процессоры используют одно и то же ядро ClawHammer. Их основные характеристики в сравнении с AMD Athlon XP 3200+ и конкурентами от Intel приведены в табл. 1.
По сведениям из заслуживающих доверия источников, в первой половине 2004 года должны также появиться процессоры для Socket 939 с поддержкой обычной (нерегистровой) двухканальной DDR400 и недорогие процессоры на 0,13-микронном ядре Newcastle для Socket 754 с уменьшенным вдвое (до 512 Кбайт) объемом кэш-памяти L2. Ну а ближе к концу 2004 года мы должны увидеть серию процессоров на 90-нанометровом ядре San Diego (и его клонах Winchester и Odessa, см. также роадмэп AMD на предыдущей странице).
Можно долго иронизировать по поводу высокой цены и малой доступности Pentium 4 Extreme Edition 3,2 ГГц, однако с его прямыми конкурентами AMD Athlon 64 FX-51 ситуация, на самом деле, очень похожая: при объявленной в момент анонса оптовой цене 733 доллара, реальная цена в тех немногих магазинах, где они есть, доходит до 850 долларов, что не намного выше, чем у Extreme Edition. Между тем, если последний прекрасно работает на самых обычных платах на чипсетах Intel 875P и даже дешевых (но не менее шустрых при использовании режима «квази-PAT») 865PE с обычной DDR400, то Athlon 64 FX требует себе почти «серверную» плату с разъемом Socket 940 и, что куда хуже, более дорогие регистровые модули DDR400 (уже не говоря об их большей латентности/таймингах), которых пока днем с огнем не найдешь. Так что привлекательность обеих платформ для пользователя в плане цены и доступности примерно одинакова. Не стоит забывать и о других конкурирующих решениях — более доступных по цене и наличию в магазинах, но не сильно проигрывающих двум первым в производительности. Это традиционный Pentium 4 3,2 ГГц и новый Athlon 64 3200+. Для рабочих станций начального уровня подойдут даже прежние Pentium 4 3,06 ГГц или Athlon XP 3200+, которые тоже участвуют в наших сегодняшних испытаниях и на фоне новичков смотрятся не так уж плохо.
Платформы
Поскольку и AMD Athlon 64 FX-51, и Intel Pentium 4 EE 3,2 ГГц берут начало именно от «серверных» процессоров AMD Opteron и Intel Xeon MP, то логично предположить, что именно на них профессиональные приложения будут «летать». Сразу оговоримся, что двух- и четырехпроцессорные системы на AMD Opteron и Intel Xeon мы пока оставим в стороне, а рассмотрим только однопроцессорные системы из категорий «высокопроизводительные настольные ПК» или «рабочие станции начального уровня». Вместе с тем, поскольку однопроцессорные системы на базе AMD Opteron и Intel Xeon — это фактически полные аналоги (при условии равенства частот ядра, системной шины и памяти) соответствующих настольных ПК на базе AMD Athlon 64 FX и Intel Pentium 4 (или Extreme Edition), некая параллель с простыми системами на Opteron и Xeon явно будет прослеживаться.
Четкой границы между понятиями «высокопроизводительный ПК» и «рабочая станция, по-видимому, не существует. Если под высокопроизводительными рабочими станциями понимают все-таки более мощные специфические двух- и даже многопроцессорные машины на Intel Xeon, Intel Itanium и AMD Opteron и пр., использующие видеоускорители профессионального (а не бытового/игрового) класса и дисковые массивы SCSI RAID, то рабочие станции послабее вполне могут иметь один процессор Pentium 4 или Athlon 64, «десктопную» материнскую плату с памятью DDR SDRAM даже без ECC и один из старших бытовых видеоускорителей, а в качестве накопителя — либо массив ATA RAID, либо и вовсе быстрый ATA-винчестер. Часто высокопроизводительный ПК приобретается для выполнения несложных профессиональных задач, поскольку сравнимая с ним по мощности специализированная рабочая станция стоит в несколько раз дороже. Вместе с тем о производительности ПК в таких приложениях, как AutoCAD, 3D Studio Max или Photoshop, вряд ли можно объективно судить по популярным «бытовым» и игровым тестам. В данном обзоре мы рассмотрим скорость работы систем в следующих профессиональных приложениях:
- Adobe Photoshop 7.0;
- Autodesk AutoCAD 2002;
- Disсreet 3D Studio Max 5.0;
- Alias|Wavefront Maya 4.5;
- Maxon Cinema 4D;
- пакеты трехмерного инженерного проектирования Pro/ENGINEER и др.
Для экспериментов выбраны следующие характерные конфигурации платформ (описание плат см. на www.terralab.ru/system/30337, .../29365 и .../25249):
- AMD Athlon 64 FX-51 на плате ASUS SK8N (чипсет NVIDIA nForce3 Pro 150) с двухканальной регистровой памятью DDR400;
- AMD Athlon 64 «3400+» на плате ASUS SK8N (чипсет NVIDIA nForce3 Pro 150) с одноканальной регистровой памятью DDR400;
- AMD Athlon 64 3200+ на плате ASUS K8V Deluxe (чипсет VIA K8T800) с одноканальной памятью DDR400;
- AMD Athlon XP 3200+ на плате EPoX 8RDA3+ (чипсет NVIDIA nForce2 Ultra 400) с двухканальной памятью DDR400;
- Intel Pentium 4 Extreme Edition 3,2 ГГц на плате Intel D875PBZ (чипсет Intel 875P) с двухканальной памятью DDR400;
- Intel Pentium 4 3,2 ГГц на плате Intel D875PBZ (чипсет Intel 875P) с двухканальной памятью DDR400;
- Intel Pentium 4 3,06 ГГц на плате Intel D875PBZ (чипсет Intel 875P) с двухканальной памятью DDR333.
Тут нужно сделать два пояснения.
Во-первых, на момент написания этих строк процессора AMD Athlon 64 3400+ не было и в помине, поэтому для его имитации мы воспользовались процессором Athlon 64 FX-51 (с той же тактовой частотой 2,2 ГГц), задействовав один канал памяти вместо двух. С одной стороны, такая имитация не полностью адекватна будущему истинному Athlon 64 3400+, поскольку использует более медленную регистровую память, работающую с чуть худшими таймингами, чем обычная небуферизованная DDR400 в остальных пяти системах. Но с другой стороны, именно при таком подходе мы сможем понять в чистом виде (на одной и той же плате, с одинаковой памятью), что теряем, используя один канал памяти вместо двух.
Во-вторых, систему на Pentium 4 3,06 ГГц мы тоже включили сюда не случайно. Ровно год назад она стала победительницей в нашем обзоре рабочих станций начального уровня (см. «КТ» #475). Правда, тогда этот процессор «обитал» на других чипсетах и памяти: Intel 850E с RDRAM PC1066 и Intel E7205 с двухканальной DDR266. Сейчас же мы «пересадили» его на современную конфигурацию — чипсет Intel 875P (в данном случае используется системная шина 533 МГц, а не 800 МГц) с двухканальной памятью DDR333 — которая, судя по нашим тестам, даже слегка опережает обе прежние связки.
Память DDR400/333 (OCZ Platinum PC3500, два 16-чиповых модуля по 512 Мбайт каждый) работала по таймингам 2-2-3-5 (tRCD=3) во всех системах, кроме платы ASUS SK8N, где аналогичные по объему и организации регистровые модули PC3200 от Infineon были способны в лучшем случае на 2,5-2-3-5. В остальном конфигурации систем были идентичны: видеоускоритель GeForce FX 5900 Ultra (256 Мбайт памяти) с драйверами Detonator 44.03 или 52.16 (в зависимости от приложения), винчестер Samsung SP1614N, блок питания мощностью 400 Вт. В данном случае использовать более скоростную дисковую подсистему не было необходимости, поскольку в процессе испытаний «дискозависимость» была минимальна — в отобранных нами тестах вполне хватало 1 Гбайт оперативной памяти, хотя в реальности для ряда задач может потребоваться и больше. Все тесты проводились под управлением операционной системы Microsoft Windows XP Professional SP1. Для чипсета Intel использовалась Intel Chipset Software Installation Utility версии 5.02.1003, для чипсета NVIDIA nForce3 — набор драйверов версии 3.0 (WHQL), а для чипсета VIA — драйвер 4-in-1 версий 4.49 и 4.51. Между блоками тестов компьютер перезагружался, а для каждого паттерна в пакетах моделирования приложение запускалось снова (чтобы очистить память и свопы самого приложения). Тесты неоднократно повторялись, и результаты усреднялись.
Но прежде чем перейти к результатам тестов, взглянем на производительность систем при работе с памятью (см. диаграммы в низу страницы). Именно здесь во многом кроются разгадки тех результатов, которые мы увидим позднее.
Быстрее всего с памятью работает система на Athlon 64 FX-51. Это вполне закономерно, поскольку она оснащена интегрированным в процессор двухканальным контроллером памяти DDR400. За ней идут интеловские системы на шине 800 МГц, причем Extreme Edition порой отстает от обычного Pentium 4. Далее следует Pentium 4 с системной шиной 533 МГц, и замыкают список два Athlon 64 с одним каналом памяти и Athlon XP 3200+ с двумя каналами, но медленной системной шиной, равной по скорости одному каналу DDR400. В общем, ничего неожиданного — все платформы выстроились в соответствии со своими теоретическими возможностями. Интересно, что самая высокая эффективность использования потенциальных возможностей полосы пропускания двухканальной памяти DDR400 — у Athlon 64 FX (около 87%), тогда как Pentium 4 за счет «чипсетного» контроллера памяти утилизирует лишь 76% от возможной полосы (и 82% для FSB 533 МГц). Другое дело — одноканальные системы. Тут и Athlon 64, и Athlon XP «выбирают» почти всю доступную ширину полосы. Подтверждают это и тесты скорости чтения памяти в AIDA32. Однако по скорости записи в память картина существенно меняется: вперед с солидным отрывом вырвался Extreme Edition, имеющий огромный L3 (заметим — вырвался именно за счет эффективного кэширования).
По латентности работы с памятью тоже с большим отрывом лидирует Athlon 64 благодаря встроенному контроллеру. Латентность около 50 нс — уникально низкое для настольных систем значение, причем оно наблюдается как для двухканальной, так и для одноканальной работы с памятью (регистровая память при этом имеет процентов на 10 более высокую латентность, чем обычная). Справедливости ради отметим, что использованная здесь «классическая» плата на i875P для Pentium 4 — не самая продвинутая в плане латентности. На некоторых других современных платах (особенно в режимах ускорения чипсета) наблюдалась латентность в районе 65 нс для Pentium 4 с двухканальной DDR400, что приближается к значениям для Athlon 64 и намного опережает синхронный режим для Athlon XP 3200+ на nForce2.