Ботва титанов,или Серверные корки Pentium 4 Extreme Edition в ответ на AMD Athlon 64 FX
АрхивВ заголовке нет очепятки: именно "ботва", а никакая не битва. Два давнишних конкурента — корпорации AMD и Intel — в очередной раз решили забить стрелку и выяснить, у кого "мегахерц" длиннее, кэш "ширее" и вообще — кто крутой, а кто "ацтой".
В заголовке нет очепятки: именно «ботва», а никакая не битва. Два давнишних конкурента — корпорации AMD и Intel — в очередной раз решили забить стрелку и выяснить, у кого «мегахерц» длиннее, кэш «ширее» и вообще — кто крутой, а кто «ацтой».
Признайтесь, вам было мало скорости процессоров Pentium 4 3,2 ГГц или Athlon XP 3200+? У вас тормозили какие-то игры или приложения? Не было свиста в ушах? Так мы вам его обеспечим! Причем за ваши же деньги.
Итак, очередной виток гонки процессорных вооружений делает ставку на геймеров: и Intel, и AMD заявляют свои новые процессоры именно как игровые. И хотя никто не отрицает, что они с успехом могут использоваться для выполнения профессиональной работы, но на то ботва и ботвой, что в данном случае никого не волнует, где и зачем нужны «для дела» эти процессоры — ведь главное круто играть! И тут каждая лишняя десятая «фэпээса» (это такая нефизическая величина, определяющая степень крутизны компьютерной «железки» у геймеров) на вес золота. В прямом смысле слова, поскольку каждый лишний «фэпээс» сверх рекордных влетает в нехилую кучку баксиков. Но хватит лирики, вперед — к физике!
23 сентября корпорация AMD наконец-то объявила долгожданные 64-разрядные процессоры Athlon 64 FX-51 и Athlon 64 3200+ для настольных ПК и мобильный Athlon 64 (подробности см. на www.terralab.ru/system/29375). Это событие транслировалось в реальном времени на www.amd. com, а видеозапись можно будет посмотреть там еще месяц. Старший процессор, Athlon 64 FX-51 (фото справа) для разъема Socket 940, при цене 733 доллара фактически является однопроцессорным аналогом ранее вышедших серверных AMD Opteron, но работает на более высокой частоте 2200 МГц. Как и Оптероны, он поддерживает двухканальную DDR400 и ниже, но требует для работы дорогие регистровые модули памяти. Несмотря на явно серверные корни (корки), он позиционируется именно как мощный игровой процессор. Второй, Athlon 64 3200+, попроще — он имеет всего один канал памяти для обычных (небуферизованных) модулей памяти DDR400, тактовую частоту 2000 МГц и предназначен для «упрощенного» разъема Socket 754. Мобильный Athlon 64 из-за мощного тепловыделения (около 80 ватт) сможет пока использоваться только в ноутбуках-десктопозаменителях. Предлагаются модели 3200+ и 3000+ по цене 417 и 278 долларов.
Все эти процессоры производятся по 0,13-микронной технологии (SOI), содержат 105,9 млн. транзисторов и отличаются от предшествующих Athlon XP новым ядром с 64-битными возможностями вычислений (наряду с улучшенными 32-битными на базе прежнего ядра Athlon XP), кэш-памятью второго уровня объемом 1 Мбайт (причем кэш у Атлонов инклюзивный, то есть полный объем с учетом 128 Кбайт L1 составляет 1152 Кбайт — пока рекорд для настольных систем; быстродействие кэша также выше, чем у Athlon XP), интегрированным контроллером памяти (вплоть до двухканальной DDR400), прогрессивной шиной HyperTransport и еще рядом примочек. За деталями отсылаем читателя к вышеупомянутому обзору и врезке. Десктопные процессоры оснащены защитной металлической теплорассеивающей крышкой (хитспредером), как у Pentium 4, а мобильные имеют открытый кристалл.
Производительность AMD Athlon 64 предполагается очень высокой даже в обычных 32-битных приложениях (истинных 64-битных операционных систем, драйверов и программ на потребительском рынке ждать придется еще долго). Однако Intel была бы не Intel, если бы не предусмотрела ответный ход — какому лидеру в здравом уме захочется сдавать свои позиции? И внезапно на Форуме для разработчиков в Сан-Хосе (см. репортаж в этом и прошлом номерах «КТ») в середине сентября корпорация объявила о намерении выпустить процессор Pentium 4 Extreme Edition с экстремальной производительностью. Разумеется, он оснащен технологией Hyper-Threading (куда же без нее, если, по заверениям Intel, сейчас 80% продаваемых Пентиумов — именно с НТ), работает на системной шине 800 МГц, имеет тактовую частоту ядра до 3,2 ГГц и пр., но его главным отличием от предшествующих Pentium 4 стала интегрированная в кристалл кэш-память третьего уровня объемом 2 Мбайт!!! Она дополняет стандартный нортвудовский кэш L2 512 Кбайт и тоже работает на частоте ядра процессора (правда, с большей раза в два латентностью). Таким образом, в сумме новый Pentium 4 Extreme Edition имеет кэш-память объемом 2,5 Мбайт! Рекорд AMD пал, не успев родиться.
Дополнительная кэш-память третьего уровня ведет начало от серверных процессоров Xeon MP на 0,13-микронном ядре Gallatin и не имеет ничего общего с грядущим 90-нанометровым Prescott, однако этот кристалл (ядро) все же немного переработали с целью поддержки системной шины 800 МГц, уменьшения энергопотребления и др. и упаковали в стандартный корпус от текущих Pentium 4. В результате Pentium 4 Extreme Edition 3,2 ГГц не может работать в многопроцессорных конфигурациях, зато совместим со всеми существующими системными платами на чипсетах Intel 875/865, то есть не потребует редизайна плат, другого сокета, умощнения стабилизаторов питания VRM, более внушительных кулеров и пр., так как выделяет почти столько же тепла, сколько нынешний Pentium 4 3,2 ГГц (TDP около 93 ватт).
Pentium 4 Extreme Edition позиционируется Intel главным образом для игрового рынка (объем которого оценивается примерно в 5% от общего числа процессоров). Хотя руководители корпорации и не исключают, что новый продукт можно использовать в рабочих станциях. А поскольку Athlon 64 также имеет выдающуюся производительность именно в играх, шаг Intel становится очевидным. Но вдвое больший кэш у интеловских «игровых» камней почти не оставляет шансов конкуренту.
И хотя официальный выход «экстремальных» Pentium 4 запланирован на октябрь-ноябрь, у нас появилась уникальная возможность протестировать новый Pentium 4 Extreme Edition 3,2 ГГц и сравнить его со старшим из процессоров AMD — Athlon 64 FX-51. Специально ради этого я привез прямиком из лабораторий Intel в Санта-Кларе его инженерный образец (на фото — справа), еще без маркировки на крышке, но уже отлично работающий на обычных системных платах.
Для начала сравним внешний вид двух новейших процессоров (на фото). Athlon 64 заметно крупнее Pentium 4 (несмотря на меньшую кэш-память и, видимо, размер кристалла), толще и имеет 940 ножек против 478. Это обусловлено наличием в нем двухканального контроллера памяти с поддержкой ECC. Если сравнить Pentium 4 Extreme Edition с текущими Pentium 4 на ядре Northwood, то внешне они почти не отличаются, за исключением большего числа элементов обвязки с обратной стороны корпуса, что вызвано гораздо большим числом транзисторов на кристалле.
По утилитам у геймерского Pentium 4 Extreme Edition четко видна кэш-память третьего уровня объемом 2 Мбайт, хотя на месте и все прежние атрибуты Northwood (скриншоты справа). Аналогичная информация показана для Athlon 64. Интересно, что у нового Pentium 4 меньший степпинг, нежели у последних Northwood, — 5 против 9. По графику теста латентности памяти для Pentium 4 Extreme Edition (нижний скриншот) хорошо видно, что граница кэш-памяти L3 лежит на 2 Мбайт, L2 — на 512 кбайт. Итак, для двух новых процессоров Intel и AMD характерна прежде всего огромная кэш-память, которая, в конце концов, и должна поднять производительность каждого из них. Посмотрим, так ли это.
Испытания
Для испытаний Pentium 4 Extreme Edition мы использовали плату Intel D875PBZ (знаменитая Bonanza, см. www.terralab.ru/system/ 25198 и «КТ» #506), которая опознала процессор как Pentium 4. Ничем особенным ее включение с новым процессором не отличалось. Безусловно, это не самая быстрая плата на чипсете Intel 875, однако и не самая медленная. Зато она обеспечит нам классическую производительность чипсета Canterwood. Для процессоров AMD мы взяли платы ASUS SK8N на чипсете NVIDIA nForce3 Pro150 для Athlon 64 FX-51 (на фото, детали см. .../system/29365) и Gigabyte GA-7N400 (была предоставлена компанией «Никс», www. nix.ru) на чипсете NVIDIA nForce2 Ultra 400 для Athlon XP 3200+ (см. .../system/25249).
Кулер для Athlon 64 ничуть не меньше, чем для Pentium 4, только крепления разные, а сзади платы необходима металлическая пластина-упор. Привлекает массивное медное основание и очень тихий вентилятор. Даже несмотря на высокую скорость вращения (3400 об./мин.) и отключенную систему управления оборотами на материнской плате шум был едва заметен и оказался явно меньше, чем у современных боксовых кулеров для Pentium 4. А уж с включенной регулировкой оборотов он может вообще останавливаться при малой загрузке процессора.
Для всех систем использовались видеоускоритель GeForce FX 5900 Ultra (256 Мбайт памяти) с драйверами Detonator 44.03 (которые хоть и не так быстры, как последующие релизы, зато не искажают картинки) и 1 Гбайт системной памяти двумя 16-чиповыми модулями по 512 Мбайт (для платы ASUS SK8N использовались регистровые модули от Infineon, на фото). В системах на Pentium 4 и Athlon XP память работала по таймингам 2-2-3-5 (tRCD=3), а регистровые PC3200 Infineon на SK8N осилили максимум 2,5-2-3-5. Впрочем, это не критично, поскольку современные двухканальные чипсеты очень слабо (в плане быстродействия) реагируют на изменение тайминга CL=2 или 2,5 (см. «КТ» #508–509). То есть можно считать, что все четыре системы работали с одинаковыми таймингами памяти.
Итак, сравним процессоры:
- AMD Athlon 64 FX-51 (тактовая частота 2200 МГц).
- AMD Athlon XP 3200+ (частота 2200 МГц, FSB 400 МГц).
- Pentium 4 (Northwood) с частотой 3,2 ГГц (FSB 800 МГц).
- Pentium 4 Extreme Edition c частотой 3,2 ГГц (FSB 800 МГц).
Тем, кто привык сравнивать частоты процессоров-конкурентов, напомним, что в данном случае абсолютное сравнение частот процессоров Intel и AMD лишено смысла, поскольку их микроархитектуры существенно различаются (и даже преследуют разные цели): в Pentium 4 производительность должна обеспечиваться преимущественно высокой тактовой частотой (для этого и увеличили до двадцати стадий вычислительный конвейер), а в Athlon упор делается на другие особенности, порой в ущерб тактовой частоте. Разные подходы в микроархитектуре не позволяют адекватно сравнивать процессоры на одинаковой тактовой частоте. И пример тому — разный предел частот при одинаковых технологических нормах производства: для технологии 0,13 мкм массовым пределом ядра Pentium 4 является частота 3,2–3,4 ГГц, а в Athlon — 2,2–2,4 ГГц. Поэтому корректнее сравнивать процессоры по пределу их частоты для той или иной технологии производства — в данном случае 3,2 и 2,2 ГГц. Чем мы и займемся.
Полные результаты тестов вы можете найти в полной версии обзора на www.terralab.ru/system/ 29365, а здесь мы отметим главное. По полосе пропускания двухканальной памяти впереди, безусловно, процессор AMD. Хотя Пентиумы отстают от него заметно меньше, чем Athlon XP 3200+ (напомню — все они используют двухканальную DDR400). Athlon 64 FX ближе всех подошел к теоретическому пределом 6,4 Гбайт/с — на 86%, Пентиумы показывают примерно три четверти в штатных режимах работы (в режимах ускорения чипсета/памяти эффективность возрастает до более чем 80%), а Athlon XP утилизирует менее половины (из-за узкой системной шины). По скорости чтения памяти Pentium 4 Extreme Edition почти не отличается от Northwood (небольшое падение можно связать с недостатками метода измерения — потоки немного «застревают» в большом кэше L3), а Athlon 64 FX и тут вне досягаемости. Зато по скорости записи в память Pentium 4 Extreme Edition на голову опережает всех, включая Athlon 64 FX! Видимо, благодаря именно хорошему и «большому» кэшированию. Зато по латентности памяти Athlon 64 FX показывает просто фантастические результаты — всего 56 нс!!! Интересно также, что строго синхронный чипсет NVIDIA nForce2 обеспечивает порой лучшую латентность, чем Intel 875P. Вместе с тем мы помним, что и у чипсетов Intel 875/865 может быть латентность в районе 66 нс — если они работают в специальных (нештатных) низколатентных режимах (см. «КТ» #506–507).
Во многих бытовых и игровых приложениях Pentium 4 Extreme Edition заметно ускорился по сравнению с Pentium 4. В CPUmark 99 и более новом 3Dmark03 CPU очевидно огромное преимущество Athlon 64 FX. Впрочем, появление Pentium 4 EE позволило немного нагнать конкурента: от возросшего кэша новичок прибавил 5% в первом из тестов и аж 26% во втором! Для сравнения, Athlon 64 FX, как и обещали рекламщики из AMD, прибавил в обоих тестах чуть более 30% по сравнению с одночастотным Athlon XP. Еще один «AMD-любивый» тест — обновленный Science Mark 2.0. Тут даже Athlon XP быстрее самого быстрого Пентиума, хотя переход на AMD64 дает прирост скорости Атлону всего около 8%, а большой кэш Пентиума добавляет менее 5%.
Но не все коту масленица — будет праздник и на улице поклонников продукции Intel. Например — комплексный вычислительный тест MetaBench, где Pentium 4 и безо всякого «экстрима» легко опережает Athlon 64 в большинстве подтестов. Возросший кэш в среднем добавляет ему лишь 1,4%, тогда как новая микроархитектура Athlon 64 — целых 13%. Благосклонны к Intel и процессорные тесты пакета SiSoftware Sandra: во всех пяти (включая арифметические и дробные расчеты и работу с мультимедиа-данными) Пентиумы заметно впереди, но заслуги Extreme Edition в этом нет. Таким образом, что касается сравнения AMD — Intel, тут все зависит от приложения — где-то быстрее одни, где-то другие. Пока счет равный.
Архивирование в WinRAR было коньком Pentium 4, поскольку требовало высокой скорости работы с потоковыми данными и малой латентности памяти. По идее, именно поэтому Athlon 64 FX должен был победить, однако этого не произошло. Точнее, произошло бы, если б не появился Pentium 4 Extreme Edition, который справляется с архивированием почти на 20% быстрее. Это рекорд прибавки быстродействия от возросшей кэш-памяти Pentium. Athlon 64 FX, прибавив аж 24% по сравнению с Athlon XP, уперся в недостаточно большой объем кэш-памяти и проиграл. Пол-очка в копилку Intel. При кодировании графики, видео и звука Пентиумы по-прежнему оказываются вне досягаемости — главным образом, благодаря технологии Hyper-Threading, которая в этих приложениях работает очень эффективно, а большой кэш Pentium 4 Extreme Edition тут добавляет всего 2,5%, а порой и меньше. Зато преимущества новой микроархитектуры AMD64 выливаются тут в 14–22%.Твердое очко в зачет прошлых заслуг Intel.
В играх ситуация двоякая — снова где-то быстрее Intel, где-то AMD. Например, в новейшем 3DMark2003 (с функциями DirectX 9) впереди Intel. Небольшой отрыв платформ друг от друга в этом тесте объясняется тем, что результаты здесь больше зависят от скорости графического ускорителя и его драйверов, нежели от процессора и системной памяти. Тем не менее, разница налицо. Интересно, что в чисто процессорном тесте этого пакета (см. выше) мы наблюдаем прямо противоположную картину — с завидным отрывом лидирует AMD. Ситуацию, видимо, можно объяснить так. В тяжелом графическом тесте большее влияние оказывает скорость работы видеокарты с системной памятью. Вместе с тем для чипсетов Intel шина AGP 8x общается с системной памятью непосредственно через низколатентный северный мост, тогда как для чипсета nForce3 шина AGP работает с памятью через цепочку «чипсет-HyperTransport-процессор-память», что неминуемо снижает скорость. Доказательством является слабое отличие Athlon XP от Athlon 64 в этом тесте. Напротив, в чисто процессорном тесте общение по AGP минимально, и высокая скорость памяти позволяет Athlon 64 быть в лидерах. Подтверждает вышесказанное более старый и менее требовательный к шине AGP (если на видеокарте много своей памяти) тест 3DMark2001SE (DirectX 8 и 7). Тут Athlon 64 почти на 20% быстрее Athlon XP и даже опередил Pentium 4 Extreme Edition, хотя последний тоже добавил больше 10% скорости настольной платформе Intel за счет кэш-памяти. Похожая картина и в игре Unreal Tournament 2003: Athlon 64 FX был почти на треть (!) быстрее Athlon XP (на той же тактовой частоте) и обошел P4EE, который прибавил всего 13%. Пока ничья в негласном соревновании процессоров.
Ситуация для Pentium 4 улучшается в играх под OpenGL. И в стареньком Кваке, и в более тяжелом RTCW Extreme Edition позволил Intel сохранить первенство: хоть Athlon прибавил 10–25%, Pentium пошустрел на 3–18%, чего пока хватило для лидерства. Игровой OpenGL-движок теста Vulpine GLmark 1.1 вообще не оставляет Атлонам никакого шанса. Да и в Serious Sam SE, всегда благоволившем к продукции AMD, экстремальному Pentium 4 хватило мощи потягаться даже с Athlon 64 FX-51: он почти догнал конкурента, прибавив по сравнению с обычным Pentium 4 почти 6%. Учитывая вышесказанное, счет по очкам примерно 4,5 на 3,5 (Intel против AMD). Конечно, это очень условная оценка. Производительности новых процессоров в профессиональной работе мы посвятим отдельный обзор (ведь не только геймеры покупают новые дорогие процессоры), а сейчас подведем итоги.
Корпорация Intel недаром опасалась выхода Athlon 64 FX: новый настольный процессор AMD получился очень удачным. Он заметно опережает прежний Athlon XP 3200+ при той же тактовой частоте ядра (2200 МГц) и безусловно отобрал пальму первенства у прежнего Pentium 4 3,2 ГГц на ядре Northwood. Вместе с тем расторопность, с которой Intel решила выпустить свой геймерский процессор Pentium 4 Extreme Edition с гигантским размером кэш-памяти (собственно, сейчас в арсенале Intel других возможностей наращивания производительности и не осталось; Prescott на 90-нанометровом ядре появится лишь к Новому году), сделала свое дело: практически одновременно с выходом AMD Athlon 64 мы получили (или вскоре получим) настольный процессор, который в среднем примерно равен по производительности старшему представителю конкурента или даже чуть быстрее его (по крайней мере, в нашем наборе тестов, в том числе — в играх). Победу в очередном раунде великого противостояния мы не присуждаем никому (но и поражения тоже!). Предпочтение пользователь может отдавать продукту той или иной фирмы исходя из тех задач, которые чаще приходится выполнять на ПК: в одних приложениях быстрее AMD Athlon 64 FX, в других — Pentium 4 Extreme Edition и даже обычный Pentium4! Вопрос за малым — сколько все это будет стоить? Учитывая, что AMD пока не планирует демпинговать с Athlon 64 и будет снимать сливки с новых моделей (а многие любили процессоры AMD именно за низкие цены), мы, видимо, получим ситуацию, когда процессоры с примерно одинаковым быстродействием будут стоить одинаково. И выбор будет определяться скорее вкусом, на который, как известно, товарища нет. Но мы не заканчиваем знакомство с новыми процессорами: нас еще ждут обзоры чипсетов и материнских плат в «большой Ферре». Следите за журналом и сайтом www.terralab.ru.
Особенности микроархитектуры AMD64 Первое и самое очевидное технологическое новшество архитектуры AMD64 — поддержка 64-разрядной адресации памяти и расширение регистров общего назначения. Таким образом, приложению теперь может быть выделено больше двух гигабайт памяти. X86-регистры общего назначения (GPR) стали вмещать 64 бита. От перехода с 286-го на 386-й это отличается тем, что число GPR еще и удвоилось, обеспечив более эффективное выполнение даже старого 32-битного кода и сделав код ассемблера компактнее. Главное преимущество 64-разрядности от AMD — полная совместимость и максимальное быстродействие 32-битных приложений. То есть все существующие операционные системы и приложения должны работать как минимум так же быстро, как и на Athlon XP. А для того, чтобы они заработали еще быстрее, достаточно их просто перекомпилировать. В дальнейшем ожидается выход приложений, оптимизированных с учетом новых возможностей. Впрочем, ждать поголовного роста производительности не стоит. Прирост скорости зависит от типа приложения и алгоритма реализации задачи. Можно провести аналогию с тем, что нам вполне хватает одной руки, чтобы нести сумку, хотя гвозди забивать гораздо проще двумя. Кайрат Ахметов |