Архивы: по дате | по разделам | по авторам

Ботва титанов,или Серверные корки Pentium 4 Extreme Edition в ответ на AMD Athlon 64 FX

Архив
автор : Александр Карабуто   17.10.2003

В заголовке нет очепятки: именно "ботва", а никакая не битва. Два давнишних конкурента — корпорации AMD и Intel — в очередной раз решили забить стрелку и выяснить, у кого "мегахерц" длиннее, кэш "ширее" и вообще — кто крутой, а кто "ацтой".

В заголовке нет очепятки: именно «ботва», а никакая не битва. Два давнишних конкурента — корпорации AMD и Intel — в очередной раз решили забить стрелку и выяснить, у кого «мегахерц» длиннее, кэш «ширее» и вообще — кто крутой, а кто «ацтой».

Признайтесь, вам было мало скорости процессоров Pentium 4 3,2 ГГц или Athlon XP 3200+? У вас тормозили какие-то игры или приложения? Не было свиста в ушах? Так мы вам его обеспечим! Причем за ваши же деньги.

Итак, очередной виток гонки процессорных вооружений делает ставку на геймеров: и Intel, и AMD заявляют свои новые процессоры именно как игровые. И хотя никто не отрицает, что они с успехом могут использоваться для выполнения профессиональной работы, но на то ботва и ботвой, что в данном случае никого не волнует, где и зачем нужны «для дела» эти процессоры — ведь главное круто играть! И тут каждая лишняя десятая «фэпээса» (это такая нефизическая величина, определяющая степень крутизны компьютерной «железки» у геймеров) на вес золота. В прямом смысле слова, поскольку каждый лишний «фэпээс» сверх рекордных влетает в нехилую кучку баксиков. Но хватит лирики, вперед — к физике!

23 сентября корпорация AMD наконец-то объявила долгожданные 64-разрядные процессоры Athlon 64 FX-51 и Athlon 64 3200+ для настольных ПК и мобильный Athlon 64 (подробности см. на www.terralab.ru/system/29375). Это событие транслировалось в реальном времени на www.amd. com, а видеозапись можно будет посмотреть там еще месяц. Старший процессор, Athlon 64 FX-51 (фото справа) для разъема Socket 940, при цене 733 доллара фактически является однопроцессорным аналогом ранее вышедших серверных AMD Opteron, но работает на более высокой частоте 2200 МГц. Как и Оптероны, он поддерживает двухканальную DDR400 и ниже, но требует для работы дорогие регистровые модули памяти. Несмотря на явно серверные корни (корки), он позиционируется именно как мощный игровой процессор. Второй, Athlon 64 3200+, попроще — он имеет всего один канал памяти для обычных (небуферизованных) модулей памяти DDR400, тактовую частоту 2000 МГц и предназначен для «упрощенного» разъема Socket 754. Мобильный Athlon 64 из-за мощного тепловыделения (около 80 ватт) сможет пока использоваться только в ноутбуках-десктопозаменителях. Предлагаются модели 3200+ и 3000+ по цене 417 и 278 долларов.

Все эти процессоры производятся по 0,13-микронной технологии (SOI), содержат 105,9 млн. транзисторов и отличаются от предшествующих Athlon XP новым ядром с 64-битными возможностями вычислений (наряду с улучшенными 32-битными на базе прежнего ядра Athlon XP), кэш-памятью второго уровня объемом 1 Мбайт (причем кэш у Атлонов инклюзивный, то есть полный объем с учетом 128 Кбайт L1 составляет 1152 Кбайт — пока рекорд для настольных систем; быстродействие кэша также выше, чем у Athlon XP), интегрированным контроллером памяти (вплоть до двухканальной DDR400), прогрессивной шиной HyperTransport и еще рядом примочек. За деталями отсылаем читателя к вышеупомянутому обзору и врезке. Десктопные процессоры оснащены защитной металлической теплорассеивающей крышкой (хитспредером), как у Pentium 4, а мобильные имеют открытый кристалл.

Производительность AMD Athlon 64 предполагается очень высокой даже в обычных 32-битных приложениях (истинных 64-битных операционных систем, драйверов и программ на потребительском рынке ждать придется еще долго). Однако Intel была бы не Intel, если бы не предусмотрела ответный ход — какому лидеру в здравом уме захочется сдавать свои позиции? И внезапно на Форуме для разработчиков в Сан-Хосе (см. репортаж в этом и прошлом номерах «КТ») в середине сентября корпорация объявила о намерении выпустить процессор Pentium 4 Extreme Edition с экстремальной производительностью. Разумеется, он оснащен технологией Hyper-Threading (куда же без нее, если, по заверениям Intel, сейчас 80% продаваемых Пентиумов — именно с НТ), работает на системной шине 800 МГц, имеет тактовую частоту ядра до 3,2 ГГц и пр., но его главным отличием от предшествующих Pentium 4 стала интегрированная в кристалл кэш-память третьего уровня объемом 2 Мбайт!!! Она дополняет стандартный нортвудовский кэш L2 512 Кбайт и тоже работает на частоте ядра процессора (правда, с большей раза в два латентностью). Таким образом, в сумме новый Pentium 4 Extreme Edition имеет кэш-память объемом 2,5 Мбайт! Рекорд AMD пал, не успев родиться.

Дополнительная кэш-память третьего уровня ведет начало от серверных процессоров Xeon MP на 0,13-микронном ядре Gallatin и не имеет ничего общего с грядущим 90-нанометровым Prescott, однако этот кристалл (ядро) все же немного переработали с целью поддержки системной шины 800 МГц, уменьшения энергопотребления и др. и упаковали в стандартный корпус от текущих Pentium 4. В результате Pentium 4 Extreme Edition 3,2 ГГц не может работать в многопроцессорных конфигурациях, зато совместим со всеми существующими системными платами на чипсетах Intel 875/865, то есть не потребует редизайна плат, другого сокета, умощнения стабилизаторов питания VRM, более внушительных кулеров и пр., так как выделяет почти столько же тепла, сколько нынешний Pentium 4 3,2 ГГц (TDP около 93 ватт).

Pentium 4 Extreme Edition позиционируется Intel главным образом для игрового рынка (объем которого оценивается примерно в 5% от общего числа процессоров). Хотя руководители корпорации и не исключают, что новый продукт можно использовать в рабочих станциях. А поскольку Athlon 64 также имеет выдающуюся производительность именно в играх, шаг Intel становится очевидным. Но вдвое больший кэш у интеловских «игровых» камней почти не оставляет шансов конкуренту.

И хотя официальный выход «экстремальных» Pentium 4 запланирован на октябрь-ноябрь, у нас появилась уникальная возможность протестировать новый Pentium 4 Extreme Edition 3,2 ГГц и сравнить его со старшим из процессоров AMD — Athlon 64 FX-51. Специально ради этого я привез прямиком из лабораторий Intel в Санта-Кларе его инженерный образец (на фото — справа), еще без маркировки на крышке, но уже отлично работающий на обычных системных платах.

Для начала сравним внешний вид двух новейших процессоров (на фото). Athlon 64 заметно крупнее Pentium 4 (несмотря на меньшую кэш-память и, видимо, размер кристалла), толще и имеет 940 ножек против 478. Это обусловлено наличием в нем двухканального контроллера памяти с поддержкой ECC. Если сравнить Pentium 4 Extreme Edition с текущими Pentium 4 на ядре Northwood, то внешне они почти не отличаются, за исключением большего числа элементов обвязки с обратной стороны корпуса, что вызвано гораздо большим числом транзисторов на кристалле.

По утилитам у геймерского Pentium 4 Extreme Edition четко видна кэш-память третьего уровня объемом 2 Мбайт, хотя на месте и все прежние атрибуты Northwood (скриншоты справа). Аналогичная информация показана для Athlon 64. Интересно, что у нового Pentium 4 меньший степпинг, нежели у последних Northwood, — 5 против 9. По графику теста латентности памяти для Pentium 4 Extreme Edition (нижний скриншот) хорошо видно, что граница кэш-памяти L3 лежит на 2 Мбайт, L2 — на 512 кбайт. Итак, для двух новых процессоров Intel и AMD характерна прежде всего огромная кэш-память, которая, в конце концов, и должна поднять производительность каждого из них. Посмотрим, так ли это.

Испытания

Для испытаний Pentium 4 Extreme Edition мы использовали плату Intel D875PBZ (знаменитая Bonanza, см. www.terralab.ru/system/ 25198 и «КТ» #506), которая опознала процессор как Pentium 4. Ничем особенным ее включение с новым процессором не отличалось. Безусловно, это не самая быстрая плата на чипсете Intel 875, однако и не самая медленная. Зато она обеспечит нам классическую производительность чипсета Canterwood. Для процессоров AMD мы взяли платы ASUS SK8N на чипсете NVIDIA nForce3 Pro150 для Athlon 64 FX-51 (на фото, детали см. .../system/29365) и Gigabyte GA-7N400 (была предоставлена компанией «Никс», www. nix.ru) на чипсете NVIDIA nForce2 Ultra 400 для Athlon XP 3200+ (см. .../system/25249).

Кулер для Athlon 64 ничуть не меньше, чем для Pentium 4, только крепления разные, а сзади платы необходима металлическая пластина-упор. Привлекает массивное медное основание и очень тихий вентилятор. Даже несмотря на высокую скорость вращения (3400 об./мин.) и отключенную систему управления оборотами на материнской плате шум был едва заметен и оказался явно меньше, чем у современных боксовых кулеров для Pentium 4. А уж с включенной регулировкой оборотов он может вообще останавливаться при малой загрузке процессора.

Для всех систем использовались видеоускоритель GeForce FX 5900 Ultra (256 Мбайт памяти) с драйверами Detonator 44.03 (которые хоть и не так быстры, как последующие релизы, зато не искажают картинки) и 1 Гбайт системной памяти двумя 16-чиповыми модулями по 512 Мбайт (для платы ASUS SK8N использовались регистровые модули от Infineon, на фото). В системах на Pentium 4 и Athlon XP память работала по таймингам 2-2-3-5 (tRCD=3), а регистровые PC3200 Infineon на SK8N осилили максимум 2,5-2-3-5. Впрочем, это не критично, поскольку современные двухканальные чипсеты очень слабо (в плане быстродействия) реагируют на изменение тайминга CL=2 или 2,5 (см. «КТ» #508–509). То есть можно считать, что все четыре системы работали с одинаковыми таймингами памяти.

Итак, сравним процессоры:

- AMD Athlon 64 FX-51 (тактовая частота 2200 МГц).
- AMD Athlon XP 3200+ (частота 2200 МГц, FSB 400 МГц).
- Pentium 4 (Northwood) с частотой 3,2 ГГц (FSB 800 МГц).
-  Pentium 4 Extreme Edition c частотой 3,2 ГГц (FSB 800 МГц).

Тем, кто привык сравнивать частоты процессоров-конкурентов, напомним, что в данном случае абсолютное сравнение частот процессоров Intel и AMD лишено смысла, поскольку их микроархитектуры существенно различаются (и даже преследуют разные цели): в Pentium 4 производительность должна обеспечиваться преимущественно высокой тактовой частотой (для этого и увеличили до двадцати стадий вычислительный конвейер), а в Athlon упор делается на другие особенности, порой в ущерб тактовой частоте. Разные подходы в микроархитектуре не позволяют адекватно сравнивать процессоры на одинаковой тактовой частоте. И пример тому — разный предел частот при одинаковых технологических нормах производства: для технологии 0,13 мкм массовым пределом ядра Pentium 4 является частота 3,2–3,4 ГГц, а в Athlon — 2,2–2,4 ГГц. Поэтому корректнее сравнивать процессоры по пределу их частоты для той или иной технологии производства — в данном случае 3,2 и 2,2 ГГц. Чем мы и займемся.

Полные результаты тестов вы можете найти в полной версии обзора на www.terralab.ru/system/ 29365, а здесь мы отметим главное. По полосе пропускания двухканальной памяти впереди, безусловно, процессор AMD. Хотя Пентиумы отстают от него заметно меньше, чем Athlon XP 3200+ (напомню — все они используют двухканальную DDR400). Athlon 64 FX ближе всех подошел к теоретическому пределом 6,4 Гбайт/с — на 86%, Пентиумы показывают примерно три четверти в штатных режимах работы (в режимах ускорения чипсета/памяти эффективность возрастает до более чем 80%), а Athlon XP утилизирует менее половины (из-за узкой системной шины). По скорости чтения памяти Pentium 4 Extreme Edition почти не отличается от Northwood (небольшое падение можно связать с недостатками метода измерения — потоки немного «застревают» в большом кэше L3), а Athlon 64 FX и тут вне досягаемости. Зато по скорости записи в память Pentium 4 Extreme Edition на голову опережает всех, включая Athlon 64 FX! Видимо, благодаря именно хорошему и «большому» кэшированию. Зато по латентности памяти Athlon 64 FX показывает просто фантастические результаты — всего 56 нс!!! Интересно также, что строго синхронный чипсет NVIDIA nForce2 обеспечивает порой лучшую латентность, чем Intel 875P. Вместе с тем мы помним, что и у чипсетов Intel 875/865 может быть латентность в районе 66 нс — если они работают в специальных (нештатных) низколатентных режимах (см. «КТ» #506–507).

Во многих бытовых и игровых приложениях Pentium 4 Extreme Edition заметно ускорился по сравнению с Pentium 4. В CPUmark 99 и более новом 3Dmark03 CPU очевидно огромное преимущество Athlon 64 FX. Впрочем, появление Pentium 4 EE позволило немного нагнать конкурента: от возросшего кэша новичок прибавил 5% в первом из тестов и аж 26% во втором! Для сравнения, Athlon 64 FX, как и обещали рекламщики из AMD, прибавил в обоих тестах чуть более 30% по сравнению с одночастотным Athlon XP. Еще один «AMD-любивый» тест — обновленный Science Mark 2.0. Тут даже Athlon XP быстрее самого быстрого Пентиума, хотя переход на AMD64 дает прирост скорости Атлону всего около 8%, а большой кэш Пентиума добавляет менее 5%.

Но не все коту масленица — будет праздник и на улице поклонников продукции Intel. Например — комплексный вычислительный тест MetaBench, где Pentium 4 и безо всякого «экстрима» легко опережает Athlon 64 в большинстве подтестов. Возросший кэш в среднем добавляет ему лишь 1,4%, тогда как новая микроархитектура Athlon 64 — целых 13%. Благосклонны к Intel и процессорные тесты пакета SiSoftware Sandra: во всех пяти (включая арифметические и дробные расчеты и работу с мультимедиа-данными) Пентиумы заметно впереди, но заслуги Extreme Edition в этом нет. Таким образом, что касается сравнения AMD — Intel, тут все зависит от приложения — где-то быстрее одни, где-то другие. Пока счет равный.

Архивирование в WinRAR было коньком Pentium 4, поскольку требовало высокой скорости работы с потоковыми данными и малой латентности памяти. По идее, именно поэтому Athlon 64 FX должен был победить, однако этого не произошло. Точнее, произошло бы, если б не появился Pentium 4 Extreme Edition, который справляется с архивированием  почти на 20% быстрее. Это рекорд прибавки быстродействия от возросшей кэш-памяти Pentium. Athlon 64 FX, прибавив аж 24% по сравнению с Athlon XP, уперся в недостаточно большой объем кэш-памяти и проиграл. Пол-очка в копилку Intel. При кодировании графики, видео и звука Пентиумы по-прежнему оказываются вне досягаемости — главным образом, благодаря технологии Hyper-Threading, которая в этих приложениях работает очень эффективно, а большой кэш Pentium 4 Extreme Edition тут добавляет всего 2,5%, а порой и меньше. Зато преимущества новой микроархитектуры AMD64 выливаются тут в 14–22%.Твердое очко в зачет прошлых заслуг Intel.

В играх ситуация двоякая — снова где-то быстрее Intel, где-то AMD. Например, в новейшем 3DMark2003 (с функциями DirectX 9) впереди Intel. Небольшой отрыв платформ друг от друга в этом тесте объясняется тем, что результаты здесь больше зависят от скорости графического ускорителя и его драйверов, нежели от процессора и системной памяти. Тем не менее, разница налицо. Интересно, что в чисто процессорном тесте этого пакета (см. выше) мы наблюдаем прямо противоположную картину — с завидным отрывом лидирует AMD. Ситуацию, видимо, можно объяснить так. В тяжелом графическом тесте большее влияние оказывает скорость работы видеокарты с системной памятью. Вместе с тем для чипсетов Intel шина AGP 8x общается с системной памятью непосредственно через низколатентный северный мост, тогда как для чипсета nForce3 шина AGP работает с памятью через цепочку «чипсет-HyperTransport-процессор-память», что неминуемо снижает скорость. Доказательством является слабое отличие Athlon XP от Athlon 64 в этом тесте. Напротив, в чисто процессорном тесте общение по AGP минимально, и высокая скорость памяти позволяет Athlon 64 быть в лидерах. Подтверждает вышесказанное более старый и менее требовательный к шине AGP (если на видеокарте много своей памяти) тест 3DMark2001SE (DirectX 8 и 7). Тут Athlon 64 почти на 20% быстрее Athlon XP и даже опередил Pentium 4 Extreme Edition, хотя последний тоже добавил больше 10% скорости настольной платформе Intel за счет кэш-памяти. Похожая картина и в игре Unreal Tournament 2003: Athlon 64 FX был почти на треть (!) быстрее Athlon XP (на той же тактовой частоте) и обошел P4EE, который прибавил всего 13%. Пока ничья в негласном соревновании процессоров.

Ситуация для Pentium 4 улучшается в играх под OpenGL. И в стареньком Кваке, и в более тяжелом RTCW Extreme Edition позволил Intel сохранить первенство: хоть Athlon прибавил 10–25%, Pentium пошустрел на 3–18%, чего пока хватило для лидерства. Игровой OpenGL-движок теста Vulpine GLmark 1.1 вообще не оставляет Атлонам никакого шанса. Да и в Serious Sam SE, всегда благоволившем к продукции AMD, экстремальному Pentium 4 хватило мощи потягаться даже с Athlon 64 FX-51: он почти догнал конкурента, прибавив по сравнению с обычным Pentium 4 почти 6%. Учитывая вышесказанное, счет по очкам примерно 4,5 на 3,5 (Intel против AMD). Конечно, это очень условная оценка. Производительности новых процессоров в профессиональной работе мы посвятим отдельный обзор (ведь не только геймеры покупают новые дорогие процессоры), а сейчас подведем итоги.

Корпорация Intel недаром опасалась выхода Athlon 64 FX: новый настольный процессор AMD получился очень удачным. Он заметно опережает прежний Athlon XP 3200+ при той же тактовой частоте ядра (2200 МГц) и безусловно отобрал пальму первенства у прежнего Pentium 4 3,2 ГГц на ядре Northwood. Вместе с тем расторопность, с которой Intel решила выпустить свой геймерский процессор Pentium 4 Extreme Edition с гигантским размером кэш-памяти (собственно, сейчас в арсенале Intel других возможностей наращивания производительности и не осталось; Prescott на 90-нанометровом ядре появится лишь к Новому году), сделала свое дело: практически одновременно с выходом AMD Athlon 64 мы получили (или вскоре получим) настольный процессор, который в среднем примерно равен по производительности старшему представителю конкурента или даже чуть быстрее его (по крайней мере, в нашем наборе тестов, в том числе — в играх). Победу в очередном раунде великого противостояния мы не присуждаем никому (но и поражения тоже!). Предпочтение пользователь может отдавать продукту той или иной фирмы исходя из тех задач, которые чаще приходится выполнять на ПК: в одних приложениях быстрее AMD Athlon 64 FX, в других — Pentium 4 Extreme Edition и даже обычный Pentium4! Вопрос за малым — сколько все это будет стоить? Учитывая, что AMD пока не планирует демпинговать с Athlon 64 и будет снимать сливки с новых моделей (а многие любили процессоры AMD именно за низкие цены), мы, видимо, получим ситуацию, когда процессоры с примерно одинаковым быстродействием будут стоить одинаково. И выбор будет определяться скорее вкусом, на который, как известно, товарища нет. Но мы не заканчиваем знакомство с новыми процессорами: нас еще ждут обзоры чипсетов и материнских плат в «большой Ферре». Следите за журналом и сайтом www.terralab.ru.

Особенности микроархитектуры AMD64

Первое и самое очевидное технологическое новшество архитектуры AMD64 — поддержка 64-разрядной адресации памяти и расширение регистров общего назначения. Таким образом, приложению теперь может быть выделено больше двух гигабайт памяти. X86-регистры общего назначения (GPR) стали вмещать 64 бита. От перехода с 286-го на 386-й это отличается тем, что число GPR еще и удвоилось, обеспечив более эффективное выполнение даже старого 32-битного кода и сделав код ассемблера компактнее. Главное преимущество 64-разрядности от AMD — полная совместимость и максимальное быстродействие 32-битных приложений. То есть все существующие операционные системы и приложения должны работать как минимум так же быстро, как и на Athlon XP. А для того, чтобы они заработали еще быстрее, достаточно их просто перекомпилировать. В дальнейшем ожидается выход приложений, оптимизированных с учетом новых возможностей. Впрочем, ждать поголовного роста производительности не стоит. Прирост скорости зависит от типа приложения и алгоритма реализации задачи. Можно провести аналогию с тем, что нам вполне хватает одной руки, чтобы нести сумку, хотя гвозди забивать гораздо проще двумя.
Упрощенная схема устройства нового процессора показана на рисунке. Следующее нововведение пока менее очевидно для массового пользователя, но на первых порах оно сделает больший вклад в производительность архитектуры, чем пресловутые 64 бита. Речь идет об интегрированном в процессор контроллере памяти. Теперь отпадает необходимость в доселе самом критичном компоненте чипсета. Благодаря этому, а также технологии высокоскоростной низколатентной передачи данных HyperTransport, проектировка чипсетов и материнских плат заметно упрощается. Так что незатейливые платы под Athlon 64 скоро будут стоить меньше ста долларов.
HyperTransport — основа систем с архитектурой AMD64. Именно эта технология межузловых соединений, на мой взгляд, определяет элегантность и красоту новой архитектуры — то, что позволяет ей найти применение везде — от мощнейших суперкомпьютеров до субноутбуков.
В новый процессор встроена поддержка пентиумовских мультимедиа-инструкций SSE2, что тоже должно помочь в приложениях, которые были так оптимизированы под Pentium 4 с его сильным SIMD-блоком, что не использовали ни аналогичный 3DNow! Professional у Athlon’а, ни FPU. Теперь даже сама AMD отмечает, что для разработки новых приложений лучше ориентироваться на SSE2, нежели на 3DNow! Для достижения более высоких тактовых частот основной конвейер удлинили с 10 до 12 стадий (у Р4 — 20 стадий). Снова «привет» Intel.

Кайрат Ахметов
[nomad@computerra.ru]

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.