Самый дорогой процессор AMD[Не считая серверных процессоров, конечно]
АрхивТестирование процессоров - занятие неблагодарное. Если новый CPU отличается от предшественников только тактовой частотой и объемом кэша, то вроде и писать особенно не о чем, роль журналиста сведена к роли эдакого "обслуживающего персонала", прогоняющего набор своих любимых тестов и пытающегося по полученной горке цифр объективно оценить производительность новинки.
Тестирование процессоров - занятие неблагодарное. Если новый CPU отличается от предшественников только тактовой частотой и объемом кэша, то вроде и писать особенно не о чем, роль журналиста сведена к роли эдакого "обслуживающего персонала", прогоняющего (зачастую в виде пакета) набор своих любимых тестов и пытающегося по полученной горке цифр объективно оценить производительность новинки.
Если же новый кристалл принципиально отличается от своих предков, то, как правило, у него найдется какой-нибудь мерзкий недостаток (а порой и не один). То он не намного опережает по быстродествию своих собратьев, то слишком сильно греется, то требует покупки комплектующих на полтысячи долларов. И общее впечатление (которое потом обязательно отразится в статье) получается не "я себе такой же хочу", а "хотели как лучше, а получилось как всегда"…
Как же так, - возмутится читатель, - ведь из любого правила обязательно должны быть исключения! А вот и нет, - ответим мы, - ибо если процессор очень быстрый, "холодный" и совместимый со всем на свете, то от его цены у вас глаза на лоб полезут. Новинка от AMD - Athlon 64 FX 57 - обладает всеми качествами "идеального процессора", однако его цена[$1031 на момент написания статьи] бьет все рекорды: это самый дорогой настольный процессор за последние пять лет. Даже за топовые двухъядерные чипы (особенно после недавнего снижения цен) сегодня просят заметно меньшие деньги. Но по большому счету это единственный недостаток FX 57. Вдобавок процессор для тестирования достался нам совершенно бесплатно. Так что, покончив с неизменной "ложкой дегтя", перейдем к хвалебной части.
Технические подробности
FX 57 - самый яркий представитель второго поколения 90-нм технологических норм ("степпинга E"), использующегося сегодня для изготовления всех новых процессоров AMD[Опознать процессоры этого степпинга можно по последним двум буквам в полной маркировке (Ordering Part Number, OPN): BP и BQ - соответствуют степпингу E3; BN и BV - степпингу E4; BW, BX и CD - степпингу E6. Например, для FX57 - ADAFX57DAA5BN - OPN соответствует степпингу E4. В прайсах Ordering Part Number, как правило, не пишут, но посмотреть его можно всегда: именно OPN выгравирован на кристалле второй строчкой]. Эра старых добрых 130 нм завершена: в июле 2005 года AMD практически целиком перевела[Не считая, конечно, разной "непрофильной" продукции и продукции, производимой по специальным заказам] свое производство на более "тонкие" и экономичные варианты. И это, кстати, означает, что отныне окончательно похоронен настоящий Мафусаил среди процессорных разъемов - Socket A: процессоры для него, кроме как по особым заказам, производиться больше, увы, не будут. Но и грустить по этому поводу тоже особенно не приходится: чипы Sempron Socket A архитектуры K7, основанные на ядрах Thoroughbred-B и Thorton, честно скажем, безнадежно устарели, и единственной причиной, по которой их продолжали изготавливать, была невозможность выпускать столь же большое количество куда более сложных и дорогих процессоров, основанных на архитектуре K8. Правда, первое поколение 90-нм CPU от AMD ("степпинг D") было неспособно работать на достаточно высоких (выше 2,2 ГГц) тактовых частотах, но благодаря технологии "растяженного кремния" (Dual Stress Liner в терминологии AMD) теперь решена и эта проблема - Athlon 64 FX 57 работает на заоблачной по меркам процессоров Athlon тактовой частоте 2,8 ГГц. Это первое и главное достоинство нового "экстремала". На звание "быстрейшего одноядерного процессора в мире" успешно претендовали еще Athlon 64 4000+/3800+ (2,4 ГГц); имеющий же относительно них 17-процентную прибавку к тактовой частоте FX 57 не только абсолютно недосягаем в "любимых приложениях AMD" - играх, но и успешно "бьет противника на чужом поле", умудряясь в ряде "любимых приложений Intel" обгонять топовый Pentium 4 670 (3,8 ГГц).
Второй козырь нового степпинга - поддержка набора инструкций SSE3, впервые появившегося в Pentium 4 Prescott[И поэтому также известного как Prescott New Instructions (PNI)]. Тринадцать новых инструкций (из которых две - MONITOR и MWAIT, связанные с технологией HyperThreading, - выделены в особый "подблок" и процессорами AMD принципиально не поддерживаются) есть своеобразная "работа над ошибками"; инженеры Intel посчитали целесообразным добавить их по итогам практического использования действительно новаторских SSE/SSE2. Каждая такая инструкция фактически рассчитана на использование буквально в одной-двух ситуациях, когда традиционные схемы требуют "недостаточно быстрых" (как в случае с HADDPS, осуществляющей сложение компонентов внутри одного вектора) или "некрасивых решений" (в случае с FISTTP, округляющей число в сторону нуля, как того требует стандарт языка C, независимо от выбранного для сопроцессора режима округления). Потенциально все эти инструкции способны многократно повысить производительность некоторых участков кода; на практике[Подробности см. на www.anandtech.com/cpuchipsets/showdoc.aspx?i=2350] же такие участки встречаются сравнительно редко и с трудом поддаются "компиляторным" оптимизациям (программисту требуется либо использовать стандартные, вручную оптимизированные библиотеки, либо возиться с оптимизацией "критичных" участков кода на ассемблере, что требует сегодня очень высокой квалификации). Вдобавок для "неудачных" языковых конструкций (типа округления чисел с плавающей точкой в x87) давно найдены эффективные "обходные пути" с использованием "нетиповых" инструкций (PF2ID, CVTSS2SI или CVTPS2PI вместо стандартной FISTP). В итоге прирост производительности от поддержки SSE3 составляет всего пару процентов, лишь изредка доходя до 7–8%[В некоторых подтестах прирост производительности куда больший - до 25%, однако в целом даже в таких приложениях итоговая производительность увеличивается ненамного. Например, прирост скорости при кодировании видео в DivX - 0,26%]. Так что ожидать от SSE3 многого не приходится, однако "фича" это приятная.
Третье достоинство степпинга E - усовершенствованный контроллер памяти[По неофициальной информации, степпинг D имеет проблемы с интегрированным контроллером памяти: некоторые процессоры нестабильно работали даже на номинальных частотах. Правда, скорее всего, "бракованные" CPU были простой перемаркировкой своих менее дорогих и менее шустрых собратьев: тогда на рынке присутствовало много поддельных процессоров AMD, что даже вынудило компанию практически отказаться от треевых поставок в пользу боксовых (PIB) процессоров, надежно защищенных от подделок]. В основном изменения касаются улучшенной совместимости контроллера с "быстрыми" типами оперативной памяти - теперь можно использовать гораздо более быструю 1T-адресацию с одиночными (по одному на канал памяти, коих у Sempron один, а у Athlon 64 - два) модулями памяти практически любой организации (если сами модули, конечно, эту адресацию "вытянут") и с парами (для Athlon 64 это означает четыре модуля) односторонних модулей DDR400. Кроме того, появилась и долгожданная неофициальная поддержка нестандартной "быстрой" оперативной памяти стандартов DDR433, DDR466 и DDR500 без повышения тактовой частоты процессорной шины! Да-да, отныне преимуществами этих скоростных модулей смогут в полной мере насладиться не только оверклокеры, разгоняющие процессоры с риском для стабильности системы, но и добропорядочные пользователи, строго придерживающиеся спецификаций. Здесь, правда, следует сделать поправку на некоторые особенности архитектуры K8 (см. врезку); да и прирост производительности от 10–20% прибавки пропускной способности оперативной памяти не очень большой, однако в целом - штука чрезвычайно интересная. Для ее поддержки (чтобы появилась возможность выбрать "быстрые" разновидности оперативной памяти) требуется обновить BIOS; соответствующие апдейты к своим материнским платам многие производители уже выпустили. Правда, из-за того, что JEDEC (организация, занимающаяся выработкой стандартов на оперативную память) и DDR400-то стандартизировала "со скрипом", а о более быстрой памяти DDR пока и речи не идет, гарантировать, что свежекупленная "оверклокерская" память и процессор заработают на заявленных таймингах без проблем, вам никто не сможет.
Заявленное максимальное тепловыделение (TDP) осталось тем же, что и у "старичка" FX 55 (104 Вт): чуть ниже TDP новых двухъядерных процессоров (110 Вт), тоже основанных на степпинге E4. С полутора до 1,4–1,35 В снизилось напряжение питания ядра; слегка увеличился потребляемый при работе ток; однако проблем с совместимостью нового процессора со старыми схемами питания (VRM) возникнуть не должно[За исключением совсем уж дешевых или старых материнских плат, не обеспечивающих совместимости с FX55 и 90-нм процессорами]. По-прежнему разблокирован на повышение коэффициент умножения процессора; правда, разгоняется FX 57 пока довольно умеренно (с воздушным охлаждением можно заведомо рассчитывать разве что на 3,0 ГГц). Кстати, в отличие от тех времен, когда в линейке Athlon 64 FX фигурировал один и только один процессор, старый FX 55 будет выпускаться по-прежнему, но уже в 90-нм исполнении[Предыдущий вариант изготовлялся по старому 130-нм технологическому процессу, но якобы с некоторыми хитрыми "доработками" (выдвигались даже гипотезы о применении в FX 55 технологии DSL и частичном использовании 90-нм норм для критичных участков). Учитывая колоссальную стоимость разработки отдельного степпинга специально для ничтожного по объему выпуска FX 55, информация эта относится скорее к разряду мифических] и в степпинге E4. Вполне разумное решение, учитывая более приемлемую ($827) цену "младшей" модели и то, что "идеология" линейки FX (топовые и только топовые процессоры, лучшие в мире) при этом не нарушается: что FX55, что FX57 в своей "игровой" нише все равно конкурентов не имеют.
Тесты производительности
Ограниченность журнального пространства, к сожалению, не позволяет рассказать о полученных результатах подробнее. Так что просто смотрите в таблицу, а я постараюсь кратко прокомментировать самые интересные из них.
В играх Athlon 64 FX 57 просто нет равных. Причем чем новее и требовательнее к процессорным ресурсам игра, тем больше отрыв Athlon 64. В Half-Life 2 с его сложной реалистичной физикой (на движке Havok 2) отрыв FX 57 от лучшего решения Intel (Pentium 4 670) составляет, ни много ни мало, аж 36%! Причем обещанный в недалеком будущем FX 59 может довести этот разрыв до совсем уж неприличной полуторакратной (!) разницы; а никакого достойного "противовеса" в ближайшие несколько лет (!) Intel нам не обещает. Да, с появлением хорошо распараллеленных многопоточных игр ситуация может измениться; да, в играх с менее развитой (UT 2004 - 26%) и совсем неразвитой (Doom 3 -14%) физикой разница в производительности не столь значительна, однако то, что на ближайшие два года Athlon 64 FX будет безусловным лидером в играх, можно не сомневаться.
Вторая область, где FX безоговорочно лидирует, - это "интерактивные приложения". Буквально везде, где программа активно взаимодействует с пользователем, а не считает тихонечко чего-нибудь пару часов, Athlon 64 FX 57 без труда опережает всех преследователей.
Рендерить трехмерные сцены или кодировать видеофильмы пока, впрочем, лучше на процессорах Intel. Правда, на двухъядерных процессорах AMD это получается еще быстрее, но это уже совсем другая история. Однако положительные сдвиги у AMD есть и в этой области: например, в наших тестах FX 57 впервые сумел обогнать Pentium 4 670 при кодировании видео с помощью довольно популярного Windows Media Encoder 9. Да и в остальных тестах отставание не столь велико: скорее всего, заметной разницы вы здесь не почувствуете.
Единственное "слабое место" FX проявляется только при одновременной работе нескольких "тяжелых", ресурсоемких приложений. Производительность его при этом просаживается очень сильно, вплоть до "замораживания" под большой нагрузкой графического интерфейса Windows.
Выводы
Отдавать процессор после недельного тестирования не хотелось. Очень не хотелось. Даже нам, завзятым железячникам, немало повидавшим на своем веку. На сегодняшний день это объективно лучший одноядерный процессор. Просят за него, конечно, немало, но он того стоит.
Благодарим компанию AMD за предоставленный образец процессора Athlon 64 FX 57.
В CPU архитектуры K8 контроллер памяти интегрирован непосредственно в кристалл и соединен с ним, внешним миром и некоторой обслуживающей логикой через интегрированный в процессор же "свитч" (так называемый кросс-бар). Все это хозяйство работает на одной тактовой частотой с процессорным ядром, а потому чем выше частота - тем быстрее работают все компоненты чипа. Однако у подобного решения есть и недостатки: работать с оперативной памятью подобный контроллер может только в синхронном режиме. Проще говоря, в один такт шины памяти должно укладываться целое число тактов процессора. Нетрудно догадаться, что при подобном подходе тактовая частота оперативной памяти получается делением тактовой частоты процессора на некоторое целое число - коэффициент деления памяти (memory divider). Но всегда ли этот коэффициент можно подобрать? Ответить на этот вопрос нам поможет таблица.
Оранжевым цветом я выделил встречающиеся на практике комбинации коэффициентов деления памяти и процессорных множителей (и соответствующих им тактовых частот). Чем насыщеннее цвет - тем быстрее память. Нетрудно убедиться в следующем: благодаря тому, что опорные тактовые частоты шин HyperTransport и шины памяти DDR400[Правда, "несущая" тактовая частота шины HyperTransport выше и получается умножением базовой частоты на специальный "множитель HT". Например, у степпингов D и E этот множитель равен 5. С учетом того, что в HyperTransport данные передаются дважды за такт, "эффективная" частота передачи данных по стандартному линку HT у новых процессоров AMD составляет 2000 МГц, а не "базовые 200".] совпадают (200 МГц[Как и в случае с шиной HyperTransport, данные для DDR SDRAM (Double Data Rate SDRAM), что следует из названия, передаются дважды за такт. Поэтому тактовая частота DDR400 равна 200 МГц (400/2)]), подходящий целочисленный коэффициент (равный коэффициенту умножения процессора) для этого типа памяти всегда легко отыскать, причем тактовая частота оперативной памяти в точности равна стандартным 200 МГц. То же самое можно сказать про оперативную память DDR200 (выделена светло-серым). А вот с памятью других стандартов дела обстоят хуже.
Взглянем, например, на часто использующуюся совместно с процессорами Opteron оперативную память DDR 333. Нетрудно заметить, что подобрать коэффициент деления так, чтобы результирующая тактовая частота равнялась в точности 166,67 МГц, можно сегодня только в одном-единственном случае - при использовании процессора с частотой 2,0 ГГц. В остальных случаях приходится выбирать из "более или менее близких" к 166,67 МГц вариантов, от 160 до 169 МГц включительно. Но все-таки подобрать подходящие коэффициенты для DDR333 и DDR266 с приемлемой точностью можно всегда.
А вот найти коэффициенты для более быстрой памяти стандартов DDR433/450/466/500 уже труднее. Почти всегда можно подобрать коэффициент для частот порядка DDR433–466 (217–233 МГц) или DDR480–520 (240–260 МГц), однако "погрешность" при этом получается огромная. Так что выбранный в BIOS Setup пунктик "DRAM Frequency: 466 МГц" может с равным успехом означать, что память будет работать как DDR440 или DDR480 - это уж как с процессором повезет.
Нестандартной оперативной памяти - нестандартные частоты: неудивительно, что JEDEC этот кошмар даже не пытается стандартизировать. Ситуация обещает исправиться только с переходом на модули DDR2: за счет передачи данных четырежды за такт, частоты этой памяти замечательно ложатся в хорошо освоенный диапазон 100–200 МГц.