Архивы: по дате | по разделам | по авторам

Я такое дерево

Архив
автор : Алекс Карабуто   17.01.2002

Сравнительные испытания процессоров Pentium 4 на ядре Northwood и ядре Willamette

Несколько лет назад, когда Intel только приступила к проектированию Pentium 4, в его архитектуру было заложено множество полезных нововведений. И процессор поначалу (на бумаге) выглядел очень впечатляюще. Однако по мере приближения проекта к виду, готовому для серийного производства, частью из этих возможностей приходилось жертвовать - то кристалл получался слишком большим и дорогим (для тогдашней технологии), то чрезмерное тепловыделение подводило. В конце концов, до нас дошло… ну в общем, то, что дошло. И в не слишком удачном соперничестве Pentium 4 на ядре Willamette (изготавливающемся по технологии 0,18 мкм) с процессорами AMD Athlon отчасти виноваты именно эти упрощения.

Со временем Intel освоила технологические нормы 0,13 мкм - сперва для процессоров Pentium III, а теперь мощностей стало хватать и для производства Pentium 4. В 2002 году у корпорации будет уже шесть фабрик, изготавливающих процессоры по этой технологии, причем две из них (D1C и F11X) будут работать сразу на новых пластинах диаметром 300 миллиметров. Переход с 0,18 на 0,13 мкм уже сам по себе способен удвоить количество чипов на одной пластине, а применение 300-миллиметровых пластин вместо 200-миллиметровых увеличивает полезную площадь еще в 2,5 раза и способствует заметному удешевлению процессоров. Кроме того, новая технология производства повышает технические характеристики процессоров. Так, 0,13-микрометровые с медными межсоединениями Pentium 4 на ядре Northwood имеют более низкое напряжение питания (1,5 В вместо 1,75 В для 0,18-мкм ядра Willamette), а значит, и меньшее тепловыделение - не более 49,8 Вт TDP для процессоров с тактовой частотой 2,2 ГГц (старшие модели Willamette могут выделять более 70 Вт). Новые кристаллы вмещают больше транзисторов: у Northwood на чипе площадью 146 кв. мм их 55 миллионов, тогда как Willamette, площадью 214 кв. мм, содержит всего 42 миллиона. При этом оказалось возможным наконец-то увеличить объем встроенной кэш-памяти второго уровня (L2): у Northwood она выросла до 512 Кбайт (более 20 млн. транзисторов) против 256 Кбайт у Willamette. То есть в Northwood компания Intel начала постепенно возвращаться к тому первоначальному «суперпроекту» Pentium 4, который должен был «потрясти мир».

К сожалению, этим дело пока ограничилось, и никаких других принципиальных нововведений ядро Northwood не содержит. По-прежнему мизерным остался кэш данных первого уровня (L1, 8 Кбайт), из-за чего на ряде задач процессор ведет себя весьма неторопливо. Не изменилась и математическая мощь процессора: урезанные (по сравнению с первоначальным проектом) дополнительные математические конвейеры так и не появились, и в многочисленных тестах простых математических расчетов Northwood и Willamette с одинаковой тактовой частотой ведут себя совершенно одинаково (чтобы не засорять статью бесполезными диаграммами, я эти тесты иллюстрировать не буду). Появившаяся в большинстве последних моделей Willamette «скрытая» поддержка двухпроцессорных конфигураций (On-chip APIC; видимо, чтобы не переделывать ядро для соответствующих процессоров Xeon) осталась и в Northwood (из одинаковых скриншотов для нескольких процессоров в двух программах WCPUid и TestCPU приведу только один).

Таким образом, фактически единственное отличие, которое может повлиять на скорость работы процессора, - это вдвое больший кэш L2. Ах да, есть еще одно! Применение новой технологии позволяет существенно повысить предел тактовой частоты процессора: если для Willamette пределом было 2-2,2 ГГц, то у Northwood ожидается прирост почти в полтора раза, и в перспективе называются цифры до 3 ГГц. Хотя в ближайшем будущем нас ждут более скромные значения: в первом полугодии мы увидим максимум 2,4 ГГц (весьма вероятно, что уже на системной шине 133 МГц), а к концу года предельная частота должна перевалить за 2,53 ГГц (см., например, roadmap процессоров Intel в «Фeрре» #12, «КТ» #425). Пока же в продажу поступают (по цене около полтысячи долларов) две модели - на 2 и 2,2 ГГц, причем первая, во избежание путаницы с одночастотным Willamette, будет иметь букву «А»: 2.0A. Кроме того, чуть позже ожидается появление моделей Northwood с еще более низкой частотой (1.6A и 1.8A), которые будут постепенно вытеснять соответствующие модели Willamette (как уже происходит с Celeron 1 и 1,1 ГГц).

Удвоение объема кэш-памяти второго уровня - мера очень полезная, особенно в такой системе с длинным конвейером, какой является Pentium 4. Поэтому мы вправе ожидать заметного прироста производительности нового ядра в реальных приложениях, и, возможно, это не только окажется решающим в противостоянии процессоров Intel и AMD, но и поможет сгладить различия в скорости систем с разным типом памяти (RDRAM, DDR SDRAM и SDRAM PC133). Напомню, что производительность Pentium 4 Willamette существенно зависела от типа платформы и применяемой памяти - см., например, наши обзоры в «КТ» #425, на www.ferra.ru/online/system/15065 и www.ferra.ru/online/system/14788.

Теперь перейдем к результатам сравнительных испытаний нового Pentium 4 Northwood 2,2 ГГц с Pentium 4 Willamette 2 ГГц на трех платформах с разной памятью:

  • RDRAM PC800 на плате ASUS P4TE;

  • DDR PC2100 на плате ASUS P4B266;

  • SDRAM PC133 на плате ASUS P4B.

Подробнее о методике читайте в «КТ» #425 или на сайте www.ferra.ru/online/system/14788. Подчеркнем, что использовалось 512 Мбайт системной памяти, поскольку гонять на таких системах под MS Windows XP Professional различные, не всегда «легкие» тесты при объеме памяти всего 256 Мбайт, по всей видимости, было бы не совсем корректно. Процессор на ядре Willamette и платы ASUS были предоставлены компанией «Пирит», а память производства Kingston и Transcend - компанией «АК-Цент Микросистемс». К сожалению, в инженерном образце Northwood, который находился в нашем распоряжении, множитель был зафиксирован, поэтому для сравнения процессоров на одинаковой тактовой частоте упомянутый Pentium 4 Willamette 2 ГГц был установлен на шину 110 МГц (на плате ASUS P4B266), то есть его частота составляла те же 2,2 ГГц. Небольшое повышение частот шины процессора и памяти при этом могло бы сыграть на руку Willamette, но ниже мы увидим, что получилось на самом деле. Для сравнения также использовалась «перспективная» система-фантом «P4 Willamette на шине 133 МГц с памятью DDR333», ставшая чемпионом среди всех систем на базе Willamette (подробности см. в обзоре www.ferra.ru/online/system/15065).

И в дополнение, в качестве своеобразного исследования потенциальных возможностей нового ядра, мы использовали платформу Pentium 4 Northwood 2,75 ГГц (частота системной шины 125 МГц) с памятью PC2700 (частота 166,7 МГц) на плате ASUS P4B266 (см. скриншот). К сожалению, наш сэмпл Northwood на более высоких частотах работал нестабильно, но для серийных процессоров порог частоты будет, скорее всего, выше. Поскольку полоса пропускания процессорной шины на частоте 500 (125) МГц существенно шире, чем у памяти PC2700 (4 Гбайт/с против 2,7 Гбайт/с), то такую систему можно условно считать аналогом процессора на «стандартной» (в недалеком будущем) частоте шины 533 МГц с памятью DDR333. Таким образом, мы попробуем предугадать производительность систем на Pentium 4 Northwood, которые должны появиться только в самом конце 2002 года.

Поскольку скорость работы нового процессора с памятью различных типов осталась практически неизменной, результаты соответствующих тестов опущены (их можно посмотреть, например, в вышеупомянутых обзорах). Относительно простой математической производительности: как я уже говорил, она совершенно одинакова для процессоров Northwood и Willamette с одинаковой тактовой частотой (использовались тесты ProcessorMark, TestCPU, CPUMathMark, SiSoft Sandra 001 Pro и некоторые другие). Например, по «Сандре» итоговый математический рейтинг обоих процессоров на частоте 2,2 ГГц составил примерно 2650 единиц (и около 2400 для всех процессоров с частотой 2 ГГц). Идентичные показатели для процессоров с одинаковой частотой были и в двух из трех более сложных математических тестах из пакета Science Mark V1.0: Simulate Liquid Argon at 140K (см. диаграмму) и при квантово-механических вычислениях энергии молекулы воды. Более того, время конвертации wav-файла в формат MP3-кодером LAME 3.89 (для различных битрейтов) тоже почти не зависело ни от чего, кроме частоты процессора (диаграммы можно даже не приводить, настолько все однообразно).

Теперь посмотрим, какой выигрыш дает увеличенный вдвое кэш L2. Практически во всех тестах (см. диаграммы; полные результаты тестов приведены на www.ferra.ru/online/system/15067) система Willamette 2,2 ГГц с DDR заметно отстает от аналогичной системы на Northwood, даже невзирая на чуть более быстрые (на 10%) шины процессора и памяти у первого. Другая закономерность - разрыв (в процентном соотношении) между платформами с разным типом памяти в некоторых тестах немного сократился для Northwood по сравнению с Willamette. То есть большой кэш процессора иногда «сглаживает» разницу в скорости памяти. Хотя справедливости ради надо сказать, что это происходит далеко не всегда, и примерно в половине наших тестов разрыв между платформами с разной памятью остался таким же, каким был с Willamette. Это говорит лишь о том, что на подобных задачах даже большой кэш требует постоянного обновления.

Синтетический тест CPUmark 99 наглядно показывает благотворность большого кэша: Willamette отстал от одночастотного Northwood (с памятью DDR) почти на 5%, а отставание Willamette 2 ГГц составляет аж 13%, то есть 3-5% прироста скорости системы приходятся именно на увеличенный кэш процессора. В тестах SysMark 2001 рост производительности всех систем тоже превышает прирост частоты: те же пять дополнительных процентов можно смело поставить в заслугу кэшу. Платформы на Northwood с памятью DDR и RDRAM выглядят превосходно, да и с PC133 новичок тоже обгоняет практически все системы на Willamette на радость поклонникам дешевой памяти. В тесте Atomic RHF Promethium (расчет волновой функции атома) пакета Science Mark (напомню, что этот тест чувствителен к пропускной способности шин памяти и процессора) прирост скорости тоже больше роста частоты процессора, а влияние медленной памяти (PC133 и др.) с Northwood менее заметно, чем с Willamette. Другой же тест из Science Mark демонстрирует результаты, пропорциональные приросту частоты CPU, а одночастотные Northwood и Willamette считают одинаково быстро.

В тесте Video 2000 (работа с двумерной графикой и видео) рост производительности системы на новом процессоре не очень заметен, и чувствуется явное влияние скорости работы памяти. Непосредственное кодирование видео во FlasK (MPEG4-кодеком DivX 4.11) и в Windows Media Encoder 7 отчасти реабилитируют Northwood для видеоприложений - в WME выигрыш достигает 14-15% (минимум 4-5% из них следует отнести на счет кэша), Willamette 2,2 ГГц с DDR проигрывает даже Northwood с PC133, а во FlasK влияние скорости памяти чувствуется сильнее, хотя и не фатально.

Скорость архивирования в WinRAR 2.90 вторит кодеру DivX 4.11: быстродействие памяти очень сильно влияет на работу, но большой кэш вносит свои дополнительные проценты производительности. «Чисто математическое зипование» выглядит почти как все тесты простой математики, однако и тут Northwood (даже со SDRAM) одолел Willamette 2,2 ГГц, показав семипроцентный прирост только за счет кэша.

Игровые DirectX-тесты 3DMark 2001/2000 находятся в русле общих закономерностей: «Нортвуд» обходит все «Вилламетты» даже с PC133 в 3DMark 2000, да и в DirectX 8 (3DMark 2001) его преимущество ощутимо. «Quake III Arena» вторит остальным: пропасть между PC800 и PC133 неуклонно сокращается, когда используется Northwood, хотя этот тест так любят «оптимизаторы» железа и софта, что к его результатам следует относиться с большой осторожностью и перепроверять на менее «заезженных» движках. В «Серьезном Сэме» и особенно в игровом тесте Vulpine GLMark 1.1 (OpenGL) прирост скорости только за счет кэш-памяти Northwood доходит до 10-15%. А в DroneZ Benchmark скорость Northwood с быстрой памятью уже столь велика, что при нормальных «игровых» разрешениях начинает «упираться» в возможности видеоускорителя. И возникает дилемма: либо использовать почти одинаковые для всех конфигураций данные в комфортных (то есть реальных) для этой игры разрешениях, либо, как и в «Quake III», зашкаливать под 300 кадров в секунду на 640х480х«гадкое качество картинки». Но скажите, кому (кроме собственно тестеров) нужны такие данные, которые не имеют никакого отношения к реальным условиям игры (и которые можно оценить как примерно 100 fps с хорошим качеством картинки)? Или спорт ради спорта? Даешь 1000 кадров в секунду! И повесим сертификат на стенку. Короче, с приходом процессора Northwood пора поднимать вопрос о новых игровых тестах (в частности, OpenGL), которые бы лучше учитывали реальную игровую ситуацию. Вот такие теперь будут скорости. Кстати, вышеупомянутые Serious Sam, Vulpine GLMark и некоторые другие пока не страдают недостатками доселе любимых публикой «Квака» и «Дрона» и к тому же прекрасно «чувствуют» слабые места всей системы, включая кэш, шины процессора и памяти.

Результаты тестов производительности процессоров на платформах с разным типом памяти.

Вторят этим рассуждениям и результаты пакета тестов SPEC viewperf v6.1.2: с приходом Northwood «все смешалось в доме Облонских», и к двум уже давно «упершимся» в скорость видеокарты тестам Awadvs04 и ProCDRS03 теперь присоединяются DRV07 и MedMCAD01. Взгляните на диаграмму: трем верхним строчкам явно не хватает возможностей GeForce 3, хотя еще совсем недавно все было OK. А два оставшихся теста - DX06 и Light04 - демонстрируют такое странное поведение, что впору упрекать Northwood за общение с нечистой силой. Хотя проще, конечно, смекнуть, что и популярный, но уже довольно старенький тест SPEC viewperf v6.1.2 с приходом Northwood пора отправлять на покой, а уважаемой компании изобрести OpenGL-тестик поновее на радость широкой общественности.

Подведем краткие итоги. Я догадывался, что Northwood способен поколебать сложившиеся в отрасли «устои», но, честно говоря, не ожидал, что настолько. Новое ядро старого процессора фактически реабилитирует порядком критикуемый всеми кому не лень Pentium 4 и ставит его на вершину «каменной» пирамиды. Теперь для Intel главное - не затягивать искусственно рост частоты этой линейки процессоров, а поскорее перейти на шину FSB 133 МГц (а памяти - на DDR333) и достигнуть предела в 3 ГГц. Вот тогда даже грядущему 0,13мкм AMD Athlon XP на ядре Thoroughdred придется напрягать мускулы, чтобы выглядеть достойно. Впрочем, ждать его осталось не долго. Тогда и посмотрим.

[i42634]

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.