Архивы: по дате | по разделам | по авторам

Intel опрескотилась

Архив
автор : Александр Карабуто   11.02.2004

Второго февраля наконец свершилось то, чего вся компьютерная индустрия ждала по меньшей мере полгода.

Второго февраля наконец свершилось то, чего вся компьютерная индустрия ждала по меньшей мере полгода. Официально увидели свет новые процессоры Pentium 4 на ядре Prescott, принципиально отличающиеся от предшественников на ядре Northwood по трем важнейшим категориям: микроархитектуре процессорного ядра, технологическому процессу изготовления кристаллов и материалами, применяемым при изготовлении кристалла. Всё вместе это обещает открыть новые горизонты для дальнейшего наращивания быстродействия процессоров архитектуры Intel NetBurst. Но обещания обещаниями, а что реально мы получаем с выходом Prescott и стоит ли овчинка выделки? Это и предстоит нам выяснить.

Давненько корпорация Intel не радовала нас новыми процессорами для настольных ПК. После выхода весной этого года целого сонма процессоров Pentium 4 на ядре Northwood (частоты от 2,4 до 3,0 ГГц, системная шина 800 МГц) и двухканальных DDR400-чипсетов для них серий i875 и i865 (Canterwood и Springdale) (см., например, обзоры на www.terralab.ru/system/25198 , www.terralab.ru/system/25235  и в «КТ» #506-507) последовал лишь еще один процессор в июне — Pentium 4 3,2 ГГц (www.terralab.ru/system/25250 ). Затем наступило длительное затишье, нарушенное лишь появлением очередных Celeron. По сути дела, корпорация не объявляла новых Pentium 4 для массового рынка больше семи (!) месяцев.

Правда, в середине осени Intel выпустила еще одну новинку — Pentium 4 Extreme Edition 3,2 ГГц, у которого объем кэш-памяти третьего уровня (2 Мбайт), площадь кристалла и количество транзисторов были просто чудовищными для настольных систем (см. www.terralab.ru/system/29365 ). Но и цена этого «экстра-геймерского» процессора оказалась не менее чудовищна — под тысячу долларов. А если учитывать, что в рознице эти монстры появились лишь недавно и их продажи на фоне обычных Pentium 4 до сих пор ничтожны, то Extreme Edition вполне можно отнести к своеобразному «процессору ради престижа», не делающему погоды на массовом рынке ПК (по самым оптимистичным прогнозам корпорации, доля P4EE среди всех «Пентиумов» не превысит 5%). Так что понятно, почему Prescott, обладающий мегабайтной кэш-памятью второго уровня, ожидали с таким нетерпением.

Первые сведения о Prescott просочились в прессу пару лет назад, а в феврале прошлого года корпорация огласила основные архитектурные особенности будущего процессора и подробно рассказала о технологиях и материалах, применяемых для его изготовления (см., например, мою статью на www.terralab.ru/system/23898 ). Спустя полгода Intel продемонстрировала процессоры в работе, показала фотографию кристалла Prescott и обнародовала дополнительные подробности — количество транзисторов, размер чипа и пр. (см. www.terralab.ru/system/29227 ).

Поначалу руководители корпорации обещали выпустить процессор осенью 2003 года. Однако «полночь близилась, а Германа все не было»… За это время главный конкурент Intel на рынке процессоров для ПК — компания AMD — успела трижды (!) выпустить новые процессоры: в конце сентября вышел долгожданный Athlon 64 3200+ (см. www.terralab.ru/system/29375) ; в декабре появился первый недорогой настольный Athlon 64 3000+, отличавшийся от 3200+ только уменьшенной вдвое кэш-памятью второго уровня, и, наконец, в начале января увидел свет великолепный Athlon 64 3400+, который на равных соперничал с самыми мощными настольными процессорами Intel и со своим более дорогим собратом Athlon 64 FX-51 (см. www.terralab.ru/system/31549). И это при том, что он работал всего с одним каналом обычной памяти DDR400, тогда как все остальные «топ-модели» требовали для реализации своего скоростного потенциала как минимум двухканального DDR400-решения.

Поклонники Intel ожидали ядра Prescott как чуда. Увеличенная вдвое кэш-память первого и второго уровня вкупе с другими усовершенствованиями (новые инструкции SSE3, улучшенные Hyper-Threading, механизм предвыборки и предсказание ветвлений) обещали если не прорыв, то, по крайней мере, существенный рост производительности по сравнению со старым ядром. Ранние «оценочные» степпинги Prescott ходили по лабораториям и OEM-партнерам Intel еще с осени, однако особых восторгов по их поводу мне слыхивать не доводилось. А пока руководители корпорации уверяли, что процессор «уже готов» и с четвертого квартала 2003 года «уже идут» его коммерческие поставки OEM-производителям, из недр Intel доносились слухи о задержках, вызванных необходимостью «дооптимизировать» технологию производства и ядро процессоров ради получения нужного теплового режима старших моделей и приемлемого для массового производства выхода годных кристаллов.

И поскольку тянуть с официальным объявлением Prescott было уже неприлично, процессоры выпустили 2 февраля. Однако удалось ли производителю в полной мере побороть «детские болезни» нового ядра? Судя по нехватке старших моделей Prescott (с частотой 3,2 и 3,4 ГГц), которую испытывают даже ведущие тестовые лаборатории, — не совсем удалось. Например, модель 3,40Е не видел живьем еще никто из моих знакомых, а 3,20E пробыла у нас в редакции всего три рабочих дня, поскольку ее как жуткий дефицит «рвали на части». Да и в первые дни после выхода я не обнаружил ни одного предложения 3,20E в российских магазинах. С другой стороны, подобный ажиотаж, возможно, объясняется тем, что процессор удался на славу и его просто «сметают из-под прилавков».

Итак, Intel выпустила сразу семь новых Pentium 4. Их перечень и некоторые характеристики приведены в табл. 1.


Pentium 4 3,40 ГГц (на ядре Northwood) и Pentium 4 Extreme Edition 3,40 ГГц — это по сути те же, что и раньше, процессоры, только с чуть более высокой частотой ядра. Так что наибольший интерес для нас представляет линейка на ядре Prescott. «Прескотты» внешне почти не отличаются от традиционных Pentium 4 — они упакованы в тот же корпус для разъема Socket 478, и лишь иное расположение элементов с обратной стороны (фото 1) говорит о том, что перед нами именно они.

Все новинки используют системную шину 800 МГц и технологию Hyper-Threading, кроме самого младшего — «гадкого утенка», «разжалованного» до шины 533 МГц и лишенного HT. Предположительные причины появления такой модели: а) необходимость продать процессоры Prescott ранних степпингов, не столь шустрых и экономичных, как текущие модификации; б) необходимость иметь «свой Prescott» для низкостоимостных систем на чипсетах, не поддерживающих шину 800 МГц; в) компания оставляет лазейку для продажи «отходов» производства более высокочастотных моделей. Последнее предположение имеет под собой гораздо больше оснований, нежели для Northwood. Дело в том, что в ядре Prescott заметно возросли токи утечки и тепловыделение (сто с лишним ватт у старших моделей), а это накладывает более жесткие требования на тестирование ядер для той или иной частоты/модели. Если процессоры на ядре Northwood (и предшественники) имели близкие характеристики зависимости рассеиваемой мощности от частоты работы, то для Prescott имеет место гораздо больший разброс характеристик кристаллов даже внутри одной партии и кремниевой пластины. В результате производитель вынужден выпускать каждый конкретный экземпляр кристалла для строго определенной (по частотным и тепловым характеристикам) модели процессора с весьма небольшими допусками. С этим связан и тот факт, что процессоры на ядре Prescott будут разгоняться неохотно — даже небольшое повышение частоты вызовет у них резкое повышение тока потребления и температуры, что негативно скажется на стабильности и живучести процессора. Это, кстати, подтвердил и побывавший в нашей лаборатории экземпляр. Prescott 3,20E с большим трудом удалось разогнать до 3,4 ГГц, причем работал он нестабильно, выделяя гораздо больше тепла, чем на штатной частоте. Таким образом, стандартный плавкий термоинтерфейс с обратной стороны боксовых кулеров (фото 2) я настоятельно рекомендую заменять хорошей термопастой, если вы имеете дело с процессорами Prescott.

Некоторые характеристики кристаллов трех типов процессоров (Extreme Edition, Northwood и Prescott) приведены в табл. 2. Для сравнения мы поместили в таблицу и AMD Athlon 64 ClawHammer.

Количество транзисторов у Prescott увеличилось по сравнения с Northwood более чем вдвое, но за счет применения нового техпроцесса площадь кристалла даже немного уменьшилась. Вместе с тем оба заметно уступают по площади и числу транзисторов ядру Gallatin. Если учесть, что ячейка кэш-памяти требует шести транзисторов (плюс примерно один транзистор в расчете на одну ячейку используется для «вспомогательных» нужд — магистральные буферы, мультиплексоры и пр.), то получается, что добавление 512 Кбайт кэш-памяти второго уровня потребовало около 30 миллионов транзисторов, а остальные 40 миллионов ушли на другие архитектурные усовершенствования ядра Prescott. Это огромное количество, ведь ядро Northwood без кэш-памяти второго уровня содержит всего 25 миллионов «затворов»!

Еще весной прошлого года специалисты сайта Chip Architect провели подробный анализ расположения и состава каждого из блоков ядра Prescott (см. фото 3 и статьи на www.chip-architect.net/news/2003_03_06_Looking_at_Intels_Prescott.html  и www.chip-architect.com/news/2003_04_20_Looking_at_Intels_Prescott_part2.html) . В частности, выяснилось, что многие блоки существенно избыточны и/или содержат скрытые возможности, среди которых не только очевидные модули для поддержки технологии La Grande (официально Prescott ее пока не поддерживает) и шины для связи с кэш-памятью третьего уровня (самой памяти L3 на кристалле, естественно, нет), но и, вероятно, блоки для реализации технологии Vanderpool и 64-битных вычислений.

Что же касается официально объявленных нововведений ядра Prescott — о них мы писали почти год назад (www.terralab.ru/system/23898) ,  и с тех пор изменилось немногое (см. табл. 2 и рис. 4).

Во-первых, вдвое увеличена кэш-память не только второго, но и первого уровня. Причем у L1 также вдвое увеличена ассоциативность. Правда, заметно (опять-таки примерно вдвое) возросла латентность каждой из них.

Во-вторых, улучшен блок предсказания ветвлений и механизм предвыборки.

В-третьих, добавлено тринадцать новых инструкций (Prescott New Instructions, PNI), улучшающих комплексные расчеты по SSE/SSE2/x87-FP-командам и позволяющих ускорить выполнение мультимедийных и игровых приложений (рис. 6). По аналогии с предшественницами эти инструкции назвали SSE3; они не требуют специальной поддержки со стороны операционной системы (достаточно поддержки SSE) и полностью совместимы с программным обеспечением, написанным для процессоров Intel. По оценкам компании, перекомпиляция (уже вышел соответствующий компилятор от Intel) приложений под SSE3 способна поднять быстродействие в среднем на 5%. Среди уже оптимизированных для SSE3 приложений — будущая версия Unreal II, видеокодировщики MainConcept, xMPEG, Ligos, Real (RV9), On2 (VP5/VP6), Pegasys TMPGEnc 3.0, Adobe Premier, Pinnacle, Sony DVD Source Creator, Ulead (MediaStudio & Video Studio, Intervideo и другие, использующие кодек DivX 5.1.1.

В четвертых, доработана технология Hyper-Threading, с тем чтобы сделать переключение между тредами более предсказуемым: в частности, наряду с симметричными введено понятие асимметричных тредов (рис. 7). Специально для этого изменили конвейер, теперь больше исполняющих блоков «распараллелено» (рис. 3). Наконец, улучшен режим управления. Блок-схема ядра Prescott, немного проясняющая его структуру, приведена на рис. 5.

 

Несмотря на множество улучшений, в новом ядре есть и несколько вынужденных «ухудшений». Эти «ухудшения» возникли не от хорошей жизни — они фактически являются альтернативным подходом при проектировании и призваны, на самом деле, улучшить те или иные параметры процессора в расчете на долговременную перспективу и рост частоты ядра. Главным и наиболее критичным для быстродействия процессора изменением стало увеличение длины основного конвейера с 20 тактов до 31. Именно это, а не применение 90-нанометровой технологии в перспективе позволит поднять тактовую частоту ядра процессора до 5 ГГц и выше.

Вместе с тем, как мы прекрасно помним по переходу с 10-стадийного на 20-стадийный конвейер (от Pentium III на Pentium 4), это может существенно ухудшить быстродействие системы в некоторых задачах, где велик процент неудачных предсказаний переходов. Чтобы снова не наступать на те же грабли, корпорация предприняла ряд шагов по улучшению работы блока предсказания ветвлений и предвыборки данных. Той же цели (уменьшению потерь производительности за счет удлинения конвейера) служит и вдвое увеличенная кэш-память. Однако, как показали наши тесты, всех этих мер порой оказывается недостаточно для того, чтобы в некоторых приложениях, не оптимизированных для архитектуры Intel NetBurst, скомпенсировать «вредное» влияние длинного конвейера. С другой стороны, на оптимизированных приложениях прирост производительности при таком подходе окажется ощутимым (вспомним, с каким скрипом в первое время продвигался на рынок Pentium 4 Willamette — именно из-за недостатка оптимизированных для него приложений).

Вторым «ухудшением» стала возросшая латентность обоих кэшей (см. рис. 8). Фактически это плата за их возросший объем и задел на будущий рост частоты ядра. В некоторых «линейных» задачах это, возможно, и не повлияет на быстродействие, но в других может оказаться весьма «болезненным». (Напомним, что длинный конвейер и возросшая латентность кэш-памяти призваны преодолеть трудности с согласованием работы блоков, расположенных в разных частях кристалла и работающих с некоторыми задержками друг относительно друга.)

Cхемотехника у Prescott существенно изменилась по сравнению с предшественниками. Большинство блоков процессора разрабатывалось практически с нуля. Более того, при проектировании топологии кристалла Prescott впервые была осуществлена полностью автоматизированная трассировка и размещение элементов (в частности, с целью оптимизации задержек и более равномерного распределения тепла по кристаллу). В результате элементы блоков не обязательно расположены компактно, в пределах своих геометрических границ; блоки как бы проникают друг в друга, а между ними и элементами процессора много пустого места, которое пригодится для исправления мелких схемотехнических ошибок, дальнейшей оптимизации кристалла и пр.

В первое время процессоры Prescott будут работать на чипсетах Canterwood и Springdale, с системной шиной 800 МГц и памятью DDR400, но позднее для них выйдут чипсеты Alterwood и Grantsdale, поддерживающие память DDR II, шину PCI Express, южный мост ICH6 и, видимо, системную шину 1066 МГц. Подавляющее большинство уже выпущенных материнских плат на чипсетах Intel 875/865, а также последних чипсетах SiS, VIA и ATI будут совместимы с Prescott путем обновления BIOS (оно необходимо для правильной инициализации большей кэш-памяти), поскольку эти платы разрабатывались с учетом будущих повышенных требований по питанию (максимальный ток питания у старших Prescott — 91 ампер). Тем не менее, разгон «Прескотта» осилит далеко не каждая плата — только самые лучшие.

Процессоры на ядре Prescott изготавливаются по 90-нанометровой технологии (это первый подобный процессор, вышедший на рынок), причем сразу на

300-миллиметровых подложках. При их производстве применяется ряд новых материалов и технологий микроэлектроники, о которых мы уже не раз писали (см., например, статьи на www.terralab.ru/system/30717  и www.terralab.ru/system/30845 ). Перечень основных технологических новшеств приведен в табл. 3. Важнейшей из них является технология напряженного (strained, растянутого или сжатого) кремния: деформированная в ту или иную сторону кристаллическая решетка обеспечивает большую подвижность электронов или дырок соответственно, а значит, и более высокую частоту работы полевых транзисторов. Для борьбы с возросшими утечками транзисторов также применялись специальные меры — технологические и схемотехнические.

Хотя площадь ядра и уменьшилась, использование новых технологий и материалов при производстве Prescott несколько повысило себестоимость кристаллов. Вместе с тем себестоимость готового процессора возросла незначительно, поэтому модели Northwood и Prescott с одинаковой частотой будут стоить одинаково.

Три процессора Pentium 4 с частотой 3,4 ГГц, вероятно, станут последними моделями для разъема Socket 478. Это связано с тем, что Pentium 4 с большей частотой, даже изготовленные по более тонкой технологии, будут потреблять гораздо больше энергии, на что не рассчитаны существующие нынче и, как правило, приспособленные для Prescott 3,4 ГГц материнские платы. Процессоры 3,6 ГГц и выше потребуют других спецификаций питания, и, чтобы избежать путаницы с системными платами, все они будут выпускаться с разъемом Socket T (он же LGA 775).

У нас в лаборатории побывал экземпляр Pentium 4 3,20E ГГц на ядре Prescott. Безусловно, новая микроархитектура требует времени для практического изучения, поэтому за те три рабочих дня, что процессор был в нашем распоряжении, мы лишь частично постигли его потенциал. Разумеется, у нас еще будет возможность детально изучить свойства Prescott (прежде всего — быстродействие в разнообразных задачах), а сейчас мы поделимся с вами первыми впечатлениями от новинки.

Описание тестовой конфигурации и подробный анализ полученных данных вы найдете в полной версии обзора на сайте www.terralab.ru , здесь же за недостатком места мы приведем лишь пару наиболее характерных результатов тестов (они представлены на диаграммах) и краткие выводы.

Прежде всего, отметим, что у Prescott немного возросла скорость работы с системной памятью по сравнению с Northwood. Кроме того, повысилась латентность и уменьшилось время выполнения сложных операций (Copy, Scale, Add, Triad). Вместе с тем, на приложениях, не оптимизированных под NetBurst, Prescott уступает своему предшественнику — порой до 15%! Более того, в отдельных задачах Prescott 3,2 ГГц даже проигрывает Northwood 3,06 ГГц на шине 533 МГц! Приложений, в которых Prescott заметно быстрее одночастотного с ним «Нортвуда», пока не так уж много (по крайней мере, в процентном отношении к общему числу программ). Чаще наблюдается ситуация, когда Prescott немного проигрывает Northwood — этим, например, «грешат» многие современные и недавнего прошлого игры, аудиокодеки, программы для математических расчетов. А вот видеокодирование и некоторые профессиональные трехмерные пакеты моделирования чаще благоволят «Прескотту», и его преимущество над Northwood в некоторых случаях доходит до 10–15 процентов.

Таким образом, изменения в микроархитектуре NetBurst требуют оптимизации приложений. Без этого новый процессор иногда работает даже медленнее, чем одинаковый с ним по частоте старый, невзирая на вдвое увеличившуюся кэш-память. На одинаковой частоте Prescott не может (в среднем) соперничать пока с Pentium 4 Extreme Edition. Однако у первого есть ресурсы по наращиванию частоты, в то время как P4EE и Northwood свои ресурсы практически исчерпали. Хотим мы этого или нет, но будущее Pentium 4 однозначно за Prescott. Хотя, вероятно, на первых порах все же выгоднее приобретать процессоры на прежнем ядре. Особенно если учесть, что «Прескотты» заметно горячее в работе, чем аналогичные Northwood и даже Extreme Edition.

© ООО "Компьютерра-Онлайн", 1997-2022
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.