Архивы: по дате | по разделам | по авторам

Intel 2006: Быстрее, меньше, холоднее…

АрхивПлатформа
автор : Сергей Озеров   16.03.2006

Новые технологические процессы позволяют улучшить характеристики энергопотребления и тепловыделения, что актуально не только для настольных или мобильных, но и для серверных процессоров.

Intel, с её многочисленными фабриками и колоссальными доходами, всегда славилась инженерами-технологами. "Тонкие" техпроцессы, новые материалы, усовершенствованные степпинги появлялись у неё и раньше, и быстрее, чем у конкурентов, и корпорация своим преимуществом активно пользовалась. Текущий год не стал исключением - и пока в AMD осторожно заявляют о начале поставок 65-нм процессоров в начале 2007 года, Intel демонстрирует сэмплы изготовленных по 45-нм технологическому процессу модулей SRAM, продаёт полный спектр 65-нм процессоров и сворачивает "устаревшее" 90-нм производство.

Новый техпроцесс получил вполне привычное название - P1264 (до того использовался 90-нм P1262, а ещё раньше - 130-нм P1260), привычные производственные материалы и привычное производственное оборудование - ультрафиолетовые литографические инструменты на основе 193-нм лазеров. Даже в 90-нм P1262 разнообразных технологических новшеств было больше (что уж говорить о принципиально новом P1260) - однако в P1264 удалось обойтись без особых ухищрений, ограничившись лишь небольшими улучшениями и усовершенствованными фазосдвигающими масками. Среди улучшений - переход к использованию в качестве электропроводящего материала силицида никеля (NiSi) и слегка доработанная технология "напряжённого кремния", позволяющие снизить (в первом случае - за счёт уменьшения электрического сопротивления, а во втором - за счёт большего рабочего тока при тех же токах утечки) тепловыделение кристалла. А вот толщину изолирующего оксидного слоя в новом техпроцессе изменять, как это делалось раньше, не стали, сохранив её на уровне 1,2 нм. Кроме того, в кристалл, ранее насчитывавший семь слоёв, добавлен восьмой слой, позволяющий повысить плотность электрических контактов, скорость распространения электрических сигналов и снизить "межконтактную" ёмкость. Собрав эти "мелочи" вместе, технологам удалось совершить маленькое чудо: сохранив все преимущества "тонкого" технологического процесса, уменьшить токи утечки кристалла почти вчетверо!

И это ещё не всё: рабочий ток затвора возрос на 10-15%, а электрическая ёмкость уменьшилась на 20%, что, по словам представителей Intel, обеспечивает почти 30-40-процентный прирост тактовых частот! Заодно всюду, где только можно, внедрили технологию "спящих транзисторов", отключающихся от питания, когда они не используются. Жестокие уроки непрерывно оптимизировавшегося по тепловыделению сложнейшего ядра Prescott, очевидно, не прошли даром. Тем не менее, заполучив в свое распоряжение прогрессивный техпроцесс, сильно изменять ядро Pentium 4 Prescott в связи с "похоронами" NetBurst разработчики не стали. Новые ядра (кодовое название CedarMill) "официально" получили кэш-память объёмом 2 Мб, технологию виртуализации Intel Virtualization Technology (VT, aka Vanderpool) и сниженный с 14 до 12 минимальный множитель. Причём (сюрприз, сюрприз!) в степпингах E0 и R0 "старичка" Prescott мы всё это уже видели. Даже тактовые частоты, несмотря на явный задел, поднимать не стали: для одноядерных CedarMill верхним пределом сегодня стала частота 3,6 ГГц (понижена с прежних 3,8 ГГц Prescott), а для двухъядерных Presler - 3,55 ГГц (повышена с 3,20 ГГц Smithfield).

По сути, почти весь созданный новым технологическим процессом задел для повышения тактовой частоты (а если слова о 40% увеличения быстродействия транзисторов правдивы, то новые Pentium 4 могли бы постепенно достичь 5 ГГц) так и остался неиспользованным (хотя оверклокеры будут счастливы) - Intel улучшила лишь результаты откровенно провального Pentium D 3,20 ГГц. Отчасти это вызвано желанием снизить тепловыделение (в первом приближении оно пропорционально частоте), а отчасти "политическими" мотивами: всё-таки NetBurst, при всех своих недостатках, была невероятно прогрессивной архитектурой, и грядущий "суперпроцессор" Conroe мог бы и не догнать "второй Northwood", преодолевший технологические проблемы.

Вдобавок, похоже, что увеличенный до 4 Мб (2+2) кэш двуядерников сыграл-таки негативную роль, поскольку снижения TDP для двуядерных процессоров так и не произошло: оно по-прежнему составляет 130 Вт у старших моделей. Правда, измерения показывают, что новый 955-й Pentium Extreme Edition значительно экономичней прежнего лидера - 840-го (возможно, оценка в 130 Вт для предыдущего поколения была "слегка" оптимистична?), хотя и рассеивает тепла раза в полтора больше, чем сопоставимое по производительности решение конкурента. Так или иначе, на 10-20% тепловыделение новых процессоров снизили - и прекрасно.

Ещё один немаловажный момент, связанный с новым технологическим процессом, - заметно возросшая производительность (в смысле - количественные возможности по выпуску процессоров с одной пластины) и пропорционально снизившаяся себестоимость производства. Площадь одноядерного CedarMill (с двухмегабайтным кэшем!) уменьшилась до скромнейших 81 мм2, мало того - новые двуядерники, в отличие от ядра Smithfield, "собираются" из двух независимых ядер CedarMill в одном корпусе. В принципе, Smithfield и так был не более чем объединением двух ядер Prescott, но их приходилось делать в виде единого кристалла. Ну а теперь, похоже, нашёлся удобный способ независимой упаковки двух кристаллов в один процессор. Кстати, Presler (это не отдельное ядро, а два CedarMill) станет не единственным процессором, использующим эту технологию: ближе к 2007 году похожим образом Intel собирается выпускать четырехъядерные процессоры, упаковывая по два двуядерных кристалла. "Двойная упаковка" очень технологична (не нужно одновременно производить два типа кристаллов, меньше влияние возникающих дефектов, больше выход с одной пластины) и, в принципе, позволяет Intel легко перевести в 2006 году большую часть своих процессоров на использование двух ядер. Или, как вариант, сильно снизить цены на свою продукцию, и без того продающуюся недорого. "Продержаться" до выхода Conroe тоже как-то необходимо, а AMD, несмотря на сократившийся разрыв в производительности двуядерных процессоров, пальму первенства по быстродействию и тепловыделению уступать в ближайшие полгода явно не намерена.

В мобильном секторе всё гораздо сложнее. Новые 65-нм процессоры (кодовое название Yonah) - впервые в мире мобильных CPU - являются двуядерными, причём построенными на основе прогрессивной технологии, общей для двух ядер кэш-памяти второго уровня. Правда, два ядра - это удвоенное тепловыделение, которое трудно компенсировать даже более тонким технологическим процессом, поэтому при работе ноутбука от батарей процессор незаметно "превращается" в одноядерный, если мощность второго ядра не требуется. Добавили в процессор и поддержку технологии виртуализации Intel VT. Правда, кэш-память второго уровня увеличивать по сравнению с предыдущим поколением Dothan не стали - она так и осталась равной 2 Мб, что для одноядерных, что для двуядерных вариантов. Заодно процессоры получили новую систему маркировки, а соответствующая платформа (Centrino третьего поколения) была названа Napa.

Серверные системы

Далеко не везде от процессора требуется очень высокая производительность. Особенно если речь идёт о производительности в вычислениях с плавающей точкой (FP). Например, Itanium в таких вычислениях несомненный лидер - и где x86, а где Itanium? Зато частенько требуется обеспечить небольшое тепловыделение, причем как для ноутбуков, так и для настольных систем и, что самое парадоксальное, серверов. Парадоксальное - потому что для серверов, в принципе, не слишком важны тишина и сложность системы охлаждения - сервер всё равно стоит в отдельном, а зачастую - и в специально кондиционируемом помещении. Однако усиливающееся влияние кластерных систем диктует свои законы - и сегодня "в моде" блейд-серверы и прочие "тонкие" одно-двухъюнитовые решения, позволяющие установить в одну стойку множество небольших однотипных серверов. Желательно дву-, а ещё лучше - четырехпроцессорных. И поскольку это совсем недорого - двуядерных.

Помножьте 130 (если не 180) ватт TDP двуядерных Xeon на два сокета и 42 сервера в стойке - и представьте себе задачу энергоснабжения и последующего отвода более 12-16 кВт мощности. Особенно если таких стоек - целый зал. Нужно ли после этого удивляться, что располагающая более чем двумястами тысячами серверами Google решила расширить свою базу за счёт серверов, построенных на процессорах AMD.

Впрочем, методики решения подобных "небыстрых, зато холодных" задач давным-давно отработаны и сводятся к использованию ноутбучных процессоров в несвойственных им системах. К примеру, новые десктопные системы от Apple используют процессоры Core Duo. С серверными процессорами так же просто поступить невозможно - они требуют специальной инфраструктуры, сертификации, чипсетов и, главное, возможности работать в многопроцессорных конфигурациях. Однако, особого труда для Intel подобная адаптация, похоже, не составляет, так что уже в самое ближайшее время мы увидим серверную модификацию Core Duo на ядре Yonah в виде низковольтных семейств процессоров Xeon LV и Xeon ULV (ядро Sossaman). Работая на частотах порядка 1,67-2,0 ГГц, они не будут блистать производительностью и не будут поддерживать 64-битные расширения, - зато будут обладать более чем конкурентоспособными тепловыми пакетами в 31 и 16 Вт соответственно против 60/30 Вт у HE (и EE - модификаций Opteron). Выходящая в середине нынешнего года серверная ипостась Conroe - ядро Woodcrest - столь же низким тепловыделением похвастать не сможет, так что линейка Sossaman'ов в исполнении Socket 479, похоже, обречена на долгое пребывание на рынке.

В секторе "не столь компактных" систем дела обстоят проще: на смену текущему (прямо скажем, не слишком удачному) двуядерному процессору Intel Xeon "Paxville" должен прийти заметно более производительный и менее горячий 65-нм эквивалент Presler под кодовым названием Dempsey. Обладая вдвое увеличенным кэшем L2, а также более быстрой 1066-МГц системной шиной, Dempsey обещает стать весьма интересным продуктом. Заодно с Paxville Dempsey вытеснит и одноядерный Xeon DP "Irwindale". В секторе MP-процессоров (4-сокетные системы и выше) на смену ядру Potomac (серверный аналог ядра Prescott с 1 Мб L2 и 8 Мб L3) придёт сложнейший двуядерный 65-нм процессор Tulsa с 16 Мбайт общей кэш-памяти L3. В отличие от других своих двухъядерных 65-нм собратьев Tulsa будет выполнен в виде одного кристалла (сказывается общий L3) с громадной площадью 435 мм2. 1,33 миллиарда транзисторов - это не шутка. Хотя ему далеко до другого "долгостроя" - двуядерного Itanium 2 "Montecito" (1,72 миллиарда транзисторов, 595 мм2). Что за проблемы с этим чудом техники, насчитывавшем, помимо двух ядер, поддерживавших своеобразную многопоточность (по два потока на ядро), 24 (12x2) мегабайта кэш-памяти L3 и производящимся по 90-нм технологическому процессу, приключились у Intel - неизвестно, но то что они были - несомненно. Montecito изрядно опоздал с выходом на рынок и "слегка" подрастерял свои тактовые частоты и заявленные поначалу "фичи". Впрочем, это всё равно очень хороший процессор с впечатляющей производительностью, "смена" которого ожидается не раньше 2007 года.

Попутно с процессорами анонсированы и новые чипсеты для DP-систем - Blackford и Greencreeck. В числе новшеств - переход на две независимые процессорные шины (пропускной способности одной шины для многопроцессорных многоядерных систем катастрофически не хватает) и переход к использованию новой оперативной памяти FB-DIMM. Вскоре изменится и сокет - вслед за Pentium 4 процессоры Intel Xeon переберутся с Socket 603/604 на разъём LGA 771.

Заглядывая в будущее

Вышеперечисленными моделями Intel, конечно, не ограничивается. Горячие головы уже рассказывают о планах уважаемой корпорации едва ли не до 2008 года, и если верить им, то первый четырёхъядерный процессор Intel появится уже в конце текущего - начале следующего года и будет представлять собой два кристалла архитектуры Conroe в одной упаковке. Серверная модификация выйдет чуть раньше и получит название Clovertown; настольная - на полгода позже и будет называться Kentsfield. Заодно выйдет и 65-нм четырёхъядерная версия Itanium (надеемся, что история с Montecito не повторится) с кодовым названием Tukwilla, хотя в отношении Itanium технологический процесс 90-нм не будет забыт даже тогда - на его основе выпустят "доработанный" Montecito (видимо, такой, каким его обещали изначально) под названием Montvale.

Тогда же начнётся интересный процесс объединения линеек Xeon и Itanium, поскольку через пару лет и те, и другие будут переведены с существующих FSB на новую последовательную шину CSI (Common System Interface), являющуюся своеобразным аналогом шины AMD Hyper-Transport и, как и последняя, обеспечивающую очень широкую совместимость с наборами системной логики. Фактически станет возможным ставить в один и тот же сервер как Xeon, так и Itanium, что, за счёт широко используемой инфраструктуры, теоретически должно резко снизить стоимость систем на основе последних.

В общем, скучать нам в ближайшие года два не придется. Некоторый "застой", наблюдавшийся последний год, медленно, но верно уходит в прошлое: похоже, что уже в 2006-м мы увидим очередной виток противостояния ведущих процессорных компаний, с присущими ему ценовыми войнами, гонкой мегагерц и выпуском принципиально новых ЦП. А конечный пользователь от этого, как всегда, только выиграет.


По материалам еженедельника "Компьютерра"
© ООО "Компьютерра-Онлайн", 1997-2019
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.