Процессоры Intel Penryn и Nehalem: развитие микроархитектуры Core
АрхивПлатформаВ самом конце марта 2007 года корпорация Intel провела в Сан-Франциско пресс-конференцию, в ходе которой поделилась с общественностью новыми подробностями о процессорах следующего поколения.
В самом конце марта 2007 года корпорация Intel провела в Сан-Франциско пресс-конференцию, в ходе которой поделилась с общественностью новыми подробностями о центральных процессорах следующего поколения, известных под кодовыми названиями Penryn и Nehalem. Процессоры Penryn должны появиться на свет уже во второй половине текущего года, а Nehalem ожидаются во второй половине будущего года.
Оба чипа разработаны на основе микроархитектуры Intel Core и будут производиться по новейшей 0,045-микронной технологии, в которой применяются металлические затворы транзисторов и диэлектрики с высокой проницаемостью (Hi-k). По официальной информации, в разработке инженеров Intel находится пятнадцать конструкций микросхем на основе этой передовой технологии, при этом уже к концу текущего года корпорация будет располагать двумя заводами, рассчитанными на выпуск чипов по 0,045-микронному техпроцессу, а ко второй половине будущего года - уже четырьмя такими заводами.
В пресс-конференции приняли участие вице-президент Intel Патрик Гелсингер и вице-президент и директор подразделения Digital Enterprise Group Стивен Л. Смит.
Penryn
Процессоры под кодовым названием Penryn будут представлены моделями с двумя и четырьмя ядрами. На основе базовой конструкции будут выпускаться шесть модификаций: дву- и четырёхъядерные "настольные" чипы, двуядерные мобильные чипы, дву- и четырёхъядерные серверные процессоры, а также серверные чипы с повышенной производительностью. Все новинки поступят в продажу под существующими марками Core и Xeon.
В Penryn используется несколько доработанная микроархитектура Core, доказавшая свою состоятельность. Четырёхъядерная модификация Penryn будет состоять из 820 миллионов транзисторов, размещённых на двух подложках общей площадью 107 мм2, что примерно на четверть меньше площади современных четырёхъядерных Intel Quad Core, составляющей 143 мм2.
Среди прочих изменений, внесённых в микроархитектуру Core в процессорах Penryn - очередное дополнение набора инструкций x86, так называемый набор расширений Intel Streaming SIMD Extensions 4 (SSE4). Представители Intel также подтвердили информацию о том, что новинка будет отличаться увеличенным числом инструкций, выполняемых за один такт (IPC), а также повышенными тактовыми частотами. В Intel пока осторожно говорят о тактовых частотах "более трёх гигагерц", однако, учитывая тот факт, что частота системной шины вырастет до 1600 МГц, напрашивается тактовая частота чипа порядка 3,2-3,6 ГГц. Двуядерные процессоры Penryn будут располагать кэш-памятью общим объёмом 6 Мб, а четырёхъядерные - объёмом 12 Мб.
В новинке будут реализованы также новые разработки в области энергосбережения. В Penryn впервые будет использоваться технология Deep Power Down, то есть "глубокого" снижения питания или режим C6. Эта технология позволит снижать напряжение, подаваемое на ядро процессора до абсолютного минимума в рамках данного технологического процессора, а также отключать питание тактового генератора ядра и всей кэш-памяти. Эта технология, которая будет использоваться в мобильных вариантах Penrym, на данный момент обеспечивает минимально возможное энергопотребление чипа.
Предполагается, что все процессоры Penryn будут совместимы по разъёмам с ныне выпускающимися моделями. Это означает, например, что десктопные модели будут рассчитаны на разъём LGA-775, но, скорее всего, для их использования потребуются новые чипсеты или обновлённые версии существующих, способных работать с системной шиной 1600 МГц.
В Penryn будет использоваться улучшенный блок делителя, позволяющий удваивать скорость деления при помощи технологии Radix 16. Кроме того, в новинке применён улучшенный однопроходный 128-битный алгоритм перемещения данных Super Shuffle Engine, что позволяет существенно повысить производительность при выполнении инструкций наборов SSE2, SSE3 и SSE4, среди которых встречаются операции перемещения вроде запаковки и распаковки, а также перемещения больших пакетов данных. Преимущества нового алгоритма будут особенно заметны в приложениях по созданию изображений, мультимедийного и видеоконтента, а также в высокопроизводительных вычислениях.
Ещё одна технология, которая впервые найдёт применение в процессорах Penryn, - это Split Load Cache Enhancement. Смысл её заключается в улучшении работы с кэш-памятью посредством динамической распределении данным по свободному кэшу. Каких-либо подробностей этой технологии пока нет, но, поскольку презентация Penryn состоится уже во втором полугодии, они станут известны совсем скоро.
По предварительным данным, энергопотребление четырехъядерных моделей останется неизменным - 120 Вт для десктопных моделей, 80 Вт для серверных и 50 Вт для модификаций с пониженным энергопотреблением. Энергопотребление двуядерных моделей, в зависимости от модификации, составит 40, 65 или 80 Вт.
Важная инновация - система Enhanced Dynamic Acceleration Technology (EDAT), благодаря которой за счёт бездействующего ядра может быть повышена тактовая частота другого ядра, что позволит ускорить решение поставленной задачи. К примеру, при выполнении однопоточного приложения или многопоточного приложения, который преимущественно использует один поток, система EDAT может отключить второе ядро, но повысить тактовую частоту первого, сохранив постоянное тепловыделение. Благодаря этой технологии, наконец, будет устранён недостаток двуядерных процессоров, которые в однопоточных приложениях нередко уступают одноядерным. Теперь же при равномерной загрузке оба ядра будут работать на более низкой тактовой частоте, а при неравномерной - частота одного из ядер будет повышаться, что обеспечит оптимальную производительность. Несмотря на повсеместный переход на многоядерные процессоры, существуют приложения, которые по своей природе являются однопоточными, поэтому для них предпочтительнее одноядерный процессор, работающий на более высокой тактовой частоте, чем двуядерный, работающей на менее высокой.
По словам Патрика Гелсингера, в ходе внутрифирменных тестов процессор Penryn с тактовой частотой 3,2 ГГц и системной шиной 1,6 ГГц примерно на 20% опередил по производительности в игровых приложениях чип Conroe c тактовой частотой 3,0 ГГц и системной шиной 1,33 ГГц. При сравнении в приложениях кодирования видео благодаря использованию нового набора инструкций SSE4 Penryn опережает предшественника уже более чем на 40%. Серверный четырёхъядерный Penryn с тактовой частотой, не превышающей 3 ГГц, опередил в приложениях с интенсивной потоковой нагрузкой четырёхъядерный Xeon с частотой 2,67 ГГц более чем на 45%. Об условиях проведения этих тестов и использованных тестовых пакетах ничего не сообщается.
Наконец, последнее изменение, которое внесено в микроархитектуру Core в процессорах Penryn - это существенно улучшенная аппаратная поддержка технологии виртуализации (VT). В новых чипах на аппаратном уровне повышена скорость доступа приложений к виртуальной машине на 25-75%, при этом никаких программных изменений для того, чтобы ощутить этот прирост, не требуется. В Intel пока не раскрывают никаких подробностей, которые, вероятно, последуют только после официальной презентации новых чипов.
Nehalem
Принципиальным отличием процессоров Nehalem от Penryn и выпускающихся ныне чипов на базе микроархитектуры Core станет существенно переработанная схема реализации многопоточности, исчезнувшая было из чипов с этой архитектурой. Поскольку процессоры Nehalem будут иметь до восьми ядер, благодаря технологии многопоточности (SMT или Hyper-Threading) появится возможность на одном процессоре одновременно запускать исполнение до 16 потоков. Как рассказал Патрик Гелсингер, самый высокий уровень из многоуровневой кэш-памяти чипа будет общим, а напряжение питания каждого из ядер будет динамически изменяться в зависимости от приложения и нагрузки.
Для связи с чипсетом и памятью в Nehalem уже не будет использоваться системная шина (FSB), вместо неё появится некая последовательная шина, чрезвычайно напоминающая HyperTransport от AMD. Сходство с продукцией AMD усиливается, если упомянуть, что в Nehalem появится встроенный контроллер оперативной памяти (по всей видимости, типа DDR3). И, наконец, самое невероятное - в некоторых версиях Nehalem непосредственно в сам чип будет встроен графический ускоритель! Тут тоже просматривается аналогия с процессорами AMD - чип Fusion со встроенной графикой планируется выпустить примерно в то же самое время, что и Nehalem. Очевидно, что встроенное видео будет относиться к низшему или, максимум, среднему классу, хотя в официальной информации и говорится о "высокопроизводительном графическом движке" - мощные видеоядра потребляют слишком много электроэнергии и требуют усиленных систем охлаждения.
Разумеется, столь принципиальные изменения архитектуры потребуют и нового процессорного разъёма, который неизбежно появится одновременно с Nehalem. Конечно же, восьмиядерные процессоры первоначально будут относиться к классу hi-end, поэтому массового перехода с LGA-775 на новый разъём можно ожидать ещё нескоро. Тем более что, по данным Intel, во второй половине 2008 года только начнётся выпуск процессоров Nehalem, а серийное их производство намечено лишь на 2009 год.
Подводя краткий итог описанию перспективных новинок, можно констатировать одно: мы ещё не успели оценить всех преимуществ даже двуядерных процессоров, а в самое ближайшее время станут привычными и четырёх, и восьмиядерные чипы. Эпоха многоядерных процессоров действительно наступила, и компаниям-производителям осталось лишь оттачивать архитектуру таких чипов. Кроме того, разработчики программного до сих пор не слишком преуспели в создании приложений, оптимизированных, или хотя бы использующих особенности многоядерных процессоров. Однако эта задача непременно должна быть решена, ведь уже в обозримом будущем одноядерные чипы могут стать дремучим антиквариатом.