Архивы: по дате | по разделам | по авторам

Искусство серверовки

Архив
автор : Алекс Карабуто   25.03.2002

Давайте немного отвлечемся от повседневной персонально-компьютерной суеты - 3D-ускорителей, новомодных оптомышей, наладонников… Задумаемся о серверах. Ведь без них уже фактически немыслима работа любого пользовательского компьютера и тем более мало-мальски организованного сообщества.

Давайте немного отвлечемся от повседневной персонально-компьютерной суеты - 3D-ускорителей, новомодных оптомышей, наладонников… Задумаемся о серверах. Ведь без них уже фактически немыслима работа любого пользовательского компьютера и тем более мало-мальски организованного сообщества.

Развитие Интернета коренным образом изменило способы ведения бизнеса, обмена информацией и налаживания связей. Как следствие, существенно возросла и роль серверов на предприятиях самого разного калибра - от межнациональных корпораций до мелких фирмочек. Сегодня главным вычислительным инструментом стали распределенные сети, и серверы широко используются для реализации сложных взаимодействий - от работы с базами данных и транзакциями до обслуживания внешних запросов на доступ к Web-страницам, количество которых может достигать миллиардов в день (то есть десятков и даже сотен тысяч в секунду)!

Все это порождает новые требования к серверной инфраструктуре: приходится не только увеличивать количество самих серверов для обслуживания растущих объемов транзакций, но и наращивать производительность каждого из них для поддержки все более сложных и ресурсоемких приложений, разрабатываемых программистами на потребу времени, например, таких как CRM (системы управления взаимоотношения с клиентами), управление знаниями и базами данных, электронное обучение и пр.

Благодаря ряду новаций Intel на рынке корпоративных серверов, за последние годы семейство ее процессоров Xeon («Зион»), впервые представленное в 1998 году, заметно изменило ситуацию на рынке 32-разрядных серверов, потеснив традиционно сильные позиции RISC-серверов (см. диаграмму), а процессор Intel Itanium, появившийся на рынке в мае 2001 года, обещает стать катализатором серьезных перемен для 64-разрядных серверов высшего класса.

В этом обзоре мы ознакомим вас с особенностями современного рынка серверов и предложениями корпорации Intel по процессорам для каждого класса серверов, в том числе остановимся на особенностях некоторых новейших серверных продуктов Intel, анонсированных на февральском Intel Developer Forum (IDF) в Сан-Франциско и мартовской выставке «CeBIT» в Ганновере. В будущем мы планируем рассмотреть серверные решения других компаний, хотя уверенная рыночная поступь серверных архитектур от Intel оставляет им все меньше шансов с каждым годом. По прогнозам, в нынешнем году продажи серверов с архитектурой Intel впервые могут превысить в денежном выражении продажи традиционно популярных RISC-серверов. А в России доля серверов на архитектуре Intel вообще подавляюща (см. таблицу в полной версии обзора на www.ferra.ru/online/system/16656).

Основные типы серверов различной производительности и применение в них процессоров Intel рассмотрены во врезке. Новые тенденции в серверных технологиях - это масштабирование, макропроцессинг, многопоточность и кластеризация на серверах, построенных на открытых отраслевых стандартах (подробности читайте на www.ferra.ru/online/system/16656). Бюджетные преимущества такого подхода слишком привлекательны, чтобы их игнорировать. Помочь в развитии этих направлений могут современные серверные решения от Intel - в частности, процессоры Xeon MP/DP.

Процессоры Intel Xeon MP/DP

Новейшие семейства процессоров Xeon для многопроцессорных (Xeon MP) и двухпроцессорных (Xeon DP) серверных платформ отличаются достаточно сильно, несмотря на практически одновременное появление на рынке.

Объявленный 25 февраля на IDF процессор Xeon (он же Xeon DP - процессор второго поколения для двухпроцессорных систем с архитектурой NetBurst) базируется на ядре Prestonia, производимом по технологии 0,13 мкм, имеет встроенную кэш-память L2 объемом 512 Кбайт, системную шину 400 МГц, поддержку технологии Hyper-Threading и частоту ядра 2,2, 2,0 и 1,8 ГГц. Фактически, Intel DP есть не что иное, как хорошо знакомый нам Pentium 4 на ядре Northwood, но с аппаратно активизированной поддержкой двухпроцессорности (APIC) и Hyper-Threading (многопоточности вычислений внутри одного чипа, см. врезку).

Возможно, эти два процессора даже имеют один и тот же дизайн кристалла - просто на этапе, предшествующем корпусировке, чипы для Xeon подвергаются более тщательному тестированию и отбору, а в чипы для Pentium 4 прошивается микрокод, отключающий в них функции APIC и HT. В пользу этого говорит как опознавание программами наличия APIC в Northwood (см. www.ferra.ru/online/system/15067), так и упорные слухи (в том числе, со слов некоторых руководящих сотрудников Intel), что технология Hyper-Threading уже присутствует в Northwood и может быть легко активирована в ближайшем будущем. Тем не менее, использовать Northwood в двухпроцессорных системах вряд ли удастся, поскольку Xeon (Prestonia) упаковывается в другой корпус - 603-контактный FC-mPGA2P/INT-mPGA (см. фото; напомню, что Pentium 4 корпусируется в 478-контактный FCPGA2). Новые Xeon (Prestonia) отличаются от первого поколения двухпроцессорных Xeon (Foster) тем же, чем Pentium 4 Northwood отличается от Willamette, за исключением появившейся поддержки Hyper-Threading. Несмотря на выход более прогрессивных Xeon DP (Prestonia), процессоры Xeon (Foster) с частотой до 2 ГГц и кэш-памятью L2 256 Кбайт будут производиться корпорацией как минимум до конца года.

Представленный 12 марта на «CeBIT» процессор Xeon MP на ядре Foster MP, напротив, является лишь первым поколением CPU для многопроцессорных (4-8) систем с микроархитектурой Intel NetBurst. Производимое по технологии 0,18 мкм ядро Foster MP является аналогом ядра Willamette первого поколения процессоров Pentium 4 и, соответственно, ядра Foster дуальных процессоров Xeon (напомню, что, как и в Northwood, программы определяют наличие аппаратного блока APIC в современных кристаллах Willamette, см. предыдущий линк). Однако Foster MP отличается от Foster гораздо больше, чем Foster от Willamette, поскольку помимо кэш-памяти L2 емкостью 256 Кбайт (с улучшенной по сравнению с Willamette передачей данных) содержит на том же кристалле еще и кэш-память третьего уровня (L3) емкостью 512 или 1024 Кбайт (в зависимости от модификации процессора), а также поддерживает технологию Hyper-Threading. Как и остальные Xeon, процессоры на ядре Foster MP пока предназначены для системной шины 400 МГц и пакуются в 603-контактный корпус INT-mPGA. Однако на данный момент они выпускаются только с частотами от 1,4 до 1,6 ГГц, - видимо, наличие высокоскоростного кэша L3 не только затрудняет теплоотвод, но и препятствует достижению предельной для данной технологии частоты 2 ГГц даже при идеальном теплоотводе (низкий выход годных выше 1,6 ГГц). Хотя спрос «на гигагерцы» есть и на рынке серверов.

Процессор Xeon MP содержит 108 млн. транзисторов - это примерно вдвое больше, чем для кристалла Willamette, то есть на «пририсованный» кэш L3 пришлось более 50 млн. «затворов». Кэш-память третьего уровня в мультипроцессорных чипах нужна, чтобы «развязать» ядро и системную шину (FSB). В отличие от кэш-памяти L2, которая является синхронной (то есть при ее заполнении процессор «простаивает»), кэш-память третьего уровня асинхронная, что позволяет процессору полноценно работать при ее наполнении. Для мультипроцессорных CPU наличие емкого кэша L3 важно еще и потому, что системная шина у процессоров общая (а их на ней может сидеть до восьми штук), то есть соседним «камням» не придется приостанавливать вычисления, пока один из них обращается к системной памяти.

Такая архитектура как нельзя лучше отвечает требованиям приложений для мощных серверов масштаба предприятия и серверов для электронного бизнеса. Кэш-память с отслеживанием исполнения (L1, 12 Кбайт микрокоманд) обеспечивает ускоренный доступ к декодированным микрокомандам и увеличивает пропускную способность конвейера, кэш-память данных L1 (8 Кбайт) уменьшает задержки в работе блока быстрого исполнения благодаря применению новейших технологий доступа, кэш-память L2 с улучшенной передачей данных ускоряет доступ к данным сервера за счет точной синхронизации с кэш-памятью данных L1 и блоком быстрого исполнения, а интегрированная кэш-память L3 в сочетании с быстрой системной шиной формирует высокоскоростной канал обмена данными с системной памятью. Максимальная пропускная способность подсистемы кэш-памяти этих процессоров составляет 51,2 Гбайт/с, тогда как для их предшественников Pentium III Xeon (которые будут продаваться еще достаточно долго) она составляет всего 28,8 Гбайт/с при ширине шины 32 байта против 128 байт у Foster MP. Для сравнения в таблице приведены основные характеристики процессоров Xeon и Pentium 4.

На смену Xeon MP разрабатываются процессоры на ядре Gallatin, изготавливаемом по технологии 0,13 мкм (фактически это Prestonia с интегрированной кэш-памятью L3). Они должны появиться в четвертом квартале этого года. Текущие оптовые цены на процессоры Xeon MP составляют от 3690 долларов за старшую модель (1,6 ГГц, 1 Мбайт L3) до 1177 долларов за младшую модель 1,4 ГГц с 512 Кбайт L3. Попутно отмечу, что цены на Xeon DP (Prestonia) будут гораздо ниже - почти как на аналогичные по частоте модели Northwood: 615 долларов за 2,2 ГГц, 417 и 251 долларов за младшие модели 2 и 1,8 ГГц. Компания Hewlett-Packard уже объявила о выпуске шести серверов на новых чипах Xeon. Почти все они выполнены на чипсете ServerWorks GC-HE - например, модель tc6100 за $7600 на двух Xeon (Pentium 4) и tc7100 за $12560 на четырех Xeon MP высотой 8,75 дюйма с монтажом в стойках.

Чипсет Intel E7500

Одновременно с выпуском процессоров Xeon DP Intel объявила (в компанию к старичку i860 на RDRAM) новый серверный чипсет E7500 (Plumas), предназначенный для двухпроцессорных систем и двухканальной памяти DDR200 (см. www.intel.com/design/chipsets/e7500). Отрадно, что почти сразу вслед за бытовым DDR-чипсетом i845D корпорация привнесла память DDR «в массы» серверов. Однако тут не обошлось без курьезов: дело в том, что этот чипсет поддерживает только память устаревшего стандарта PC1600 и строго двухканальную (как, например, i850 для RDRAM). И, разумеется, только регистровые модули памяти. Между тем в таком подходе есть свой резон. Видимо, памятуя о скоростных успехах синхронных чипсетов i440BX/GX, Intel и этот чипсет решила сделать полностью синхронным, то есть шины процессора и памяти работают всегда на одинаковой тактовой частоте (в данном случае - 100 МГц). При этом пропускная способность шины процессора совпадает с пропускной способностью двух каналов DDR200 - 3,2 Гбайт/с. В принципе, в отсутствие мощного графического ускорителя на шине AGP 4x (зачем он в серверах) такой подход вполне оправдан, хотя прожорливые клиенты на высокопроизводительной шине PCI могут все же сместить баланс системы в сторону недостатка скорости памяти. Тем не менее, синхронность делает обмен данными между процессором и памятью наиболее быстрым из всех возможных способов. Что ж, при случае мы проверим это на практике. А в будущем, с выходом Xeon на шине 533 МГц этот чипсет может быть легко модифицирован для работы с DDR266 («разгонять» свои собственные продукты Intel умеет великолепно) - чипсет Plumas 533 запланирован на конец этого года.

Максимальный объем памяти, поддерживаемый чипсетом E7500, - 16 Гбайт (до четырех модулей DIMM на канал). Разумеется, есть ECC, а также аппаратная очистка памяти и отключение неисправных микросхем. В чипсете применена новая система связи компонентов наборов микросхем - Intel Hub Interface 2.0 c пониженной амплитудой напряжения сигналов 0,7 В. Она позволяет достичь скорости обмена свыше 1 Гбайт/с (точнее - 1,066) в любом парном соединении «северного» хаба MCH с каждым из трех «периферийных» устройств. Чипы-компаньоны P64H2 (до трех штук) обеспечивают чипсету поддержку широкой профессиональной шины PCI/PCI-X с функцией «горячей замены» PCI-устройств (!) для лучшего обслуживания, надежную сегментацию I/O и улучшенный доступ к скоростным сетям. Чип P64H2 выводит технологию PCI/PCI-X на новый уровень скорости и универсальности, обеспечивая два контроллера «горячего подключения» и два независимых 64 бит/133 МГц сегмента PCI-X, то есть всего до шести независимых шин PCI-X в системе (плюс один сегмент PCI 32 бит/33 МГц от хаба ICH3-S, который подключен с MCH по прежнему Hub Interface 1.5). По высокоскоростному HI 2.0 можно также подключать Network InfiniBand и будущие хабы ICH. Сегменты PCI-X независимы, каждый поддерживает до четырех слотов PCI: один 64-разрядный слот может работать на частоте 133 МГц, а четыре слота - на 66 МГц. Быстрые карты расширения (например, гигабитный Ethernet, Ultra320 SCSI и пр.) лучше подключать на разные мосты PCI-X для более полной реализации скоростного потенциала системы.

Разумеется, E7500 обучен поддержке технологии Hyper-Threading, чтобы оптимально управлять прерываниями при установке двух CPU. В чипсете есть специальная шина управления системой. Оптовые цены на E7500 пока установлены в размере 92 и 132 доллара за минимальную и максимальную конфигурацию соответственно. На чипсете E7500 Intel выпустила уже две серверные системные платы - SE7500CW2 и SE7500WV2.

Не следует думать, что все эти «высокие материи» очень далеки от простого компьютерного обывателя. Сейчас Intel обкатывает новые технологии процессоров и чипсетов в серверах, а завтра они придут в каждый дом (вспомните про Интернет-холодильники).

У Intel нет своих чипсетов для многопроцессорных систем - она отдала этот рынок на откуп сторонним производителям, в частности своим многолетним партнерам. Наиболее популярным здесь является чипсет ServerWorks GC-HE для процессоров Xeon MP c поддержкой DDR200, обладающий очень похожими на E7500 характеристиками. Есть свой чипсет для этого и у IBM (Summit) с поддержкой до шестнадцати процессоров.

Масштабируемость систем на базе процессора Xeon MP наглядно демонстрирует диаграмма. При удвоении числа процессоров (с одного до двух или с двух до четырех) производительность сервера на специализированном ПО возрастает примерно на 70%. Все это обеспечивает новейшим серверным продуктам Intel хорошие перспективы на рынке серверов самых разных классов.

В планах корпорации - переход в конце года на ядро Gallatin с частотой от 2 ГГц и кэшем L3 емкостью 1 и 2 Мбайт. В стане IA-64 летом этого года произойдет полный переход на McKinley, а в 2003 году - и на ядро Madison с кэшем L3 в 3 и 6 Мбайт. Двухпроцессорный рынок средних по мощности серверов очень скоро и надолго полностью захватит Prestonia, постепенно пересев на шину 533 МГц и чипсет Plumas 533, а летом 2003 года нас ждут новинки. В классе компактных экономичных серверов процессоры Pentium III на ядре Tualatin с частотами до 1,4 и 1,53 ГГц еще долго будут вне конкуренции.

Градация серверов (по Intel)

Сервер - центральный элемент многоуровневой инфраструктуры современного предприятия. Типичная серверная среда для электронного бизнеса - это множество серверов, к каждому из которых предъявляются определенные требования с точки зрения производительности, масштабируемости и готовности. Распределив серверы по уровням, компания может легко модифицировать одну из частей своей инфраструктуры, не меняя другие. Серверы можно разделить на такие категории:

  1. Фронтальные Web-серверы и серверы общего назначения.

  2. Серверы бизнес-приложений промежуточного уровня.

  3. Серверы баз данных.

Выпускаемые сейчас четыре семейства процессоров Intel (Pentium III, Pentium III Xeon, Xeon и Itanium) служат основой для построения всех этих типов серверных решений. Intel также поставляет серверы провайдерского класса для телекоммуникационной отрасли.

Фронтальные серверы и серверы общего назначения обычно монтируются в стойке с высокой плотностью размещения и применяются в качестве Web-серверов, межсетевых экранов или прокси-серверов. Они обслуживают запросы пользователей на доступ к информации, защищают среду электронного бизнеса от несанкционированного доступа и обеспечивают безопасность транзакций. Нагрузка на серверы может меняться в широких пределах за очень короткие промежутки времени, поэтому важнейшее требование к ним - наличие запаса производительности. Эффективным решением для серверов с высокой плотностью монтажа и одноплатных серверов являются двухпроцессорные системы на базе Pentium III-S (на ядре Tualatin c кэш-памятью L2 объемом 512 Кбайт и пониженным энергопотреблением). Двухпроцессорные серверы на базе процессоров Pentium III Xeon способны обеспечить более высокую производительность, надежность и запас ресурсов, что необходимо для систем с непредсказуемыми колебаниями нагрузки и серверов общего назначения (электронная почта, службы каталогов, базы данных масштаба подразделения). Наконец, новейшие процессоры Xeon DP (на ядре Prestonia) предназначены для двухпроцессорных серверов инфраструктуры Интернет и приложений масштаба подразделения, поскольку обеспечивают повышенный параллелизм исполнения и улучшенное время реакции.

Серверы приложений промежуточного уровня занимают место между фронтальными Интернет-серверами и внутренними серверами баз данных и обеспечивают передачу информации, которую хранят серверы баз данных. Они обслуживают сложные транзакции при ведении деловых операций через Интернет - оформление заказов, контроль их исполнения, управление взаимодействием с клиентами и пр. На процессорах Pentium III Xeon возможно построение 4- и 8-процессорных серверов. Эти процессоры отличаются большой емкостью кэш-памяти L2 (1 или 2 Мбайт), работающей на частоте ядра процессора, а также широким набором средств управления. Новейшие процессоры Xeon MP (на ядре Foster MP) позволяют создавать многопроцессорные серверы приложений, внутренних СУБД среднего размера, систем CRM, средств коллективной работы, серверы мультимедийного контента, управления сайтами, систем бизнес-анализа и др.

Серверы баз данных используются для обслуживания защищенных транзакций и пользовательских запросов. Ключевое требование к серверу БД - способность быстро извлекать и форматировать данные. На эту способность существенно влияет вычислительная мощность и масштабируемость сервера. Здесь также возможно применение процессоров Pentium III Xeon и Xeon MP для конфигураций с восемью и более процессорами, хотя сейчас типичный сервер БД имеет четыре или восемьтаких процессоров и 4 Гбайт оперативной памяти, что позволяет хранить в ней фрагменты базы данных для ускорения доступа к ним со стороны процессоров. Такие серверы рассчитаны на высокоуровневые корпоративные системы.

Кроме того, с прошлого года корпорация Intel начала поставлять 64-разрядные процессоры Intel Itanium, предназначенные для корпоративных серверов высшего класса. Развитие таких серверов является приоритетным направлением для Intel (действительно, кому как ни самой корпорации заботиться о поддержке собственного бизнеса современными серверными решениями). Восьмипроцессорные платформы на основе Xeon MP и Itanium здесь играют главную роль. Благодаря новой архитектуре с явным параллелизмом команд (EPIC) серверы на базе процессоров Itanium способны выполнять до двадцати операций одновременно. Независимые тестирования показывают, что такие системы в приложениях оперативной обработки защищенных транзакций могут в двенадцать раз превосходить по производительности традиционные RISC-серверы. Процессор Itanium выполняет в секунду до 6,4 млрд. операций и обрабатывает до 2,1 Гбайт данных, что является наивысшим показателем в отрасли, и способен адресовать непосредственно до 16 Тбайт информации. Он уже эффективно используется, например, в Европейском институте ядерных исследований (CERN). Крупнейшие производители, в числе которых Bull, Compaq, Dell, Fujitsu-Siemens, HP, IBM, NEC, SGI и Unisys, предлагают более 35 различных моделей серверов на базе Itanium. А в первой половине этого года корпорация Intel планирует выпустить 64-разрядный процессор второго поколения с кодовым именем McKinley, который будет работать в 1,5-2 раза быстрее первого Itanium (кстати, он уже вовсю демонстрируется на «CeBIT», читайте наши новости и репортажи). Он призван постепенно отвоевывать на рынке позиции у RISC-систем. По прогнозам компании Gartner Group, поставки серверов на базе 64-разрядных процессоров Intel в штучном выражении в период с 2001-го по 2006 год будут расти в среднем на 209% в год, при этом наибольший рост придется на 2002-03 годы.

Серверы провайдерского класса для телекоммуникационного рынка, представленные Intel в декабре 2001 года, включают системы с высокой плотностью монтажа на процессорах Pentium III, а в будущем планируется их перевод на процессоры Xeon и Itanium. Телекоммуникационная продукция Intel отвечает жестким стандартам отрасли, включая Network Equipment Building Specification (NEBS) в США и стандарты European Telecom Standards Institute (ETSI) в Европе, что позволяет серверам сохранять работоспособность в экстремальных условиях - при перегреве и переохлаждении, при пожарах и землетрясениях. Серверы этого типа используются и для реализации технологии Voice over IP на частных АТС компаний и провайдеров услуг.

Технология Hyper-Threading

Новейшая технология Intel Hyper-Threading дает возможность операционной системе и многопоточному ПО рассматривать каждый физический процессор как два логических (физически разделены только наборы регистров и блоки XAPIC - Extended APIC, см. схему), распараллеливая решение нескольких задач между ними и повышая тем самым скорость отклика системы, производительность и скорость обработки транзакций. При этом эти логические процессоры осуществляют совместный доступ ко всей кэш-памяти и вычислительным блокам - FP, ALU и пр. Существующее ПО, оптимизированное для многопроцессорных систем, может использоваться с Hyper-Threading без каких-либо изменений. Для операционных систем нужна минимальная оптимизация, чтобы избежать ненужных простоев. Работу технологии поясняет схема.

Преимущества новой технологии: эффективнее используются ресурсы процессора, производительность при использовании многопоточного серверного ПО повышается до 30% в четырехпроцессорных системах и до 80% (в зависимости от задачи) в двухпроцессорных системах (по однопроцессорным пока данных нет). Повышается масштабируемость, уменьшается время отклика, увеличивается число обрабатываемых транзакций в масштабе предприятия. Огорчает, что для применения Hyper-Threading в системах на Windows XP требуется лицензирование операционной системы для дополнительных логических процессоров. Кроме того, чипсет системной логики и BIOS серверной платы должны быть специально «заточены» для распределения задач между процессорами.

© ООО "Компьютерра-Онлайн", 1997-2021
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.