Кластеры начинают и выигрывают
АрхивВ середине ноября в Финиксе, столице штата Аризона, состоялась конференция по суперкомпьютерным вычислениям (SC2003), которая проводится дважды в год.
=+=+=+=В середине ноября в Финиксе, столице штата Аризона, состоялась конференция по суперкомпьютерным вычислениям (SC2003), которая проводится дважды в год.
По давней традиции к этому форуму приурочена публикация Top500 — рейтинга полутысячи самых быстрых суперкомпьютеров планеты (www.top500.org). Осветим вкратце главные особенности нынешней, 22-й по счету, редакции топ-списка и те тенденции в развитии высокопроизводительных вычислений, которые он отражает.
Когорту «самых-самых» по-прежнему уверенно возглавляет японский Earth Simulator, изготовленный компанией NEC и демонстрирующий на классификационном тесте Linpack (решение большой системы линейных уравнений) производительность 35,86 терафлопа (триллионов операций с плавающей запятой в секунду). Второе место, как и полгода назад, занимает с 13,88 терафлопа система ASCI Q, собранная в Лос-Аламосском ядерном центре компанией Hewlett-Packard на базе машин AlphaServer SC45. А вот на третью строчку взобрался интересный дебютант — самодельный кластер Вирджинского технологического института (фото 1), основанный на процессорах PowerPC 970 (G5) и показавший в тестах быстродействие 10,28 терафлопа (см. «КТ» #518). Получивший аскетичное название «X», а в прессе обычно именуемый «Биг Маком», он стал не только третьим в мире суперкомпьютером, сумевшим преодолеть 10-терафлопный рубеж, но и первым, собранным на базе машин Apple. Причем за очень скромные для этой сферы деньги: система из 1100 двухпроцессорных блоков обошлась в 5,2 млн. долларов (приблизительная стоимость Earth Simulator, к примеру, составляет 350–400 миллионов). Воодушевленные успехом, конструкторы из Virginia Tech обещают собрать 50-терафлопный кластер уже в 2006 году.
Четвертым в Top10 идет еще один новый кластер, собранный компанией Dell в Национальном центре суперкомпьютерных приложений (NCSA) на основе машин PowerEdge 1750 с процессором P4 Xeon. Он получил название Tungsten и лишь самую малость не дотянул до десятитерафлопного рубежа (тестовый результат 9,82 Тфлоп). Кластером является и «номер пятый» — надстроенная система Mpp2, установленная HP в Национальных лабораториях Pacific Northwest. На шестом месте — первая в Top500 система Lightning на основе процессора AMD Opteron, собранная фирмой Linux Networx в Лос-Аламосе. Следует подчеркнуть, что кластерных систем за последнее время заметно прибавилось — даже в элитном Top10 их теперь семь. Остальные три места пришлись на упомянутый Earth Simulator и на две системы IBM SP, установленные в Лоуренсовских ядерных центрах в Ливерморе и Беркли. За исключением «Симулятора Земли», все остальные суперкомпьютеры из Top10 теперь находятся в США (в прошлом списке были машины из Японии и Франции), а порог вхождения в первую десятку поднялся за полгода с 4 до 6,6 Тфлоп.
Общие же характеристики нынешнего Top500 выглядят так. Суммарная производительность машин превысила половину петафлопа (то есть квадриллиона операций в секунду) и составила 528 Тфлоп (шесть месяцев назад было 375 Тфлоп). Количество систем, демонстрирующих на Linpack быстродействие выше 1 Тфлоп, возросло с 59 до 131. Самая последняя в списке система с производительностью 403,4 гигафлопа полгода назад занимала 290-ю позицию, когда начальный порог составлял 245 Гфлоп. Подобный рост производительности существенно обгоняет средние темпы, диктуемые законом Мура.
На глазах растет представительство в Top500 корпорации Intel. Сейчас на основе ее чипов собраны 189 систем, полгода назад их было 119, а год назад лишь 56. Этот процесс можно трактовать как демократизацию элитного сектора суперкомпьютеров, когда все больше машин опираются на процессоры массового рынка. Об этом же говорит и заметный рост кластерных систем, число которых увеличилось за полгода со 149 до 208. В результате кластеры стали ныне наиболее распространенной архитектурой в Top500.
Если ранжировать фирмы по суммарной производительности изделий, то здесь явно лидирует IBM — ее доля выросла до 35,4% (год назад было 31,8%, полгода назад — 34,9%). На втором месте остается Hewlett-Packard (22,7%), на третьем — NEC (8,7%). Корпорация Cray, единственная в США, изготовляющая векторные (как Earth Simulator) суперкомпьютеры, представлена в рейтинге десятью такими системами X1, самая мощная из которых стоит на 19-й позиции (2,93 Тфлоп).
Особого внимания заслуживает дебют «тестового прототипа» системы IBM BlueGene/L (фото 2), показавшего пока скромную производительность 1,43 Тфлоп и занявшего 73-е место. Но физически этот суперкомпьютер представляет собой всего лишь вполовину усеченную стандартную стойку (то есть блок «размером с 30-дюймовый телевизор»), в то время как сравнимые по производительности системы занимают приличных размеров машинные залы. Благодаря хитростям сборки, инженеры IBM упаковали в такой блок 512 сдвоенных процессоров PowerPC 440, тем самым обеспечив теоретическую производительность 2 Тфлоп. В целом же BlueGene/L будет собрана из 64 полных стоек в Ливерморском центре им. Лоуренса и, как планируется, в 2005 году достигнет производительности 360 Тфлоп. Заветный петафлопный рубеж намечено достичь в 2006 году, с помощью машины BlueGene/P.
Еще одним важным событием конференции SC2003 стало известие о создании новой, существенно отличающейся от Linpack, системы тестов для более объективной оценки и сравнения высокопроизводительных компьютеров. Неадекватность Linpack реальным задачам уже давно не устраивает суперкомпьютерное сообщество; не первый год имеется и альтернативный рейтинг IDC (IDC Balanced Rating, см. «КТ» #424), который, однако, игнорируется в Top500. Теперь же объявлено о запущенной в августе под эгидой DARPA (Агентства передовых военных исследований США) программе HPCS («Компьютерные системы высокой производительности»), участники которой за три года должны разработать новые «бенчмарки» для всесторонней оценки аппаратных и программных аспектов суперкомпьютеров. Причем с HPCS сотрудничают и организаторы Top500. Представитель руководства DARPA Роберт Грейбил (Robert Graybill), курирующий создание новой системы тестов HPCchallenge, прокомментировал инициативу такими словами: «Точно так же, как Linpack повлиял на особенности разработки машин [многие годы суперкомпьютеры специально «затачивались» под этот тест], новые тесты, мы надеемся, окажут влияние на будущие архитектурные решения. Мы намерены создавать не просто компьютеры петафлопного масштаба, а более полезные в работе системы».