Mать-героиня
АрхивНе успела угаснуть слава материнской платы BP6 фирмы ABIT (если кто еще не знает - двухпроцессорная для Celeron PPGA), как известному в стане гурманов изобретателю "вкусных мамок" удалось покорить очередную вершину, на которую еще не ступала нога Homo Computerus. В попытках выжать все возможное из самого удачного чипсета всех времен и народов i440BX специалисты ABIT превзошли самое Intel.
Судите сами: им удалось разработать специальную микросхему-диспетчер, позволяющую этому чипсету работать с четырьмя процессорами (квадральная конфигурация)! Напомню, что по спецификации он рассчитан максимум на два процессора. Как утверждают разработчики, их техническое решение подходит только для процессоров Celeron PPGA 300-533, Pentium Pro и Pentium II/III Xeon 400-550 МГц. Все процессоры для Slot 1, а также Coppermine (FC-PGA и Xeon от 600 МГц) не поддерживаются. Уже спроектирован опытный вариант системной платы ABIT BP12 для четырех процессоров Celeron PPGA (см. фото), хотя официально об этом еще не объявлено (разработка аналогичных плат для Pentium Pro и Pentium II/III Xeon, очевидно, не планируется по маркетинговым соображениям).
Принцип работы такой системы пока не раскрывается, но кое-что узнать все же удалось. Чтобы разобраться в деталях, нужно вспомнить историю. Как известно, интерфейс системной шины процессоров шестого поколения, впервые примененный для Pentium Pro в далеком 1996-м, рассчитан на объединение в симметричную мультипроцессорную систему до четырех процессоров с помощью внутренних схем арбитража чипсета. Для этого используется несколько специальных сигналов шины: BP[3:2]# (breakpoint - сигналы от процессоров, указывающие на попадание в точку останова) и сигналы запроса шины (bus request) BR0# (I/O), BR1#, BR2#, BR3# (I). Для Pentium Pro и Pentium II/III Xeon используется полный набор сигналов, тогда как для Pentium II/III (Slot 1) - только BR0# и BR1# (соответственно контакты А76 и В75 разъема Slot 1), что допускает использование последних только в дуальной конфигурации.
Вообще, с именем Pentium Pro связано много прогрессивных нововведений, таких как динамическое (упреждающее) исполнение команд, архитектура двойной независимой шины (одна шина системная, другая - для работы с кэшем), оптимизированное параллельное исполнение 32-битного кода и встроенный в корпус процессора кэш второго уровня (L2) емкостью 256-512 Кбайт, работающий на частоте ядра CPU (привет "Коппермайну"). Профессионалы до сих пор с теплотой в душе вспоминают (и используют!) машины на Pentium Pro. Именно он стал плодовитым отцом нового семейства, произведя на свет таких способных детишек, как Mendocino (Celeron с кэшем L2 в 128 Кбайт) и Coppermine. Недоносок же Pentium II родился от потуг Intel в погоне за дешевым решением и длинным баксом.
Дело в том, что уровень технологии 1996 года не позволял делать L2-кэш на одном кристалле с процессором, и оба чипа (кэш и CPU) располагались рядом в общем корпусе Pentium Pro (под гнездо Socket 8). Этот вариант был весьма дорогостоящим и не очень надежным. Тогда было решено заменить встраиваемый кэш вдвое более медленными отдельными микросхемами, размещаемыми на одной печатной плате с процессором (в картридже для разъема Slot 1). А в качестве призрачной компенсации упавшей вдвое частоты кэша увеличили его объем до 512 Кбайт. Позже практика показала, что даже вчетверо меньший L2-кэш, работающий на полной частоте ядра (как в Mendocino), справляется с большинством задач не хуже (а иногда и лучше)! Кроме того, в ядро Pentium II надо было добавить поддержку модных тогда команд MMX. Так вот, в процессе такой, с позволения сказать, "модернизации" пришлось пожертвовать большим количеством контактов разъема процессора: если в Socket 8 их насчитывалось 387, то в Slot 1 - всего 242. Соответственно, экономили везде, где можно и нельзя. К этому добавилось и давление маркетологов - поначалу нужно было сохранить спрос на продолжавшие производиться более дорогие Pentium Pro, для чего им отвели нишу серверов и самых дорогих рабочих станций, где приветствовалась поддержка четырехпроцессорности. Для Pentium II же оставили только двухпроцессорность, причем чисто механическим способом - не став разводить на разъем Slot 1 соответствующие контакты. При этом ядро процессора почти не изменилось, сохранив все "четырехпроцессорные" возможности как есть. Впоследствии это было использовано в дорогих серверных моделях Pentium II/III Xeon 400-550 МГц, которые оснастили большим L2-кэшем (512-2048 Кбайт), работающим на полной частоте ядра, и большим разъемом Slot 2 (SC330) с 330 контактами, где хватало места на все "четырехпроцессорные" сигналы.
Технология производства микросхем постоянно улучшалась, и со временем стало возможно разместить L2-кэш на одном чипе с ядром процессора. Так появился чудный процессор Mendocino (фактически, Pentium II с кэшем L2 в 128 Кбайт, работающий на полной частоте ядра). Разрабатывая его, специалисты Intel следовали известному принципу: "если сложная система работает хорошо, то не надо ничего трогать", и оставили ядро практически без изменений, то есть не убирая "четырех-" и "двухпроцессорных" функций. Впоследствии, когда Celeron стали паковать в 370-контактный корпус PPGA (разъем Socket 370), большинство сигналов развели на внешние ноги. В их число попали и многопроцессорные возможности. Однако, опасаясь конкуренции Celeron'а с более дорогими моделями Pentium II, документировать эти возможности не стали, ограничившись в спецификации большим количеством контактов "reserved for future use". Тем не менее, благодаря аналогиям c PII по разъему Slot 1 "двухпроцессорность" Celeron стала известна почти сразу (и была реализована, в частности, в многочисленных переходниках Socket-Slot и материнских платах ABIT BP6 и др.). А вот "четырехпроцессорность" была сокрыта до недавнего времени: поди разбери сразу, какие из множества "reserved"-контактов чему соответствуют! И вот справедливость наконец восторжествовала: теперь мы можем использовать героический Celeron на полную мощь его мультипроцессорных возможностей.
Однако здесь есть ряд тонкостей. Все дело в том, что официально только два чипсета поддерживают четырехпроцессорную конфигурацию - i450GX для Pentium Pro (системная шина не выше 66 МГц) и i450NX для Pentium II/III Xeon. Даже серверный i440GX (брат знаменитого i440BX) - только двухпроцессорный. Но и тут фирма Intel преподнесла нам подарок. Во избежание последующих кардинальных переделок чипсеты изначально проектировались со всеми возможными функциями, которые потом просто отключались в зависимости от конкретных вариантов применения. Так, например, все чипсеты после i450GX, в том числе i440BX и i440GX, несут в себе возможности четырехпроцессорной работы, не реализованные, однако, на уровне полнофункциональной разводки контактов (интерфейса). Эту особенность и использовали спецы из ABIT, спроектировав достаточно простую логическую схему-диспетчер, восстанавливающую все мультипроцессорные сигналы по части доступных служебных сигналов чипа i443BX.
Итак, материнская плата ABIT BP12, являясь достойной наследницей платы BP6, по праву может считаться матерью-героиней, поскольку поддерживает до четырех процессоров Celeron PPGA. Разумеется, возможна ее работа как в двухпроцессорном, так и однопроцессорном вариантах, а также сосуществование разных по частоте процессоров. Кроме того, заявляется поддержка до двух процессоров Coppermine FC-PGA (BP6 "мамка" до сих пор их не понимает). Замечу попутно, что все процессоры на ядре Coppermine официально поддерживают только двухпроцессорность, в том числе и убогие Xeon на 600 МГц и выше (у которых кэш L2 объемом 256 Кбайт смешон в сравнении с 1-2 Мбайт у предыдущих моделей Xeon на 550 МГц). На плате BP12 кроме стандартных возможностей чипсета i440BX и BIOS c SoftMenu III (частота шины от 66 до 200 МГц с шагом 1, ручная установка всех напряжений) реализована интересная система мониторинга: измерение температур всех процессоров по встроенным в них термодиодам плюс две системные температуры, шесть вентиляторов с возможностью управления скоростью от термодатчиков, выносной оптический датчик для измерения скорости вращения большого системного вентилятора, измерение всех напряжений. Кроме того, имеется дополнительный контроллер UltraATA/100 на чипе HPT370 со скоростью передачи по интерфейсу IDE до 100 Мбайт/с. Напомню, что новейшие диски IBM уже оснащены таким интерфейсом.
Пользуясь обаянием, авторитетом и тайными связями Евгения Козловского, а также "железной" репутацией Ильи Хрупалова, нам удалось раздобыть опытный экземпляр шедевра ABIT. Стала очередь за четырьмя процессорами. Тестировать такую мать на шине 66 МГц (даже с процессорами на 533 МГц) я посчитал неприличным. Значит, разгон! Два Celeron'а 300А, разогнанных до 600 МГц (системная шина 133 МГц), были сняты с моей BP6. Еще пару таких же "гнедых" найти оказалось очень непросто. Остальное железо под стать: два 128-мегабайтных модуля (PC133, Infineon), видео на GeForce 256, HDD Quantum LM 30 Гбайт. А представительство Intel выделило нам парочку FC-PGA Coppermine на 600 МГц (шина 100 МГц)... Чтобы засунуть такую высокую плату в мой middle-tower ATX, пришлось вынуть из него блок питания. Неутомительная процедура инсталляции Windows NT 4.0 обрадовала беспроблемным опознанием четырехпроцессорной конфигурации (см. скриншот). Установка драйверов контроллера UltraATA/100 прошла как по маслу (к сожалению, проверить его на трафике 100 Мбайт/с не удалось из-за отсутствия поддержки со стороны диска).
Разумеется, только Бивису с Батхедом придет в буйны головы тестировать такую систему в играх или офисных приложениях. Для начала решено было ограничиться парой профессиональных задач - расчетом сцены в 3D Studio MAX и конструкции в ProENGINEER. Результаты превзошли самые смелые ожидания! В ProENGINEER скорость расчета была прямо пропорциональна числу процессоров (4 минуты против 16 для одного такого процессора). Почти так же хорошо считала ДДД-студия: 16, 30 и 59 минут для четырех, двух и одного процессора соответственно. Как вам Pentium III c частотой 2,4 ГГц уже сегодня? Willamete "отдыхает" и будет это делать, видимо, еще долго. Как, впрочем, и Coppermine, показавший на 600 МГц практически одинаковые результаты с Celeron'ом 600 МГц из-за более медленной системной шины. Еще большие преимущества сулит грамотная мультизадачная загрузка. Одновременно запущенные компиляция исходника на C++, решение сложной задачи в пакете Matlab 5.2, архивация 650 Мбайт WinRAR'ом с максимальной компрессией (резидентно включен антивирусный контроль всех файлов DrWEB'ом), конвертирование около 10000 фотографий из PCX в JPG и поворот на 7 градусов огромной фотографии в Photoshop'е выполнялись на четырехпроцессорной системе примерно в 8 раз быстрее, чем на аналогичной однопроцессорной! Более того, когда я в диспетчере назначил каждой задаче конкретный процессор, преимущество стало десятикратным (главной сложностью в этом тесте было рассчитать оптимальный размер памяти, чтобы как можно реже использовался своп)!
По неофициальным данным, системная плата будет объявлена в апреле, а продажи начнутся в мае по цене около 150 долларов (крупные партии). Так что если успеть закупить четыре процессора Celeron 333 с разгоном до 500-550 МГц, то всего за 400 буказоидов небогатые профи смогут организовать себе производительность 2001 года уже сейчас. Кто же устоит перед таким соблазном?