Силиконы
АрхивОсновные модели
Если заглянуть в историю, то еще в начале 80-х, когда создавалась Silicon Graphics, главной целью было построение программно-аппаратной платформы, целиком ориентированной на работу с графикой. Более чем через десять лет оказалось, что темно-синие станции способны играть роль и суперкомпьютеров для сложных научных задач, и высокопроизводительных серверов для корпоративных систем, и Интернет-провайдеров, и многого другого. Но сначала была графика.
Из всех достоинств решений SGI самым важным представляется высокая производительность (причем это относится ко всем подсистемам: вычислительной, графической, ввода-вывода), которая сочетается с практически линейной масштабируемостью. Еще одна сильная сторона продуктов Silicon Graphics заключается в том, что уже в 1994 году - c выпуском микропроцессора MIPS R8000 - она перешла на полностью 64-битную платформу, поддержанную в операционной системе Irix 6.0.
Помимо анонсированных недавно станций на основе Pentium II (Silicon Graphics 320 и Silicon Graphics 540), SGI выпускает несколько линий станций и серверов. Коротко остановимся на них (см. таблицу).
O - станция "начального уровня" - по соотношению цена/производительность составляет конкуренцию PC и "Макам". В 1996 году она пришла на смену более ранним Indy. Поначалу в нее устанавливался процессор MIPS R5000, позже стали использоваться R10000 [2]. В O2 появилась архитектура UMA (unified memory access), где узлы станции - процессор, графический ускоритель, устройство компрессии, система ввода-вывода (СВВ) - получили возможность напрямую обращаться к основной памяти по сверхширокой шине.
Octane и Onyx2 имеют большую производительность и мощный набор интерфейсов. В качестве мультипроцессорной платформы в Octane была использована архитектура, близкая к CC-NUMA и основанная на так называемом crossbar switch. В Onyx2 (а также в Origin) SGI начала использовать архитектуру CC-NUMA. При этом Onyx2 более "тяжелая" станция, чем Octane, по сути - графический суперкомпьютер.
Серверы Origin позволяют строить масштабируемые системы хранения и распространения данных, а также используются для рендеринга сложных сцен. Стойки Origin и Onyx2 могут объединяться по суперкомпьютерному интерфейсу CrayLink с пропускной способностью 1,28 Гбайт/с.
Столпы
Посмотрим, на чем зиждется мощь станций и серверов SGI.
Основные модули процессора MIPS R10000.
Ядром всех современных рабочих станций SGI являются процессоры MIPS R10000 и MIPS R12000 (набор инструкций MIPS IV), построенные по суперскалярной RISC-архитектуре (см. рис.).
В процессоре R10000 имеются четыре параллельных конвейера обработки инструкций (команд). То есть за один такт одновременно извлекается и декодируется четыре инструкции. Каждый из конвейеров имеет доступ к трем очередям (queue): адреса, целочисленных операций и операций с плавающей точкой. Очереди занимаются динамическим планированием исполнения этапов инструкций, учитывая доступность необходимых данных, а также занятость вычислительных модулей. Каждая из трех очередей отвечает за свой класс задач. Так, очередь целочисленных операций имеет доступ к двум равноценным АЛУ (арифметико-логическим устройствам). Для выполнения операций с плавающей точкой соответствующая очередь имеет доступ к двум первичным (сложение и умножение) и двум вторичным (извлечение корня и деление) вычислительным модулям. Использование этих шести вычислительных модулей обеспечивает при относительно невысокой частоте (175-250 МГц для R10000) очень высокую производительность. Благодаря суперскалярной архитектуре, всего в различных стадиях обработки может находиться до 32 инструкций одновременно. Имеется также и механизм предсказания ветвлений (обработкой инструкций логических условий занимается специальное устройство - branch unit).
В R10000 предусмотрено два раздельных кэша первого уровня (L1): для кода (32К) и данных (32К). Большую роль в обеспечении общей производительности системы играет внешний кэш второго уровня (L2), в качестве которого могут использоваться микросхемы SSRAM. Объем кэша L2 - от 512 Кбайт до 16 Мбайт. Связь с ним процессор поддерживает через 128-разрядную шину с пиковой пропускной способностью 3,2 Гбайт/с.
Помимо микропроцессоров MIPS, платформу SGI подпирают еще по крайней мере четыре столпа:
1) вычислительная система, построенная по архитектурам UMA и CC-NUMA;
2) высокопроизводительная графическая подсистема;
3) высокопроизводительная система ввода-вывода;
4) межстанционный интерфейс.
|
Далее остановимся лишь на архитектуре CC-NUMA и структуре графической подсистемы.
Мощные станции и серверы SGI построены на архитектуре CC-NUMA. Аббревиатура расшифровывается как Cache Coherent NonUnified Memory Access, что означает "система с распределенной памятью и согласуемым кэшем". CC-NUMA объединяет в себе сильные стороны двух основных мультипроцессорных архитектур: кластерной (КА) и симметричной мультипроцессорной (SMP). Поэтому CC-NUMA имеет и другое название: S2MP.
Кластерная архитектура предполагает объединение по высокоскоростному интерфейсу практически независимых компьютеров (с собственной памятью и системой ввода-вывода). Каждый из них управляется собственной операционной системой (как правило, Unix). В отличие от КА, архитектура SMP - это система из нескольких процессоров с общей разделяемой памятью (UMA) и системой ввода-вывода.
CC-NUMA, в свою очередь, обладает следующими чертами:
Таким образом, архитектура CC-NUMA, реализованная SGI первоначально в линии Origin (октябрь 1996 года), строится из узлов. В каждом узле имеется два процессора R10000 (R12000), а каждый процессор обычно снабжен кэш-памятью L2 объемом до 4 Мбайт и до 4 Гбайт ОЗУ. Взаимодействие модулей узла осуществляет специальный чип-концентратор (hub).
Оперативная память отдельных узлов в CC-NUMA является распределенной. То есть каждый узел может обращаться как к собственной (near memory) памяти, так и к ОЗУ других узлов (remote memory). Узлы, в свою очередь, с помощью специальных маршрутизаторов (routers) собираются в мультипроцессорную систему (в последних моделях Origin их может быть до 256).
|
Графическая подсистема в станциях и серверах SGI строится на так называемых пайпах (pipe, pipeline), графических конвейерах. Рассмотрим их структуру на примере тех, что используются в Onyx2. Конвейер состоит из трех последовательно соединенных модулей:
Геометрическая машина (ГМ) отвечает за трансформации трехмерных геометрических примитивов (вращение, масштабирование и т. д.) и расчет освещенности. ГМ состоит из четырех процессоров, а каждый процессор - из трех ядер, реализующих арифметику с плавающей точкой по командам типа SIMD (single instruction multiple date). Помимо основной функции - расчета трехмерных геометрических моделей - геометрическая машина участвует и в обработке двухмерных изображений.
Назначение растеризатора соответствует названию. От ГМ он получает геометрические примитивы (точки, отрезки, треугольники) и формирует растр изображения, то есть решает задачи Z-буферизации, наложения текстур, смешивания (blending) и др. Для эффективной обработки текстур растеризатор имеет собственную память. Так, в Onyx2 в одном пайпе под текстуры отводится 4, 16 или 64 Мбайт памяти.
Наконец, генератор изображения, являясь выходным звеном пайпа, принимает данные из растеризатора и преобразует массив данных в аналоговый видеосигнал. Здесь надо лишь отметить, что графическая подсистема Onyx2 может формировать не только VGA-изображение, но и практически любой стандартный видеосигнал (NTSC, PAL, HDTV).
O2 | Octane | Onyx2 | Origin | |
Тип | R5000, R10000, R12000 | R10000, R12000 | R10000 | R10000, R12000 |
Число процессоров | 1 | 1-2 | 1-24 | до 128 узлов (по 2 процессора) |
Архитектура | UMA | crossbar switch | CC-NUMA | CC-NUMA |
Объем ОЗУ | до 1 Гбайт | до 2 Гбайт | до 12 Гбайт | до 4 Гбайт в каждом узле |
Доступные сетевые Интерфейсы | FDDI, 100Base-T Ethernet, ISDN, 2xT1/Ethernet, ATM, | ATM OC3 (4 порта) 100Base-T Ethernet (4 порта), Serial HiPPI, Fibre Channel | ATM OC3, Serial HiPPI 100Base-T Ethernet (4 порта), Fibre Channel, Gigabit Ethernet | ATM OC3, Serial HiPPI 100Base-T Ethernet (4 порта), Fibre Channel, Gigabit Ethernet |
Пропускная способность по обработке видео | 1 поток несжатого видео | Несколько потоков несжатого видео с возможностью использования эффектов в real-time. Совместим с HDTV | Предпросмотр с разрешением 2048x1107x24кадра/с. Совместим с HDTV | Поток MPEG-2 (3 Мбит/с) Более 1000 потоков (через АТМ) |
1 (обратно к тексту) - Недавно Silicon Graphics объявила о переименовании в SGI. Это не столько смена имени и логотипов, сколько перестройка внешнего имиджа компании, продолжение серьезной внутренней реструктуризации, длящейся уже около года. 2 (обратно к тексту) - C недавнего времени станции и серверы SGI начали поставляться с более мощным процессором R12000. Помимо повышения тактовой частоты (до 300 МГц), в новый процессор внесен целый ряд архитектурных изменений. |