Альтернативная история: nForce 4 SLI Intel Edition и i955X
АрхивКак часто мы задаемся вопросом «а что было бы, если…»! А вот что было бы, согласись корпорация Intel предоставить Nvidia лицензию на процессорную шину QPB и разрешив ей, таким образом, продажу чипсетов для процессоров Pentium 4?
Как часто мы задаемся вопросом «а что было бы, если…»! А вот что было бы, согласись корпорация Intel предоставить Nvidia лицензию на процессорную шину QPB и разрешив ей, таким образом, продажу чипсетов для процессоров Pentium 4?
Ведь выходя на рынок чипсетов для настольных платформ, Nvidia фактически начинала с нуля. У нее не было ни имени, ни купленных на стороне разработок — и для чего изготавливать чипсеты, ей, по большому счету, было неважно. Однако Intel в те времена ревностно оберегала от конкурентов рынок чипсетов для процессоров Pentium 4(Чтобы делать чипсеты для Pentium 4 (и Pentium M), нужна лицензия на использование процессорной шины QPB (Quad Pumped Bus), с которой работают эти процессоры. А Intel на первых порах отказывалась передавать лицензии — исключение было сделано только для Silicon Integrated Systems (SiS), да и то не сразу. В результате VIA, рискнувшая выпускать чипсеты без лицензии на QPB, долго и упорно была вынуждена судиться с Intel), и лицензию на шину QPB предоставлять то ли вообще отказалась, то ли предложила совершенно неприемлемые условия. Таким образом, несмотря даже на то, что самый первый чипсет Nvidia (X-MCP, использовавшийся в консоли Xbox) предназначался для процессоров Intel (Pentium 3, шина AGTL+), едва ли не единственным перспективным и открытым рынком для американской корпорации оказался рынок чипсетов для процессоров AMD. Благо в Advanced Micro Devices ей были только рады.
Последующий громкий успех «графического» гиганта (на сегодняшний день он контролирует от 50 до 60% рынка чипсетов для процессоров AMD) и ставшие поистине культовыми чипсеты nForce показали, что на этом деле Nvidia собаку съела. Так что у Intel и впрямь были все основания опасаться потери лидерства на своем «родном» рынке. И выйди nForce2 Intel Edition — еще вопрос, кто стал бы два года назад самым популярным и востребованным чипсетом: i865, весьма вероятно, пришлось бы изрядно потесниться. Да и AMD, оказавшейся в самый тяжелый момент (K7 уже устарел, а K8 еще толком не вышел) без такого «суперчипсета», каким был nForce 2, а сегодня — без такого мощного средства «раскрутки» Athlon 64, как nForce 4, пришлось бы куда как хуже.
Впрочем, сколько ни предлагай гипотез на тему «а что было бы, если» — историю это не изменит. Сегодня лицензия на QPB стала доступной всем (Даже VIA помирилась с Intel), но вот много ли с того Nvidia пользы, если рынок уже поделен, Intel имеет мощнейшую линейку чипсетов на все случаи жизни (недаром же корпорация легко удерживает более 80% этого рынка), а VIA и SiS отчаянно борются за свое присутствие, выпуская очень дешевые и притом весьма удачные чипсеты? Линейка nForce никогда не была дешевой — это всегда был уверенный mainstream пополам с hi-end, так что выпускать более дешевые чипсеты Nvidia явно не с руки. Можно было бы выпустить альтернативу линейке i915-i955 с чуть лучшей функциональностью за те же деньги — но, похоже, условия лицензионного соглашения с Intel (которое явно содержит пунктик по лицензионным отчислениям с каждого проданного чипсета для Pentium 4) делают этот вариант невыгодным экономически (Не работать же себе в убыток, отбивая рынок, на котором даже сложился устойчивый фразеологизм Intel+Intel — процессор Intel на чипсете от Intel, как синоним «правильной» — надежной, быстрой и функциональной системы). Тупик? Оказывается, нет: вместо того чтобы бороться за уже занятые ниши, можно попробовать организовать «свою». Нишу крайне дорогих, «особенных» чипсетов. Главное, чтобы у них была яркая уникальная черта, делающая эти чипсеты в чем-то принципиально лучше чипсетов конкурента. И чтобы все остальные характеристики при этом тоже были на высоте — как минимум не хуже, чем у лучшего чипсета конкурента.
И такая черта у чипсетов Nvidia есть — это поддержка технологии SLI. Напомним (www.terralab.ru/video/37911), что Scalable Link Interface позволяет объединять в системе две видеокарты и таким образом получать не только вывод изображения на четыре (и даже больше) монитора, но и значительно увеличивать производительность в трехмерных графических приложениях. И хотя востребованность этой технологии, по правде говоря, не очевидна[Ибо выигрыш от SLI начинает проявляться только при использовании видеокарт класса GeForce 6800 ($350 и выше). Вместо двух 6600GT гораздо проще (и выгоднее) купить за те же $400 плату на 6800 Ultra. Впрочем, в качестве апгрейда (вначале покупаем одну 6600GT, затем докупаем вторую) это тоже неплохой вариант], весьма недешевые ($50) чипсеты nForce 4 SLI сегодня разлетаются как горячие пирожки. Так что рецепт выхода на новый рынок оказался довольно простым: берем топовый (и дорогой) чипсет, адаптируем его для работы с процессорами Intel — и перед нами nForce 4 SLI Intel Edition.
Практика
Несмотря на название, от «родного» nForce 4 SLI в чипсете осталась, по большому счету, лишь функциональность. Благодаря тому что у процессоров архитектуры K8 контроллер оперативной памяти встроен в процессор, Nvidia уже давно и успешно использует в чипсетах «одночиповую» схему — то есть обходится для построения системы одним-единственным чипом MCP (Media Control Processor), объединяющем всю мыслимую периферию. Это удобно — проектировщику не нужно заботиться о размещении двух чипов на плате, а поскольку HyperTransport, который AMD использует вместо FSB, особых ограничений на расположение MCP не накладывает — его можно ставить где угодно. Что производители с удовольствием и делают: разводка плат «под nForce» обычно проще и эффективнее, чем под альтернативные чипсеты. Кроме того, сделать, упаковать и распаять на плате один кристалл заметно дешевле, нежели два. Однако Pentium 4 — далеко не Athlon 64, и без сложного и громоздкого контроллера памяти в чипсете работать он не будет. Поэтому Nvidia в nForce 4 Intel Edition вернулась к старой проверенной схеме nForce 2, использовавшейся для процессоров архитектуры K7. К процессору по QPB подключается северный мост — SPP (System Platform Processor), в котором расположен контроллер памяти и к которому по PCI Express подключаются видеокарты и самые производительные устройства (гигабитная сеть или RAID-контроллер, например). А уж к SPP по шине HyperTransport (Nvidia состоит в консорциуме разработчиков HTC и успешно использует ее во всех своих чипсетах. Хотя не будем скрывать, что главным разработчиком этой шины является злейший конкурент Intel — компания AMD. Вот и еще один пример «конвергенции» современных технологий) подключается богатый разнообразной «медленной» периферией MCP (рис. 1).
В первую очередь следует отметить чрезвычайно продвинутый контроллер памяти. Этот контроллер входит в состав любого графического процессора, так что опыт в их создании за всю многолетнюю историю линейки NVxx у Nvidia накоплен изрядный. При этом, если посмотреть спецификации, окажется, что nForce 4 SLI Intel Edition поддерживает самую обычную двухканальную оперативную память DDR2 с частотами 400, 533, 667 МГц в виде четырех слотов DIMM. Да и что, казалось бы, здесь можно сделать еще? Оказывается, сделать можно довольно много. Во-первых, в nForce 4 SLI Intel Edition встроен блок DASP третьей версии [Первые две версии были в nForce и nForce 2 соответственно. Третья версия DASP, в частности, оптимизирована для процессоров с Hyper-Threading и двухъядерных процессов (несколько одновременных потоков обращений к памяти)]. Этот Dynamic Adaptive Speculation Preprocessor, как и следует из названия, занимается тем, что анализирует (Dynamic Adaptive) все обращения к оперативной памяти, пытается «угадать» (Speculative) следующие обращения и заблаговременно прочитать и «закэшировать» соответствующие участки оперативной памяти. DASP, как правило, ничего не дает в плане увеличения «потоковой» пропускной способности памяти, но зато может значительно снижать латентность оперативной памяти в не слишком оптимизированных приложениях.
Во-вторых, в nForce 4 SLI предусмотрены раздельные шины адреса и управления для каждого из четырех слотов DIMM. Если бы инженеры сделали еще и раздельные шины данных для каждого из слотов памяти (а не общие шины данных на каждый канал памяти), это бы означало четырехканальный (!) контроллер памяти — и вдвое более высокую пропускную способность памяти. Но разводка четырех каналов SDRAM чрезвычайно сложна и потребовала бы очень дорогих материнских плат. А вот такой «промежуточный» вариант в виде двух шин данных и четырех шин адресов и управления хоть и не увеличивает пропускную способность, зато позволяет еще больше снизить латентность обращения к памяти за счет использования 1T-адресации.
В-третьих, last but not least, в nForce 4 SLI IE реализована технология, уменьшающая потери, которые возникают при использовании асихронной памяти (рис. 2). Мелочь, но мелочь актуальная, с учетом того, что подавляющее большинство процессоров Intel работают с шинами, частоты которых не выше 800 МГц, а быстрая оперативная память обычно работает на отличных от 400 МГц частотах.
Конечно, Intel тоже есть чем похвастаться. Контроллеры памяти в ее чипсетах, начиная с i875, используют ряд «оптимизаций», сводящихся к минимизации «пауз» между обращениями к памяти и минимизации задержек прохождения данных через чипсет (то, что раньше называлось PAT). Вдобавок, хоть Intel и не акцентирует на этом внимания, не исключено, что и ее чипсеты поддерживают выделенную Address & Command Bus. Да и особенности своих процессоров Intel, разумеется, знает куда лучше Nvidia. Так что рассудить «кто лучше» может только объективное тестирование.
Было решено остановиться на DDR2 533 с таймингами 3-3-3-7 из-за лучшего соотношения ПСП/латентность. Результаты — в таблице 3.
У nForce 4 SLI на самую малость (порядка 1% !) лучше латентность; с пропускной способностью памяти ситуация неоднозначна — в некоторых тестах впереди 925XE, в некоторых — nForce 4 SLI. Впрочем, победа «по очкам» все-таки присуждается последнему[Правда, у некоторых зарубежных сайтов получилось, что nForce 4 SLI по латентности выигрывает очень заметно: порядка 70 нс против 80 нс у 955X (по данным AnandTech)]. Хотя до систем на K8 обоим чипсетам очень далеко.
Что еще может предложить nForce 4 SLI, помимо производительности, не уступающей топовым чипсетам Intel? Поддержку любых процессоров для сокета LGA775 (вплоть до поддержки старой полузабытой шины FSB 400 МГц), включая двухъядерные Pentium D и Pentium Extreme Edition. Вдвое больший поддерживаемый объем оперативной памяти (до 16 Гбайт). Подключаемые напрямую к северному мосту устройства PCI Express. Всевозможные RAID, вплоть до RAID 5 [Вариант RAID 0, но с введением избыточного кодирования. Несколько уменьшает эффективный объем массива дисков, зато подобный массив, как и RAID 0+1, не «умирает» при отказе одного из дисков. Кстати, поддержка RAID 5 — единственное отличие в функциональности (не считая, конечно, контроллера памяти и типа FSB) nForce 4 SLI Intel Edition от «обычного» nForce 4 SLI] (причем загрузочного). Два канала UltraATA 133 вместо одного, причем с возможностью организации RAID (то есть возможностью полноценного использования винчестеров с интерфейсом PATA). Поддержку SATA2, включая поддержку NCQ[Технология Native Command Queing (NCQ), позволяющая оптимизировать обращения к жесткому диску и за счет этого заметно поднять его производительность. Должна поддерживаться не только чипсетом, но и жестким диском]. Десять портов USB 2.0 вместо восьми. И, конечно же, первоклассную интегрированную сеть. Гигабитный Ethernet интегрирован в южный мост, PCI-E сетевые решения могут подключаться напрямую к северному MCP, но это не главное. Главное — аппаратный модуль ActiveArmor, позволяющий ускорить обработку многих задач, связанных с сетью, — вплоть до частично аппаратного брандмауэра Nvidia Firewall. Учитывая, что обработка потока данных на скорости 1 Гбит/с — непростое занятие даже для мощных современных процессоров, подобного рода разгрузка, безусловно, может сказываться на производительности компьютера самым положительным образом.
Увы, все это смотрится блестяще только на фоне i915 и i925. Я не буду подробно расписывать все изменения, внесенные в i955 по сравнению с i925 (они носят преимущественно экстенсивный характер, см. таблицу 1), а остановлюсь лишь на самых заметных «штрихах» новой платформы.
Во-первых, i955 тоже поддерживает двухъядерные процессоры и DDR2 667.
Во-вторых, с выходом i955 и ICH7 поддержку RAID 5, SATA/300 и NCQ [Правда, у Nvidia, по информации с западных сайтов, NCQ реализован заметно лучше. Впрочем, этот вопрос требует отдельного изучения] получили и чипсеты Intel. Больше того: они поддерживают технологию Intel Matrix Technology, позволяющую организовывать RAID не в масштабах целых дисков, а ограничиваясь отдельными разделами. Скажем, в рамках двух дисков можно организовать и RAID 0 для «быстрого» раздела, и RAID 1 для «надежного». Правда, Parallel ATA так и остался лишь один (причем сравнительно старый UltraATA 100), но с повсеместным распространением жестких дисков SATA (новейшие модели которых явно выигрывают у PATA-дисков хотя бы за счет поддержки NCQ) это уже не является заметной проблемой.
Устройства PCI Express (кроме видеокарты) подключаются к южному, а не северному мосту — зато i955 предлагает теперь уже целых шесть линий PCI Express, что позволяет организовать либо больше слотов PCI-E x1 и интегрированных устройств на этой шине, либо безболезненно развести более мощный слот PCI Express x4.
Наконец, i955 поддерживает потенциально более качественный звук High Definition Audio (HDA), тогда как nForce 4 SLI вынужден довольствоваться обычным восьмиканальным AC’97.
По сути, единственное серьезное преимущество nForce 4 SLI заключается в аппаратном блоке ускорения работы с сетью: если компьютер работает в качестве сервера или если пользователь активно использует сеть — это становится весьма актуальным. Зато i955, в свою очередь, поддерживает технологию Active Management (AMT), позволяющую эффективно настраивать компьютер и управлять им по сети. То есть, «по гамбургскому счету», оба чипсета — и i955, и nForce 4 SLI IE — по своим возможностям примерно равноценны. За исключением той самой изюминки, которая и оправдывает даже более высокую цену ($80 за nF4 против $50 за i955) нового чипсета, — поддержки технологии SLI.
Scalable Link Interface
Здесь, правда, особенно комментировать нечего: SLI новый чипсет поддерживает точно так же, как и подробно описанный нами старый верный nForce 4 SLI. Поэтому всех интересующихся я отсылаю к соответствующей статье в «КТ» #9 от 8 марта 2005 года. А здесь просто добавлю, что все преимущества и недостатки технологии он перенял в полной мере.
Только глядя на эти результаты, и понимаешь, ради чего следует предпочесть nForce 4 SLI Intel Edition «родному» i955: преимущество SLI-систем над обычными так явно и неоспоримо, что дилеммы для заядлого геймера просто нет. Тем более что в «тяжелых» режимах с анизотропией и антиалиасингом (а только ради них, в общем-то, и может потребоваться SLI) различия между платформами AMD и Intel заметно сглаживаются — Pentium 4 560 хоть и уступил Athlon 64 3500+ «по сумме баллов», однако назвать безоговорочного победителя трудно. Так что если деньги есть, nForce 4 SLI Intel Edition позволит собрать систему на процессоре Intel, практически ни в чем не уступающую аналогичной «геймерской» платформе AMD.
Подведем итоги. i955X — это следующее поколение чипсетов Intel и достойная замена семейству i925X. Ключевые новшества — поддержка NCQ, iAMT, RAID 5, DDR2-667 и увеличенное в полтора раза число линий PCI Express в южном мосте. Ничего принципиально нового, однако вполне достаточно, чтобы признать превосходство i955 над предшественниками.
nForce 4 SLI Intel Edition — крайне дорогой чипсет, не уступающий по функциональности и производительности i955X и ориентированный на геймерские системы, в которых актуально использование технологии SLI. В не-SLI-системах, пожалуй, в большинстве случаев предпочтительнее гораздо более дешевый и ничуть не худший i955X.
Благодарим московское представительство MicroStar International (MSI) за предоставленные на тестирование плату, видеокарты и оперативную память.