Отладка кристаллов микросхем
АрхивОдно из важнейших условий стабильности работы системы — надежность и качество ее комплектующих.
Одно из важнейших условий стабильности работы системы — надежность и качество ее комплектующих. И в первую очередь это касается микропроцессоров и других современных микросхем. Еще на стадии проектирования проводится моделирование распространения сигналов и синхронизации, а также моделирование на уровне компонентов, микросхемы и системы в целом.
Например, только на стадии разработки процессоры Intel проходят 176 квадриллионов (1015) циклов проверки (Вообще, по ряду оценок, корпорация Intel реализует самую полную в отрасли программу испытаний процессоров и платформ, и совместно с производителями и разработчиками программного обеспечения работает над оптимизацией производительности и совместимости платформ. Intel тратит на проверку своей продукции более 300 миллионов долларов в год, этой работой занято более 2500 сотрудников корпорации по всему миру). А после выпуска образцов проводится строгое тестирование на уровне системы и проверка электрических параметров, а также всестороннее испытание на совместимость, охватывающее более двадцати операционных систем, полутора сотен периферийных устройств и четыреста приложений. Проверка включает более 250 тысяч отдельных тестов с использованием более чем шестисот программных приложений и длится примерно 6–8 недель круглые сутки. Мобильные эталонные платформы проходят примерно 26 тысяч часов дополнительного тестирования и испытаний — в частности, средствами управления энергопотреблением, в более широком диапазоне условий среды и пр.
Серьезнее всего проверяется «сердце» компьютера — процессор. Скажем, процессор Pentium 4 проходит 1 триллион случайных проверок инструкций в неделю, 2 тысячи тестов на совместимость с предыдущими архитектурами, 2450 тестов функций процессора, нагрузочное тестирование системы ввода/вывода с миллионами вариантов функций набора микросхем, расширенное тестирование случайных команд для конвейера процессора. Это гарантирует совместимость и оптимальную производительность для широчайшего спектра операционных систем и приложений, сетевых устройств и аппаратных компонентов.
Между тем процесс тестирования и отладки современных микросхем постоянно усложняется — ведь растет функциональная насыщенность кристаллов, уменьшается размер транзисторов, увеличивается их число. Но следствием того же закона Мура является и рост вероятности появления багов (ошибок) в кристаллах! Именно по причине огромного количества интегрированных в микросхему транзисторов и их крошечного размера вопросы надежности и качества их работы выходят на первый план. Для их решения и упрощения отладки сложнейших кристаллов в опытном и серийном производстве ведущие производители полупроводниковой продукции разрабатывают и широко используют различные методы контроля, анализа и коррекции. В их основу положены самые современные научные достижения в области физики твердого тела, оптики и других дисциплин. А в последнее время широко стали применяться и нанотехнологии. В этой статье мы попробуем взглянуть на некоторые из таких методов (их полный обзор занял бы не одну толстую книжку). И помогут нам в этом визиты в святая святых корпораций Intel и AMD — их фабричные и исследовательские лаборатории.
Intel Silicon Debug
В структуре деятельности Intel есть такое понятие — Silicon Debug. Это отладка — обнаружение и устранение ошибок и неудачных мест в кремниевых кристаллах микросхем (для краткости далее мы будем использовать английский термин, а не его перевод). Методы Silicon Debug позволяют исправлять как блоки, так и отдельные транзисторы на поверхности кристалла. А учитывая наномасштабы элементов современных микросхем, такие действия превращаются в подлинное искусство, и их всё возрастающую важность на современном этапе развития полупроводниковой промышленности трудно переоценить. Существует даже глобальная инженерная организация — Corporate Quality Network или CQN, которая занимается разработкой и поставкой инновационных, патентованных продуктов для решения подобных вопросов.
Методы Silicon Debug должны, во-первых, давать возможность обнаруживать проблемы в кристаллах, работающих на высоких частотах, — причем неразрушающим способом и в микромасштабах, а во-вторых, по возможности устранять их. И делать все это надо быстро, экономя время разработки и отладки кристаллов, — например, проверить в работе скорректированный кристалл до создания новых, исправленных фотолитографических масок. Сейчас эти методы тесно интегрированы в производственный процесс.
Традиционные способы диагностики
В дрезденских лабораториях AMD нам показали, как испытываются некоторые важные параметры микропроцессоров последнего поколения (90-нм Athlon 64). Этим занимаются так называемые Quality Lab и Material Analysis Lab. Во-первых, очень широко применяется так называемый «разрушающий» анализ. Дело в том, что многие важные параметры производимых на фабриках микроструктур могут быть измерены только разрушающим способом. Для этого в готовых или полуготовых (при контроле на стадии производства) кристаллах делаются поперечные сечения или разрезы. А далее применяются широко известные в физике методы — оптическая микроскопия, сканирующая электронная микроскопия (SEM), просвечивающая электронная микроскопия высокого разрешения (TEM), рентгеновская дифракция (XRD), атомно-силовая микроскопия (AFM) и другие.
Анализ структур
Например, SEM является очень распространенным, оперативным и удобным методом контроля геометрических размеров создаваемых структур — транзисторов, металлических слоев и омических контактов между ними (а в современных 130-нм и 90-нм процессорах AMD — 9 слоев межсоединений и аж пять миллиардов контактов, и в их качестве и соответствии размеров проектным нормам надо быть уверенным). На современных технологических установках такой электронный микроскоп дополнен ионной пушкой. При помощи сфокусированного ионного луча (используются тяжелые ионы галлия) в нужном месте кристалла делается небольшой надрез и «вытравливается» неглубокая и аккуратная вертикальная канавка — чтобы под углом в электронный микроскоп было видно сечение верхних слоев микросхемы и можно было определить характерные размеры различных компонентов структуры. При помощи этой же аппаратуры можно определять и некоторые электронные свойства структур, а также контролировать количество дефектов на поверхности пластины.
Аналогичным образом (ионной пушкой) делаются сечения и для более тонкого метода визуального контроля — TEM. Этот метод чаще применяется для анализа сечений современных нанотранзисторов, поскольку некоторые их размеры настолько малы (например, в области затвора, см. фото выше), что разрешения SEM просто не хватает. Тут же можно сделать и элементный (химический) анализ атомарных слоев — например, измерить распределение азота в слое.
При помощи различных традиционных методов поверхностного анализа измеряется профиль легирования слоев кремния атомами примеси (B, P, As) — концентрацию легирующих примесей в процессе производства микросхем нужно уверенно контролировать, чтобы получить p-n-переходы с заданными свойствами. Для анализа дефектов в поверхностном слое монокристалла кремния служит SIMS (Secondary Ion Mass Spectrometer). Фотоэлектронный микроскоп измеряет концентрацию азота в диэлектрике затвора. Все эти установки используют ультравысокий вакуум. Атомно-силовой микроскоп определяет шероховатость (неровность) поверхностей и размер зерен осаждаемых в производстве материалов.
Электрические испытания
Помимо этого, в лабораториях по контролю качества делаются различные электрические тесты готовых структур. Например, тесты на электромиграцию и диэлектрический пробой.
Полные тесты электромиграции в омических контактах и межсоединениях необходимы для того, чтобы определить качество омических контактов в межсоединениях микропроцессора и оценить время жизни всей структуры. Напомним, что межсоединения в современных процессорах делают из меди, однако в местах омических контактов наносят тонкий проводящий подслой (обычно его состав является ноу-хау компании). На электромиграцию тестируются как новые технологии при их разработке, так и текущие — квалифицируются продукты перед их выпуском на рынок и образцы серийной продукции. Для вычисления времени жизни контактов поводятся тесты на повышенной температуре — при 350–360 градусах Цельсия. О времени жизни судят по степени омической деградации контактов в течение определенного времени (не принимая во внимание неомические нарушения) — при такой высокой температуре деградация контактов становится заметной уже через несколько дней или недель работы. Далее процесс экстраполируют на штатные рабочие температуры процессора (до 100 градусов). Если получается более 100 тысяч часов (около десяти лет), продукт считается годным, если нет — партию кристаллов бракуют. Тестировать кристаллы можно прямо на неразрезанных пластинах.
Диэлектрический пробой подзатворного диоксида кремния — бич современных транзисторов. Поскольку подзатворный диэлектрик сейчас предельно тонок (1,4 нм или шесть атомарных слоев в последних процессорах AMD; у Intel еще тоньше — 1,2 нм), то его изолирующие свойства со временем ухудшаются. Особенно под действием достаточно высокого напряжения (около 1,4 В у современных настольных микропроцессоров [Что соответствует гигантскому электрическому полю — около миллиона вольт на миллиметровый промежуток! Например, виниловая изоляция бытовых электропроводов рассчитана на поля примерно в тысячу раз меньше]) и повышенной температуры (нагрев процессора в работе). Физические механизмы зависящего от времени диэлектрического пробоя подзатворного диэлектрика весьма сложны и неоднозначны, поэтому тут используют комплексную эмпирику. Время жизни процессоров «по диэлектрику» определяют при помощи трех параметров экстраполяции — делаются стресс-тесты при повышенном напряжении (2,0–2,9 В), при повышенной температуре и на транзисторах большей площади. Полученные результаты экстраполируются на реальные размеры и условия работы транзисторов (например, температуру 90 градусов и напряжение 1,4 В) и по спецификациям допустимого тока утечки вычисляется среднее время жизни. По словам одного из сотрудников лаборатории AMD, для процессоров Opteron последнего поколения (90 нм) среднее время жизни оценивается (по этой характеристике) примерно в три года, но такое, казалось бы, малое время оправдывается требованиями нынешних пользователей — им, дескать, уже не нужны процессоры, живущие десять лет, поскольку апгрейд, как правило, требует их замены чаще.
Бесконтактная диагностика микросхем
Идеальным тестовым прибором для проверки кристаллов является тот, который бы мог измерять каждое напряжение, ток и температуру при определенных условиях. Методы контактных микрозондов здесь непригодны в силу очень многих причин (В первую очередь хотя бы потому, что такой зонд не сможет «приконтачиться» непосредственно к транзисторам на пластине — ведь они находятся под несколькими слоями металлизации и толстым слоем пассивирующего диэлектрика). Поэтому используются бесконтактные — оптоэлектронные и тепловые.
Современная оптическая диагностика кристаллов микросхем использует микрозонд с импульсным лазером ближнего инфракрасного диапазона (Laser Probe). Луч лазера проходит сквозь подложку кристалла микросхемы с обратной стороны (то есть там, где нет слоев металлизации) и фокусируется на слое стоков-истоков и каналов работающих в реальном масштабе времени транзисторов. Слабый отраженный оптический сигнал модулируется исследуемым транзистором в соответствии с изменениями зарядов и напряжений в его канале и, таким образом, содержит информацию о его динамической работе. Обработанные аппаратурой сигналы с оптического датчика представляют собой осциллограммы с пикосекундным разрешением, амплитуда которых пропорциональна напряжению на каждом из транзисторов (см. рисунок), что позволяет детально анализировать любой транзистор прямо во время реальной работы микропроцессора! Кстати, все это проводится в специальных прецизионных термостатах, где можно испытывать кристаллы на пониженных и повышенных температурах.
Сканирующий лазерный луч может дать контрастную (в градациях серого) карту транзисторов на выбранном участке микросхемы с неплохим разрешением. Поскольку сейчас для этого используется ближний ИК-диапазон с длиной волны в районе 1 мкм (в области оптической прозрачности кремния, иначе подложку насквозь не просветишь), то и разрешение этого метода — не лучше долей микрона (на виденных мной в лабораториях Intel «живых» картинках можно было различить детали размером около 0,15 мкм). Однако для целей отладки и обнаружения слабых мест этого вполне хватает, поскольку даже в самых современных микропроцессорах, производимых по 90-нм технологии, продольный (то есть от истока к стоку) размер транзистора (Так называемый pitch (шаг), определяемый как расстояние между серединами контактов стока и истока транзистора. Pitch фактически является минимальным шагом размещения транзисторов на кристалле. Тогда как реальная полная «длина» транзистора может быть и больше) составляет более 300 нм (А транзистор в данном анализе нужен только целиком, то есть различать области его затвора, стока и истока, имеющие, разумеется, меньше размеры, попросту не нужно). Более того, данная аппаратура применима и для будущих техпроцессов с нормами 65 и 45 нм, где размер транзистора (точнее, pitch) равен 220 и примерно 150 нм соответственно.
Другим современным бесконтактным методом анализа полупроводниковых структур является Time-Resolved Emission (спектроскопия с временны,м разрешением). Дело в том, что современные КМОП-структуры являются к тому же и активными оптоэлектронными приборами. Переключающиеся транзисторы излучают вспышки света, хотя этот свет и очень слаб — один инфракрасный фотон испускается примерно за 10 тысяч переключений транзисторов. Тем не менее, подсчет этих фотонов во времени делает возможным получение осциллограмм работы транзисторов, используя полностью пассивный («неагрессивный») режим (Напомним, что в предыдущем случае использовался облучающий лазер, который мог определенным паразитным образом воздействовать на объект исследования). Здесь также возможно достижение пикосекундного разрешения во времени и субмикронного в пространстве, причем для двумерных карт фрагментов микросхем (на экране можно видеть переключающиеся блоки и транзисторы, см. фото). Кроме того, снимаются и своеобразные электрокардиограммы (Электрокардиограммы — медицинское понятие, осциллограммы электрических импульсов животного организма во времени, снятые в разных его точках) сигналов time-resolved emission для отдельных транзисторов.
Третьим интересным современным диагностическим методом Silicon Debug является активное воздействие на приборы при помощи лазера (Laser-Assisted Device Alteration). Основная идея метода — лазер сканирует по поверхности кристалла работающей в режиме обычного (электронного) теста микросхемы, и когда луч попадает на элемент (транзистор), работающий в критическом режиме (с малым запасом надежности), тест дает сбой. Тем самым определяются наиболее «слабые» участки чипа, работа которых с наибольшей вероятностью приведет к сбою всей микросхемы. Этот тест можно разнообразить, меняя рабочие напряжения и частоты функционирования микросхемы во время лазерного сканирования.
Методы Laser Probe и Time-Resolved Emission широко применяются для обнаружения единичных отказов логики, сбоев из-за паразитных емкостных, индуктивных и резистивных перекрестных связей и из-за шума источника питания. Третий метод более эффективен при дефектах типа всплесков dI/dt, низковольтных колебаний и нестабильности питания (то есть там, где КМОП-ячейка недостаточно надежно фиксирует уровни логических 0 или 1). Разумеется, в дополнение к этим новейшим методам применяются и более традиционные, разрушающие способы диагностики структур — см. врезку.
Кремниевая нанохирургия
Для устранения обнаруженных дефектов на предварительном этапе отладки кристаллов в Intel широко используется так называемая кремниевая нанохирургия (nanosurgery). Дело в том, что на чипах микросхем предусматривается некоторое место (в различных областях по всей площади кристалла) для размещения «свободных», то есть незадействованных в основной схеме транзисторов. Точнее даже не транзисторов, а функциональных КМОП элементов — вентилей, линий задержки, триггеров и пр. Если, например, в процессе диагностики обнаружился дефект и моделирование на компьютере показывает, что этот дефект можно устранить, внедрив дополнительный элемент в схему (скажем, простейшую линию задержки, состоящую из двух логических инверторов), то далее для проверки этого предположения «в железе» применяется нанохирургия, которая позволяет «вставить» резервный элемент прямо в основную схему на кристалле, разрезав соединения, где это потребуется. Это подобно тому, как при лабораторной отладке радиоэлектронных схем (материнских плат, видеокарт и пр.) нужные радиоэлементы (транзисторы, резисторы и даже микросхемы) впаиваются в нужные участки — порой, «в навал» на уже готовую плату, если заранее места для них не предусмотрено. Но в кремниевой нанохирургии эти операции, разумеется, имеют многократно бо,льшую сложность и до недавнего времени были практически невозможны — для исправления каждого бага (или группы багов) приходилось изготавливать новую партию дорогостоящих фотомасок, выпускать пробную партию кристаллов (а это занимает несколько недель!) и повторять все это снова и снова, если проблемы оставались.
Итак, для проведения «нанохирургии» с обратной стороны кремниевого кристалла (в подложке) ступенчато вытравливаются углубления в форме квадратных обратных пирамид (см. рисунок). Для селективного травления используется сфокусированный ионный пучок и специальный газ-реагент. Точное место травления — прямо «под» нужным элементом — определяется оптическими методами, описанными выше, причем в процессе травления положение ямки постоянно уточняется и корректируется с тем, чтобы на финальной стадии небольшое (диаметром в единицы микрон и даже меньше) углубление попало точно в нужный металлический контакт (с обратной его стороны). После того как ямка «прорыта» до контакта со схемой, в нее «заливается» металл (например, вольфрам) — до образования надежного электрического контакта со схемой. После этого полученные металлические контакты к разным участкам схемы можно соединить между собой в нужной последовательности, осаждая (напыляя) перемычки с тыльной стороны кремниевой пластины (см. фото) — прямо как напайка дополнительных проводков на печатную плату.
Модифицированная таким способом электронная схема кристалла тщательно проверяется заново (включая оперативную бесконтактную диагностику), и если исправление дефектов первоначального проекта прошло успешно, разрабатываются новые фотошаблоны, учитывающие опробованные изменения. Если же процедура исправления не дала удовлетворительных результатов, «нанохирургическую» операцию можно повторять снова и снова (и занимает она, кстати, всего несколько часов) — до тех пор, пока не найдется надежный путь исправления дефекта. Таким образом, экономится уйма времени и средств, которые бы ушли на исправление, если действовать традиционными методами (через новые фотомаски и кристаллы). Более того, этим способом можно быстро исправлять целую последовательность проблем, каждая из которых может быть обнаружена только после исправления предыдущей. И экономия тут будет просто колоссальная!
Кстати, для проведения подобных процедур прямо на готовых, помещенных в корпус кристаллах очень удобна именно та упаковка, которая применяется микропроцессорной индустрией последние несколько лет — Flip-Chip (FC-BGA). В ней кристалл расположен подложкой кверху и все операции с обратной стороны чипа легко проводить даже при включенной в тестовый стенд микросхеме (а порой — тут же установить исправленный кристалл в материнскую плату и запустить Windows — это не шутка!).
Описанный способ широко применяется при устранении проблем трех уровней:
В частности, удается достаточно оперативно повысить рабочие частоты кристаллов (после чего выпускается, например, новый степпинг процессора по новым фотошаблонам), снизить потребляемую мощность, увеличить выход годных кристаллов с заданными параметрами. Например, для анализа и устранения проблем энергопотребления применяется так называемый инфракрасный микроскоп IREM (InfraRed Emission Microscope), который позволяет наблюдать участки повышенного нагрева кристалла в работе (вплоть до отдельных транзисторов или логических блоков).
Полученные термомикрограммы используются для поиска мест повышенных утечек в кристалле, наиболее разогревающихся элементов при высокой частоте работы, и для выработки нужных решений по улучшению кристаллов.
Основные игроки полупроводниковой индустрии
Лидеры полупроводниковой индустрии по итогам 2003 года, по данным аналитической компании iSuppli (см. www.isuppli.com/news/index.asp?p=details&nid=2426), показаны в таблице. В первой двадцатке (а она обеспечивает две трети всей мировой продукции!) сейчас восемь японских компаний, семь американских, три европейских и две южно-корейских, а первая десятка остается неизменной уже в течение трех лет. Вне конкуренции — корпорация Intel, удерживающая уже 15% рынка и растущая вверх теми же темпами, что и индустрия в целом (то есть Intel является хорошим индикатором состояния дел в среднем в полупроводниковой промышленности). Новый игрок — Renesas Technology — является результатом слияния LSI-подразделений компаний Hitachi и Mitsubishi (10-е и 11-е место по итогам 2002 года). Этим, в частности, объясняется то, что почти все компании первой десятки «сползли» вниз на одну позицию. Кстати, самый быстрый рост — у AMD, почти 50% в год — обусловлен, скорее, устранением временных неудач, преследовавших корпорацию в 2002 году. Впрочем, по итогам 2004 года от AMD можно ожидать новых сюрпризов — не в последнюю очередь благодаря быстрорастущей Spansion (флэш-память). Среди аутсайдеров — IBM и Fujitsu с внушительным падением годовых продаж.