Архивы: по дате | по разделам | по авторам

Наследники DяTLA: убили, а потом воскресили (разборка одного полета)

АрхивНакопители
автор : Алекс Карабуто   29.06.2002

Рассказ об успешной попытке восстановить очередной «полетевший» винчестер IBM. Анализ возможных причин «полетов» современных IDE-дисков IBM.

Бедному Йорику посвящается…

Началась эта история с того, что у меня скоропостижно скончался бедный Йорик. Точнее - Эрик. Еще точнее - винчестер IBM Deskstar 60GXP или Ericson. Я не стал падать духом - совершил колдовской ритуал и оживил бедный трупик. «Зомби тоже… могут играть в баскетбол». Но обо всем по порядку.

В течение многих лет IDE-винчестеры IBM вполне заслуженно считались лучшими среди аналогов. Однако за последние 2 года, точнее - после выпуска Голубым Гигантом дисков на стеклянных пластинах, репутация IBM в этой области слегка пошатнулась. Нет, IBM по-прежнему делает самые быстрые IDE-диски (исключение - недавние модели от WD с буфером 8Мбайт), однако к надежности этих «стеклянных» накопителей накопилось уже немало претензий. То тут, то там слышны разочарованные и обреченные возгласы владельцев дисков IBM Deskstar, скорбящих о безвременно почивших винтах и потерянных данных. Подобными сообщениями пестрят и всевозможные сетевые конференции (см. хотя бы эту ветку в нашей). И хотя крупные российские продавцы компьютеров и комплектующих (да и сама IBM) не подтверждают наличия проблемы с надежностью и массовых отказов современных дисков IBM (судя по неофициальной статистике, полученной мной в ряде московских фирм, сейчас диски IBM возвращают в среднем не чаще дисков других производителей), проблема все же существует и требует определенного внимания.

Год назад мы уже обращались к теме надежности «стеклянных» дисков IBM: тогда шла волна разговоров о частых отказах так называемого DяTLA, то есть дисков IBM DTLA серий Deskstar 75GXP. Тогда мы попытались разобраться в проблеме и предложить несколько возможных вариантов ее решения (см. статью «Убили DяTLA. Сухо замочили»). Ясной причины спонтанных отказов таких дисков так не было найдено (по крайней мере, о них не стали сообщать широкой общественности J), но с появлением новой серии «стеклянных» винчестеров IBM Deskstar 60GXP (IC35L0x0AVER07 или Ericson) отказов вроде бы стало меньше, и разговоры слегка поутихли.

Тем не менее, сообщения о «полетевших» ни с того, ни с сего дисках IBM 60GXP в последнее время мне стали попадаться все чаще. А совсем недавно сия участь настигла и меня: без видимых причин в моих руках (точнее - компьютере) умер проработавший всего пол года бедный Йорик (то есть диск IBM Deskstar 60GXP). Причем почти одновременно с этим один мой близкий приятель посетовал на вдруг сдохший (за год не очень активной работы) IBM Deskstar 75GXP («дятел»). Поскольку за много лет активной возни с компьютерами и испытаний винчестеров в лаборатории «Компьютерры» этот диск оказался первым (ну может вторым J), кто умер не по моей вине (да еще так быстро и без видимых причин, кстати «дятлы» у меня лично не дохли ни разу), мне стало обидно (да и диск был мой личный), и захотелось разобраться в причине и по возможности устранить ее. Честно говоря, нести диск в гарантийный ремонт мне не захотелось. Во-первых, лень было тащиться через пол Москвы и пререкаться с «недружелюбным» персоналом сервис-центра. А во-вторых, нельзя было терять накопленные (и не продублированные) гигабайты данных. Итак, было решено самостоятельно восстановить потерянные данные и по возможности - сам винчестер.

И мои усилия не пропали даром! Поработав несколько дней программами IBM Drive Fitness Test v3.0 и SpinRite 5.0 (под DOS с загрузочной дискеты) и послушав душераздирающий скрежет диска, сопровождавший процесс лечения «битых» участков поверхности, удалось восстановить доступ к логическим разделам диска и несколько «потрепанной» информации. В основном, «битой» оказалась загрузочная область диска, так что логические разделы просто исчезли из видимости, а при обращении к диску начинались бесконечные звуки типа «хрю-хрю-хрю-хрю…пауза…хрю-хрю-хрю-хрю…пауза…» (образчик звука я, к сожалению, не записал J). Мою «бесценную» информацию спасло то, что я традиционно использую отдельные логические разделы диска для операционных систем и никогда не храню на этих разделах свои данные (первые два раздела используются только для файлов самих ОС и некоторых наиболее часто запускаемых программ, а данные расположены на последующих разделах). Благодаря такой «предусмотрительности» мои данные почти не пострадали (на одном из разделов файлы потеряли только длинные имена), тогда как файлы на разделах с операционными системами по большей части было невозможно восстановить. Впрочем, это частности и далеко не главное в моем рассказе.

Итак, нужную информацию удалось спасти (переписав на другой носитель), и теперь предстояло выяснить, можно ли полностью реанимировать бедного Йорика (винчестер), чтобы использовать его в дальнейшем. Курс «программного» лечения (см. выше) подействовал хорошо: «хрюканья» при обращении к диску прошли (очевидно, диск исключил из работы плохие сектора - в загрузочной области и чуть дальше, - заменив их хорошими из резервной области), и стало возможным снова разбить диск на разделы и отформатировать. Причем, после «лечения» пациент почувствовал себя совершенно здоровым: совсем не пострадала «гладкость» графиков линейной скорости чтения и записи, и при форматировании разделов (я специально проводил его под DOS, поскольку при этом происходит одновременная проверка целостности поверхности) плохих блоков обнаружено не было, как, впрочем, и при последующей тщательной проверке разделов программами Norton Disk Doctor и SpinRite. На радостях я уже было «залил» (с предусмотрительно сохраненных «образов») операционные системы и приготовился к перекачке своих данных, как… тут началось самое интересное!

Слегка потревожив IDE-шлейф, ведущий к диску (переместив диск внутри корпуса), я столкнулся с тем, что диск опять перестал читаться (при включении компа возникали те самые «хрю-хрю-хрю-хрю…пауза…хрю-хрю-хрю-хрю…пауза…»). Еще раз (теперь уже намеренно) потеребив шлейф около диска, я добился того, что работоспособность диска восстановилась. Однако впоследствии ситуация несколько раз повторялась (то шлейф случайно заденешь, то еще что-нибудь) и каждый раз лечилась «тереблением шлейфа». Сначала я грешил на контакты этого шлейфа и питания, но, перепроверив все, что только возможно, убедился, что дело не в нем, а в самОй достаточно «нежной» конструкции дисков IBM.

Диск IBM IC35L0x0AVER07 с обратной стороны без платы контроллера.

Оказывается, плата контроллера диска, крепящаяся к его корпусу четырьмя винтами (отмечены указателями на фото выше), не обеспечивает достаточной жесткости конструкции: при вставлении и вынимании разъемов IDE и питания плата с разъемами на конце ощутимо изгибается, и порой даже возникает опасение, что разъемы могут «отломиться» от платы при неосторожном движении (поскольку сами разъемы требуют усилия для подключения и отключения). Более того, даже простые перемещения проводов от подключенных к такому диску шлейфов уже вызывают небольшие изгибы платы контроллера, в чем я и убедился «тереблением». Всё бы ничего, да как назло неподалеку от этих внешних разъемов расположен еще один - внутренний (он обведен овалом на фото выше), - соединяющий плату контроллера с внутренностями самого винчестера. Это самый важный и самый критичный (к электрическим параметрам) разъем диска, поскольку именно по нему передаются как сигналы управления прецизионным двигателем кронштейна с головками, так и высокочастотные сигналы от самих головок при чтении (через микропредусилители, расположенные все-таки внутри корпуса диска) и на головки при записи. Для наглядности напомню, что у нынешних дисков точность позиционирования головок вдоль радиуса пластины (то есть по дорожкам) должна быть лучше 0,2 микрон (или менее 0,0005% от хода перемещения, что соответствует примерно 18 двоичным разрядам преобразователя перемещения и соответствующего управляющего электрического сигнала), а частота сигнала с головок при чтении доходит до 600 МГц. (Шпиндельный мотор, вращающий сами пластины, питается от отдельного небольшого разъема - вверху по центру на этом фото).

Игольчатый разъем на обратной стороне диска (острые контакты).

Так вот, этот «критичный» внутренний разъем выполнен в виде небольших твердых металлических иголочек (они жестко закреплены в корпусе диска), впивающихся в мягкие оловянные площадки на обратной стороне платы контроллера (обведены прямоугольником на фото платы ниже). С одной стороны такая конструкция разъема дешева и обеспечивает неплохие высокочастотные характеристики, но с другой - сильно подвержена влиянию механических и тепловых деформаций, то есть не очень надежна.

Плата контроллера диска IBM IC35L0x0AVER07 с обратной стороны.

В самом деле, соединение контактов неупругое (иголки жестко закреплены в корпусе, а плата не подпружинена к иголкам), иголки, впившись в мягкое и неупругое олово (сложный сплав с серебром, конечно), образуют в нем небольшие ямки, которые могут увеличиваться со временем, ухудшая свойства электрического контакта (и даже просто подокисляясь). Механические деформации платы в месте этого разъема также могут привести и ухудшению или даже потере контакта (образуются микрозазоры). И поскольку эти контакты расположены в нынешних дисках IBM вблизи «шатких» внешних разъемов, а плата недостаточно жестко закреплена на краях, то даже небольшие изгибы платы при подключении и вынимании внешних разъемов могут привести к увеличению лунок и/или к микроизгибу платы в месте внутреннего разъема в сторону от иголок. То есть к частичному нарушению электроконтактов внутреннего разъема, что я и наблюдал на практике «тереблением» разъемов и шлейфов IDE и питания.

Игольчатый разъем с обратной стороны платы контроллера (оловянные площадки).

Более того, даже при полном отсутствии внешних механических изгибов платы, нарушение контактов внутреннего разъема может происходить из-за тепловых деформаций. Так, в процессе работы закрепленный в корпусе винчестер нагревается примерно до 40-50 градусов (а собирается-то и хранится он градусах при 20-25), что, учитывая разные тепловые коэффициенты расширения металлического корпуса диска и текстолита платы контроллера, уже может привести к микродеформациям в месте разъема. Более того, плата контроллера устроена таким образом, что в непосредственной близости от внутреннего разъема расположена микросхема управления перемещением кронштейна с головками (она обведена квадратом на фото ниже; овалом обведено место разъема с обратной стороны). Во время работы винчестера при активном поиске (перемещении головок или «стрёкоте») эта микросхема сильно разогревается: по моим измерениям - градусов до 60-80 в зависимости от активности и длительности непрерывного поиска (на ее нагрев для дисков IBM DTLA мы уже обращали ваше внимание год назад). То есть вблизи «нежного» разъема возникает сильный градиент температур, который также может привести к микродеформациям и нарушению контактов, причем циклические термодеформации в процессе многомесячной работы диска могут дополнительно увеличить ямки в олове контактов и/или деформировать плату со временем («поджарить»).

Плата контроллера диска: как мы ее видим, не разбирая диск.

Таким образом, в результате всех этих воздействий недостаточно жестко закрепленная и циклически перегреваемая плата контроллера может послужить причиной нарушения контактов во внутреннем разъеме, а это может повлечь за собой как обратимые (порча информации на диске), так и необратимые (появление плохих блоков) сбои функционирования диска (даже несмотря на то, что современные пластины и головки покрываются ультратонкими твердыми и гладкими защитными слоями - например, алмазоподобными пленками - и оснащаются средствами для устранения «шлепков» головки по поверхности). Разумеется, в первую очередь при такой неисправности будет страдать именно загрузочная область диска. Скажем, в один прекрасный день ваш диск просто перестанет работать (читаться) - например, при включении питания. Действительно, если мне многократно удавалось восстановить работу диска «тереблением» разъема (точнее - платы диска), то в один прекрасный день это не сработало, и диск ни при каких условиях не захотел читаться.

После того, как мой диск (Йорик) во второй раз «полетел» (совсем перестал читаться и постоянно «хрюкал»), я решил его разобрать и докопаться до первопричины отказов. Каковую вам уже и описал в нескольких предыдущих абзацах. Дальнейшее восстановление работоспособности диска было делом техники. Сняв плату контроллера, я обнаружил с обратной стороны достаточно здоровые ямки в оловянных площадках внутреннего разъема (просмотр иголок показал их полную целостность). Поскольку олово мягкое, твердым гладким предметом можно аккуратно заполировать эти ямки до получения гладкой поверхности площадок (ну или аккуратно пройтись специальным паяльным феном, если таковой вдруг оказался у вас в хозяйстве). При этом усердствовать (и тем более применять шкурку-нулёвку) не нужно, чтобы не «сточить» оловянные бугорки, иначе иголки потом не достанут до площадок. Самостоятельно напаивать бугорки на этих площадках тоже не стоит - они получатся разновысокими и часть иголок может не достать до площадок (хотя если вы суперас по пайке, может и получиться - с последующей подгонкой полировкой). Мне на первый раз хватило просто «заполировать» площадки и аккуратно (чтобы случайно не переприжать место контакта) привинтить плату контроллера на место, предварительно промыв ее спиртом. После этого я уже предельно нежно и аккуратно (насколько это возможно с тугими разъемами) старался подключать и отключать IDE-шлейф и питание диска.

Аттрибуты S.M.A.R.T. для дважды «вылеченного» диска IBM 60GXP по программам Drive Temperature 1.00 (наверху) и S.M.A.R.T. Vision 2.02 (внизу).

Повторив «программную» процедуру проверки/излечения загрузочной области (и остальной поверхности), работоспособность диска удалось полностью восстановить (без потерь блоков, как и выше, в первый раз). Измерение графиков и поверка на плохие блоки никаких подозрений не вызвали. Даже просмотр аттрибутов S.M.A.R.T. для диска различными программами (см. скриншоты выше) показали отличное состояние диска, а количество заремаппеных секторов (то есть замещенных исправными, параметр №5 в этих списках) было по-прежнему очень мало (по понятным причинам я не знаю их точное значение до аварии). И данную статью я сейчас пишу именно на этом диске, который исправно работает уже почти две недели (сплюнем три раза на левого соседа).

Медный радиатор на сильно греющемся чипе платы контроллера диска.

Для повышения надежности работы диска я также уменьшил вероятность термодеформаций внутреннего разъема, приклеив (термоклеем АлСил-5) на сильно греющуюся при поиске микросхему небольшой медный радиатор (см. фото выше; приклеивая радиатор, не нажимайте на плату сильно, чтобы не «прожать» мягкие оловянные контакты внутреннего разъема). При установке такого диска в корпус компьютера желательно обеспечить воздушный зазор и хороший обдув диска снизу (со стороны контроллера). Ну и будьте предельно аккуратны, подключая внешние разъемы: плата у дисков IBM весьма гибкая. Напоследок, желая вам удачи в подобных экспериментах и долгих лет жизни вашим дискам IBM, замечу, что за все возможные последствия подобных переделок (включая потерю гарантии) вы несете ответственность сами. Если не сможете восстановить свой «голубой» винчестер, нас не вините. J

P.S. Мне остается надеяться, что инженеры нового предприятия, объединившего в себе соответствующие подразделения IBM и Hitachi, обратят внимание на описанный здесь недостаток конструкции настольных IDE-дисков IBM и примут меры к его устранению в будущих моделях. Кстати, диски других производителей значительно меньше подвержены подобной проблеме, поскольку там «игольчатые» разъемы распложены более удачно и плата крепится жестче.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.