Проблема 7200.11, или Охота на муху ЦЦ
АрхивПлатформаСомнения в надежности дисков серии Barracuda 7200.11 у профессиональных ремонтников появились еще летом-осенью прошлого года, когда накопилась статистика по необычно высокому проценту отказов ряда моделей.
У моего друга Коли случилась беда. В один прекрасный день домашний компьютер отказался загружаться, упирая на полное отсутствие подходящего для этого дела жесткого диска. Коля сначала затосковал, вспомнив, когда в последний раз делал бэкап, а потом, как ему показалось, нашел изящное решение. Он купил в магазине точно такую же модель, снял с нее плату контроллера и переставил на покойника, в надежде на то, что с новыми мозгами тело заживет лучше прежнего. Не помогло. А через неделю умер второй, свежеприобретенный жесткий диск...
Коля, как потом выяснилось, прошел типичный путь жертвы бракованных дисков Seagate. После того как он залез на первый попавшийся компьютерный форум, то обнаружил длиннющую ветку с жалобами таких же страдальцев. Самые продвинутые из них тоже купили по второму винчестеру1. Парадоксально, но серьезная проблема, всплывшая чуть ли не полгода назад и касающаяся, наверное, самого важного компьютерного узла, известна в основном специалистам и тем, кто уже успел наступить на грабли.
Сомнения в надежности дисков серии Barracuda 7200.11 у профессиональных ремонтников появились еще летом-осенью прошлого года, когда накопилась статистика по необычно высокому проценту отказов ряда моделей. К Новому году проблема достигла апогея, и в середине января Seagate была вынуждена признать наличие брака. Но то, как она это сделала, отнюдь не делает чести крупнейшему производителю жестких дисков. Информация выдавалась в месяц по чайной ложке, зачастую новые данные опровергали старые, и до сих пор в этой истории больше темных пятен, чем твердо установленных фактов. И главная загадка - сколько бракованных винчестеров было выпущено и какова статистика их отказов. По независимым оценкам, речь идет о миллионах штук и 30–40-процентной вероятности отказа2.
Как утверждают в Seagate, болезни подвержены модели трех семейств: Barracuda 7200.11, Barracuda ES.2 SATA и DiamondMax 22. Напасть дает знать о себе тремя способами. Неисправный диск может определяться в BIOS с нулевым размером. В этом случае виноват транслятор - модуль внутренней программы, отвечающей за соответствие физических секторов диска логическим адресам. Иногда BIOS вовсе перестает видеть устройство: в результате программного сбоя блокируется работа диска по интерфейсу, что соответствует ошибке с кодом, начинающимся с LED:000000CC (к умершему винчестеру можно подключиться через технологический порт и провести диагностику). Из-за этой комбинации символов ошибку в народе прозвали "мухой ЦЦ". Наконец, особым талантом наделены некоторые диски емкостью 1,5 Тбайт, которые могут зависать на десятки секунд.
Seagate утверждает, что неприятности носят чисто программный характер; сбой возникает, как правило, при отключении и включении заново питания и никак не портит данные на диске3. Компания рекомендует владельцам проблемных накопителей сменить прошивку и дальше жить спокойно. Только вот здесь есть несколько весьма существенных "но".
Первое - чтобы сменить прошивку, нужно для начала узнать о необходимости этого шага. Меж тем Seagate отнюдь не старается донести эту информацию до максимально широкого круга людей. Более того, уже после официального признания бага, дефектные диски, как ни в чем не бывало, продолжали продаваться, то есть об отзыве партий не было и речи4.
Второе "но" - чтобы сменить прошивку, нужно сперва определить, попадает ли ваш диск в группу риска, и скачать нужный файл. Здесь все непросто. Прошивки для некоторых винчестеров Seagate разместила на собственном сайте 16 января, а владельцев остальных моделей просила писать в техподдержку и ждать ответа со ссылкой на нужный файл. По-видимому, техподдержка получила очень много писем, так как многие жалобщики дожидались ответа неделями, а кто-то и вовсе его не дождался. Утилиты для идентификации дисков, выложенные на сайте компании, похоже, слегка "путаются в показаниях". Если верить нашему собственному опыту и отзывам на форумах, сервис работает странно, выдавая разные результаты для одних и тех же серийных номеров; кроме того, в категорию "безрисковых" иногда попадают те диски, которые уже вышли из строя с описанными выше симптомами5.
Третье "но" - некоторые из умников, поторопившихся перепрошить винчестеры в соответствии с рекомендациями Seagate, получили (сразу или чуть погодя) те же самые мертвые "кирпичи". Достоверных данных об ошибках в уже исправленных версиях прошивок нет, но судя по тому, что файлы несколько раз втихаря заменялись более свежими вариантами, без багов и здесь не обошлось. Кроме того, не всем страдальцам удалось корректно завершить перепрошивку - банальный скачок напряжения в электросети, мигнувшие лампочки - и получаем на выходе тот же самый дохлый диск.
Ну и наконец, "но" номер четыре. Те диски, которые BIOS уже не видит, просто так не перепрошьешь, необходимо специальное оборудование6. В домашних условиях "муху ЦЦ" можно вывести с помощью специального адаптера, соединяющего технологический порт диска с COM-портом (или выступающим в его роли USB). Электрическую схему адаптера, исходником для которого может быть кабель для подключения к компьютеру мобильного телефона, в Сети найти нетрудно, причем в нескольких вариантах. Нетрудно найти и последовательность действий по вводу терминальных команд (тоже есть из чего выбрать), которые нужны для коррекции работы внутренней программы диска. Вот только напортачить здесь проще простого, так как подобные операции не предусматривают отмены совершенных действий или сообщений об их фатальной опасности. Еще одной изюминкой процедуры является необходимость воспользоваться пластиковой карточкой, чтобы в нужный момент изолировать определенные контакты на плате микроконтроллера диска.
Учитывая все эти сложности, конечно, разумнее поручить ответственную процедуру профессионалам. И Seagate, по слухам, вроде бы пообещала бесплатно восстановить данные с проблемных дисков. Прикинувшись обычными пострадавшими, мы послали в Seagate письмо с просьбой восстановить данные, но получили вежливый отказ. На деле компания-производитель готова лишь выполнить свои гарантийные обязательства, отремонтировав диск или заменив его. Ремонт собственно сводится к замене прошивки, что по идее должно обернуться получением доступа к данным, но не более того. Восстановление информации в гарантию не входит. Эта процедура - неплохой дополнительный бизнес для Seagate, а вернее, её дочернего предприятия i365. Справедливости ради заметим, что если хорошо попросить, то i365 высылает стикеры предоплаченного почтового заказа через UPS, то есть платить за пересылку винчестера клиенту не придется7.
Публикация, построенная на сообщениях с форумов и опыте друга Коли, не самый лучший вариант, но комментариев по существу от самой Seagate или её дистрибьюторов в России редакция так и не дождалась. При попытке разобраться с бедой, которая обрушилась на компанию и покупателей её дисков, мы обращались к специалистам, ремонтирующим диски по долгу службы, но большого энтузиазма не было и в их ответах. Возможно, дело в том, что раскрытие деталей недолгого и недорогого для ремонтника процесса восстановления диска ударит по кошельку этих самых специалистов. Какая-то своя логика в молчании производителя, видимо, тоже есть: говорить всю правду не хочется, а диски продавать надо. Катавасия с комментариями и послужила причиной того, что материал по данной теме вы читаете только сейчас, а не месяцем раньше. Впрочем, уповать на официальную информацию тоже не всегда правильно. Например, если безоговорочно верить январским сообщениям Seagate, то описанной болезни подвержены только диски, выпущенные в декабре прошлого года. Однако в этом случае нужно считать ложью десятки летних и осенних сообщений на тех же форумах. В заключение еще один факт: в начале года Seagate скостила гарантийный срок на многие свои винчестеры с пяти лет до трех. Мы опять-таки можем только догадываться, что за этим кроется: антикризисная мера или безудержно расплодившаяся "муха ЦЦ".
Глас ремонтника: Готовьтесь к тому, что рано или поздно диск умрет
Проблемы разрушения микрокода в разное время были у многих изготовителей HDD. Микрокод - это операционная система жесткого диска. Она состоит из расположенных в служебной зоне модулей, часть которых постоянно меняется (например, ведется большое количество внутренних журналов событий). Достаточно возникнуть аппаратной проблеме - вроде ухудшения параметров канала записи, дефектов в служебной зоне, - и из-за некорректной записи происходит разрушение модулей.
Однако у 11-х "Барракуд" главный недостаток - некачественные материалы. Изза этого некоторые накопители уже через несколько месяцев начинают работать неустойчиво. До всплывшей проблемы с микрокодом у дисков тех же серий были баги, не связанные с разрушением внутренней программы, - заклинившие валы, подвисания на 2–5 секунд, долгий выход в готовность при включении, заваленные атрибуты 1 и 195 в SMART, характеризующие работу системы коррекции ошибок HDD.
То, что у рассматриваемых дисков "слетает" микрокод, - тоже следствие нештатных аппаратных ситуаций. Сам же микрокод не должен разрушаться от "реактивности" системы мониторинга. У грамотно спроектированных винчестеров (к которым относились все модели Seagate до появления 11-й серии) он вообще не должен разрушаться.
Про новые (вышедшие относительно недавно) диски 7200.11 пока сказать ничего не могу: мало статистики. У москвичей, насколько я знаю, еще летом 2008-го были проблемы, но тогда никто не умел их решать. Мне заказали написать программу для оживления в октябре, когда умирающие диски пошли косяком (Сергей живет в Минске. - А.Б.). При этом устройств, изготовленных до декабря 2008 года, в моих руках побывало уже предостаточно. До того как решение проблемы стало широко известным, за недолгую и несложную операцию восстановления данных с таких дисков некоторые фирмы просили тысячу долларов.
Отдельная тема - 11-е "Барракуды" с bad-блоками. Если у диска вышел из строя транслятор, но устройство дает готовность по интерфейсу - там всегда есть bad-блоки. Однако если восстановить транслятор "шнурками" и командами по одной из доступных в Сети процедур, то обычному пользователю это ничего не даст. Bad-блоки там специфичные: если начать копирование информации в обычной операционной системе, после первого же дефекта диск впадает в ступор и отключается. Копировать нужно специальным копировщиком непосредственно через порты. Ну и конечно, надо знать, как при этом обращаться с командами. Обычный пользователь, если начинает оживлять свой винчестер, вскоре получает гораздо больше bad-блоков, чем было, а иногда накопитель вовсе ломается из-за запиливания поверхностей и выхода из строя головок. Таким образом, отключение транслятора - это своеобразная защита диска от потери данных.
Вообще, по моему личному мнению, большинство проблемных дисков не отработают трехлетней гарантии даже после устранения ошибок в микропрограмме. Небольшая часть, возможно, выживет. Есть же накопители, которые должны были давно выйти из строя, но, вопреки всему, уже пятнадцать лет работают. Например, известные своей ненадежностью WDC AC22000.
Владельцам дисков могу посоветовать следующее. Если ваш винчестер вышел из строя, несите его к специалисту: не усугубляйте проблему. Если диск лишь потенциально неисправен, с осторожностью пользуйтесь им до тех пор, пока он не сломается. Это дисциплинирует. Винчестер не предназначен для хранения действительно ценной информации. HDD - это постоянно включенное устройство с изнашивающимися подвижными частями. Что уж говорить о моделях, выпущенных в период экономии ресурсов. Все результаты деятельности на ПК опасно хранить на винчестере того же ПК. Нужно дублировать данные на нескольких компьютерах или сохранять их на сменных носителях. Отслеживайте состояние винчестера программами для контроля атрибутов SMART. Если есть ухудшения- чаще делайте бэкап. И морально готовьтесь к тому, что диск рано или поздно умрет. Помните, что ни один производитель устройств для хранения данных не гарантирует сохранности информации.
Сергей Казанский,
специалист по восстановлению информации, техцентр "Виктория"
Из еженедельника "Компьютерра" № 14 (778)
1. Специалисты по восстановлению данных утверждают, что практически на всех современных накопителях переставлять контроллер бесполезно, и более того, после этой процедуры можно получить уже два неработоспособных устройства. [назад]
2. Причем пострадали покупатели отнюдь не только самих винчестеров, но и разнообразной электронной техники, от серверов до Bluray-плееров. [назад]
3. Seagate.custkb.com/seagate/crm/selfservice/search.jsp?DocId=207931. [назад]
4. Таковы гримасы логистики: партия, отгруженная с завода в Юго-Восточной Азии, попадает на наши прилавки в среднем через три месяца. [назад]
5. Предположительно, в таком безобразии виновато вольное обращение с прошивками на отдельных заводах. [назад]
6. Конечно, если на умершем диске ценной информации нет, то проще всего сдать его по гарантии по обычным каналам. На территории России, если опираться на информацию официального сайта Seagate, диски нужно возвращать туда, где они были куплены. [назад]
7. В России центров по восстановлению данных i365 нет, посылку нужно отправлять в Европу. Сами мы не прошли весь путь до конца, однако связались с человеком, который обратился непосредственно в Seagate. На его письмо с просьбой восстановить диск Seagate не ответила, но после звонка в службу поддержки владелец диска получил ссылку на предоплаченный почтовый заказ в UPS. Отправленный в ремонт диск был получен в исправном состоянии через десять дней. [назад]