Почему мои жесткие диски перестали работать?

У меня есть маленький сервер Ubuntu, работающий дома с 2 жесткими дисками. Существует два набега программного обеспечения (raid1) на дисках, управляемых mdadm, которому я верю, не важно, но упоминание его так или иначе.

Оба из жестких дисков являются Western Digital и использовались в течение приблизительно 2 лет, когда один из них начал издавать шум нажатия и умер. Я полагал, что, возможно, это естественно после 2 лет, таким образом, я купил новый и повторно синхронизировал массивы RAID. Приблизительно после месяца также перестал работать другой диск.

Я не стал подозрительным, так как оба диска были куплены одновременно, не случается так, что удивление для наблюдения их обоих друг около друга, таким образом, я купил другой.

До сих пор 2 старых диска перестали работать, и 2 совершенно новых в системе. После одного месяца перестал работать один из новых дисков. Это - когда это начало становиться подозрительным. Так как ПК был соединен от некоторых действительно старых частей (думайте Athlon XP), я полагал, что, возможно, контроллер SATA материнской платы является преступником. Конечно, Вы не можете переключить части легко в старый ПК как это, таким образом, я купил целую систему, нового МБ, новый ЦП, новую RAM. Забрал справедливый сбойный диск, так как он находился под гарантией и заменил его.

Таким образом, это - до 2 сбойных дисков от старых и 1 сбойный диск от новых. Никакие проблемы, в течение 1 месяца. После этого ошибки накапливались снова в/var/log/messages, и mdadm сообщал об отказах массива RAID. Я начал отрывать волосы. Все является новым в системе, это до третьего совершенно нового жесткого диска, просто не возможно, что все новые диски, которые я купил, были неисправны.

Давайте посмотрим то, что все еще распространено... кабели. Хорошо, съемка общим планом, давайте заменим кабели SATA. Заберите жесткий диск, улыбнитесь парню в счетчике и скажите, что я действительно неудачен. Он заменяет жесткий диск. Я прихожу домой, передачи месяца и один из сбоев жестких дисков, снова. Я не шучу.

Два из совершенно новых жестких дисков перестали работать. Возможно, это - ошибка в ОС. Давайте посмотрим то, что говорит инструмент тестирования производителя. Загрузите инструмент тестирования, запишите его к CD, перезагрузке, оставьте жесткий диск, тестирующий в течение ночи. Test говорит, что диск неисправен, и я должен создать резервную копию всего, если я все еще могу. Я не знаю то, что происходит, но это не похоже на программную проблему, что-то определенно перегружает жесткие диски.

Я должен упомянуть теперь, что целая система находится в обувной коробке. С тех пор существует загрузка "сборки Ваш собственный материал" случая ИКЕА, я думал, что не должно быть никаких проблем, бросающих вещь в поле и наполняющих ее далеко где-нибудь. Поле хорошо вентилируется, но я думал, что просто, возможно, диски перегревались. Нет никакого другого возможного ответа на это. Таким образом, я забрал жесткий диск, и получил замененный (в 3-й раз) и купил вентиляторы жесткого диска.

И сейчас, я услышал звук гибели. нажмите щелчок whizzzzzzzzz. SSH в поле:

You have new mail!
mail
r 1
DegradedArrayEvent on /dev/md0 ...

dmesg производят:

[47128.000051] ata3: lost interrupt (Status 0x50)
[47128.000097] end_request: I/O error, dev sda, sector 58588863
[47128.000134] md: super_written gets error=-5, uptodate=0
[48043.976054] ata3: lost interrupt (Status 0x50)
[48043.976086] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[48043.976132] ata3.00: cmd c8/00:18:bf:40:52/00:00:00:00:00/e1 tag 0 dma 12288 in
[48043.976135] res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
[48043.976208] ata3.00: status: { DRDY }
[48043.976241] ata3: soft resetting link
[48044.148446] ata3.00: configured for UDMA/133
[48044.148457] ata3.00: device reported invalid CHS sector 0
[48044.148477] ata3: EH complete

Резюме:

  1. Никакая возможность перегрева
  2. 6 дисков перестали работать, 4 из тех были совершенно новыми. Я не уверен теперь, когда исходные два были дефектными, или перенесли то же самое что новые.
  3. Нет ничего общего в системе кроме ОС, которая является Ubuntu, Кармической теперь (запустился с Бойкого). Новый МБ, новый ЦП, новая RAM, новые кабели SATA.
  4. Нет, небольшие дыры на жестком диске не покрыты

Я кричу.В самом деле. Я не имею наглость возвращаться в хранилище теперь, это не возможно для 4 дисков привести менее чем 4 месяца к сбою.

Несколько идей, что я думал: действительно ли возможно, что я порчу что-то, когда я делю и повторно синхронизирую диски? Это может быть настолько плохо, что это физически разрушает диск? (так как поставщик предоставил инструмент, говорит, что диск поврежден), я делаю разделение с fdisk и использую тот же размер блока для raid1 разделов (я проверяю точные размеры блока с fdisk - лютеций),

Действительно ли возможно, что ядро Linux или mdadm, или что-то не совместимо с этим точным брендом жестких дисков и перегружает их?

Действительно ли возможно, что это может быть обувная коробка? Попытаться поместить его где-то в другом месте? Это находится под полкой теперь, таким образом, влажность не является проблемой также. Действительно ли возможно, что нормальный Корпус компьютера решит мою проблему (я собираюсь застрелиться затем)? Завтра я получу изображение.

Я просто проклят?

Любая справка или предположение значительно ценятся.

Править: Удлинитель охраняют против повышенного напряжения.

Edit2: Я переместил промежуток эти 4 месяца, таким образом, возможность причины, являющейся "грязным" электричеством в обоих местах, является очень низкой.

Edit3: Я проверил напряжения в BIOS (не мог одолжить мультиметр), и они, все кажутся корректными, самое большое несоответствие находится в 12 В, потому что это предоставляет 11.3. Я должен быть взволнован по поводу этого?

Edit4: Я поместил PSU своего настольного ПК в сервер. BIOS сообщил о намного более точных показаниях напряжения, и также он успешно восстановил массив raid1, который занял приблизительно 3-4 часа, таким образом, я чувствую себя немного положительным теперь. Заставит новый PSU завтра тестировать с этим. Кроме того, присоединяя изображение о поле: (игнорируйте 3-й диск),

picture of box of doom

23
задан 20.08.2011, 08:29

8 ответов

Действительно ли Ваш источник питания стар также? Возможно, под/подавление диском, который вызывает отказ. Если бы у Вас есть мультиметр, я попытался бы измерить напряжение, которое работает в Ваших жестких дисках, и наблюдайте его в течение времени. Другой преступник может быть 'грязным' электричеством, таким образом, UPS может быть в порядке так, чтобы это 'убрало' питание, входящее в PSU.

26
ответ дан 07.12.2019, 09:49

Я соглашаюсь с другими: питание.

Однако со скручиванием.

ВСЕ компоненты должны иметь Общее заземление - шасси типично, но в Вашем случае, кто знает! "Дрейфующая земля" вызвала бы это, я уверен.

Вы хотите все компоненты, связанные с единственной землей И той землей, связанной с основанием от земли "электросети" Вашего средства. Это ВАЖНО.

BTW, возможно, что все Ваши старые аппаратные средства на самом деле все еще в порядке! Я нашел, что оборудование, которое подавалось с облупленным источником питания иногда, переживает его хорошо, когда надлежащее предоставление обеспечивается.

Я надеюсь, что это помогает.

RT

14
ответ дан 07.12.2019, 09:49

Я не могу вообразить, как у Вас есть хорошая вентиляция и охлаждающийся в обувной коробке? Действительно необходимо ли выйти из оболочки 50 или 60 маркеров для реального корпуса компьютера?

Удлинители только принимают меры против скачков напряжения; типичные проблемы для электронного оборудования находятся под напряжением (коричневый) и по (пронзающему) напряжению. Также распространенный шум EMI - у нас был нестабильный компьютер некоторое время назад, который оказался вызванным при наличии беговой дорожки на той же схеме (я лично проверил это вне сомнения). Это ударило бы модем офлайн и заставило бы систему просто время от времени замерзать.

Кроме того, непрерывное воздействие шуму и колебаниям источника питания с в конечном счете повреждает PSU, со временем, уменьшая качество питания, поставленного электронике.

Править: Колебания электроэнергии могут быть изолированы к определенным схемам. Что еще более важно, высоко - тянут устройства, такие как микроволны, холодильники, беговые дорожки, печь и подобный может оказать значительное влияние на качество электрической энергии на той схеме. И вещи как холодильники также имеют непрерывный цикл включения - выключения операции, которая по очереди обжаривается, и скачки включают строку, когда двигатель умирает и.

Кроме того, если Вы обслуживаетесь той же энергетической компанией, они могут испытывать продолжающиеся затруднения при предоставлении напряжения через плату. Постоянно колебание между 105 В и 125 В будет иметь отрицательный эффект на электронику (насколько я понимаю).

4
ответ дан 07.12.2019, 09:49

Это действительно походит на проблемы электропитания.

Если у Вас действительно будут скачки напряжения, то много дешевых удлинителей будут только работать однажды - и обычно нет никакого признака, что они больше не защищают.

Хороший UPS мог бы помочь - некоторые более высокого уровня на самом деле производят энергию от батарей и непрерывно перезаряжают, обеспечивая полностью изолированное питание. Единственный недостаток состоит в том, что они могут быть шумными.

2
ответ дан 07.12.2019, 09:49

Я соглашаюсь, что плохая земля является вероятным преступником. Однако рассмотрите перегрев как возможную причину. Если диски являются горячими на ощупь затем, они являются слишком горячими. Поместите вентилятор на них.

1
ответ дан 07.12.2019, 09:49

Необходимо, вероятно, обновить установку Ubuntu. Несколько месяцев (годы?) назад, ошибка была найдена, который вызывает увеличенный износ жесткого диска в установках Ubuntu.

Проверьте эту ссылку об этой проблеме/ошибке: Высокая частота загружает/разгружает, циклы на некоторых жестких дисках могут сократить время жизни

0
ответ дан 07.12.2019, 09:49

Могли бы быть какие-либо крупные динамики, холодильники, кондиционеры, электродвигатели или другие магнитные источники рядом с Вашим (полностью не экранированы) обувная коробка?

0
ответ дан 07.12.2019, 09:49

Проверьте разделители питания, которые разделяют питание для вентиляторов диска. Неустойчивый коннектор может вызвать Ваш диск потерять питание в критический момент и разрушить его. Определенно нужен случай для твердой почвы между МБ, PSU и HD.

0
ответ дан 07.12.2019, 09:49

Теги

Похожие вопросы