У меня есть маленький сервер Ubuntu, работающий дома с 2 жесткими дисками. Существует два набега программного обеспечения (raid1) на дисках, управляемых mdadm, которому я верю, не важно, но упоминание его так или иначе.
Оба из жестких дисков являются Western Digital и использовались в течение приблизительно 2 лет, когда один из них начал издавать шум нажатия и умер. Я полагал, что, возможно, это естественно после 2 лет, таким образом, я купил новый и повторно синхронизировал массивы RAID. Приблизительно после месяца также перестал работать другой диск.
Я не стал подозрительным, так как оба диска были куплены одновременно, не случается так, что удивление для наблюдения их обоих друг около друга, таким образом, я купил другой.
До сих пор 2 старых диска перестали работать, и 2 совершенно новых в системе. После одного месяца перестал работать один из новых дисков. Это - когда это начало становиться подозрительным. Так как ПК был соединен от некоторых действительно старых частей (думайте Athlon XP), я полагал, что, возможно, контроллер SATA материнской платы является преступником. Конечно, Вы не можете переключить части легко в старый ПК как это, таким образом, я купил целую систему, нового МБ, новый ЦП, новую RAM. Забрал справедливый сбойный диск, так как он находился под гарантией и заменил его.
Таким образом, это - до 2 сбойных дисков от старых и 1 сбойный диск от новых. Никакие проблемы, в течение 1 месяца. После этого ошибки накапливались снова в/var/log/messages, и mdadm сообщал об отказах массива RAID. Я начал отрывать волосы. Все является новым в системе, это до третьего совершенно нового жесткого диска, просто не возможно, что все новые диски, которые я купил, были неисправны.
Давайте посмотрим то, что все еще распространено... кабели. Хорошо, съемка общим планом, давайте заменим кабели SATA. Заберите жесткий диск, улыбнитесь парню в счетчике и скажите, что я действительно неудачен. Он заменяет жесткий диск. Я прихожу домой, передачи месяца и один из сбоев жестких дисков, снова. Я не шучу.
Два из совершенно новых жестких дисков перестали работать. Возможно, это - ошибка в ОС. Давайте посмотрим то, что говорит инструмент тестирования производителя. Загрузите инструмент тестирования, запишите его к CD, перезагрузке, оставьте жесткий диск, тестирующий в течение ночи. Test говорит, что диск неисправен, и я должен создать резервную копию всего, если я все еще могу. Я не знаю то, что происходит, но это не похоже на программную проблему, что-то определенно перегружает жесткие диски.
Я должен упомянуть теперь, что целая система находится в обувной коробке. С тех пор существует загрузка "сборки Ваш собственный материал" случая ИКЕА, я думал, что не должно быть никаких проблем, бросающих вещь в поле и наполняющих ее далеко где-нибудь. Поле хорошо вентилируется, но я думал, что просто, возможно, диски перегревались. Нет никакого другого возможного ответа на это. Таким образом, я забрал жесткий диск, и получил замененный (в 3-й раз) и купил вентиляторы жесткого диска.
И сейчас, я услышал звук гибели. нажмите щелчок whizzzzzzzzz. SSH в поле:
You have new mail!
mail
r 1
DegradedArrayEvent on /dev/md0 ...
dmesg производят:
[47128.000051] ata3: lost interrupt (Status 0x50)
[47128.000097] end_request: I/O error, dev sda, sector 58588863
[47128.000134] md: super_written gets error=-5, uptodate=0
[48043.976054] ata3: lost interrupt (Status 0x50)
[48043.976086] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[48043.976132] ata3.00: cmd c8/00:18:bf:40:52/00:00:00:00:00/e1 tag 0 dma 12288 in
[48043.976135] res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
[48043.976208] ata3.00: status: { DRDY }
[48043.976241] ata3: soft resetting link
[48044.148446] ata3.00: configured for UDMA/133
[48044.148457] ata3.00: device reported invalid CHS sector 0
[48044.148477] ata3: EH complete
Резюме:
Я кричу.В самом деле. Я не имею наглость возвращаться в хранилище теперь, это не возможно для 4 дисков привести менее чем 4 месяца к сбою.
Несколько идей, что я думал: действительно ли возможно, что я порчу что-то, когда я делю и повторно синхронизирую диски? Это может быть настолько плохо, что это физически разрушает диск? (так как поставщик предоставил инструмент, говорит, что диск поврежден), я делаю разделение с fdisk и использую тот же размер блока для raid1 разделов (я проверяю точные размеры блока с fdisk - лютеций),
Действительно ли возможно, что ядро Linux или mdadm, или что-то не совместимо с этим точным брендом жестких дисков и перегружает их?
Действительно ли возможно, что это может быть обувная коробка? Попытаться поместить его где-то в другом месте? Это находится под полкой теперь, таким образом, влажность не является проблемой также. Действительно ли возможно, что нормальный Корпус компьютера решит мою проблему (я собираюсь застрелиться затем)? Завтра я получу изображение.
Я просто проклят?
Любая справка или предположение значительно ценятся.
Править: Удлинитель охраняют против повышенного напряжения.
Edit2: Я переместил промежуток эти 4 месяца, таким образом, возможность причины, являющейся "грязным" электричеством в обоих местах, является очень низкой.
Edit3: Я проверил напряжения в BIOS (не мог одолжить мультиметр), и они, все кажутся корректными, самое большое несоответствие находится в 12 В, потому что это предоставляет 11.3. Я должен быть взволнован по поводу этого?
Edit4: Я поместил PSU своего настольного ПК в сервер. BIOS сообщил о намного более точных показаниях напряжения, и также он успешно восстановил массив raid1, который занял приблизительно 3-4 часа, таким образом, я чувствую себя немного положительным теперь. Заставит новый PSU завтра тестировать с этим. Кроме того, присоединяя изображение о поле: (игнорируйте 3-й диск),
Действительно ли Ваш источник питания стар также? Возможно, под/подавление диском, который вызывает отказ. Если бы у Вас есть мультиметр, я попытался бы измерить напряжение, которое работает в Ваших жестких дисках, и наблюдайте его в течение времени. Другой преступник может быть 'грязным' электричеством, таким образом, UPS может быть в порядке так, чтобы это 'убрало' питание, входящее в PSU.
Я соглашаюсь с другими: питание.
Однако со скручиванием.
ВСЕ компоненты должны иметь Общее заземление - шасси типично, но в Вашем случае, кто знает! "Дрейфующая земля" вызвала бы это, я уверен.
Вы хотите все компоненты, связанные с единственной землей И той землей, связанной с основанием от земли "электросети" Вашего средства. Это ВАЖНО.
BTW, возможно, что все Ваши старые аппаратные средства на самом деле все еще в порядке! Я нашел, что оборудование, которое подавалось с облупленным источником питания иногда, переживает его хорошо, когда надлежащее предоставление обеспечивается.
Я надеюсь, что это помогает.
RT
Я не могу вообразить, как у Вас есть хорошая вентиляция и охлаждающийся в обувной коробке? Действительно необходимо ли выйти из оболочки 50 или 60 маркеров для реального корпуса компьютера?
Удлинители только принимают меры против скачков напряжения; типичные проблемы для электронного оборудования находятся под напряжением (коричневый) и по (пронзающему) напряжению. Также распространенный шум EMI - у нас был нестабильный компьютер некоторое время назад, который оказался вызванным при наличии беговой дорожки на той же схеме (я лично проверил это вне сомнения). Это ударило бы модем офлайн и заставило бы систему просто время от времени замерзать.
Кроме того, непрерывное воздействие шуму и колебаниям источника питания с в конечном счете повреждает PSU, со временем, уменьшая качество питания, поставленного электронике.
Править: Колебания электроэнергии могут быть изолированы к определенным схемам. Что еще более важно, высоко - тянут устройства, такие как микроволны, холодильники, беговые дорожки, печь и подобный может оказать значительное влияние на качество электрической энергии на той схеме. И вещи как холодильники также имеют непрерывный цикл включения - выключения операции, которая по очереди обжаривается, и скачки включают строку, когда двигатель умирает и.
Кроме того, если Вы обслуживаетесь той же энергетической компанией, они могут испытывать продолжающиеся затруднения при предоставлении напряжения через плату. Постоянно колебание между 105 В и 125 В будет иметь отрицательный эффект на электронику (насколько я понимаю).
Это действительно походит на проблемы электропитания.
Если у Вас действительно будут скачки напряжения, то много дешевых удлинителей будут только работать однажды - и обычно нет никакого признака, что они больше не защищают.
Хороший UPS мог бы помочь - некоторые более высокого уровня на самом деле производят энергию от батарей и непрерывно перезаряжают, обеспечивая полностью изолированное питание. Единственный недостаток состоит в том, что они могут быть шумными.
Я соглашаюсь, что плохая земля является вероятным преступником. Однако рассмотрите перегрев как возможную причину. Если диски являются горячими на ощупь затем, они являются слишком горячими. Поместите вентилятор на них.
Необходимо, вероятно, обновить установку Ubuntu. Несколько месяцев (годы?) назад, ошибка была найдена, который вызывает увеличенный износ жесткого диска в установках Ubuntu.
Проверьте эту ссылку об этой проблеме/ошибке: Высокая частота загружает/разгружает, циклы на некоторых жестких дисках могут сократить время жизни
Проверьте разделители питания, которые разделяют питание для вентиляторов диска. Неустойчивый коннектор может вызвать Ваш диск потерять питание в критический момент и разрушить его. Определенно нужен случай для твердой почвы между МБ, PSU и HD.