Vladimir "Dair" Lebedev-Schmidthof (dair_spb) wrote,
Vladimir "Dair" Lebedev-Schmidthof
dair_spb

(компьютерно-железное) Кто виноват?

Что делать я сам решу, мне бы понять, чо ваще происходит.

Есть "антресольный сервер". В нём три винчестера — два стареньких, 320Gb (системный, Linux Debian Sid) и 400Gb и один типа новый, 2Tb.
На плате два SATA разъёма, а них воткнуты два мелких винта. В PCI воткнут контроллер, в котором есть ещё четыре SATA, в один из которых воткнут 2Tb.

Так вот. 2Tb начинает отваливаться на ровном месте.


В dmesg примерно такое:
[    6.719211] [drm] Initialized drm 1.1.0 20060810
[    6.753110] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[    6.753158] ata3.00: BMDMA2 stat 0x80c0109
[    6.753195] ata3.00: failed command: READ DMA
[    6.753239] ata3.00: cmd c8/00:08:10:00:00/00:00:00:00:00/e0 tag 0 dma 4096 in
[    6.753242]          res 51/04:00:3f:ad:99/00:00:00:00:00/f0 Emask 0x1 (device error)
[    6.753327] ata3.00: status: { DRDY ERR }
[    6.753362] ata3.00: error: { ABRT }
[    6.768617] ata3.00: configured for UDMA/100
[    6.768642] ata3: EH complete
[    6.770093] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[    6.770136] ata3.00: BMDMA2 stat 0x80d0109
[    6.770173] ata3.00: failed command: READ DMA
[    6.770218] ata3.00: cmd c8/00:08:00:01:00/00:00:00:00:00/e0 tag 0 dma 4096 in
[    6.770220]          res 51/04:00:2f:ae:99/00:00:00:00:00/f0 Emask 0x1 (device error)
[    6.770305] ata3.00: status: { DRDY ERR }
[    6.770340] ata3.00: error: { ABRT }
[    6.792562] ata3.00: configured for UDMA/100
[    6.792589] ata3: EH complete
[    6.806788] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x2400000 action 0x0
[    6.806855] ata3.00: BMDMA2 stat 0x80c0109
[    6.806909] ata3: SError: { Handshk UnrecFIS }
[    6.806963] ata3.00: failed command: READ DMA
[    6.807023] ata3.00: cmd c8/00:08:47:03:00/00:00:00:00:00/e0 tag 0 dma 4096 in
[    6.807026]          res 51/04:00:76:b0:99/00:00:00:00:00/f0 Emask 0x1 (device error)
[    6.807174] ata3.00: status: { DRDY ERR }
[    6.807225] ata3.00: error: { ABRT }
[    6.828853] ata3.00: configured for UDMA/100


Через пару перезагрузок (вот сейчас например) винт определился и работает. Сколько проработает — фиг знает.

Винт втыкался в другую машину и проходился всеми проверялками — всё вроде ок.
Если кто может посдказать, что именно смотреть и как — буду благодарен, а то мало ли. А винт на гарантии, так что можно и поменять, есичо.
До этого, когда была такая проблема, я поменял контроллер. В новом всё проработало "без единого обрыва" больше месяца (или даже двух?), потом, вот, началось опять.

Что может быть? Гугл подсказывает стопицот ссылок на сдохшие винты и рекомендации смотреть бэдблоки. Но тут стопудово не бэдблоки, потому как иногда линукс винт не видит вообще, т.е., в /dev/sd? его нет. Т.е., проблема явно выше уровнем.
Опять говноконтроллер? Тогда подскажите нормальный, плиз, который можно купить, а то я уже чото задолбался.
Спасибо.
Tags: hardware
Subscribe

  • В этот день 7 лет назад

    Как вчера, ей-Богу!

  • Вентиляторы

    Сегодня получал в Озоне заказ с двумя вентиляторами взамен одного сломавшегося. Пришёл в пункт выдачи Озона, там мне дают коробку. Одну. С надписями…

  • В этот день 8 лет назад

    Этот пост был опубликован 8 лет назад! А всё ещё актуально!

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 19 comments

  • В этот день 7 лет назад

    Как вчера, ей-Богу!

  • Вентиляторы

    Сегодня получал в Озоне заказ с двумя вентиляторами взамен одного сломавшегося. Пришёл в пункт выдачи Озона, там мне дают коробку. Одну. С надписями…

  • В этот день 8 лет назад

    Этот пост был опубликован 8 лет назад! А всё ещё актуально!