Сегодня наткнулся на статью о RAID-контроллерах 3ware. А поскольку у самого на нескольких серверах установлены RAID-контроллеры от даного производителя, то решил выложить даную статью и у себя. Правда добавлю еще непосредственно то, как установить утилиту tw_cli (благо она есть в портах). Находится она в /usr/ports/sysutils/tw_cli.
Установить можно следующей командой:
# cd /usr/ports/sysutils/tw_cli && make install clean && rehash |
После этого можно будет использовать команду tw_cli для перехода в консольный режим управления RAID-контроллером. Кстати, man-страница довольно обширная, так что рекомендую к ознакомлению:
# man tw_cli |
Поскольку у меня масивы работают корректно (на всяк случай покамлал шаманской штукой, лежащей на столе ), експерементировать не стал, ознакомился только с командой show и ее вариациями. Но на всякий случай материал статьи процитирую, возможно когда-то пригодится.
Автор: lissyara.
На одном из серверов установленных в датацентре произошла странная ситуация - пропал диск =). На всякий случай машину перезагрузил - не помогло. Пришлось написать тикет, чтоб погасили, выдернули второй справа хот-сваповый диск, воткнули на место и включили. Диск появился, но, состояние массива было "DEGRADED". Контроллер был от правильного производителя - 3ware (недавно их купил убогий LSI, очень хочу надеяться что они не станут производить такие же кривые контроллеры...). После часа ковыряний сtw_cli, пришлось просить IP-КВМ и запускать пересборку из BIOS контроллера - утилиту на боевой системе я ниасилил (многие вещщи делать было стрёмно - дока скудная, а предложения из буржуйского сектора инета, типа разрушить массив для пересборки - доверия не внушали). Просто так ребилдинг запускаться не хотел, ругаясь на неверную конфигурацию диска который я пытался воткнуть на место.
В общем, через пару недель в руки попал такой же контроллер и два одинаковых SATA диска. Решил разобраться, как же это сделать наживую.
Эмулируем проблему: выдёргиваю из одного диска шнурок, прям на ходу. Гашу тазик, втыкаю шнурок обратно, включаю. Получаю то что и в датацентре:
|
Смотрим родной утилитой:
|
Оба диска на месте, но - состояние массива и второго диска (который дёргался) - разрушен. В ДЦ я пытался сразу же воткнуть диск на место (кстати, в БИОС контроллера это именно так и выглядит, видимо, он прячет цепочку операций с целью упрощения интерфейса)
|
Облом. Ковыряния в интерентах и попытки удалить массив (ссылки на блог советовавшего идиота не даю, чтоб желающих повторять не нашлось) ни к чему не привели:
|
После получаса тыканий/раскуривания man'a получилась последовательность команд, позволяющая пересобрать массив без физического доступа.
Для начала удаляем деградировавший диск:
|
Смотрим, что получилось:
|
Диска нет. Запускаем сканирование каналов контроллера, с целью найти его снова:
|
Чё-то нашёл. Смотрим что именно:
|
Оба диска на месте, оба в статусе "ОК" - что и требовалось для пересборки. Запускаем:
|
Процесс пошёл. В /var/log/messages появляется соотвествующая запись:
|
Утилита от производителя показывает более подробно:
|
По окончании пеерборки в логи будет записано и это событие:
|
Ну а с массивом станет всё отлично:
|
Надеюсь кому-нибудь пригодиться. Ибо я надёргался прилично пока удалённо на боевом ковырялся и пытался всё это сделать.
P.S. Для включения отчёта о состоянии рейда в ежденевный отчёт сервера, необходимо добавить такую строку в /etc/periodic.conf:
|
P.S.2 Если во время ребилда машину перезагрузить, пересборка начинается с нуля, но не сразу, а минут через 10. Это, кстати, плюс - если будет fsck работать - не будет ему мешать.
Последние комментарии
17 недель 3 дня назад
41 неделя 5 дней назад
2 года 42 недели назад
3 года 12 недель назад
3 года 35 недель назад
3 года 50 недель назад
3 года 51 неделя назад
4 года 2 недели назад
4 года 13 недель назад
4 года 17 недель назад