15.04.2019 - Minor Host 0 Boot from backup root – Утро начинается не с кофе! 
Коллеги, доброе утро! По сложившейся традиции нашей практики ИТ-аутсорсинга, рабочее утро начинается не с кофе, а с проверки системы мониторинга.
Итак, система мониторинга, весело подмигивая триггером, оповестила, что на оборудовании нашего Клиента появилось системное сообщение. Мы, удаленно подключившись к консоли коммутатора Juniper EX-2200, на котором было сообщение, встретили баннер:
***********************************************************************
** **
** WARNING: THIS DEVICE HAS BOOTED FROM THE BACKUP JUNOS IMAGE **
** **
** It is possible that the primary copy of JUNOS failed to boot up **
** properly, and so this device has booted from the backup copy. **
** **
** Please re-install JUNOS to recover the primary copy in case **
** it has been corrupted. **
** **
***********************************************************************
Он сообщил следующее: «Пожалуйста, переустановите JUNOS для восстановления основного корневого раздела, который был поврежден».
Для просмотра системных сообщений воспользуемся командой:
oneweb@ASW-006> show system alarms 1 alarms currently active Alarm time Class Description 2019-03-04 05:02:04 MSK Minor Host 0 Boot from backup root
Данная запись говорит нам о том, что существующий хост был загружен из резервного корневого раздела. Далее проверим систему мониторинга и время работы коммутатора следующей командой:
oneweb@ASW-006> show system uptime Current time: 2019-03-04 09:20:15 MSK System booted: 2019-03-04 05:02:13 MSK (04:18:02 ago) <= Время работы 4 часа 18 минут Protocols started: 2019-03-04 05:05:08 MSK (04:16:07 ago) Last configured: 2019-02-21 15:42:10 MSK (1w3d 13:20 ago) by oneweb 9:20AM up 4:18, 1 user, load averages: 0.30, 0.24, 0.39
Исходя из полученных данных, можно смело делать вывод о наличии сбоя в электропитании и перезагрузке устройства.
Проверим состояние разделов следующей командой:
oneweb@ASW-006> show system storage partitions Boot Media: internal (da0) Active Partition: da0s1a <= Основной корневой раздел Backup Partition: da0s2a <= Резервный корневой раздел Currently booted from: backup (da0s2a) <= тот самый раздел, из которого был загружен коммутатор Partitions information: Partition Size Mountpoint s1a 184M altroot s2a 184M / s3d 369M /var/tmp s3e 123M /var s4d 62M /config s4e unused (backup config)
Начиная с версии JunOS 10.4R3, коммутаторы серии EX используют систему «resilient dual-root partition», которая позволяет повысить отказоустойчивость работы, загружая ОС из резервного корневого раздела, при условии выхода из строя основного.
Внимание! Во время загрузки из резервного корневого раздела, этот раздел становиться активным!!! И, если не исправить такую ситуацию, при следующей загрузке коммутатора будет выбран резервный раздел. В случае выхода его (резервного раздела) из строя в будущем, всё будет очень грустно – скорее всего, придется «перепрошить» коммутатор. Но наша система мониторинга не дремлет, и вовремя сообщит об этой проблеме, а мы её вовремя исправим.
Для этого, в первую очередь, проверим мгновенные снимки, которые хранятся в системе, следующей командой:
oneweb@ASW-006> show system snapshot media internal Information for snapshot on internal (/dev/da0s1a) (primary)<= Основной мгновенный снимок Creation date: Jun 25 07:14:27 2011 <= Дата создания снимка JUNOS version on snapshot: jbase : 11.1R3.5 jcrypto-ex: 11.1R3.5 jdocs-ex: 11.1R3.5 jkernel-ex: 11.1R3.5 jroute-ex: 11.1R3.5 jswitch-ex: 11.1R3.5 jweb-ex: 11.1R3.5 jpfe-ex42x: 11.1R3.5 Information for snapshot on internal (/dev/da0s2a) (backup) <= Резервный мгновенный снимок Creation date: Nov 7 12:35:17 2013 JUNOS version on snapshot: jbase : 11.1R3.5 jcrypto-ex: 11.1R3.5 jdocs-ex: 11.1R3.5 jkernel-ex: 11.1R3.5 jroute-ex: 11.1R3.5 jswitch-ex: 11.1R3.5 jweb-ex: 11.1R3.5 jpfe-ex42x: 11.1R3.5
Для восстановления нормальной работы основного корневого раздела, скопируем резервный мгновенный снимок в основной корневой раздел командой:
oneweb@ASW-006> request system snapshot media internal slice alternate Copying '/dev/da0s2a' to '/dev/da0s1a' .. (this may take a few minutes) The following filesystems were archived: /
Для проверки работоспособности основного корневого раздела и коммутатора в целом, выполним его перезагрузку командой:
oneweb@ASW-006> request system reboot slice alternate media internal Reboot the system ? [yes,no] (no) yes <= Подтверждаем “yes” Shutdown NOW! oneweb@ASW-006> *** FINAL System shutdown message from oneweb@ASW-006 *** System going down IMMEDIATELY
После перезагрузки коммутатора проверим системные сообщения и состояние разделов командами:
oneweb@ASW-006> show system alarms No alarms currently active <= Активных ошибок нет
oneweb@ASW-006> show system storage partitions Boot Media: internal (da0) Active Partition: da0s1a Backup Partition: da0s2a Currently booted from: active (da0s1a) <=Раздел, из которого был загружен коммутатор Partitions information: Partition Size Mountpoint s1a 184M / s2a 184M altroot s3d 369M /var/tmp s3e 123M /var s4d 62M /config s4e unused (backup config)
P.S. Данная статья предназначена для свободного ознакомления и не входит в состав официальной эксплуатационной или технической документации к оборудованию. Использование ее содержимого осуществляется исключительно по Вашему усмотрению.
До новых коннектов по обе стороны монитора.
Автор ed@oneweb.pro | Просмотров 7017
Комментарии (0)
Есть что сказать? Пишите нам ->