HP x86 서버에서 Kernel Panic과 함께 서버가 리부팅되는 Bug가 발견되어 펌웨어 업그레이드가 필요합니다.
1. 이슈 내용
- iLO4(HP DL 360/380/580 Gen8 서버) 장비에서 발생하는 문제로 iLO4 펌웨어 버전 1.30, 1.32, 1.40, 1.50을
사용하는 서버에서 NMI가 발생하는 Bug가 있어 1.51 이상의 펌웨어로 업데이트가 필요합니다.
- iLO3 를 사용하는 G7(DL380 G7 등의)와 iLO2를 사용하는 G5, G6 장비는 해당되지 않습니다.
※ Glossary
- Integrated Lights-Out (iLO)
HP에서 만든 독자적 임베디드 서버 관리 기술이며, 서버의 기본 네트워크 인터페이스 외의 물리적 이더넷 포트를
이용하여 원격지에서 HP 서버의 활동을 수행하게끔 한다.
- NMI(Non-Maskable Interrupt)
처리 여부를 묻지 않고 CPU가 무조건 처리하는 인터럽트
예) 메모리 패리티 에러, I/O channel check
2. 패치 영향
- 펌웨어 업데이트 후 시스템 재시작이 필요.
※ 참고
SR 진행 결과 - Red Hat Global Support Services |
이번 패닉 이슈는 커널이 NMI 신호를 받고 패닉된 것으로 보입니다. 해당 이슈 발생원인에 대하여 하드웨어 IML 로그를 확인해 보시기 바랍니다.
<0>Kernel panic - not syncing: An NMI occurred, please see the Integrated Management Log for details. <0> <4>Pid: 0, comm: swapper Tainted: G --------------- T 2.6.32-358.11.1.el6.x86_64 #1 <4>Call Trace: <4> <NMI> [<ffffffff8150d4f8>] ? panic+0xa7/0x16f <4> [<ffffffff815130d6>] ? kprobe_exceptions_notify+0x16/0x430 <4> [<ffffffffa00234cd>] ? hpwdt_pretimeout+0x8d/0xbc [hpwdt] <4> [<ffffffff81511c19>] ? perf_event_nmi_handler+0x9/0xb0 <4> [<ffffffff81513705>] ? notifier_call_chain+0x55/0x80 <4> [<ffffffff8151376a>] ? atomic_notifier_call_chain+0x1a/0x20 <4> [<ffffffff8109cc1e>] ? notify_die+0x2e/0x30 <4> [<ffffffff815114b3>] ? do_nmi+0x2a3/0x340 <4> [<ffffffff81510c90>] ? nmi+0x20/0x30 <4> [<ffffffff812d39d1>] ? intel_idle+0xb1/0x170 <4> <<EOE>> [<ffffffff8109de11>] ? sched_clock_idle_sleep_event+0x11/0x20 <4> [<ffffffff814163f8>] ? menu_select+0x178/0x390 <4> [<ffffffff814152d7>] ? cpuidle_idle_call+0xa7/0x140 <4> [<ffffffff81009fc6>] ? cpu_idle+0xb6/0x110 <4> [<ffffffff814f345a>] ? rest_init+0x7a/0x80 <4> [<ffffffff81c27f7b>] ? start_kernel+0x424/0x430 <4> [<ffffffff81c2733a>] ? x86_64_start_reservations+0x125/0x129 <4> [<ffffffff81c27438>] ? x86_64_start_kernel+0xfa/0x109
참고로 기존에 기록된 이슈에 의하면 HP ProLiant DL360p Gen8 에서 iLO 4 펌웨어 버그로 이와 같은 패닉 이슈가 발생되는 것으로 알고 있습니다. 해당의 경우 하드웨어사에 연락하셔서 iLO 펌웨어 버전을 올리시기 바랍니다.
참고문서: Why does the system crash with HP NMI Watchdog [hpwdt]? https://access.redhat..com/solutions/707563 ========================================================== 해당 페이지 확인 결과 위 현상이 발생 가능한 조건은 아래와 같습니다. n Red Hat Enterprise Linux 7 n Red Hat Enterprise Linux 6 n Red Hat Enterprise Linux 5 n iLO4 Management Interface ü HP ProLiant DL380p Gen8 ü HP ProLiant DL360p Gen8 ü ProLiant Gen8 Servers with HP Integrated Lights-Out 4 Firmware Versions 1.30, 1.32, 1.40 and 1.50 n HP watchdog driver [hpwdt]. 관련하여 H/W 업체에서는 위 조건에 맞는 장비들에 ILO 1.51 버전 설치를 권고한 상태입니다.
본 사항에 관련 있으신 분들은 위 내용 확인하시어 장애 대응하는데 활용하시기 바랍니다. |