이번 패닉 이슈는 커널이 NMI 신호를 받고 패닉된 것으로 보입니다. 해당 이슈 발생원인에
대하여 하드웨어 IML 로그를 확인해 보시기 바랍니다.
<0>Kernel
panic - not syncing: An NMI occurred, please see the Integrated Management
Log for details.
<0>
<4>Pid:
0, comm: swapper Tainted:
G
--------------- T 2.6.32-358.11.1.el6.x86_64 #1
<4>Call
Trace:
<4>
<NMI> [<ffffffff8150d4f8>] ? panic+0xa7/0x16f
<4>
[<ffffffff815130d6>] ? kprobe_exceptions_notify+0x16/0x430
<4>
[<ffffffffa00234cd>] ? hpwdt_pretimeout+0x8d/0xbc [hpwdt]
<4>
[<ffffffff81511c19>] ? perf_event_nmi_handler+0x9/0xb0
<4>
[<ffffffff81513705>] ? notifier_call_chain+0x55/0x80
<4>
[<ffffffff8151376a>] ? atomic_notifier_call_chain+0x1a/0x20
<4>
[<ffffffff8109cc1e>] ? notify_die+0x2e/0x30
<4>
[<ffffffff815114b3>] ? do_nmi+0x2a3/0x340
<4>
[<ffffffff81510c90>] ? nmi+0x20/0x30
<4>
[<ffffffff812d39d1>] ? intel_idle+0xb1/0x170
<4>
<<EOE>> [<ffffffff8109de11>] ?
sched_clock_idle_sleep_event+0x11/0x20
<4>
[<ffffffff814163f8>] ? menu_select+0x178/0x390
<4>
[<ffffffff814152d7>] ? cpuidle_idle_call+0xa7/0x140
<4>
[<ffffffff81009fc6>] ? cpu_idle+0xb6/0x110
<4>
[<ffffffff814f345a>] ? rest_init+0x7a/0x80
<4>
[<ffffffff81c27f7b>] ? start_kernel+0x424/0x430
<4>
[<ffffffff81c2733a>] ? x86_64_start_reservations+0x125/0x129
<4>
[<ffffffff81c27438>] ? x86_64_start_kernel+0xfa/0x109
참고로 기존에 기록된 이슈에 의하면 HP ProLiant DL360p Gen8 에서 iLO 4 펌웨어
버그로 이와 같은 패닉 이슈가 발생되는 것으로 알고 있습니다. 해당의 경우 하드웨어사에 연락하셔서 iLO 펌웨어 버전을 올리시기 바랍니다.
참고문서:
Why
does the system crash with HP NMI Watchdog [hpwdt]?
https://access.redhat..com/solutions/707563
==========================================================
해당 페이지 확인 결과 위 현상이
발생 가능한 조건은 아래와 같습니다.
n Red Hat Enterprise Linux 7
n Red Hat Enterprise Linux 6
n Red Hat Enterprise Linux 5
n iLO4 Management Interface
ü HP ProLiant DL380p Gen8
ü HP ProLiant DL360p Gen8
ü ProLiant Gen8 Servers with HP Integrated
Lights-Out 4 Firmware Versions 1.30, 1.32, 1.40
and 1.50
n HP watchdog driver [hpwdt].
관련하여 H/W 업체에서는 위 조건에
맞는 장비들에 ILO 1.51 버전 설치를 권고한 상태입니다.
본 사항에 관련 있으신 분들은
위 내용 확인하시어 장애 대응하는데 활용하시기 바랍니다.
|