Search

'OS/버그 리포트'에 해당되는 글 1건

  1. 2015.01.14 iLO4 리부팅 Bug

iLO4 리부팅 Bug

OS/버그 리포트 2015. 1. 14. 12:38 Posted by 이정식

HP x86 서버에서 Kernel Panic과 함께 서버가 리부팅되는 Bug가 발견되어 펌웨어 업그레이드가 필요합니다.


 

1.     이슈 내용

- iLO4(HP DL 360/380/580 Gen8 서버) 장비에서 발생하는 문제로 iLO4 펌웨어 버전 1.30, 1.32, 1.40, 1.50

사용하는 서버에서 NMI가 발생하는 Bug가 있어 1.51 이상의 펌웨어로 업데이트가 필요합니다.

- iLO3 를 사용하는 G7(DL380 G7 등의) iLO2를 사용하는 G5, G6 장비는 해당되지 않습니다.

Glossary

- Integrated Lights-Out (iLO)

HP에서 만든 독자적 임베디드 서버 관리 기술이며, 서버의 기본 네트워크 인터페이스 외의 물리적 이더넷 포트를

이용하여 원격지에서 HP 서버의 활동을 수행하게끔 한다.

- NMI(Non-Maskable Interrupt)

 처리 여부를 묻지 않고 CPU가 무조건 처리하는 인터럽트

) 메모리 패리티 에러, I/O channel check

 

2.     패치 영향

- 펌웨어 업데이트 후 시스템 재시작이 필요.

 

      ※ 참고

SR 진행 결과 - Red Hat Global Support Services

이번 패닉 이슈는 커널이 NMI 신호를 받고 패닉된 것으로 보입니다. 해당 이슈 발생원인에 대하여 하드웨어 IML 로그를 확인해 보시기 바랍니다.

 

<0>Kernel panic - not syncing: An NMI occurred, please see the Integrated Management Log for details.

<0>

<4>Pid: 0, comm: swapper Tainted: G           ---------------  T 2.6.32-358.11.1.el6.x86_64 #1

<4>Call Trace:

<4> <NMI>  [<ffffffff8150d4f8>] ? panic+0xa7/0x16f

<4> [<ffffffff815130d6>] ? kprobe_exceptions_notify+0x16/0x430

<4> [<ffffffffa00234cd>] ? hpwdt_pretimeout+0x8d/0xbc [hpwdt]

<4> [<ffffffff81511c19>] ? perf_event_nmi_handler+0x9/0xb0

<4> [<ffffffff81513705>] ? notifier_call_chain+0x55/0x80

<4> [<ffffffff8151376a>] ? atomic_notifier_call_chain+0x1a/0x20

<4> [<ffffffff8109cc1e>] ? notify_die+0x2e/0x30

<4> [<ffffffff815114b3>] ? do_nmi+0x2a3/0x340

<4> [<ffffffff81510c90>] ? nmi+0x20/0x30

<4> [<ffffffff812d39d1>] ? intel_idle+0xb1/0x170

<4> <<EOE>>  [<ffffffff8109de11>] ? sched_clock_idle_sleep_event+0x11/0x20

<4> [<ffffffff814163f8>] ? menu_select+0x178/0x390

<4> [<ffffffff814152d7>] ? cpuidle_idle_call+0xa7/0x140

<4> [<ffffffff81009fc6>] ? cpu_idle+0xb6/0x110

<4> [<ffffffff814f345a>] ? rest_init+0x7a/0x80

<4> [<ffffffff81c27f7b>] ? start_kernel+0x424/0x430

<4> [<ffffffff81c2733a>] ? x86_64_start_reservations+0x125/0x129

<4> [<ffffffff81c27438>] ? x86_64_start_kernel+0xfa/0x109

 

참고로 기존에 기록된 이슈에 의하면 HP ProLiant DL360p Gen8 에서 iLO 4 펌웨어 버그로 이와 같은 패닉 이슈가 발생되는 것으로 알고 있습니다. 해당의 경우 하드웨어사에 연락하셔서 iLO 펌웨어 버전을 올리시기 바랍니다.

 

참고문서:

Why does the system crash with HP NMI Watchdog [hpwdt]?

https://access.redhat..com/solutions/707563

========================================================== 

해당 페이지 확인 결과 위 현상이 발생 가능한 조건은 아래와 같습니다.

n  Red Hat Enterprise Linux 7

n  Red Hat Enterprise Linux 6

n  Red Hat Enterprise Linux 5

n  iLO4 Management Interface

ü  HP ProLiant DL380p Gen8

ü  HP ProLiant DL360p Gen8

ü  ProLiant Gen8 Servers with HP Integrated Lights-Out 4 Firmware Versions 1.30, 1.32, 1.40

and 1.50

n  HP watchdog driver [hpwdt].

관련하여 H/W 업체에서는 위 조건에 맞는 장비들에 ILO 1.51 버전 설치를 권고한 상태입니다.

 

본 사항에 관련 있으신 분들은 위 내용 확인하시어 장애 대응하는데 활용하시기 바랍니다.