服务器 2024-11-15

350vip8888 R2260服务器宕机问题分析

一、?现网描述

1.1?环境描述

设备型号:350vip8888 R2260

硬件配置:3508 RAID卡


二、故障描述

2.1?故障现象

客户现场2022-03-24业务运行过程中,一台服务器出现宕机的问题。

?

三、?问题分析

3.1?排查思路

1、?Sel日志中记录2022-3-24显示RAID卡与BMC通信丢失

image.png?

2、?maintenance_log记录 raid卡心跳异常

image.png?

3、?RAID_Controller_Info中查看,RAID卡显示状态异常,且RAID组、硬盘状态异常

image.png?

判断为RAID卡故障,建议更换RAID卡

3.2?原因分析

RAID卡故障


四、问题解决

4.1?解决办法

建议更换RAID卡

4.2?分析总结

raid卡故障,导致raid卡信息、硬盘信息获取不到,raid配置找不到,进不去系统,并产生raid卡与iBMC通信丢失告警。

更换raid卡问题解决,服务器当前运行状态无异常。