版本:3.54(2025/4/2)
升级建议
可选升级
解决问题
10.1 HDM-3.54版本解决问题列表
问题现象:在HDM界面上打开JAVA KVM失败。
问题产生条件:在HDM界面上打开JAVA KVM。
问题现象:并发SOL会话压测出现ReadSerialPkt的core文件,导致SOL创建失败命令无法下发成功。
问题产生条件:并发SOL会话压测。
新增功能
2.1 HDM-3.54版本硬件特性变更说明
无
升级建议
可选升级
解决问题
10.1 HDM-6.17.02版本解决问题列表
无
新增功能
2.1 HDM-6.17.02版本硬件特性变更说明
R4900 G5新增option适配
新增适配NIC-ETH330T-3S-4P网卡
升级建议
可选升级
解决问题
10.1 HDM-3.53版本解决问题列表
问题现象:服务器上的部分硬盘因为温度过高导致故障。
问题产生条件:G5服务器入风口温度Inlet_Temp超过55℃没有自动关机。
问题现象:R4930 G5 H3服务器配置特定硬盘背板,小概率出现HDM页面无法显示特定槽位NVME硬盘的详细信息。
问题产生条件:R4930 G5 H3服务器配置特定硬盘背板,小概率出现。
新增功能
2.1 HDM-3.53版本硬件特性变更说明
无
升级建议
可选升级
解决问题
10.1 HDM-3.52版本解决问题列表
问题现象:服务器设置电源主备模式15天后事件日志上报PSU自检异常告警。
问题产生条件:服务器设置电源主备模式。
问题现象:通过HDM Web页面查看操作日志时,Web页面自动退到登录页面。
问题产生条件:操作日志中存在乱码。
新增功能
2.1 HDM-3.52版本硬件特性变更说明
R5300 G5新增option适配
新增适配海飞科C20 GPU卡
新增适配昆仑芯P800 GPU标卡
R4900 G5新增option适配
新增适配NIC-ETH330T-3S-4P网卡
新增适配J6410 3.84T/7.68T NVMe硬盘
升级建议
可选升级
解决问题
10.1 HDM-3.51版本解决问题列表
问题现象:HDM Web页面不显示NIC-BCM957508-P2100G-2P网卡信息。
问题产生条件:在BIOS setup的Advance页面下将NIC-BCM957508-P2100G-2P的FunCtion Mode修改为NPAR1.0模式,并保存重启设备。
问题现象:HDM Web页面误报内存条UCE故障。
问题产生条件:服务器上报MCA告警时误解析M2M相关寄存器。
新增功能
2.1 HDM-3.51版本硬件特性变更说明
R5300 G5新增option适配
新增适配长鑫32G内存
升级建议
可选升级
解决问题
10.1 HDM-3.50版本解决问题列表
问题现象:R4900 G5服务器的HDM界面,上报硬盘missing告警但系统下无异常。
问题产生条件:HDM启动过程中与阵列卡通信获取信息异常。
新增功能
2.1 HDM-3.50版本硬件特性变更说明
R4900 G5新增option适配
新增丽台4090D GPU适配
新增适配忆联UM311b 480G/960G/1.92T/3.84T SATA SSD硬盘
R4930 G5 H3新增option适配
Scaleflux CSD3000 7.68T NVMe硬盘
NIC-ETH-N500L-FH-4P-GE网卡
R5300 G5新增option适配
新增适配metaScale-200S网卡
新增适配metaScale-200网卡
R5500 G5 AMD新增option适配
新增适配3140H网卡
升级建议
建议升级
解决问题
10.1 HDM-6.14.01版本解决问题列表
问题现象:使用Redfish接口获取部分性能指标数据时,出现执行报错问题。
问题产生条件:使用Redfish接口获取部分性能指标数据。
问题现象:在R4900 G5服务器上通过HDM获取电源功耗,出现数据跳变问题。
问题产生条件:在R4900 G5服务器上使用多种接口获取电源功耗。
问题现象:服务器运行较长一段时间之后,低概率出现无法通过HDM下载SDS日志,继而出现HDM反复重启的问题。
问题产生条件:服务器运行较长一段时间。
新增功能
2.1 HDM-6.14.01版本硬件特性变更说明
R4900 G5新增option适配
新增适配QLE2694-SR-AK 16G FC-HBA卡
R4930 G5 H3新增option适配
新增适配UN-SSD-1.6T-NVMe-PE321
新增适配UN-SSD-1.92T-NVMe-PE321
新增适配UN-SSD-3.2T-NVMe-PE321
新增适配UN-SSD-3.84T-NVMe-PE321
新增适配UN-SSD-6.4T-NVMe-PE321
新增适配UN-SSD-7.68T-NVMe-PE321
升级建议
建议升级
解决问题
10.1 HDM-3.49.01版本解决问题列表
202405141974
问题现象:通过Redfish接口获取服务器电源的输入功率与输出功率,其数值相同。
问题产生条件:在配置Intel处理器的服务器上,通过Redfish接口获取电源功率。
202408230652
问题现象:通过HDM Web页面修改用户密码时,若接口URL的ID和BODY中的ID不一致,仍然可以修改成功。
问题产生条件:通过HDM Web页面修改用户密码时,URL的ID和BODY的ID不一致。
202406191302
问题现象:R4900 G5服务器概率性出现硬盘状态检测为Ready的问题。
问题产生条件:R4900 G5服务器在PMC阵列卡下配置逻辑盘,其成员盘状态概率性变为Ready状态。
202407070061
问题现象:服务器在持续运行一段时间之后,低概率出现无法通过HDM下载SDS日志,继而出现HDM反复重启的问题。
问题产生条件:服务器持续运行一段时间。
新增功能
2.1 HDM-3.49.01版本硬件特性变更说明
R5300 G5新增option适配
新增适配燧原S60 GPU
R4900 G5新增option适配
新增适配NS8500 G2 1.92&3.2&7.68TB SSD硬盘
R4950 G5新增option适配
新增适配SSD-7.68T-NVME-CD8P
新增适配SSD-7.68T-NVME-7940M
R4930 G5 H3新增option适配
新增适配SSD-1.92T-NVME-J5100
升级建议
建议升级
解决问题
10.1 HDM-3.48版本解决问题列表
问题现象:B5700 G5机型BMC开启禁用历史密码后OM交互异常。
问题产生条件:B5700 G5机型BMC开启禁用历史密码。
问题现象:服务器出现IO延迟导致业务告警。
问题产生条件:配置LSI的阵列卡并在带内开启CC功能。
问题现象:通过Web界面使用LSI-9460-8i存储卡创建RAID10逻辑盘时,如果RAID组数量超过8个,会出现创建失败并导致存储进程卡死的情况。
问题产生条件:通过Web界面使用LSI-9460-8i存储卡创建RAID10逻辑盘时,RAID组数量超过8个。
问题现象: Redfish库调用接口获取部分性能指标错误,。
问题产生条件:Redfish库调用接口获取电源输出功率。
新增功能
2.1 HDM-3.48版本硬件特性变更说明
R4900 G5新增option适配
新增适配QLE2694-SR-AK 16G FC-HBA卡
新增适配ScaleFlux CSD 3320 3.84TSSD硬盘
R4950 G5新增option适配
瀚博GPU VG1000-32G-LP
升级建议
建议升级
解决问题
10.1 HDM-3.47版本解决问题列表
问题现象:批量机器报带外用户连接已满告警,IPMI命令返回会话资源不足。
问题产生条件:脚本压力执行sol activate和sol deactivate命令。
问题现象:同一机柜中8台R4900 G5服务器异常宕机,手动重启后恢复。
问题产生条件:电源外部输入异常引入服务器二次电源告警。
问题现象:调用Redfish接口获取部分性能指标,发现指标异常。
问题产生条件:Redfish接口多次获取电源输入输出功率。
问题现象:修改HDM密码带"%"后无法登录HDM。
问题产生条件:修改HDM密码带"%"字符。
问题现象:按照MIB及SNMP手册,使用OID(.1.3.6.1.4.1.25506.13.1.2.1.2.2.1.1.7)监控组件温度状态,实际返回的是组件健康状态,MIB及SNMP手册有误。
问题产生条件:使用OID(.1.3.6.1.4.1.25506.13.1.2.1.2.2.1.1.7)监控组件温度状态。
新增功能
2.1 HDM-3.47版本硬件特性变更说明
R4900 G5新增option适配
MCX515A-CCUT网卡适配
NIC-ETH-SP670-FHHL-2P 100G网卡适配
大普微R5 1.92&3.2&7.68TB硬盘适配
R5300 G5新增option适配
瀚博VA10 GPU适配
CX8028G G5新增option适配
IB-MCX755106AS-HEAT-200Gb-2P
R5500K新增option适配
VR芯片适配英飞凌方案
升级建议
建议升级
解决问题
10.1 HDM-3.46.01版本解决问题列表
问题现象:配置NVMe盘后读取到的寿命为255,触发了严重级别的寿命告警。
问题产生条件:配置NVMe盘后读取硬盘寿命。
新增功能
2.1 HDM-3.46.01版本硬件特性变更说明
R4900 G5新增option适配
Dapustor R5101-1.92T/R5301-3.2T
升级建议
建议升级
解决问题
10.1 HDM-3.46版本解决问题列表
问题现象:R4900 G3服务器通过Web进行HDM固件升级,页面提示admin账户没有权限升级固件。
问题产生条件:因为异常情况导致HDM Web服务重启。
问题现象:通过Redfish接口设置SNMP trap服务器域名,如果域名包含3个及以上“.”号,无法设置成功。
问题产生条件:通过Redfish接口设置SNMP trap服务器域名,域名包含3个及以上“.”号。
新增功能
2.1 HDM-3.46版本硬件特性变更说明
R5300 G5 新增option适配
大普微Dapustor H5100 7.68TB(FW:FF035008)的nvme硬盘
NVIDIA L2 GPU
VR芯片适配英飞凌方案
七彩虹4090 GPU
R4900 G5新增option适配
大普蛟容5 1.92&3.2&7.68TB适配
升级建议
建议升级
解决问题
10.1 HDM-3.45版本解决问题列表
问题现象:R4900 G3服务器间歇性风扇噪音大。
问题产生条件:网络环境中存在携带NoAddrAvail信息的DHCPv6报文。
问题现象:对HDM不断发起SSH连接请求,概率出现HDM中打印BIOS reset误报, 实际服务器未重启。
问题产生条件:对HDM不断发起SSH连接请求。
问题现象:NIC-GE-4P-360T-B2-1-X网卡页面型号信息显示为N/A。
问题产生条件:安装NIC-GE-4P-360T-B2-1-X网卡。
问题现象:R4900 G5服务器A0与E0内存触发UCME报警时,BMC将CPU1 E0 CE告警错误解析成了CPU1 A0 E0 UCE。
问题产生条件:A0与E0内存触发UCME报警。
问题现象:Redfish事件订阅服务器无法收到PMC阵列卡故障上报的日志。
问题产生条件:Redfish事件订阅服务器对对应机器进行订阅,触发PMC阵列卡故障告警SEL。
问题现象:HDM网页无法通过https访问。
问题产生条件:存在大量https攻击的情况下,Lighttpd中有机制会通过IPtables把对应端口和IP加入到黑名单。
问题现象:R4900 G3服务器当电源指示灯红灯告警时,HDM未关联故障。
问题产生条件:电源产生红灯告警。
新增功能
2.1 HDM-3.45版本硬件特性变更说明
R4930 G5 H3新增option适配
大唐480G/960G/1.92T/3.84T-SATA-DSS200-B K5 SSD 硬盘
union 480G/960G/1.92T-UM310a硬盘
UN-SSD-1.92T/3.84T/7.68T/1.6T/3.2T/6.4T-NVMe-PE321硬盘
R4900 G5新增option适配
NIC-ETH-3S910-LP-2P-25G 网卡
NIC-ETH-SF200T-LP-2P-GE 网卡
NIC-ETH-SF400T-LP-4P-GE 网卡
NIC-ETH-RP1000P2SFP-LP-2P 网卡
升级建议
建议升级
解决问题
10.1 HDM-3.44.01版本解决问题列表
问题现象:R4900 G3服务器运行497天后在部分监控平台的SNMP V3 Trap告警无法显示。
问题产生条件:R4900 G3服务器运行497天监控SNMP V3 Trap。
新增功能
2.1 HDM-3.44.01版本硬件特性变更说明
无
升级建议
建议升级
解决问题
10.1 HDM-3.43版本解决问题列表
问题现象:R4930 G5(H3)服务器配置25SFF硬盘背板和后置4SFF Unibay硬盘背板,且后置4SFF Unibay硬盘背板中装配NVME硬盘,HDM存储管理界面下的物理视图展示的NVME硬盘信息跟实际不符。
问题产生条件:R4930 G5(H3)服务器配置25SFF硬盘背板和后置4SFF Unibay硬盘背板,且后置4SFF Unibay硬盘背板中装配NVME硬盘。
问题现象:服务器配置LSI RAID卡,小概率出现RAID卡下挂接的硬盘全部上报drive fault误告警。
问题产生条件:服务器配置LSI RAID卡,小概率出现问题。
问题现象:R4900 G5服务器因电网环境不稳定出现AC瞬断,BMC上报为主板电源故障。
问题产生条件:R4900 G5服务器因电网环境不稳定出现AC瞬断。
新增功能
2.1 HDM-3.43版本硬件特性变更说明
R4930 G5 H3新增option适配
SSD-3.2T-NVMe-PB6537-AIC
SSD-6.4T-NVMe-PB6537-AIC
SSD-3.2T-NVMe-J5310-AIC
SSD-6.4T-NVMe-J5310-AIC
SSD-7.68T-NVMe-J5110-AIC
瀚博GPU VG1000-64G-LP
NIC-ETH-RP1000SFPH102-3S-10G-2P
R4900 G5新增option适配
X710-T2L网卡适配
升级建议
建议升级
解决问题
10.1 HDM-3.42版本解决问题列表
问题现象:服务器设置过密码有效期后,hREST工具无法获取信息。
问题产生条件:服务器设置过密码有效期。
问题现象:搭配昆仑芯R300模组,概率出现获取不到R300温度,存在散热风险。
问题产生条件:R5500K搭配昆仑芯R300模组,概率出现。
问题现象:R5500K风扇功耗页面显示不正确。
问题产生条件:R5500K,开机待启动完成后设置风扇转速100%。
新增功能
2.1 HDM-3.42版本硬件特性变更说明
R4900 G5新增option适配
瀚博VA1L GPU适配
瀚博VA1-16G GPU适配
支持Solidigm P5520 15.36T硬盘
R4930 G5 H3新增option适配
登临GPU Goldwasser-L256
SSD-7.68T-NVME-PB6531-AIC
江波龙SATA SSD硬盘
R5300 G5新增option适配
天数 BI-V150 GPU适配
升级建议
建议升级
解决问题
10.1 HDM-3.41版本解决问题列表
问题现象:服务器设置过密码有效期后,hREST工具无法获取信息。
问题产生条件:服务器设置过密码有效期。
问题现象:R4900 G5接8SFF UniBay配置安装硬盘后,HDM界面显示的硬盘在位信息与实际不符。
问题产生条件:R4900 G5接8SFF UniBay配置安装硬盘。
问题现象:服务器触发ADDDC故障后未上报日志信息。
问题产生条件:服务器触发ADDDC故障。
问题现象:当服务器配置名称中有MB字样的PCIe卡时,触发PCIe卡故障,MCA解析建议是更换卡,但是事件日志上报的却是主板故障,并建议更换主板。
问题产生条件:服务器搭配含有MB字样的PCIe卡,且该PCIe卡出现告警。
问题现象:R5500 G5服务器误上报system detected the absence of a DIMM的SEL告警。
问题产生条件:G5 Intel服务器搭配未认证的内存,执行不断电重启或者断电重启。
问题现象:R4300 G5服务器HDM获取的硬盘功耗与实际硬盘功耗不一致。
问题产生条件:R4300 G5服务器接背板、硬盘,从HDM页面读取功耗。
新增功能
2.1 HDM-3.41版本硬件特性变更说明
R4900 G5新增option适配
支持Solidigm P5520 15.36T硬盘
支持长城2700W电源
支持IVA-CP24-VA卡
R4950 G5新增硬盘背板配置适配
只接后置4SFF UniBay硬盘背板的配置
升级建议
建议升级
解决问题
10.1 HDM-3.40版本解决问题列表
问题现象:R4900 G3服务器出现部分电源故障时,健康灯亮红灯,HDM页面无告警信息。
问题产生条件:R4900 G3服务器出现部分电源故障时。
问题现象:R4930 G5 H3服务器配置多块硬盘背板,主机启动过程中低概率出现HDM上报硬盘drive fault和missing告警日志。
问题产生条件:R4930 G5 H3服务器配置多块硬盘背板,主机启动过程中HDM低概率上报硬盘误告警。
问题现象:R5500 G5 执行fieldiag,概率性报错。
问题产生条件:R5500 G5 进行搭配HDM版本,带内执行fieldiag。
新增功能
2.1 HDM-3.40版本硬件特性变更说明
R4900 G5新增配置适配
支持双95系列阵列卡接12LFF+2SFF UniBay背板配置
支持9560-8i阵列卡接8UniBay配置
R4930 G5 H3新增option适配
NIC-ETH-3S930-LP-2*100G
R5500 G5新增option适配
NVIDIA A800 HGX 40G模组适配
升级建议
建议升级
解决问题
10.1 HDM-3.39版本解决问题列表
问题现象:服务器搭配25SFF背板,概率性出现Expander温感超温导致服务器异常关机。
问题产生条件:服务器搭配25SFF背板配置。
问题现象:HDM页面下删除原有逻辑盘并重新创建同样逻辑盘并设置初始化选项为FULL后,原有逻辑盘的系统及数据未被清除。
问题产生条件:HDM页面删除并创建逻辑盘并设置初始化选项为FULL。
问题现象:服务器搭配PMC卡时接入可显示寿命的SSD和NVME后部分SSD不显示剩余寿命信息。
问题产生条件:服务器搭配PMC卡。
问题现象:R6700 G3服务器上报内存故障时,日志中的内存槽位号显示异常。
问题产生条件:R6700 G3服务器CPU3上报内存故障。
问题现象:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置时,概率出现误报Drive Fault报错。
问题产生条件:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置概率出现。
问题现象:R4300 G3服务器使用3.37版本,HDM页面出现内存未认证的轻微告警。
问题产生条件:R4300G3 服务器使用3.37版本,接多根内存条,执行DC操作,概率出现HDM页面误报内存未认证告警。
问题现象:B460/B5700 G3机型搭配P5408阵列卡,阵列卡告警后上报的名称为R2140M。
问题产生条件:B460/B5700 G3搭配P5408阵列卡,触发阵列卡告警。
新增功能
2.1 HDM-3.39版本硬件特性变更说明
R5300 G5新增option适配
Nvidia H800 GPU适配
Nvidia L40S GPU适配
RG800 Pro GPU适配
R4930 G5(H3)新增option适配
GPU-RG800-32GB-FHFL适配
25SFF硬盘背板PCA-BP-25SFF-2U-G5搭配NVME硬盘的配置
R4950 G5新增option适配
UN-RC-2FHFL-R3-2U-G5 适配
升级建议
建议升级
解决问题
10.1 HDM-3.38.01版本解决问题列表
202307180160
问题现象:R4900 G3搭配LSI RAID卡,Ucenter低概率出现上报逻辑盘为Unknow状态。
问题产生条件:R4900 G3搭配LSI RAID卡低概率出现。
问题现象:R4900 G3搭配24NVMe配置,在【存储管理】/【物理视图】页签会多显示硬盘在位信息。
问题产生条件:R4900 G3搭配24NVMe配置。
202307120329
问题现象:R4300 G5搭配多盘的配置时,SNMP WALK获取硬盘信息响应时间较慢。
问题产生条件:R4300 G5搭配多盘配置。
202308070270
问题现象:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置时,概率出现误报Drive Fault报错。
问题产生条件:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置概率出现。
202307240022
问题现象:R5500K搭配OCP网卡在压力测试后重启,批量报OCP过温。
问题产生条件:R5500K搭配OCP网卡,执行压力测试,随后执行DC重启。
202307192176
问题现象:R5500G5机型搭配332A网卡,散热存在问题。
问题产生条件:R5500G5机型,搭配332A智能网卡,进入FAKE S5。
新增功能
2.1 HDM-3.38.01版本硬件特性变更说明
R4900 G5新增option适配
无镁光芯片H460-B1阵列卡适配
无镁光芯片H460-M1阵列卡适配
升级建议
建议升级
解决问题
10.1 HDM-3.37.01版本解决问题列表
202306200181
问题现象:R4300 G5搭配9300阵列卡出现概率性转速超过90%的情况。
问题产生条件:R4300 G5搭配9300阵列卡概率性出现。
202306240148
问题现象:R4900 G5使用4GPU Riser,搭配PMC卡,存储页面不显示PMC卡信息。
问题产生条件:R4900 G5使用4GPU Riser,搭配PMC卡插在槽位3位置。
202306020382
问题现象: G5 Intel机型增加内存未认证告警。
问题产生条件:G5 Intel机型针对未通过H3C认证的内存增加内存未认证告警。
202302231383
问题现象: R4300 G5搭配24LFF背板,概率性出现误报硬盘丢失。
问题产生条件:R4300 G5搭配24LFF背板概率性出现。
202305221785
问题现象: R4900 G5搭配LSI阵列卡,出现部分硬盘型号显示和实际不符的情况。
问题产生条件:R4900 G5搭配LSI阵列卡。
202306020141
问题现象:R4900 G5通过Redfish创建逻辑盘,创建成功时返回的响应体中Message拼写错误。
问题产生条件:通过Redfish创建逻辑盘。
新增功能
2.1 HDM-3.37.01版本硬件特性变更说明
R4900 G5新增option适配
遂原I20 GPU适配
升级建议
建议升级
解决问题
10.1 HDM-3.35.01版本解决问题列表
202303260045
问题现象:R4900 G5搭配多张R200 GPU后SN显示重复。
问题产生条件:R4900 G5搭配多张R200 GPU后可复现。
202304271897
问题现象:4300 G3 HDM版本从3.13升级至新版本后,大量机器随机出现drive fault&disk missing误告警。
问题产生条件:R4300 G3搭配LSI卡且接有多块盘概率性出现。
新增功能
2.1 HDM-3-35版本硬件特性变更说明
R4900 G5新增option适配
MBF2H512C-AEUOT
升级建议
建议升级
解决问题
10.1 HDM-3.34.01版本解决问题列表
202303291487
问题现象:升级3.33版本后HDM页面上560F网卡网口链接状态信息无法正常显示。
问题产生条件:使用3.33版本搭配560网卡网卡会出现。
新增功能
2.1 HDM-3.34.01版本硬件特性变更说明
无
3.1 HDM-3.34.01
无
升级建议
建议升级
解决问题
10.1 HDM-3.31版本解决问题列表
1. 202210310602
问题现象:服务器配置两张LSI阵列卡,其中一张是HBA-LSI-9400,主机执行重启操作,概率性出现HBA-LSI-9400卡管理的所有硬盘误报Drive Fault和Disk is missing告警。
问题产生条件:服务器配置两张LSI阵列卡,其中一张是HBA-LSI-9400,主机执行重启操作。
2. 202212010962
问题现象:服务器配置一张或多张阵列卡和不带扩展芯片的硬盘背板,在主机先出现阵列卡掉卡,然后主机重启后重新识别到阵列卡的情况下,大概率出现硬盘误报Drive Fault和Disk is missing告警。
问题产生条件:服务器配置一张或多张阵列卡和不带扩展芯片的硬盘背板,主机先出现阵列卡掉卡,然后主机重启后重新识别到阵列卡。
新增功能
2.1 HDM-3.31版本硬件特性变更说明
R4900 G5新增option适配
U55C赛灵思FPGA卡
R4930 G5 H3新增option适配
GPU-Z100-16G-FHFL
GPU-Atlas 300I Pro-24G-LP
RR5300 G5新增option适配
GPU-Z100L-32G-FHFL
16G EF-I20 GPU
3.1 HDM-3.31
无
升级建议
建议升级
解决问题
10.1 HDM-3.30版本解决问题列表
1.
问题现象:R6900 G5冷重启过程中概率报错8Unibay上的所有硬盘报错driver fault。
问题产生条件:R6900 G5机型使用25SFF搭配其他非25SFF背板时概率性出现。
2.
问题现象:R8900 G3 AC reboot过程中上报“Transition toNon-recoverable from less severe---System detected a power supply failure onCMOD2.”日志。
问题产生条件:R8900机型搭配G3-RS3M9PWF-1200W交流电源模块做AC重启后概率性出现。
3.
问题现象:R4900 G3 HDM上报的故障日志和解除日志部分信息不一致导致华为esight监控软件不解除故障。
问题产生条件:触发“Bus Uncorrectable Error”日志后可复现
4.
问题现象:R4900 G3服务器配置LSI-9460-8i阵列卡HDM上报电池告警日志“BBU is Miss”。
问题产生条件: 阵列卡FW版本与系统内阵列卡驱动不匹配会概率性出现。
5.
问题现象:R4900 G3使用3.10版本在逻辑盘重建的时候,会概率上报硬盘in critical array告警,随后解除。
问题产生条件: 使用3.10到2.98间的版本,逻辑盘在进行重建时概率性出现。
新增功能
2.1 HDM-3.30版本硬件特性变更说明
R4900 G5新增option适配
UH711a、UH610a、UH630a硬盘适配
华为1300W电源适配
R5300 G5新增option适配
灵犀 GPU-HP300-8GB
R5500 G5 intel、R5500 G5 AMD新增OPTION适配
Nvidia A800 8-GPU 80GB GPU模块(PG506)
3.1 HDM-3.30
无
升级建议
建议升级
解决问题
1.
问题现象:R4900G3产生IERR告警时故障会指向主板和内存,指向不明确。
问题产生条件:触发DCU Poison error故障。
2.
问题现象:R4930 G5 H3主机BIOS启动过程中,HDM事件日志低概率出现FRB2看门狗告警,同时BIOS会自动重启,重启后业务功能正常。
问题产生条件:R4930 G5 H3主机BIOS启动过程中低概率出现。
新增功能
无
无
升级建议
建议升级
解决问题
无。
新增功能
无
无
升级建议
建议升级
解决问题
1.
问题现象:R5500 G5 intel/AMD 服务器风扇模式默认配置为静音模式,服务器在高负载业务运行过程中,概率性出现HDM事件日志上报GPU过温告警现象。
问题产生条件:R5500 G5 intel/AMD 服务器风扇模式默认配置为静音模式,服务器在高负载业务运行过程中。
2.
问题现象:服务器在持续运行一段时间之后低概率出现无法下载SDS日志,当下载SDS日志时,HDM页面提示“所选时间段内没有SDS日志”的报错现象。
问题产生条件:服务器持续运行一段时间。
3.
问题现象:检测到HDM可能存在缓慢的HTTP拒绝服务攻击。
问题产生条件:无。
4.
问题现象:设备配置LSI Raid卡,运行中概率性会误报”Drive Fault”与”Disk missing”,上报的物理盘槽位不固定,告警会多次触发解除。
问题产生条件:设备配置LSI Raid卡。
5.
问题现象: HDM 配置VLAN,并且收到的网络报文中,报文头中宣称的长度与实际长度不同时,会概率性出现HDM无法连接情况。
问题产生条件:无。
6.
问题现象:R8900 G3服务器历史功率曲线记录的最高功率信息出现毛刺点,超出了设备的正常功率范围。
问题产生条件:无
7.
问题现象:当网络环境较差,使用WEB页面进行升级固件,页面概率性会提示提示当前用户没有权限进行升级。
问题产生条件:当网络环境较差,使用WEB页面进行升级固件。
8.
问题现象:CVE-2021-41617/CVE-2016-20012。
问题产生条件:OpenSSH存在安全漏洞。该漏洞源于允许权限提升,因为补充组未按预期初始化/OpenSSH 8.7之前版本存在安全漏洞,允许远程攻击者怀疑 SSH 服务器知道用户名和公钥的特定组合,以测试这种怀疑是否正确。 发生这种情况是因为仅当该组合对登录会话有效时才会发送质询。
新增功能
无
新增特性:
对于支持背板逻辑固件升级的产品,新增支持通过HDM在线升级逻辑芯片为紫光同创型号的背板逻辑固件版本。
升级建议
建议升级
解决问题
无
新增功能
无
升级建议
可选升级
解决问题
13.1 HDM-3.10版本解决问题列表
1.
问题现象:R4950 G5服务器配置2个电源模块,在主机开机情况下,将2个电源模块依次断电,HDM事件日志会误报Board found PSU output can't be enabled。
问题产生条件:R4950 G5服务器配置2个电源模块,在主机开机情况下,将2个电源模块依次断电。
2.
问题现象:R4930 G5产品配置5系CPU和后部NVME硬盘情况下,HDM的存储信息界面会在不同的槽位下显示同一块NVME硬盘的信息。
问题产生条件:R4930 G5产品配置5系CPU和后部NVME硬盘。
3.
问题现象:服务器配置了Intel CPU,出现内存Uncorrected Error(UCE)故障时,HDM系统健康日志上报的故障类型未区分Fatal/Recoverable/Correct 类型的故障。
问题产生条件:服务器配置了Intel CPU,并出现内存Uncorrected Error(UCE)故障。
4.
问题现象:服务器处于主机状态为开机,使用IPMI命令获取到的主机状态为关机。
问题产生条件:服务器处于主机状态为开机,使用IPMI命令尝试获取主机状态。
新增功能
5.1 HDM-3.10版本硬件特性变更说明
R4930 G5新增option适配:
SSD-3.2T-NVMe-D6456
SSD-6.4T-NVMe-D6456
SSD-3.84T-NVMe-D6436
SSD-7.68T-NVMe-D6436
NIC-ETH-RP2000-LP-2P10G
R5500 G5新增option适配:
IB-P23644-B21-200Gb-1P
R5300 G5新增option适配:
PCIE_EF_T20_64G_TYPE GPU卡
PCIE_EF_I20_16G_TYPE GPU卡
PCIE_EF_I10_16G_TYPE GPU卡
P5520 硬盘
MBF2H516C-CESOT 网卡
NIC-MCX683105AN-HDAT-1*200G网卡
6.1 HDM-3.10
无
升级建议
可选升级
解决问题
13.1 HDM-2.98版本解决问题列表
1. 202203050362
问题现象:R4950 G5主机配置Milan CPU,当CPU工作过程中发生LS-HWA故障时,HDM无法检测该故障并上报告警日志。
问题产生条件:R4950 G5主机配置Milan CPU,CPU工作过程中发生LS-HWA故障。
2. 202201210384
问题现象:R4950 G5主机在特定情况下,由于主板硬件故障导致一次电源无输出,HDM无法检测该故障并上报告警日志。
问题产生条件:R4950 G5主机在特定情况下,由于主板硬件故障导致一次电源无输出。
新增功能
5.1 HDM-2.98版本硬件特性变更说明
R4900 G3新增option适配:
DERA D527 1.92T
6.1 HDM-2.98
无
升级建议
建议升级
解决问题
13.1 HDM-2.97.03版本解决问题列表
1. 202203110599
问题现象:HDM恢复出厂设置后,功率封顶会启用,功率封顶值设为500W。
问题产生条件:HDM恢复出厂设置。
新增功能
5.1 HDM-2.97.03版本硬件特性变更说明
无
6.1 HDM-2.97.03
无
升级建议
建议升级
解决问题
13.1 HDM-2.93版本解决问题列表
1. 202112241261
问题现象:R4900 G3/R4300 G3/R6700 G3配置了PMC卡,PMC卡工作异常,HDM没有检测到异常并上报SEL日志。
问题产生条件:R4900 G3/R4300 G3/R6700 G3配置了PMC卡,PMC卡工作异常。
2. 202112280415
问题现象:R4900 G3/R5300 G3/R5300 G5/R5500 G5 AMD/R5500 G5 Intel配置了支持NVLINK检测功能的GPU,HDM上报NVLINK CRC故障的SEL日志。
问题产生条件:R4900 G3/R5300 G3/R5300 G5/R5500 G5配置了支持NVLINK检测功能的GPU。
3. 202201051030
问题现象:R5300 G3 配置支持8张GPU的GPU节点板,节点板的VR电源存在DRMOS烧毁。
问题产生条件:R5300 G3 配置支持8张GPU的GPU节点板。
新增功能
5.1 HDM-2.93版本硬件特性变更说明
R5300 G5新增option适配:
GPU-BI-V100-32G
6.1 HDM-2.93
无
升级建议
建议升级
解决问题
13.1 HDM-2.91版本解决问题列表
1. 202110150155
问题现象:SNMP Trap的Test报文添加一个告警级别为通知的字段。
问题产生条件:使用SNMP Trap 发送Test报文。
2. 202109090447
问题现象:SNMP Trap告警模块,设置SNMP Trap模式中,将事件OID模式后的推荐去除。
问题产生条件:无。
3. 202109140123
问题现象:服务器SNMP V2和V3版本trap 报文携带trap OID 发送。
问题产生条件:使用V2和V3版本SNMP trap。
4. 202112131150
问题现象:触发告警时,HDM客户端和邮件服务器服务端在建立TCP连接后,邮件服务器在5s后发送第一个报文,导致HDM侧连接超时,HDM主动发送FIN的结束报文,从而造成告警邮件发送失败。
问题产生条件:触发告警时,HDM客户端和邮件服务器服务端在建立TCP连接后,邮件服务器在5s后发送第一个报文,导致HDM侧连接超时。
5. 202110200521
问题现象:当服务器发生风扇冗余丢失、电源冗余丢失、内存隔离其中一种故障,页面健康状态没有关联事件日志的告警。
问题产生条件:当服务器发生风扇冗余丢失、电源冗余丢失、内存隔离其中一种故障。
6. 202111250333
问题现象:设备配置MCX512A-ACAT或NIC-MCX4121A-F-B-25Gb-2P,HDM页面没有获取不到网卡的连接状态。
问题产生条件:设备配置MCX512A-ACAT或NIC-MCX4121A-F-B-25Gb-2P。
7. 202112180531
问题现象:R4900 G5服务器配置4张GPU_BAIDU_R200 卡,通过HDM web页面升级GPU卡固件,升级失败。
问题产生条件:R4900 G5服务器配置4张GPU_BAIDU_R200 卡。
新增功能
5.1 HDM-2.91版本硬件特性变更说明
R4300 G3新增option适配:
PCIE卡 ALIMOC
R4900 G3新增option适配:
智能网卡 iETH-MBF2H512C-AESOT-2P-25G
R5300 G5新增option适配:
A2-PCIe-16G
R5500 G5新增option适配:
A100-SXM4-80GB
R6900 G5新增硬盘背板适配:
RS65B25SXP8YD 25SFFF背板
R6700 G3新增硬盘背板适配:
RS33B25SXP8YD 25SFFF背板
R4900 G3新增硬盘背板适配
RS33B25SXP8YD 25SFFF背板
6.1 HDM-2.91
无
升级建议
建议升级
解决问题
13.1 HDM-2.81版本解决问题列表
1. 202109280480
问题现象: R4900 G3配置前部8SFF SAS/SATA+8SFF SAS/SATA+8SFF NVME硬盘,并配置switch卡,HDM界面展示的NVMe盘序展示异常,实际在位Box3-0,但在位信息会多出来一个Box3-3。
问题产生条件: R4900 G3配置前部8SFF SAS/SATA+8SFF SAS/SATA+8SFF NVME硬盘,并配置switch卡。
新增功能
5.1 HDM-2.81版本硬件特性变更说明
R4900 G3新增option适配:
长城1300W电源GW-CRPS1300D3
R4300 G3新增option适配:
长城1300W电源GW-CRPS1300D3
R6700 G3新增option适配:
长城1300W电源GW-CRPS1300D3
6.1 HDM-2.81
无
升级建议
建议升级
解决问题
13.1 HDM-2.76版本解决问题列表
1. 202108251029
问题现象: RAID卡下硬盘组建逻辑盘,逻辑盘出现降级,然后再恢复,这个过程产生的告警触发日志和告警解除日志时间上存在错乱。
问题产生条件: RAID卡下硬盘组建逻辑盘,逻辑盘出现降级,然后再恢复。
2. 202108300061
问题现象: Fru信息读取失败时,BMC_Self_Test传感器显示状态异常,但是没有上报相关事件日志。
问题产生条件:Fru信息读取失败。
3. 202108300356
问题现象:HDM页面的syslog设置中的告警日志主机标识缺少主机序列号。
问题产生条件:在syslog设置中设置告警日志主机标识为主机序列号。
4. 202105130683
问题现象:R6900 G3设备,同一硬盘温感传感器下硬盘都不在位,会导致风扇转速高。
问题产生条件:R6900 G3设备,同一硬盘温感传感器下硬盘都不在位。
5. 202108310746
问题现象:使用duid作为分配地址的依据,给HDM下发地址,在BOND下DHCP v6无法获取IPV6地址,HDM 重启之后可以正常获取IPV6,但是插拔专用口网线之后IPV6就会丢失。
问题产生条件:使用duid下发HDM地址。
6. 202107130260
问题现象:HDM解析出的故障PCIe槽位没有插PCIe卡时,会导致健康灯亮,但是HDM页面显示正常;
问题产生条件:HDM解析出的故障PCIe槽位没有插PCIe卡。
新增功能
5.1 HDM-2.76版本硬件特性变更说明
R4900G3新增option适配:
NIC-MCX512A-ACUT-2*25Gb Mellanox
R6900 G5 新增option适配:
长城1300W电源GW-CRPS1300D3
长城1600W电源GW-CRPS1600D2
R4900 G5 新增option适配:
GPU卡GPU_BAIDU_R200
R5300 G3 新增option适配:
GPU卡 GPU-RTX6000B-24G
R5300 G5新增option适配:
RAID卡 RAID-P4408-MR-8i-2GB
NIC-MCX623430MS-CDAB-2*100G
R5500 G5新增option适配:
NIC-MCX653106A-HDAT-2*200G
R4950 G5新增option适配:
SSD-3.84T-NVMe-PE8010
GPU-A6000
R4930 G5新增option适配:
FAN-6056-2U-G5
6.1 HDM-2.76
无