版本:234.1.124.0(2025/12/31)
升级建议
建议升级
解决问题
(1)从损坏固件重置后niccli recovery失败的问题(DCSG-41552)。
(2)Wh+: 启用软件untag VLAN时更新Broadcom 57414网卡固件引发的通信问题(DCSG-41528)。
(3)当active image和pending image的版本相同时,PLDM 固件更新不显示待更新image的问题(DCSG-40211)。
(4)最新PLDM时间不能发送到BMC(DCSG-37593)。
(5)Whp:Mgmt: 若未启用RMII则丢弃LLDP数据包(DCSG-34687)。
(6)修正OCP链引脚的GPIO复用值(DCSG-31638)。
(7)niccli-windows: 计数器清除操作(---clear)失败(DCSG-30477)。
(8)当前实现在清除温度有效标志位与读取/验证温度之间存在时序漏洞(DCSG-29165)。
(9)Whp:Mgmt: 始终将LLDP数据包转发至BMC(DCSG-29361)。
(10)在WHITNEY+设备上验证链路状态时出现HWRM错误(DCSG-22697)。
[ +40.128023] bnxt_en 0000:a1:00.1 eth9: hwrm req_type 0xfff1 seq id 0x142 error 0x3
[ +0.000172] bnxt_en 0000:a1:00.1 eth9: hwrm req_type 0xfff1 seq id 0x143 error 0x3
(11)通过PCIe VDM的早期MCTP消息可能导致系统挂起(DCSG-18324)。
(12)Whp:Mgmt:使用微秒计时器调整超时计算,以避免 FIFO 已满时固件崩溃(DCSG-01769683)。
(13)将定期更新心跳的任务交由其它进程处理以防止固件崩溃。
新增功能
(1)实现了可与多个实例应用程序共存的热升级功能(DCSG-6354)。
(2)修复代码和DSC2054规范之间的PLDM PDR实体差异(DCSG-16320)。
(3)如果NC-SI路径上启用了DCBX,拒绝LLDP禁用请求(DCSG-3220)。
(4)添加了支持,允许驱动程序在RTR状态下更改原始以太网QP上的SGID(如果用于镜像)。固件正在使用modify_sqd IM来实现此支持(DCSG-31514)。
(5)增加了对Truflow模式下NTUPLE/KTLS过滤器的200K支持(DCSG-21229)。
(6)为Thor2添加了基于DCQCN的1QP解决方法的更改(DCSG-18660)。
(7)在200G模式下工作时关闭400G光模块内未使用的信道(DCSG-26824)。
(8)为UDCC实施了基于RoCE计数器集的轮询优化,以提高低活动QP场景下的tx事件率(DCSG-24565)。
升级建议
建议升级
解决问题
(1)所有与ntuple不匹配的数据包都被丢弃(DCSG01664630)。
(2)获取接口传感器裁剪的CMIS返回有效载荷(DCSG01670754)。
(3)未能配置rx_cosq_enable(DCSG01674033)。
(4)获取收发器温度错误单位值(DCSG01680872)。
(5)roce_stats硬件可能无法正确检索数据(DCSG01681325)。
(6)FEC计数器获取问题修复-在SRIOV VF上尝试运行RoCE hammer时固件崩溃使用hammer脚本在VM上运行具有多个ib实例的RDMA流量(DCSG01684380)。
(7)由于最大重传,应用程序可能无法正确终止(DCSG01678522)。
在第一次迭代中,当我们通过丢弃所有中间响应包开始使用干扰器进行测试时,应用程序成功退出。对于第二次迭代,当我们使用干扰机重新启动测试时,应用程序将进入无限循环,不会退出。
(8)ethtool-m检查主机2、3和4上的模块信息失败,端口中断(DCSG01686458)。
(9)在低温测试中,BMC读取模块温度结果为0xff(DCSG01689877)。
(10)当具有默认vlan的VF接口关闭时,PF和VFS仍在接收所有mcast数据(DCSG01693223)。
(11)Thor:PRBS测试结果仅显示端口最后一条通道的结果(DCSG01693120)。
(12)修复TRP_UPDATE_INACTIVE致命中断问题FW崩溃,同时运行32k QP和RC QP,32k QP与UD QP在环回路径中,消息大小不匹配(DCSG01687265)。
(13)在N1100G多根板上启动所有256VF时发生超时错误(DCSG01670364)。
(14)在使用64k QP的RoCE IO执行VF FLR后,无法运行RoCE IO(DCSG01684329)。
(15)修复了OnChip传感器和设备状态传感器的容器ID(DCSG01694200)。
(16)当端口处于某个分接模式时,Ethtool显示错误的模块类型(DCSG01695153)。
(17)自动协商不适用于50G背板连接(DCSG01700268)。
(18)调整端口分流表,使100Gx1端口按每条通道25G进行分流(DCSG01702148)。
(19)thfw:多无损队列:为cos队列模式添加了健全性检查(DCSG01700563)。
(20)启用lldp/dcbx时,启动到vaux时发生崩溃循环(DCSG01702613)。
(21)旧驱动程序的RoCE流量随机失败(DCSG01694707)。
使用最新固件的旧ESXi驱动程序。
(22)RDE端口LLDP接收管理AddressMAC在不存在时返回空字符串(DCSG01711648)。
(23)在RDE固件中添加了SFP名称修复(DCSG01713209)。
(24)流量上的SVLAN值不正确(DCSG01715790)。
(25)PLDM事件:某些传感器事件中使用了不支持的健康状态(DCSG01696882)。
(26)RDE端口度量。收发器相关属性无法正常工作(DCSG01713520)。
(27)VAUX中的管理固件寄存器访问超时(DCSG01726648)。
(28)VM删除时服务器崩溃(DCSG01689222)。
删除和重新创建VM时发生固件断言。
(29)windows驱动程序不会为每个hwrm命令清除整个hwrm邮箱(DCSG01711812)。
(30)RoCE流量因丢弃而被丢弃(DCSG01731818)。
(31)连接收发器时,RDE 显示的 SFP.FiberConnectionType 属性值不正确(DCSG01731623)。
(32)232.0: 使用 TruFlow 配置包时,Thor 的 ping 不工作(DCSG01732953)。
(33)在高 PF 和 VF 规模下适配器重置时,显示“固件重置中止”(DCSG01734599)。
(34)在大量 VF 的情况下,多播资源耗尽(DCSG01743357)。
(35)删除用户创建的 RSS 上下文时出现流量丢失(DCSG01749757)。
(36)运行 rss 哈希键流创建命令后,创建流时出现“错误 65534:0:00000000:0000”(DCSG01736621)。
(37)从 226.x 升级固件到 230.x 后,Thor 链路不会启动(DCSG01758774)。
(38)运行 roce 测试时资源耗尽错误(DCSG01752647)。
ROCE VF 接口启动失败,错误信息为 - bnxt_init_nic err: ffffffe4。
(39)NCSI:GetPartitionStats(0x2F) 的 CountersCleared 字段似乎出现了字节交换(DCSG01766964)。
(40)主机在检测到 PCIe 错误时重启(DCSG01766369)。
(41)避免因无效的 DCBX 配置导致固件崩溃(DCSG01773046)。
在 ESX 7.0 中加载驱动程序时使用参数 roce_prio=0,NIC 卡会消失.
(42)热断言后没有接收到流量(DCSG01777549)。
(43)卸载 Wh+ 上的 RoCE 驱动程序时观察到 'hwrm req_type 0x3a' 消息(DCSG01665809)。
(44)NCSI OEM 命令 0x2a 在不支持监控和标志的 SFP 模块上返回成功(DCSG01678338)。
(45)解决了 MCG 复制器过度使用动作记录的问题(DCSG01687464)。
在删除和重新添加默认 VLAN 时观察到 bnxt_init_nic 错误:ffffffe4。
(46)禁用时,XDP EM 记录将回送数据包(DCSG01687396)。
(47)在 NC-SI OEM 命令响应的保留字段中返回零值(DCSG01710209)。
(48)Wh+: pm_probe 无法完成,导致没有 10GBase-T PHY 链路连接(DCSG01714143)。
(49)硬件 CoS 队列在 ifdown/ifup 之间重新配置(DCSG01639909)。
(50)修复代码以在端口指标 RDE 请求中返回正确的值(DCSG01726076)。
(51)Citadel:修复身份验证超时等待值(DCSG01744035)。
(52)WH+: 在某些平台上进行暖重启测试时,NIC 会断开(DCSG01729324)。
(53)MCTP) 获取版本命令时的错误 pldm 绑定版本号(DCSG01756112)。
(54)Whp: 在进行主机重启测试时,主机上的 NIC 接口消失(DCSG01759869)。
(55)多个适配器的服务器启动时间太长(DCSG01709336)。
(56)删除5750x设备不支持的与链路速度相关的x-UEFI关键字(DCSG01700984)。
(57)分区9至16没有启用“RDMANICModeOnPartition”的选项(DCSG01672582)。
(58)在端口禁用时处理“支持的分区数”值(DCSG01672016)。
(59)固件映像菜单帮助具有CCM描述,而不是RDMA固件(DCSG01751352)。
(60)如果启用FlexQBG,则更新HII逻辑以不修改特定的有效位(DCSG01752515)。
(61)更新驱动程序,以便在确定是否应查询或配置链路状态时使用正确的值(DCSG01784276)。
新增功能
(1)确保 niccli 的 PCIe 眼图结果与 Arctic 结果匹配 (DCSG01646449)。
(2)修复复位信号线上的故障 (DCSG01681557)。
(3)避免使用 IPC 调用来获取 SFF 8472 收发器模块数据 (DCSG01576743)。
(4)如果启用了 DCBX,则拒绝 LLDP 禁用请求 (DCSG01687210)。
(5)更新DMTF规范版本号的报告 (DCSG01659200)。
(6)端口模块与规格 CMIS 和 SFF 的兼容性 (DCSG01687955)。
(7)核心固件:将默认拥塞控制从DCQCN-P更改为DCQCN-D (DCSG01659194)。
(8)为tf global请求添加镜像ID读写功能 (DCSG01700712)。
(9)增加资源以并行处理NC-SI命令 (DCSG01539845)。
(10)允许SMBUS #1在RX处理队列上对MCTP数据包进行排队 (DCSG01705453)。
(11)模块故障检测的增强 (DCSG01702165)。
(12)如果命令响应在DMTF NC-SI规范中定义的T5定时内,则进行NC-SI命令定时测量(DCSG01696104)。
(13)TPH模式默认未启用(DCSG01669724)。
(14) [Thor]启用MAC环回时,固件会“伪造”到主机的链接状态(DCSG01665249)。
(15)当RoCE QP存在时启用RoCE TIM硬件块(DCSG01690178)。
(16)支持每个PF的最小带宽速率限制器(DCSG01687212)。
(17)针对多种物理介质的NC-SI实施增强(DCSG01727100)。
(18)添加3个DSCP支持(DCSG01716813)。
(19)NIC返回通道0的已配置BMC MAC地址(DCSG01730202)。
(20)添加了正确处理重复过滤器的支持(DCSG01698127)。
(21)[Wh+]通过SMBus或PCIe上的MCTP上的NC-SI将LLDP数据包传递给BMC(DCSG01684535)。
(22)固件不知道在未创建会话时驱动程序是否收到同步消息(DCSG01634992)。
(23)增加了报告环回统计信息的功能(DCSG01709535)。
(24)更改硬件资源管理以支持基于WH+的板卡的安全解决方案(DCSG01687434)。
(25)Wh+:支持通过NIC启用/禁用以太网开机(DCSG01685910)。
(26)在固件更新过程中启用固件的内联身份验证(DCSG01716979)。
(27)WHP:热重启从Flash加载块固件,块核心重置命令和支持获取配置状态命令(DCSG01743202)。
(28)在接收到每个NC SI OEM接收以太网帧通信时,始终发送最后一个接收到的LLDP帧(DCSG01751397)。
(29)启用自动否定和媒体自动检测时,不允许FEC模式选项(DCSG01730348)。
升级建议
建议升级
解决问题
(1)更新了驱动程序,包含 shared_cfg_phy 中定义的所有模式 (DCSG01542237)。
(2)驱动程序没有正确考虑PCI插槽,只检查总线以确定PCI插槽,但在服务器上总线编号相同而段编号不同。更新驱动程序以检查段和总线编号以确定适配器 (DCSG01533415)。
(3)UEFI驱动程序修改成不为FMP GetImageInfo功能读取NVM内容,从而避免不必要的NVM调用 (DCSG01545904)。
(4)在设置/检索默认值之前,更新驱动程序以获取RDMA兼容的NVRAM选项 (DCSG01546670)。
(5)更新UEFI驱动程序,使其默认记录调试消息到固件缓冲区 (DCSG01557866)。
(6)更新固件以处理VXLAN IP udp_dest == 250,并解析VXLAN包后跟随IP而非以太网头部 (DCSG01514101)。
(7)如果10G模块的 Extended Specification Compliance Code 为0,增加了10G媒体类型 (DCSG01528884)。
(8)修复了当MTU更改时RoCE流量故障问题 (DCSG01494948)。
(9)现在固件会首先检查mctp负载的类型。如果负载为mctp控制消息类型,则Eid验证将被缓解 (DCSG01507302)。
(10)修复了225.3.41.0固件的NIC-BCM957508-P2100G-2P卡和NIC-BCM957508-N2100G-2P卡每个端口最大只能分离32个VF问题。
新增功能
(1)以下过时的oem命令被弃用(DCSG01520206)。
①0x00设置备用主机MAC地址
②0x1E启动复位
③0x20查询RX ECN功能
④0x21启用RX ECN
⑤0x22查询RX ECN配置
已废弃的命令将不再显示在0x10获取支持的OEM命令中。
(2)实现了"Set Transceiver Management Data"命令,可以用于将数据写入指定的收发器模块的存储器bank、页面和偏移位置 (DCSG01479222)。
(3)为"pcie_crs_enable"定义了新的NVM选项(专用于Thor及更高版本),该选项用于在冷启动或热插拔时延迟PCIe配置请求重试,直到固件完成PCIe初始化 (DCSG01505071)。
(4)增加了网络媒体类型GUID支持 (DCSG01500398)。
(5)为WH+新增了从bnxtnvm或niccli工具获取C2M Tx FIR设置的支持 (DCSG01475834)。
(6)为"xcvr_rate_auto_sense"定义了新的NVM选项,用于支持能够根据传入信号改变CDR的双速率收发器模块 (DCSG01485064)。
(7)为端口统计信息增加了RS FEC符号错误的新字段 (DCSG01484026)。
(8)根据新的闪存部件更新了nvram表中的操作码支持列表 (DCSG01416083)。
(9)增加了对支持自动速率感测的双速率模块(DCSG01475831)。
(10)增加了对PLDM的支持,以接受多个管理地址参数,用于修补其LLDP传输字段 (DCSG01483141)。
(11)新增选项:cosq_enable、cosq_mode和cosq_mode_valid (DCSG01422628)。
(12)在AFM中实现了ROCE VF Lag支持 (DCSG01408250)。
(13)添加了非持久性nvram特性 (DCSG01404128)。
(14)增加了对RSS CAM的支持以增强RSS功能 (DCSG01361734)。
升级建议
建议升级
解决问题
(1)修复在N425G DC reboot测试BIOS启动超过10分钟问题(DCSG01435828)。
(2)如果PM在异常状态则重做PM探测(DCSG01496962)。
(3)删除Legacy BIOS下热键进入网卡OptionRom配置项的接口,不再支持Legacy BIOS下配置网卡。
(4)修复了BCM957414M4142C网卡DC reboot概率性掉卡的问题。
新增功能
(1)RDMA支持64k页大小(DCSG01487008)。
(2)支持bnxtnvm设置total_host_port_control,实现软件down物理链路同步断开功能(DCSG01486920)。
(3)增加1000BASE-LX支持(DCSG01489550)。
升级建议
建议升级
解决问题
(1)修复IPv6 CNP数据包可能被标记为RoCE优先级的问题(DCSG01174544)。
(2)在使用64k QPs运行RoCE IO并在交换机上执行链路切换或PFC切换时观察call traces(DCSG01172607)。
(3)修复在部分平台上加载UEFI HII配置延迟造成Advanced页面卡顿的问题(220版本引入)。
新增功能
(1)Linux 辅助驱动程序支持(RoCE 驱动程序重新架构)。
(2)NC-SI 增强功能,包括 NC-SI 1.2。
(3)Whitney+ 增强 Linux 默认队列数。