v2.8.0
🚀 主要功能
- HAMi 现已支持 DRA,详情请访问:https://github.com/Project-HAMi/HAMi-DRA
- 在多个调度器之间启用 leader 选举 (#1553)
- 在 NVIDIA 设备上支持 CDI 模式 (#1552)
- 优化 HAMi WebUI,请访问 https://github.com/Project-HAMi/HAMi-WebUI
- 与 NVIDIA k8s-device-plugin v0.18.0 同步 (#1541)
- 添加 hami_build_info 指标和版本信息打印 (#1581)
- 监控并热重载更新的证书 (#1573)
🐛 主要 bug 修复
- 更新 HAMi-core 以修复 vllm 相关问题:#1381 #1461,作者 (@archlitchi),PR #1478
- 修复:配额计算错误,作者 (@luohua13),PR #1400
- 修复:vXPU 功能在 P800 节点上可能无法正常工作 (#1569)
- 修复调度器分配错误的 MIG 实例 (#1518)
📝 变更内容
🔨 其他变更
- Mock-device-plugin 现已可用,请访问:https://github.com/Project-HAMi/mock-device-plugin
- Ascend device plugin 现已 为 HAMi 和 volcano 支持 vNPU 功能,请访问:https://github.com/Project-HAMi/ascend-device-plugin
- 优化节点注册逻辑 (#1499)
- 更新 Go 版本至 v1.25.5
- 修复发布 CI,作者 (@archlitchi),PR #1373
- 修复:更改 release 名称或 chart 名称时 clusterrolebinding 失败,作者 (@FouoF),PR #1380
- 修复:e2e ginkgo 版本不匹配,作者 (@FouoF),PR #1391
- 修复:在
ReleaseNodeLock中检查 pod nil,作者 (@DSFans2014),PR #1372 - 修复:升级 nvidia-mig-parted 至 v0.12.2 以解决安全问题,作者 (@Shouren),PR #1388
- 修复:调度器不稳定测试,作者 (@FouoF),PR #1402
- 修复:从 GPU 节点移除设备插件后仍可被检测到,作者 (@luohua13),PR #1456
- 修复并发 map 迭代和 map 写入致命错误,作者 (@litaixun),PR #1452
- 修复:拼写错误,作者 (@DSFans2014),PR #1434
- 修复 PR #1470、#1326、#1033 的 CI 错误,作者 (@archlitchi),PR #1473
- 修复并发 map 读写致命错误,作者 (@litaixun),PR #1476
- 在 DeviceUsage 中添加 podInfos 以增强调度决策,作者 (@Kyrie336),PR #1362
- 更新 device-numa 获取逻辑,作者 (@archlitchi),PR #1403
- 改进对 iluvatar GPU 的支持,作者 (@qiangwei1983),PR #1399
- 改进:使用
MergePatchType替换StrategicMergePatchType,作者 (@luohua13),PR #1431 - 优化调度失败事件,作者 (@Kyrie336),PR #1444
贡献者
- archlitchi (@archlitchi)
- FouoF (@FouoF)
- DSFans2014 (@DSFans2014)
- Shouren (@Shouren)
- luohua13 (@luohua13)
- litaixun (@litaixun)
- Kyrie336 (@Kyrie336)
- qiangwei1983 (@qiangwei1983)
完整更新日志: https://github.com/Project-HAMi/HAMi/compare/v2.7.1...v2.8.0







