事件

平頭哥在 2026 年 4 月 28 日的數字中國建設峰會發表 Panmai 920,定位為 AI 叢集用 400G SmartNIC。公開資訊把三個特性放在前面:

  • 內建 PCIe switch:把 NIC 與 CPU / GPU 的資料路徑縮短,避免所有流量都被主機板上的 PCIe switch 拖進固定拓樸。
  • 多路徑 RDMA:用 per-packet spraying 讓單一 QP 更容易吃滿 400G 頻寬,目標是改善 AI 訓練同步流量的熱點。
  • 可程式化擁塞控制:把網路狀態感知與排程策略放到 NIC 端,而不是只依賴交換器或主機 stack。

SmarterNIC 判讀

這比較像 hyperscaler 自研基礎設施的一塊拼圖,不只是「中國版 400G 網卡」。如果 NIC 內建 PCIe switch 成為雲端規格的一部分,伺服器設計就會從傳統的 CPU-centered PCIe topology 轉向更接近 AI fabric appliance 的路線。

要追蹤的問題

  • Panmai 920 的 PCIe switch 是只做路徑縮短,還是會承擔隔離、telemetry、故障域切割?
  • 多路徑 RDMA 的 host driver、交換器 ECMP、NIC firmware 三者如何協同?
  • 大規模部署是否只在阿里雲內部成立,還是會變成外部伺服器規格需求?