事件
平頭哥在 2026 年 4 月 28 日的數字中國建設峰會發表 Panmai 920,定位為 AI 叢集用 400G SmartNIC。公開資訊把三個特性放在前面:
- 內建 PCIe switch:把 NIC 與 CPU / GPU 的資料路徑縮短,避免所有流量都被主機板上的 PCIe switch 拖進固定拓樸。
- 多路徑 RDMA:用 per-packet spraying 讓單一 QP 更容易吃滿 400G 頻寬,目標是改善 AI 訓練同步流量的熱點。
- 可程式化擁塞控制:把網路狀態感知與排程策略放到 NIC 端,而不是只依賴交換器或主機 stack。
SmarterNIC 判讀
這比較像 hyperscaler 自研基礎設施的一塊拼圖,不只是「中國版 400G 網卡」。如果 NIC 內建 PCIe switch 成為雲端規格的一部分,伺服器設計就會從傳統的 CPU-centered PCIe topology 轉向更接近 AI fabric appliance 的路線。
要追蹤的問題
- Panmai 920 的 PCIe switch 是只做路徑縮短,還是會承擔隔離、telemetry、故障域切割?
- 多路徑 RDMA 的 host driver、交換器 ECMP、NIC firmware 三者如何協同?
- 大規模部署是否只在阿里雲內部成立,還是會變成外部伺服器規格需求?