一篇搞懂 Celestial AI:Marvell 用 32.5 億美元買下的「把光送進晶片肚子裡」
- 5天前
- 讀畢需時 6 分鐘
Marvell 在 2026 年 2 月完成收購 Celestial AI(約 US$3.25B 全股票)。它買的不是「又一個 CPO」,而是 in-die 光 I/O——能把光直接送到 GPU/ASIC 晶片內部的任何一點,不再只停在晶片邊緣。
核心產品 Photonic Fabric 靠 OMIB(光學版的 EMIB)+GeSi EAM 調變器,官方宣稱比傳統 CPO 25 倍頻寬、10 倍低延遲,單顆 PFLink chiplet 做到 14.4–16 Tbps。
真正的護城河是 GeSi EAM 製程(IP 來自收購 Rockley Photonics)與 CoWoS-L 整合,不是漂亮的架構圖。但這是 scale-up 的 2028+ 故事,現在仍在 narrative 階段。
1. 痛點:AI 晶片缺的從來不是算力,是「餵不飽」
把一顆現代 AI 加速器想成一座超大工廠。問題早就不是廠房裡的機台不夠快——FLOPs 已經很便宜了——而是原料進不來、成品出不去。資料要從 HBM 搬進運算核心、運算結果要送去隔壁的 GPU,這段「搬運」才是瓶頸。
這個瓶頸有兩道物理牆。第一道叫岸邊密度牆(Beachfront Limit):晶片的算力與記憶體容量是按「面積」成長的,但傳統銅線 I/O 只能擠在晶片四周的「邊緣」。晶片做得越大,能塞在邊緣的接腳卻沒有等比增加,於是越大的晶片反而越餵不飽。第二道叫距離延遲:銅走線的延遲大約是長度乘上 1 ns/mm,所以 HBM 只能緊緊貼著 GPU。
光不應該被強制留在晶片邊緣排隊——它應該能直接走進晶片中央。
2. 排除誤解:Marvell 買的不是「又一個 CPO」
市場第一反應是「Marvell 補強 AI 光通訊」,把它跟一般 CPO(Co-Packaged Optics,共封裝光學)混為一談。這是誤讀。要看懂 Celestial AI 的位置,得先把三家最受矚目的矽光子(Silicon Photonics,SiPh)新創擺在一起看,它們代表三種完全不同的「整合維度」:Ayar Labs 是側邊鋪路(光引擎放 GPU 旁邊,side-car)、Celestial AI 是垂直蓋樓(光引擎埋在運算晶片肚子底下,in-die)、Lightmatter 是換地基(把所有晶片種在一整片矽光晶圓上,wafer-scale interposer)。
一句話記憶:Ayar 幫晶片「裝寬頻」、Celestial 幫晶片「加樓層」、Lightmatter 幫晶片「換地基」。Ayar 最成熟但受晶片邊緣限制,Lightmatter 最激進,Celestial 走的是中間那條最務實、卻最難做的路——既打破邊緣限制,又沿用既有封裝流程。
3. 技術本質:把光從「晶片旁邊」搬進「晶片肚子底下」
Celestial 的核心招式,是把資料的進出口從晶片邊緣(Edge)改成晶片整個底面積(Area)。傳統 CPO 只能從晶片四周邊緣引出訊號,受周長限制;Celestial 的 Vertical Area I/O 讓光從晶片整個底面積垂直進出,頻寬與算力同步以平方擴展。
那要怎麼把光「埋」進去?答案叫 OMIB(Optical Multi-Chip Interconnect Bridge,光學多晶片互連橋)。最直覺的理解是:它就是「光學版的 Intel EMIB」。EMIB 是埋在基板裡的小矽橋,用來在封裝內連接 GPU 和 HBM;OMIB 同樣埋在基板裡,但它連接的是運算晶片與整張光傳輸網路,而且用的是 TSMC 的 CoWoS-L 先進封裝。

4. 拆解 Photonic Fabric:四個關鍵組件
Celestial 的產品平台叫 Photonic Fabric,是一套 full-stack 解法(photonics + mixed-signal ASIC + 先進封裝 + 軟體)。
4.1 三種產品形態:PFLink(可授權的光連接 chiplet/IP,單顆 14.4–16 Tbps,約現有 1.6T 埠的十倍)、PFSwitch(低延遲高頻寬 scale-up 光交換機)、OMIB(封裝級光學橋)。

4.2 四層整合:Photonic Fabric 從「片內」就開始用光——片內(mm 級)→ 包內(die 對 die)→ 包對包(透過光纖陣列 FAU,公尺級)→ 包對 fabric。傳統 CPO 只處理最外層,Photonic Fabric 把銅互連的 NVLink、PCIe 整段換成光。
4.3 OMIB 的真實長相:它本質是一顆大型主動式矽光子 IC(Active PIC),用 SOI 製造、嵌在 CoWoS-L 基板裡。XPU 從底部 micro-bump 把訊號垂直打進 OMIB,EIC(TSMC 4/5nm 驅動晶片,含 SerDes/TIA/Driver)堆在上面;非光路區打 TSV 供電,雷射用外部 ELS 隔熱、光纖經 FAU 帶出。
4.4 騰出來的晶片邊緣全部還給記憶體:把光 I/O 移到中央,原本被光通訊介面佔滿的晶片邊緣被釋放,可重新分配給 4 組 DDR + 2 組 HBM 控制器。這就是「記憶體解構(Memory Disaggregation)」的物理基礎——光延遲只有約 0.02 ns/mm(銅是 1 ns/mm),HBM 可被移到幾公尺外的機櫃建成記憶體池,GPU 存取卻像在旁邊。
5. 護城河:為什麼只有 Celestial 敢賭 GeSi EAM
懷疑論者會問:架構很美,但別人複製得了嗎?答案藏在一個多數人忽略的零件——調變器(Modulator),把電訊號變成光訊號的開關。產業在這件事上分三派:

路線 | 代表廠商 | 尺寸 | 熱穩定 | 定位 |
MRM 微環 | NVIDIA / Lightmatter / Ayar / Intel | ~15µm | 差(需加熱器) | 極致密度派 |
MZM 干涉 | Broadcom | >1000µm | 高 | 交換機 CPO 霸主 |
GeSi EAM | Marvell / Celestial AI | ~50µm | 高(>85°C 寬溫) | 短距高密度互連 |
Celestial 選了第三條路,而且這正是它最硬的護城河,原因有三:
IP 來源難以複製:GeSi EAM 的關鍵 IP 來自收購的 Rockley Photonics,它花數年才解決鍺矽晶格不匹配(Lattice Mismatch)與暗電流(Dark Current)。
製程是精細活:做一顆只要吸光的 Ge PD 很容易;但 EAM 必須運作在吸光/透光的能隙懸崖邊緣,需要極精準的應力工程與成分配比。
專利+製程雙重牆:競爭者想轉 GeSi EAM,得同時跨過 Rockley 專利組合與製程參數重頭研發兩道門檻。
EAM 陣營賭的是:客戶寧願要一個稍微大一點、但絕對穩定的方案,也不要在 GPU 旁邊伺候一個怕熱的嬌貴元件。
6. 產業連結:Marvell 接到哪、誰受惠、走到哪一步
6.1 Marvell 的算盤:Marvell 原本就有 Inphi 的 DSP、MZM 與 EML(適合長距交換),缺的正是短距高密度互連。補進 Celestial 的 in-die EAM 後,它能對自研 ASIC 的雲端巨頭提供整套 Optical CXL Appliance:Structera CXL 控制器當大腦、UCIe 當介面、PFLink 當翅膀,跨機櫃總延遲約 135 ns。核心戰略是繞過 NVIDIA 主導的 CoWoS+standard CPO,直攻自研 ASIC 的 hyperscaler。
6.2 想像空間:接到 Google MPU 上:市場傳出 Google 與 Marvell 洽談共同開發 MPU(Memory Processing Unit),專攻「資料搬移」瓶頸——正是 Photonic Fabric 的主場。技術契合度高,但整進客製 ASIC 須讓 XPU 把 SerDes/UCIe 佈到晶片中央對準 OMIB,並處理 OMIB 夾在熱源與散熱路徑間的散熱。難點在 co-design 與熱管理,不在光元件本身。(資訊強度:MPU 合作為媒體報導未定案,整合可行性為推斷、時程為猜測,信心度中)
6.3 供應鏈誰跟著吃肉:
環節 | 代表廠商 | 受惠邏輯 |
SiPh 代工 | GlobalFoundries / TSMC / UMC | active interposer/PIC wafer,GF 被低估 |
CW/外部雷射 | Lumentum / Coherent / 聯亞 / 華星光 | ELS 隔熱架構需大功率 CW 雷射 |
FAU/光纖陣列 | Senko / Sumitomo / Browave / 上詮(TFC) | 包對包靠光纖帶出,FAU 需求大增 |
Bumping/OSAT | Amkor / ASE(日月光) / SPIL(矽品) | 後段 chiplet 整合與光電模組組裝 |
載板/長距 | Unimicron/欣興;Lumentum / Coherent / Ciena | CoWoS-L 有機中介層;跨 DC DCI 與 OCS |
bump 這條線值得補一句:OMIB 的全面積垂直 I/O 把 micro-bump 從邊緣搬到整個晶片底面,單顆 XPU 的 bump 數量明顯上升;pitch 持續微縮(主流 35µm,hybrid bonding 下探 5µm),加上非光路區要打 TSV 供電,對 OSAT 與載板都是價值量提升。
6.4 走到哪一步了:standard CPO 是 scale-out 的解、已量產(Meta 實測 800G CPO 比可插拔省 65% 功耗、MTBF 三倍);Celestial 這種 in-die/SiPh interposer 是 scale-up 終局,但雲端生產環境部署案例還沒出現。兩條軸線並存到 2028,營收要等 2028 之後。(資訊強度:量產現況為已知事實,時程為合理推斷,信心度中)
總結
濃縮成三句話:第一,Marvell 買 Celestial,買的是「把光送進晶片肚子裡」的能力(in-die 光 I/O),不是又一個 CPO。第二,真正的護城河不是漂亮架構圖,而是 GeSi EAM 的製程與 Rockley 專利——別人想抄也得從頭研發。第三,這是 scale-up 的 2028+ 故事,現在追,追的是 narrative 與供應鏈卡位,不是今年的營收。
所以現在該盯什麼?盯第一個把 Photonic Fabric 真正放進量產 ASIC 的 hyperscaler 訂單——尤其 Google MPU 是否落槌給 Marvell。那一刻,才是這個故事從投影片走進機房的訊號。
本文為技術與產業趨勢分析,聚焦 Celestial AI 產品與技術說明,不構成任何投資建議。


留言