近日,Marvell(美滿電子)宣布推出采用共封裝光學(xué)器件(CPO)技術(shù)的定制XPU架構(gòu)。 Marvell的這一舉措是對當(dāng)前人工智能行業(yè)發(fā)展需求的有效回應(yīng)。在數(shù)據(jù)處理量持續(xù)增長的當(dāng)下,傳統(tǒng)AI加速器在計算能力與互聯(lián)規(guī)模方面存在局限,最多只能在單一機架內(nèi)連接數(shù)十個XPU。而新推出的CPO架構(gòu)能夠?qū)⒒ヂ?lián)規(guī)模提升至多個機架上的數(shù)百個XPU,極大地拓展了計算資源的集成范圍。 該定制XPU架構(gòu)基于Marvell之前推出的定制HBM計算架構(gòu),在這一基礎(chǔ)上進(jìn)一步鞏固了Marvell在定制芯片領(lǐng)域的領(lǐng)導(dǎo)地位。其架構(gòu)運用高速SerDes、D2D接口和先進(jìn)的封裝技術(shù),將XPU計算模塊、HBM內(nèi)存以及其它小芯片與該公司的3D硅光子學(xué)引擎集成于同一基板之上。 這種集成方式具有諸多優(yōu)勢。在互連距離和數(shù)據(jù)傳輸速率方面,它能實現(xiàn)XPU間最大互聯(lián)距離達(dá)到傳統(tǒng)銅線連接方式的百倍,從而大大加快數(shù)據(jù)傳輸速度,這對于大數(shù)據(jù)傳輸和高并發(fā)計算場景意義重大。從信號完整性和延遲方面來看,由于CPO技術(shù)將光學(xué)元件直接集成到單一封裝內(nèi)部,有效縮短了電氣路徑長度。這一改變顯著減少了信號損失、增強了高速信號完整性,并且極大地降低了延遲。 同時,新架構(gòu)還降低了數(shù)據(jù)鏈路受電磁干擾(EMI)的影響,優(yōu)化了元件清單(BOM),提升了能效表現(xiàn)。以Marvell現(xiàn)有的6.4Tb/s 3D硅光子學(xué)引擎為例,該引擎集成了數(shù)百個組件,能提供32條200Gb/s的電氣和光學(xué)I/O,這意味著在單個器件內(nèi)能夠?qū)崿F(xiàn)2倍的帶寬和2倍的輸入/輸出帶寬密度,而且與100Gb/s接口同類設(shè)備相比,每比特功耗降低了30%。 目前,許多客戶正在積極評估該技術(shù)以集成到下一代解決方案之中,這也顯示出該CPO架構(gòu)在推動人工智能服務(wù)器發(fā)展方面的巨大潛力,未來有望在AI服務(wù)器性能提升方面發(fā)揮重要作用。 |