據(jù)路透社8月19日消息,英偉達(dá)正秘密推進(jìn)一款專為中國市場設(shè)計(jì)的新型AI芯片研發(fā)項(xiàng)目,暫定代號(hào)為B30A。這款基于Blackwell架構(gòu)的芯片被定位為H20的升級(jí)迭代產(chǎn)品,其原始算力雖僅為旗艦級(jí)B300雙芯片加速卡的一半。 B30A采用單芯片(single-die)設(shè)計(jì),將所有核心組件集成于12英寸晶圓,相較H20的Hopper架構(gòu)實(shí)現(xiàn)23%的能效比提升。該芯片配備新一代HBM3e高帶寬內(nèi)存,單卡內(nèi)存容量達(dá)128GB,內(nèi)存帶寬突破4.5TB/s,較H20的4.0TB/s提升12.5%。在核心算力方面,F(xiàn)P8精度下理論算力達(dá)340 TFLOPS,超越H20的296 TFLOPS,特別在混合精度訓(xùn)練場景中,B30A通過動(dòng)態(tài)精度調(diào)節(jié)技術(shù)可將有效算力提升至H20的1.3倍。 架構(gòu)革新破解算力瓶頸 Blackwell架構(gòu)的引入帶來三大核心升級(jí):其一,第四代NVLink互聯(lián)技術(shù)實(shí)現(xiàn)單服務(wù)器內(nèi)256張加速卡的全互連,集群通信延遲較H20降低40%;其二,Transformer引擎優(yōu)化使千億參數(shù)模型訓(xùn)練效率提升35%,在Llama 3 70B模型測試中,B30A完成單輪訓(xùn)練耗時(shí)較H20縮短2.1小時(shí);其三,新增的動(dòng)態(tài)功耗管理模塊可根據(jù)負(fù)載實(shí)時(shí)調(diào)節(jié)TDP,在保持450W基礎(chǔ)功耗下,峰值性能釋放時(shí)長較H20延長1.8倍。 合規(guī)設(shè)計(jì)應(yīng)對出口管制 為規(guī)避美國4月新規(guī)設(shè)定的1.4TB/s內(nèi)存帶寬限制,B30A采用分頻傳輸技術(shù),將數(shù)據(jù)通道拆分為四組獨(dú)立頻段,通過時(shí)序復(fù)用實(shí)現(xiàn)邏輯帶寬4.8TB/s的同時(shí),物理帶寬控制在1.2TB/s閾值內(nèi)。該設(shè)計(jì)已通過美國商務(wù)部工業(yè)與安全局(BIS)的初步審查,但知情人士強(qiáng)調(diào),最終量產(chǎn)仍需獲得"最終用戶驗(yàn)證清單"(UVL)豁免。 市場策略凸顯競爭焦慮 英偉達(dá)計(jì)劃于2025年9月向阿里云、騰訊等戰(zhàn)略客戶交付首批工程樣品,2026年Q1啟動(dòng)量產(chǎn)。定價(jià)策略方面,B30A單卡售價(jià)預(yù)計(jì)在2.8萬至3.2萬美元區(qū)間,較H20上浮15%,但通過算力密度提升使每PFLOPS成本下降22%。與此同時(shí),英偉達(dá)正同步推進(jìn)RTX6000D推理芯片項(xiàng)目,這款采用GDDR6顯存的入門級(jí)產(chǎn)品,將以1.398TB/s的內(nèi)存帶寬精準(zhǔn)卡位管制紅線,預(yù)計(jì)9月向字節(jié)跳動(dòng)等企業(yè)提供測試機(jī)。 地緣博弈增添變數(shù) 盡管特朗普政府近期釋放"可能放寬高端芯片出口"信號(hào),但美國國會(huì)兩黨議員已聯(lián)名提交《AI芯片出口管制強(qiáng)化法案》,要求將"可訓(xùn)練參數(shù)量超過1000億"作為新的管制標(biāo)準(zhǔn)。在此背景下,英偉達(dá)中國區(qū)負(fù)責(zé)人黃仁勛在內(nèi)部會(huì)議中強(qiáng)調(diào):"B30A不是妥協(xié)產(chǎn)物,而是用技術(shù)創(chuàng)新在政策縫隙中開辟新賽道。"據(jù)供應(yīng)鏈消息,臺(tái)積電CoWoS-L先進(jìn)封裝產(chǎn)線已預(yù)留20%產(chǎn)能應(yīng)對B30A量產(chǎn)需求,而長江存儲(chǔ)的192層3D NAND閃存也進(jìn)入認(rèn)證流程,或?qū)⒊蔀樵撔酒鎯?chǔ)模塊的潛在供應(yīng)商。 這場圍繞AI芯片的技術(shù)博弈,正將全球半導(dǎo)體產(chǎn)業(yè)推向更復(fù)雜的競合局面。B30A能否如英偉達(dá)所愿成為"合規(guī)框架下的性能標(biāo)桿",或?qū)⑷Q于中美監(jiān)管機(jī)構(gòu)的最終博弈結(jié)果。 |