來源:21世紀(jì)經(jīng)濟(jì)報(bào)道 AI芯片的戰(zhàn)役正愈演愈烈。 7月11日,英特爾(33.98, 0.68, 2.04%)面向中國市場推出了AI芯片Habana Gaudi 2,Gaudi 2直接對(duì)標(biāo)英偉達(dá)GPU的100系列,欲爭奪AI算力市場的寶座。 眾所周知,目前GPU資源緊缺,英偉達(dá)的100系列在國內(nèi)禁售,而百模大戰(zhàn)之下算力的需求還在飆升。對(duì)于中國市場而言,當(dāng)前急需AI芯片“解渴”,對(duì)于英特爾而言,眼下正值算力緊缺的窗口期,也是進(jìn)攻的絕佳時(shí)機(jī)。 英特爾也強(qiáng)調(diào),Gaudi 2芯片是專為訓(xùn)練大語言模型而構(gòu)建,采用7納米制程,有24個(gè)張量處理器核心。事實(shí)上,去年英特爾就已經(jīng)在海外發(fā)布了Gaudi 2,此次在中國推出的是“中國特供版”。 由于各國的出口管制限制,外界首要關(guān)心的是AI芯片在中國市場的供應(yīng)可持續(xù)性。對(duì)此,英特爾公司執(zhí)行副總裁、數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera在接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪時(shí)做出了肯定的回答。 Sandra Rivera說道:“這張卡也是中國定制版的產(chǎn)品,對(duì)于出口或者是支持中國的客戶是沒有任何問題的。英特爾肯定是合法合規(guī)地在中國繼續(xù)支持我們的客戶,不管是Gaudi 2或者是未來的Gaudi 3,我們一定是在合法合規(guī)的情況下做出一些中國定制的產(chǎn)品,以滿足中國的客戶的需求! 同時(shí),芯片的性能并沒有打折,她表示:“在網(wǎng)絡(luò)速度上,(中國版)和國際版相比,是從24個(gè)網(wǎng)口變成21個(gè)網(wǎng)口,但是整體性能還是基本一致的! 隨著大模型的日新月異,英特爾在近幾個(gè)月內(nèi)圍繞著Gaudi2繼續(xù)進(jìn)行優(yōu)化。 Sandra Rivera介紹道,在性能上,根據(jù)機(jī)器學(xué)習(xí)與人工智能開放產(chǎn)業(yè)聯(lián)盟MLCommons在6月底公布的AI性能基準(zhǔn)測試MLPerf Training 3.0結(jié)果顯示,Gaudi 2是除了英偉達(dá)產(chǎn)品外,唯一能把MLPerf GPT 3.0模型跑起來的芯片。 在發(fā)布會(huì)現(xiàn)場,英特爾也直接將Gaudi2和英偉達(dá)的A100進(jìn)行比較,其野心可見一斑。根據(jù)英特爾公布的數(shù)據(jù),從計(jì)算機(jī)視覺模型訓(xùn)練到1760億參數(shù)的BLOOMZ推理,Gaudi 2每瓦性能約A100的2倍,模型訓(xùn)練和部署的功耗降低約一半。 同時(shí),英特爾高管還介紹道,目前相比A100,Gaudi 2價(jià)格更有競爭力,且性能更高。接下來到9月,采用FP8軟件的Gaudi 2預(yù)計(jì)能夠提供比H100更高的性價(jià)比。 整體而言,除了芯片,在此次發(fā)布會(huì)上,英特爾展示了一系列支持大模型的算力解決體系,接下來具體的落地應(yīng)用和產(chǎn)品迭代狀況也受到關(guān)注。 一方面,目前在中國市場上,英特爾已經(jīng)和浪潮信息、新華三、超聚變等國內(nèi)主要的服務(wù)器廠商合作,其中,浪潮信息的NF5698G7是專為面向生成式AI市場的新款A(yù)I服務(wù)器,支持8顆OAM高速互聯(lián)的Gaudi2加速器,而在終端客戶方面,Sandra Rivera表示:“中國市場對(duì)人工智能解決方案的需求非常強(qiáng)勁,我們正在與幾乎所有傳統(tǒng)客戶洽談。我們的云服務(wù)提供商、通信服務(wù)提供商都是企業(yè)客戶,因此對(duì)人工智能解決方案有著強(qiáng)烈的需求! 另一方面,在產(chǎn)品路線上,英特爾近年一直強(qiáng)調(diào)XPU,即多樣化、多組合的異構(gòu)計(jì)算。在AI相關(guān)的產(chǎn)品線上,既有集成AI加速器的CPU處理器、有GPU產(chǎn)品,以及Habana Gaudi系列代表的ASIC類型AI芯片。 Habana Labs成立于2016年,主要研發(fā)方向?yàn)槿斯ぶ悄、深度學(xué)習(xí)計(jì)算等,創(chuàng)業(yè)初期就得到了英特爾的投資,而后在2019年12月以20億美元被其正式收購。 對(duì)于GPU和AI芯片的組合,Sandra Rivera透露:“Gaudi是一個(gè)人工智能加速的專屬產(chǎn)品,在英特爾產(chǎn)品里,如果是針對(duì)大模型這個(gè)工作負(fù)載,它是性能最佳、最優(yōu)的一個(gè)產(chǎn)品。明年我們還會(huì)有下一代產(chǎn)品Gaudi 3發(fā)布。在2025年的時(shí)候,我們會(huì)把Gaudi的AI芯片跟GPU路線圖合二為一,推出一個(gè)更整合的GPU的產(chǎn)品! 大模型的火熱還在持續(xù)拉動(dòng)AI芯片的需求。 Sandra Rivera告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者:“在4月份回顧一季度的情況時(shí),我們看到了各種人工智能帶來的芯片需求,包括Gaudi在內(nèi),需求至少翻了兩倍以上。” TrendForce集邦咨詢向21世紀(jì)經(jīng)濟(jì)報(bào)道記者提供的數(shù)據(jù)顯示,目前主要由搭載NVIDIA A100、H100、AMD(114.58, 3.26, 2.93%) MI300,以及大型CSP業(yè)者如Google、AWS等自主研發(fā)ASIC的AI服務(wù)器成長需求較為強(qiáng)勁,2023年AI服務(wù)器出貨量(包含搭載GPU、FPGA、ASIC等)出貨量預(yù)估近120萬臺(tái),年增率近38%,AI芯片出貨量同步看漲,可望成長突破五成。 芯片廠商們也在AI領(lǐng)域開足馬力。英偉達(dá)不必多言,當(dāng)前不論是100系列還是800系列,都十分緊缺,在AI芯片市場上占據(jù)先發(fā)優(yōu)勢;在6月中旬,AMD推出了新一代AI芯片、數(shù)據(jù)中心CPU以及DPU,其中AI芯片Instinct MI 300X,直接對(duì)標(biāo)英偉達(dá)H100;此外,谷歌(119.62, 1.91, 1.62%)、亞馬遜(130.8, 2.02, 1.57%)、百度(148.83, 5.50, 3.84%)等大廠也都在自研AI芯片,在算力市場上的競爭維度更加豐富。 而除了硬件之外,軟件也同樣關(guān)鍵。比如,目前大部分AI芯片都繞不開英偉達(dá)的CUDA平臺(tái),CUDA建立了一套軟硬件間的開發(fā)標(biāo)準(zhǔn)。如何從CUDA遷移、如何建立自己的優(yōu)勢生態(tài)都是挑戰(zhàn)者的重要課題。 對(duì)于軟件生態(tài)的競爭,Sandra Rivera表示:“軟件開發(fā)或者是開發(fā)者生態(tài),其實(shí)是英特爾多年的一個(gè)強(qiáng)項(xiàng),在整個(gè)數(shù)據(jù)中心領(lǐng)域的軟件生態(tài)中,一個(gè)是x86的軟件生態(tài),另外一個(gè)是CUDA。而且我們注意到,隨著越來越多的公司希望使用人工智能,軟件生態(tài)系統(tǒng)也正在加速挖掘更多硬件潛能,以大幅提高生產(chǎn)力! 她進(jìn)一步談道:“英特爾希望能在多種語言環(huán)境中,能夠提供更簡便的應(yīng)用。通過軟件、庫和工具提供一種模塊化的方法,來優(yōu)化并加速跨多種架構(gòu)的異構(gòu)負(fù)載。當(dāng)然在人工智能或者是AI運(yùn)算的時(shí)候,確實(shí)很多人在用CUDA,但是大部分開發(fā)者不會(huì)做那么底層的開發(fā),他們是在一個(gè)比較高的框架,比如說在PyTorch、TensorFlow上面去創(chuàng)新! Habana Labs首席運(yùn)營官Eitan Medina進(jìn)一步向21世紀(jì)經(jīng)濟(jì)報(bào)道記者指出:“在Gaudi2之前,我們已經(jīng)有一代產(chǎn)品,在軟件上也做了好幾年的積累,底層的軟件庫都已經(jīng)開發(fā)好了,我們希望讓開發(fā)者能夠在最上層的20%的比例能夠做他的開發(fā),這里的開發(fā)和CUDA并沒有那么直接的關(guān)聯(lián)! Gaudi系列作為英特爾AI的一艘旗艦,外界也拭目以待Gaudi 2在實(shí)際應(yīng)用中的性能表現(xiàn)、算力實(shí)力。從硬件迭代到軟件生態(tài),AI芯片的競爭故事還將繼續(xù)。 |