作者:上方文Q 蘋果表面上是一家手機(jī)廠商,但這幾年已經(jīng)悄然在移動(dòng)處理器行業(yè)占據(jù)了一定的地位,尤其是CPU:A6首次使用自主設(shè)計(jì)架構(gòu)Swift,A7首次使用64位ARMv8架構(gòu)Cyclone。A8又能帶來什么驚喜呢? 很可惜,如果你期待又一次革命,那恐怕要失望了。無論CPU還是GPU,A8都只是一次穩(wěn)健的進(jìn)步,并不算很激進(jìn)。 ![]() A8 ![]() A8內(nèi)核照片與基本布局 【新工藝、內(nèi)存】 A8最大的亮點(diǎn)其實(shí)是制造工藝,并且創(chuàng)造了多個(gè)第一: 它是第一批采用20nm工藝制造的移動(dòng)處理器之一,也是最重要的一個(gè)。 這是蘋果第一次使用最先進(jìn)的半導(dǎo)體工藝(28nm誕生了一年多采用上)。 這是蘋果第一次使用非三星工廠代工,當(dāng)然也是第一次使用臺(tái)積電代工,而且一下子就搶走了絕大部分產(chǎn)能。 臺(tái)積電宣稱,20nm工藝相比于28nm可使芯片速度提升30%,或者集成度提高90%,或者功耗降低25%,具體如何權(quán)衡就看芯片設(shè)計(jì)了。A8晶體管數(shù)量翻了一番,核心面積小了13%,性能……稍后再說。 ![]() A8的內(nèi)存子系統(tǒng)基本沒變,只有一些細(xì)微的調(diào)整。SRAM緩存依然存在,繼續(xù)同時(shí)為CPU、GPU服務(wù)(可視為三級(jí)緩存),容量還是4MB,而內(nèi)存控制器還是支持LPDDR3-1600。 經(jīng)過測試發(fā)現(xiàn),A8的內(nèi)存帶寬比A7略有增加,2-9%的樣子,很小,說明來自進(jìn)一步優(yōu)化。 ![]() 更有趣的是內(nèi)存延遲,1-4MB SRAM緩存區(qū)域、6+MB內(nèi)存區(qū)域都降低了大約20ns,但具體如何實(shí)現(xiàn)的仍有待考察。 ![]() 除了CPU、GPU、緩存、內(nèi)存,A8里還有其他大量的固頂功能模塊(或者最多時(shí)彈性很有限的DSP),包括音頻控制器、USB控制器、視頻編解碼器、閃存控制器、攝像頭ISP等等。具體在芯片的哪個(gè)位置、特性如何還不清楚,但至少知道,A8支持H.265格式視頻編碼,不過目前只會(huì)用于FaceTime視頻通話。 ![]() ![]() A8、A7對(duì)比 ![]() 蘋果自主處理器歷史 【CPU架構(gòu):沒有革命 仍然驚喜】 兩年多過去了,我們對(duì)A6、A7 CPU架構(gòu)仍然知之甚少,蘋果始終不肯公布任何技術(shù)細(xì)節(jié)。A8仍是如此,這一次甚至連架構(gòu)代號(hào)都還不知道(以前兩代分別是Swift、Cyclone)。 就目前所知,A8 CPU架構(gòu)設(shè)計(jì)并沒有像A6、A7上那樣有著革命性的地方,也就是個(gè)增強(qiáng)版的Cyclone,但也并不算是壞事。A7架構(gòu)已經(jīng)十分優(yōu)秀:較寬、較高的IPC設(shè)計(jì),延遲很低,可以在很低的頻率下取得很高的性能。(Intel酷睿的理念也與此類似) A7的頻率只有1.3GHz,A8也不過區(qū)區(qū)1.4GHz,但正因?yàn)槿绱耍O果無需在頻率上投入太多,就能獲得理想的性能,同時(shí)保證功耗足夠低,這對(duì)移動(dòng)設(shè)備來說顯然是再理想不過的。 換句話說,蘋果在去年就完成了其他芯片廠商明年才有可能做到的。 ![]() 盡管不用再費(fèi)力挖掘架構(gòu)細(xì)節(jié),但我們?nèi)匀幌胫,A8究竟改變了什么。 根據(jù)估量,A8 CPU部分面積約12.2平方毫米,相比于A7 17.1平方毫米縮小了29%,也就是說在塞入了更多晶體管后,蘋果憑借更新的工藝,反而減小了CPU所占面積。 從測試數(shù)據(jù)看,A8、A7 CPU的確是如出一轍,很多底層測試中都表現(xiàn)得就像同一顆芯片,只是浮點(diǎn)加法和整數(shù)乘法延遲更短了一些,緩沖和分支預(yù)測也可能略有不同。 A7只有1個(gè)整數(shù)乘法單元,需要4個(gè)周期執(zhí)行,A8則只需3個(gè)周期,更神奇的是整數(shù)乘法性能翻了一番還多,這意味著現(xiàn)在有2個(gè)整數(shù)乘法單元了。 浮點(diǎn)加法也有很大提升,不過幅度沒這么高,執(zhí)行周期從5個(gè)縮短到4個(gè),貌似仍是3個(gè)浮點(diǎn)ALU單元。 總體而言,A8、A7的變化有點(diǎn)像是Intel Tick-Tock的后一步,即升級(jí)工藝,架構(gòu)上只是微調(diào)增強(qiáng)。 ![]() 接下來看一些更接近表層的測試。這里使用多年前用于PC系統(tǒng)的SPEC CPU2000,如今移動(dòng)處理器的檔次拿來跑它正合適。 ![]() A8的頻率高了100MHz,也就是大約7.7%,排除這一因素后,A8的性能仍然明顯高于A7,12個(gè)子項(xiàng)全部有提升,尤其是MCF、GCC、PerlMmk、GAP的幅度都很高,最高達(dá)55%。 再來看Geekbench 3,包括整數(shù)、浮點(diǎn)兩部分。 ![]() 仍然普遍有提升,幅度也不錯(cuò),最高達(dá)到了37%,但是加解密差點(diǎn),排除頻率因素后偶爾甚至還有所倒退。 ![]() 浮點(diǎn)部分更好些,各項(xiàng)提升相對(duì)比較均勻。 總體而言,A8 CPU沒有再次革命,但憑借架構(gòu)優(yōu)化、內(nèi)存延遲改進(jìn)、頻率提升,仍然有了不小的進(jìn)步,完成了“A7升級(jí)版”的基本任務(wù)。 明年,大批的64位ARM處理器將陸續(xù)登場,既有公版的A57,也會(huì)有非公版的自主設(shè)計(jì),蘋果將面臨嚴(yán)峻的挑戰(zhàn),但相信A8仍然能有自己的立足之地。 雖然四核、六核、八核將大行其道,蘋果依然只是個(gè)雙核,但是已經(jīng)可以看出,蘋果的單線程IPC一直十分優(yōu)秀,而現(xiàn)在很多工作任務(wù)仍然無法很好地支持多核,A8根本不用怕。 當(dāng)然了,下一代A9能再次帶來什么驚喜更值得期待。 ![]() 【GPU架構(gòu):六核?沒必要】 庫克宣稱A8 GPU性能提升最多50%,這很自然讓我們以為是從四核變成了六核,會(huì)用上Imagination最頂級(jí)的PowerVR GX6650。 但是經(jīng)過對(duì)芯片的觀察,卻只發(fā)現(xiàn)了四個(gè)GPU核心,排除了六核的可能性。 ![]() 再結(jié)合其他信息,尤其是蘋果的Metal編程指導(dǎo),最終確認(rèn)A8采用的是四核PowerVR GX6450,也就是A7 G6430的升級(jí)版,基于最新的PowerVR Series6XT架構(gòu),年初的CES大會(huì)上才宣布。 ![]() Series6XT是此前2012年誕生的Series6架構(gòu)的增強(qiáng)版(G6430就屬于后者),重點(diǎn)是通過架構(gòu)上的各種調(diào)整和優(yōu)化,提升性能、增加功能,比如支持下一代紋理壓縮技術(shù)ASTC(自適應(yīng)可擴(kuò)展紋理壓縮)。 該技術(shù)來自出品了OpenGL、OpenGL ES等標(biāo)準(zhǔn)規(guī)范的行業(yè)組織Khronos,可提供更好的紋理壓縮性能、更精細(xì)的質(zhì)量控制,同時(shí)也是所有GPU都可以支持的通用格式。 蘋果一直都在用PowerVR GPU,一直支持PVRTC、PVRTC2,ATSC則可以進(jìn)一步提升游戲畫質(zhì)和性能。 Series6XT架構(gòu)還有新的電源管理技術(shù),能降低待機(jī)、輕負(fù)載時(shí)的功耗,比如說“PowerGearing G6XT”門控技術(shù)可以單獨(dú)開關(guān)每個(gè)GPU核心(著色器簇/USC),自然能夠延長手機(jī)的待機(jī)時(shí)間。 Series6XT通過一系列底層優(yōu)化,提升了總體性能,官方宣稱最多可達(dá)50%,正好也是蘋果宣傳的數(shù)據(jù),但具體怎么做的,Imagination并未公開。 我們只知道,新架構(gòu)對(duì)核心(著色器簇)本身做了改進(jìn),仍然是16寬度的SIMD結(jié)構(gòu),但每條流水線都增加了一組中等/半精度FP16 ALU,也就是從2×3變成了2×4,理論上性能可提升33%。 FP16操作比FP32節(jié)省帶寬和功耗,但是需要精心編程才能高效利用,否則性能提升會(huì)很有限。 FP32部分仍然是每條流水線兩個(gè)ALU,每時(shí)鐘周期最多四個(gè)FP32浮點(diǎn)操作,或者說128個(gè)MAD(乘加運(yùn)算)。 ![]() 前端和后端的幾何處理、紋理填充同樣有所改進(jìn),但還是細(xì)節(jié)不詳。 最后是GPU計(jì)算性能。iOS仍然沒有提供這方面的良好支持,OpenCL也沒有相應(yīng)的版本。iOS 8增加了Metal API,可以同時(shí)用于圖形、計(jì)算,但效果如何還有待觀察。 GPU頻率完全不知道,也不太容易測試。 ![]() 總體而言,GX6450可以在部分優(yōu)化、支持到位的項(xiàng)目中獲得50%的性能提升,有的則可能只會(huì)看到15-20%,一般來說也就是30-35%的樣子吧。 ![]() 為什么還是四核? 其實(shí),Imagination已經(jīng)有了更強(qiáng)大的六核心型號(hào)G6630、GX6650,完全可以更好地滿足更大屏幕的iPhone 6、iPhone 6 Plus,而且有了新工藝的支持,晶體管、核心面積都可以更好地控制,為什么還是堅(jiān)持四核心呢? 這再次體現(xiàn)了蘋果的設(shè)計(jì)原則:絕不盲目追新,夠用就好。 A8 CPU上只是一次進(jìn)化,GPU也不必急著革命,尤其是G6430本來就已經(jīng)很強(qiáng)大了,iPad Air 2048×1536的屏幕都不在話下,iPhone 6 Plus 1080p又算什么,GX6450本身的改進(jìn)加上頻率提升(如果有的話)確實(shí)正好。 A7 GPU部分的面積是22.1平方毫米,A8縮小到了19.1平方毫米?雌饋砗芾硐,但別忘了20nm理論上可以讓它縮小11.1平方毫米的。這說明A8 GPU還是增強(qiáng)了很多的,尤其是那兩塊清晰可見的共享紋理單元,將對(duì)紋理性能產(chǎn)生至關(guān)重要的影響。 說到最后,對(duì)明年的A9更期待了:16nm工藝、CPU新架構(gòu)、六核心GPU…… ![]() |