熱門關(guān)鍵詞：數(shù)字電視飛兆 Ubuntu 555 無線充電器

歐洲最強(qiáng)芯片，碰壁！

發(fā)布時(shí)間：2024-6-26 14:59 發(fā)布者：eechina

來源：半導(dǎo)體行業(yè)觀察

設(shè)計(jì)芯片并將其引導(dǎo)至代工、封裝和組裝是一個復(fù)雜而困難的過程，如果國家層面不具備這些技能，將對這些國家的競爭力產(chǎn)生深遠(yuǎn)影響。

在許多方面，歐洲的行為更像一個國家，超級計(jì)算當(dāng)然也是如此，過去幾十年來，超級計(jì)算一直是一項(xiàng)合作事業(yè)。2010 年代末，正當(dāng) HPC 加速計(jì)算的浪潮在人工智能領(lǐng)域達(dá)到高潮時(shí)，歐洲厭倦了依賴美國和日本供應(yīng)商的超級計(jì)算機(jī)計(jì)算引擎，并成立了歐洲處理器計(jì)劃，以創(chuàng)建本土的歐洲計(jì)算引擎，并成立了歐洲 HPC 合資企業(yè)，為整個歐洲安裝的百億億次級和百億億次級系統(tǒng)提供資金。迄今為止，已為三個百億億次級系統(tǒng)編制了預(yù)算。

EPI 處理器和加速器路線圖上出現(xiàn)了一些坎坷和延誤，但歐洲仍然致力于在當(dāng)前情況下盡可能實(shí)現(xiàn)百億億次系統(tǒng)所用計(jì)算引擎的本土化。

當(dāng)我們進(jìn)一步了解歐洲第二個百億億次級系統(tǒng)時(shí)，我們想到了這一點(diǎn)，該系統(tǒng)將被稱為“Alice Recoque”，并將在法國運(yùn)行，與此同時(shí)，我們也在思考 SiPearl 推遲推出其第一代“Rhea1”基于 Arm 的處理器，該處理器將設(shè)計(jì)為 EuroHPC 聯(lián)盟的主機(jī)處理器，該聯(lián)盟正在 EPI 努力下推動 CPU 和加速器的設(shè)計(jì)。

處理器交付延遲是芯片行業(yè)的常態(tài)，而非例外，盡管從外部來看可能并非如此。芯片設(shè)計(jì)者/銷售商（我們不愿使用“制造商”這個名詞，因?yàn)槿缃癯擞⑻貭栆酝猓麄兺ǔ２簧a(chǎn)芯片）內(nèi)置緩沖區(qū)，這就是他們堅(jiān)持相當(dāng)常規(guī)的路線圖的方式。設(shè)計(jì) Rhea 系列 CPU 的 SiPearl 芯片初創(chuàng)公司正在實(shí)時(shí)學(xué)習(xí)所有這些技能，這些 CPU 旨在用作歐洲百億億次級超級計(jì)算機(jī)的主處理器以及 HPC 領(lǐng)域常見的僅 CPU 工作負(fù)載的計(jì)算引擎。它在設(shè)計(jì)第一款芯片時(shí)已經(jīng)耗盡了大量緩沖區(qū)。這對于 EPI 工作和歐洲的百億億次級愿望來說都是不幸的，但歐洲在試圖培養(yǎng)本土芯片技術(shù)時(shí)有應(yīng)急計(jì)劃。

你必須在這里打一場長期的比賽，包括投資鑄造廠和封裝公司，以便他們在歐洲建立先進(jìn)的工廠，如果你想要能夠自力更生，正如歐洲肯定做的那樣。

SiPearl 是一家位于法國巴黎郊外的初創(chuàng)公司，其 Rhea1 CPU是“Jupiter”百億億次級超級計(jì)算機(jī)的核心，該超級計(jì)算機(jī)將于今年在德國于利希研究中心安裝。EuroHPC JV 尚未透露有關(guān)最終 Jupiter 配置的大量細(xì)節(jié)，但我們知道 Jupiter 系統(tǒng)中所謂的“GPU Booster”部分可能基于 Nvidia 的“Grace”CG100 Arm 服務(wù)器芯片和“Hopper”H100 GPU 加速器超級芯片。我們之所以說“可能”，是因?yàn)槲覀冋J(rèn)為，當(dāng) Jupiter 的 GPU Booster 模塊在今年晚些時(shí)候啟動時(shí)，很有可能基于 Nvidia 的“Blackwell”B100 GPU，與 H100 相比，其 FP64 性能提高了 2.3 倍，預(yù)計(jì)增量成本約為 1.6 倍。

在 6 月份的 500 強(qiáng)超級計(jì)算機(jī)排行榜上，我們一窺了 Jupiter 系統(tǒng)的大部分計(jì)算能力，當(dāng)時(shí) FZJ 展示了一個名為“Jedi”的原型系統(tǒng)，該系統(tǒng)由 Grace-Hopper 超級芯片組成，通過同樣來自 Nvidia 的四軌 200 Gb/秒 NDR InfiniBand 網(wǎng)絡(luò)連接。Jedi 是 Jupiter Exascale Development Instrument 的縮寫，它有 24 個 Grace-Hopper 超級芯片，在 FP64 性能上峰值為 5.1 petaflops，在高性能 LINPACK 基準(zhǔn)測試中峰值為 4.5 petaflops。重要的是，在 67.3 千瓦的功耗下，這架 Grace-Hopper 系統(tǒng)每瓦可提供 72.7 gigaflops，這使其成為各種 HPC 基準(zhǔn)測試中能效最高的機(jī)器。Blackwell GPU 可能會將 GPU Booster 的能效推得更高。

我們推測，為了挽回面子，并讓 Rhea1 經(jīng)受真正的壓力測試，EuroHPC 和 EPI 都希望 Jupiter 的通用集群（也稱為集群模塊）仍然基于 Rhea1 處理器，即使這款 CPU 的交付時(shí)間已經(jīng)推遲到 2025 年，盡管它基于 Arm 的 Neoverse“Zeus”V1 內(nèi)核。

但無論如何，由于 EPI 并未為 Jupiter 提供可以取代 Nvidia GPU 的 RISC-V 加速器（我們認(rèn)為它仍將嘗試這樣做），因此由于 GPU 助推器已切換到 Nvidia 超級芯片，因此將有大量 Arm 內(nèi)核可用于運(yùn)行僅使用 CPU 的應(yīng)用程序。

Jupiter 的絕大部分計(jì)算能力將集中在 GPU 加速節(jié)點(diǎn)上。通過在 GPU Booster 節(jié)點(diǎn)中使用 Nvidia 超級芯片，將有大量 Grace 處理器可用——準(zhǔn)確地說，每個 Hopper 或 Blackwell GPU 都有一個。要在 LINPACK 測試中輕松突破 1 exaflops 的性能，可能需要 32,000 個帶有 H100 的節(jié)點(diǎn)和 16,000 個帶有 B100 的節(jié)點(diǎn)，因此將需要 32,000 或 16,000 個 Grace CPU，每個 CPU 有 72 個內(nèi)核，總共 230 萬或 115 萬個內(nèi)核。我們認(rèn)為后者在 GPU 性能和能效方面是理想的，但很難說 EuroHPC 是否能讓 Nvidia 放棄 Blackwell GPU 來為 Jupiter 系統(tǒng)服務(wù)。如果 Nvidia 在 Jupiter 時(shí)間范圍內(nèi)只有 H100，那么 FZJ 將獲得兩倍的 Grace 核心，因?yàn)樗诘却?Rhea1 的交付和基于它的通用集群。

相比之下，F(xiàn)ZJ 的“Juwels”系統(tǒng)基于英特爾“Skylake”Xeon 8168 處理器，具有 114,840 個內(nèi)核，峰值聚合 FP64 性能為 9.9 petaflops。較新的“Juwels Booster”系統(tǒng)于 2020 年安裝，擁有 449,280 個 AMD Epyc 7402 處理器內(nèi)核，峰值額定速度略低于 71 petaflops。我們根據(jù)布里斯托大學(xué)安裝的 Isambard 3 系統(tǒng)中使用的 Grace-Grace 超級芯片的性能得出的猜測是，Jupiter 的 GPU Booster 中的 32,000 個 Grace CPU 本身將在 FP64 下提供約 225 petaflops 的性能。這是 FZJ 目前安裝的 Juwels 和 Juwels Booster 全 CPU 系統(tǒng)的全 CPU 性能的 2.8 倍。

Rhea1 對此添加的任何內(nèi)容都是漸進(jìn)的且好的，并且為 Rhea1 創(chuàng)建的軟件可以在 Grace 上運(yùn)行，反之亦然，因?yàn)樗鼈兌甲袷?Arm 標(biāo)準(zhǔn)。

正如我們之前在 2023 年 4 月報(bào)道的那樣，Rhea1 預(yù)計(jì)將擁有 72 個基于 Arm 的“Zeus”V1 內(nèi)核的內(nèi)核，并將于今年上市。在最近的一次延遲之后，SiPearl 現(xiàn)在表示，它將在 2025 年的某個時(shí)候提供最多 80 個內(nèi)核的 Rhea1。這意味著在恒定時(shí)鐘速度下吞吐量將提高 11%，這有助于稍微緩解延遲問題。

我們認(rèn)為最初的計(jì)劃是使用臺灣半導(dǎo)體制造公司的 7 納米工藝來生產(chǎn) 72 個內(nèi)核，而在此過程中，SiPearl 轉(zhuǎn)向了臺積電的 7 納米工藝的 N6 改進(jìn)版，并能夠在設(shè)計(jì)中添加另外 8 個活動內(nèi)核。（84 個內(nèi)核更容易添加，因?yàn)樽畛醯脑O(shè)計(jì)似乎是每列 12 個內(nèi)核，而為了實(shí)現(xiàn)良率可能會損失 4 個內(nèi)核。）

Rhea1 芯片混合了 DDR5 主內(nèi)存和 HBM2e 堆疊內(nèi)存，據(jù)我們所知，混合內(nèi)存子系統(tǒng)是導(dǎo)致該處理器延遲的原因。我們在 2020 年看到的規(guī)格顯示它有四個 DDR5 內(nèi)存控制器，但現(xiàn)在我們看到它也有四個 HBM2e 內(nèi)存堆棧，來自三星。該芯片的 I/O 控制器預(yù)計(jì)還將有 104 條 PCI-Express 5.0 通道。

還有一件事需要考慮：Nvidia在 Grace CPU 中使用了“Demeter”V2 內(nèi)核，這一點(diǎn)很重要。亞馬遜網(wǎng)絡(luò)服務(wù) (Amazon Web Services ) 即將推出的“Graviton4”自主研發(fā)處理器也使用了這些V2 內(nèi)核。Rhea1 中使用的 Zeus 內(nèi)核中的 V1 內(nèi)核有一對 256 位 SVE2 矢量引擎，但 V2 內(nèi)核有四個 128 位矢量，在某些類型的處理中效率更高。

無論如何，按照某種思維方式，32,000 個 Grace-Hopper 超級芯片在 LINPACK 上達(dá)到每秒百億億次浮點(diǎn)運(yùn)算的峰值 FP64 性能要比在 FZJ 上達(dá)到 16,000 個 Grace-Blackwells 更好，因?yàn)檫@樣可以獲得兩倍的 CPU 數(shù)量。

這將帶我們走進(jìn)將安裝在 GENCI 的 Alice Recoque 系統(tǒng)，該系統(tǒng)由 CEA（法國相當(dāng)于美國能源部）運(yùn)營，并由法國和荷蘭政府以及 EuroHPC JV 集體出資。

Rhea2 芯片預(yù)計(jì)將由兩個芯片組成，根據(jù)上述路線圖，從今年早些時(shí)候開始，它預(yù)計(jì)將于 2025 年完成，使用 Rhea2 的百億億次級系統(tǒng)（復(fù)數(shù)）將于 2026 年在歐洲安裝。我們猜測兩個芯片至少各有 64 個內(nèi)核，性能將提高 1.6 倍。Rhea2 可能會嘗試將內(nèi)核數(shù)量推至 192 個，每個芯片有 96 個內(nèi)核。這將是 Rhea1 內(nèi)核數(shù)量的 2.4 倍，但我們認(rèn)為時(shí)鐘速度必須略有降低，因此最終性能可能只有 2 倍。

如果 SiPearl 想要避免 Rhea2 芯片的麻煩，我們強(qiáng)烈建議該公司與 Arm 合作，使用“Poseidon”V3 核心及其“Voyager”計(jì)算子系統(tǒng) (CSS) V3 包。這將有助于所有芯片設(shè)計(jì)人員簡化流程并加快開發(fā)速度。因?yàn)闆]有時(shí)間嘗試從頭開始做所有事情，以滿足 Rhea2 和 Alice Recoque 系統(tǒng)進(jìn)入 GENCI 并由 CEA 運(yùn)行的 2026 年最后期限。

Arm 早在 2023 年 8 月就啟動了 CSS 計(jì)劃，并展示了如何采用 CSS 堆棧（包括內(nèi)核、網(wǎng)格互連、I/O 控制器等）來節(jié)省 80 個工程師年的工作量。由于只有 190 名員工，并且只有兩年時(shí)間推出 Rhea2，即 380 個工程師年，SiPearl 似乎是 Voyager CSS V3 套件的理想候選者。

在上表中，Jupiter 機(jī)器有 32,000 個 Grace-Hopper 節(jié)點(diǎn)。在其他機(jī)器中，當(dāng)有 GPU 時(shí)，CPU 基本上被忽略，但出于上述原因，我們認(rèn)為 Jupiter 不會出現(xiàn)這種情況。有傳言稱 Rhea1 集群將只有 1,300 個節(jié)點(diǎn)。這性能不是很好。

我們認(rèn)為 EuroHPC JV 確實(shí)希望在 Alice Recoque 系統(tǒng)的所有節(jié)點(diǎn)中都使用 Rhea2，并且希望在系統(tǒng)中基于 RISC-V 架構(gòu)加速“Hurricane”EPAC。我們認(rèn)為每個 Rhea2 CPU 上都會連接大量此類 EPAC 協(xié)處理器，我們還認(rèn)為它們將以四比一的 CPU 和加速器比例配置。我們不知道 Hurricane 設(shè)備的性能如何或效率如何，因此我們無法估計(jì)需要多少設(shè)備才能突破 LINPACK 上的 1 exaflops 障礙。

如果這一切都失敗了，那么 EuroHPC JV 可以資助一個基于 Nvidia 電機(jī)的系統(tǒng)，使用未來的“Vera”Arm 服務(wù)器 CPU 和“Rubin”GPU 加速器，然后就完事了。

我們還認(rèn)為，Alice Recoque 不由法國系統(tǒng)制造商和 IT 服務(wù)供應(yīng)商 Atos 的超級計(jì)算子公司 Eviden 打造是不可想象的。

Alice Recoque 系統(tǒng)的預(yù)算為 5.42 億歐元（5.802 億美元），其中 2.71 億歐元（2.911 億美元）來自 EuroHPC JV，2.63 億歐元（2.815 億美元）來自法國政府，800 萬歐元（860 萬美元）來自荷蘭政府。

順便說一句，歐洲第二臺百億億次級計(jì)算機(jī)系統(tǒng)的名字來源于愛麗絲·阿爾諾·雷科克，她于 1929 年出生于阿爾及利亞，并于 1954 年在巴黎高等電子與電氣工程學(xué)院（相當(dāng)于法國的麻省理工學(xué)院）獲得工程學(xué)研究生學(xué)位。畢業(yè)后，她在 Société d'Electronique et d'Automatisme (SAE) 工作，幫助設(shè)計(jì)了多代小型計(jì)算機(jī)，特別是 Mitra 系列，該系列是為了與 Digital Equipment Corp 的 PDP 和 VAX 系列競爭而創(chuàng)建的。1985 年，她轉(zhuǎn)投 Bull Group，從事并行超級計(jì)算機(jī)和人工智能方面的工作，同時(shí)還擔(dān)任多所法國著名大學(xué)的計(jì)算機(jī)科學(xué)教授。

本文地址：http://www.54549.cn/thread-861877-1-1.html 【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)；文章版權(quán)歸原作者及原出處所有，如涉及作品內(nèi)容、版權(quán)和其它問題，我們將根據(jù)著作權(quán)人的要求，第一時(shí)間更正或刪除。

網(wǎng)友評論

貿(mào)澤電子有獎問答視頻，答對領(lǐng)10元微信紅包

廠商推薦

快速回復(fù) 返回頂部 返回列表

色偷偷偷久久伊人大杳蕉,色爽交视频免费观看,欧美扒开腿做爽爽爽a片,欧美孕交alscan巨交xxx,日日碰狠狠躁久久躁蜜桃

歐洲最強(qiáng)芯片，碰壁！

網(wǎng)友評論

廠商推薦

歐洲最強(qiáng)芯片，碰壁！