亞馬遜云科技發(fā)布72卡Blackwell GPU實例 算力飆升20倍
在生成式AI技術快速發(fā)展的背景下,云計算巨頭亞馬遜云科技近日宣布推出基于NVIDIA Grace Blackwell Superchips的全新Amazon EC2 P6e-GB200 UltraServer實例,這是該公司迄今為止最強大的GPU產品。該實例專為訓練和部署最大規(guī)模、最復雜的AI模型而設計,標志著云計算AI基礎設施進入新紀元。
技術規(guī)格突破
P6e-GB200 UltraServer搭載了72個NVIDIA Blackwell GPU,通過第五代NVIDIA NVLink互連形成一個單一計算單元。這一配置提供了驚人的360 petaflops FP8算力,以及13.4TB的高帶寬顯存(HBM3e)。與上一代P5en實例相比,計算能力提升超過20倍,內存容量提升超過11倍。此外,該實例還支持高達28.8 Tbps的第四代Elastic Fabric Adapter(EFAv4)網絡帶寬,為大規(guī)模AI工作負載提供了充足的網絡吞吐能力。
性能對比
亞馬遜云科技今年早些時候已推出基于NVIDIA Blackwell GPU的Amazon EC2 P6-B200實例,每個實例配備8個NVLink互連的Blackwell GPU。相比之下,P6e-GB200 UltraServer在單NVLink域內的計算能力是P6-B200實例的9倍,顯存容量是其9.57倍。這種性能飛躍使得訓練像GPT-4這樣的大型語言模型的時間可以大幅縮短。
多樣化部署方案
亞馬遜云科技提供了多種部署路徑來簡化新實例的使用流程??蛻艨梢酝ㄟ^Amazon SageMaker HyperPod使用這些新實例,該服務將優(yōu)化工作負載以保持在同一個NVLink域內運行,確保性能最大化。同時,亞馬遜還構建了一套完整的多層級恢復機制,可以自動替換故障節(jié)點,并提供全面的監(jiān)控儀表板。
與NVIDIA深度合作
值得注意的是,P6e-GB200 UltraServer也將通過NVIDIA DGX Cloud平臺提供。這個統(tǒng)一的AI平臺集成了英偉達完整的AI軟件棧,客戶可以獲得最新的性能優(yōu)化方案和技術支持。這種合作模式為需要專業(yè)AI支持的企業(yè)提供了更多選擇。
市場影響
這一發(fā)布正值AI行業(yè)對算力需求激增之際。隨著大模型參數量持續(xù)增長,訓練成本已成為制約AI發(fā)展的重要因素。亞馬遜云科技此次推出的高性能實例,不僅為研究機構和科技公司提供了更強大的計算資源,還可能加速新一代AI技術的研發(fā)進程。
未來展望
亞馬遜云科技表示,這些新實例將首先面向特定客戶開放,隨后逐步擴大可用范圍。隨著Blackwell架構GPU的普及,我們可以預期生成式AI模型的訓練和推理效率將得到顯著提升,這可能為AI應用開辟新的可能性。
這一重大技術升級展示了云計算廠商在AI基礎設施領域的持續(xù)創(chuàng)新,也預示著未來AI研發(fā)將獲得更強大的計算支持。隨著硬件性能的不斷提升,AI模型的規(guī)模和能力邊界有望進一步擴展。
- 零跑C11推激光雷達版 14.98萬起售 自研AR-HUD成亮點
- 稀土短缺沖擊 日產Leaf被迫減產
- AI推薦信息存疑 專家警告用戶需謹慎核實
- 寶馬全球銷量微增0.4% 歐洲回暖難掩中國頹勢
- 小米汽車30萬輛交付破紀錄:15個月跑贏新勢力賽道
- 馬斯克xAI發(fā)布Grok 4 自稱性能最強引熱議 xAI推出Grok 4 馬斯克再掀AI模型之爭 Grok 4問世 馬斯克宣稱AI性能全球第一 xAI發(fā)布Grok 4 馬斯克挑戰(zhàn)AI性能極限 馬斯克Grok 4亮相 自稱超越現有AI模型
- 小米自研5G基帶獲關鍵突破 芯片自主化再進一步
- 羅馬仕充電寶內幕:利潤至上,安全靠邊站
- 特斯拉Semi貨運測試終完成 六年跳票后能否兌現承諾
- 蘋果AI落后股價大跌 庫克領導力遭質疑
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。