AMD董事長兼CEO蘇姿豐在美國當?shù)貢r間10月10日于舊金山舉行的Advancing AI活動上帶來了一整套AI“殺手锏”,給整個業(yè)界帶來了全新的AI震撼。
蘇姿豐展示最新發(fā)布的MI325X GPU
其中,最大的驚喜正是AMD最新發(fā)布的旗艦AI芯片-AMD Instinct MI325X GPU(以下簡稱:MI325X),蘇媽也是再次信心滿滿地掏出了與老對手英偉達當下熱銷產(chǎn)品H200的對比圖,她表示,MI325X的內(nèi)存容量是H200的1.8倍,內(nèi)存帶寬、FP16和FP8峰值理論算力都達到了H200的1.3倍。
此外,蘇媽還發(fā)布了第五代EPYC服務器CPU,并稱其為“面向云計算、企業(yè)級和AI的全球最好CPU”,與老對手英特爾的第五代至強鉑金8592+處理器相比,這款CPU的HPC(高性能計算)性能提高多達3.9倍,基于CPU的AI加速提高多達3.8倍。蘇媽此次可謂是將滿滿的壓力給到了英偉達和英特爾。
HBM3e內(nèi)存容量是GPU提升的關鍵?
當前,英偉達毫無疑問是數(shù)據(jù)中心GPU領域的霸主,TechInsights公布的數(shù)據(jù)顯示,2023年全球數(shù)據(jù)中心GPU總出貨量達到了385萬顆,其中,英偉達以98%的市場份額穩(wěn)居第一,AMD雖位居第二,卻仍是相差十分懸殊。但熟悉蘇媽的人都知道,她蘇媽受命于AMD危難之際,最不怕的就是打硬仗,此次帶來的MI325X就是為了“硬剛”英偉達的H200而來。
據(jù)了解,MI325X采用了與上一代MI300X相同的CDNA 3架構,最大的提升就是首次采用了業(yè)界目前最先進的HBM3e,總?cè)萘窟_256GB,基于16-Hi堆棧制程,內(nèi)存帶寬高達6TB/s,單顆芯片總共擁有1530億個晶體管。
MI325X GPU的各項參數(shù)
專家告訴記者,HBM內(nèi)存提高,對于GPU來說,能夠帶來數(shù)據(jù)傳輸速度的提升、數(shù)據(jù)處理能力的增強、能效比的提高、空間與延遲的節(jié)省、對更復雜應用場景的支持以及系統(tǒng)穩(wěn)定性與可靠性的提升等多方面的好處。因此,MI325X的FP8性能達到了2.6PFLOP,F(xiàn)P16性能也達到了1.3PFLOP。
橫向?qū)Ρ?,英偉達H200采用的HBM3e容量為141GB,帶寬為4.8TB/sz,總晶體管數(shù)量約為800億個,相比于MI325X肯定是不夠看了,哪怕是英偉達最新推出的B200,采用的HBM3e內(nèi)存容量也僅為192GB,與MI325X的256GB HBM3e內(nèi)存容量仍存在差距。
雖然,兩家對于GPU的設計各有不同,HBM3e內(nèi)存容量也并不是評判GPU性能的唯一標準,但對產(chǎn)品性能的上限有明顯提升,這也是AMD直面英偉達的底氣。蘇媽很自豪地在發(fā)布會上強調(diào):“MI325服務器平臺在運行Llama 3.1時,能提供比英偉達H200 HGX高出多達40%的性能?!?/p>
根據(jù)AMD官方信息,MI325X加速器目前有望在2024年第四季度投入生產(chǎn),預計從2025年第一季度開始發(fā)貨。
AMD最新的GPU技術路線圖
此外,根據(jù)當前“一年一迭代”的節(jié)奏,AMD此次更新了其AI芯片的路線圖,預計下一代MI350系列將在明年上市,將采用3nm制程,并把HBM3E內(nèi)存再提升至288GB,新一代CDNA 4架構也將安排上,使得其推理性能比基于CDNA 3架構的加速器提高了35倍,該系列AMD計劃在2025年下半年上市。
其中,MI350系列的代表產(chǎn)品MI355X是AMD專門用來應對英偉達在三月剛剛發(fā)布的Blackwell B200的。據(jù)了解,MI355X的FP8和FP16性能相比MI325X提升了80%,F(xiàn)P16峰值性能達到2.3PFLOPS,F(xiàn)P8峰值性能達到4.6PFLOPS,F(xiàn)P6和FP4峰值性能達到9.2PFLOPS。
最新CPU性能已經(jīng)趕超英特爾?
CPU業(yè)務對于AMD來說是涅槃重生的開始,在2018年,其EPYC服務器的市占率僅為2%,經(jīng)過四代的升級,終于在2024年第一季度達到了34%,從英特爾手里搶走了近30%的CPU服務器市場份額,也成了AMD的主要營收來源。
EPYC服務器CPU的市場占比
蘇媽在發(fā)布今年第二季度財報時就表示:“我們在第二季度實現(xiàn)了強勁的營業(yè)額與收入增長,這得益于數(shù)據(jù)中心事業(yè)部創(chuàng)紀錄的營業(yè)額。我們的AI業(yè)務繼續(xù)加速攀升,在Instinct系列、,EPYC和Ryzen處理器的市場需求帶動下,AMD為下半年營業(yè)額的強勁增長已做好了充分準備?!?/p>
所以,AMD此次的另一大殺手锏就是其第五代EPYC服務器CPU,代號“Turin”。
第五代EPYC服務器CPU的各項參數(shù)
據(jù)介紹,Turin擁有1500億顆晶體管,采用臺積電3/4nm制程、全新“Zen 5”及“Zen 5c”核心兼容廣泛部署的SP5平臺,最多支持192核、384個線程。當前,英特爾能效核版至強6雖然能在未來通過雙芯封裝做到288核心,但無法支持超線程技術,只有288個線程。因此,在核心數(shù)和線程數(shù)上,AMD已經(jīng)趕超了英特爾。
在技術全面升級的情況下,Turin的性能得到了明顯提升。AMD表示,相比于上一代的英特爾Xeon服務器,Turin在SPEC CPU測試中性能提升2.7倍,企業(yè)級性能最高提升4.0倍,HPC(高性能計算)性能最高提升3.9倍。
蘇媽打了很形象的比方,她表示,如果用Turin服務器替代上一代的至強服務器,只需131臺服務器就能達到原來1000臺的性能水平,節(jié)省87%的占地空間。同時,功耗可以節(jié)省最多68%。
AMD還優(yōu)化了Turin在AI工作流程中的關鍵動作,包括數(shù)據(jù)預處理、內(nèi)存復制、內(nèi)核啟動和任務協(xié)調(diào)等。這些優(yōu)化使得CPU在處理GPU協(xié)調(diào)任務時更高效,比前代產(chǎn)品快28%。
除了GPU和CPU,蘇媽此次還帶了最新的DPU、AI網(wǎng)卡以及ROCm 6.2生態(tài)系統(tǒng),湊齊了一整套“AI全家桶”,給“雙英”帶來了十足的壓力。但當天的AMD股價并沒有買賬,反而以大跌收場,日內(nèi)跌幅一度擴大到約5.3%,最終收跌4%,創(chuàng)9月3日以來最大盤中和收盤跌幅??梢?,AMD的新品雖然來勢兇猛,可只有真正量產(chǎn),經(jīng)過客戶檢驗,才能贏得市場的認可。
責任編輯:許子皓
- QQ:61149512