英偉達“三相之力”,加速構建AI帝國
顯卡無疑已經是當下IT圈子最熱門的話題,但對于NVIDIA而言,關于圖形、視覺乃至大規(guī)模并行運算的征程,已經開啟了新的起點。NVIDIA在不久前舉行的GTC大會上連發(fā)三款基于Arm IP打造的處理器,包括全球首款專為TB級加速計算而設計的CPU NVIDIA Grace、全新BlueField-3 DPU,以及業(yè)界首款1000TOPS算力的自動駕駛汽車SoC等?!叭愋酒?逐年飛躍,一個架構。”N
2021-05-21 09:48:43
來源:中國電子報、電子信息產業(yè)網 李秧??

顯卡無疑已經是當下IT圈子最熱門的話題,但對于NVIDIA而言,關于圖形、視覺乃至大規(guī)模并行運算的征程,已經開啟了新的起點。NVIDIA在不久前舉行的GTC大會上連發(fā)三款基于Arm IP打造的處理器,包括全球首款專為TB級加速計算而設計的CPU NVIDIA Grace、全新BlueField-3 DPU,以及業(yè)界首款1000TOPS算力的自動駕駛汽車SoC等。

“三類芯片,逐年飛躍,一個架構?!盢VIDIA數(shù)據(jù)中心路線圖中包括CPU、GPU和DPU這三類芯片,集齊“未來計算的三大支柱”,這也標志著NVIDIA異構計算布局趨于完善,成為全棧計算平臺。

專用AI計算CPU:NVIDIA GRACE

NVIDIA發(fā)布的首款中央處理器Grace成為本次GTC的焦點,其面向超大型AI模型的和高性能計算。基于Grace的系統(tǒng)與NVIDIA GPU緊密結合,性能將比目前最先進的NVIDIA DGX系統(tǒng)(在x86 CPU上運行)高出10倍。

GRACE的重大創(chuàng)新包括:內置下一代Arm Neoverse內核,單CPU在SPECrate2017_int_base基準測試超300分;采用第四代NVIDIA NVLink,從CPU到GPU連接速度超過900GB/s,達到相當于目前服務器14倍的帶寬,從CPU到CPU的速度超過600GB/s;擁有最高的內存帶寬,采用的新內存LPDDR5x技術,帶寬是LPDDR4的兩倍,能提供更多算力。

數(shù)據(jù)中心處理器DPU:NVIDIA BlueField-3

為了獲得更好的數(shù)據(jù)中心軟件定義網絡、存儲、網絡安全加速,NVIDIA還推出了首款為AI加速度BlueField-3 DPU。DPU針對多用戶、云原生環(huán)境優(yōu)化,提供數(shù)據(jù)中心軟件定義和硬件加速的網絡、存儲、安全、管理內容。

NVIDIA BlueField-3 DPU包含220億個晶體管,采用16個Arm A78 CPU核心、18M IOPs彈性塊存儲,加密速度是上一代的4倍,并完全向下兼容BlueField-2。該產品預計將于2022年第一季度發(fā)布樣品。

BlueField-3 DPU的重大創(chuàng)新包括:是首款支持第五代PCIe總線并提供數(shù)據(jù)中心時間同步加速的DPU;BlueField-3能夠卸載相當于300個CPU核的工作負載,以400Gbps的速率對網絡流量進行保護、卸載和加速;通過全新發(fā)布的NVIDIA DOCA(集數(shù)據(jù)中心于芯片的架構)軟件開發(fā)包為開發(fā)者提供一個完整、開放的軟件平臺,開發(fā)在BlueField DPU上開發(fā)軟件定義和硬件加速的網絡、存儲、安全和管理等應用。

GPU賦能推動ARM生態(tài)

NVIDIA Ampere架構GPUA100于2020 GTC發(fā)布,今年大會則主要發(fā)布基于新架構GPU的產品,并致力于借助GPU賦能推動ARM生態(tài)。

NVIDIA升級并打造了“便攜式AI數(shù)據(jù)中心”——NVIDIA DGX Station,以及NVIDIA專為密集型AI研發(fā)打造的AI數(shù)據(jù)中心產品——NVIDIA DGX SuperPOD。NVIDIA DGX Station 320G連接4個NVIDIA A100 GPU并達8TB/s的帶寬,性價比獲得很大提升;NVIDIA DGX SuperPOD目前是世界上首臺原生超級計算機,使用全新80GB NVIDIA A100,將其HBM2e 內存提升至90TB,實現(xiàn)2.2EB/s的總帶寬。

NVIDIA發(fā)布了用于訓練Transformers的超大語言模型的NVIDIA Megatron Triton推理服務器。Transformers已幫助開發(fā)者在自然語言處理領域取得了突破性進展,能夠生成文檔摘要、將電子郵件中的短語補充完整、甚至讓AI根據(jù)用戶的期望自己編寫代碼。通過分布式計算,原本雙CPU服務器1分鐘只能響應1項查詢,使用Megatron Triton的DGX能在1秒內實現(xiàn)16項查詢。

NVIDIA還發(fā)布了新一代AI自動駕駛汽車處理器DRIVE Atlan,算力將達到1000TOPS,約是上一代Orin處理器的4倍,超過了大多數(shù)L5無人駕駛出租車的總計算能力。采用下一代GPU的體系結構、新型Arm CPU內核、新深度學習和計算機視覺加速器,內置為先進的網絡、存儲和安全服務的BlueField DPU,網絡速度可達400Gbps。

此外,NVIDIA還與亞馬遜云科學(AWS)、Marvell、聯(lián)發(fā)科、富士通等加強了合作,推動云服務、科學及AI應用開發(fā)、打造GPU驅動的新型PC,共同致力于擴展Arm生態(tài)系統(tǒng)。

目標構建AI帝國

NVIDIA基于GPU、CPU、DPU“三項之力”的硬件基礎,還在持續(xù)打造介于硬件和軟件之間的底層技術、計算機工具乃至實用的應用框架。

針對專業(yè)領域的云原生平臺NVIDIA Omniverse平臺能夠在虛擬世界中匯聚全球各地的工程師、科學家,在多個GPU的共同協(xié)助下實現(xiàn)高物理精度,并充分運用RTX實時光線追蹤、DLSS技術,利用NVIDIA MDL模擬材料、NVIDIA PhysX模擬物理,NVIDIA AI完成人工智能推算的線上平臺。擁有了更強的普適性,已適用于建筑、娛樂、游戲、廣告等行業(yè)。

先進的對話式AI平臺NVIDIA Jarvis可達到90%的識別精度,并支持5種語言:英語、日語、西班牙語、德語、法語和俄語,未來將會有更多語言加入其中,這使得國際會議將會變得更輕松;可糾正目光接觸的會議軟件NVIDIA Maxine會自動糾正視頻會議中與會人的注視位置;NVIDIA自動駕駛汽車計算系統(tǒng)級芯片NVIDIA DRIVE Orin將與2022年投產,可處理集群、信息娛樂、乘客交互AI及非常重要的信息視圖或感知世界模型,將實際感知構建成一個3D環(huán)繞模型。

NVIDIA已經創(chuàng)建了Tensor Core GPU、NVLINK、DGX、cuDNN、RAPIDS、NCCL、GPU Dirext、DOCA等眾多技術,所有的這些底層技術,統(tǒng)稱為NVIDIA AI。NVIDIA AI已集成到所有業(yè)內流行的工具和工作流程中,并且可在搭載NVIDIA GPU的任何系統(tǒng)上運行,包括PC、筆記本電腦、工作站、超級計算機、云平臺等?,F(xiàn)在缺少的是5G技術的連接,日常所使用的消費級5G技術只是錦上添花,而未來專用5G技術將為AI技術帶來革命性的變化。

注:作者為賽迪顧問集成電路產業(yè)研究中心高級分析師

最新文章
1
Vidda三色激光投影618開門紅戰(zhàn)報:C3 Ultra/Pro包攬高端投影銷冠
2
云米發(fā)布昆侖4礦泉凈水器,讓家庭飲水進入礦泉時代
3
女廚神開啟涅槃路,快手星芒短劇《廚神小福星》詮釋美食真諦
4
磁力聚星釋放達人營銷勢能,激活大促生意新增量
5
雙女主攜手復仇,快手星芒短劇《少女的審判》見證璀璨新生
6
快手磁力引擎“出游裝備節(jié)”引爆五一出行消費,超2.4億曝光助力商家生意增長
7
百商聚首·萬品齊放:第36屆慧聰家電交易會電商新渠道選品會邀您鏈通全渠道
8
移動愛家推出“515移動愛家日”活動,詮釋千萬家的愛家智慧
9
蘋果正在開發(fā)新的“HomePad”,具備以下五個功能
10
雷軍最新發(fā)聲:小米自研手機系統(tǒng)級芯片即將發(fā)布
11
壁掛爐市場降幅收窄,存量爭奪戰(zhàn)將去向何方?
12
電視行業(yè)大尺寸化的趨勢下,智能投影將迎來發(fā)展機遇
13
“以舊換新”首次深度綁定618,家電行業(yè)熱增長與冷思考
14
創(chuàng)維A6F Pro解決了影音發(fā)燒友哪些痛點?
15
小米Civi 5 Pro內部代號小15 盧偉冰:全面對標iPhone
16
雷軍最新內部演講全文曝光:小米要成為同檔最安全的車 要做行業(yè)的領導者
17
榮耀400系列代言人官宣:就是肖戰(zhàn)
18
出貨量從“國內第一”到“跌出前五”,榮耀手機亟待“重生”
19
中國移動“三大回饋計劃”暨515移動愛家日重磅發(fā)布
20
磁力方舟推出618全周期投放指南,智算精投,高效撬動大促新增量
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512