2023年,來自千行百業(yè)的企業(yè)關注生成式AI、尋找應用場景;2024年,他們中的領先者實踐生成式AI、進行場景實驗;2025年,那些繼續(xù)保持領先的企業(yè),將轉向生產階段,走向生成式AI應用的“深水區(qū)”,尋求商業(yè)價值回報。誰來為這些企業(yè)護航,又怎么護航?
能力越大,責任越大,為全球百萬客戶提供安全可靠云服務、連續(xù)13年被Gartner評為“全球云計算領導者”的亞馬遜云科技,先承擔了這份“護航”的重任。在2024 re:Invent全球大會上,亞馬遜云科技推出一系列技術發(fā)布,以覆蓋基礎設施、模型和應用的全棧聯(lián)動創(chuàng)新助力企業(yè)應用生成式AI,全面重塑客戶云上創(chuàng)新體驗。
在亞馬遜云科技2024 re:Invent中國行北京站,亞馬遜云科技大中華區(qū)產品部總經(jīng)理陳曉建表示:“今年re:Invent全球大會的一系列重磅發(fā)布,我們不僅在云的核心服務層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應用的每一個技術堆棧取得突破,讓不同層級的創(chuàng)新相互賦能、協(xié)同進化。只有這樣全棧聯(lián)動的大規(guī)模創(chuàng)新才能真正滿足當今客戶的發(fā)展需求,加速前沿技術的價值釋放,助力各行各業(yè)重塑未來?!?/p>
(亞馬遜云科技大中華區(qū)產品部總經(jīng)理陳曉建,圖源:亞馬遜云科技)
三大領域技術矩陣,直面未來復雜需求
“2024年我們看到許多客戶從思考階段進入實踐階段,進行了大量場景試驗。但是我覺得2025年肯定會發(fā)生一個變化,很多客戶將從原型驗證階段轉化為生產階段,這是必經(jīng)之路。屆時客戶需求將更加復雜,不僅是選擇模型,還需要各種技術支持?!标悤越ū硎?。
實踐層面,亞馬遜云科技在2024 re:Invent全球大會上的一系列技術發(fā)布,聚集生成式AI、數(shù)據(jù)戰(zhàn)略和云服務三大領域。
整體來看,這些新發(fā)布更加側重于產品的實際應用和工具優(yōu)化,這是對全球用戶積極使用亞馬遜云科技進行生成式AI應用探索和創(chuàng)新的全新反饋。
沙利文大中華區(qū)總監(jiān)李慶表示:“本次更新有兩個方面讓我印象深刻:一是隨著全球企業(yè)對生成式AI的深入應用,數(shù)據(jù)不僅實現(xiàn)跨區(qū)域的傳輸與協(xié)同,更實現(xiàn)跨地域、跨區(qū)域的深度連接;二是亞馬遜云科技進一步優(yōu)化生成式AI的應用,從數(shù)據(jù)存儲、治理到管理的全流程提升,旨在簡化AI對數(shù)據(jù)的使用,同時強化模型功能、增加AI agent管理和應對模型幻覺的功能?!?/p>
技術“高能”的同時,在當天的溝通環(huán)節(jié),陳曉建和亞馬遜云科技大中華區(qū)數(shù)據(jù)分析與生成式AI的產品總監(jiān)崔瑋,還多次提到了獲得的“成本”與使用的“便捷”,這些在具體的創(chuàng)新中都有體現(xiàn)。
生成式AI:基礎設施、模型、應用的全進化
具體而言,在生成式AI領域,亞馬遜云科技全面強化基礎設施、模型和應用三層技術棧能力,幫助企業(yè)更輕松、更經(jīng)濟地將生成式AI應用于實際業(yè)務場景。
基礎設施方面,突出能力。推出Amazon SageMaker AI的四項創(chuàng)新,包括新訓練配方、靈活訓練計劃和任務治理功能,以及在Amazon SageMaker中使用亞馬遜云科技合作伙伴的熱門AI應用。幫助客戶更快構建、訓練、部署流行模型,節(jié)省數(shù)周時間并將成本降低最高40%。
模型方面,豐富選擇。一方面推出Amazon Nova基礎模型矩陣,突出的是對基礎模型成本的大幅降低。包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基礎模型,以及用于生成高質量圖像的Nova Canvas和生成高質量視頻的Nova Reel。在各自智能類別中,Amazon Nova Micro、Lite和Pro應用成本比Amazon Bedrock中表現(xiàn)最佳的模型至少降低75%,同時也是其中對應類別速度最快的模型。
另一方面,Amazon Bedrock平臺能力全面升級。新接入100多款熱門、新興及專業(yè)模型,并推出AI防護、多智能體協(xié)作和模型蒸餾等重磅更新,全面優(yōu)化推理場景的準確性、成本和響應速度。
應用方面,延伸場景。Amazon Q更加深入軟件開發(fā)和商業(yè)應用場景,Amazon Q Developer增加三款新的智能體,能自動執(zhí)行單元測試、文檔編制和代碼審查流程,并通過與GitLab深度集成,擴展應用場景;推出轉型功能以加速Windows.NET、VMware和大型機工作負載的遷移和現(xiàn)代化,縮短轉型時間并降低成本。強化了Amazon Q Business和Amazon Q in QuickSight洞察能力,并簡化了復雜工作流程的自動化實現(xiàn)方式。
數(shù)據(jù)戰(zhàn)略:體驗升級,統(tǒng)一平臺釋放數(shù)據(jù)價值
數(shù)據(jù)戰(zhàn)略領域,亞馬遜云科技推出新一代Amazon SageMaker,能夠為客戶提供單一的數(shù)據(jù)和AI開發(fā)環(huán)境,用戶可以在其中查找和訪問其組織中的所有數(shù)據(jù),為各種常見的數(shù)據(jù)用例選擇最佳工具,并將數(shù)據(jù)和AI項目擴展至團隊內不同分工角色以實現(xiàn)協(xié)作。
Amazon SageMaker Lakehouse,能夠實現(xiàn)數(shù)據(jù)湖、數(shù)據(jù)倉庫、運營數(shù)據(jù)庫和企業(yè)應用程序中數(shù)據(jù)的統(tǒng)一管理,支持客戶使用熟悉的AI和機器學習工具或Apache Iceberg兼容的查詢引擎進行訪問和處理。
云服務:全棧聯(lián)動創(chuàng)新,提供更強大底層支持
云服務領域,亞馬遜云科技在計算、網(wǎng)絡、存儲和數(shù)據(jù)庫等核心領域持續(xù)創(chuàng)新,為各類工作負載提供更強大的底層支持。
計算部分,繼續(xù)憑借自研芯片引領算力創(chuàng)新?;贏mazon Trainium2的EC2 Trn2實例正式可用,較當前GPU實例性價比提升30-40%;推出配備64個Trainium2芯片的EC2 Trn2 UltraServers服務器,提供高達83.2 Petaflops浮點算力,計算能力是單一實例的四倍。在大規(guī)模訓練方面,Project Rainier集群搭載數(shù)十萬個Trainium2芯片,算力超越以往集群5倍以上。采用3納米工藝的下一代Trainium3芯片預計將在2025年末上線,預計將使集群性能提升4倍,并在性能、能效和密度上樹立新標桿。
網(wǎng)絡部分,升級基礎設施。推出第二代UltraCluster網(wǎng)絡架構,支持超過20000個GPU協(xié)同工作,帶寬達10Pb/s,延遲低于10ms,將模型訓練時間縮短至少15%。
存儲部分,增強數(shù)據(jù)處理能力。Amazon S3新增Metadata元數(shù)據(jù)功能實現(xiàn)自動獲取和實時更新;推出專為Iceberg表優(yōu)化的S3 Tables存儲類型,將查詢性能提升3倍,事務處理能力提升10倍。
數(shù)據(jù)庫部分,全新的無服務器分布式SQL數(shù)據(jù)庫Amazon Aurora DSQL,采用active-active架構并具備自動故障恢復功能,支持應用程序在任意端點進行讀寫。它不僅提供99.999%的多區(qū)域可用性,還能實現(xiàn)近乎無限的可擴展性,且無需進行數(shù)據(jù)庫分片或實例升級。Amazon DynamoDB global tables增加了多區(qū)域強一致性支持,進一步增強了其分布式數(shù)據(jù)庫服務能力。
解決“幻覺”,讓企業(yè)無憂推進生成式AI生產應用
除了以上內容,更好地應對模型“幻覺”,更多企業(yè)才能沒有顧慮地推進生成式AI的生產應用,因為在眾多的真實場景中,容不得紕漏,生成的內容一旦與現(xiàn)實世界事實或用戶輸入不一致,可能造成難以挽回的損失,像是金融、醫(yī)療、法律領域尤其如此。
解決“幻覺”,才能讓企業(yè)有信心將生成式AI從原型驗證推向生產應用,也是充分釋放性能的前提。亞馬遜云科技探索了多種不同的技術方案發(fā)現(xiàn)自動推理技術(Automatic Reasoning)能夠很有效的解決“幻覺”問題,提升內容生成的安全性與準確定。
例如,可以通過自動推理來證明說在整個Amazon IAM之中設計的權限和策略是不是按照所預想的方式進行的,從而獲得可證明的安全性;推出的Amazon Bedrock 自動化推理檢查的功能,則能夠有效的去預防由于模型幻覺帶來的事實性錯誤。
整體來看,亞馬遜云科技將持續(xù)助力各行各業(yè)加速創(chuàng)新,突破既有范式,重塑未來。(丁科技網(wǎng)原創(chuàng),轉載務必注明“來源:丁科技網(wǎng)”)
- QQ:61149512