前不久,亞馬遜云科技投資的Anthropic發(fā)布了模型Claude3,并且第一時間在Amazon Bedrock平臺上完成了發(fā)布。Anthropic做出長期承諾,將通過Amazon Bedrock為世界各地的亞馬遜云科技用戶提供訪問其下一代基礎模型的能力。在日前的生成式AI溝通會上,亞馬遜云科技方面演示了Claude3的能力;并且再次闡釋了如何將大模型能力提供給千行百業(yè)的用戶,Amazon Bedrock是其中一分部。
Amazon Bedrock 是一項完全托管的服務,通過單個 API 提供來自 AI21 Labs、Cohere、Meta、Stability AI和Amazon Titan等領先人工智能公司的高性能基礎模型,以及通過安全性、隱私性和負責任的 AI 構建生成式人工智能應用程序所需的一系列廣泛功能。
當前企業(yè)對大模型的重視,與多年前對云的接受類似,為了降本增效、激發(fā)創(chuàng)新。即便是在這個“數字化生存”加速展開的時代,企業(yè)上云,從外驅到自發(fā),依舊用了超過十年時間。相較之下,大模型與生成式AI的應用,在相當數量的企業(yè)被迅速提上日程,算是個小小的“奇跡”。當然,快速跟進之下,痛點同樣突出:從模型能力的獲得到對運營生產生成真實驅動力之間,存在不小的“鴻溝”。
幫助企業(yè)在大模型層面“跨越鴻溝”,這是亞馬遜云科技作為云服務探路者驅策數字生產力之后,想做的又一件事。
去年6月的“2023亞馬遜云科技中國峰會”,大模型、生成式AI、AI創(chuàng)新,是貫穿議程的線索。也就是從2023年下半年開始,從外部觀察,亞馬遜云科技對AI的重視程度達到了空前高度,除了成立生成式AI創(chuàng)新中心、投資模型公司Anthropic、強化和開放自家模型Amazon Titan、豐富相關服務架構外,與其他模型公司的合作也在深化。
今年來看,亞馬遜云科技的發(fā)展重心,很大程度上還會在大模型與生成式AI上。
Claude 3強勢登陸B(tài)edrock
Claude 3作為當前全球最領先的大模型之一,不同于某些語言模型或者視覺模型等等,主打“多模態(tài)”,這也是大模型本身發(fā)展的趨向。系列包括Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku,被亞馬遜云科技形象地稱之為“超大杯”“大杯”“中杯”,分別指向高度復雜任務、在技能與速度之間達到理想平衡、幾乎即時響應且最緊湊,供客戶根據自己的商業(yè)需求,從中選擇適合的智能、速度和價格組合。
Claude3系列模型提供200k長度的上下文召回,并針對不同的用例進行了優(yōu)化。Opus具有深度推理、高級數學和編碼能力,在高度復雜的任務上具有頂級性能;Sonnet適用于絕大多數工作負載;Haiku突出快速、緊湊,幾乎及時響應,成本相對平易。
基準性能來看,據稱Claude 3創(chuàng)造了模型智能水平新紀錄,在數學問題、編程練習和科學推理等標準評估中超越了所有現有模型,特別是Opus,不僅在包括本科生水平專業(yè)知識(MMLU)、研究生水平專業(yè)推理(GPQA)、基礎數學(GSM8K)在內的常見AI系統(tǒng)評估基準測試中表現優(yōu)異,在復雜任務中也表現出了優(yōu)秀的理解能力和流暢性。
多模態(tài)能力來看,Claude 3可以接受基于圖像的輸入,能力與其他前沿模型大致相同,且延遲低于其他多模態(tài)模型,在兼具速度和智能要求的用例中表現出色。
AI幻覺來看,Claude 3在處理挑戰(zhàn)性開放問題上準確性相較Claude 2有著明顯的提升,從舉例上看,Claude 3對于不明確的問題會表示并不足夠了解,Claude 2可能會出現“放飛自我”自由表達的情況。
應用場景來看,Claude 3可提供包括內容續(xù)寫、代碼輔助、電商商品描述撰寫以及長文本知識召回在內的多種功能。
現場演示來看,亞馬遜云科技主要展示了Haiku,部分展示了Sonnet,Haiku在即時性出色的前提下,輸出結果的素質也有保障;Sonnet的輸出結果顯然更出色,或許可以理解為職業(yè)頭顯中加“高級”與否的差別。
Amazon Bedrock不止對接領先模型
對Amazon Bedrock的能力,亞馬遜云科技方面也進行了一次全新解讀,除了提供對全球領先基礎模型的接入,其還提供知識庫、代理等各種便捷工具,同時確保數據隱私和安全,助力企業(yè)構建和應用生成式AI。
知識庫功能 Knowledge Bases for Amazon Bedrock,為基礎模型和Agent提供來自企業(yè)私人數據源的上下文信息,用于檢索增強生成 (RAG),以提供更相關、更準確和更個性化的響應。
代理功能 Agents for Amazon Bedrock,使生成式 AI 應用能夠使用自然語言來執(zhí)行多步驟的業(yè)務任務。如果需要用戶輸入特定信息,Agent會主動詢問,用自然語言獲取所需的附加細節(jié)。最重要的是,Agent始終利用最新的信息,并在保證安全與隱私的前提下為用戶提供解決方案。
加速實現負責任AI的Guardrails for Amazon Bedrock,允許客戶根據應用程序特定要求和負責任的 AI策略來管理用戶體驗。構建適合其應用場景且符合其安全和隱私要求的生成式人工智能應用程序,能夠為Amazon Bedrock上的多種基礎模型和代理提供保護;根據用戶設置的負責任AI策略來配置有害內容過濾器;能夠通過簡短的自然語言描述來定義并拒絕生成被禁止的話題;能夠在基礎模型的回復結果中屏幕個人隱私數據。
合規(guī)方面,Amazon Bedrock是基于全面的數據保護和隱私保護構建的,傳輸中數據和靜態(tài)數據都會被加密,數據不會與模型提供者共享,也不會用于改進基礎模型。
支持構建生成式AI的三層架構
亞馬遜云科技與眾多客戶開展了生成式AI合作過程中發(fā)現,各行各業(yè)的場景千變萬化,即使單一大模型的技術能力再強,也不能適用所有業(yè)務場景;同時,模型也并不是生成式AI創(chuàng)新的全部。因此,亞馬遜云科技在生成式AI領域為客戶提供了三層架構。
底層基礎設施層,提供基礎算力與基礎架構。
算力方面,主要是芯片,現階段還加入了英偉達最新推出的G200。亞馬遜云科技還投入大量的力量自研芯片,包括Amazon Trainium用于訓練的芯片,目前已經是第二代,推理芯片Amazon Inferentia也已經進入第二代。還包括用于訓練和推理的平臺Amazon Sagemaker。
用于大規(guī)模并行訓練一整套基礎架構也有非常重要,集中體現為UltralClusters,可以支持最多10萬多個最新的Trainium2在一起進行并行訓練。
中間模型層,亞馬遜云科技提供基于生成式AI的一系列全新產品,其中就包括Amazon Bedrock。
應用層,提供生成式AI驅動的應用程序。目前最主要的就是Amazon Q,與自身的多個產品,比如BI產品Amazon QuickSight、智能客服產品Amazon Connect、面向編程開發(fā)人員的平臺Amazon CodeWhisperer等,都實現了非常有效的結合。
通過這三層,不同的客戶可以根據需求選擇不同層級的產品來支持他們的業(yè)務,這比模型選擇,還要再進一步。
打通生成式AI“最后三公里”
可以說,在技術服務方面,亞馬遜云科技的準備還是比價充分的。但在同時,客戶也面臨著場景應用落地的壓力,這種壓力,很大程度上會給到亞馬遜云科技。
就此,亞馬遜云科技,除了用技術將客戶的生成式AI構建項目“扶上馬”,還要在后續(xù)的應用階段再“送一程”。
亞馬遜云科技通過包括架構師、產品專家、人工智能實驗室、數據實驗室、快速原型團隊、專業(yè)服務團隊等的豐富的專業(yè)技術支持資源,幫客戶打通應用生成式AI的最后三公里的工程化挑戰(zhàn)。
包括:解決方案架構師和客戶一起尋找場景與解決方案,產品技術專家根據客戶需求來提供產品構建的專業(yè)方案,人工智能實驗幫客戶打磨算法,數據實驗室?guī)兔蛻舸蛟於说蕉说臄祿?chuàng)新嘗試,快速原型團隊助力客戶構建 MVP,專業(yè)服務團隊提供專業(yè)的咨詢到實施的全流程服務,以及培訓與認證部門提供專業(yè)的機器學習培訓等等。
正如去年6月的“2023亞馬遜云科技中國峰會”上,亞馬遜云科技全球產品副總裁Matt Wood,在他的主題發(fā)言中談到的:
“亞馬遜云科技始終希望將擁有廣闊前景的且令人興奮的技術提供給每個人。在云計算時代我們提供通過API訪問云上應用的快捷訪問,這一愿景不會因為生成式AI的出現而改變。我們想用生成式AI做同樣(指亞馬遜云科技的愿景)的事情,我們想把這個非常廣闊的、創(chuàng)造性的、重要的技術放到每一個構建者和每一個商業(yè)用戶的手中?!保ㄞD載注明“來源:丁科技網”)
- QQ:61149512