就當(dāng)我們還在為OpenAI的Sora實(shí)際效果感到震撼,驚嘆未來(lái)已來(lái)的時(shí)候。短短一個(gè)月,OpenAI的“家”就被人偷了,昨晚北京時(shí)間凌晨Anthropic公司宣布Claude-3正式發(fā)布,帶有三個(gè)高性能的模型形態(tài),并宣布在AI邏輯基準(zhǔn)測(cè)試中超過(guò)了ChatGPT-4。
可能國(guó)內(nèi)的小伙伴很少知道Claude,這是一個(gè)在海外備受關(guān)注且用戶基數(shù)較大的一個(gè)AI模型,其從誕生以來(lái)就一直與GPT相愛(ài)相殺,在AI性能排行榜上緊追不舍。其也是基于GPT(Generative Pre-trained Transformer)技術(shù)的大型語(yǔ)言模型,通過(guò)在大規(guī)模文本數(shù)據(jù)上的預(yù)訓(xùn)練,學(xué)會(huì)了自然語(yǔ)言理解和生成的能力。
亞馬遜于今日宣布使用Claude3來(lái)優(yōu)化其商業(yè)邏輯
該系列包含三款各具特色的型號(hào):Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,它們?cè)谛阅芘c應(yīng)用功能上各有側(cè)重,旨在滿足多樣化的應(yīng)用場(chǎng)景需求。
Claude 3 Haiku
Haiku 型號(hào)憑借其極速處理能力和高性價(jià)比脫穎而出。它能夠在短短三秒內(nèi)完成對(duì)一篇含有約 10,000 個(gè)標(biāo)記、信息濃縮且數(shù)據(jù)密集的 arXiv 研究論文的閱讀工作,包括對(duì)圖表和圖形的理解。Haiku 尤其適用于那些對(duì)處理速度有極高要求但性能負(fù)荷相對(duì)較輕的平臺(tái)。
Claude 3 Sonnet
Sonnet 型號(hào)在處理大多數(shù)工作負(fù)載時(shí)的速度是 Claude 2 以及 Claude 2.1 的兩倍,且模型效果與性能一致,并提供更高層次的智能分析能力。它特別擅長(zhǎng)處理那些需要快速反應(yīng)的任務(wù),例如知識(shí)檢索和銷售流程自動(dòng)化等。
Claude 3 Opus
Claude 3 Opus 是系列中的高端型號(hào),具備與市場(chǎng)上其他頂尖模型相匹敵的復(fù)雜視覺(jué)處理能力,能夠處理多種視覺(jué)格式,包括照片、圖表、圖形以及技術(shù)圖解。相較于 Claude 2.1,Opus 在解決開(kāi)放性問(wèn)題上的準(zhǔn)確度提升了一倍,同時(shí)也顯著降低了錯(cuò)誤答案的比例。
其他亮點(diǎn)
全系列模型均能處理超過(guò) 100 萬(wàn)個(gè)標(biāo)記的輸入,為那些需要更強(qiáng)大處理能力的客戶提供可靠支持。Claude 3 系列在執(zhí)行復(fù)雜多步驟指令方面表現(xiàn)卓越,尤其在遵循品牌語(yǔ)調(diào)和響應(yīng)指南上,能夠?yàn)橛脩舸蛟斐鲋档眯刨嚨目蛻趔w驗(yàn)。此外,這些模型還擅長(zhǎng)生成流行的結(jié)構(gòu)化輸出格式,如 JSON。
目前,Opus 和 Sonnet 已經(jīng)通過(guò) API 對(duì)外開(kāi)放,開(kāi)發(fā)者現(xiàn)可直接注冊(cè)并開(kāi)始體驗(yàn)這些尖端模型的強(qiáng)大功能。比如,POE就已經(jīng)支持Claude-3-Opus模型,購(gòu)買POE“月卡”后就可以體驗(yàn)。
超越GPT-4;兼顧視覺(jué)功能
根據(jù)Anthropic的說(shuō)法,Claude 3 Opus 在10項(xiàng)人工智能標(biāo)準(zhǔn)測(cè)試中超越了GPT-4,包括MMLU(本科水平知識(shí))、GSM8K(小學(xué)數(shù)學(xué))、HumanEval(編程)以及HellaSwag(常識(shí))。
其中一些勝利的優(yōu)勢(shì)非常微小,例如Opus在MMLU五次嘗試中得到86.8%的得分,而GPT-4得到86.4%,一些差距則較大,例如在HumanEval上Opus得到90.7%的得分,而GPT-4得到67.0%。這可能就意味著Claude 3對(duì)于新手碼農(nóng)要更加友好。
與前代模型相比,Claude 3系列在分析、預(yù)測(cè)、內(nèi)容創(chuàng)作、代碼生成以及多語(yǔ)言對(duì)話等方面展現(xiàn)了改進(jìn)。據(jù)報(bào)道,這些模型還具備了增強(qiáng)的視覺(jué)能力,允許模型處理照片、圖表和圖解等視覺(jué)格式,類似于GPT-4V和谷歌的Gemini
在實(shí)際測(cè)試中,Claude 3相比于GPT-4V對(duì)于PDF的解讀要更加快速,同時(shí)對(duì)于中文輸出的邏輯與優(yōu)化也要明顯好于前代,也是達(dá)到了GPT-4平替的水準(zhǔn)。
- QQ:61149512