快手Kwai Agents系統(tǒng)、模型、數(shù)據(jù)全部開源
7B的模型也能玩轉(zhuǎn)AI Agents了?近期,快手開源了Kwai Agents,親測發(fā)現(xiàn),問它周末滑雪問題,它不但能幫你找到場地,連當天的天氣都幫你考慮周到了。 大語言模型(LLM)通過對語言的建模而掌握了大量知識,并具備一定認知和推理能力。但由于無法跟世界保持實時的交互,在單獨使用的情況下,常會出現(xiàn)一本正經(jīng)地胡說八道的現(xiàn)象。而AI Agents就是解決這個問題的道路之一,它通過激發(fā)大模型任
2024-01-04 19:15:36
來源:丁科技網(wǎng)??

7B的模型也能玩轉(zhuǎn)AI Agents了?近期,快手開源了Kwai Agents,親測發(fā)現(xiàn),問它周末滑雪問題,它不但能幫你找到場地,連當天的天氣都幫你考慮周到了。

大語言模型(LLM)通過對語言的建模而掌握了大量知識,并具備一定認知和推理能力。但由于無法跟世界保持實時的交互,在單獨使用的情況下,常會出現(xiàn)一本正經(jīng)地胡說八道的現(xiàn)象。而AI Agents就是解決這個問題的道路之一,它通過激發(fā)大模型任務規(guī)劃、反思、調(diào)用工具等能力,使大模型能夠借助現(xiàn)實世界工具提升生成內(nèi)容的準確性,甚至有能力解決復雜問題。

據(jù)了解,KwaiAgents是一個先進的AI智能體系統(tǒng),由快手聯(lián)合哈爾濱工業(yè)大學研發(fā),通過使用大型語言模型來模仿人類認知技能,可應用于自然語言處理、語音識別等領域。Kwai Agents可以使7B/13B的“小”大模型也能達到超越GPT-3.5的效果,目前該項目已將系統(tǒng)、模型、數(shù)據(jù)、評測全部開源,使得更多的研究人員可以參與其中。

技術報告:https://arxiv.org/abs/2312.04889

項目主頁:https://github.com/KwaiKEG/KwaiAgents

從「KwaiAgents」的Github主頁中可以看到,本次開源內(nèi)容包含:

1.系統(tǒng)(KAgentSys-Lite):輕量級AI Agents系統(tǒng),并配備事實、時效性工具集;

2.模型(KAgentLMs):Meta-Agent Tuning后,具有Agents通用能力的系列大模型及其訓練數(shù)據(jù);

3.評測(KAgentBench):開箱即用的Agent能力自動化評測Benchmark與人工評測結(jié)果。

KAgentBench通過人工精細化標注的上千條數(shù)據(jù),做到了開箱即用,讓大家能夠用一行命令評測一個大模型在不同模板下,各方面的Agents能力。下表顯示了經(jīng)過快手團隊調(diào)優(yōu)后,7B-13B模型各項能力的提升,且超越了GPT-3.5的效果:

同時,作者們還請人類標注者在200個事實性和時效性的問題(如“劉德華今年幾歲了”),對不同的大模型和Agent系統(tǒng)進行了交叉評估,可以看到KAgentSys系統(tǒng)和MAT之后模型提升顯著(百分號前為正確率,括號內(nèi)為5分制均分)。

通常僅依賴網(wǎng)頁搜索對一些長尾問題和熱門問題返回結(jié)果不佳。比如問到“安東內(nèi)拉比梅西大多少天?”這類長尾問題,往往搜索結(jié)果返回的都是一些兩者的八卦新聞,而返回不了一些關鍵信息。而KAgentSys 通過調(diào)用百科搜索工具獲取精準的出生日期,再調(diào)用time_delta時間差工具算出年齡差,就能精準回答這個問題了。

快手技術人員表示,AI Agents是一條非常有潛力的道路,未來一方面會在這個方向持之以恒地沉淀核心技術,并為整個社區(qū)不斷地注入新的活力;另一方面,也會積極探索Agents技術與快手業(yè)務的結(jié)合,嘗試更多有趣、有價值的創(chuàng)新應用落地。

原創(chuàng)文章
最新文章
1
更沉浸更好聽,“半入耳降噪蘋替”vivo TWS Air3 Pro正式發(fā)布
2
再創(chuàng)全球最輕新紀錄 vivo X Fold5旗艦折疊新品正式發(fā)布
3
快手發(fā)布暑期招商通案,四大場域引爆品牌夏日營銷熱潮
4
專業(yè)品酒師跨界帶貨三農(nóng)產(chǎn)品,快手達人丹牛讓好產(chǎn)品收獲強增長
5
快手電商商家全域經(jīng)營指南發(fā)布,做好四大場域開啟全域增長
6
音樂彈幕、AI美音、音色測試…..回森攜音樂黑科技亮相華為開發(fā)者大會2025
7
亞馬遜云科技中國峰會召開 解碼Agentic AI時代企業(yè)加速創(chuàng)新路徑
8
亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松:企業(yè)要利用Agentic AI實現(xiàn)價值創(chuàng)造的關鍵在于三大技術準備
9
亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松:Agentic AI時代,產(chǎn)品服務乃至商業(yè)模式的創(chuàng)新最令人興奮
10
亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松:我們正處在Agentic AI爆發(fā)的前夜
11
三星Galaxy Z Fold7/Flip7定檔7月9日:折疊屏迎來超薄革命,Exynos 2500芯片全球首發(fā)
12
蘋果散熱革命!iPhone 17 Pro系列首搭均熱板系統(tǒng)
13
預計2025年全球電視出貨量下滑,面板價格將持續(xù)回落
14
從“可選”到“剛需”:洗碗機五年倍增計劃啟動 風口已至
15
國產(chǎn)OLED設備走上“逆襲”路
16
互聯(lián)網(wǎng)大廠為何紛紛瞄上“穩(wěn)定幣”?
17
行業(yè)首創(chuàng)!美的家用中央空調(diào)推出“雙出風室內(nèi)機”
18
格力、美的雙雙申請“燈具空調(diào)”新商標
19
“技術創(chuàng)維”賦能:躋身全球TOP5!618創(chuàng)維壁紙電視銷量激增120%
20
史上最輕大折疊!vivo X Fold5今晚發(fā)布:配置匯總來了
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512