倒是沒(méi)想到,12月過(guò)半,各家大模型廠商和在沖刺KPI似的,好消息一波接著一波。
前腳大模型六小虎之一的智譜剛完成新一輪30億的融資;后腳字節(jié)跳動(dòng)發(fā)布豆包視覺(jué)理解模型、快手可靈1.6正式上線。
如果說(shuō)2023年是大模型元年,那2024年就是AI的應(yīng)用年。
從深度推理成為主流、AI Agent成新風(fēng)口,多模態(tài)模型競(jìng)相出現(xiàn),AI產(chǎn)品迭代速度之快,以至于我們常常忽略,從爆發(fā)至今,國(guó)內(nèi)AI領(lǐng)域的發(fā)展其實(shí)還不到2年。
AI一年,人間十年。
但這個(gè)被視為互聯(lián)網(wǎng)變革級(jí)別的產(chǎn)品,卻至今都還沒(méi)迎來(lái)爆發(fā)時(shí)刻。
算力不是護(hù)城河
直到今年上半年,國(guó)內(nèi)市場(chǎng)聊大模型發(fā)展,最核心的決定要素和關(guān)注焦點(diǎn)還是在算力。百模大戰(zhàn)如火如荼的那一年,想通過(guò)卷參數(shù)來(lái)迅速占領(lǐng)市場(chǎng)份額,曾是如今走在前列的幾個(gè)大模型的來(lái)時(shí)之路。
但從今年開(kāi)始,關(guān)于國(guó)內(nèi)外大模型卷不動(dòng)了的聲音越來(lái)越大,特別是下半年以來(lái),我們已經(jīng)很少聽(tīng)到哪個(gè)大廠又推出了什么大模型,這并非意味著百模大戰(zhàn)就要迎來(lái)終局,而是各家大廠正清楚地意識(shí)到,隨著整個(gè)行業(yè)的快速迭代,僅靠算力和參數(shù)規(guī)模的提升已經(jīng)難以真正超越同行。
再加上大模型的訓(xùn)練和運(yùn)營(yíng)需要大量的算力和資金投入,且這種投入需要持續(xù)進(jìn)行,這對(duì)現(xiàn)階段還難以走通商業(yè)模式的大模型廠商來(lái)說(shuō),顯然是一大挑戰(zhàn)。
以字節(jié)為例,據(jù)證券時(shí)報(bào)報(bào)道,僅2024年,字節(jié)在AI上的投入就達(dá)到800億元,幾乎達(dá)到了BAT三家資本開(kāi)支的總和。最新消息顯示,其2025年資本開(kāi)支將達(dá)到驚人的1600億元,其中約900億人民幣將用于AI算力的采購(gòu)。
就連ChatGPT也一直被算力緊缺所困擾。澎湃新聞曾報(bào)道,微軟用幾億美元,耗費(fèi)上萬(wàn)張英偉達(dá)A100芯片打造超算平臺(tái),只為給ChatGPT和新版必應(yīng)提供更好的算力。不僅如此,微軟還在Azure的60多個(gè)數(shù)據(jù)中心部署了幾十萬(wàn)張GPU,用于ChatGPT的推理。
實(shí)際上,從長(zhǎng)遠(yuǎn)角度來(lái)看,算力并不能構(gòu)成真正的護(hù)城河,它更多地體現(xiàn)為硬件層面的核心競(jìng)爭(zhēng)力。眾所周知,誰(shuí)的算力更強(qiáng),訓(xùn)練語(yǔ)料更豐富,誰(shuí)的模型表現(xiàn)就更好。算力依賴(lài)于GPU性能和數(shù)據(jù)中心建設(shè),訓(xùn)練語(yǔ)料依賴(lài)于公開(kāi)的數(shù)據(jù)集。但歸根結(jié)底,兩者都取決于經(jīng)濟(jì)實(shí)力。
早在去年,谷歌內(nèi)部討論如何應(yīng)對(duì) ChatGPT時(shí),就有工程師表示:“我們沒(méi)有護(hù)城河,OpenAI 也沒(méi)有?!彼J(rèn)為,即使谷歌全力投入,可能也贏不了這場(chǎng) AI 競(jìng)賽。不僅谷歌贏不了,OpenAI 也贏不了。
圖源:全球知名半導(dǎo)體行業(yè)研究咨詢(xún)機(jī)構(gòu)SemiAnalysis
其中他指出,開(kāi)源AI模型發(fā)展之迅速,使其很難形成強(qiáng)技術(shù)壁壘,即使現(xiàn)階段其大模型的數(shù)據(jù)質(zhì)量仍然稍有優(yōu)勢(shì),但差距正在驚人地迅速縮小。特別是開(kāi)源社區(qū)的創(chuàng)新和快速迭代能力,使得Google和OpenAI難以保持技術(shù)優(yōu)勢(shì)。
目前AI行業(yè)想要獲得領(lǐng)先優(yōu)勢(shì)和壟斷利潤(rùn),極其困難。
這也是目前國(guó)內(nèi)大模型的現(xiàn)狀,各公司的模型有強(qiáng)有弱,但是核心功能普遍同質(zhì)化,替代品很多。模型之間的差異性目前看來(lái)并不具有決定性。
某廠商推出的新功能,其他廠商可能很快就能趕上。Kimi最初雖然自己沒(méi)有內(nèi)部數(shù)據(jù),靠的也是調(diào)別人的搜索結(jié)果,但靠著長(zhǎng)文本,也成功進(jìn)入了國(guó)內(nèi)AI大模型的第一梯隊(duì),但如今長(zhǎng)文本已然成為大多數(shù)AI搜索產(chǎn)品的基本能力。
而值得注意的一點(diǎn)是,訓(xùn)練材料容易來(lái)著同一個(gè)池子,大家都能用。文小言跑的是百度的數(shù)據(jù),Kimi也能獲取。這就會(huì)導(dǎo)致個(gè)別大模型在算力和訓(xùn)練語(yǔ)料上的競(jìng)爭(zhēng)優(yōu)勢(shì)也在減弱。
《大模型落地與前沿趨勢(shì)研究報(bào)告》就直接表示,互聯(lián)網(wǎng)時(shí)代應(yīng)用有很多關(guān)鍵要素可以構(gòu)建護(hù)城河,包括數(shù)據(jù)飛輪、網(wǎng)絡(luò)效應(yīng)、遷移成本、規(guī)模效應(yīng)、用戶心智等,但已經(jīng)不再適用大模型的業(yè)務(wù)模式。
目前為止大模型的業(yè)務(wù)模式仍沒(méi)有清晰護(hù)城河。
AI應(yīng)用想要跳出包圍圈
下半年開(kāi)始,AI領(lǐng)域的關(guān)鍵詞開(kāi)始從“模型層”落到“應(yīng)用層”。
華爾街明星基金經(jīng)理Cathie Wood曾表示,基礎(chǔ)設(shè)施建設(shè)的階段,硬件廠商往往表現(xiàn)出更大的增長(zhǎng)空間,但一旦這個(gè)階段完成,市場(chǎng)的關(guān)注點(diǎn)就會(huì)轉(zhuǎn)向軟件,轉(zhuǎn)向應(yīng)用。
過(guò)去一年,國(guó)內(nèi)各家大模型廠商在通用場(chǎng)景的模型能力其實(shí)是缺乏辨識(shí)度的,雖然細(xì)分技術(shù)方向眾多,例如Kimi早期的長(zhǎng)文本,AI搜索產(chǎn)品主打的深度推理、近期開(kāi)始起風(fēng)的多模態(tài),包括最近熱門(mén)的視覺(jué)大模型。
但同質(zhì)化嚴(yán)重早已是AI產(chǎn)品們頭頂高懸的達(dá)摩克里斯之劍。
12月18日,豆包視覺(jué)理解模型正式發(fā)布,主要聚焦在圖片內(nèi)容識(shí)別能力、理解和推理能力以及視覺(jué)描述與創(chuàng)作能力上,媒體聲量轟轟烈烈,但事實(shí)上就在兩天前,Kimi 才剛剛發(fā)布了Kimi 視覺(jué)思考版,針對(duì)的還是基礎(chǔ)科學(xué)領(lǐng)域的圖片理解、推理能力。
正如上文所述,既然技術(shù)上沒(méi)有護(hù)城河,那如果從應(yīng)用場(chǎng)景角度進(jìn)攻,能否找到破圈點(diǎn)呢?
大模型始終是個(gè)底座,想要真正看到爆發(fā)點(diǎn),是要讓AI真正和普通人強(qiáng)相關(guān),此前就有業(yè)內(nèi)人士指出,未來(lái)能否出現(xiàn)殺手級(jí)別的應(yīng)用,將會(huì)是各家決出勝負(fù)的關(guān)鍵。
正如李彥宏多次強(qiáng)調(diào),“沒(méi)有(AI)應(yīng)用,基礎(chǔ)模型一文不值。”
殺手級(jí)應(yīng)用的出現(xiàn)會(huì)帶動(dòng)技術(shù)在更多領(lǐng)域的應(yīng)用和拓展,形成新的應(yīng)用場(chǎng)景和商業(yè)模式。例如,3G網(wǎng)絡(luò)的發(fā)展中,iPhone作為殺手級(jí)應(yīng)用,不僅推動(dòng)了智能手機(jī)的普及,還催生了移動(dòng)互聯(lián)網(wǎng)的各種應(yīng)用和服務(wù)。
那AI應(yīng)用能不能催生出下一個(gè)iPhone時(shí)代,至少2024年,我們還看不到火花。
直到現(xiàn)在,網(wǎng)上關(guān)于不同AI應(yīng)用在聊天、文生圖、圖生視頻上的使用體驗(yàn)的測(cè)評(píng)還是很多,你幾乎很難在第一時(shí)間告訴別人,同類(lèi)型的AI產(chǎn)品中,哪個(gè)才是最好的。
即使作為普通用戶確實(shí)會(huì)覺(jué)得AI搜索產(chǎn)品的興起對(duì)原有的搜索體系的沖擊非常強(qiáng),但目前來(lái)看,還沒(méi)有一家公司在市場(chǎng)感知和搜索量方面展現(xiàn)出壓倒性的優(yōu)勢(shì),形成類(lèi)似“不懂就百度一下”或“遇事不決小紅書(shū)”的強(qiáng)勢(shì)心智占領(lǐng)。
盡管AIGC技術(shù)在某些領(lǐng)域取得了進(jìn)展,近期快手就聯(lián)手賈樟柯、李少紅等國(guó)內(nèi)知名影視工作者,與AIGC創(chuàng)作者合作,用可靈生成電影短片;在獨(dú)立游戲領(lǐng)域AIGC也已得到廣泛應(yīng)用,部分大型游戲公司正開(kāi)始逐步推進(jìn)工業(yè)化的AIGC美術(shù)流程。
但整體上AIGC仍處于發(fā)展階段,生成內(nèi)容的質(zhì)量、穩(wěn)定性和可控性等方面仍存在不足,再加上AIGC的應(yīng)用場(chǎng)景相對(duì)有限,且多為輔助性工具,未能形成獨(dú)立且廣泛的應(yīng)用場(chǎng)景,難以滿足大規(guī)模用戶的需求。
而即使落到硬件端,以手機(jī)大模型為例,也不免出現(xiàn)同質(zhì)化的情況。
目前,AI手機(jī)在實(shí)際的AI體驗(yàn)上,主要變化還是在語(yǔ)音交互、圖像處理和通話增強(qiáng)。
為了實(shí)現(xiàn)所謂的AI手機(jī),幾乎所有頭部手機(jī)廠商都在對(duì)語(yǔ)音交互進(jìn)行升級(jí),號(hào)稱(chēng)要將之前的語(yǔ)音助手打造成更智能的AI Agent,除了智能對(duì)話之外,信息檢索、文本創(chuàng)作、文生圖這些已經(jīng)是豆包、Kimi等AI助手的基本操作的功能,也成為了AI手機(jī)的噱頭之一。
但正如創(chuàng)新工場(chǎng)聯(lián)合CEO汪華所言,現(xiàn)在整個(gè) AI 才出來(lái)一年半的時(shí)間,大家就指望 AI 的產(chǎn)品形態(tài)就被探索出來(lái),再快,也快不到這個(gè)地步。真正做應(yīng)用,從明年初才有最基本的基礎(chǔ)。
商業(yè)化著急不得
事實(shí)上,AI應(yīng)用之所以受到如此重視,一個(gè)重要原因是市場(chǎng)亟需看到AI技術(shù)能轉(zhuǎn)化為可落地的商業(yè)模式。
隨著大量資金涌入AI領(lǐng)域,投資者對(duì)AI項(xiàng)目的回報(bào)要求越來(lái)越高。他們希望AI企業(yè)能夠盡快實(shí)現(xiàn)技術(shù)的商業(yè)化應(yīng)用,以實(shí)現(xiàn)投資的增值。
今年9月,紅杉資本合伙人Pat Grady才指出,紅杉資本在人工智能領(lǐng)域的投資重心正在向應(yīng)用程序開(kāi)發(fā)傾斜。他表示,紅杉資本預(yù)計(jì)未來(lái)數(shù)十億美元級(jí)的人工智能公司大多數(shù)將來(lái)源于應(yīng)用層,而非傳統(tǒng)的基礎(chǔ)模型構(gòu)建。這一轉(zhuǎn)變預(yù)示著,未來(lái)我們也將看到更多技術(shù)創(chuàng)新與實(shí)際應(yīng)用結(jié)合的AI應(yīng)用。
值得注意的是,據(jù)智能涌現(xiàn)獨(dú)家消息,有知情人士透露,雖然豆包的用戶規(guī)模在過(guò)去幾個(gè)月有所增長(zhǎng),但和行業(yè)里所有AI對(duì)話形態(tài)的產(chǎn)品一樣,其在使用時(shí)長(zhǎng)、打開(kāi)頻次及商業(yè)化潛力上仍不夠理想。
文章指出,字節(jié)管理層判斷AI對(duì)話類(lèi)產(chǎn)品可能只是AI產(chǎn)品的“中間態(tài)”,長(zhǎng)期更理想的產(chǎn)品形式,大概率需要更視覺(jué)化的用戶體驗(yàn)、更低的用戶使用門(mén)檻。因此,字節(jié)已經(jīng)提升了即夢(mèng)的產(chǎn)品優(yōu)先級(jí),嘗試用新的路徑打造AI時(shí)代的“抖音”。
該消息暫未得到字節(jié)回應(yīng)。
眾所周知,在AI產(chǎn)品的開(kāi)發(fā)應(yīng)用上,字節(jié)并沒(méi)有先發(fā)優(yōu)勢(shì)。2023年8月,豆包正式推出,這距離百度在3月發(fā)布文心一言,已過(guò)去近半年。
但靠著實(shí)打?qū)嵉拟n能力,豆包APP 11月份的月活已經(jīng)達(dá)到近6千萬(wàn),保持 10% 以上的增速。目前,在國(guó)內(nèi)AI原生應(yīng)用(APP)中,豆包早就是遙遙領(lǐng)先的第一名,排在其后面的是1299萬(wàn)月活的文小言,1282萬(wàn)月活的Kimi。(數(shù)據(jù)來(lái)源:AI產(chǎn)品榜)
截至今年10月,國(guó)內(nèi)AI原生應(yīng)用(APP)中,豆包以1.08億的累計(jì)下載量位居第一,第二名是累計(jì)下載量為2260萬(wàn)次的文小言。
而在今年2月,豆包的訪問(wèn)量也才173萬(wàn)。短短三個(gè)季度,MAU就翻了近35倍,作為目前國(guó)內(nèi)用戶最多的ToC AI產(chǎn)品,豆包的用戶增長(zhǎng)空間應(yīng)該是更大,而非不夠理想。
如果僅從盈利模式來(lái)看,AI搜索類(lèi)產(chǎn)品能觸及的模式無(wú)非就是付費(fèi)訂閱和廣告。前者的市場(chǎng)在國(guó)內(nèi)一直以來(lái)就是出了名的難走通,為強(qiáng)行增加adload顯然也會(huì)極大的打擊到用戶的使用體驗(yàn)。想靠對(duì)話類(lèi)AI產(chǎn)品來(lái)賺錢(qián)確實(shí)有一定壓力。
文章指出,豆包的對(duì)話輪次、時(shí)長(zhǎng)等關(guān)鍵指標(biāo)仍然不夠理想。但事實(shí)上,不管是AI搜索還是其更高形態(tài)的AI Agent,這種工具類(lèi)提效產(chǎn)品對(duì)大眾消費(fèi)市場(chǎng)來(lái)說(shuō)本就不算剛需。
一定意義上來(lái)說(shuō),AI搜索類(lèi)產(chǎn)品作為生成式大模型在C端落地后最拿得出手的產(chǎn)品,其更大的作用是樣本收集場(chǎng)景,而不是賺錢(qián)的場(chǎng)景。
對(duì)字節(jié)來(lái)說(shuō),在對(duì)話類(lèi)產(chǎn)品中去強(qiáng)化自身語(yǔ)料、文生圖訓(xùn)練的能力,形成生態(tài)鏈,為后續(xù)以更加體系化的方式為字節(jié)的AI生態(tài)打開(kāi)更大的商業(yè)空間才更具生命力。
只要有活躍的用戶、有可持續(xù)的使用價(jià)值,AI對(duì)話類(lèi)產(chǎn)品的重要性就仍然存在。而事實(shí)上,縱觀目前其他對(duì)話類(lèi)產(chǎn)品,字節(jié)的友商們也沒(méi)那么著急去把對(duì)話類(lèi)AI當(dāng)作商業(yè)化的重要組成。
此前百度副總裁、移動(dòng)生態(tài)商業(yè)體系負(fù)責(zé)人陳一凡在談及生成式AI的商業(yè)場(chǎng)景時(shí)就曾表示:“我們沒(méi)有那么著急地要把所有流量在一時(shí)間都釋放出來(lái),我們希望真正滿足用戶的需求,所以我們的機(jī)制也會(huì)升級(jí),會(huì)把整個(gè)問(wèn)答的內(nèi)容質(zhì)量和整個(gè)智能體對(duì)話的質(zhì)量作為排序里的重點(diǎn),只有先滿足用戶需求,才能更好地滿足商業(yè)需求。”。
回顧上一代移動(dòng)互聯(lián)網(wǎng)級(jí)別的創(chuàng)新,從2008年APP Store的推出為移動(dòng)應(yīng)用提供了平臺(tái),直到2012年手機(jī)操作系統(tǒng)生態(tài)圈全面發(fā)展,智能手機(jī)規(guī)?;瘧?yīng)用才真正爆發(fā)。
移動(dòng)互聯(lián)網(wǎng)這條路走了5年,而如今AI技術(shù) 只用了不到2年,就已經(jīng)讓我們看到了質(zhì)的飛躍?;蛟S2025年,我們就能看到下一個(gè)iPhone時(shí)代拐點(diǎn)的到來(lái)。
參考資料:
《大模型落地與前沿趨勢(shì)研究報(bào)告》量子位智庫(kù)
《AI 沒(méi)有護(hù)城河》科技愛(ài)好者周刊
《對(duì)話汪華:現(xiàn)在的模型,還是支撐不了,大體量的免費(fèi)商業(yè)模式》AI產(chǎn)品榜
《豆包視覺(jué)理解模型正式發(fā)布,價(jià)格狂砍 85%》有新Newin
- QQ:61149512