通信世界網(wǎng)消息(CWW)在人工智能技術(shù)高速演進(jìn)的2025年,大模型領(lǐng)域的競爭已從單一的語言處理能力比拼,轉(zhuǎn)向多模態(tài)融合、場景化落地與生態(tài)整合的全面較量。北京時(shí)間8日凌晨1點(diǎn),OpenAI公司舉辦發(fā)布會,正式推出GPT-5模型。該公司首席執(zhí)行官山姆?奧特曼表示,GPT-5的推出是邁向通用人工智能(AGI)的重要一步,與該模型交流如同與人類專家“對話”。
GPT-5系列包含GPT-5、GPT-5 mini及GPT-5 nano三款模型,上下文長度均達(dá)400K,最大輸出為128K tokens。功能方面,GPT-5解釋Bernoulli效果等任務(wù)時(shí)反應(yīng)迅速,而創(chuàng)建視覺效果等復(fù)雜任務(wù)則需稍長時(shí)間。用戶可在提示中要求模型“深入思考”或“更精確”,還能直觀看到其思維過程。
技術(shù)架構(gòu)維度,GPT-5采用1.8萬億參數(shù)的MoE架構(gòu),借助動態(tài)路由機(jī)制僅激活1/5參數(shù)參與推理,使單次查詢能耗降低40%。這種設(shè)計(jì)在數(shù)學(xué)推理(GSM8K準(zhǔn)確率98.7%)和復(fù)雜邏輯任務(wù)中表現(xiàn)突出,但需數(shù)千GPU集群支撐訓(xùn)練。在聯(lián)網(wǎng)搜索時(shí),GPT-5的回答出現(xiàn)事實(shí)錯誤的概率比GPT-4o低了45%。
在實(shí)用功能上,ChatGPT的記憶功能現(xiàn)支持Pro、Plus及Teams訂閱用戶連接谷歌賬號訪問日歷,聯(lián)動Gmail與Google Calendar,使模型能依據(jù)用戶行程獲取更多情境信息。此外,提醒用戶回復(fù)未回郵件的功能將于下周先向Pro用戶開放,隨后擴(kuò)展至Plus和Teams用戶。
大模型測評網(wǎng)站Artificial Analysis數(shù)據(jù)顯示,目前GPT-5已經(jīng)超過Grok4排在第一,排在前列的國產(chǎn)大模型只有阿里的通義千問和DeepSeek。而在開源模型榜中,目前排名前十的有六個(gè)是國產(chǎn)大模型。相比之下,國內(nèi)廠商聚焦行業(yè)痛點(diǎn)深耕專用模型:字節(jié)跳動豆包大模型采用稀疏MoE架構(gòu),將推理成本壓降至GPT-4o的1/50,在電商場景中實(shí)現(xiàn)商品描述生成98%的準(zhǔn)確率;華為盤古3.0的萬億級氣象預(yù)測模型將臺風(fēng)路徑誤差控制在20公里內(nèi),較傳統(tǒng)方法提升60%,但多模態(tài)生成能力仍弱于GPT-5。開源陣營中,DeepSeek-R1以6710億參數(shù)實(shí)現(xiàn)接近GPT-4的推理性能,其開源策略推動企業(yè)私有化部署量增長 。
阿里云Qwen2.5-VL通過動態(tài)分辨率采樣技術(shù)直接處理原生尺寸視頻,在工業(yè)質(zhì)檢場景中實(shí)現(xiàn)99.2%的缺陷檢測準(zhǔn)確率,顯存占用顯著降低。騰訊混元大模型采用分層架構(gòu),支持從3B到750B參數(shù)的彈性擴(kuò)展,使社交娛樂創(chuàng)作效率提升200%,但通用推理能力仍不及GPT-5。硬件協(xié)同方面,華為昇騰384超節(jié)點(diǎn)通過總線技術(shù)實(shí)現(xiàn)384個(gè)NPU互聯(lián),突破集群通信瓶頸,將萬億參數(shù)模型訓(xùn)練效率提升3倍,部署成本降至GPT-4的20%。
在發(fā)布會上,OpenAI首席執(zhí)行官薩姆·奧爾特曼稱,GPT-5是“世界上最好的模型”,代表著OpenAI在開發(fā)通用人工智能 (AGI) 道路上邁出了“重要一步”,但GPT-5在“持久記憶、自主性和跨任務(wù)適應(yīng)性等領(lǐng)域仍然存在關(guān)鍵限制”。這場AI大模型的“進(jìn)化賽”,遠(yuǎn)比想象中漫長。
- QQ:61149512