Grok 3:10萬塊H100煉出“最聰明AI”,GPT-4地位不保?
北京時(shí)間2025年2月18日,馬斯克在迪拜世界政府峰會(huì)上正式發(fā)布xAI第三代大模型Grok 3時(shí)如此評(píng)價(jià)。
2025-02-19 08:37:27
來源:PConline??

“它聰明得有些嚇人?!?/p>

北京時(shí)間2025年2月18日,馬斯克在迪拜世界政府峰會(huì)上正式發(fā)布xAI第三代大模型Grok 3時(shí)如此評(píng)價(jià)。這場發(fā)布會(huì)如同一顆“核彈”,炸穿了全球AI圈的平靜:Grok 3在AIME數(shù)學(xué)測(cè)試中以52分碾壓DeepSeek-V3的39分,推理能力自稱超越OpenAI的o1和R1模型,訓(xùn)練成本高達(dá)30億美元,甚至被曝出“證明黎曼猜想”的瘋狂傳聞。馬斯克宣稱:“這是地球上最聰明的AI”,而行業(yè)則陷入了一場關(guān)于技術(shù)、倫理與商業(yè)的激烈爭論。

一、技術(shù)突破:10萬塊H100煉出“思維鏈”,數(shù)學(xué)屠榜背后的硬核邏輯

“Grok 3的思考方式像人類一樣有步驟”——這是馬斯克在發(fā)布會(huì)上反復(fù)強(qiáng)調(diào)的亮點(diǎn)。 該模型首次引入“思維鏈”(Chain of Thought)推理機(jī)制,使其能夠分步驟拆解復(fù)雜問題。例如,面對(duì)一道物理題,Grok 3會(huì)先列出已知條件,再推導(dǎo)公式,最后分步計(jì)算答案。這種能力直接體現(xiàn)在AIME數(shù)學(xué)測(cè)試中:Grok 3得分52分,遠(yuǎn)超DeepSeek-V3(39分)和GPT-4o(未公布具體分?jǐn)?shù))。

算力與效率的雙重碾壓

為訓(xùn)練Grok 3,xAI動(dòng)用了10萬塊英偉達(dá)H100 GPU,預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到驚人的50萬億token。相比之下,GPT-4的訓(xùn)練算力僅需2.5萬塊A100芯片。更令業(yè)界咋舌的是,xAI從Grok-0迭代到Grok-3僅用18個(gè)月,而OpenAI從GPT-3到GPT-4耗時(shí)近3年。這種“馬斯克速度”背后是極致的工程優(yōu)化:Grok 3的推理速度比上一代提升10倍,且支持多模態(tài)輸入(文本、圖像、代碼)。

爭議與彩蛋:Grok 3真的證明了黎曼猜想?

發(fā)布會(huì)后,一則傳聞引發(fā)數(shù)學(xué)界震動(dòng):Grok 3在訓(xùn)練過程中“證明”了黎曼猜想,導(dǎo)致xAI暫停訓(xùn)練以驗(yàn)證結(jié)果。盡管尚未被學(xué)界確認(rèn),但這一事件側(cè)面印證了Grok 3的推理潛力——它已能處理最復(fù)雜的數(shù)學(xué)猜想。

二、行業(yè)洗牌:OpenAI遭遇最強(qiáng)挑戰(zhàn)者,DeepSeek神話終結(jié)?

“Grok 3的目標(biāo)是成為OpenAI的替代品?!?馬斯克在發(fā)布會(huì)上直言不諱。從性能對(duì)標(biāo)來看,Grok 3在編程、數(shù)學(xué)、科學(xué)等領(lǐng)域全面超越GPT-4o,且在LMSYS競技場評(píng)分首破1400分,而GPT-4o僅為1280分。更致命的是,xAI同步推出Grok 3推理模型(Grok-3 Reasoning)和輕量版Grok-3 mini,直接覆蓋高、中、低端市場。

中國廠商的“壓力測(cè)試”

此前憑借數(shù)學(xué)能力屠榜的國產(chǎn)模型DeepSeek-V3,在Grok 3面前黯然失色:其AIME得分落后13分,且Grok 3的思維鏈功能使其在復(fù)雜問題處理上更接近人類專家。行業(yè)分析師指出:“中國廠商若不能突破推理瓶頸,將面臨市場份額流失風(fēng)險(xiǎn)?!?/p>

訓(xùn)練成本戰(zhàn):30億美元豪賭未來

Grok 3的訓(xùn)練費(fèi)用高達(dá)30億美元,遠(yuǎn)超GPT-4的1億美元。這一數(shù)字背后是馬斯克的野心:通過極致算力投入建立技術(shù)壁壘。正如xAI工程師所言:“我們不是在優(yōu)化成本,而是在創(chuàng)造未來?!?/p>

三、用戶體驗(yàn):幽默感AI如何走進(jìn)日常生活?

“讓AI不再像個(gè)冰冷的機(jī)器” ——這是Grok系列的核心設(shè)計(jì)理念。Grok 3在交互中增加了更多擬人化表達(dá),例如用emoji表情回應(yīng)情緒化提問,甚至能創(chuàng)作融合《寶石迷陣》和《俄羅斯方塊》的混合游戲。

教育、醫(yī)療、創(chuàng)作的顛覆性場景

教育:Grok 3可逐步講解微積分難題,并生成配套練習(xí)題;
醫(yī)療:根據(jù)患者癥狀描述,自動(dòng)生成診斷建議和用藥方案;
創(chuàng)作:在發(fā)布會(huì)演示中,Grok 3用10分鐘編寫出一款可運(yùn)行的小游戲。

用戶實(shí)測(cè):效率提升,但可靠性存疑

盡管早期測(cè)試用戶盛贊其效率(例如代碼生成速度比GPT-4快40%),但也有開發(fā)者指出,Grok 3在處理專業(yè)領(lǐng)域問題時(shí)仍會(huì)“一本正經(jīng)地胡說八道”。xAI回應(yīng)稱:“所有缺陷將在一周后的正式上線版本解決?!?/p>

四、爭議與隱憂:最聰明AI會(huì)是潘多拉魔盒嗎?

“當(dāng)AI比人類更聰明時(shí),我們?nèi)绾慰刂扑???馬斯克曾在多個(gè)場合警告AI風(fēng)險(xiǎn),但Grok 3的發(fā)布卻將這種矛盾推向頂點(diǎn):一方面,他呼吁加強(qiáng)AI監(jiān)管;另一方面,他又在推進(jìn)“不受限的技術(shù)突破”。

倫理挑戰(zhàn):從信息繭房到就業(yè)沖擊

信息真實(shí)性:Grok 3的“幽默感”可能導(dǎo)致錯(cuò)誤信息以更隱蔽的方式傳播;
就業(yè)替代:其代碼和文案生成能力可能沖擊初級(jí)程序員和文案崗位;
隱私安全:10萬億級(jí)訓(xùn)練數(shù)據(jù)是否包含用戶隱私?xAI尚未公開數(shù)據(jù)來源。

行業(yè)質(zhì)疑:技術(shù)躍進(jìn)還是營銷噱頭?

盡管馬斯克宣稱Grok 3“超越所有現(xiàn)有AI”,但科技媒體指出,其演示案例多為限定場景,尚未經(jīng)過第三方大規(guī)模測(cè)試。DeepMind研究員評(píng)論稱:“真正的AGI需要通用性,而非單項(xiàng)指標(biāo)領(lǐng)先。”

結(jié)語:AI競賽進(jìn)入“馬斯克時(shí)間”

Grok 3的發(fā)布不僅是一場技術(shù)秀,更是一封“戰(zhàn)書”——它宣告AI競賽進(jìn)入以算力堆砌和工程迭代為核心的“硬核時(shí)代”。當(dāng)馬斯克用10萬塊H100砸開AGI的大門時(shí),OpenAI、谷歌和中國廠商們必須回答一個(gè)問題:跟上這種瘋狂的速度,需要付出多大代價(jià)? 而普通用戶更關(guān)心的是:當(dāng)AI聰明到“嚇人”時(shí),我們?cè)撊绾闻c它共處?

原創(chuàng)文章
最新文章
1
快手快聘助力北京服務(wù)行業(yè)就業(yè) 直播招聘開啟新路徑
2
“護(hù)苗育心·童創(chuàng)未來”,快手啟動(dòng)2025未成年人保護(hù)系列活動(dòng)
3
“青年”與“銀發(fā)”兩大人群激發(fā)生態(tài)活力!《2025快手泛知識(shí)數(shù)據(jù)報(bào)告》展示新圖景
4
快手X巴黎歐萊雅 500個(gè)家鄉(xiāng)首次商業(yè)化 驗(yàn)證“家鄉(xiāng)敘事”商業(yè)承載力
5
輿論風(fēng)暴之后,小米能用玄戒和YU7翻盤嗎?
6
TCL獲中國視像協(xié)會(huì)權(quán)威認(rèn)可,三大技術(shù)方向樹立行業(yè)標(biāo)桿
7
第三代儲(chǔ)能電芯誰說了算?
8
蘋果將向開發(fā)者開放其AI模型,助其與三星展開競爭
9
凈利下滑84%,箭牌家居的希望在哪里?
10
30分鐘到手還便宜千元?“國補(bǔ)+美團(tuán)閃購”這波太狠了!
11
終極演唱會(huì)神器!vivo X200 Ultra長焦增距鏡影像套裝今日開售:1699元
12
國補(bǔ)額度已消耗過半 空調(diào)廠商狂賭旺季 6月排產(chǎn)增長35%
13
首發(fā)自研玄戒O1芯片!雷軍自費(fèi)購買一臺(tái)小米15S Pro收藏
14
同賽道競爭,為何美的與小米的競合關(guān)系如此融洽?
15
小米劍指前三,美的、格力、海爾如何回答“方洪波之問”?
16
2025年廚房小家電細(xì)分“藍(lán)海”趨勢(shì)“干貨”總結(jié)
17
空調(diào)6月排產(chǎn)增長35%,旺季賭一波?
18
Galaxy Watch 8 Classic帶旋轉(zhuǎn)表圈曝光
19
谷歌I/O大會(huì):與中國企業(yè)合作打造Android XR眼鏡,可實(shí)時(shí)翻譯
20
開啟電競?cè)緯r(shí)代!一加 Ace 5 至尊版發(fā)布會(huì)定檔5月27日
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512