左手剛剛?cè)谫Y,右手就發(fā)大模型,馬斯克重金打造的Grok 4,正式面世!
7月10日,特斯拉創(chuàng)始人兼首席執(zhí)行官馬斯克旗下的人工智能公司xAI正式發(fā)布了Grok 4。在將近1小時(shí)的發(fā)布會(huì)直播中,xAI發(fā)布了這個(gè)系列的兩款模型,分別是Grok 4(單智能體版本)和Grok 4 Heavy(多智能體版本),其中后者支持4個(gè)智能體并行思考,在推理過(guò)程中橫向比對(duì)、縱向協(xié)同,調(diào)用更大規(guī)模的計(jì)算資源以完成更復(fù)雜、更精密的任務(wù)。
作為xAI在2023年推出首代大模型以來(lái)的第四次重要更新,Grok 4在“人類的最后考試”(Humanity's Last Exam)取得了25.4%的準(zhǔn)確率,超過(guò)了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%,被稱為“世界上最強(qiáng)AI模型”。
據(jù)xAI的研究人員介紹,Humanity's Last Exam測(cè)試總共有2500個(gè)問(wèn)題,包括數(shù)學(xué)、自然科學(xué)、工程以及所有人文學(xué)科,問(wèn)題廣泛且都是博士甚至高級(jí)研究水平,極具挑戰(zhàn)性,但Grok 4在這些問(wèn)題上都可以得到很好的分?jǐn)?shù)。
“在所有學(xué)科上,Grok 4比博士還強(qiáng)——沒(méi)有例外?!瘪R斯克在直播中表示,雖然Grok 4目前還沒(méi)有發(fā)現(xiàn)新科學(xué)或新的物理定律,但這只是一個(gè)時(shí)間問(wèn)題,他相信Grok 4可以在今年內(nèi)實(shí)現(xiàn)科學(xué)新發(fā)現(xiàn)。
此外,據(jù)發(fā)布會(huì)披露,在GPQA、AIME25、LCB(Jan-May)、HMMT25等多項(xiàng)測(cè)評(píng)中,Grok 4都超越了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等模型。
價(jià)格方面,Grok 4目前僅對(duì)付費(fèi)用戶開(kāi)放。輸入每100萬(wàn)tokens價(jià)格為3美元,輸出每100萬(wàn)tokens價(jià)格為15美元。值得注意的是,xAI還推出了迄今為止最昂貴的AI訂閱計(jì)劃——每月300美元的Super Grok Heavy,這一價(jià)格也超過(guò)了OpenAI最貴的200美元Pro會(huì)員月費(fèi)。
業(yè)內(nèi)人士分析稱,從Grok 2到Grok 3,再到如今的Grok 4,xAI的訓(xùn)練計(jì)算量實(shí)現(xiàn)了驚人的百倍增長(zhǎng)。發(fā)布會(huì)披露,Grok 4的訓(xùn)練是在一個(gè)擁有超過(guò)20萬(wàn)張H100 GPU的超級(jí)計(jì)算機(jī)集群上完成的,是Grok 3時(shí)期的兩倍。更重要的是,xAI改變了訓(xùn)練策略,將更多的算力投入到“推理能力”的專項(xiàng)訓(xùn)練上。相比于Grok 2,Grok 4的訓(xùn)練量提升了整整100倍。
因此,Grok 4所取得的優(yōu)異性能,離不開(kāi)馬斯克“燒錢”打造的超級(jí)計(jì)算機(jī)集群的算力支撐。2024年6月,xAI宣布在美國(guó)田納西州孟菲斯建造超級(jí)計(jì)算機(jī)以訓(xùn)練其人工智能大模型Grok。該系統(tǒng)初期配備20萬(wàn)個(gè)英偉達(dá)GPU,馬斯克還計(jì)劃將GPU規(guī)模最終擴(kuò)大到100萬(wàn)個(gè)。這一項(xiàng)目已投入數(shù)億美元,未來(lái)仍需持續(xù)投入大量資金。
值得注意的是,一周以前,xAI剛剛完成了100億美元的融資,其中包括50億美元債務(wù)融資和50億美元股權(quán)融資。在本輪融資中,摩根士丹利擔(dān)任了50億美元債務(wù)融資的顧問(wèn),并表示其債務(wù)融資獲得超額認(rèn)購(gòu),吸引了全球債務(wù)投資者參與。摩根士丹利強(qiáng)調(diào),xAI還另外獲得了50億美元戰(zhàn)略股權(quán)融資,“債務(wù)與股權(quán)組合有效降低綜合資本成本,大幅拓展xAI的可融資渠道”。
高昂的算力支出讓xAI承受著巨大的成本壓力。據(jù)外媒援引消息人士報(bào)道,xAI目前每月“燒錢”高達(dá)10億美元,其在構(gòu)建先進(jìn)大模型方面的成本遠(yuǎn)遠(yuǎn)超過(guò)收入增長(zhǎng)。對(duì)于這一報(bào)道,馬斯克曾公開(kāi)表示,這類巨額虧損在整個(gè)人工智能行業(yè)并不罕見(jiàn),主要源自高昂的服務(wù)器建設(shè)和芯片采購(gòu)成本。
在AI大模型的競(jìng)賽中,融資與技術(shù)研發(fā)猶如車之兩翼,只有充足的資金儲(chǔ)備才能支撐高成本的技術(shù)研發(fā),只有技術(shù)持續(xù)取得突破才能支撐進(jìn)一步的融資。在Grok 4發(fā)布不久前,OpenAI也透露了可能在今年夏天發(fā)布GPT-5。不可否認(rèn),Grok 4是xAI發(fā)展過(guò)程中的又一個(gè)里程碑,但追逐AGI的道路依然漫長(zhǎng)。在馬斯克慶祝Grok 4取得的卓越成績(jī)時(shí),下一個(gè)“最強(qiáng)AI模型”或許已經(jīng)在路上。