- 相關(guān)報(bào)道
- 股票代幣化引爭(zhēng)議 OpenAI怒斥Robinhood未經(jīng)授權(quán)
- 扎克伯格重金押注“超級(jí)智能” 新團(tuán)隊(duì)過半挖自O(shè)penAI
- GPT革命|字節(jié)跳動(dòng)辭退原大模型團(tuán)隊(duì)負(fù)責(zé)人;快手發(fā)布AI生成的短劇;小米發(fā)布AI眼鏡
- 字節(jié)跳動(dòng)辭退原大模型團(tuán)隊(duì)負(fù)責(zé)人 與下屬存在親密關(guān)系被曝光
- AMD推GPU對(duì)標(biāo)英偉達(dá) 稱大模型產(chǎn)出提高40%
【財(cái)新網(wǎng)】全球大模型仍在競(jìng)速跑。當(dāng)?shù)貢r(shí)間7月9日晚,馬斯克旗下AI公司xAI發(fā)布最新一代大模型Grok 4和Grok 4 Heavy,其中Grok 4為單智能體版,消費(fèi)者可花30美元/月訂閱體驗(yàn);Grok 4 Heavy為多智能體版,訂閱費(fèi)用高達(dá)300美元/月。
馬斯克以“人類最后的測(cè)試”(Humanity’s Last Exam)為標(biāo)準(zhǔn),發(fā)現(xiàn)在不使用工具的情況下,Grok 4的分值為25.4%,高于谷歌最先進(jìn)的Gemini 2.5 Pro(21.6%),也高于OpenAI的o3大模型(21%)。如果讓大模型調(diào)用工具,Grok 4的分值達(dá)34.6%,Grok 4 Heavy的分值達(dá)44.4%?!叭祟愖詈蟮臏y(cè)試”難度很高,包括了2500個(gè)極其困難的學(xué)術(shù)問題,涉及一百多個(gè)學(xué)科。