【財新網(wǎng)】
小米首個推理大模型開源
4月30日,小米開源首個推理大模型“Xiaomi MiMo”,由預(yù)訓(xùn)練和后訓(xùn)練階段中數(shù)據(jù)和算法等多層面的創(chuàng)新聯(lián)合驅(qū)動提升推理能力,小米方面介紹,在數(shù)學(xué)推理(AIME 24-25)和 代碼競賽(LiveCodeBench v5)公開測評集上,MiMo 用 7B 的參數(shù)規(guī)模,超越了 OpenAI 的閉源推理模型 o1-mini 和阿里 Qwen 更大規(guī)模的開源推理模型 QwQ-32B-Preview。
4月29日,騰訊宣布成立大語言模型部和多模態(tài)模型部,分別負責大語言模型和多模態(tài)模型的前沿技術(shù)研發(fā),同時騰訊大模型團隊原有的數(shù)據(jù)平臺部將專注于大模型數(shù)據(jù)的建設(shè),原有的機器學(xué)習(xí)平臺部聚焦機器學(xué)習(xí)和大數(shù)據(jù)融合平臺建設(shè),這兩個部門為AI模型的訓(xùn)練、推理提供底座。騰訊向財新稱,此次調(diào)整有利于整合資源,優(yōu)化研發(fā)流程,提升騰訊在AI領(lǐng)域的長期技術(shù)作戰(zhàn)能力。