【財新網(wǎng)】時隔5個月,DeepSeek R1模型迎來首次重要升級。5月29日上午,DeepSeek在開源社區(qū)Hugging Face上線了一款名為DeepSeek-R1-0528的模型。同日晚間,DeepSeek公布了該模型更多的信息,并稱用戶通過官方網(wǎng)站、APP或小程序進入對話界面后,開啟“深度思考”就可體驗最新版本。API也已經(jīng)更新。
DeepSeek介紹稱,該模型仍然使用去年12月發(fā)布的DeepSeek V3模型作為基座,但在后訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力,在數(shù)學、編程和通用邏輯等測評中取得領(lǐng)先,并在整體表現(xiàn)上已接近o3和Gemini-2.5-Pro等頂尖模型。