【財(cái)新網(wǎng)】
5月29日上午,DeepSeek上線DeepSeek-R1-0528,標(biāo)志著DeepSeek R1模型迎來(lái)首次重要升級(jí)。該模型仍使用DeepSeek V3 模型作為基座,但整體表現(xiàn)已接近o3和Gemini-2.5-Pro等頂尖模型。DeepSeek同時(shí)還推出了基于新版R1模型訓(xùn)練的小模型Qwen3-8B ,DeepSeek稱(chēng)以此得到的模型能力比肩2350億參數(shù)的Qwen3-235B。