- 相關(guān)報(bào)道
- 【財(cái)新周刊】封面報(bào)道|誰能接住DeepSeek潑天流量?互聯(lián)網(wǎng)算力、應(yīng)用、服務(wù)新一輪激戰(zhàn)
- 【財(cái)新周刊】封面報(bào)道|DeepSeek爆火 撼動(dòng)AI投資和算力競(jìng)爭(zhēng)底層邏輯
- 騰訊:目前資本投入足以滿足AI算力需求 元寶不會(huì)是唯一AI應(yīng)用入口
- 獨(dú)家|騰訊“元寶”將上線PC端應(yīng)用 后續(xù)接入“快思考”模型Turbo-S
- 獨(dú)家|微信AI搜索調(diào)用量超載 搜索需求跳轉(zhuǎn)至聊天機(jī)器人“元寶”
【財(cái)新網(wǎng)】3月21日夜間,騰訊正式推出自研強(qiáng)推理模型“混元T1”正式版。該模型早期版本此前曾在AI聊天機(jī)器人元寶APP上小范圍測(cè)試,2月中旬曾和DeepSeek R1一起在元寶APP上提供模型服務(wù)。此次正式發(fā)布,騰訊稱混元T1通過大規(guī)模強(qiáng)化學(xué)習(xí),并結(jié)合數(shù)學(xué)、邏輯推理、科學(xué)和代碼等理科難題的專項(xiàng)優(yōu)化,進(jìn)一步提升了推理能力。
混元T1是騰訊混元發(fā)布的第一款推理模型。推理模型是指模型在預(yù)訓(xùn)練之后的階段采用強(qiáng)化學(xué)習(xí)、思維鏈的技術(shù),進(jìn)一步“訓(xùn)練”提高模型處理復(fù)雜邏輯推理任務(wù)的能力?;煸獔F(tuán)隊(duì)介紹,在模型后訓(xùn)練階段,96.7%的算力投入到了強(qiáng)化學(xué)習(xí)訓(xùn)練,重點(diǎn)圍繞純推理能力的提升以及對(duì)齊人類偏好的優(yōu)化。