【財新網】4月17日,字節(jié)跳動旗下火山引擎面向B端發(fā)布豆包1.5深度思考模型,這是字節(jié)跳動首款推理模型,可在解決問題時“邊想邊搜”,根據(jù)目標規(guī)劃搜索路徑;同時具備視覺推理能力,可以綜合理解圖片中的各類信息。
推理模型是指模型在預訓練之后的階段采用強化學習、思維鏈的技術,進一步“訓練”提高模型處理復雜邏輯推理任務的能力。
OpenAI于2024年9月率先推出o1模型讓業(yè)界轉向推理模型,而后DeepSeek于1月20日推出推理模型R1,憑借頂尖的能力引發(fā)了廣泛討論。此后,互聯(lián)網廠商間AI基座模型的競爭加劇,騰訊、阿里先后推出T1、QwQ-32B推理模型,百度則在3月17日推出首個推理模型X1。