【財新網(wǎng)】隨著人工智能技術(shù)的發(fā)展,AI幻覺問題也日益受到關(guān)注。2025年兩會期間,全國人大代表、國內(nèi)人工智能企業(yè)科大訊飛的董事長劉慶峰建議,應(yīng)預(yù)防大模型生成“幻覺數(shù)據(jù)”充斥互聯(lián)網(wǎng)帶來的危害,從技術(shù)研發(fā)和管理機制上構(gòu)建可信的信息環(huán)境。
AI幻覺(AI Hallucinations)指的是大模型時常胡編亂造,而且有時候編得足以以假亂真,或者出現(xiàn)“AI 運算偏差”,產(chǎn)生與真實世界不一致的內(nèi)容。
一項最近更新于2月11日的測評顯示,DeepSeek R1的幻覺率為14.3%(平均總結(jié)長度77.1個詞),相對較高,DeepSeek -V3的幻覺率則為3.9%(平均總結(jié)長度88.2個詞)。測評的所有模型中,表現(xiàn)最佳的是Google Gemini -2.0- Flash -001,幻覺率只有0.7%(平均總結(jié)長度65.2個詞)。同樣是國產(chǎn)模型的智譜Zhipu AI GLM -4-9B- Chat 幻覺率為1.3%(平均總結(jié)長度58.1個詞),GPT -4o的幻覺率則為1.5%(平均總結(jié)長度77.8個詞)。