freesexvideos性少妇kant,国产美女久久久亚洲综合,久久久精品国产sm调教网站,97色成人综合网站,高清欧美性猛交xxxx黑人猛交

財新傳媒
  • 發(fā)表評論
  • 分享到微信朋友圈
  • 新浪轉發(fā)

曾毅:AI大模型性能變強 安全能力仍有待提升

文|財新 杜知航
2025年06月05日 23:09
即使是經(jīng)過安全訓練的模型,在面對精心設計的技術類惡意查詢時,仍存在被突破的可能性
國內外大型語言模型(LLMs)的越獄成功率隨發(fā)布時間的變化。圖:前瞻研究院

  【財新網(wǎng)】“人工智能大模型變得越來越強大,但它并沒有變得越來越安全,”在2025北京網(wǎng)絡安全大會上,北京前瞻人工智能安全與治理研究院(下稱“前瞻研究院”)院長、人工智能安全與超級對齊北京市重點實驗室主任曾毅指出,即使是今年春節(jié)以后新發(fā)布的海內外人工智能大模型,也沒有由于能力的躍遷,而在安全風險防范方面做得越來越好。

  曾毅介紹,前瞻研究院的靈御大模型攻防安全評估平臺研究了2024年6月到2025年3月發(fā)布的49個國內外大模型,發(fā)現(xiàn)新的大模型能力雖然提升了,但是其攻擊成功率并沒有下降。因此人工智能能力的提升并不意味著安全能力的提升,在構建安全的人工智能方面還要走更深刻的道路。

國內外大型語言模型(LLMs)的越獄成功率隨發(fā)布時間的變化(橫軸:年月;縱軸:攻擊成功率(%);灰色圓圈大小代表大模型的大?。﹫D片來源:前瞻研究院

  推薦進入財新數(shù)據(jù)庫,可隨時查閱公司股價走勢、結構人員變化等投資信息。

責任編輯:覃敏 | 版面編輯:李東昊
推廣

財新網(wǎng)主編精選版電郵 樣例
財新網(wǎng)新聞版電郵全新升級!財新網(wǎng)主編精心編寫,每個工作日定時投遞,篇篇重磅,可信可引。
訂閱