要聞

清華大學與瑞萊智慧聯合團隊推出RealSafe-R1大模型

每日經濟新聞 2025-02-24 17:57:20

每經記者可楊每經編輯魏官紅

2月23日，清華大學與瑞萊智慧聯合團隊（以下簡稱“清華瑞萊聯合團隊”）推出大語言模型RealSafe-R1。據悉，該模型基于DeepSeek R1進行深度優化與后訓練，在確保性能穩定的基礎上，實現了安全性的顯著提升。

瑞萊智慧方面表示，連日來，國產開源大模型DeepSeek的優異表現令人驚艷，其在自然語言處理和多任務推理方面的能力展現了強大的技術實力，尤其是在復雜問題解決和創造性任務中表現出色。然而，DeepSeek R1和V3在面對“越獄攻擊”等安全性挑戰時仍存在一定的局限性。例如，模型可能會被惡意設計的輸入誤導，生成不符合預期或不安全的響應。這一安全短板并非DeepSeek所獨有的難題，而是當前開源大模型的通病，其根本缺陷源于安全對齊機制的深度不足。

為此，清華瑞萊聯合團隊提出了基于模型自我提升的安全對齊方式，將安全對齊與內省推理相結合，使大語言模型能夠通過具有安全意識的思維鏈分析來檢查潛在風險，實現基礎模型自身能力的自主進化，可以應用于多種開源、閉源模型。

基于該方法，清華瑞萊聯合團隊對DeepSeek-R1系列模型進行后訓練，正式推出RealSafe-R1系列大模型。據悉，RealSafe-R1各尺寸模型及數據集，將于近期向全球開發者開源。瑞萊智慧首席執行官田天表示，大模型的安全性瓶頸是本質的，只有通過持續投入和攻堅補齊短板弱項，人工智能產業才能真正實現高質量發展。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

模型 DeepSeek 大模型

上一篇文章

歐洲通信衛星公司股價上漲7.8%

返回每經網首頁

下一篇文章

【美股盤前】熱門中概股多數下跌；微軟被曝取消數據中心租約；阿里宣布投入超3800億元建設云和AI硬件基礎設施；英偉達據稱包下臺積電今年超70%先進封裝產能