首頁 > 工作動態 > 正文

清華團隊推出“安全增強版 DeepSeek”

稿件來源: 發布時間:2025-02-27

2 月 23 日,清華大學計算機系相關研究團隊宣布推出大語言模型 RealSafe-R1。該模型基于 DeepSeek R1 進行深度優化與后訓練,在確保性能穩定的基礎上,顯著提升了安全性,為開源大模型的安全發展與風險治理提供了創新性解決方案。

 

近日來,國產開源大模型 DeepSeek 在自然語言處理和多任務推理方面展現了強大的技術實力,但在面對越獄攻擊等安全性挑戰時仍存在一定局限性。為此,清華團隊提出了基于模型自我提升的安全對齊方式,將安全對齊與內省推理相結合,使大語言模型能夠通過具有安全意識的思維鏈分析來檢查潛在風險,實現基礎模型自身能力的自主進化。

 

基于該方法,團隊對 DeepSeek-R1 系列模型進行后訓練,正式推出 RealSafe-R1 系列大模型。實驗數據表明,RealSafe-R1 安全性提升顯著,在多個基準測試中有效增強了對各種越獄攻擊的抵抗力,并減輕了安全與性能之間的“蹺蹺板”現象。

 

據悉,RealSafe-R1 各尺寸模型及數據集將于近期向全球開發者開源。

來源丨人民網

主站蜘蛛池模板: 久久久久久久尹人综合网亚洲| 无码专区久久综合久中文字幕| 狠狠色噜噜狠狠狠狠色综合久AV | 狠狠色婷婷综合天天久久丁香| 亚洲AⅤ优女AV综合久久久| 色狠狠色狠狠综合天天| 色天使久久综合网天天| 欧美va亚洲va国产综合| 国产综合色在线视频区| 国产综合成人色产三级高清在线精品发布 | 久久综合九色综合97_久久久| 国产综合欧美| 人人狠狠综合久久亚洲| 日本一道综合色视频| 亚洲欧美精品综合中文字幕| 久久影院综合精品| 激情综合亚洲色婷婷五月APP| heyzo专区无码综合| 亚洲欧美日韩综合二区三区| 色综合天天综合给合国产| 日韩综合无码一区二区| 久久综合亚洲欧美成人| 色狠狠久久综合网| 亚洲精品第一国产综合境外资源| 国产色综合天天综合网| 99久久婷婷国产综合亚洲| 色久悠悠婷婷综合在线亚洲| 亚洲综合五月天| 亚洲第一综合色| 久久综合噜噜激激的五月天| 亚洲综合色在线观看亚洲| 国产综合精品久久亚洲| 久久狠狠色狠狠色综合| 久久综合成人网| 开心五月激情综合婷婷| 亚洲人成网站999久久久综合| 亚洲色欲久久久综合网| 狠狠综合久久综合中文88| 浪潮AV色综合久久天堂| 97SE亚洲国产综合自在线观看| 色悠久久久久久久综合网|