智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          OpenAI部署新監(jiān)控,能否有效遏制o3和o4-mini生物風(fēng)險?

             發(fā)布時間:2025-04-17 07:31 作者:江紫萱

          近期,人工智能領(lǐng)域的巨頭OpenAI宣布了一項(xiàng)新舉措,針對其最新研發(fā)的人工智能推理模型o3和o4-mini,部署了一套專門設(shè)計(jì)的監(jiān)控系統(tǒng)。這一系統(tǒng)的主要目標(biāo)是預(yù)防這些先進(jìn)模型提供可能構(gòu)成生物和化學(xué)威脅的有害建議。

          OpenAI在一份安全報告中詳細(xì)闡述了該系統(tǒng)的目的,即確保模型不會為潛在的惡意用戶提供制造生物或化學(xué)武器的指導(dǎo)。據(jù)OpenAI介紹,盡管o3和o4-mini在性能上相較于之前的模型有了顯著提升,但同時也帶來了新的安全風(fēng)險。

          特別是o3模型,在OpenAI的內(nèi)部基準(zhǔn)測試中展現(xiàn)出了對回答有關(guān)生物威脅問題的高度能力。為了有效應(yīng)對這一風(fēng)險,OpenAI開發(fā)了名為“安全導(dǎo)向推理監(jiān)控器”的新系統(tǒng)。該監(jiān)控器經(jīng)過專門訓(xùn)練,能夠深入理解并遵循OpenAI的內(nèi)容政策,實(shí)時監(jiān)控o3和o4-mini的運(yùn)行狀態(tài)。

          安全導(dǎo)向推理監(jiān)控器的核心功能是識別與生物和化學(xué)風(fēng)險相關(guān)的關(guān)鍵詞或提示,一旦檢測到這些風(fēng)險信號,就會指示模型拒絕提供相關(guān)的建議。為了驗(yàn)證這一系統(tǒng)的有效性,OpenAI的紅隊(duì)成員投入了大量時間,標(biāo)記了o3和o4-mini中涉及生物風(fēng)險的“不安全”對話,并進(jìn)行了模擬測試。

          測試結(jié)果顯示,在模擬安全監(jiān)控器的“阻斷邏輯”測試中,模型成功拒絕回應(yīng)風(fēng)險提示的比例高達(dá)98.7%。然而,OpenAI也坦誠地指出,這一測試并未涵蓋用戶在被監(jiān)控器阻斷后嘗試使用新提示詞的情況。因此,OpenAI表示將繼續(xù)結(jié)合人工監(jiān)控手段,以彌補(bǔ)這一潛在漏洞。

          值得注意的是,盡管o3和o4-mini尚未達(dá)到OpenAI設(shè)定的生物風(fēng)險“高風(fēng)險”閾值,但與早期的o1和GPT-4相比,它們在回答關(guān)于開發(fā)生物武器的問題時表現(xiàn)出了更高的幫助性。OpenAI正在密切關(guān)注其模型可能如何被惡意用戶利用,以更容易地開發(fā)化學(xué)和生物威脅。

          為了降低模型帶來的風(fēng)險,OpenAI正越來越多地依賴自動化系統(tǒng)。例如,在防止GPT-4o的原生圖像生成器創(chuàng)建兒童性虐待材料(CSAM)方面,OpenAI已經(jīng)采用了與o3和o4-mini相似的推理監(jiān)控器技術(shù)。

          然而,并非所有人都對OpenAI的安全措施感到滿意。一些研究人員對OpenAI在安全問題上的重視程度提出了質(zhì)疑。特別是OpenAI的紅隊(duì)合作伙伴Metr表示,他們在測試o3的欺騙性行為基準(zhǔn)時,由于時間限制,未能進(jìn)行全面深入的評估。OpenAI還決定不為其最新發(fā)布的GPT-4.1模型發(fā)布安全報告,這一決定也引發(fā)了一些爭議。

          盡管如此,OpenAI仍在不斷努力提升其模型的安全性,以確保人工智能技術(shù)的健康發(fā)展。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          国产亚洲精品美女久久久久久下载| 99热门精品一区二区三区无码| 国产高清一级毛片精品| 国产区香蕉精品系列在线观看不卡| 99久久综合国产精品免费| 揄拍成人国产精品视频| 国产伦精品一区二区三区免.费 | 日韩亚洲国产高清免费视频| 国产精品午夜小视频观看| 精品久久久久久久久亚洲偷窥女厕| 亚洲国产精品白丝在线观看| 久久99精品视频| 国产精品视频二区不卡| 国内精品久久人妻互换| 窝窝午夜看片国产精品人体宴| 精品国产福利盛宴在线观看| 亚洲性日韩精品一区二区三区 | 久久久久久九九精品久小说| 精品国产亚洲一区二区三区| 亚洲一区二区三区在线观看精品中文| 久久精品中文字幕一区| 精品亚洲一区二区三区在线播放| 亚洲精品国产V片在线观看| 日韩成人免费视频播放| 日韩一级免费视频| 日韩美一区二区三区| 日韩电影免费在线| 日韩在线看片免费人成视频播放| 日韩av无码国产精品| 日韩在线不卡视频| 无码精品人妻一区二区三区AV| 七次郎在线视频观看精品| 九九免费精品视频在这里| 亚洲精品老司机在线观看| 一区精品麻豆入口| 精品国偷自产在线视频| 久热精品人妻视频| 国产在视频线精品视频二代| 久久这里只有精品66re99| 无码人妻精品一区二区三区在线| 少妇人妻偷人精品无码视频 |