據(jù)了解,國(guó)際知名人工智能社區(qū)MLCommons近期推出了AI Safety人工智能安全基準(zhǔn)測(cè)試的v0.5版,該測(cè)試由多領(lǐng)域?qū)<覉F(tuán)隊(duì)共同打造,以識(shí)別并防范AI應(yīng)用中的潛在風(fēng)險(xiǎn)。
隨著AI技術(shù)的快速發(fā)展,相關(guān)安全問(wèn)題也日益凸顯。僅過(guò)去數(shù)周內(nèi),便有LastPass公司遭遇音頻深度偽造攻擊等案例浮出水面。為了應(yīng)對(duì)這一挑戰(zhàn),新推出的AI Safety基準(zhǔn)測(cè)試將成為模型開(kāi)發(fā)者的有力工具,助力他們構(gòu)建更為穩(wěn)固的安全防線。
AI Safety基準(zhǔn)測(cè)試主要通過(guò)大型語(yǔ)言模型對(duì)各類(lèi)危險(xiǎn)提示詞的反應(yīng)來(lái)評(píng)估其安全性。該測(cè)試的v0.5版已開(kāi)始收集社區(qū)反饋,預(yù)計(jì)將于今年晚些時(shí)候推出正式的v1.0版。
v0.5版的AI Safety基準(zhǔn)測(cè)試主要關(guān)注通用聊天文本模型,而v1.0版則將加入針對(duì)圖像生成模型的測(cè)試內(nèi)容,并初步探討交互式代理模型的安全測(cè)試方法。
該測(cè)試涵蓋了超過(guò)43000個(gè)測(cè)試提示詞,采用Meta公司的Llama Guard對(duì)大模型的危險(xiǎn)提示響應(yīng)進(jìn)行評(píng)估。這些提示詞包括常見(jiàn)模板及危險(xiǎn)場(chǎng)景描述短語(yǔ),覆蓋七類(lèi)安全危害類(lèi)型,未來(lái)還將進(jìn)一步擴(kuò)展至至少十三類(lèi)。
最后,AI Safety基準(zhǔn)測(cè)試將根據(jù)測(cè)試結(jié)果給出五個(gè)安全評(píng)級(jí),以便用戶更好地理解和使用。
-
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249581 -
模型
+關(guān)注
關(guān)注
1文章
3521瀏覽量
50432 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1308瀏覽量
25160
發(fā)布評(píng)論請(qǐng)先 登錄
AI應(yīng)用的“安全鎖”:安全閃存技術(shù)在滿足行業(yè)認(rèn)證中的作用
直流充電安全測(cè)試負(fù)載方案解析
電氣設(shè)備的安全性與絕緣性能測(cè)試

大語(yǔ)言模型在軍事應(yīng)用中的安全性考量
AI如何增強(qiáng)車(chē)輛安全性和用戶交互性
如何實(shí)現(xiàn) HTTP 協(xié)議的安全性
MLCommons推出AI基準(zhǔn)測(cè)試0.5版
電池的安全性測(cè)試項(xiàng)目有哪些?

電池安全性測(cè)試關(guān)鍵:圓柱與軟包電池測(cè)試設(shè)備指南

在電氣安裝中通過(guò)負(fù)載箱實(shí)現(xiàn)最大效率和安全性
AI即服務(wù)平臺(tái)的安全性分析
智能系統(tǒng)的安全性分析
固態(tài)電池安全性怎么樣
NVIDIA文本嵌入模型NV-Embed的精度基準(zhǔn)

評(píng)論