近日,由中國互聯(lián)網(wǎng)協(xié)會主辦,中國信息通信研究院承辦,云計算標(biāo)準(zhǔn)和開源推進委員會、北京市通信與互聯(lián)網(wǎng)協(xié)會聯(lián)合協(xié)辦的2025“人工智能+”產(chǎn)業(yè)生態(tài)大會“人工智能與安全論壇”在北京順利召開。會上,“大模型安全防護圍欄能力檢驗”評估結(jié)果正式發(fā)布,360數(shù)字安全集團憑借扎實的技術(shù)積累與全面的服務(wù)能力,成為首家通過測評并獲證的企業(yè),標(biāo)志著其在大模型安全防護方面持續(xù)走在行業(yè)前列。

隨著大模型技術(shù)加速落地應(yīng)用,傳統(tǒng)單點防御機制已難以應(yīng)對其全生命周期的復(fù)雜安全挑戰(zhàn)。為系統(tǒng)化解此類風(fēng)險,大模型安全防護圍欄應(yīng)運而生,構(gòu)建覆蓋“全鏈路貫通、多維度協(xié)同、全周期管控”的一體化防護體系,為大模型安全建設(shè)提供了全新路徑。為規(guī)范并推動相關(guān)產(chǎn)品能力發(fā)展,中國信通院牽頭制定了《大模型安全防護圍欄產(chǎn)品能力要求》標(biāo)準(zhǔn),并啟動能力評估工作。
360大模型衛(wèi)士防護系統(tǒng)在本次測評中表現(xiàn)突出,全面滿足基礎(chǔ)管理、風(fēng)險識別與攔截、智能代答與引導(dǎo)、對抗攻擊防御、管理與運營、系統(tǒng)測試加固等六類指標(biāo)的能力要求,在行業(yè)內(nèi)首家獲頒大模型安全防護圍欄能力檢驗證書。
面對AI大模型發(fā)展面臨的安全挑戰(zhàn),360創(chuàng)新性提出“外筑‘以模治?!瘎討B(tài)屏障,內(nèi)固‘平臺原生’安全底座”的核心理念?;谪S富實戰(zhàn)經(jīng)驗,提供了可落地的安全解決方案,為大模型應(yīng)用拉起了全鏈路安全防線,助力推動人工智能行業(yè)向“安全、向善、可信、可控”的方向穩(wěn)健發(fā)展。
作為這套解決方案的重要組成,360大模型衛(wèi)士防護系統(tǒng)聚焦內(nèi)容安全,兼具“內(nèi)容測評”與“內(nèi)容護欄”雙重核心能力。系統(tǒng)基于“以模護模”“以測促防”的設(shè)計理念,提供智能判定機制、風(fēng)險內(nèi)容檢測、敏感問題代答、內(nèi)容安全測評等關(guān)鍵技術(shù),全面保障大模型輸入輸出內(nèi)容的安全性及價值觀對齊。該系統(tǒng)的核心優(yōu)勢包括:
全周期防護體系:基于“以模治?!崩砟顦?gòu)建多智能體系統(tǒng),覆蓋大模型從訓(xùn)練、接入、運行到評估的全流程防控,形成完整的安全閉環(huán); 海量高質(zhì)數(shù)據(jù):依托動態(tài)更新的敏感詞庫與百萬級測評數(shù)據(jù),實現(xiàn)風(fēng)險精準(zhǔn)識別與快速響應(yīng),持續(xù)提升評測準(zhǔn)確率與覆蓋度;豐富實戰(zhàn)驗證:已在政務(wù)、金融、能源、互聯(lián)網(wǎng)等多個行業(yè)落地應(yīng)用,服務(wù)重大活動保障與日常運維,能夠迅速響應(yīng)各類場景下的個性化安全需求。
此次360首家通過信通院大模型安全防護圍欄能力測評,不僅是對其技術(shù)實力與產(chǎn)品成熟度的權(quán)威認可,也彰顯了其在AI安全領(lǐng)域的持續(xù)積累與前瞻布局。未來,360將持續(xù)深耕大模型安全技術(shù),攜手行業(yè)伙伴共建可信AI生態(tài),為人工智能的穩(wěn)健發(fā)展筑牢安全底座。
(審核編輯: 朝言)
分享