清華阿里RealAI聯合發布首個AI安全評估平臺,模型防御力如何?一測便知
平臺能夠對AI防御和攻擊算法進行自動化、科學的評估
白交 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
AI的創新發展,帶來了新一輪的產業變革。
一方面,是落地于傳統行業,提升產業效率;另一方面,則是催生了新的產業,比如智能交通、智慧醫療。
但與此同時,AI所帶來的新的風險和安全隱患,也同樣不容小覷。
想象一下這些場景。
街道上自動駕駛的汽,車因AI視覺系統受到AI算法誘導攻擊,那么行駛軌跡發生改變。
有人通過AI技術模仿出跟你熟悉的親朋好友一模一樣的聲音,找你借錢。
……
雖然AI技術已經有了長足進步,但是沒有安全性的保障,也很難取得有效發展。
最近,清華大學聯合阿里安全、Real AI發布了首個公平、全面的AI攻防對抗基準平臺。
平臺能夠對AI防御和攻擊算法進行自動化、科學的評估,并實時生成一個AI安全排行榜單。
AI模型是否安全?一測便知。
AI攻防對抗基準平臺
不同于之前只包含零散攻防模型的對抗攻防基準,此次推出AI對抗安全基準基本上包括了目前主流的人工智能對抗攻防模型,涵蓋了數十種典型的攻防算法。
不同算法比測的過程中盡量采用了相同的實驗設定和一致的度量標準,從而在最大限度上保證了比較的公平性。
清華大學計算機系教授、RealAI首席科學家朱軍介紹道:
通過對AI算法的攻擊結果和防御結果進行排名、比較不同算法的性能,建立AI安全基準具有重要學術意義,可以更加公平、全面地衡量不同算法的效果。”
此外,評測標準則是依托清華大學人工智能研究院研發的人工智能對抗安全算法平臺ARES(Adversarial Robustness Evaluation for Safety)建立。
ARES作為古希臘神話中的戰神,雙手持矛和盾是攻防合一的化身,集中體現了AI安全算法攻防博弈的特點。
阿里安全高級算法專家越豐,參與了此次評測基準平臺的設計,他表示:
就像打仗一樣,攻擊者可能用水攻,也可能火攻,還可能偷偷挖條地道來攻打一座城,守城的人不能只考慮一種可能性,必須布防應對許多的攻擊可能性。
“創新治理兩手抓”
因此,我們不光要致力于AI的創新發展,還有專注于AI的治理。
正如張鈸院士所說:
既要抓AI的創新發展,又要抓AI的治理,兩手都要抓。
張鈸院士還談到,為何AI的發展沒有像信息科技發展異常迅猛,反而卻緩慢曲折,安全問題層出不窮。
究其關鍵,還是基礎理論的局限性。
從信息革命一開始,信息的三大理論就已經建立:圖靈機理論、信息論、控制論。
有了堅實的理論基礎,從而引導信息技術健康地發展。
AI則相反,它的理論基礎至今沒有建立。
盡管經歷了盡管經歷了第一代AI的符號主義模型(知識驅動),和第二代AI的亞符號(連接)主義模型(數據驅動)。
但由于它們均具有很大的局限性,不能構成AI的理論基礎。
因此,建立AI的理論基礎,也就成為張鈸院士團隊提出“第三代人工智能”的初衷。
“第三代人工智能”,簡單來說,是利用知識、數據、算法和算力4個要素,建立新的可解釋和魯棒的AI理論和方法,從而發展安全、可信、可靠和可擴展的AI技術。
最后,張鈸院士呼吁:全世界應該團結起來,共同來發展安全可控的第三代人工智能,讓人工智能真正造福于人類。
平臺網站:
http://ml.cs.tsinghua.edu.cn/adv-bench/
- 空間智能卡脖子難題被杭州攻克!難倒GPT-5后,六小龍企業出手了2025-08-28
- 陳丹琦有了個公司郵箱,北大翁荔同款2025-08-28
- 英偉達最新芯片B30A曝光2025-08-20
- AI應用如何落地政企?首先不要卷通用大模型2025-08-12




