選單

微軟推EzPC框架:在AI模型驗證中增強資料安全性

在資料科學領域工作過的人都知道,開發一個人工智慧模型通常可以概括為 3 個階段:訓練、驗證和測試。在測試模型的準確性時,選擇驗證集來調整超引數(hyperparameters)時,通常有很多考慮。

為了進行準確的模型評估,企業傾向於使用一部分真實資料進行驗證,但自然會有很多安全和隱私方面的考慮,特別是在處理個人身份資訊(PII)方面。

如果你的模型是由一個外部公司開發的,你基本上有兩個選擇。要麼該公司與你分享其模型,這將對其智慧財產權保護構成風險;要麼你與他們分享你的真實資料,這對你來說是一種隱私風險,也可能導致模型對真實資料過度擬合。在做出這兩種困難的選擇時,也有很多法律障礙需要跳過。因此,雖然企業希望儘快採用人工智慧,但在處理資料時,模型開發過程無論是內部還是外部,他們都面臨著挑戰。

為了解決這個問題,微軟正在研究一個名為 EzPC 的新框架,它代表著“輕鬆安全的多方計算”。

從本質上講,EzPC 是基於安全的多方計算(MPC)的。MPC 使多方能夠使用加密技術聯合計算一個函式,而不向對方透露他們的資料。

雖然 MPC 已經存在多年,但事實證明它很難實現,因為在計算多個函式時,使其具有可擴充套件性和高效性的挑戰。EzPC 透過使用 MPC 作為構建塊來解決這些問題,並使開發者——不僅僅是密碼學專家——能夠在此基礎上進行擴充套件。

微軟推EzPC框架:在AI模型驗證中增強資料安全性

微軟表示

EzPC 的核心是兩項創新。

● CrypTFlow 模組化編譯器

將用於 ML 推理的 TensorFlow 或 Open Neural Network Exchange(ONNX)程式碼作為輸入,並自動生成類似 C 的程式碼,然後可以將其編譯為各種 MPC 協議。這個編譯器既是“MPC感知”的,也是最佳化的,確保了 MPC 協議的高效和可擴充套件。

高效能的加密協議

第二個創新是一套高效能的加密協議,用於安全地計算複雜的ML函式。

微軟吹噓說,EzPC 在與斯坦福大學研究人員的測試中實現了“有史以來第一次對生產級人工智慧模型的安全驗證”,從而證明你不需要分享資料來進行驗證。儘管微軟的EzPC模型在“兩個標準的雲端虛擬機器”上用了15分鐘做帶有驗證元素的安全推理——這比普通推理要長 3000 倍,但該公司表示,這並不重要,因為計算並行可以解決這個問題。

根據目前的方法,驗證集中的 500 多個影象在五天的時間內完成了推理,總成本不到 100 美元。微軟聲稱,如果所有的資料都是並行執行的,它可以在 15 分鐘內完成對整個集合的推理。你可以在這裡發表的論文中探討這些發現。