微軟推EzPC框架：在AI模型驗證中增強資料安全性

在資料科學領域工作過的人都知道，開發一個人工智慧模型通常可以概括為 3 個階段：訓練、驗證和測試。在測試模型的準確性時，選擇驗證集來調整超引數（hyperparameters）時，通常有很多考慮。

為了進行準確的模型評估，企業傾向於使用一部分真實資料進行驗證，但自然會有很多安全和隱私方面的考慮，特別是在處理個人身份資訊（PII）方面。

如果你的模型是由一個外部公司開發的，你基本上有兩個選擇。要麼該公司與你分享其模型，這將對其智慧財產權保護構成風險；要麼你與他們分享你的真實資料，這對你來說是一種隱私風險，也可能導致模型對真實資料過度擬合。在做出這兩種困難的選擇時，也有很多法律障礙需要跳過。因此，雖然企業希望儘快採用人工智慧，但在處理資料時，模型開發過程無論是內部還是外部，他們都面臨著挑戰。

為了解決這個問題，微軟正在研究一個名為 EzPC 的新框架，它代表著“輕鬆安全的多方計算”。

從本質上講，EzPC 是基於安全的多方計算（MPC）的。MPC 使多方能夠使用加密技術聯合計算一個函式，而不向對方透露他們的資料。

雖然 MPC 已經存在多年，但事實證明它很難實現，因為在計算多個函式時，使其具有可擴充套件性和高效性的挑戰。EzPC 透過使用 MPC 作為構建塊來解決這些問題，並使開發者——不僅僅是密碼學專家——能夠在此基礎上進行擴充套件。

微軟表示

EzPC 的核心是兩項創新。

● CrypTFlow 模組化編譯器

將用於 ML 推理的 TensorFlow 或 Open Neural Network Exchange（ONNX）程式碼作為輸入，並自動生成類似 C 的程式碼，然後可以將其編譯為各種 MPC 協議。這個編譯器既是“MPC感知”的，也是最佳化的，確保了 MPC 協議的高效和可擴充套件。

●

高效能的加密協議

第二個創新是一套高效能的加密協議，用於安全地計算複雜的ML函式。

微軟吹噓說，EzPC 在與斯坦福大學研究人員的測試中實現了“有史以來第一次對生產級人工智慧模型的安全驗證”，從而證明你不需要分享資料來進行驗證。儘管微軟的EzPC模型在“兩個標準的雲端虛擬機器”上用了15分鐘做帶有驗證元素的安全推理——這比普通推理要長 3000 倍，但該公司表示，這並不重要，因為計算並行可以解決這個問題。

根據目前的方法，驗證集中的 500 多個影象在五天的時間內完成了推理，總成本不到 100 美元。微軟聲稱，如果所有的資料都是並行執行的，它可以在 15 分鐘內完成對整個集合的推理。你可以在這裡發表的論文中探討這些發現。

微軟推EzPC框架：在AI模型驗證中增強資料安全性

猜你喜歡

推薦文章