選單

蘇宇:利用技術識別演算法歧視因素,破解差別對待“黑箱”

中新經緯7月18日電 (王玉玲 實習生 郭西子)近日,由對外經濟貿易大學數字經濟與法律創新研究中心舉辦的“演算法公平治理與實現”研討會在線上舉行。中國人民公安大學資料法學研究院院長、法學院副教授蘇宇從技術角度出發,介紹了演算法歧視的識別方法。

蘇宇將演算法歧視的識別分為兩大類情形、四種具體情況:第一類情形是程式碼本身有明顯缺陷。其中,第一種情況是將與歧視有關的敏感變數及相應的區別性處理規則直接寫進程式碼;第二種情況是程式碼儘管不直接包含基於敏感變數的歧視性規則,但包含基於替代變數的歧視性規則。

第二類情形是程式碼本身沒有明顯缺陷或者不方便探知原始碼。此種情形下可進一步劃分兩種情況:一是從演算法解釋中可以清楚發現歧視性因素,用標準化的演算法解釋方法即可揭示其中包含的演算法歧視;二是無法為差別對待的結果提供合理解釋。

針對不同的歧視情況,蘇宇副教授介紹了不同的識別方法:對於第一類情形,程式碼直接包含基於敏感變數或替代變數的歧視性規則,直接檢查程式碼就可以發現問題;對於第二類情形,不直接包含基於敏感變數或替代變數的歧視性規則,可能需要運用反事實解釋等演算法解釋方法,發現其中隱含的歧視。

如果演算法解釋顯示存在歧視性因素,可透過研究不同變數對機器決策產生影響的程度,判斷是否存在不能接受的歧視因素。具體而言,演算法解釋的常用方法主要有七種,包括區域性依賴圖、單個條件期望、置換特徵重要性、全域性代理、區域性代理、沙普利值、反事實解釋等。其中,區域性依賴圖、單個條件期望、置換特徵重要性、沙普利值、反事實解釋五種對揭示歧視性因素的解釋都是有說服力的。有些解釋方法可以結合使用,例如區域性依賴圖可以顯示一種變數對於機器學習模型預測結果的總體邊際效應,而個體條件的期望是顯示具體個案中的單個變數對決策有什麼樣的結果,二者可結合使用。整體上,基於沙普利值的解釋方法可能最有利於識別演算法歧視。

如果既接觸不到原始碼,也無法從中直接找到輸入的敏感因素,則需要用到因果關係挖掘的方法。如果演算法歧視的證明標準特別高的時候,僅有相關性是不夠的,還需要把因果性證明出來,以具備足夠的說明力。此時,首先需要發現輸入的敏感因素或其替代變數與輸出的歧視性結果之間有強相關關係,隨後基於因果結構方程建立因果模型,或透過其他方式進行因果關係挖掘。由於證明因果關係相當困難,法律上還可採用另一種方式,即讓演算法應用運營者承擔一定的舉證義務來說明為何會產生具有歧視性色彩的強相關結果。

蘇宇認為,如果識別演算法歧視的相關路徑成熟,那麼測量便是順理成章的事情。識別和測量是一體的,而測量對技術的要求更高。(中新經緯APP)

(文中觀點僅供參考,不構成投資建議,投資有風險,入市需謹慎。)

炒股開戶享福利,入金抽188元紅包,100%中獎!

開啟App看更多精彩內容