選單

數字化觀察(74)|商業銀行大資料審計探索與思考

導語:

大資料審計的研究和應用是近年來審計領域的熱點。大資料時代的到來給商業銀行內部審計帶來機遇和挑戰。筆者首先介紹商業銀行計算機輔助審計系統的演進過程,然後分析大資料審計的意義和特點。在此基礎上,重點研究大資料審計在商業銀行應用的創新思路,最後給出大資料審計的實施要點和相關建議,為今後大資料在商業銀行內部審計的應用提供借鑑和參考。

2020年10月釋出的《中共中央關於制定國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標的建議》明確提出,要發展數字經濟,推進數字產業化與產業數字化。如何利用好大資料資源,全面揭示風險,推動商業銀行的數字化轉型,服務好實體經濟,是商業銀行內部審計部門一直研究和思考的課題。本文結合大資料審計系統的建設經驗,探索大資料在商業銀行內部審計的應用實踐。

商業銀行計算機輔助審計發展回顧

商業銀行的計算機輔助審計系統建設經歷了三個階段。第一階段是“配備裝備”,將主要的賬務資料、交易資料進行T+1日採集、轉換和載入,實現了線上分析疑點資料,解決了傳統審計人海戰術的弊端。第二階段是“推廣裝備”,改善系統可拓展性及可用性,增強資料載入和處理能力,接入包括對公信貸、零售信貸、國際業務在內的更多業務資料,並向審計分支機構進行推廣。第三階段是“升級裝備”,藉以A(人工智慧)、B(大資料)、C(雲計算)為標識的資訊科技蓬勃發展之勢,統籌行內外一切可用的資料資源,充分挖掘資料的內在價值,為實現內部審計的“風險警示、監督評價、管理增值”三大職能保駕護航。第三階段的系統一般稱為大資料審計系統,其邏輯如圖1所示。

數字化觀察(74)|商業銀行大資料審計探索與思考

圖1 大資料審計系統示意圖

大資料對商業銀行內部審計的意義

美國國家科學基金會(NSF)將大資料定義為“由科學儀器、感測裝置、網際網路交易、電子郵件、音影片軟體、網路點選流等多種資料來源生成的大規模、多元化、複雜、長期的分散式資料集”。大資料技術有四個基本特徵(4V特徵),即規模巨大(Volume)、型別巨多(Variety)、增長速度巨快(Velocity)、蘊含價值巨高(Value)。大資料審計是指依照法律許可權採集各公共管理部門、社會公開的海量資料,利用跨領域、跨層次、跨行業、跨系統的全維度資料開展智慧化的資料探勘與分析,進行綜合審計判斷,形成審計結論。

商業銀行利用大資料進行審計的意義。

一是藉助更全面、更真實、更準確、更實時的大資料,形成新的審計模型,使審計更加科學、準確、客觀、統一、公正,提高審計發現問題的廣度和深度,提升審計能力和審計價值。二是解決傳統審計簡單重複勞動多、出差多、投入人力多的“三多”難題,實現對現場審計從支援、補充到替代的轉型。三是探索科技強審的路徑,推進審計工作的資料引領作用,增強風險防控的實時性、前瞻性和系統性,推動業務管理向資訊化、精細化轉型。

商業銀行具備實施大資料審計的優勢。

一是銀行儲存了客戶基本資訊、交易流水、信貸明細、客服電話錄音、網點影片錄影、網銀地理位置、資訊系統登入日誌等多種格式、多種來源的資料。二是銀行在交易處理、風險防範、管理決策等過程中積累了豐富的資料處理經驗。三是銀行富有競爭力的薪酬待遇能夠吸引高階人才。四是銀行非常重視高新技術在金融業的研究和應用。

大資料背景下商業銀行內部審計的轉變

大資料審計的特點有“五多”:一是資料來源多,如財務資料、業務資料、管理資料、監管資料、客戶行為資料等。二是審計方式多,如既可與現場審計專案相結合,又可獨自開展遠端實時審計。三是技術手段多,如在資料採集、儲存、管理、分析、演示等環節,需要多種技術配合協作。四是協調關係多,如需要協調跨部門的資源,多個被審計單位支援配合。五是分析維度多,既能客觀、真實、實時對被審計單位畫像,又能從全行甚至全行業的角度進行宏觀判斷。大資料審計為商業銀行內部審計工作帶來思維模式的重要轉變,主要有以下幾點。

全樣非抽樣

全體樣本是指在大資料環境下,要分析與某事物相關的所有資料,而不再僅僅是依靠少量的樣本資料。其優勢是深入挖掘了資料的額外價值,避免了傳統做法的抽樣風險。

大資料的這個特點不僅降低了商業銀行內審部門的抽樣風險,而且能夠更具體、更精確、更全面、更及時、更多維度地分析和掌控審計物件,實現從“審計抽樣模式向”向“總體審計模式”、從“間斷性審計”向“持續性審計”的轉型。

相關非因果

相關關係是指從大量資料中揭示事物之間的關聯聯絡,雖然其無法準確告知事情發生的起因,但是會提示我們這件事情正在發生。如大額欺詐交易之前往往會有小額試探性交易出現,而且這些交易發生的時間往往是深夜,發生的地點往往人跡罕至。

“尋找相關關係”這種思維方式,使得商業銀行內部審計部門不再侷限於尋找因果關係,不再等待事件發生後去亡羊補牢,而是改變視角,透過抓“苗頭性”風險,推進審計關口前移,進而實現從“問題揭示型審計”向“價值增值型審計”的轉型。

輪廓非精確

大資料中只有約5%的資料是結構化並適用於傳統資料庫進行處理的,剩下的95%資料都是諸如日誌、影片、音訊等非結構化(NoSQL)或半結構化的資料。這使得我們沒有必要對每個細節刨根問底,只要掌握整體脈絡方向即可。

在微觀層面上適當忽略精細度,使得商業銀行內審部門能夠從更加宏觀的視角去把握系統性、趨勢性、區域性的風險,為經營管理決策提供有價值的建議。

長尾非二八

傳統帕累托法則指出,企業80%的利潤來自20%的高價值客戶。但網際網路時代更信賴長尾理論,即只要能以足夠低的成本覆蓋足夠廣的客戶,那麼小眾客戶群對市場的貢獻將不容忽視。

由於資源有限,商業銀行內審部門過去將80%的精力投入到20%的高風險領域。而被忽略的剩餘80%領域往往能夠帶來前所未有的、爆炸性、災難性後果的“黑天鵝”事件。依託大資料,商業銀行內審部門可以進行“大膽懷疑”,輔以現場查證進行“小心求證”,才能控制好已知的未知,最大程度防範未知的未知帶來的風險。

柔性非剛性

剛性生產是指為滿足大量社會需求的規模化的生產方式;而柔性生產是指為了滿足個性化需求而進行的多品種、小批次、智慧化的生產方式。

商業銀行內部審計部門經常會面臨各種領域、各種型別的審計任務,會有五花八門、紛繁複雜的疑點資料分析需求。利用分門別類的大資料資源和便利的工具,審計人員可以透過研發規則靈活的審計模型來提取針對性強的審計線索,實現“風險提示、監督評價、管理增值”的審計目標。

遠端非現場

遠端審計是指商業銀行內部審計部門運用各種資料分析技術找出資料背後隱匿的規律,鎖定疑點線索,確定需要深入排查的人和事,並最終交由現場審計人員進行面對面溝通和確認的審計過程。

透過遠端審計,商業銀行大幅節約了投入到現場的審計資源,並且減少了對被審計單位的正常工作的影響。同時,在被審計單位沒有察覺、沒有準備的情況下開展分析與檢查工作,商業銀行內審部門會得到更加獨立、客觀、公正的結果。

商業銀行大資料審計創新應用

伴隨著大資料技術應運而生了諸如分類、邏輯迴歸、聚類、關聯、決策樹、神經網路、支援向量機、WEB資料探勘等高階演算法,使得商業銀行內部審計人員可以透過研發更加複雜和深入的模型,來提取審計線索,降低審計機構與被審計機構的資訊不對稱。目前經典的大資料審計應用有以下幾種。

用網路爬蟲技術實現審計物件全景畫像

在傳統的審計中,審計人員透過登入國家企業信用資訊系統或者啟信寶、企查查等平臺,手工查詢企業資訊。但當批次査查詢企業資訊時,這種做法將制約審計工作的時效性和審計人員的積極性。在大資料審計中,審計人員可以透過編寫Python指令碼,自動獲取wbe頁面資訊,並將資料標準解析、儲存和呈現,從而實現批次查詢的功能。透過網際網路爬蟲獲取的可供商業銀行內部審計使用的資料還包括司法、公安、稅務、公積金、國土資源、股票交易、社交活動、消費行為等資料。在遵循法律的前提下,利用網際網路資源,拓展了審計的資料來源,豐富了資料分析的維度,使得審計人員能夠更加清晰地對審計目標進行畫像。審計物件全景畫像如圖2所示。

數字化觀察(74)|商業銀行大資料審計探索與思考

圖2 審計物件全景畫像示意圖

用關係圖譜技術識別審計物件的資金流轉情況

傳統資料庫是基於二維表的關係型資料庫。而當審計人員多次連結多個大表查詢交易流水的對手時,傳統資料庫的笛卡爾積處理方式嚴重製約了交易對手的多手查詢。

而關係圖譜技術引入了關係和節點的思想,把兩兩之間的關係以圖的方式展現,再對兩兩關係圖進行連線,直觀地變成關係群組。除了識別各個主體之間的相互關係外,關係圖譜技術還能將原來不存在直接關係的各個節點進行關係延伸,對當前節點的父節點、子節點、兄弟節點等多層次關係再進行深度挖掘拓展。

商業銀行內部審計透過運用關係譜圖技術,生成資金流轉網路圖,能夠輕鬆展現資金多層流轉關係,發現重要節點之間存在的聯絡,揭露現象背後深層次的原因。

用中文分詞技術挖掘文字檔案的關鍵資訊

審計人員經常會調閱被審計單位的會議記錄、工作總結報告、貸前調查、貸中審查報告、貸後管理報告等電子文件資料,來分析和識別風險。這些檔案的儲存格式五花八門,肉眼檢視費時費力,分析效果主要依賴於審計人員的職業判斷能力,非常容易遺漏某些重要資訊,造成審計風險。

中文分詞是一種將沒有詞的界限的中文句子切分成一個一個單獨的詞的語言處理技術,可以基於字典、詞頻度統計和知識理解來進行。透過該技術手段對檔案進行識別和處理後,審計人員只要對需重點關注的名稱、地址、事件或其他關鍵詞進行詞權重提取,便能夠對檔案的重要性進行排序,進而集中力量抓住重點檔案進行突破,節省非結構化資料分析的時間和精力。

使用地理位置資訊識別欺詐事件

地理位置定位是指透過特定的技術來獲取使用者的經緯度座標資訊,進而分析出其地理位置資訊。定位技術有兩種,一種是基於GPS/北斗衛星系統的定位,另一種是基於移動運營網的基站的定位。前者是利用手機上的定位模組將自己的位置訊號傳送到定位後臺來實現手機定位的,後者是利用基站對手機的距離測算來確定手機位置的。

傳統審計手段難以對審計物件的動態軌跡進行跟蹤分析。而藉助於地理位置資訊的變動,商業銀行內部審計能夠針對抵押品、客戶、員工的行為資訊開展進一步的分析並及時發起風險預警。如某單位規定員工如果在辦公大樓附近租房,可每月獲得固定金額的租房補貼。該機構內部審計部門可利用App定位功能發現員工虛假申報租房資訊、違規獲取補貼的行為。

商業銀行大資料審計的保障措施

高素質隊伍是大資料審計的關鍵。

大資料審計首先需要既熟悉業務又精通技術,既善於溝通又樂於創新,既思維敏銳又敢於擔當的人才。而這種綜合性、複合型的人才的培養是非常缺失、無法速成以及難以招募的。商業銀行內審部門一方面應當藉助於培訓、外招、外聘等手段,做好長遠的人才儲備;另一方面應加強對基礎理論和新型風險領域審計方法的研究,促進審計人員專業素養的提高。此外,商業銀行內審部門還需以審代訓,在審計實戰中透過不斷摸爬滾打,持續推動審計人員的專業能力和實戰能力的提升。

高質量資料是大資料審計的基礎。

在資訊化時代,資料是寶貴的資源。但無論是外部資料還是內部資料,都不同程度地存在重複、缺失、不一致等問題,嚴重製約了大資料審計工作的效果。商業銀行應當按照《銀行業金融機構資料治理指引》的要求,建立覆蓋全部資料的標準化規劃,遵循統一的業務規範和技術標準;持續完善資訊系統,覆蓋各項業務和管理資料;加強資料採集的統一管理,明確系統間資料交換流程和標準,實現各類資料有效共享;建立資料安全策略與標準,依法合規採集、應用資料,依法保護客戶隱私。

高效能系統是大資料審計的引擎。

商業銀行的大資料審計平臺不僅囊括了銀行的內外部資料,而且面向不同場景的資料需求配備了各種機器學習的複雜演算法。因此,其應當構建企業級的資料平臺,實現一、二、三道防線共商共建、共享共贏、聯防聯控。只有藉助全行大資料平臺的搭建,引進先進的資料分析工具,商業銀行才能充分挖掘半結構化和非結構化資料的價值,才能按照資料化、線上化的審計創新理念,強化網際網路時代資訊科技對審計的引領和支撐作用。

作者單位:中國財政科學研究院

專欄主持人:

王煒 銀行數字化轉型課題組負責人

專欄介紹:

銀行移動化、智慧化、資料化在更高效地獲客、活客、留客的同時,給客戶帶來更便捷的服務、更低廉的價格、更友好的體驗。《數字化轉型觀察》欄目,分享數字化轉型實踐案例,分析衡量轉型效果、探討數字銀行發展等。敬請分享精彩案例與觀點。