選單

商業銀行數字化轉型中的“風險資料集市”建設

作者:同盾科技金融交付專家 小新

風險資料集市是商業銀行風險管理體系的重要支撐,這絕非一句空話。

9月1日正式實施的《資料安全法》中,對資料分級分類及重要資料識別等作出了明確的制度安排,對於各領域的資料安全治理、管理、技術、基礎支撐等各層次的問題提供法律依據。

對於商業銀行來說,提升資料的分級分類管理及運用水平,使資料系統涵蓋銀行所有的業務場景,為各業務場景風險管理需要提供依據,已成為業內共識。在此背景下,在銀行風險管理中構建風險資料集市也成為必然選擇。

事實上,我國《商業銀行信用風險內部評級體系監管指引》第186條也明確規定,

商業銀行應在資料倉庫基礎之上建立風險資料集市

,內部評級體系中模型的開發、最佳化、校準和驗證應基於功能完整、強大的風險資料集市。

商業銀行數字化轉型中的“風險資料集市”建設

風險資料集市是銀行風控體系的基建之一

那麼問題來了。資料倉庫、風險資料集市是什麼?我們先簡單回顧一下歷史。

1988年,為解決企業的資料整合問題,IBM的兩位研究員提出了一個新術語:資料倉庫(Data Warehouse)。根據“資料倉庫之父”的比爾·恩門給出的定義,資料倉庫是一個面向主題的、整合的、相對穩定的、反映歷史變化的資料集合,用於支援管理中的決策制定。

商業銀行是資料密集型機構,擁有海量的金融基礎資料,且必須對資料實施統一管理,形成共建共享的資源池。這如同國家的鐵路網、交通網,必須站在全國角度統籌規劃,而不能由各省各自建設;假如那樣的話,省區邊界斷頭路等問題將造成交通體系非常低效。商業銀行的資料倉庫建設也是一樣,不能由各部門根據業務分工和職責範圍,各自建設資料系統,而是需要統一規劃管理,滿足全轄業務、監管報送等全域性性需要。

資料倉庫作為商業銀行資料統一管理的資源池,從這一概念延伸出來,資料集市則像是從水池中舀出來的一個個“瓶裝水”。一池泉水經過過濾、蒸餾、除菌可以成為純淨水;經過提取、有益元素調配就成了礦泉水;經最小限度處理過的泉水則是天然水。

這些對資料倉庫的“挖掘”和“搬運”後按照不同的品類和用途進行封裝,就是資料集市典型特徵。從理論角度講,資料集市是滿足特定的使用者或場景的需求,面向某個特定的主題,解決靈活性與效能之間的矛盾,為特定使用者儲存預先計算好的資料。

那麼問題又來了:有了資料倉庫,為什麼還要建設面向各個主題的資料集市?筆者認為,其原因在於銀行系統複雜、資料海量、統計維度眾多,因此,如果風險、營銷、運營、監管、財務管理等各類應用系統直接從資料倉庫調取資料,這樣的資料使用方式存在明顯弊端:資料倉庫中,面向各主題性質的資料被分散儲存,例如,風險相關資料散落在各個不同的資料來源中,資料使用者需要花費大量精力理清各個系統間的關係,資料質量也參差不齊;同時,各風險應用系統計算的指標重複度較高,也會造成系統運算資源的浪費。

商業銀行數字化轉型中的“風險資料集市”建設

為此,在資料分析與應用及資料倉庫之間建設風險資料集市,針對風險資料主題進行統一的資料清洗和整合,提供面向業務的風險資料,並梳理和理解資料之間的邏輯,支撐各業務場景的風控需求,可有效提升商業銀行的資料使用效率、風險管理效率。如上圖所示,左邊部分業務前臺直接使用資料倉庫,造成像蜘蛛網一樣交叉縱橫,讓人眼花繚亂。右邊經過業務領域資料集市建設,則簡練、清晰、高效,讓人一目瞭然。

商業銀行數字化轉型中的“風險資料集市”建設

對公風險資料集市建設

商業銀行的風險資料集市建立在資料倉庫之上,其資料大部分來自資料倉庫,以風險計量所涉及的資料為主,為商業銀行對公、同業、零售、信用卡業務等各種風險管理場景提供資料支撐。這其中,對公、同業、零售等風控需求既有共性,又有各自不同的特點。本文中,筆者以同盾科技對公業務風險資料集市的建設方案為例闡述。

社會學家查爾斯·培洛在其理論中認為,容易造成系統崩潰的是複雜系統失效,儘管複雜系統必然會有多種安全防控機制;但是,任何防控機制都不是完美的。安全工程裡的“乳酪片理論”也有一個觀點:每片乳酪片代表一層防控,每層都有一兩個漏洞,正常情況下,漏洞位置不同,連光線都不過;但是在很極端的情況下,每層的漏洞都串到一起,一個小失誤就有可能穿透層層關卡,釀成大禍。

筆者認為,商業銀行的風險防控是一個複雜系統,我們需要在每一層都嚴防,設定關卡,建立對公風險資料集市,就是為了設立統一的防線,把業務中的風險在第一層就儘早、儘可能的處置掉。

商業銀行數字化轉型中的“風險資料集市”建設

在實踐中,同盾對公風險資料集市打破了商業銀行風險管理“煙囪式”各自開發的現狀,解鎖“網狀式”的資料鏈路,透過建設集中式業務領域集市,為打造共享式業務資料中臺奠定基礎。

同時,也能協助商業銀行平衡靈活性與穩健性之間的矛盾,可以在一定程度上緩解資料倉庫集中訪問的壓力。

對公風險資料集市的建設大致分為整合、分層、應用三個流程。第一步首先以大資料平臺對內部資料、外部資料、產業資料為基礎進行有效整合,然後進行精細化的集市分層,同盾對公風險資料集市主要分為基礎層、彙總層和服務層,這樣的設定是呼應商業銀行的實際應用,為各下游應用提供資料服務,例如:

對公客戶評級:

資料集市將為對公評級系統提供所需的合同、貸款帳戶、財報指標等資料。採集其PD、LGD、EAD計量結果。

零售信用風險評級:

資料集市將為對零售評級系統提供計算PD和LGD所需的變數來源資料、基礎風險指標加工結果。採集零售客戶分池後PD、債項分池後LGD值等資訊。

市場風險:

資料集市將為市場風險提供市場及資金交易資料、基礎風險指標加工結果。採集一般風險價值(VAR),壓力風險價值(SVAR)等資訊。

操作風險:

資料集市為操作風險提供公司融資、支付與清算、資產管理等八大條線三年總收入資訊和部分損失資料;採集操作風險資本佔用計量結果。

流動性風險:

資料集市為流動性風險提供負債類業務、資金業務資料。採集流動性風險計量結果資訊。

資料管控:

提供風險資料集市的相關風險資料質量的監控。

商業銀行數字化轉型中的“風險資料集市”建設

同盾資料集市建設方案三個優勢

筆者認為,實踐證明資料集市的建立,有助於解決商業銀行在資料管理與應用方面的挑戰,它透過創新的資料管理方法、流程、技術,在滿足法律法規要求的前提下,充分應用好資料資源,讓資料創造價值,加快商業銀行的數字化轉型。

憑藉技術、方案、人才等方面的綜合能力,同盾資料集市建設方案目前已經在多個銀行客戶中得到應用和部署,為多個客戶的風控建設和智慧中臺建設起到支撐作用。

深厚的業務積累:

同盾在金融、網際網路、製造、物流、大健康、零售、智慧城市、政務等領域沉澱了豐富的數字化專業知識,服務企業客戶超10000家。

體系化的方法論:

同盾在自有資料體系建設以及與各行各業的合作中,沉澱了體系化的資料集市建設方法論和實踐經驗;同盾基於對模型、策略及資料分析所需風險資料的梳理,整理各場景相關的資料需求,搭建服務於企業風險管理的主題資料集市。

經驗豐富的團隊:

同盾匯聚了阿里、IBM、Paypal、銀聯、FICO、SAS、麥肯錫等頂級科技、金融和諮詢公司的成員,規模超千人,60%為碩士以上學歷。

筆者認為,隨著商業銀行數字化轉型的加速,面向不同應用場景和產業領域的資料集市建設將進入一個發展高峰。