
征信機構始于19世紀30年代的美國。雛形是一些商業(yè)調研機構,服務民間或銀行借貸業(yè)務,獲取信息途徑通過招募些調研人員去街巷走訪,然后逐漸形成規(guī)模及規(guī)范化。
作為起源之地,美國有3大征信機構都有百年歷史,例如全國性3大個人征信機構益博睿、艾荃法克斯、環(huán)聯(lián)。3大征信機構數據源95%相同、覆蓋90%美國人。可以看出美國的征信數據覆蓋率是非常廣的。其征信服務覆蓋行業(yè)也非常多。在美國個人征信收到嚴格的監(jiān)管,監(jiān)管法律也非常健全,目前企業(yè)征信基本不受監(jiān)管。

在中國,最早的專職征信機構是中華征信所,于1932年6月6日創(chuàng)辦。國內征信行業(yè)快速發(fā)展基本是2003年后開始。在這一年中國人民銀行征信管理局也成立了。2017年6月個人信息安全法出臺,整個征信行業(yè)對數據的敏感性輸出做了很大調整,很多敏感信息接口都主動關停。

國內,央行征信數據其實只覆蓋了3.8億左右的自然人,覆蓋率非常低,還有幾億人只有簡單的身份數據。美國已達90%以上,因此在國內單靠央行數據已經不太符合創(chuàng)新型的互金行業(yè)信貸產品。從而催生了各式各樣的數據公司(包括備案的征信機構)嘗試將非央行征信的電商、社交等數據應用于信貸風控,例如京東白條。

無論國外還是國內,企業(yè)征信的發(fā)展都不如個人征信。從國內央行征信查詢數據來看,2015年已達6.3億,這還只是央行體系內的數據查詢量,可見征信行業(yè)市場可見還是非常巨大。以此類推,央行外的類征信數據市場規(guī)模應該也是非??陀^。

在國內還沒有一家征信機構獲得正式牌照。之前沸沸揚揚的8大征信機構也只是屬于備案階段。國內2016年底備案有134家機構,最新公布的數據其實只有133家征信機構還在備案,經過全面的初步調研,僅有20%不到的征信機構是屬于有業(yè)務開展,其他的大多還在籌備和摸索階段。這些備案機構屬于正規(guī)軍,市場上還有很多數據科技公司也在做征信業(yè)務,但為了避開監(jiān)管,多打著“信貸風控”等名號開展數據查詢的交易業(yè)務。而這些非正規(guī)軍卻非常有活力,各種創(chuàng)新的信貸模型產品層出不窮,具體哪些真的好用,還無法判斷。
后續(xù)將征信備案機構及非備案機構歸類為“大數據行業(yè)”機構

征信行業(yè)使用的數據主要包括傳統(tǒng)央行的征信數據及互聯(lián)網征信數據。
互聯(lián)網征信包含的數據主要涉及傳統(tǒng)央行的征信數據、經營數據,身份數據、社交數據、消費/財務數據、乃至日?;顒訑祿?、特定場景下的行為數據等。嚴格來說互聯(lián)網征信數據大多數與個人信用是弱相關的,因此才有N中關系型算法來驗證各種數據相關性來判斷個人信用可靠性。
傳統(tǒng)征信體系的征信(央行)由于體制和技術等原因使用多限于金融行業(yè),而互聯(lián)網金融平臺的大數據征信結果往往有在金融業(yè)外的更多應用。

互聯(lián)網征信數據使用的比較多的主要有個人身份信息(個人基本信息、教育學歷信息、駕駛證信息)、個人消費相關數據(資產信息、興趣愛好、電商注冊行為),銀行持卡人數據(POS交易信息、個人借貸卡賬單信息、線上線下支付數據),互聯(lián)網用戶及行為信息(APP瀏覽數據、WEB瀏覽數據、地理位置信息),司法被執(zhí)行信息(裁判文書信息、履約被執(zhí)行信息、失信行為信息)、借貸黑名單高風險客戶名單(傳統(tǒng)金融、互聯(lián)網金融)、航旅信息(出行頻率、票務信息)、位置信息(實時位置、常用地址、出行軌跡)等。 但掌握這些信息的企業(yè)基本屬于行業(yè)內的巨頭,例如3大運營商、京東、淘寶等。

基于國內的征信行業(yè)大調研,基于大數據的風控框架大致是這樣。一些枝節(jié)部分其實對應了貸前中后使用到的一些大數據及大數據的來源。其中對應不同環(huán)節(jié)使用的技術能力和數據源要求都不一樣。在P2P等高風險行業(yè),使用多頭數據來做阻斷或獲客都可以。數據的使用不是一成不變,均要看行業(yè)、產品、風險定價等靈活使用。在支付環(huán)節(jié),結合位置信息就成了反盜刷的功能。這里不一一舉例。

圍繞大數據框架的整體思路發(fā)展,大數據風控行業(yè)其實簡單來分有3種:個人/企業(yè)數據接口批發(fā)、個人/企業(yè)數據接口整合報告、個人/企業(yè)數據建模及分析系統(tǒng)。圖上均是行業(yè)內比較知名的一些機構。產品輸出方式:各類接口直接聯(lián)調調用、網頁版登錄查詢及管理、定制化風控報告、聯(lián)合建模。

最后說下非全自動的個人征信模型簡版思路:首先需要接入各種各樣的數據源,這些數據源需要與業(yè)務需求符合,其次將各類裸數據拆分,根據業(yè)務類型及其他規(guī)則進行特征提取,初步分類。然后,各類特征將根據不同算法逐一組合成對應模型,應用與不同業(yè)務場景。不同模型經過機器學習(監(jiān)督學習及無監(jiān)督學習)的方式,輸出相應分值,給與各模型相應的參考。最好還需要有經驗人士,根據得分進行最后的決策。

- 閃存普惠,一步到位!華為商業(yè)市場極簡全閃數據中心Pro+重磅發(fā)布
- 《企業(yè)數據治理實踐白皮書》發(fā)布,啟信寶聯(lián)合六大數交所共同編制
- 業(yè)界首個!華為數據中心自動駕駛網絡通過EANTC L4自智網絡等級測評
- AI模型的耗電量驚人 下一步是建設太空數據中心?
- 為什么制造商必須協(xié)調IT和OT,才能實現智能工業(yè)的成功?
- 打造AI時代先進算力底座,鯤鵬開發(fā)者峰會2025即將開幕
- 金山辦公宣布未來五年戰(zhàn)略:重建海外基地,優(yōu)化WPS Office用戶體驗
- 是德科技攜KAI系列布局AI新時代
- 微軟全球再裁6000人:無關績效,關乎未來
- 華為發(fā)布AI數據湖解決方案,助力企業(yè)加速擁抱AI
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。