36氪專訪人人貸顧崇倫(下):為什么說互聯(lián)網(wǎng)信貸的大數(shù)據(jù)夢,離現(xiàn)實(shí)還很遙遠(yuǎn)?
在對(duì)人人貸COO顧崇倫的上一篇專訪中,我們著重討論了該公司的模式選擇問題。站在我個(gè)人角度,之前對(duì)于人人貸的一些困惑——包括“暗箱”與透明,線上還是線下等問題——多多少少得到了解答。今天這篇專訪是對(duì)上一篇的承接,關(guān)注焦點(diǎn)由人人貸放大到P2P行業(yè),目標(biāo)仍然是為外界解答我們此前對(duì)于這個(gè)行業(yè)的一些疑惑和誤解,比如關(guān)于國內(nèi)外P2P的本質(zhì)差別,以及技術(shù)的能力界限等。
以下進(jìn)入正文,詞句有所修改:
一、互聯(lián)網(wǎng)信貸不“互聯(lián)網(wǎng)”,源于外部數(shù)據(jù)電子化和整合程度不夠高
這個(gè)其實(shí)已經(jīng)是業(yè)界共識(shí),中國的征信體系欠發(fā)達(dá),而且開放程度有限(比如只有銀行和當(dāng)事人才能調(diào)用征信報(bào)告),導(dǎo)致一些P2P要么模式比較重,要么干脆是輕審核的狀態(tài)。雖然國家層面有一些數(shù)據(jù)庫(包括央行和其他機(jī)關(guān)),政府也在推動(dòng)信用數(shù)據(jù)的整合和開放,但沒走到這一步的時(shí)候,基本只能依靠企業(yè)自主整合來實(shí)現(xiàn)。
站在企業(yè)自主整合的角度,目前可以有學(xué)歷、工商、第三方征信等開放數(shù)據(jù),在用戶授權(quán)下,也可以拿到電商、社交等私密數(shù)據(jù)。比較理想情況下,借款用戶只需提交一個(gè)身份屬性,平臺(tái)即可以獲取完整的數(shù)據(jù)拼圖。而當(dāng)你做不到的時(shí)候,只能讓用戶自己填寫上傳資料,此時(shí)會(huì)涉及到一個(gè)數(shù)據(jù)校驗(yàn)的問題。
目前國內(nèi)做P2P的邏輯是這樣:先考慮用戶的數(shù)據(jù)拼圖里需要哪些資料,能夠電子化獲取的就電子化,不能做到的,就讓用戶自主上傳,然后通過其他線上或線下手段驗(yàn)證——P2P的互聯(lián)網(wǎng)化,會(huì)是一個(gè)逐步演進(jìn)的過程。
二、征信是P2P的核心,大的玩家都會(huì)往這個(gè)方向走
很多P2P企業(yè),包括人人貸和陸金所,其實(shí)都想往征信的這個(gè)方向去走。大家想做征信,很大程度上也是因?yàn)樽约烘湕l里缺失這一環(huán)。如果國家先做了,民間當(dāng)然不用自己做,但就現(xiàn)狀而言,更多還需要民間去推動(dòng)這一進(jìn)程。
一般來說,真正的互聯(lián)網(wǎng)信貸需要先搜集數(shù)據(jù),然后做數(shù)據(jù)驗(yàn)證,之后再根據(jù)歷史壞賬、交易記錄做審核模型。這個(gè)模型,簡單說有一些評(píng)分法,復(fù)雜一點(diǎn)的會(huì)做數(shù)據(jù)挖掘。 目前包括人人貸在內(nèi),各家在這一點(diǎn)上做得其實(shí)并沒那么好。 在數(shù)據(jù)獲取都比較困難的前提下,各種模型也只能不斷嘗試和研究。但即便如此,一些公司和機(jī)構(gòu)的在數(shù)據(jù)整合上還是會(huì)走得很快。民間走得快,國家也會(huì)跟進(jìn)得快一些。國家想要將民間的一些動(dòng)作規(guī)范起來,這就要求國家在數(shù)據(jù)整合和開放上的行動(dòng)更加迅速。隨著P2P的受監(jiān)管地位被明確下來,相信得到認(rèn)證的P2P非常有可能拿到央行征信接口。
三、國外P2P和國內(nèi)P2P,關(guān)鍵差異在于是否提供保障機(jī)制
在顧崇倫看來,國外的P2P模式其實(shí)跟國內(nèi)不那么可比。 但是否提供保障機(jī)制,是兩者的一個(gè)關(guān)鍵差異。
Lending Club在對(duì)借款人評(píng)級(jí)的時(shí)候,能拿出一個(gè)相對(duì)公允的評(píng)級(jí)標(biāo)準(zhǔn)(FICO),這是公眾比較認(rèn)同的。國外公眾長期受到信用教育,明白不同信用數(shù)值的意義,認(rèn)同不同信用得分借不同金錢的觀念。這樣用戶可以自擔(dān)風(fēng)險(xiǎn),平臺(tái)審核工作可以變得很輕,這才能做成比較純粹的交易所模式。
但國內(nèi)情況是缺少這么一套公認(rèn)的評(píng)級(jí)標(biāo)準(zhǔn)。平臺(tái)自己去做評(píng)級(jí),用戶不知道你給出的信用等級(jí)是什么意思,因此才衍生出了本息保障一類的東西,這是歷史演變的結(jié)果。理論上,本息保障、承諾收益都是不應(yīng)該存在的,整個(gè)金融行業(yè)都不能做收益承諾。但現(xiàn)實(shí)來看,中國幾乎沒有一家P2P不提供某種形式的擔(dān)保。即便是一些聲稱不參與風(fēng)險(xiǎn)的類Lending Club模式的P2P,也在用戶投資標(biāo)的分散的前提下提供“有限保障”。
平臺(tái)不提供保障,用戶不知道憑什么做出投資決策。而且如果平臺(tái)只盯著交易量,不管風(fēng)控,也會(huì)衍生出道德風(fēng)險(xiǎn)。 風(fēng)險(xiǎn)誰來管,保障就由誰來做,風(fēng)控者的身份應(yīng)該和保障者合一 ——不管是自己擔(dān)保,還是由第三方做保險(xiǎn)擔(dān)保的模式,其實(shí)都是這個(gè)邏輯。
【重點(diǎn)】四、互聯(lián)網(wǎng)信貸,最核心的還是結(jié)構(gòu)化數(shù)據(jù),大數(shù)據(jù)的作用十分有限
在人人貸看來,非結(jié)構(gòu)化數(shù)據(jù)對(duì)互聯(lián)網(wǎng)信貸更多的起到輔助作用,這一點(diǎn)長期可能也不會(huì)變。顧崇倫表示,國外的信用評(píng)估模型發(fā)展了這么多年,至今還是主要依靠借款人的收入、借款歷史、聯(lián)系方式和居住地穩(wěn)定性等傳統(tǒng)金融數(shù)據(jù)做評(píng)估,恰恰說明了這些結(jié)構(gòu)化數(shù)據(jù)的核心地位。
而對(duì)于一些非結(jié)構(gòu)化數(shù)據(jù),比如社交大數(shù)據(jù),因?yàn)槠淙鄙倜鞔_定義、不規(guī)整的特性,只能去做一些主動(dòng)性的挖掘和探索。 如果你做的是結(jié)構(gòu)化數(shù)據(jù),比如10個(gè)變量對(duì)應(yīng)1個(gè)結(jié)果,可以通過一些數(shù)據(jù)挖掘算法找到不同變量對(duì)結(jié)果的影響權(quán)重及其是否顯著有效等,結(jié)構(gòu)化數(shù)據(jù)是可挖掘的。但如果是非結(jié)構(gòu)化的數(shù)據(jù),比如社交應(yīng)用中的文字,你很難直接使用并且找到它對(duì)結(jié)果的影響,這樣的數(shù)據(jù)價(jià)值就比較低。
面對(duì)這些大數(shù)據(jù),挖掘者不知道什么東西對(duì)自己有用,只能去猜測條件和結(jié)果之間的關(guān)聯(lián),驗(yàn)證關(guān)聯(lián)性后,才能把它當(dāng)做一條規(guī)則來用。比如針對(duì)借款人,雖然你可以在他的搜索行為(比如有無檢索過“信用卡套現(xiàn)”這類關(guān)鍵詞)和逾期率之間做挖掘,但事實(shí)上,這里對(duì)數(shù)據(jù)的運(yùn)用還是基于人的思考。人先想到,再用數(shù)據(jù)驗(yàn)證,然后才成為實(shí)施方案——這樣的東西是很難反向挖掘的。
[ 36氪 原創(chuàng)文章,作者: 沈超]