為了防止信用卡盜刷,機器學(xué)習(xí)算法給你畫了一副「肖像」
盜刷信用卡風(fēng)險已經(jīng)成為困擾全球銀行信用卡部門的難題之一。僅以美國為例,美聯(lián)儲的支付調(diào)查報道顯示,2012年全美信用卡支付總金額達(dá)到260億美元,這其中未經(jīng)授權(quán)的信用卡支付,也就是盜刷信用卡的金額高達(dá)61億美元。
對銀行而言,衡量信用卡交易的風(fēng)險非常困難。要實現(xiàn)這個目標(biāo)必須快速確定哪些交易是合法授權(quán),哪些交易是盜刷的。那么這些工作又是如何實現(xiàn)的呢?
站在消費者的立場來看,檢測信用卡盜刷的過程似乎很「神奇」,這種檢測幾乎是瞬時發(fā)生的,背后涉及到一系列復(fù)雜的技術(shù),從金融到經(jīng)濟到法律再到信息科學(xué)。當(dāng)然,有些信用卡盜刷的檢測很簡單,比如,當(dāng)機器發(fā)現(xiàn)信用卡刷卡地的郵編與發(fā)卡地的郵編不符時會發(fā)出警告。
傳統(tǒng)的信用卡檢測需要大量人力參與到海量數(shù)據(jù)的分析判斷上,算法只會對一筆交易發(fā)出警告,最后人類審核員會打電話確認(rèn)這筆交易是否涉嫌信用卡盜刷?,F(xiàn)在,由于交易量激增,各大銀行的信用卡部門開始依靠大數(shù)據(jù),并通過機器學(xué)習(xí)和云計算的方法快速甄別未經(jīng)授權(quán)的信用卡交易。
用于信用卡檢測的機器學(xué)習(xí)算法首先將被海量正常的交易數(shù)據(jù)和持卡人數(shù)據(jù)進行訓(xùn)練。交易結(jié)果會成為機器理解交易的一個重要維度,比如一個正常人可能每周買一次電、每兩周去一趟購物中心等等,這些交易結(jié)果將成為正常交易的模型。
接下來,機器將接受實時交易數(shù)據(jù)的考驗,并給出該交易是否不合法的概率,比如97%,如果檢測系統(tǒng)設(shè)置每筆交易不合法的概率不能高于95%,那么所有這些交易將被拒絕接受付款,換句話說,交易不會成功。
這個算法考慮的因素很多,包括刷卡供應(yīng)商的信任度、插卡讓購買行為(時空維度)、IP地址等等,考慮的因素越多,其構(gòu)建的模型也越準(zhǔn)確。
這個檢測的過程幾乎是實時的,這也是人類工作者無法達(dá)到的檢測速度。但整個流程中還是需要人類的參與,包括人類對算法判斷的審核以及隨后的信用卡欺詐跟蹤等等。
金融交易過程中的數(shù)據(jù)非常大,比如目前PayPal要處理1億690萬用戶的1.1PB數(shù)據(jù)。但對機器學(xué)習(xí)而言,越多的數(shù)據(jù)意味著越能提升自身的算法準(zhǔn)確度,從而更好地識別盜刷信用卡的事件。海量數(shù)據(jù)對于銀行IT系統(tǒng)的硬件要求非常高,數(shù)據(jù)的存儲、讀取和分析,都成為巨大的IT開支。
目前,銀行的信用卡部門開始使用云計算作為處理海量數(shù)據(jù)的方式,云計算彈性可伸縮的特性能夠機器學(xué)習(xí)算法運行的效率,有效應(yīng)對諸如雙11等刷卡高峰期時的信用卡檢測
圍繞信用卡盜刷和反盜刷的戰(zhàn)爭一直在持續(xù),借助于機器學(xué)習(xí)、大數(shù)據(jù)和云計算以及今后可以實現(xiàn)的區(qū)塊鏈技術(shù),未來我們的錢包和卡包會越來越安全。