基于时空聚集的网贷反欺诈建模与研究
2020年信息技术与网络安全第2期
俞旭峰1,王澎1,郭威2,张子柯1
(1.杭州师范大学 阿里巴巴复杂科学研究中心,浙江 杭州 311121; 2.阿里巴巴集团 新零售技术事业群,浙江 杭州 310008)
摘要: 识别突发的团伙欺诈已经成为网贷业务中亟待解决的问题。在特征维度较少的情况下,提出了一种基于时空聚集的网贷反欺诈模型。首先基于用户定位信息和申请贷款的时间,设计了一个适用于网贷场景下的聚集指标:KN最近邻指数;然后,将不同时间观察窗口的K-N最近邻指数利用基于LSTM(长短期记忆网络)的seq2seq(序列到序列)模型提取embedding(嵌入)特征;最后,利用LightGBM模型预测欺诈发生的概率。实验结果表明,所提出的指标能更有效地捕捉坏账,且相比于仅使用基础特征,预测结果的KS值和AUC都有了较好的提升。
中图分类号:TP391
文献标识码:A
DOI: 10.19358/j.issn.2096-5133.2020.02.013
引用格式:俞旭峰,王澎,郭威,等.基于时空聚集的网贷反欺诈建模与研究[J].信息技术与网络安全,2020,39(2):69-74.
文献标识码:A
DOI: 10.19358/j.issn.2096-5133.2020.02.013
引用格式:俞旭峰,王澎,郭威,等.基于时空聚集的网贷反欺诈建模与研究[J].信息技术与网络安全,2020,39(2):69-74.
Anti-fraud modeling and research of online loans based on time and space aggregation
Yu Xufeng1, Wang Peng1, Guo Wei2, Zhang Zike1
(1.Alibaba Research Center for Complexity Sciences,Hangzhou Normal University,Hangzhou 311121,China; 2.New Retail Technology Business Group,Alibaba Group,Hangzhou 310008,China)
Abstract: The identification of sudden gang fraud has become an urgent problem in the online loan business.In the case of less feature dimensions,this paper proposes an anti-fraud model of online loans based on spatiotemporal aggregation.Firstly,based on the users′ location information and the time of applying for the loan,a clustering indicator suitable for the online loan business,K-N nearest neighbor index is designed;Then,the K-N nearest neighbor index of different time observation windows is used to extract embedding features from seq2seq (sequence to sequence) model based on LSTM (Long Short-Term Memory);Finally,the LightGBM model is used to predict the probability of fraud.The experimental results show that the proposed indicator can capture bad debts more effectively.Compared with only using the basic features,the KS value and AUC of the prediction result are better improved.
Key words : data mining;financial fraud identification;spatiotemporal data analysis;neighbor index;LSTM
0 引言
网贷具有以下3个重要的优势:高回报、覆盖面广、需求量大,所以最近几年得到持续蓬勃发展。然而,网贷在给借贷者带来便利、及时的金融服务的同时,也给放贷方带来了欺诈者的攻击威胁的风险。首先,网贷主要是面向那些没有抵押、在传统信贷体系之外的借贷者;其次,网贷业务中个人数据较敏感,放贷方难以充分获取用户真实数据,所以那些缺少较为全面的反欺诈风控机制的放贷方面临着重大损失的风险。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003164
作者信息:
俞旭峰1,王澎1,郭威2,张子柯1
(1.杭州师范大学 阿里巴巴复杂科学研究中心,浙江 杭州 311121;2.阿里巴巴集团 新零售技术事业群,浙江 杭州 310008)
此内容为AET网站原创,未经授权禁止转载。