文献标识码: A
DOI: 10.20044/j.csdg.2097-1788.2022.03.002
引用格式: 文凯,马寅,王鹏,等. 基于光量子计算的信用评分特征筛选研究报告[J].网络安全与数据治理,2022,41(3):13-18.
0 引言
目前,量子计算是未来的计算发展趋势,全球各主要研究机构和公司选用不同的物理方案来制造量子计算机,主流的技术路线包括超导量子计算、光量子计算等。超导量子计算系统对环境要求苛刻,要求在绝对零度附近的超低温下才能工作;光量子计算其原理是使用光量子的叠加态对组合优化问题进行指数级求解加速。基于光量子系统的相干伊辛计算架构(Coherent Ising Machine,CIM)[1],具有光量子常温下编码操控和其在相干时间、室温工作、全联接等方面的技术优势。目前,国内北京玻色量子科技有限公司等企业,已完成第一台全国产光量子计算原型机的设计制造。
CIM可以充分利用光量子常温下编码操控的技术优势,实现100~100 000量子比特的量子计算的有效应用和算法优越性验证[2],并且可以广泛地应用于生物制药、交通、人工智能[3-7]等领域。在金融风控领域,特别是在信贷业务场景下,需要利用客户多维度的特征,对客户未来的违约行为做出预测,从而进行风险控制决策。因此好的风控评估模型能为银行风控业务提供从资产负债、信用风险、反欺诈、反洗钱等全方位完整的风险控制方案。在建立风控模型的过程中,随着大数据时代的到来,客户数据维度呈指数型增长,传统的特征筛选方法需要人工经验的参与,对大维度数据的处理显得较为吃力,亟需创新式的解决方案。量子计算作为超强算力的代表,在此领域拥有极大的潜力。
在信用评分的建模场景中[8],特征选择在整个过程起着至关重要的作用,通过筛选后续入模的特征从而提高模型的准确率和效率,并具有更好的泛化能力。尤其是在特征数较大时,不同特征的选择将决定最后信用评分模型的整体效果。本文将采用传统信用评分的建模逻辑,对于特征筛选这一环节,采用量子计算的方式进行优化,从而对整体模型效果进行提升(并与传统方式的特征选择进行对比)。通过建立相应的二次无约束二值优化(Quadratic Unbounded Binary Optimization,QUBO)[9]模型来实现特征选择,该模型理想情况下选择既独立又有影响力的特征。此次研究主要通过量子计算解决QUBO模型来实现特征选择,相比传统信用评分的特征选择,在不牺牲准确率的前提下,量子计算效率更高而且人工干扰更少,并在特征数很大时,解决了人工筛选难度大的问题。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000004899。
作者信息:
文 凯1,马 寅1,王 鹏2,朱德立2
(1.北京玻色量子科技有限公司,北京100016;2.光大科技有限公司,北京100083)