云霞资讯网

研究 | 张宏哲:挖掘用户“潜在相似性”, 提出信贷风险预测新范式

挖掘用户“潜在相似性”

提出信贷风险预测新范式

港中大(深圳)张宏哲教授的合著研究在国际经管顶刊《MISQuarterly》上发表

在消费信贷市场规模急剧扩张的当下,如何精准预测违约风险是金融机构面临的核心挑战。传统预测模型往往局限于用户已知的显性特征,却忽略了用户间未被观测到的、隐秘的内在关联,限制了风控精度的进一步提升。

针对这一背景,香港中文大学(深圳)经管学院的张宏哲与特拉华大学的WeiQian和方晓合作撰写的论文“LatentSimilarity-EnhancedCreditRiskPrediction”创新性地提出了“潜在相似性增强”(LatentSimilarity-Enhanced,LSE)预测框架。该研究通过融合可观测特征与潜在相似性,更全面地刻画了用户画像,并在实证中展现出优于XGBoost、图神经网络(GNN)等主流算法的预测性能与经济效益。近期,该研究在国际经管顶刊《MISQuarterly》上发表。

作者简介

张宏哲

香港中文大学(深圳)经管学院

助理教授

研究领域

金融科技、隐私保护人工智能、

推荐系统、医疗分析

本文合著者

WeiQian

特拉华大学

方晓

特拉华大学

研究简介

研究背景

消费者信贷市场的规模庞大且用户数量众多,信贷风险预测——即如何预测消费者信贷的违约概率以帮助金融机构进行信贷审批与管理,已成为消费信贷行业的关键问题。现有研究仅依赖于用户可观测特征计算的相似性,未能充分利用用户间潜在的、未被观测的相似性信息,这限制了预测性能的进一步提升。为应对这一挑战,本研究提出了一种潜在相似性增强的信贷风险预测模型,通过融合可观测与潜在相似性来更全面地刻画用户之间的关联,从而提升预测准确性。

研究内容

该研究首先将信贷风险预测形式化为分类任务,提出了一种融合用户自身特征与双重相似性(可观测与潜在)的新型预测框架。该模型突破了传统方法仅依赖显性特征的局限,将用户间的关联定义为“可观测相似性”与“潜在相似性”之和。在此基础上,研究构建了一种创新性的违约预测模型,其中用户的违约概率由其个人特征与相似用户的潜在信用风险共同决定。此外,该框架具备良好的通用性,不仅适用于二分类违约预测,还成功扩展至多类别信贷风险分类及数值型风险指标预测等场景。

研究方法

在论文模型部分,作者提出了一种融合用户自身特征与用户间相似性的信用风险预测框架。该模型不仅考虑用户可观测的个人特征,还引入了一种新的相似性定义,将用户之间的相似程度分解为可观测相似性与潜在相似性两部分。

其中,可观测相似性通过用户已知的特征计算得出,而潜在相似性则通过一组隐含变量刻画用户未被记录的内在属性。具体地,模型认为用户的违约概率不仅受自身特征影响,还与其相似的其他用户的违约情况有关。通过引入一个用户特定的权重参数,模型能够灵活调节自身特征与相似用户影响之间的相对重要性。参数估计过程采用正则化似然函数作为目标,并通过分块优化策略迭代更新模型参数,其中关键步骤使用梯度下降并结合矩阵加速技巧以保证运算效率。

该模型不仅适用于二分类违约预测,还进一步扩展到多类别风险分类以及数值化风险指标预测等场景,展现出较强的通用性与可扩展性。

研究结论

基于真实信贷数据的实验结果表明,该研究提出的潜在相似性增强方法(LSE)在预测精度、召回率、F1分数和AUC等多个指标上均显著优于逻辑回归、多层感知机、支持向量机、XGBoost、循环神经网络及图神经网络等基准方法。消融实验进一步验证了潜在相似性成分对模型性能的重要贡献。案例研究还表明,该方法能为金融机构带来显著的经济效益提升。此外,模型在多类别风险分类和数值型风险指标预测任务上也表现出良好的扩展性与优越性。

研究意义

该研究在方法论上提出了融合可观测与潜在相似性的信贷风险预测框架,突破了传统方法仅依赖单一特征或显式相似性的局限,为信贷风险评估提供了新的分析视角。

在实践层面,该方法能够帮助金融机构更精准地识别高风险用户、降低违约损失,同时为优质用户提供更合理的信贷服务,从而提升整体盈利水平。此外,该框架还可扩展至其他具有相似性结构的预测问题,如个性化营销、客户行为分析等领域,具备广泛的适用价值与推广潜力。