摘要:人工智能技术和大语言模型在金融市场的广泛应用,为解决传统金融优化中的技术局限提供了难得机遇和载体,显著赋能了金融问题的建模机理和决策优化。本文基于金融行为最优化的核心逻辑,围绕金融产品价格和投资收益预测、投资组合和资产交易的决策优化、金融风险识别和管理中的精准性、金融监管手段和效果的先进性等核心问题,将传统金融方法与人工智能金融方法进行对比,揭示人工智能技术在优化金融问题中的范式革命与技术重构过程和结果,总结人工智能应用于金融建模和决策的具体路径和方法创新,展现人工智能金融在优化问题中的优异表现,尤其是人工智能金融显著提升了预测的精准度,优化了资产定价和交易的决策机制,实现了金融风险识别和金融监管手段的智能化和精细化。
作者:殷德生,华东师范大学经济与管理学院、中国金融研究院教授;王涵,华东师范大学中国金融研究院博士研究生。
本文载于《学术月刊》2026年第3期。
一、引言
党的二十届四中全会关于“十五五”规划的建议,要求加快人工智能等数智技术创新,全面实施“人工智能+”行动,以人工智能引领科研范式变革,加强人工智能同产业发展相结合。其中的一个重要结合就是人工智能金融。传统金融学理论的核心问题可归纳为多目标、多约束条件下的最优化决策问题,确立了优化方法在金融理论建构与实证分析中的基础地位。但随着金融市场环境日益复杂和加速演变,非凸性、不确定性与动态反馈机制愈加凸显,传统模型的适用边界和求解能力面临持续挑战。人工智能(AI)方法在处理临高维非线性、信息不完全与行为异质性等多重复杂性方面具有明显优势,在金融建模与决策领域的应用日益广泛。这就需要以优化问题驱动为主线,系统整理AI方法在金融建模与决策中的技术优势与应用潜力。优化问题驱动的人工智能金融研究方法创新的内在逻辑,就在于通过问题结构化、目标函数设定与求解路径优化,实现对复杂金融行为的动态建模。
近年来,AI技术在金融研究中的应用不断深化,推动了金融建模范式从理论先设向数据驱动转型。随着金融数据体量呈几何级数增长,AI技术在模型构建、信息提取、特征工程和动态适应等方面展现出系统性技术优势,被广泛用于高频交易、微观结构分析与非结构化文本处理等领域,显著提升了模型的预测精度与稳健性。大量基于机器学习(ML)、深度学习(DL)与大语言模型(LLM)等算法技术的研究,打破传统金融研究对结构化经济指标的依赖,对政策文件、企业公告、社交媒体等非结构化数据进行挖掘,实现对市场情绪、政策信号与企业行为的识别分析,为金融决策与政策评估提供了更加全面及时的数据信息支撑,对金融行为的生成机制、策略演化路径与市场微观结构进行了动态建模与系统刻画。在风险管理与监管科技领域,AI方法亦突破传统静态估计与线性设定限制,推动构建以优化问题为驱动的动态预测与调控模型,增强了金融系统应对尾部风险与极端波动的韧性。AI方法通过历史数据学习与多轮迭代优化,为有限理性行为提供了基于经验归纳与数据驱动的优化学习机制,使金融建模过程从传统的函数设定与解析形式求解,逐步转向以经验学习、启发式搜索与数据归纳为特征的方法路径。在提升模型全局寻优能力的同时,亦丰富了金融模型对行为机制、信息反馈与动态调整过程的刻画,为金融模型的行为解释、动态预测与政策仿真提供了全新的建模工具和理论依据,不仅能够提升模型的求解性能,也有助于增强其在政策模拟与监管评估中的可解释性与制度适配性。因此,当前人工智能技术正以金融优化问题为驱动,形成融合结构建模、动态学习与语义识别的金融研究方法体系,重构微观金融理论和宏观金融逻辑。
基于优化问题驱动的人工智能金融在时间序列预测、资产配置、风险管理与监管科技等核心领域的经典应用发挥了日益重要的作用。在资产价格预测与波动率建模中,AI模型有效提升了结构信号与噪声的识别能力,在非平稳环境下展现出更强的样本外预测稳健性;在投资组合管理中,AI技术通过优化因子构造、信号生成与权重调整,增强了策略的动态适应性与实时响应能力,强化学习进一步支持策略的迭代优化与风险控制。在信用评估、欺诈识别、违约预警及舆情分析等领域,AI方法不仅提高了识别精度和响应效率,而且在非结构化数据分析中展现出突出的语义理解与异常检测能力,推动金融风险识别由结构预设向数据驱动转型。AI技术还加速嵌入金融监管流程,在合规监测、异常交易识别与政策反馈评估等方面提供了强有力支持,助推监管科技从规则驱动向智能响应转变。总之,优化问题驱动的人工智能金融研究在应对高维非线性、动态不确定性与制度约束交织的金融环境中,提供了一种兼具技术先进性与经济解释力的系统性分析框架,不仅突破了传统建模范式的局限,也为金融系统中的风险管理、策略生成与政策干预提供了新的路径与工具。
本文结构安排如下:第二部分揭示人工智能金融如何实现金融产品价格和收益预测精准度的提升;第三部分分析人工智能金融中资产投资与交易管理策略是怎样得到优化的;第四部分阐述人工智能金融中的风险管理方法及其应用;第五部分梳理人工智能金融中的监管科技与监管效果。这四个部分旨在集中展现人工智能金融的范式革命和技术重构。最后部分是总结。
二、人工智能金融中产品价格和收益预测精准度的提升
AI技术在金融时间序列预测中的应用本质上是一种优化问题驱动的建模过程。运用AI算法,将预测任务形式化为损失函数最小化问题,在非线性、高维度和结构复杂的金融数据中识别潜在规律,实现更优的模型拟合与泛化性能,预测的精确性远高于传统模型。
(一)金融资产价格的预测
关于股票、汇率、加密货币等资产的价格预测,主要使用人工神经网络(ANNs)、支持向量自回归(SVR)和遗传算法(GA)等基础AI方法,捕捉金融时间序列中的非线性模式与短期波动特征。Hassan等较早提出融合隐马尔可夫模型(HMM)、ANNs与GA的混合模型,用于股票市场走势预测,验证了无需预处理下AI方法的可行性与优越性。在汇率预测方面,Fu等融合粒子群优化(PSO)与GA对SVR进行结构改进,提升了对人民币汇率的预测精度,在95%显著性水平下显著优于传统SVR模型。
AI技术在金融预测中的应用不断升级迭代,从传统神经网络扩展至深度学习、优化算法、混合建模与大语言模型等方向,强调以优化预测结果为导向,结合数据处理、特征构建与模型结构改进。长短期记忆网络(LSTM)、循环神经网络(RNNs)以及深度置信网络(DBN)成为金融资产价格预测中的主流模型。Bekiros构建基于RNN的启发式学习模型,模拟有限理性代理人在市场中的适应行为,其在道琼斯指数收益与累计收益方面的预测优于线性模型,尤其在高波动环境下优势更显著。Shen等提出改进的DBN模型,通过优化输入节点数、隐藏节点数和隐藏层数等结构,在多种汇率预测中取得优异表现。Fischer和Krauss利用LSTM对标普500成分股进行预测,准确率和夏普比率显著优于无记忆模型。Gülmez引入ARO(Artificial Rabbits Optimization)算法对LSTM的超参数进行全局最优搜索,在道琼斯指数个股预测中显著改善了均方误差(MSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)等指标。
在预测决策中,解决金融资产价格的高波动性、非线性及强噪声问题,是最为关键的技术难题。结合频率分解、去噪处理与结构重构等方法进行AI建模,不仅能够丰富特征空间,也能增强预测模型在处理非平稳、高噪声时间序列中的表现。一类研究将经验模态分解(EMD)及其扩展方法作为前置步骤,与深度学习模型结合,提升对非平稳时间序列的预测能力。典型做法是,将EMD等信号分解算法与LSTM联合应用。Zhang等构建了一种融合变分模态分解(VMD)、LSTM与SVR的混合模型,用以削弱数据非平稳性、更精准捕捉时序特征并集成预测结果,显著提升了煤炭价格预测的精度和稳定性。Deng等结合多变量经验模态分解(MEMD)与LSTM,采用多输入多输出(MIMO)策略捕捉股指时间序列的复杂动态特征,在标普500指数、上海证券交易所指数和恒生指数的预测上取得优于基准模型的表现。另一类研究聚焦于构建集成模型,以结构解耦与功能模块优化提升对金融市场高波动性、非线性及多源异质数据的建模能力。这类模型通常将特征提取、时序建模与预测输出等环节模块化分工,通过多算法融合提高系统稳健性与预测性能。例如,Deng等构建融合深度学习与强化学习的循环深度神经网络(RDNN)框架,前者用于动态特征提取,后者用于交易策略优化,并通过任务感知型时间反向传播方法提升训练稳定性,在白银与糖期货市场预测中取得稳健结果。Bhambu等提出深度随机向量函数链接网络(RedRVFL),融合RNN与RVFL结构优势,在11个金融资产预测中均显著优于SVR和LSTM方法。模糊推理与神经网络组合在处理市场模糊信号方面具有优势,Atsalakis等提出基于模糊神经元控制器的预测模型,在比特币等加密资产价格的预测中精准性和稳定性都很明显。对于影响金融资产预测的其他因素,AI模型的应用也加快渗透。例如,情绪变量对资产价格变动有着重要影响,Kraus和Feuerriegel采用RNN与LSTM架构构建金融情绪模型分析金融文本,其预测准确率相较传统机器学习方法提高了8.3%。
(二)资产收益及其波动率的预测
机器学习方法广泛应用于金融资产收益及波动率预测。Oztekin等证实,支持向量机(SVM)在预测准确性方面优于多层感知机(MLP)与RNN,即使在特征维度有限的情形下,仍具有较强的稳定性。Dong等通过改进LASSO方法提取多空异象组合中的预测信号,显著提升市场超额收益的可预测性。Zografopoulos等将LASSO正则化融合进神经网络结构,对美国行业ETF组合收益进行预测建模,获得了稳健的夏普比率与阿尔法收益。Gu等提出融合自编码器的非线性因子模型,提升了资产收益变化的解释力与预测效果。Murray等采用一系列神经网络架构,证实了深度学习在预测实际收益方面的技术优势。
金融资产收益的波动对情绪变量的影响相当敏感。Obaid和Pukthuanthong发现图像在捕捉高强度情绪信号中具有独特作用,通过应用CNN算法对《华尔街日报》新闻图片进行情感识别,所构建的模型在预测股市回报方面具有明显优势,特别是在市场恐慌情绪高涨时,其预测精准性是平常时期的2.8倍。在大宗商品市场,Pan等利用随机森林(RF)方法引入在线新闻文本情绪指标,显著提升了原油期货收益率预测的精度。Van Binsbergen等通过量化分析师预测偏差,发现预测误差较大的公司更倾向于择机增发股票,揭示了管理层可能策略性利用市场情绪进行资本运作。这些研究表明,AI模型在整合异质化、多源情绪变量方面具有强大能力,情绪变量本身也正成为理解资产价格波动与投资者行为的重要载体。
在债券收益预测上,机器学习同样展现出强大的建模能力。Bianchi等指出,股票与劳动力市场变量对短期国债收益预测效果更佳,而产出与收入变量更适合用于长期债券。Huang和Shi提出监督自适应组LASSO(SAGLasso)方法,从917个宏观变量中筛选并构建对政府债券超额收益具有较强预测力的因子,显著提升样本外预测能力。Jiang等从期限结构视角出发,利用机器学习建模宏观经济变量与债券收益间的非线性关系,发现短期债券收益更易受利率与货币政策影响,长期收益则更多受储蓄与房地产等结构性因素驱动。
尽管不同资产类别在特征维度与数据噪声结构上存在差异,合理选择建模方法仍是提升预测性能的关键。集成学习与模型融合策略普遍展现出更强的稳定性与通用性。Barak等通过组合多个分类器并融合其预测结果,发现最优集成模型预测准确率超过80%。一些采用模型平均与集成方法的研究,在收益预测中也取得显著效果。
在波动率建模方面,传统GARCH类模型在市场相对平稳时表现良好,但在存在剧烈波动或结构跳变情境下预测力显著下降。为增强对复杂动态过程的适应性,一类研究探索将GARCH与AI算法结合形成混合模型。Pérez-Hernández等构建了SVM、LSTM、ANN、GARCH与EWMA的多模型融合结构,在VaR框架下评估其对市场风险因子波动率的预测性能,证实该混合模型在多种风险状态下均优于传统方法。
深度学习技术凭借其对复杂非线性关系的强大识别能力,正逐步成为金融资产波动率预测的重要工具。Pradeepkumar和Ravi引入PSO算法构建分位数回归神经网络(QRNN)模型,克服了传统神经网络易陷入局部最优的问题,在外汇、黄金、原油及标普500指数的波动率预测中表现出色。Vidal和Kristjanpoller将时间序列数据转化为图像输入CNN识别模式,再由LSTM建模时序依赖,该模型在黄金价格波动率预测中的均方误差相较于单独的GARCH和LSTM模型分别下降了37%和18%。Cao等利用LLM从企业财报电话会议中提取语义特征,构建多模态预测系统,显著提升了模型在股价波动率预测中的表现。
(三)市场趋势识别与交易信号预测
趋势预测和价格预测在原始数据的输入特征上是相似的,但趋势预测研究目标通常简化为判断未来价格相较于当前价格的涨跌方向,这一设定更符合实际交易决策逻辑,也降低了对模型绝对预测精度的要求。针对不同输入数据构造方式对模型性能的影响,Patel根据两类不同特征输入方案,对比分析ANN、SVM、RF与朴素贝叶斯(Naive Bayes)四类主流机器学习模型在印度股市价格走势预测中表现,发现RF在处理原始连续特征时具有最优预测性能,而所有模型在采用趋势型离散输入后均实现了准确率的提升。为解决股价序列的非线性与非平稳性问题,Zhou等提出了一种EMD与因子分解机神经网络(FNN)的融合模型(EMD2FNN),选取中国上证指数、美国纳斯达克指数与标普500指数且覆盖震荡、上行与下行市场特征的三类代表性数据,发现基于EMD2FNN的多空交易策略在平均年化收益率、最大回撤、夏普比率等方面都具有突出的优越性。
通过融合技术指标、价格与基本面数据等多源数据,挖掘其间潜在的互补关系,可以构建更具信息丰富度的预测模型,提升模型对市场动态的解释能力与预测性能。Long等提出一种融合投资者交易行为与市场信息的深度学习框架DSPNN,基于知识图谱的个股相关性结构,结合交易行为聚类与CNN提取特征,对中国A股1日、5日和7日股价预测的准确率分别达到71%、65%与74%,验证了多源信息融合在提升股价趋势预测准确性方面的有效性。除个股信息之外,Chen等进一步引入市场整体特征,提出图卷积神经网络(GCN)融合架构,所生成交易策略的年化收益率较基准状态提升约100%。Jiang等将历史股价转换为二维图像,借助CNN从图表中自动提取预测信号,预测性能显著提升。
(四)衍生品定价与动态对冲
衍生品定价是金融资产价格时序预测的重要应用场景,传统上主要依赖Black-Scholes等经典模型。但在面对金融市场中的高频扰动、结构性跳变以及隐含波动率非平稳等复杂情形时,参数化建模方式存在明显局限。现有研究大量引入AI方法,依托其非参数学习能力与多层次特征提取机制,显著提升模型预测能力。例如,人工神经网络擅长捕捉输入与输出间的非线性映射,已被广泛应用于期权定价与动态对冲任务。Hutchinson等提出基于MLP与径向基函数(RBF)的非参数定价方法,在标普500期货期权数据中表现出优于Black-Scholes模型的定价与对冲效果。Garcia和Genay构建基于前馈神经网络的广义期权定价公式,引入齐次性提示分解定价函数,增强样本外预测能力。AI方法在网络结构与定价约束融合方面持续迭代。Cao等构建融合无套利约束的混合门控神经网络(hGNN)期权估值模型,通过乘法结构隐藏层与单独的隐含波动率预测网络,有效提高模型解释力与预测精度。除期权外,AI方法也逐步拓展至其他金融资产的定价领域。例如,Griffin等利用梯度提升树(GBT)分析市政债券定价行为,发现交易网络结构、交易商行为与投资者认知偏差显著影响定价结果。这类应用的主要贡献在于引入了行为特征与市场微结构变量。
三、人工智能金融中资产投资与交易管理的策略优化
金融投资管理本质上是一类高维、多约束、动态演化的优化任务,涵盖因子构建、交易策略制定与资产配置等关键环节。凭借在非线性建模、特征提取与自适应学习方面的明显优势,AI方法在金融资产投资、交易、管理领域的应用日益拓展,为实现更优的风险收益与决策效率之间的平衡提供了有力保障。
(一)因子投资的策略优化
因子投资(Factor Investing)是一种基于可量化特征的系统化选股与资产配置策略,核心在于识别并利用驱动资产收益的系统性因子以获取超额收益。传统Fama-French三因子、Carhart四因子及Fama-French五因子模型通常假设资产对因子的暴露关系为线性,但在金融市场结构日益复杂、变量维度迅速扩张以及因子间相互作用高度非线性的情形下,这类模型在解释能力和稳健性方面存在明显的局限性。AI算法因其强大非线性建模能力与数据驱动特性,日益成为因子投资研究的重要工具,显著提升了因子识别效率、模型预测精度与动态适应能力,尤其在多市场与跨区域环境中表现出更强的稳健性。Feng等提出增强型深度因子模型,自动提取“深度特征”,Chen等将无套利约束嵌入神经网络结构,构建非线性资产定价模型,均在风险因子识别、横截面收益解释与预测性能方面优于传统模型。因子表现受地区制度环境影响显著,存在明显异质性。Tobek和Hronec发现动量因子在欧洲市场不显著,而在日本市场上账面市值比因子具有明显风险溢价。AI算法对不同类型企业的股价预测效果也存在显著差异。Leippold等基于中国股市构建包含1160个信号的因子集合,发现神经网络对小盘股和民营企业具有更强的预测能力。
尽管AI方法在因子投资中展现出良好的应用前景,但也面临一些挑战,也是未来的突破方向。首先,因子冗余与解释力不足问题。随着高维特征数据的广泛应用,因子数量迅速增长,可能导致模型结构稳定性下降。Feng等构建了双重机器学习框架下的两阶段LASSO模型,发现大多数新因子缺乏统计显著性。Freyberger等则发现,被检测的62个常用公司特征中仅13个具有稳健的边际解释力。为减少高相关性因子所带来的估计偏误,Sun提出了基于LASSO回归的OWL(Ordered-Weighted LASSO)方法,验证了流动性、动量与盈利能力因子的关键性。诸如L1正则化、稀疏编码与自适应特征选择机制的应用,旨在提升因子筛选的有效性和增强模型的结构透明度。其次,因子收益存在明显的时变性。传统因子模型多基于静态设定,难以捕捉因子在不同市场环境下的动态变化。为应对此类结构性不稳定,人们采用RNN、LSTM或Transformer等深度时序模型,动态刻画因子暴露与市场状态之间的演化路径。最后,模型落地时经常忽视实际交易约束。多数研究仅关注收益与风险之间的权衡,较少考虑交易成本、滑点(Slippage)、流动性等现实约束,导致最优策略的实际执行效果不佳。为此人们引入强化学习等基于反馈机制的算法,实现在动态市场环境中的多目标优化与策略自适应调整,提升投资策略的执行效率与市场稳健性。
(二)算法交易的策略优化
算法交易(Algorithmic Trading)旨在通过计算机程序在预设规则下自动完成证券买卖决策与交易执行,由算法根据历史数据、市场行情和特定逻辑条件,自主决定买入、卖出、持仓或平仓的时机、价格与数量,并在毫秒或微秒级别内完成交易指令的下单与撮合。针对算法交易,现有研究主要集中于三个方向:一是,提升买卖点识别的准确性,优化交易时机。传统策略大多依赖固定规则,难以灵敏捕捉市场趋势变化。AI技术的应用不断增强模型的时点判断能力,将时间序列预测模型与交易策略相结合。Sezer和Ozbayoglu将股价及技术指标转化为图像输入CNN模型,根据图像对买卖点进行识别分类。在对9支ETF进行的实证检验中,该模型交易成功率达71.51%,平均年化收益率为13.01%,约为基准模型的三倍。二是,优化买卖价差、交易频率和头寸规模等关键交易参数。传统策略往往静态设定相关参数,难以应对市场条件变化。Jeong和Kim结合深度神经网络与强化学习动态确定交易头寸,并引入迁移学习提高模型泛化能力,在实测中获得的总利润较基准提升了13至30倍。Syu等构建TripleS选股系统,运用模糊集方法量化股票特征与策略适配度,实现更优的选股与投资组合管理。Ha和Zhang构建了一个基于限价指令簿(LOB)实时信息的优化算法,将大额市场订单切分为多个小订单分时执行,在保持执行效率的同时显著降低交易引发的价格冲击。三是,构建更具适应性和稳健性的交易系统架构,增强策略在复杂环境中的稳定性。多智能体系统(MAS)通过多个具有自主学习能力的代理协同运作,可有效提升策略对市场不确定性的响应能力。Huang等构建基于时序特征提取网络的多代理深度强化学习框架,各代理根据不同投资偏好学习交易行为,最终集成为稳健的交易策略。He等提出结合生成对抗网络(GAN)的多智能体虚拟市场模型(MVMM),生成真实的市场价格序列供强化学习代理学习,以提升交易策略学习和适应不同市场的能力。
(三)投资组合优化
投资组合管理的基本目标是在可接受的风险水平下实现投资回报最大化。早在1952年由Markowitz的“均值—方差”模型开始,后经资本资产定价模型(CAPM)与套利定价理论(APT)引入系统风险因子,为资产定价与组合优化提供了理论工具与标准化路径。随着金融市场结构日益复杂、资产类别迅速扩张以及投资者行为显著多样化,传统模型在处理高维特征、多期动态路径、交易成本约束和行为偏误等方面逐渐暴露出适应性不足,导致许多优化模型在样本内的效果良好但在样本外的鲁棒性却较差。于是,主动投资组合管理重新受到重视,AI方法也在该领域被广泛使用,尤其在资产选择、参数优化、策略执行及动态适应等方面取得显著进展。
首先,基于投资策略优化的组合管理方法创新。Wu等运用k-means聚类算法,引入距离信息以优化资产筛选,弥补传统“均值—方差”模型仅依赖协方差的局限,构建出更加稳健的股票池,实现高达32.13%的年化收益率,夏普比率同样优于传统组合。Lu和He考虑了交易成本和投资者背景,提出一种改进的PSO算法以解决约束组合问题,在香港市场的测试中表现出更优的稳定性与风险控制能力。在多期组合优化方面,Dai和Qin引入动态风险偏好调整机制,并使用遗传算法求解多期“均值—方差”问题,验证了不同投资期内投资者风险态度和投资决策的变化趋势。
其次,基于市场价格预测的投资组合管理。为避免高、低动量股票相对收益分布呈现双峰特征可能带来的亏损风险,Han提出了深度动量模型,利用深度神经网络估计个股收益分布并分类构建组合,在美股市场实现了最高82%的年化收益率,显著优于传统动量策略。Chen等结合ML方法与“均值—方差”模型以确定最优投资组合配置,指出由于ML方法能更好地捕捉股票市场未来特征并得到更准确的股价预测结果,其构建的最优投资组合在收益和风险两方面的策略结果均优于基准模型。
最后,大语言模型(LLMs)大规模应用于投资组合优化中。Lu等证实ChatGPT基于非结构性文本生成投资建议的可行性,特别是在处理《华尔街日报》新闻和中国政策公告时,所构建的投资组合每月可实现3%的阿尔法收益率,证实了深度文本理解在资产配置中的价值。Ko和Lee采用ChatGPT进行投资组合管理,发现其所构建的投资组合在多样性与表现方面均优于随机选择的基准策略,凸显了大语言模型挖掘文本背后的市场信号并支持复杂投资决策的应用潜力。
四、人工智能金融中的风险管理方法创新及其应用
金融风险管理涉及如何准确识别潜在风险、量化风险敞口,并实现有效的预警与动态应对等复杂问题。传统方法在捕捉非线性关联、传染机制与动态反馈效应方面明显局限,特别是在面对突发事件、非结构性信息或行为反馈驱动的市场波动时更是难以应对。AI技术在欺诈检测、风险评估、信用评级与破产预测等关键环节展现出强大的风险识别与监管优势。
(一)金融欺诈检测
金融欺诈检测(Fraud Detection)的核心任务是在海量交易数据中识别出异常行为,如虚假交易、信用操纵与洗钱等。这类问题通常表现为高度稀疏的分类任务,伴随着严重的数据不平衡、行为模式高度异质以及欺诈策略的快速演化,极大地挑战了传统基于规则的风险控制系统。欺诈交易通常在全部交易中占很小比重,传统的评估标准会掩盖模型对少数异常类别,特别是欺诈行为的识别能力。为此人们引入精度—召回权衡机制(Precision-Recall Trade-off)。常用策略包括分类阈值调整、优化调和均值指标以及构建加权损失函数等,以适应不同业务对误判类型的风险容忍度。例如,Sahin等提出了一种基于成本敏感的决策树方法,考虑不同类别的误分类成本,能够更好识别欺诈交易和最小化潜在财务损失。
近年来,人工智能金融中欺诈检测的研究主要集中在信用卡欺诈、保险欺诈、财务欺诈和反洗钱识别等领域。在信用卡欺诈检测上,广泛采用决策树(DT)、SVM、RF、神经网络(NN)等监督学习方法。Bhattacharyya等发现SVM与RF在多个性能指标上显著优于传统逻辑回归模型,尤其是RF模型的欺诈识别率最大提升超70%。Xu等将GCN与监督学习结合,基于贷款申请人及其联系人的特征与社交关系构建图结构,显著提升了多人共谋型欺诈的检测能力。
针对欺诈检测面临的类别不平衡、标签稀缺等问题,人们采取无监督或半监督学习策略,主要包括自编码器(AE)、去噪自编码器(DAE)、生成对抗网络(GAN)以及基于生成式预训练模型(GPT)的自回归建模等。其中,AE和DAE通过特征重构与噪声消除,增强对少数类样本的表示能力。GAN通过模拟欺诈或正常交易的潜在分布,生成具有代表性的合成样本,融合GAN生成样本后训练的分类器,其在异常交易检测中的整体性能显著提升,尤其在提高召回率方面表现突出。而基于GPT的自回归建模方法适用于从大规模行为序列中自动提取潜在的异常交易模式。Zhao等利用GPT架构对海量支付数据进行自监督预训练以避免对大量人工标注的依赖,提升模型对异常行为的判别能力,并结合差分卷积方法,强化对行为序列中细微变化的感知能力,在精度与召回率上均优于传统方法。
在保险欺诈检测上,Liang等构建设备账户关联图、账户交易图及好友关系图,应用GCN提取结构特征,提升了模型对复杂网络行为的建模能力,该方法在运费险上的预测准确率超过80%,较基础分类器多识别约44%的可疑账户。这表明尽管欺诈者行为具有欺骗性,但关系图结构相对稳定,可作为更为可靠的欺诈识别特征。Gomes等提出具备动态适应能力的无监督深度学习框架,实现从事后识别向事前预警的转变。
在财务欺诈识别上,现有研究主要围绕时间序列建模、多源特征融合与文本语义提取等关键问题展开。Chen和Han将企业财务数据建构为融合时间序列与财务指标的三维数据,设计双阶段映射机制,通过深度神经网络有效捕捉潜在欺诈行为及其时序动态演化特征。欺诈行为往往还伴随治理结构异动、市场预期偏离等非财务异常,Achakzai和Peng集合机构投资者持股比例、分析师预测误差、高管薪酬等关键非财务特征,提出动态集成选择算法(DES),在重复违规行为的识别上效果突出。为解决结构化财务数据在语言操控检测方面的局限,Bhattacharya和Mickovic基于分析文本微调预训练语言模型BERT,实现对文本语义中的欺诈线索精准提取,识别出的可疑公司样本数量高出传统方法的5倍。
(二)金融风险评估
信用风险评估不仅是金融机构进行放贷、定价和风控管理的核心环节,更是监管部门保障金融稳定的重要参考。Baesens等发现,与传统的逻辑回归相比,神经网络在多个数据集上的预测准确率有明显提升,且最高可达7.18%。然而,Crook等指出,尽管SVM与神经网络在准确率上优于传统模型,但神经网络模型的解释性较差,难以为拒贷客户提供合理解释。因此,AI方法运用于金融风险评估也在快速迭代。
首先,信用风险建模从传统专家评分和逻辑回归模型转向更复杂的机器学习和深度学习方法。Shi等提出kNN-GNN模型,通过k近邻构建图结构并利用GNN分类,在一系列评估指标上优于其他主流模型。该方法在不平衡数据场景下表现出色,有效避免了对外部信息的依赖。除模型算法本身的优化外,信用风险评估效果还依赖于面向复杂场景的数据预处理机制。Chen等强调,开发信用风险评估模型要注重借款人真实信用状况的关键变量的全面获取与合理利用。传统信贷评分模型只基于已接受的申请构建的数据集,而将被拒绝的贷款申请排除在外,这会导致样本选择偏差。为此,Mancisidor等提出融合两类样本信息的评估框架,利用AI方法深度学习客户特征与违约行为之间的关系,估计其违约与履约的后验概率,该方法有效缓解样本选择偏差。
其次,多分类器架构的集成模型在信用风险预测中实现了更高的精度。Lessmann等在对41种分类算法在8个真实信用评分数据集上的比较中发现,集成算法在全部性能指标上均优于单一分类器,尤其是异构集成方法占主导地位。Fitzpatrick和Mues指出,提升回归树(BRT)、RF等集成模型的预测性能显著优于传统的逻辑回归模型。Gunnarsson等同样认为,大多数信用风险数据集的样本规模有限,相比而言集成算法更为稳健。尽管如此,但集成方法的“黑箱”特性限制了模型的可解释性,难以满足金融监管和业务决策中的透明性需求。针对该问题,Dumitrescu等开发了一种结合短深度决策树规则与惩罚逻辑回归的混合建模框架,通过决策树捕捉变量间的非线性关系和交互作用,并生成可解释的二元特征以输入逻辑回归模型,以保持较高预测能力的同时增强可解释性。
最后,在金融风险评估中引入文本、行为等外部非结构化信息,以弥补结构化数据在信息表达维度上的局限性。例如,Fu等使用深度学习方法从文本评论中提取投资者情绪,利用LSTM模型预测平台违约风险,在对正常运营平台和违约平台的识别任务中均能达到80%以上的精确率。一些文献还基于企业运营相关的文本资料,挖掘其潜在的风险信息。Yin等利用法律判决文书证实非结构化文本信息在捕捉信用风险方面具有重要作用。对于缺乏完整财务记录的场景,非结构信息的应用就显得更为重要。Kriebel和Stitz从P2P借贷平台用户提交的贷款申请文本中提取行为信号,发现即使是简短文本也能显著改善违约预测性能。skarsdóttir等使用通话记录数据和社交网络信息,提升违约预测模型的表现。
(三)信用评级
无论是专家判断还是财务指标分析,传统信用评级机制受制于信息滞后、主观性强及透明度不足等明显局限。神经网络与SVM等AI方法已被广泛应用于信用评级中。Zhao等改进MLP模型,通过优化训练、验证与测试集的分布结构,使模型在德国信用数据集上的预测准确率达到87%,较以往最佳结果提升约8%,尤其是适用于不平衡的数据分布。SVM在处理评级问题中的有序分类结构上表现出良好性能。Kim和Ahn提出的多类别SVM模型,具有较强的适应性与预测能力,在韩国信用评级上的模型表现优于其他基准模型。近年来,集成学习方法逐渐成为信用评级的新手段。Lessmann等通过评估多种信用评分模型的分类性能后认为,集成方法尤其是异构集成模型,在各项指标上普遍优于单一模型。针对企业信用评级中的类别不平衡问题,Sun等使用SMOTE算法创建不同程度的人工高风险样本,结合Bagging技术随机抽取低风险样本,这一集成模型在识别高风险企业方面表现明显更优,其召回率高达0.84。
(四)破产预测
企业破产预测是典型的分类任务。传统上以统计模型为主,以满足动态复杂环境下的风险识别需求。而后,支持向量机、遗传算法、进化算法、神经网络等AI方法被广泛使用,展现出优于传统模型的预测性能。现有研究致力于提升单一模型在对不平衡数据建模时的精度与解释性。例如,Divsalar等基于德黑兰证券交易所财务数据开发的遗传编程模型,不仅预测效果强于基准模型和神经网络算法,还保留了模型的可解释性,识别出速动资产占比和负债率为破产预测贡献最大的关键财务指标;Cleofas-Sánchez等应用联想记忆算法,构建基于神经网络的HACT模型,在不平衡样本与高重叠数据场景下的表现仍然稳健。
单一分类模型难以在不同数据结构和市场环境下保持一致优异表现,因而集成模型被广泛采用。Du Jardin构建可捕捉企业财务状况动态变化的集成框架,强调宏观经济周期对模型预测能力的影响,证实所有模型都对宏观经济环境的变化敏感,经济衰退期间的预测准确性会下降。基于传统梯度提升决策树(GBDT)模型的特征选择可能存在重要性度量偏差与选择误差问题,Qian等提出了一种基于置换重要性(PIMP)的启发式特征选择算法,将其嵌入XGBoost模型进行检验,在召回率等多项指标上均表现出色,显著优于基准模型。
五、人工智能金融中的监管科技与监管效果
金融科技的快速发展使得AI技术在金融监管中的应用深入拓展,人工智能成为提升监管效能的重要工具。现有研究从制度试点、技术机制、场景建模等多维角度,展现了AI在监管科技(RegTech)与监管效果领域的前沿应用与挑战。
(一)AI金融监管科技
AI金融监管的成效依赖于监管环境的高度适配性,尤其在监管数据可得性、算法审计机制完备性与跨机构协同能力方面。在金融监管科技上,一些国家率先开展了AI嵌入式监管的制度探索与技术实践。英国金融行为监管局(FCA)通过“技术沙盒”机制,为监管算法测试提供低风险环境;新加坡金融管理局(MAS)搭建监管数据中台,推动AI在反洗钱与客户审查等关键流程中的落地应用;中国人民银行在推进跨部门金融数据整合与大模型辅助监管系统建设方面取得积极进展,力图提升AI监管模型性能并确保制度合规与稳健性。从监管实践来看,在压力测试、逆周期资本缓冲评估与风险暴露识别等高敏感任务中,AI模型的不确定性与样本外失效风险可能引致政策误判。为此,AI金融监管科技朝着两个方向发展,通过推进建模优化与制度规制,提升监管科技工具的合规性与容错能力:一是,引入稳健建模机制,例如为模型参数设置信赖区间、引入风险厌恶因子或开展极值敏感性分析;二是,建立模型风险管理机制(MRM),明确AI监管模型的开发、验证、部署与更新流程,并纳入审慎监管体系。
(二)AI金融监管效果评估
现代金融体系结构的日益复杂以及监管政策工具之间联动效应的日趋增强,使得传统上以均衡分析和代表性经济人为核心的建模方法,在揭示异质性行为主体与动态反馈机制方面日显局限。近年来,AI技术尤其是强化学习、多代理建模以及大语言模型在金融监管领域的应用,为金融监管政策评估提供了更具行为现实性和系统响应能力的技术支持。
一方面,基于代理的建模方法在模拟金融政策冲击下主体行为的异质性反应上表现出显著优势。Fatouh等利用该方法揭示了英国银行在量化宽松政策实施后未优先向非金融企业提供贷款的机制,识别出两大原因:量化宽松政策压低了长期债券收益率,推动大型企业转向资本市场直接融资,减少了对传统信贷的依赖;巴塞尔协议II与III确立的风险加权资本监管体系,驱动商业银行更倾向于发放抵押贷款,以提升资本使用效率。融资结构调整与监管激励机制的共同作用,降低了货币政策对实体经济的传导效能。多代理模型(MAM)还被广泛应用于政策情景的动态仿真。Vidler和Walsh据此模拟了澳大利亚政府债券市场中具有信息不对称特征的双边交易机制,考察了价格黏性与交易惯性等市场刚性因素对系统稳定性的影响。该模型为监管机构提供了动态测试集中度控制、交易规则调整与监管成本变化联动效应的实用工具,有利于增强金融监管中的政策敏感度与行为预测能力。
另一方面,将大语言模型与代理建模技术相结合,增强对复杂金融行为的解释能力,弥补了传统模型在模拟人类复杂行为决策上的局限性。Horton就指出,LLMs可以被视为一种隐含的计算人类模型(Homo Silicus),相较于传统理性经济人假设更贴近真实人类的认知偏差与行为动机。在实证层面,可通过GPT模型复现经典行为的经济实验,包括Charness和Rabin的独裁者游戏、Kahneman等的公平性实验、Samuelson和Zeckhauser的现实偏误实验,以及Horton的最低工资实验等,这些都揭示了LLMs在模拟人类经济行为和决策过程中的有效性。Gao等在传统代理建模(ABM)基础上融入LLMs构建新框架,嵌入具备交易者画像、市场观察和工具学习能力的智能交易代理,展现了LLMs+ABM框架在行为金融与监管政策研究中的潜力与前景。
AI驱动的金融监管评估正逐步形成涵盖行为建模、制度情景推演与异质性动态反馈分析的综合体系,为应对系统性金融风险、优化政策组合与提升治理能力提供了理论创新与技术支撑。在复杂金融体系中,不同监管工具组合可能引发多重联动效应,而AI技术将在宏观审慎监管、货币政策识别、金融稳定监测、消费金融政策评估以及跨境资本流动管理等关键领域得到更广泛的应用,并为金融监管工具搭配与动态调整提供关键量化证据。
六、总结
人工智能技术的广泛应用尤其是大语言模型的兴起,为解决传统金融优化中的技术局限提供了难得机遇和载体,显著赋能了金融问题的建模机理和决策优化。本文基于金融行为最优化的核心逻辑,围绕金融产品价格和投资收益预测、投资组合和资产交易的决策优化、金融风险识别和管理中的精准性、金融监管手段和效果的先进性等核心问题,将传统金融方法与人工智能金融方法进行对比,揭示AI方法在优化金融问题中的范式革命与技术重构过程和结果,总结人工智能应用于金融建模和决策的具体路径和方法创新,展现人工智能金融在优化问题中的优异表现,不仅包括金融产品价格波动的预测、投资收益率变动的预测,以及投资组合选择的优化和交易策略的优化,而且包含金融主体的目标函数、策略生成机制及动态调整过程中的适应性行为变化,由此带来的金融风险精准识别和防范措施优化,以及日趋复杂金融结构环境下金融监管工具和策略优化,提炼当前人工智能金融的框架、范式和功能。
基于优化问题驱动的建模框架,AI方法不仅提升了模型对复杂金融环境的适应能力,而且为有限理性经济行为提供新的解释机制。在高维、多源数据语料的环境下,市场参与者难以通过封闭解析实现最优选择。AI方法通过历史数据学习与多轮迭代优化,为决策主体提供了近似最优的行为路径,构建了一套经验归纳、启发式搜索与数据驱动相结合的学习机制和预训练模型,例如,在目标函数设计中,AI方法可嵌入经济逻辑、制度约束与行为机制,使建模过程兼顾预测性能与理论解释力,推动金融优化分析从静态函数走向动态策略。与传统金融方法相比,人工智能金融在一系列金融核心问题分析结果上的成效更为显著。在金融时间序列预测中,人工智能金融提升了对资产价格走势、波动率及市场趋势的识别能力,并在衍生品定价与对冲中表现出更高的环境适应性。在投资组合管理中,人工智能金融优化了因子提取、交易信号生成与组合权重配置流程,支持了策略在动态市场中的自适应更新。在金融风险控制领域,AI方法在信用风险评估、欺诈检测与破产预警等任务中显著优于传统模型,提升了系统性风险识别与响应能力。在金融监管上,AI技术正加速嵌入金融监管科技与实践,在合规监测、交易审查与监管政策评估等方面表现出赋能监管效率与风险干预的新潜力,推动金融监管向智能化、精细化与实时化方向演进。
当AI技术嵌入金融问题优化过程,研究范式就开始由依赖理论设定的静态逻辑转向融合数据驱动、机制识别与制度嵌入的动态路径,为识别金融市场微观机制、理解行为驱动路径以及提升金融决策的智能化水平提供了技术支撑。与依赖显式结构设定与线性假设的传统金融方法相比,人工智能金融模型通过深层特征提取与数据驱动机制,在缺乏先验信息的条件下识别非结构化、动态化的金融行为规律。尽管人工智能金融也面临着诸多挑战,例如,可解释性限制了模型在高合规性场景的应用,算法偏见与数据隐私问题对模型的公平性与伦理合规性提出更高要求。但随着兼具可解释性与因果推断能力的AI模型和量子科技的迭代,以及算法治理、数据治理与AI赋能金融的逻辑框架更加兼容,优化问题驱动的人工智能金融范式将更加成熟。
〔本文为国家社会科学基金项目“中国式发展经济学自主知识体系研究”(22VRC179)的阶段性成果〕