在当今复杂多变的金融市场中,信用评级模型已成为债券投资中的重要工具之一。它不仅帮助投资者评估和量化信用风险,还为投资决策提供了坚实的数据支持。随着市场需求的不断演变和金融科技的飞速发展,信评模型的搭建和优化仍有很高的讨论度,比如:择券是基于业务人员判断还是量化模型统一评估?模型敞口怎么定?行业周期怎么体现等等。DM上线了45个行业敞口,覆盖全转债、abs等全信用的评分,本文将基于DM对众多金融机构客户的深入需求分析和丰富模型咨询项目经验,以问答的形式,探讨信评模型搭建过程中的关键问题和解决方案,旨在为读者提供一份实用的指南。
一、为什么需要信评模型?
1.统一项目审批标准
通过引入一个标准化的风险评估模型,确保了不同部门和个人在信用风险评估时能够遵循统一的准则,从而消除了因个人主观判断差异而产生的评估不一致性。这种标准化的方法提升了决策的一致性和可预测性。
2.精细化风险定价与投资决策
模型将风险评估从简单的二元决策(通过/未通过)转变为更为细致的评分系统,为投资决策提供了更为精确的依据。我们可以根据每个债券的具体风险评级和预期收益率,进行更为精细的风险收益权衡,进而构建出更优化的投资组合。
3.强化风险监控与预警能力
信用评级模型能够设置预警机制,当投资标的的风险评分低于预设阈值时,系统将自动发出预警,这有助于资产的分级管理。例如,如果一家公司的财务状况恶化导致其信用评分下降,业务部门可以及时采取措施,如减少持仓或要求额外的担保。
4.灵活应对市场和政策变化
在快速变化的市场环境中,信用评级模型能够迅速适应新的数据和市场条件,提供及时的风险评估。例如,在构建产业模型时,我们需要充分考虑行业风险,从宏观到中观层面确定不同行业的周期位置和相应的评级基准。这种灵活性和适应性对于我们在竞争激烈的市场中保持领先地位至关重要。
5.知识资产化与经验传承
信用评级模型将个人经验和知识转化为机构资产,这不仅减少了对单个分析师的依赖,还提高了知识的可复制性和可传递性。需要不同部门的紧密合作,最终得出的评分系统凝聚了多方智慧。这种知识资产化有助于新员工的培训和知识共享,同时也降低了因人员变动带来的业务中断风险。
二、不同行业财务特征不同,模型敞口怎么定?
我们需要在建模初期定好模型敞口,根据被评价主体的表现特征,可使用聚类等多分类算法使特征相同的主体放在一起进行模型搭建,从而能筛选出最有效且符合其业务本质的预警因子。
我们针对所有发债主体建模时,可以首先根据其信用风险决定因素不同粗分为产业、城投、金融三大类。城投主体的信用风险本质上依靠地方政府所给的支持,产业主体市场化程度较高且存在标债违约先例,金融机构的经营模式和报表结构又和城投产业主体完全不一样,因此这三类主体在模型方法和模型评价框架上就采用完全不同的方式。
更具体的说,我们在使用违约量化模型对4000+产业主体的进行财务预警因子筛选时,发现主体的经营模式最终会影响其财务表现,且不同行业主体的违约原因不同,全部放在一起跑模时无法得出最有效的指标因子,而是会筛选出对绝大数产业样本有效的预警因子。并且不是所有行业都有标债违约样本,所以无法支持分行业单独建模。
因此,我们逐一梳理了历史的所有标债违约案例总结违约特征,并使用聚类算法对所有产业主体进行维度分类,基于违约特征和财务特征将37个行业合并为两类敞口进行模型搭建,分别对应制造业主体和非制造业主体。一方面,分类后的每个敞口内具有足够的坏样本,能提高模型的违约特征捕捉能力;另一方面,能保证最终筛选出的指标因子对每个敞口内样本都适用且有效。
三、财务因子筛选的量化方式有哪些?怎样将财务指标表现和违约风险直接联系起来?
在构建财务量化模型时,我们通常会涉及多个关键维度,包括偿债能力、成长能力、筹资能力、规模、投资能力、现金流、营运能力、盈利能力、资本结构和资产质量等。DM在构建行业财务量化模型的过程中,财务指标的长清单涵盖了240多个项目。在筛选有效指标之前,我们首先对具有相似属性的财务指标进行整合,这样做有助于在模型开发中实现指标多样性与分散度之间的平衡,避免模型对某一类别变量的过度依赖,从而增强模型的稳定性。
同时,还需结合财务指标的业务含义和数据特征,对数据缺失和异常值情况进行逻辑上的梳理。例如,对于均值指标,当某一成分数据缺失时,我们采用剩余数据的平均值来替代;对于增长率指标,分母取绝对值以避免负数的影响;对于比率指标,当分母缺失时,我们采取取极大值或极小值的策略,以确保模型的稳健性。通过这种细致入微的处理,我们能够确保财务量化模型在面对数据的不完整性和异常性时,依然能够保持其准确性和可靠性。
DM希望通过量化的方式对清理好后财务指标进行有效性筛选,而非单纯依赖专家业务经验挑选,旨在挖掘还未被市场发现的预警因子并且尊重数据表现。筛选的目的是为了剔除不相关或重复指标,减少特征数量,同时保证特征有效性,以提高模型的精确度和可解释性。如果使用全部长清单指标进行模型穷举,模型的计算维度和复杂度会成倍增加,形成为“维数灾难”。我们常使用的单变量分析有以下几个维度:
(1)缺失率:为了保证模型有效性和数据可获得性,剔除缺失率大于40%的指标。
(2)稳定性:为了保证指标分布的稳定性,剔除稳定性较差的指标。我们可以计算指标在不同时间周期内的群体稳定性指标(Population Stability Index,PSI),一般PSI大于0.25的指标为不稳定指标。
(3)违约区分能力:为了保证模型的预测效果,需剔除对y区分能力较低的指标。我们使用AR值衡量指标对违约的区分能力大小。剔除|AR|值较低的指标,通常设置的阈值为0.1。
(4)指标间相关性:为了保证入模变量的显著性,避免出现多重共线性,我们还需检验指标组内相关性和组间相关性。同一评价维度内或不同评价维度之间,如有多个指标相关性系数较高(如高于0.85),保留违约区分能力最高的指标。
实际业务中,我们从多个渠道收集的数据往往包含大量噪声,并容易受到异常值的影响。如果未经处理的原始数据直接用于模型,可能会导致模型整体性能下降或模型参数不稳定。因此,在对原始数据进行特征编码之后,不仅可以提高模型的准确性,还能增强模型的可解释性。在零售评分卡的构建中,虽然广泛采用WOE(Weight of Evidence)转换,但这种转换在对数据进行离散化处理的同时,可能会牺牲一部分数据的区分度。
基于技术实践,DM决定将原始数据转化为连续违约率,确保每个指标的数值唯一对应一个违约率,并将这些连续违约率作为模型的自变量。具体步骤如下:
(1)首先,我们将原始数据按数值从小到大排序,并将其分为20个等分位组,每组包含5%的数据,计算每个区间内的违约率。
(2)鉴于违约样本数量相对较少,我们采用局部回归方法对区间违约率进行平滑处理,以减少噪声的影响。
(3)为了满足自变量与因变量之间单调关系的基本假设,在完成变量平滑处理后,我们进一步对变量进行强制单调化处理。具体规则是:对于正向指标,其区间违约率应随着分位值的增加而单调递减;对于负向指标,其区间违约率应随着分位值的增加而单调递增。
(4)最后,我们利用经验累积密度函数拟合离散型单调区间违约率,通过这个映射函数,我们可以确定每个指标原始值对应的违约率。
通过上述方法,我们能够有效地处理原始数据,提高模型的稳定性和预测能力,同时保持模型的可解释性。
以关联方/营业总收入指标为例,图表中上图为区间违约率计算、局部平滑和强制单调的过程(黑色圆圈为每个分位值区间内的违约率,蓝色三角为局部平滑后的区间违约率,黄色实线为强制单调后的分位值违约率趋势线),下图为通过密度函数映射后的连续违约率。
从上图明显可见,关联方占比越高,样本违约率越高,尤其是0.4-0.8分位值区间,违约率有明显增加。违约率转化相较于WOE转化,业务解释性更强,通过变量和违约之间的关系能明显看出每个指标对于违约的影响,且更适用于违约样本偏少的情况。
四、经营表现和财务状况如何结合?
传统内评模型里大多仅考虑公司的财务状况,一是因为公开财报数据可得性较高,二是指标处理较为简单,打分卡灵活可调。但是财务指标有滞后性,且并非所有经营表现都反映在财务数据中,所以需要我们结合经营和财务数据得出一个综合评价结果。DM产业模型评价框架如下:
整体我们的整体评价框架立足于投资研究的逻辑,全面考量企业的经营和财务表现。在经营评价方面,DM系统地收集并整理了涵盖37个行业的500多个经营指标。通过单变量分析,我们筛选出既有效又适合纳入模型的指标,为每个行业构建了评分卡。这些评分卡结合了专家的判断,更加注重对信用资质的排序,以确保评价结果的准确性和实用性。在财务表现方面,我们以标债违约为因变量(y),运用计量经济学模型对财务指标进行回归分析,目的是识别出能够有效预测违约风险的财务分析指标。下图是部分经营数据示例:
在整合经营和财务两方面的结果时,我们摒弃了传统的线性打分卡方法。在选择技术路线时,我们的目标是确保混合模型的风险预警能力能够实现“1+1>2”的效果。这意味着混合模型不仅要能够捕捉到财务违约概率(PD值)和打分卡得分中任一指标所揭示的违约风险,确保两类风险不会相互抵消,还要能够识别出那些在财务状况或经营数据单一方面看似风险不高,但整体信用风险显著的情况。
此外,混合模型的输出更倾向于连续型数值,而非简单的违约与否的二元标签,这有利于后续的信用风险等级划分。基于这些考量,模型团队最终选择了广义线性-逻辑回归(Logit)模型。在模型参数的选择上,我们综合了专家的意见和定量检验的结果,不再单一依赖计量结果,也不再受制于参数不显著的问题。
五、宏观和中观风险如何在模型中体现?
在综合考虑混合经营和财务表现后,我们能够确定发债主体在分行业建模中的信用风险相对排名及其差距。然而,由于不同行业所处的周期不同,以及行业内企业经营状态和发展趋势的差异,我们需要从行业维度对评级分布进行调整,以实现信用评分的跨行业可比性。在评估行业风险时,我们考虑的维度包括行业收入和盈利能力的周期性、行业进入壁垒、竞争格局、稳定性以及产业链结构等因素。基于这些考量,我们构建了中观景气度指数(DM),针对不同行业,选择与行业营收、净利润等经营情况密切相关的指标,预测行业的景气程度。通过分析这些指标与市场经验的相关系数,我们对各指标赋予权重,并加权处理后综合得出行业整体的景气走势和当期景气程度预测。
在模型实践中,中观景气度指数的应用主要通过调整混合模型参数(截距和斜率)来实现。这样做可以在不改变混合模型得出的各行业发债主体信用风险排名的前提下,对其原始得分和预期违约率进行调整,以便使用统一的标准来映射各行业发债主体的预期违约率。简而言之,基于逻辑回归得出的混合模型预期违约率分布虽然形态正确,但均值和方差存在偏差,需要进行“平移”和“压缩/拉伸”处理以校正数据分布。参数调整的具体步骤包括:首先,根据行业景气度指数的结果,为37个行业设定预设级别中枢;然后,依据专家对行业内样本的评级意见,确定风险较低和较高的两个评级锚点;最后,在遍历参数后的结果中,选出最优的风险等级分布。
六、如何验证模型是否有效?
一旦信用评级模型开发完成,无论其设计理念多么贴近实际业务需求,或者采用了多么先进的算法技术,我们最为关注的始终是模型的有效性。核心问题在于模型的预测结果是否具有准确性,即模型在实际应用中能否提供可靠的评估结果。
(1)区分能力:衡量模型是否能对主体的信用资质进行合理排序。我们可以观察违约主体和非违约主体的评级分布,违约主体的级别分布是否明显位于风险较高级别,也可使用KS、AR、AUC等检验统计量辅助判断。通常来说AUCARKS的取值范围都是0~1,值越大说明模型对于好坏样本的区分能力越好。在检验整体模型之后,我们也可以分行业统计,观察是否有个别行业的区分能力较差,以进一步调整。
(2)稳定性:检验模型在新样本中的推广能力,是否仍能保持稳定的区分能力,一般可用PSI来检验建模数据级别分布和验证数据级别分布是否一致。为了能评价模型在不同经济周期的表现力,新样本选取时可使用跨周期样本。
(3)预测能力:通过模型计算违约主体在违约前1~2年的级别结果,观察违约主体是否在违约前已经出现模型级别逐渐下调的情况。同时也可构建级别迁移矩阵,理想情况下模型级别越低的企业未来违约的概率也会逐渐递增。