欢迎访问中企信办信用工作办公室,今天是2025年01月03日,星期五

基于大数据及知识图谱的客群信用风险关联传导研究

随着信息技术和人类生产生活交汇融合,企业、个人的经营和社交行为日益丰富,银行的客户量和业务量也在不断增长。传统的以盯住借款人和粗放式集团管理等信用风险管理模式从效率和质量上都存在较大问题。伴随大数据、人工智能、物联网等为代表的金融科技发展,以行内外大数据为基础,以知识图谱为核心技术,以客群为风险共同体,以关联传导为重点,以自动化和量化为主要处理方式的新信用风险管理模式将发挥很大的价值,值得研究。


现状与问题


信息不对称制约了风险管理的半径


随着市场经济持续发展,企业跨区域、跨行业生产经营十分普遍,这使得银行的现场调查效率大大降低,在本地区现场很难了解到客户全部真实情况。再加上银行内部缺乏有效的信息共享机制,外部数据引进不够,银行或不可避免的存在不少重要信息,尤其是股东、实际控制人等变动信息的滞后、遗漏或缺失,从而严重影响了对客户实质风险的识别和判断。


企业集团化趋势加剧了风险管理的难度


随着企业集团化运作模式不断深入,企业越来越不是单一的个体,企业与个人、企业与企业之间的联系与交互作用愈加复杂,单个客户信用风险的爆发有可能引发整个关联客群的风险,严重的还有可能引发区域性金融风险。但目前银行对于集团关联风险、连环担保风险以及交叉违约风险等多层复杂风险的识别能力还比较薄弱,隐形集团、担保圈等管理问题也一直是难点和热点。


传统信用风险管理模式难以适应现实管理要求


目前银行还主要侧重于专注借款人和担保人风险状况,对集团客户的风险管理也主要是局限于授信额度的管理,集团动态管理不够及时、效率不高。当社会活动越来越丰富的情况下,企业经常隐藏在复杂网络之下,表面正常的企业实际可能风险暗流涌动。所以在企业、个人、机构、账户、行为等实体交错的复杂关系网络下,如何高效、高质的做好信用风险工作将是一个巨大的挑战。


思考与对策


大数据和知识图谱等技术的发展为创新信用风险管理方式提供了信息和技术支持。知识图谱本质上是语义网络,是一种由节点和边组成,基于图的数据结构。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。通俗来讲,知识图谱就是把所有企业、个人、机构、账户、行为等不同种类的信息连接在一起而得到一个关系网络,从而提供从“关系”的角度去分析问题的能力。


知识构建,整合关联


“关系”是知识图谱中连接实体的边,是知识图谱中重要的内容,从数据现状来看,关联关系是“关系”中最为丰富和质量较高的数据,知识构建中重要的工作是要充分整合提炼挖掘关联关系。目前,关系来源方式主要包括行内采集、监管机构关联关系库、征信报告及工商信息等,关系类型主要包括投资、担保、生产经营影响、贸易链、资金交易、高管、实际控制人等关系。关系知识构建就是要将多来源的关系进行充分整合,以应用为驱动,一是在直接关系基础上提炼出高管关联、家族企业关联、企业信息关联等间接关系,二是要充分挖掘各种隐藏的关系,可借鉴集团客户甄别指引中隐形关系场景,提炼股权类关联、交易类关联和担保类关联等模型复合关系。


通过关联关系的构建,最终形成行内与行外、直接与间接、单一与复合、法定和非法定相结合的关系网络,支持各实体和事件等信息的连接。


知识计算,明确关联强弱和风险客群


知识计算是一种从知识到智慧的过程,以复杂网络、图技术等人工智能算法为支撑,通过数据建模等方式对隐形关系、扩展属性及社群组织进行发现计算,去发现关系的强弱系数、高关联客群等知识。


1. 数据建模,量化关系强弱。对银行大体量的客户和业务,量化是支持风险管理的重要处理方式,关联传导分析首要是要解决关系强弱量化问题。基于积累的大量样本数据,通过数据建模去发现各类关系的强弱,即风险传导的概率大小;基于单关系传导系数,通过拟合模型拟合多关系传导系数,以确定两个企业之间唯一的风险传导系数。整个量化的过程是数据建模和专家建模相结合的过程,要结合专家经验对量化结果及样本数据量小的关系传导系数进行修正,最终确定唯一的执行系数。


2. 网络切割,建立风险客群共同体。在复杂关系网络中,客群是一个通过关系组成的共同体,对此,银行一般采取集团客户的管理方式去解决客群风险管理问题。但是,目前的集团客户管理还存在一些问题:一是以人工识别为主的集团认定方式主管性太强,标准难以统一;二是集团动态维护时效性不高,一些隐形成员游离集团之外;三是对大集团风控精细化不够,子集团的管理未有效落实等。所以,非常有必要按照共同体的思路去进行客群管理,即基于量化后的传导系数,再一次进行知识计算,主要包括:一是通过图挖掘等技术对复杂关系网络进行切割,以隐形集团识别、实际控制利益体、一致行动人、高关联体等应用场景为驱动计算出各个客群;二是根据关系和风险传导特性,采用因子聚合算法去发现客群中核心客户,找到客群的领袖,突出客群风险监测的重点。


3. 路径探索,计算传导路线和传导能量。路径是关联风险传导线路,当网络中某客户发生风险后,需要及时了解给其他客户的潜在风险传导路径,便于做出准确的决策以截断风险。但是,两客户之间可能存在多条路径,这些路径中存在传导强弱、传导快慢等问题。这些问题均需要量化解决,目前根据风险传导路径的应用场景,可应用复杂网络模型等算法去计算风险传导路径,并且根据模型应用反馈信息不断对模型进行迭代改进,达到最优化。另外,还需要根据传导强弱,进一步量化风险传导的能量。


4. 客群聚焦,计量整体限额。相对于银行认定的集团客户,通过模型切分出的风险客群将被定位为更聚焦的强关联群体,这个群体类似于子集团的概念,成员数量要适中,便于管理人员分析风险状况,如控股或同一实际控制人客群等。对于客群,可参照银行集团授信管理的模式核定客群的整体限额,考虑到客群的动态调整频率高等因素,限额的核定还是要依赖量化模型实现自动计算。由于这类客群一般没有合并报表,在主要依据成员三张财务报表的前提下,量化建模时需要通过工商投资数据对权益部分进行调整,并应用数据建模训练出其他科目的关联交易影响系数,最终核定客群整体限额。对于精细化要求不高的,可直接将所有成员授信额度相加的方式,采取最大容忍限额进行管理。


知识表现,研发多场景应用功能


为将知识更好的应用,需要借助大数据可视化等技术研发相应系统功能,包括搜索与展示、人机互动、智能客户画像和囊括事前、事中、事后的全方位智能风控等,其中智能风控可面向场景研发隐形集团、担保圈等多场景客群的展示、客群风险状况分析、知识智能作用于决策流程等功能。另外,也可对行内审批、贷后、预警等相关系统作相应改造,将知识与现有系统功能融合。


知识应用,支持信用全流程管理


知识只有应用才有价值,基于知识图谱的客群信用风险传导知识要服务于全流程的信用管理工作。


1. 助推客户准入和管理。客户全网知识具有丰富的价值,一是筛选目标营销客户。可将客户规模、行业、注册地、与行内客户关系以及一些招投标等事件作为筛选条件,去挖掘潜在目标客户,寻找银行的商机。二是辅助集团客户的认定。可利用关联关系、传导系数等信息,从控制的角度去认定集团,并辅助及时对集团成员进行动态更新。三是加强信用客户准入管理。可在发起客户分类、评级等准入事项时,利用全网知识去分析客户所处客群状况、客户自身的受传导情况等。  


2. 辅助信用业务决策。将客户全网知识直接作用于授信、用信等业务的调查、审查、审批、放款审核等决策环节中,强化知识的智能化应用。决策人员通过信贷审批系统即可查看客户的关联网络状况,了解强关联客户风险状况、客户所在的担保圈、强关联子网等信息,并可对于影响决策的重要知识强制提示决策人员关注,也可直接控制业务办理。


3. 强化信用风险监控。客户全网知识可在风险监控工作中发挥更大的作用,一是创新监控主体,将高度关联的客群作为风险共同体进行监控;二是创新风险预警建模的思路,将从客户自身信息指标作为变量扩大到从客户自身和关联企业信息两方面指标作为变量的框架,从而提高风控模型准确性;三是创新监控角度,基于传导路径、系数、传导能量及客户自身状况去量化客户的耐受力,可前瞻性的监控资金链断裂风险。


机遇与挑战


当前正是银行布局金融科技创新信用风险管理方式的最好时机。一是践行十九大报告中“推动互联网、大数据、人工智能和实体经济深度融合”的要求,让科技与金融充分融合;二是国家正在实施大数据战略,金融科技是金融行业的下一个风口,信用风险管理规划需做好前瞻性布局。三是已具备丰富的数据源。这些年,各商业银行持续开展金融IT信息化工作,行内已经积累了大量的高质量数据,且随着大数据行业的发展,外部数据的质量不断提高,应用日益成熟,内外部数据的融合铺就了大数据基础。四是知识图谱、图挖掘等技术也已成熟,且在同业有了一定的实践,如国家开发银行基于大数据技术开发了客户关联关系分析系统等。


基于大数据及知识图谱的客群信用风险传导管理模式已在农业银行完成了初步探索且深入推进中。2013年农业银行建设了集团与关联客户分析系统,通过系统可自动搜索和展示客户关系网络。为深入推动金融科技与信贷管理的融合,2016年,农业银行信用管理部联合科技部门启动了“信用大数据+AI”的信用风险统一视图项目,从知识构建、知识计算、知识存储和知识应用四个方面去打造大数据集市和智能应用功能,让数据转化为知识和智慧,最终服务于信用管理工作。主要包括:一是充分整合行内外信用管理类数据,以应用驱动进行主题建模,构建覆盖行业、区域、产品、客户的多维度、多时点的信用风险大数据视图;二是以信用大数据为基础,以人工智能算法为支撑,发挥智能应用在信贷管理全流程中提效和防控的作用。目前项目利用大数据和知识图谱技术构建了客户关系全网云图,形成了客户风险传播的知识图谱,打造了核心客户识别、风险传导测算等风险洞察引擎,并试点了高风险客户群体风险整体管控应用功能。


基于大数据及知识图谱的客群信用风险传导管理模式已初见成效,但是仍然可以从持续夯实数据基础、智能挖掘知识信息、不断创新应用模式等几个方面进行改进和提升,助力信用风险管理进入智能化新阶段。

来源:信用中国

关联链接

mqu.cn site.nuo.cn