欢迎访问中企信办信用工作办公室,今天是2024年12月22日,星期日

大数据构建企业图谱

一只蜜蜂的机体所代表的模式,只适用于其十分之一克重的更细小的翅室、组织和壳质。而一个蜂巢的机体,则将工蜂、雄蜂以及花粉和蜂窝组成了一个统一的整体。一个重达五十磅的蜂巢机构,是从蜜蜂的个体部分涌现出来的。蜂巢的群体智慧远远大于其组成的个体智慧。一个斑点大的蜜蜂大脑,只有六天的记忆,而作为整体蜂巢所拥有的记忆时间是三个月,数倍于一只蜜蜂平均寿命。这是凯文.凯利二十年前在《失控》中的一段描述,揭示了个体与群体的关系。

工业文明缔造的金融机制以经济实体个体为度量基础,评估企业经营通过三张黄金会计表:资产负债表、损益表、现金流量表,对个体历史数据竖向分析。但面对更迭更快的经济周期和市场,对企业间行业间的全局量化能力更为重要。本文借助复杂网络等大数据技术,通过企业资金往来行为构建全局度量体系,实践中借助金融体系内部数据,从供应链到企业图谱,建立复杂网络核心参数(强健性、活跃性和流通性),度量资金活性和贷款计提成本,动态定价。同时识别资金风险,关联交易等投融资黑洞。

一、大数据发现和度量事物彼此联系,构建全局的高阶智慧

大数据颠覆传统商业智能(BI)数据仓库经营分析的路线,一方面是从群体共性统计描述到个性化刻画的过程,自动化算法取代业务规则预判,电商的各类个性化推荐系统在这方面实践很多;而另一方面,则是用创新的数据结构把个体构建成群体的全局知识体系,提炼出高阶的系统和个体的评估量化指标。人类历史上最成功的全局数据结构应用就是门捷列夫的元素周期表,每一个个体数据在统一参照系中被精确量化,即便某个个体元素还没有被发现,数据缺失情况下同样可以推断出它的物理特性。对于国内会计数据缺少或失真的现状,如何评估2000万中小微企业的经济运营,大数据在金融体系的落地更需要后者,即全局化建立企业图谱的路线。

构建群体智慧的首要条件就是发现彼此的联系,串联蜜蜂个体智慧的,是工蜂之间跳八字舞的行为,在蜂巢哪个位置跳八字舞,这些联系赋予了整个蜂巢的群体智慧,能够记住上一个采蜜季节,能够找到几百公里以外的蜜源。捕捉个体间交往行为的联系,才能提炼和获得更高阶层的群体智慧。描述声音的联系创作音乐,抽象色彩的联系创作绘画,那么量化经济实体之间的往来经济行为,我们就可以抽象出整个经济活动体系,同时评估个体经济实体在整体经济环境中的经济指标。

二、资产评估到行为评估,供应链金融到企业图谱

早期的金融贷款是一种抵押物贷款模式,银行首先会对企业厂房、各种股票、汽车等资产进行评估,并作为抵押物来进行贷款,也就是企业的信用来自于资产评估。

供应链金融开始从交易行为中抽取事件作为评估依据,取代了传统方式用资产做信用评估的方式。比如汽车行业,一旦上游企业整车汽车厂向轮胎厂下一个订单,需要供应5000个轮胎,那么轮胎厂就可以拿订单找银行贷款,订单就可以代替抵押物进行贷款。供应链金融建立起来的链条关系是线下的技术诀窍(know how)建立的,要看行业积累,靠从业人员的经验来确定上下游链条。靠人为确定形成的产业链条,只能发现局部关系。我们由此看到供应链金融的两个特点:第一个是供应链金融已经跨越了一步,从资产走向了行为,但是链条是靠线下经验形成的,很难跨行业快速复制;第二个是基于订单等交易事件的供应链金融,交易行为还存在一定偶发性,风险还是很高的,它更多依靠上下游链条企业的相关资质来评估,例如整车制造厂的规模大、品牌知名度高,订单置信度高可以获得低风险贷款,但经过资金链传导多次的橡胶生产企业,其订单就很难获得客观信用评估。

如果供应链金融评估的是工蜂之间跳八字舞的单次行为,那么是否可以累计更多联系行为,去构建新金融的蜂巢呢?

实践中,我们通过200多万条?对公账户的企业资金往来数据,构建一个更大的复杂网络,从往来的金额、往来频次和权重上构建实体与实体之间的关系,把现金流往来回单表格中的二维数据,转化为矩阵操作,进行关系行为的量化,把每一个实体投影在全局中,把每一条链条都深入到网络中去,深化出一个更全面的经济体视图。构建全局经济视图就是从一次性的经济行为到历史的长周期的频繁经济行为的一个抽象,也就是我们构建蜂巢的过程。

企业图谱是对企业一个历史长周期内的事件的抽象量化。这个量化值是在全网络里计算的,这样得到的最后结果,不是评估这一次的一个事件,而是N多个事件在整个历史周期里,依据网络结构迭代出的结果,可以平滑很多的偶发因素,所以会更客观、更准确。而且这个值是在不断变化的,每一次新订单新的资金流的发生,都会对这个值进行网络的重新收敛,产生一个新的值,计算一个新的结果,所以它的风险模型和风险的指示输出是动态变化的,这样的评估体系会更客观,可以有效降低风险。

这个企业图谱能做什么?当我们有整个经济视图的时候,我们可以把所有经济实体做量化。每个经济实体的资金活性、资金回报率、资本计提的消耗,都可以在我们的量化关系里进行计算。

基于资金往来反映的历史周期里的常态性交易,可以量化的主要有两个方向,一个方向面向风险,一个方向面向利润。面向风险就是信用与风险,面向利润就是资产资金定价。下面我们就来看看复杂网络所建立的评估指标。

三、复杂网络的评估坐标

我们抽取了强壮性、流通性、活跃性三个指标来构建评估体系,对企业的周期性行为进行评估。

强壮性计算节点在网络中的深度,越是核心(Coreness)的企业在网络中评估值越高。通过强壮性计算,可以发现经济网络中哪些经济实体的抗风险能力强,银行可以分析此类客户的信息,发现其特征和共性,在将来业务拓展时尽力多增加此类客户。此类客户在银行的企业客户总数的比例也能直接反映出银行对公业务的整体抗风险能力,是对公业务健康稳健发展的垫基石。简单来说,强壮性描述的就是网络里面最核心的企业点。当经济危机出现的时候,边缘企业倒闭的时候,生存在网络最强壮的企业依然能够存活下来,这就是我们所说的龙头企业,也可以标注谱聚类获得的行业群。

活跃性是指经济实体在整个企业图谱里资金往来的频率,我们可以通过矩阵方式的多轮迭代计算收敛得到企业的活跃性量化值。

从银行业务角度来看,节点所代表的企业客户的活跃性越大,则说明该企业业务量大且交易频繁,也能表达出该企业的状态良好且有壮大的趋势,是最有可能对银行业务需求量大的优质企业客户。因此通过活跃性分析,可以提示银行需要重点关注哪类客户,做好关系营销、服务营销和个性化营销。举例来说,如果银行给餐饮行业放贷款,银行就要去获取客户,传统方式肯定是找知名企业,比如湘鄂情、俏江南、巴国布衣、蜀国演义等知名企业。但通过我们的资金模型发现有一个企业不出名,但它的资金活跃度非常高。经过线下调查,发现它是胡椒和辣椒批发商,每天有几顿的胡椒、辣椒供应给上百家火锅店,其现金流非常好,同样的贷款,其周期短、还款快,所以其资本计提成本相对要低,定价就有优势。

通过流通性计算可以挖掘整个经济网络中各个供应链体系中的关键节点。因为大量的资金流动都会经由这些节点,所以这类企业在网络中处于关键地位,一旦企业出现变动将会直接影响上下游企业的运营状态以及整个供应链的生态体系。因此在整体经济形势发生重大变化事件时,银行需要重点扶持和关注该类企业,以免因这类企业出现问题后造成大面积影响,从而导致银行业务受损。

四、新金融从企业图谱中的获益

供应链金融从资产评估到行为属性评估的跨越,企业图谱从单次交易行为评估到长周期行为评估的升级,由行为联系构建成的群体智慧,为大数据金融提供了更多创新机遇。

第一个层面,直接与银行收益相关。如何获取客户,怎么发现识别优质客户,我们可以通过强壮性和活跃性的定量评估来定位网络中的核心优质客户。也可以对相似网络结构属性的客户,做交叉金融产品的销售,提升或激活存量客户。

第二个层面,我们可以通过分析整个网络来进行风险控制,成本定价。比如某个节点活跃性值突然发生变化,梯度、方差超过行业平均水平的变化,那么需要确认它的经营是不是出现了问题。通过分析整个网络图谱,还可以有效发现资金闭环形成的子图,通过对各个闭环子图的深入分析,就可以有效寻找出异常的资金来往,发现其中的关联交易。我们还可以通过实际的沙箱模拟操作发现潜在的投融资的黑洞。这些都是通过行为数据分析发现的,可以有效地帮助银行回避风险。

第三个层面,针对银行后端系统,通过整体网络分析去进行一些流程性的改造。传统模型往往基于业务经验和规则,各种打分卡记录评级,而网络模型可以获得创新的业务实践规则。例如,贷后管理的方式直接来自于生产经营的资金活动数据,用数据定量的方式会对整个运作流程生成一个系统的变化。企业图谱对后端系统优化和合理化的持续改造提供依据。

金融产品的生产资料一直是货币和资产,而新金融环境下,作为交易环节的副产品——经济行为数据被大量记录沉淀,大数据发现个体间的联系获得新的价值,数据从而直接成为生产资料制造新的金融产品。在云计算和大数据的今天,金融不仅普惠,更在缔造财富。

来源:《中国征信》杂志

关联链接

mqu.cn site.nuo.cn