第1章 绪论
1.1 大数据环境下的信用与信用评价
1.1.1 大数据环境下信用和信用评价涌现的新特征
信用是指个人或组织在社会经济活动过程中所形成的一种相互信任的生产关系和社会关系,是人类社会重要的行为规范、现代文明的标志、市场经济良序运行的基础和政府公信力的源泉。狭义的信用则是指对约定规则或契约的遵守,即“有约必履”“有诺必践”。信用包括宏观的国家信用、中观的地方政府信用及微观的商业与消费信用等。在市场经济环境下,各类经济主体的社会经济活动都离不开信用,借、贷、购、销等各类经济业务往来,均以信用为基础。本书研究内容聚焦市场经济环境下的商业和消费信用,属于狭义的信用范畴。
信用评价(又称信用评估、信用评级)是专门机构根据规范的指标体系和科学的评估方法,对市场参与主体履约意愿和履约能力的一种综合分析与测度,是市场经济不可缺少的风险防范机制和管控手段。按照评价对象,可以分为国家主权信用评价、企业信用评价、平台信用评价、个人信用评价、债券信用评价等。本书聚焦企业信用评价、平台信用评价和个人信用评价。
在以物联网、大数据、云计算、移动互联与人工智能等信息技术为主要特征的数字经济时代,市场的商业模式、人们的消费习惯和资金的融通方式正在发生深刻变化;同时,西方国家的产业链、供应链脱钩和逆全球化现象频频出现,导致全球商业环境的不确定性增加。在上述因素共同作用下,信用和信用风险涌现出一系列新特征,暴露出一些突出问题,信用违约事件时有发生且发生频率呈上升态势。例如,部分“高评级”企业接连发生违约;再如,一些电商平台的产业链上滋生着大量的“刷单蚂蚁”,商家通过购买“刷单”,制造虚假销量和好评,误导客户购买。具体而言,交易平台的虚拟化、交易主体的多元化、交易领域的广泛化、信用风险的泛在化和信用信息的不对称性,使得信用风险及其评价呈现出一系列新的特征。
(1)交易环境虚拟化,信用风险隐蔽性强。传统信用管理以实体经济中的企业和个人为主,交易主体和交易过程真实,信用信息相对透明,信用相对稳定。而网络环境下信用主体和交易过程虚拟化、信贷周期相对较短,信息不对称突出,信用风险隐蔽性强、动态性高。因此,信用评价体系和评价方法需要适应虚拟化交易环境下的信用评价需求,尤其是互联网金融业务的信用评价需求。
(2)违约损失长尾化,信用管理成本高。传统环境下信用主体主要是大中型企业,且单笔信贷金额较大,采用基于专家经验的信用管理成本相对较低。而普惠金融背景下小微企业和个人消费者成为信贷市场的主体,单笔信贷额度较小,但信贷总规模大,信用管理成本高,具有典型的长尾特征。因而,需要通过智能评价提高评价绩效,降低信用管理成本。
(3)信用业务泛在化,信用评价需求个性化强。新环境下各类企业和消费群体都可能成为信用业务的主体,信用业务涉及各类生产经营和投资活动,以及衣、食、住、行、游等各类消费领域,信用业务涵盖面广,尤其在普惠金融场景下,信用业务涉及民生的方方面面。不同类型的信用主体和信用产品,其信用风险存在显著差异,需要针对不同信用主体、不同信用产品,开发个性化的信用评价方法。
(4)信用孤岛现象严重,隐私保护问题突出。万物互联环境下,相关交易平台或中介机构基于可获得的信息,对信用主体进行信用评价,但评价结果只在特定场景下使用,难以共享,形成了大量的“信用孤岛”。同时,还可能存在大量的信息采集不合规问题。例如,淘宝网、拍拍网和易趣网都有各自的信用评价体系及评价方法,应用在各自的相关信用业务中,但互不共享。而工商、税务、公安和司法等公共信息共享也不充分;另外,上述各类信息的集成和融合还会产生隐私暴露问题,需要相应的机制和模型来解决信息共享与隐私保护问题。
1.1.2 数字经济时代对信用评价理论与方法提出的新要求
当今世界正在经历百年未有之大变局,新一轮科技革命和产业变革迅猛发展,促进了以数据资源为关键要素的数字经济快速发展。数字经济所催生出的各种新业态,如“新零售”“新制造”“新金融”“新农业”,正成为中国经济新的重要增长点,同时对信用评价理论与方法提出了新要求。
(1)普惠信用。数字的产业化和产业的数字化是数字经济的核心,赋能中小微企业提质增效,但中小微企业普遍存在着融资难、融资贵等问题,特别是在不确定环境下,众多中小微企业生产经营活动受到严重冲击,资金供给压力剧增。而在消费侧,消费信贷最大的风险是信用风险,特别是我国个人信用体系不完善,缺乏统一的、完备的个人资信系统,使消费信贷的发展面临制度性约束。这些都需要普惠信用体系来支持中小微企业和个体消费者的普惠金融,即需要基于大数据资源和大数据技术提供普惠信用评分和风险管理。
(2)平台信用。数字经济的一种主要表现形式是平台经济。平台经济对优化资源配置、降低交易成本、扩大市场需求起到了积极的促进作用,但也出现了虚假宣传、虚假销售、数据滥用、大数据杀熟等问题,积聚了一定的信用风险。基于平台的大数据资源优势,精准刻画平台和平台参与者的信用水平及其变化趋势是推动平台经济规范、健康、持续发展的基本保证。
(3)智能信用。普惠信用和平台信用对信用评价体系的构建和评价模型的设计提出了新要求。首先是信用信息处理和信用特征抽取的智能化,大数据环境下描述履约意愿和履约能力的海量非结构信息只有采用智能化的信息处理技术才能抽取出刻画信用特征的多维度结构化信息。其次是评价模型及其优化的智能化,信用特征的多维性、信用关系的非线性和信用状态的高度动态性对评价模型及其优化方法的智能性提出了更高的要求。
(4)安全信用。信用评价是信用大数据的二次开发和利用,涉及隐私保护和商业竞争等诸多信息安全保护问题,基于单一数据中心的信息共享与建模方法无法满足这一要求。因此,如何在利用多源信用数据建模的同时,保护各方原始数据中的隐私信息和商业秘密是数据经济时代对大数据信用评价提出的新要求。
1.2 大数据环境下信用评价理论与方法变革
随着企业、政府、商贸和公共服务等数字化转型的深入推进,社会信用主体的行为模式、交易过程、信用历史、关系网络、客户关系、潜在风险事件等信息都被实时记录在各类信息系统中,形成了信用评价的大数据环境,为解决传统信用评价存在的体系完备性差、数据获取难、主观性强、时效低等问题提供了全息、多模态、动态的信用大数据。而大数据技术与人工智能方法则为多源异构、多模态、动态时变的大数据处理和面向全生命周期的智能信用评价方法及信用风险预期机制的设计提供了智能化技术手段和方法论支持。
1.2.1 基于多维度时序大数据的全息信用特征
以物联网、移动互联、工业互联网与Web 2.0等为代表的新一代信息技术的广泛应用,以及企业和政府数字化转型的深入推进,企业的生产经营活动、供应链关系、投融资关系、工商税务信息、公安司法信息、利益相关者信息等都会被实时记录在相关的信息系统中,形成了多维度的时序信用大数据。同样,消费者的消费习惯、行为模式、资产状况、社交关系等也被相关平台或系统实时采集和记录。信用信息呈现出全息性,即动态的时序大数据能够多维度、全方位对信用主体和信用业务全过程、不同阶段的信用特征进行全面的刻画。
1.2.2 基于云计算的大数据分析与智能处理能力
信用大数据具有多源异构、动态时变、海量低质等特点。多源是指信用信息分布式存储在不同的信息系统或平台,如金融信息存储在相关的银行系统,工商税务、公安司法等信息分布在各类政务服务平台,企业生产经营活动及其成果信息存储在企业内部的信息系统。异构是指信用信息既包括结构化的信息,如财务报表信息;又包括非结构化的文本信息、图片信息、图结构信息等,如行政处罚、司法判决、网络舆情、社交关系、供应链关系、客户关系、管理者关系等。动态时变主要指信用大数据的时间序列特点,如市场交易数据、社交媒体中的互动信息等,而且这些时间序列数据大多数情况下还具有混频特征。海量低质是指信用大数据体量大,但数据质量难以保证,价值密度低。云计算的海量存储能力、分布式计算能力及人工智能算法的学习能力为多源异构、动态时变、海量低质的信用大数据分析与处理提供了高效、智能化的计算平台支持。
1.2.3 基于新一代人工智能的信用评价理论与方法变革
新发展格局下,信用风险涌现出新特征、暴露出新问题,而信用大数据能够多维度、全过程、动态刻画信用主体的全息信用特征,云计算与人工智能技术为大数据处理和评价模型构建提供了高性能的计算基础设施及智能化手段。因此,大数据、云计算、人工智能等新一代信息技术,正在改变着传统的信用评价体系,并推动信用评价理论与方法的变革。这种变革主要表现在四个方面,即从以传统的静态评价为主,向以面向业务的全过程动态评价为主的变革;从以专家的主观评价为主,向以数据和模型联合驱动的智能化客观评价为主的变革;从以财务信息评价为主,向以财务信息与非财务融合的多维度全息评价为主的变革,以及从以单一机构基于自身可用信息的封闭评价为主,向以多主体协同的联合评价为主的变革。这些变革的总体趋势如图1-1所示。
图1-1 信用评价理论与方法变革趋势
1.3 大数据环境下信用评价面临的挑战
虽然新一代信息技术为解决信用评价体系完备性差、评价数据获取难、评价手段智能化水平低、评价结果主观性强等问题提供了全息信用数据、高性能计算平台和人工智能方法,但信用大数据的海量动态、多源异构、多维流式等特点及大量的非结构化信息,给信用评价体系构建、评价特征构造、评价模型设计及评价结果可解释性等带来巨大的挑战。
1.3.1 新型信用评价体系构建问题
现有信用评价体系的构建是建立在理性预期假设和期权定价理论基础上的,主要适用于企业内外部环境相对稳定、基于小数据样本的信用评价,即基于用户提交的申请信息和评价机构拥有的有限信息进行评价体系构建。而新发展格局下,企业内外部环境变化快,对信用评价动态性、过程性和精准性提出新的要求,现有的信用评价体系构建理论和方法已不能满足新环境下的信用管理需求。因此,需要面向新发展格局下信用管理的新需求,结合大数据的特点,运用新一代人工智能技术,探索大数据环境下新型信用评价体系构建的理论方法。
1.3.2 基于非结构化信息的信用特征构造问题
虽然大数据环境能够提供企业和个人的海量信息,但与信用相关的信息中80%以上是非结构化或半结构化多源异构信息[1-5](如嵌入在社会网络中的社会资本信息、非结构化文本信用信息、非结构化关系信用信息,以及大量跨平台非关联的信用信息等)。大量的信用特性隐含在这些非结构化和半结构化海量信息中,这些信用特征被称为隐性信息特征。如何从这些非结构化、半结构化的大数据中挖掘隐性信用特征面临着巨大的挑战。
1.3.3 违约风险智能判别与动态信用评价问题
新一代信息技术正在重塑金融业态,信贷业务发生了巨大变化,这对违约风险判别的智能化和信用评价的动态性提出了新要求[6-8]。例如,业务模式由单一的线下模式向线上线下并行转变,导致信用主体和交易过程虚拟化,信用风险隐蔽性更强;再如,用户群体由少量优质客户向普惠群体拓展,信贷业务和违约损失的长尾现象突出,违约风险判别和管理成本增加,因而对违约风险判别的智能化水平提出更高要求。同时,网络环境下信用业务的高频次、短周期及概念漂移复杂等特点对信用评价的动态性和前瞻性提出了新要求。因此,需要研究大数据环境下的违约风险智能判别与动态信用评价方法。
1.3.4 信用评价模式与隐私保护策略问题
大数据环境下信用主体的多元化、信用评价目标的多样化、信用信息分布的多源化及信用信息共享的复杂性等都对信用评价模式提出了新需求,需要创新大数据环境下多主体协同的信用评价模式,解决信用评价孤岛问题。同时,在多主体协同的信用信息共享和融合过程中,隐私攻击和隐私暴露已成为人们关注的焦点,如何实现信用信息的高度共享和有效的隐私保护,是多主体协同信用评价要解决的核心问题之一。
1.3.5 拒绝推断与非均衡数据处理问题
大数据环境为信用评价提供了大样本,甚至是全样本的数据来进行模型的构建和验证