P2P大数据的争议与悖论_数据分析师培训
作为互联网金融的一种模式,P2P行业如何发展一直是舆论的焦点。其中最被大家推崇的一种观点是P2P的发展必须结合大数据,无论监管、媒体、还是我们从业者,都达成了共识,许多公司为之努力并且做了尝试。但是我却认为,P2P不能迷信大数据,大数据并不是万能的,与其执着于用大数据做风控,不如用来做营销。
一、P2P的大数据为什么做不了风控?
目前,在国内金融领域,用大数据做风控,成功的案例只有两家,一家是阿里小贷,另一家是证监会。阿里小贷通过卖家海量的交易信息和流水,在几秒钟内完成对商家的授信;证监会通过海量的交易信息挖掘出关联交易,捕捉老鼠仓的基金经理。也有其他一些电商平台号称利用大数据做风控审核,但是其模式的实质是应收账款质押融资(类似保理)或者是货物质押式融资。其实阿里和证监会之所以成功,原因在于两点,一、数据可以做到即时更新,既数据是鲜活的;二是平台本身对用户有约束力。这两点也被人们称为闭环的数据。那么问题就来了,目前国内的P2P公司并没有闭环的交易数据,对用户的约束力也不足够,那么又何来跟大数据结合一说呢?
有人说利用客户多维度的信息,例如近千个维度,对借款人做综合的评估。这种方式听起来不错,但实际情况是,对一个人信用的评估如果用这样的手段,会发现维度和维度之间并非相互独立的,而是有逻辑关系的,1000个维度中实际有用的维度可能只有100个,900个是没用的,也就是说这样一个风控模型几乎是建立不起来的,纬度的逻辑关系会有冲突,就算真的建立起来了,能通过该模型验证的也极可能是人格完美的人,例如耶稣和甘地,而不是金融信用良好的客户,不同的数据纬度应该对应一个人不同的方面,绝大多数的纬度根本体现和一个人金融信用的相关性。
再说数据来源,有一种说法是互联网上的社交数据可以作为参考依据,这其实牵涉到两个问题。其一,在互联网上人性是被放大的,现实中不敢说的话,在网络上却敢说,现实中内向的人在网络上或许会非常外向。也就是说互联网上的社交信息很难还原现实中人的信用;其二,社交信用并不一定能代表金融信用。据征信公司根据以往的征信记录来看,人的信用是多方面的,例如朋友信用、爱情信用、事业信用、其他社会信用和金融信用等,如果把每一类信用都看成一个面,其他几个面的信用与金融信用并不一定存在相关性。最近我去英国考察,国外有朋友用facebook上的社交数据做金融的尝试,即利用互联网上的个人信息评估其信用,并作授信。目前这项服务的相关数据还未披露,但是通过一些国外的朋友间接打听,网络上的社交金融可能并不成功,原因就在于此。
二、P2P的大数据如何做创新?
如果说P2P执着雨打数据风控,不如尝试用大数据做营销。事实上,大数据的提出者谷歌就是利用大数据做营销的。打比方说,现在新新贷有一位借款用户,如果他的借款次数在2次以上,且还款情况良好,可以通过数据分析,我们可以用系统的方式为他量身定制贷款方案,利率、手续费、还款方式、期限、额度等都会和原来的服务不同。
这个看似简单,背后要做的工作很多,首先要看过往的借款记录,新新贷会通过他的以往数据信息推算出他在什么时间节点需要资金周转,例如一个借款人申请借款的时间是8月,但可以通过计算得知他资金周转其实发生在6月,再分析数据,是因为5月份的货物滞压造成,再进一步分析造成货物滞压的原因。贷后管理中,客户经理会了解借款人的经营情况,根据更新过的数据,利用系统的方式推算出可能造成他下一次资金周转的时间,提前推送定制的服务方案。这种服务方案更像量身定制,而非让客户被动接受他不一定适合的信贷产品。在服务方案的制定过程中会根据他的年龄、学历、所在地区、交易流水等情况和数据库中类似的借款人做对比分析,评估他的优势劣势,和同行业企业的相似程度,根据以往借款人的额度、利率、还款方式等信息,重新评估当下借款人的额度、利率、还款方式等等。目前,我们已经尝试了几个这样的服务方案,做到了客户自己还没有发觉有融资问题是,我们就提前推送服务。
三、没有大数据,还能做数据挖掘
但是P2P最终还是希望用大数据完成授信和风险控制以降低服务成本。刚才已经谈到,那除非是用闭环的大数据才有可能,也就是说必须有数据即时更新和平台约束力两点。如果P2P无法直接做到这两点怎么办?我觉得可以通过其他的方式无限接近这两个特征。其一,不定期更新用户的数据,以我们来说,风控人员在客户贷后3个月后必须对客户进行2次尽职调查,对用户的信息做更新,重新评估其违约的概率。有人说这么做会增加成本,但P2P本来就在做商业银行和BAT都不做的脏活累活。对一家P2P公司来说,现在正处在数据原始积累的过程中,获取借款人越多真实数据越有利。未来P2P的核心竞争力与其说是风控能力,不如说是数据的积累和数据的处理能力。
另一方面,小微企业客户的账目往往混乱,在实际的风险控制中还需要还原他们的资产负债表和现金流量表,对他们进行财务输出,建立财务的标准,这些标准的信息积累就为数据积累做好了度量衡统一的准备。这些工作看似不够互联网化,不够科技化,但是只有这样的工作才能获得用户精准的数据,有效的数据,否则用系统的手段处理,就会在大量的洗脏数据的过程中,增加机会成本。
我个人认为,与其执着于在线上获取数据,不如脚踏实地在线下做好借款人的数据分析。例如,我们在数据积累的过程中,发现抽烟的借款人逾期率高于不抽烟的人,有宗教信仰的借款人逾期率低于没有宗教信仰的借款人,世界杯期间看足球的借款人违约率高于不看足球比赛的借款人。借款人的这些信息和数据几乎是没办法在线上获取的,即使获取也无法核实真伪,但是通过线下实地走访,这些信息很容易获得。这些有参考价值的数据对大数据和风险控制结合是有帮助,排除对借款人最有影响的地区、行业等因素,用户自身的一些行为是否存在相关性,是对风险控制审核的重要参考。
P2P结合大数据的路还很漫长,目前国内还没有成功的案例,大数据对P2P来说首先用于营销,其次用于风险控制,在数据的积累过程中去做更多深入的挖掘,可能才是真正的未来。
数据分析咨询请扫描二维码
数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21