大数据时代,电商和团购业务的用户行为分析
大数据可说是2015年和2016年的重点话题,一方面成为互联网和资本市场的火热话题与风口,另一方面国务院也在《关于印发促进大数据发展行动纲要的通知》系统部署了全国大数据发展工作,大数据俨然成为国家层级的重点战略。而和金融业息息相关的数据应用方面来说,国务院在随后颁布的《推进普惠金融发展规划(2016~2020年)》中更是直接提到“鼓励金融机构运用大数据、云计算等新兴信息技术,打造互联网金融服务平台”。至此,国内外各金融与类金融机构、互联网金融企业纷纷上马 大数据应用 的探索,冀望大数据可以带来技术上的突破,实现自动化、着手升级现有风控模型体系、探索新型态基于场景化的消费金融市场、提升催收效率、建设互联网深层次大面积获客能力,从而彻底提升国家金融行业的国际竞争力。
大数据和传统数据的差异
谈到大数据,首先应当了解,对金融行业来说,大数据“大”在哪里,和传统数据在本质上有什么样的不同,才能够更好地理解和更有针对性地应用这宝贵的新资源。就如同原油也需要经过层层的提炼,才能成为人类可以大量应用的石油产品,大数据也需要经过精心的筛选和应用设计,才能起到实质的功效。
传统金融机构,在建设信用风险打分模型的数据来源主要有几个方面:第一,人民银行征信中心数据;第二,客户自己提交的外部个人财力证明数据,如房产证、汽车行驶证、单位开具的收入证明等;第三,金融机构或集团内部积累的客户历史数据,如银行的工资流水,历史贷款数据,保险数据等。
传统数据的优点和缺点
传统数据优点是这些数据和金融的价值相关性高、数据采集规范。然而缺点是维度较小,并且覆盖的人群有限,对于新形态的互联网模式适应程度较差,也不容易达到普惠覆盖的目的。 金融机构基于这些高价值数据,纷纷设计出各种信用风险评分模型,最终实现对客户信用风险的打分评估,是目前较为成熟的运行方式。
大数据的特点
大数据时代 的客户信息渠道更加多元化,主要包括内部收集和外部渠道,内部收集指各互联网生态体系内,长期积累的用户数据。外部渠道则是指各种数据源采集,如通信数据、社保数据、法院失信数据、交通数据、保险数据等等。
其数据特征包括几个方面,第一,数据覆盖面广。各大互联网集团,通过各种APP采集积累了用户行为各方面的数据,如搜素历史数据、电商交易数据、支付交易数据、社交数据,以及各种APP采集的用户行为数据等等。第二,大量非结构化的破碎数据导致的数据不准确。数据采集渠道的多元化和非标准化,随之带来的问题就是,客户信息不准确,同一客户不同维度的信息经常不完整或匹配不上。第三,数据来源不稳定。不少大数据采集通过灰色渠道收集个人隐私数据,数据连续性和可持续性欠佳,往往有数据过时或缺失问题。第四,消费数据和信用数据关联性弱。
尽管市场上常见的大数据机构收集了各种维度的客户行为信息,试图描绘客户画像,但消费类的数据和客户信用风险以及还款意愿并不直接相关。目前的大数据公司往往缺少内部征信数据、外部征信数据、个人资产数据等强金融变量数据,而集中在客户衣食住行和社交信息,要直接拿来作为信用风险评分模型的有效性依旧有待考验。考虑到大数据和传统金融数据的差异性和互补性,所以更多的应该是如何通过模型的设计和提炼,使得这些大数据源经过提炼,可以从原油变成成品石油般广为应用。
大数据在借贷中的应用
借贷反欺诈的应用
由于网络借贷和传统金融面对的受众区别,借款人主要来自线上,考虑到目前网络犯罪的试错成本极低,为数众多的网络借贷平台很容易成为诈骗集团觊觎的目标,一般根据行业经验,网络借贷平台往往都会有高达九成的借款需求存在欺诈和骗贷行为风险。因此借贷反欺诈的重点在于从100名潜在借款人当中,准确识别出真正有还款意愿的10名借款人。
通过技术的防范手段很多元化,一般通过核实手机号、身份证号码、电脑唯一设备号、手机唯一设备号,可以进行下列过滤识别手段:交叉比对借款人登记的住家地址、公司地址,以及申请人当时申请的定位地点,如果差距超过10公里,风险系数极高;某些地址或大楼,属于申请诈骗高发地址的,风险系数偏高,会得到一个分值;发现和多个平台同时存在借款记录的,风险系数偏高;手机号属于法院黑名单、租车黑名单、使用时间段不足6个月、被多次标记恶意骚扰电话等,风险系数偏高;6个月内,同一个手机设备号,曾经在银行、小贷公司、多家P2P平台有过多次申请记录的,风险系数极高;手机设备号近一天关联申请人3个手机号以上的,风险系数极高;手机号与设备是否匹配、第一次激活时间距离申请贷款时间较近,风险系数较高。
基于大数据自动化流程提升效率
在通过反欺诈引擎,识别出真正有还款意愿的借款人后,这个阶段的重点在于建立大数据辅助的信用风险评分模型,尽可能的从多维度数据补强出传统金融数据不足之处,精准定位达不到传统金融机构要求,但是又具有良好还款能力的借款人。目前行业内流行较广的应用是在个人征信过程中,针对小额度(低于1万元)的贷款需求尽量采取自动化、批量化的模型审批系统,将原先需要人工花费30分钟、逐一审核的15个风险控制点,采取自动化和接口的方式,在1分钟内能完成风险定价和放贷,极大地提升运营的效率,更有效地通过技术手段压缩了运营成本。不过针对大金额的借贷,考虑到欺诈风险和成本较高,传统的金融征信数据和手段依旧不可或缺,同时使用大数据进一步提升风险管控和提高效率,例如通过接口自动实现身份证、法院、社保的信息核实,可以提高准确率和审批效率。未来也可以试图在传统风控打分模型中引入更多的大数据元素,作为评级的参考标准,例如有金融参考性的保险数据、航空记录、社保记录等。
构建基于场景的数据风险管理体系
通过建设交易借贷的场景一体化,是目前各大互联网金融平台和传统金融机构进行错位竞争的舞台。其中由于借款人是直接通过信用借贷行为取得所想要的产品或服务,套现诈骗风险相对较低,金额一般也较小,各大平台借鉴着灵活的体系和快速执行力,纷纷投入精力设计各种低风险、场景化的金融应用服务,并不断持续优化客户体验。
场景化金融的风险管理要素,在任何一个的场景中,都有借款人、贷款用途(购买特定产品和服务)、资金流和产品服务流这几个基本要素,在这些特定点中,通过下列规则的设定和组合,可以有效的极大的降低风险。第一,基于购买特定产品和服务类场景的借贷产品,例如产品服务非一次性交付,如长达一年的教育课程培训套餐或多次实施的医疗美容套餐。第二,资金流和产品服务流形成闭环,意味着借款人不能拿到现金,平台的资金流是直接付给产品服务提供方,如在线分期购买iPhone、个人二手车消费贷款。第三,风险可控有抵押需要快速周转灵活调度资金的场景,如二手车商的经营贷款、房地产置换的赎楼贷,也是很好的消费场景。
不过考虑到每个场景设定的不同,对应的风控要素自然也不同,最理想的互联网金融平台模式,会建立数十种不同的场景化金融,针对每个场景定义出不同的风控要素、准入条件和禁入人群、利率定价、还款周期等等。
从实操的角度来说,第一步应该是在每一个风控场景,由风控人员和技术人员设定出精密的各种金融要素条件,第二步是尽量善用外部数据源来辅助,能真正体现每一个互联网金融平台的产品设计和风控水平。
做催收贷后管理的应用
在传统数据受限的场景下,大数据能显著提升贷后催收的成果,目前国内各大银行信用卡中心都已经开始探索这方面的应用,互联网金融行业也早就已经着手使用。具体来说,主流应用是查找逾期失联客户的电话、地址、邮箱、QQ 、微信、微博等信息。帮助委托方与失联客户建立沟通渠道。如果还是失败,大数据公司往往会进一步分析该手机号最常联系人,做进一步联系,试图联系失联客户。
在获客和客户价值挖掘上的应用
传统金融机构或银行,目前评价一个客户价值,相对来说较为片面。举例来说,一个客户在某银行里,只有一张借记卡,没有其他信用卡或贷款服务,只有账户里面几千元活存,那这个客户对银行来说,往往被定义为交易不活跃的低价值客户。
如果可以通过大数据角度来看,通过身份证号、手机号进行客户画像描绘后,可能分析出来这个客户经常关注互联网理财,经常频繁使用各种股票和银行APP,较高频次的国内和国际航空记录。这个时候分析出来的结果反而可能是高净值客户。通过大数据可以帮助金融机构和互联网金融把客户画像描绘的更加完整。这样一来,结合了原先的传统情景和 大数据分析 后的场景,金融机构和互联网金融平台的决策就会截然不同。这个客户虽然在银行或互联网金融平台暂时是一个低价值客户,但实质上是一个高净值客户,可以通过适当推送的产品组合,并结合电话销售,推荐适合的金融产品或服务,例如,全家海外旅游分期贷款,或者短期高收益的金融产品。这也是通过 大数据分析 能改变传统获客和客户挖掘交叉营销的模式。
同时,通过算法的分析和训练,可以建立现有用户的群组,分析出一群比较相似的人,推荐一些他们经常会选择的东西,根据这些信息可以去推荐相应的金融产品或服务给他,一方面让客户觉得不会干扰,进而提升接受度和转化率。从智能推荐的角度,会利用不同的标签参数、ID的参数等等完成推荐的工作。ID在整个数字营销领域是非常关键的一件事情,需要知道这是同一个人,才会有意义,不然所有营销的工作都是分散、割裂的,对整体的营销效果并不会很好。
有了相对稳定的老客户,那如何开发新客户进行获客?很多互联网平台往往会外包给一些外部营销公司、媒体公司。其实从大数据的视角来看,应该是分析现有的稳定老客户,根据这些老客户可以通过相似的推荐、相似的选择找到什么样的用户会发生转化,根据标签设定找到已经转化的老用户相似的用户,根据这些用户选择性的去投放不同的媒体渠道和属性,不停优化整个投放的结果,可以有效的降低获客成本。
挖掘POS流水的价值
通过挖掘POS流水的历史交易数据,也是一种新的趋势。一种是通过分析商户POS机的历史交易记录流水,综合分析所在行业、月均交易额、交易额稳定性、交易变化趋势、客均消费金额、持续经营时间,实时评测其收入和还贷能力,最后得到一个商户预授信额度。另外一种是分析个人多张银行卡的流水,从月均收入和消费金额、消费大类分布、资产状况、特殊类别统计、银行卡等级、常驻城市,最后生成持卡人预授信额度。
就如同人类从发现石油,将石油精炼出煤油,为世界人民带来夜晚的光明。随后又将更进一步的提炼出今天广为全世界使用的汽油和柴油,彻底改变了人类的生活。大数据亦然,也会从传统数据,升级为大数据,进一步再升级为结构化的全数据时代,将会彻底改变人类观察世界、运作世界的方式。
从金融行业来看,各家大数据供应商的数据,随着采集设备和种类的增加,采集方式日渐结构化,辅以各种大数据分析工具的齐备、大数据分析从业人员增加,可以预期在不久的将来,大数据将会渐渐的彻底改变目前整体传统金融行业的运作方式,随之而来的,各金融机构在战规划略和资源倾斜上,也会越来越重视大数据的投入,并逐步将数据的积累、分析、应用变成金融机构核心竞争力的一部分。在国内,除了借贷业务外,预期在保险行业、券商行业、大资管与财富管理行业,还存在着巨大的发展空间和机遇等着各类金融机构进行探索。
数据分析咨询请扫描二维码
数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21大数据技术专业主要学习计算机科学、数学、统计学和信息技术等领域的基础理论和技能,旨在培养具备大数据处理、分析和应用能力的 ...
2024-11-21《Python数据分析极简入门》 第2节 3 Pandas数据查看 这里我们创建一个DataFrame命名为df: importnumpyasnpi ...
2024-11-21越老越吃香的行业主要集中在需要长时间经验积累和专业知识的领域。这些行业通常知识更新换代较慢,因此随着年龄的增长,从业者能 ...
2024-11-20数据导入 使用pandas库的read_csv()函数读取CSV文件或使用read_excel()函数读取Excel文件。 支持处理不同格式数据,可指定分隔 ...
2024-11-20大数据与会计专业是一门结合了大数据分析技术和会计财务理论知识的新型复合型学科,旨在培养能够适应现代会计业务新特征的高层次 ...
2024-11-20要成为一名数据分析师,需要掌握一系列硬技能和软技能。以下是成为数据分析师所需的关键技能: 统计学基础 理解基本的统计概念 ...
2024-11-20是的,Python可以用于数据分析。Python在数据分析领域非常流行,因为它拥有丰富的库和工具,能够高效地处理从数据清洗到可视化的 ...
2024-11-20在这个数据驱动的时代,数据分析师的角色变得愈发不可或缺。他们承担着帮助企业从数据中提取有价值信息的责任,而这些信息可以大 ...
2024-11-20数据分析作为现代信息时代的支柱之一,已经成为各行业不可或缺的工具。无论是在商业、科研还是日常决策中,数据分析都扮演着至关 ...
2024-11-20数字化转型已成为当今商业世界的热点话题。它不仅代表着技术的提升,还涉及企业业务流程、组织结构和文化的深层次变革。理解数字 ...
2024-11-20在现代社会的快速变迁中,选择一个具有长期增长潜力的行业显得至关重要。了解未来发展前景好的行业不仅能帮助我们进行职业选择, ...
2024-11-20统计学专业的就业方向和前景非常广泛且充满机遇。随着大数据、人工智能等技术的快速发展,统计学的重要性进一步凸显,相关人才的 ...
2024-11-20