大数据行业生死劫
6月1日,《网络安全法》落地实施已过去三个月,大数据行业结束野蛮时代,进入洗牌期。
此前有15家数据公司被调查,此后,名单扩大到30家;多家公司的业务负责人被约谈,他们甚至相互打招呼的方式,都变成了“今天,你被抓了吗”;大量数据接口关停,数据产品停售,导致部分公司开始裁员,一家被调查的公司,甚至将大数据业务完全下架,退出市场。
一些公司黯然退场,一些却高调入局——一些有独家数据源的公司,在最近宣布成立。
数据行业,正处于二八分流,冰火两重天。
01“你被抓了吗?”2017年5月末,数据行业的清理行动开始。
据多位知情人透露,“数据堂”多人被警方调查,导致部分数据业务线停摆。
此后,数据堂发表声明称,因公司某一客户存在被公安机关调查的情形,公安机关为进一步了解具体情况,向公司个别业务人员及财务人员进行情况了解,不存在“公司高管被抓”的情形;公司业务运作正常。
目前,数据堂的官网可正常打开,但“数据定制—数据堂”的网站页面,却无法打开。
大数据行业生死劫:上万接口关停,大量公司裁员,90%公司将倒闭今年8月,数据堂发布股票停牌公告,称因存在“预计应披露的重大信息在披露前已难以保密或已经泄露,或公共媒体出现与公司有关传司,可能或已经对股票转让价格产生较大影响的”事项,2017年8月14日起暂停转让,预计股票恢复转让日期不晚于2017年11月13日。
“公司走了很多人,还有一些人准备拿完年终奖就走”,数据堂离职员工杨青称,“目前,精准营销线和大数据线基本暂停,现在仅靠人工智能一条业务线支撑”。
但杨青同时指出:“公司的海外客户,暂时没有受到影响。”
这只是大数据行业进入冰封时代的一个缩影。
一本财经曾独家报道,15家数据公司被调查,名单中不乏估值几十亿的大公司。据知情人透露,此后,调查范围则进一步扩大,“名单已有30家”。
行业一度风声鹤唳,传闻满天飞。
头部的大数据公司,都曾传出过CEO或高层被调查的“小道消息”。
网传聚信立的高管也被带去问话,业务呈收缩状态。
聚信立CEO罗皓不得不站出来辟谣,紧急接受媒体采访:“我敢否认,说明我们没有被约谈。”
“实际上,确实很多公司的业务负责人被约谈”,行业资深从业者罗锦江称,为了取证,通常电脑等存储设备也会被拿走。
一位大数据行业的CEO听到传闻,另外一家公司的创始人被调查,他急忙在微信上询问:“你没事吧?”
对方回复没事,说是谣言。
结果第二天,CEO又听到消息,接着再问:“今天你被抓了吗?”
“今天你被抓了吗”,这句话一度成为大数据行业高层从业者的问候语。
02接口切断几乎行业所有的人都明白,这次数据整顿,是为了6月1日新推出的《网络安全法》预热。
“这次是动真格了,毫无容情”,罗锦江称,5月底,很多公司主动将一些敏感业务线停掉。
“数据供应商突然间通知我们,业务暂停,但会支付违约金”,某信贷公司的商务负责人陈希称,最先被停掉的接口,就是“三要素”查询。
“所谓三要素,就是手机、姓名、身份证”,罗锦江称,以前的价格,“购买一条仅7毛、8毛”。
多位行业从业者称,三要素停了之后,大部分公司只提供两要素(身份证和姓名)的“验证”。
“把两个信息提供给数据方,对方只会反馈一个是与否的答案”,陈希称,如果符合,反馈“是”,如果不符合,反馈“否”。
陈希紧急修改了风控规则,让业务线可以勉强推进,但紧接着,更多的接口被切断。
以前一次查询2元的学历数据接口停掉,随后,车辆、住房、公积金等数据接口都全面切断。
“我们只能再次修改风控,让用户自己填写用户名和密码,授权我们去相应的页面爬取数据”,陈希称,如此操作大大提高了风控的成本和用户体验,“但合规了”。
紧接着,各项“特色”的数据产品也悄然撤下,或开始变得不稳定。
而某平台的风控总监郭飞透露发现:“今年年初,百融金服的产品收支等级,查询突然变得不太稳定,缺失率很高”。
所谓的收支等级,就是一个人信用卡和储蓄卡的入账和出账记录,并按照等级给出分数,数字远大,金额越大。
△ 收支等级产品说明
郭飞称,这项数据,是信贷中很有价值的数据,查询一次的价格是2-3元。
但至于如此隐秘的金融数据,百融金服是如何拿到的,在业内一直是一个谜团。
华道征信的业务员称:“自6月份后,不良信息的查询、资产类,目前我们是暂停服务”。
媒体报道,为了规避政策风险,在《网络安全法》实施前,同盾停掉了“失联人修复”服务;中国移动下属全资子公司中移在线,也停掉了“移动三要素”的查询。
一边是主动停止合作,一边是客户直接跑单。
贷后邦的商务负责人称:“部分客户已与我们达成合作意向,规定一出来他们很害怕,所有关于数据的业务都暂时不接,我手上有一两例违约客户。”
大量接口断了后,行业开始了裁员潮。
头部的大数据公司,都曾传出过裁员消息。
“主要裁掉的,是销售和一些敏感业务线的人”,罗锦江称,大量的乙方公司业务人员被裁掉后,就进入了甲方公司。
03艰难求生2012年,马云在网商大会上震耳发聩地喊出:我们将进入大数据时代。
那一年,阿里巴巴集团设立了“首席数据官”一职,并推出大型数据分享平台“聚石塔”——这是中国大数据行业开始爆发的信号弹。
而大数据行业黄金年代的来临,是在2013年互联网金融崛起之后。
大数据和在线信贷相结合,激发了强烈的化学反应。
在黄金浪潮中,崛起了上万家的大数据供应商,他们采集数据,进行清洗加工,针对不同的应用场景,再输出不同的产品。
“早期,部分大数据公司的商业模式,极为简单,很多都是黑市采买数据后,简单打包,直接销售给客户”,罗锦江将其称为大数据的野蛮时代。
“在这里,就是大数据的天堂”,从美国回国创业的某CRO称,刚回国的时候,发现国内数据流通尺度之大,完全超乎想象。
在美国,很多并不敏感的数据,都无法用在信贷领域,比如,性别、人种颜色、年龄段,都不可随意参考,不然,就可能涉及“歧视女性、黑人或老人”。
滥用的用户数据,让大家就如裸泳一般,毫无隐私可言。
持续数年的数据之乱,终于在“徐玉玉”案之后,将行业推到了众矢之的的深渊。
这似乎成了诸多行业宿命,总是在鼎盛狂欢中,在利益催化之下,出现浮华泡沫。随后,巨大行业负面爆发,监管如期而至,洗牌来临。
校园贷和大数据行业,都是同样的轨迹。
行业正在挣扎中自救。
曾经很多大力宣传自己是专注大数据的公司,如今,对外的传播口径完全变动。
“行业污名化,不想和大数据扯上关系,外面现在都称自己是人工智能公司”,一位从业者称。
南京一家大数据公司也在被调查的30家名单中,目前,公司已将大数据业务全部关停,正在谋求转型。
“连我们业务员都需要加班加点看项目”,一家数据公司的商务称,公司甚至让他们去找项目,寻找出路。
大部分的数据提供商,正在寻找第一条自救之路:数据的脱敏、加密。
最常见的方式,就是查询结果的输出上,采取打分制,比如,如果完全匹配,就是100分,如果只有一半匹配,就是50分。
而查询不良则是用信息比对,输入名字身份证,输出命中与否。
还有一些公司,尝试用技术,保护用户隐私。如拨打催收电话,直接进行加密,只能看到一个加密号码拨出。
行业想到第二条自救之路:联合建模。
双方开发一套系统,直接放在客户公司的内部,双方共享数据,系统最终输出一个分数或结果。
“联合建模,确实解决了合规问题,能够使双方共享数据”,小赢科技首席风控官成少勇指出,从长远角度来说,这肯定是未来趋势,但目前,推进的过程依然困难重重。
今年8月,郭飞的公司和一家数据公司合作,对方提出了联合建模,但公司内部引发了争论。
“对于我们来说,增加了很大的工作量,我们不可能针对每家数据源都要去做建模,且联合建模的费用是十万”,郭飞称。
“实际上,现在大部分的联合建模,数据公司只是沦为一个技术提供商,这个模式太重,”大数据公司CEO林欣称,如果一家数据公司有20个客户,就得有20个建模师。
对于双方来说,这个模式重,成本高,为了合规都要付出代价。
04行业洗牌《网络安全法》出台后,要获取、使用用户的数据,都需要用户授权。
而第三方的数据公司,很难再用这种方式获取数据。
林欣认为,这样的公司,无非只有两个命运:要么在原有的老数据基础上,挖掘建模,但这样的产品,很快就会过时;要么就变成技术提供商和咨询商,比如联合建模。但这个命运,也不能让人愉悦。
如果变成技术提供商,很难和大的公司合作。因为,大的公司数据和风控,都视为核心部门,很少外包;其次,大的公司对数据提供商也百般挑剔。
因此,数据公司几乎只能给小的公司提供技术服务。
“大的公司,从6月之后,都要求数据提供商签一个承诺书,确保使用的数据,都是经过用户授权的”,罗锦江称,基本没几家公司敢签字。
行业的最终命运如何?
“行业90%的公司将被淘汰”,多位行业从业者都下了如此的判断。
有意思的是,一边是死亡,一边又是生长。
就在9月25日,联通大数据公司成立。
“未来,有一类大数据公司能活得不错,就是拥有稀缺数据源的公司”,林欣称。
而成少勇也是同样的观点,只有独家、且不断更新的数据公司,才有竞争力,“二八格局已非常明显”。
对于此次洗牌大潮,大多从业者表示,并非坏事。
劣币被驱逐,良币才能沐浴阳光,茁壮生长。
去芜存菁,正本清源,大数据行业的野蛮时代终于结束。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21