2014中关村大数据日于2014年12月11日在中关村举办,大会以大会以“聚合数据资产,推动产业创新”为主题,探讨数据资产管理和变现、大数据深度技术以及行业大数据应用创新和生态系统建设等等关键问题。大会还承载从政亚信府主管部门到各行各业的需求和实践中的疑问,探讨包括政府、金融、运营商等部门是如何通过数据资产管理和运营,实现转型发展和产业创新的路径。
在下午的金融@Big Data论坛的圆桌论坛环节中,来自政府、金融、运营商等部门的业界精英就《数据资产重构金融生态》这一话题进行讨论。
主持人易欢欢:首先想请教在座每一位,我刚才在听完演讲之后讨论完大数据还是要回归到本原。作为来自不同类型机构的从业 人员,你怎么来理解和看待大数据?因为有人说大数据是千人千面,每个人都觉得大数据很有用,但是不知道大数据在哪里。结合自 己的工作经验来谈一下您认为什么是大数据。因为咱们这次的主题是聚合数据资产,能不能谈一下对现有的企业来讲最宝贵的数据资 产究竟在哪,具体怎么使用。第三个我想问的就是当前关于数据资产的使用在我们所处的金融环境里面大概是在什么样的阶段,下一 步可能是什么状态?给大家展示一下。
刘贤荣:谢谢易总,最近大家都在谈大数据这件事情,在刚才讨论的时候我也提到过,我们一直在思考大数据对银行意味着什么 ,刚才说了一句话大数据千人千面。我们请教过很多公司也做过很多沟通,大数据感觉是有几个业界的通用的定义。但是一旦落到银 行我们发现实际上这种定义往往都很难以去落地,其实你如果为每一个人的话,大家对大数据的期望都不太一样。当我们跟业务部门 沟通的时候,业务部门首先就问你们在搞大数据的时候是不是我们传统意义的帐目就不用做数据了,大家一谈数据就是多种类型的。 最后我们总结完之后大家形成了一个共识,我们认为大数据实际上是能够为业务上带来价值,让我们更紧密的了解客户,然后可以让 我们优化流程的所有数据对我们而言都是大数据,这是从圆的视角来看。虽然我们讲数据是资产,但是数据摆在这里不是资产,因为 我们不是做交易的,银行我们最终是提供金融服务,所以我们最终是围绕金融服务如何做得更好。对我们而言我们理解的大数据是怎 么利用各种内外部的数据帮助我们更好的决策,帮助我们更好的了解客户,帮助我们更好的管控风险,帮助我们更好的优化流程。这 里面是数据加分析加应用,这是我们理解的大数据,它变化了一个体系。
反过来讲,从这个视角来讲,我们现在银行领域要谈大数据,我们最关心是两个事情。第一个是怎么样激活现有数据的价值,包 括征信的数据,包括内部交易的数据,其实我们数据也不少,可能可以到P级。但是我们面临最大问题是怎么激活,怎么真正的让数 据说话。第二是怎么活,我理解大数据里所谓的活就是通过数据可以在一个特定的场景,比较活的场景里把客户的行为、爱好和风险 还原回来,这是我们做大数据的最终的目标。希望以后在大数据的整个体系里,我们以后和外部的数据公司也好,买数据也好,做数 据分析也好,最终我们的数据的体现在银行里面是通过数据让银行变得更智能,这是我们做大数据的初衷,也是我们做大数据的最终 的目的。
如果让我把银行资产做分类,其实银行第一类资产是银行和客户的交易,以及记录的客户的静态数据,这是传统意义上银行主要 的数据资产,比如做信贷和支付,银行数据最大的优势其实银行是天然具有客户的身份信息,做存款或者贷款也好,首先把你的真实 身份会提交给银行,无论做大数据到什么程度,我认为这也是银行最为核心,价值最大的数据。第二类数据就是客户的交易性的数据 ,这个刚才说了,客户的静态数据和交易数据是指结果,什么是过程数据,过程数据就是你到网点里去,你到网点的行为,有些是音 频的,有些是视频的。你在网络银行和手机银行的行为,这是行为信息。逐渐会把行为信息跟我们已经记录的帐户的数据和静态数据 整合在一起,内部就为客户画了一个相。第三类数据就是外部的数据,最近几年来有一类外部数据我们用的很多,就是征信数据,每 一个信贷产品几乎都要用征信数据,除了征信还有别的,像宏观经济的数据,包括市场咨询数据,包括第三方数据等等。现在可惜的 是现在处于一种什么状态呢?基本是处于有需才用数据,这种数据都是在某一个流程里的,比如征信数据就是在信贷流程。未来我们 需要有一个统一数据、统一平台的视角,要打通,不但是数据的一个流程,内外部加在一起形成一个完善的客户视图。
刚才问我们到什么位置上去,这个很难判断。我们有一个数据评估模型,其实评估模型有很多概念,有一种是数据管理成熟度, 还有数据应用的成熟度,你问的问题应该是应用成熟度模型。我不想分得很细,我们到底到了优化还是什么等级,其实很难判断,不 同的领域不一样。分成三个的话我有答案,我们是分析型,比如传统的统计报表型,第二是分析型,第三种是问题导向型或者信息导 向型。我们是第三阶段正在逐渐成熟,往第三阶段发展的过程。
2王晓蕾:关于什么是大数据的定义,我也同意千人千面。我对大数据的理解可能是感性多余理性,地球刚刚诞生的时候和今天 的地球实际是一样的,虽然有一些变化。但是这里面最大的差别是什么?就是在以前的荒芜的年代你的记录水平没有。后来发展到结 绳记事,逐渐到今天的记录,我们可以用一种事实上、数据性的、数字性的,把现实生活中的很多现象记录下来,这种现象包括人的 行为。随着技术的进步,对这种需求上的生物的活动的记录越来越精准,比如说对人的认识,一天是望闻问切,现在是戴个可穿戴设 备,人方方面面的变化可以用数据精准的记录下来。你问我什么是大数据?我的理解就是由于手段的先进,我们逐渐可以把地球,甚 至宇宙上发生的所有事情记下来。这些记下来以后就方便我们更好的了解这个环境,这个环境包括自然环境也包括社会环境。所以从 这个意义来讲,我觉得所有的数据都可以归结为大数据。最初我理解大数据以后,特别是对一个人的数据的记录可以逐渐的去预测这 个人未来的行动的时候,比如连我早晨起来我还没有想到我今天中午可能会去哪里,但是通过对数据的记录已经预测出来我要去哪里 。我马上就会想到,通过这个预测有一天它可能会预测我的思想,之后我觉得这个结论就更可怕了,人可能会逐渐的被数据所取代, 人可能就是灭亡之时了。所以当人的思想可以被某种东西控制的时候,我觉得那个时候世界是什么就不太清楚了,为什么这样说呢? 比如说大家现在的消费为什么所控制?为数据、为广告。刚才讲的推送,销售行为怎么受影响?我上了你的平台,你平台周围根据对 我的认识推送一些保险广告,你已经用数据行为决定了我的消费行为。有一天通过这种推送和方方面面可以决定我的思想的时候,那 个时候是什么样就不知道了。所以我对大数据的理解可能更多是感性。
回到征信中心,对征信中心我们最珍贵的资产是记录了2004年以来中国证券市场上每人个的行为,还有企业1997年开始的最一笔 借贷行为,这对了解中国市场的经济发展规律来讲是非常重要的资产。大数据的应用是两大部分,一个是宏观应用,让大家更好的了 解规律,比如说大家对感冒药的搜索,可以不必具体,但是反映了整个的趋势。另外就是关系到某个主体,就是征信对每个主体的征 信。两大应用,对征信中心来说我们也逐渐意识到、认识到数据的资产的价值是需要发觉的。所以我们也在想尽各种办法,利用各种 手段来利用我们征信数据和价值,从而为中国市场和企业、个人服务。
我们目前的阶段是作为一个征信机构来说最为核心的任务是为每一个借款人提供信用报告,从这个意义来讲我认为我们的系统是 做得非常好的,做得好的原因就在于两点,第一个是行政力量。其他国家大家知道它是自愿的,自愿的结果就是有些机构参加,有些 机构不参加,这样的信用报告所反映的企业和个人的信用状况就不全面。中国有行政力量,同时也是信贷市场发展到现在所有的金融 机构的共同的需要,所以当我们决定建这个征信系统的时候银行相应非常积极。第二点就是当系统建成之后查询是非常活跃的,因为 大家都需要这个东西。从这个意义来讲,从提供信用报告的角度来讲,我认为我们目前的阶段已经是相当不错了,至于扩大数据源的 话,有很多是不受我们中心所左右的,涉及到国家对政府信息公开、立法等等,这方面我们也是一直在努力,到今年为止也在努力。 另外一个就是对数据价值的挖掘我们刚刚开始,我们刚刚起步。随着基础设施、方方面面,包括数据积累的不断的增加,我相信从数 据当中挖掘价值的事情在未来几年会加速。
主持人易欢欢:接下来请亚信的杨总,但是这个题目我想给你变一变。因为前年两位在应用场景里更偏甲方,更偏数据的拥有方 ,像亚信更偏产品的提供方。第一个问题还是一样,亚信怎么来理解大数据,怎么看。第二个想看一下,因为亚信当年的核心的优势 领域主要是在电信行业。现在你的产品应用在金融行业的话,能不能比较电信行业的数据资产和金融行业的数据资产以及侧重点有什 么不一样?还有在技术的应用的阶段上,这两个行业,比如像Hadoop这个技术,Hadoop这个技术在互联网是OK的,但是在金融行业里 面,因为它的交易量非常大,Hadoop的速度比较慢。您怎么看待不同的行业应用的技术的阶段性的问题?
杨晋:我先说第一个问题,就是怎么看大数据,大家可以在网上看到大数据的3V、4V的特征了解很清楚了。我们看到大数据时代 这个书里也提到,就是大数据的玩家分为三类,一类是数据拥有者,像银行、运营商等等,天然的就是拥有大量数据。第二类是没有 数据,就是服务者,像我们亚信一样,我们本身没有数据,但是我们有很好的技术,可以提供大数据相关的平台、产品和服务。第三 类是既没有服务也没有数据,但是有很好的创意,可以在这方面发挥我的作用。现在很有趣的现象是像银行或者像运营商,他们天然 拥有很多大量的数据的公司很多时候他并不强调大数据的事情,说得更多的反而是像亚信我们没有数据的公司,我们不断的强调大数 据应该怎么样怎么样,我们是想更多的通过数据产出更多的价值,数据是资产。原来我们会清理历史数据,因为磁盘容量满足不了存 储需求了。现在大数据是资产的时代,我们很难想象说你的资产每隔一年区别清理掉,我想大家都不会去做这个事情的,大数据时代 数据是重要的资产,有的数据现在可能不一定有用,将来可能会产生重要的价值。数据是重要的资产的情况下,并不是采集下来保存 在硬盘上就有价值,也是要有不同的应用在上面,使数据产生价值的变现,包括在交易市场,在互联网金融领域,等等,使数据真正 的发挥作用。
在这个情况下还需要涉及到一点,现在我们说数据的开放,数据的应用,还有一点就是数据的安全性,如何更好的保证数据的隐 私性。像美国做大数据开放通过采集一些数据做一些分析。有的机构拿这些数据分析完发现某一方公布的一份数据看不出来对这个人 有什么影响,但是我把几方公布的数据做应用关联起来,去确定比如说这个人是什么什么州的,他是学生,在什么医院就医了,把数 据关联起来就可以定位到这个人,这个人的地址,就很可怕了。如果自己在没有授权的情况下怎么保证,这个也是未来要关注的问题 。
主持人易欢欢:亚信最早做电信,现在进入到金融,隔行如隔山,两个行业的数据资产的着重点有什么不一样?
杨晋:从整体来比较数据资产有很多相同的,比如在运营商里像通话、语音,就是话单的记录。银行里每次的刷卡会有交易行为 的记录,这些数据都是很相似的,像有一些帐目和财务的数据,不同的应用都会有这些数据。具体的区别在不同的数据有不同的应用 方面和特征,像运营商里可以做到新的数据,可以通过数据定位到人所处的位置信息,这是它的典型特征,也可以基于位置信息产生 不同的应用。在运营商里拿到数据可以做全景的描述,之前银行做交易数据,或者互联网做的网上行为数据只是谋划一方面的数据, 我可以通过互联网,可以通过移动互联网每次在手机访问一个网页或者应用的时候都可以把这些特征记录下来,这是跨平台,跨行业 的,这是运营商里独有的,非常有价值的数据,现在基于这种数据做用户的精准的定位产生一些广告的推销,做这方面的应用。
主持人易欢欢:Hadoop这种技术在运营商的应用有什么影响?
杨晋:其实我们应用有几种方面,一个是像金融里的银行有这种高频的交易,做一次交易马上收到余额有多少,这对于Hadoop的 技术来说可能没法达到高频次的要求,但是现在说Hadoop说大数据技术,并不只是说Hadoop,并不只是说存储等等,而是包括整个分 布式的体系里,像Hadoop、spark等等,这些都是属于大数据的技术。因此说的实时交易,可能我们Hadoop做不到,可能spark可以做 到,或者其他的高频的流处理技术可以做到。像Hadoop和spark可以用在分析,用在内部的季度性的报表,这些本身处理数据量大, 对传统的架构处理效率低,同时投资成本非常高,这时候可以用到Hadoop相关的技术实现数据的快速处理,同时可以很好的降低投入 的成本,这个是它的一大优势。
主持人易欢欢:您讲讲大数据的标准定义,就是从工作实践里面,互联网门户。您的企业从发展到现在,积累的最宝贵的别人不 可复制,未来成为你们公司业务延伸的杀手锏的数据资产有哪些?第三个就是怎么进一步在这个方面做,处于什么阶段?
许泽伟:最务实的角度大数据对我的意义就是它是我融资的概念,这个很务实的一个事。我们做的时候我们就要进入电商,2012 、2013我们就叫金融大数据了,2013、2014年我们就变互联网金融了。我们正在变成金融交易所,实际上对一个创业者而言,因为我 要说这个意思就是说甭管你在干吗我们都在做数据变现这个事,所谓能变现是因为我们有数据变现的能力,或者我们找到了一定的数 据变现的方法,但是资源、媒体,或者大家乐于去给这个东西一个概念所以就出了一个大数据,所以大数据更像我们融资的一个概念 ,不管叫什么都是我们赚钱的一个方法。就是把非结构化的数据结构化的过程,对我来讲这就是最简单的理解大数据了。实际人类一 直都有大数据这个事情之不过怎么应用了,对企业而言就是变现,这是我的理解,这很务实了。它可以给我标上标签让我有更高的估 值,就叫大数据了,但是有没有这个概念都要做这个事。
第二个最重要的数据资产就是渔和鱼的概念,就是用户和用户在我们平台的有意向的购买行为,这是对我们有意义的。当然更有 意义的就是这些工具了,就是怎么持续扩大这些方法,从应用到分发到营销,当然怎么赚钱还是看你的数据怎么变现。对平台来讲最 重要的是这个方法,方法论,实践的经验,试错的经验等等,这个对我来讲是最重要的及
第三个问题我觉得任何一个领域都是术业有专攻,我从做数据分析的经理到做营销到现在,这是一个生态系统,但是仅限是金融 相关的事情,也可以干别的但是不是我们擅长的,我们服务的人群可能是中小,就是平均个人是20万的,可能他在这个平台交易、贷 款。我举的例子我们平台不是做保险,保险只是一个频道,一个产品。就是所有的交易行为,我们还有可能上升,等等,我希望是一 个平台系统,还是一样的,他做的频次越多,我们收的手续费越多。大的说走就走了,服务小的频次就比较多,还是中小,所以希望 最后是中小用户金融产品的交易所,是这样的生态体系,可以做很多事情。随着我最开始到现在和京东联合做,希望做一个生态系统 ,现在做的也是我现在能想到的最多的事情。
主持人易欢欢:下面的问题给到宣博士,大数据的定义是什么?您这边既服务了淘宝,一些电子商务企业。同时也服务了金融机 构,您认为这两类积累的数据有什么不一样的特性?在应用场景上能否交叉使用,尤其在金融应用上两者之间,像淘宝缺什么,银行 做小微商户缺什么,能不能中间有一个融合的交易平台这是第二个问题。第三个问题还是想请您展望一下,像Hadoop和云计算在这里 的应用,您觉得还有什么是在技术这块比较值得大家去关注?
宣博士:以前数据挖掘经常说我们讲海量数据,就是大数据,海量数据比大数据小吗?我觉得从数据本身来说我觉得只是更多样 化,而且易购。以前我们传统的做数据可能关注的或者经常接触的是结构化的数据,交易为主的数据,现在不管互联网数据也好,传 感器也好,方式不太一样,种类发生了变化。把数据转化为价值,对我们来说没有变,只是原料不太一样,原料更丰富了,对我们也 是好事。我们本身的定位是把数据转换为价值。做数据窄义理解就是变现,就是更高效之类的。但是把大数据讲大一点,作为国家战 略来说就是让社会也好、政府也好、人也好,通过大数据变得更智慧,更美好,包括更自由、更有尊严,这些都是华院角度来看的。
第二个就是金融和电商,金融本身反映很多是跟财务有关的数据,包括现在个人财务有关的信息,电商反映更多的是商品购买, 消费嘛。所以这两类数据反映的角度不一样,综合起来肯定有很多好处。最初包括阿里做小贷也是跟银行合作,开头跟建行合作,后 来没合作了,所以建行做了一个善融,然后天猫自己成立了小贷公司。总的意思我觉得本质来说结合是最好的,本来应该是电商提供 数据平台,金融去做金融服务,我觉得结合是最好的。我相信这个结合是非常多,包括个人消费也是这样。如果个人的信用又基于个 人财务数据,很多时候跟个人财务和还款意愿有关,同时结合个人消费有关的数据,综合起来有一个个人评分更有意义。我们本质来 说也不用数据,我也不认为我们拥有数据,因为已经那么多拥有数据的人,比如有银行,比如电商,比如我们的子粉丝经营的业务有 数据。可能还会有新的个人征信公司,还有像数据堂这样的公司他们也专门搜集数据,而且他们有非常大的众包团队来搜集数据,我 觉得我们本身不必要去做那么多去搜集数据有关的工作。我们就是怎么样把搜集数据的公司和需要数据的公司对接起来,把数据应用 好。所以第二个问题就是我们也站在很好的角度来做我们的平台,可以帮忙机构把运营商的数据也好,把电商的运营商的数据也好, 综合起来。所以第二个问题就是结合有好处,就是最大的好处。但是做起来也不是容易的。
第三个问题是技术,Hadoop的技术目前在处理非机构化数据也好,主要它有一个(英文)技术,我觉得现在用更便宜的服务器可 以做更大的数据处理和计算,这个不管任何一个云计算平台,这个(英文)的技术是非常重要的。第二个就是spark技术,也重新有 一个新的编程方式,而且程序做得更小,这个是非常有帮助,新的技术肯定会不断的发展,我想spark以后肯定还会有新的技术,所 以技术产生是不断的。我们本身也是定位在研究,因为大数据还有一个名字叫数字科学,第二个是大数据的成熟的计算和运用。第三 个我本身觉得在中国目前这个阶段还是需要关注的,尤其大量的在座的企业最关注的还是应用,就是应用本质上来说还是更大的市场 ,我觉得包括不一定大数据,就是一个小数据里中国可以做到的话,中国很多企业也不一定是可以做到的,这个阶段也没有完成。中 国传统讲就是数据挖掘的时代,小数据时代。所以这个本身来说我觉得也没有做完,所以我认为更多的关注很重要。
主持人易欢欢:胡总等了很久了,第一个问题是依旧,希望您谈谈自己的感受。第二个事情我想咱们一直在研究数据交易所,交 易所这个层面上因为数据是一个非标资产,是仁者见仁智者见智,每个人的理解不一样,我们构建一个数据资产的话,意味着我要定 价,我要非标变成标准,第三可能要切割、复制,整个过程您觉得我们怎么来解决核心的问题,这是第一个。第二个我想问一下数据 交易所未来大规模发展的话存在的社会需求跟大的外部的应用环境是什么样的?
胡才勇:第一个问题就是易欢欢说的,我们经常问的问题,就是数据怎么定价。有一天我忽然一想,数据的定价跟石油差不多, 石油下跌俄罗斯有多大的损失,其实可以看到。我们计划是采集石油、勘探石油、加工石油、运输加油来看看石油的亏损,从来没有 人考虑石油本身的价值,大自然给我们的石油。我们直接算成本一般是从采集数据的成本,加工数据的成本。像石油我加工成了柴油 等等不同的产生。数据里面的定价有些时候也是这样,就是看加工成什么产品,然后数据是我们人产生的,从来没有向产生数据的人 付过费,而且数据本身不能卖,所以在这地面这也就是我们面临的问题,数据本身的价值、价格怎么判断。这里面的话办法总比困难 要多,这是非常难的事情,我们软件领域本身就定价很难。我们2012年就推出了一个地标,软件成本度量标准,这个是从价值,我把 它判断为是作为一个价值。就是开发一个软件需要的钱和成本,这是价值。但是价格我们一定是随行就市,这就意味着所有的交易所 的一大功能就是信息披露。这里的话我们软交所一定将来会具备和拥有发现价格的功能,定价权不在我们里边,但是这个东西到底值 多少钱我们一定要具备,这一定是在海量数据、海量交易的基础上的。现在有些价格已经开始形成,比如说哪怕拿最新数据来说,泛 泛谈数据交易是非常难的,我安排我们的公司把数据买过来一看,完全对不上路,但是价值依然在,它是基于公共的视角来看,同时 因为它注册进去有免费送的帐号,有些公众的企业。买回来是一百块钱,以后可能是50块钱、60块钱,就是随行就市的过程中逐渐形 成价格。
我们交易所做的时候一定是一样的,我一定找最容易交易的,定价大家都比较公开认可的,这些在我的交易平台先交易起来。那 些难的,像软交所现在开始做一个事情,我们在制定用户的标准,可以让用户非常简单的描述他的信息。我们在座谈大数据和不懂大 数据的人谈大数据,他们是缺乏这种优势的,因为他们缺乏这种背景。所以我们软交所会逐步引导企业,为甲方服务,可以为了让他 们放心、大胆、方便的采购数据的时候,我们会呼吁,我们会逐渐的引导企业制定相应产品的标准。哪怕征信系统,哪怕一个企业数 据,它要包括什么基础数据,这些都要,逐步逐步的标准化的情况下,它的架构也差不多就可以发现了。这个基本上是我们的目前的 思维。
主持人易欢欢:时间关系,再留几个问题给在场的各位来宾,大家有什么问题举手,先报一下自己的单位,同时想问谁。
提问:我有一个问题想问宣博士,听宣博士讲做国电信行业和银行业,也是通过自己的技术能力和技术手段帮忙大的产业或者公 司去做生产,但是现在都在讲互联网用技术手段改造现有的管理流程、管理手段或者运营手段。我想听听宣博士这么多年的经验和宝 贵的经历,有没有指引我们做软件行业的做新一代的升级或者思路的改进?
主持人易欢欢:两个相对来讲比较大的问题。
宣博士:第一个是互联网,软件本质来说在公司的管理过程中越来越重要了,软件的革命很早就开始了,从ERP开始的,把所有 的流程变成计算机,软件方式来管理,而且可以通过很好的方式,通过最佳实践。因为我在一个地方做了最佳实践就可以适用于其他 的企业,这个过程很早就开始。互联网现在讲很多互联网思维,也不说了,互联网本身从商业角度提供了一个非常好的,拓展性很强 的方式。比如以前进一家企业要每个地方去开店、买货,通过互联网可以很快的把整个东西用整个网站的形式,所以互联网有扩展性 ,这是互联网很重要的特征。没有互联网也可以把产品做到极致、专一啊。我觉得互联网就是扩展性,大数据本身来说是智慧。企业 来说如果有更好的方法来管理,尤其在决策层面,或者管理这么多客户怎么样用自动化方式管理的时候肯定大数据很有效,所以大数 据就是怎么样智能化、自动化。我刚才讲的主要是从存储和计算来说,现在大数据的发展也是更自动化,把机器智能又推到一个更高 的程度,就是让算法更智能,这个我认为是大数据的本质。但是这件事情没有大数据的时候是不是我们应该也智能化,这个本来也有 的。你要说到智能化很早就有,数据挖掘很早也是智能化的方式,它在上个世纪的50年代信用卡公司就开始用了,就是怎么通过识别 ,通过数据怎么定义和度量每个人的风险。更早的反而是为零售企业做的,为零售企业提供方案,就是怎么能够增加收入,怎么能够 延迟付款,从这个意义上很早就开始。现在数据可记录、可度量,更多的穿戴设备,使数据资源越来越多了,所以可以加工和应用的 领域方面也就更多了。但最好的开始还是把它变成软件,有了模式以后可以变成软件用于所有的管理,这是很大一块。作为我们这样 一家公司肯定也是可以做的事情更多了,而一个企业利用大数据可以优化、管理、决策,这个过程主要还是自发的,也可以是市场环 境,当一个企业本身想做的时候实际上有很多方法。
杨晋:亚信过去专注于运营商,给他们做各种系统和项目。过去我们亚信是属于互联网的建筑师,现在提出我们要做专业互联网 的领航者,我们走出了运营商行业,进入到更多行业里面,包括像银行、政府。像今年我有一个明显的体会,因为我做大数据的,我 去了很多省市,主要是参与的国家智慧城市的建设,他们也会用到大数据,包括前段时间参与深圳这边的智慧城市联盟,我们亚信也 是负责其中的智慧城市大数据的标准的编制,我们参与了很多其他的行业。本身原来我们更多是做服务、做项目给运营商。现在我这 边负责的Hadoop等等,包装成很成熟的产品,这些产品不只用在运营商领域,其实在其他领域也都可以有很好的应用。我们大家都说 互联网思维,我们这边也基于互联网思维成立了产业基地,帮助运营商做数据的变现,通过分析运营商的流量数据我们去做用户的客 户标签的分析,取得用户的精准定位来做互联网广告,也是不断的推陈出新。现在我们亚信可以说是全面推进,不是像过去一样专注 于单一行业。
提问:大家好我是中国大数据产业网的记者,我想向王晓蕾主任提一个问题。在中国针对企业的征信大数据方面央行是怎么考虑 的?对企业这些数据又怎么保证它的准确性和真实性?
王晓蕾:首先我要说明我不代表央行,我只是征信中心,作为一个重要的服务的提供者。所以我发表的所有意见只代表我本人的 意见。你刚才提的这个问题,我觉得一定程度上是反映了现在社会上认识上的一种误区。首先你要了解一个企业,不同的需求者需要 了解的企业的情况不同,现在就拿企业征信来说,一方面你需要了解对方,需要了解对方你需要从各个方面了解他的情况,比如刚才 说到对于一个大企业来讲如果是他的客户的话他最相信的信息是他自己拿到的,他自己通过什么方式拿到的信息?现场去。比如说刘 总到了一家企业跟董事长一握手,可能凭着他多年的经验不用谈了,就知道可以做还是不做。就像交朋友一样,你希望了解你男朋友 也好、女朋友也好,你希望了解他是什么人,这种情况下有一张纸可以告诉你所有答案吗?更不可能有一个分数或者级别告诉你会是 什么样。所以这个世界是复杂的,没有人可以保证你哪个数据是准确的,哪个材料是准确的。因为所有的数据就像我刚才讲的,地球 几亿年前就存在了,只是后来采用不同的方法可以抓住某一个时点的特征以数据表现出来,你说这个数据准还是不准?对于了解一个 企业来说,事实重于评价。今天好几位专家谈到评级、评分等等,比如说你们单位新来一个同事你问他怎么样,有人告诉你不行,你 怎么觉得不行?这个不行就是一个评价,就是一个级别。你马上会问你怎么觉得他不行?所以你要的是一个事实。所以这个社会不缺 评价,每个人都会根据自己的经验有评价,缺的是什么?缺的是事实。为什么说从银行拿来的信贷信息保证准确呢?因为他是达成交 易的一方,签了合同,这是已经发生的事实。所以在事实是否准确的时候,关于一个企业也好,个人也好,有很多很多的事实。有些 事实是实际上已经发生的,比如法院给他的判决,政府部门给他的出发这都是发生的,对企业来说最重要的是什么?财务目标,那你 能保证报表的准确性吗?不可能,财务报表谁能保证它尽可能的准确呢?这个企业的董事长签字。所以说从哪可以保证一个企业的信 息的准确性或者人的信息的准确性可以告诉你没有。对各个放贷机构来说就是练的这个本事,有什么方法可以最贴近事实的了解这个 人。
所以以前老说P2P,信贷做不好是征信体系不发达,可以这样抱怨。但是P2P不练就自己对某个细分市场的独特的能力的话,只能 是错失市场良机。所以永远不到期待哪一个部门或者机构可以给你百分之百的确保它准确性的这么一个报告。因为既使是镜子里面的 你也有看走眼的时候。
主持人易欢欢:回答的非常精采,还有人有问题吗?时间也差不多了,再次以热烈掌声感谢6位嘉宾的精采分享,谢谢大家。我 们整个下午的活动到此结束,感谢各位来宾!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31