基于大数据的创业与创新机会
来自业界的专家领导、大数据专家、技术大咖、知名企业CIO、知名媒体等近200位嘉宾参与了此次盛会。本届论坛的主题聚焦开源大数据技术的生态与应用,嘉宾们分别从不同的侧面揭示了大数据技术本身的发展与行业应用趋势,带给了台下嘉宾们很多的干货以及经验分享。
黄剑锋:在对话之前,问一个问题,在座的各位,有哪位知道中国哪里的女人胸大?有知道的吗?一开始我也很意外,谁会知道这样的问题。但是马云知道。因为马云有淘宝,有很多淘宝数据,会有全国各地客户(多数是女性客户购买的数据),所以他会知道。淘宝用户数据分析里就可以得出这个结果。我们可以告诉大家,这个答案就是山东。
第二个让我印象很深刻的也是大数据应用分析的案例,来自广州。我有一个朋友是做网上商城的,主要是做一些药品。有一次交流分享时,他说“你猜,广州哪个区域买套套的最多,密度最大?”我想了很久,应该是CBD。他说不对。后来我说,城乡接合部,因为那里民工比较多。但是我的答案是错的。是哪里呢?跟全国各地一样,广州也有大学生,这个答案就是大学生。这个也是颠覆了基于一般认识的判断。所以大数据分析结构往往会颠覆你过往二三十年的经验,大数据分析的结果会让你出乎意料。
我说了一些大数据很有趣的事情。下面我把问题抛向各位嘉宾。请各位嘉宾先介绍一下自己的单位和自己跟大数据的缘份。
王才有:我是王才有,一直在国家卫生部统计信息中心工作,从2013年国务院部门改革,卫生部和计划生育委员会合并,现在在这里就职。我们中心作为部委的信息中心,跟其他部委信息中心有个很大的区别。我们以前认为是一个劣势,为什么?因为我们的名字叫卫生统计信息中心,人家都叫信息中心,人家好像比我们广。但随着大数据的发展,大家对数据的认识,我觉得这个优势确实体现出来了。为什么?我们的“I”和“T”,刚才讲到进入DT时代,到这个时代,数据和信息技术的密切融合对于,一方面对于决策本身可以发挥出更好的作用,在一个机构里应该有一个很好的生态,有决策信息的需求,要有数据科学家,要有信息工程师,你要有资源,这样可以创造出更好的价值,同时也更好的指导行业,特别是医疗行业的信息利用和价值的发挥。实际上医疗行业大家都知道,但实际上医疗行业本身就是一个数据驱动行业。每个医生都在做决策,决策正确与否关系到患者的病能否看好甚至关系到他的生存和以后下半生的幸福状况。
李红:我的30年的工作经历,一半在钢铁行业。我做了15年的行业统计,对数据是比较敏感的。当时最大关注的问题就是数据的共享和准确性。当时对我印象最深的是宝钢在90年代利用SaaS理念分析如何保障宝钢产品质量。到企业以后搞信息化建设,一直对数据比较关注。我们拥有丰富的数据,但是数据依然锁在象牙塔,我们的数据不能共享,所以大量数据是闲置的、浪费的。现在我们都在探讨大数据,如何利用大数据打破传统的屏障,让数据说话、让数据价值实现。我们正在做这件事情。
齐亚卓:对于大数据来说,处于中国经济转型和变暖期,我们面临最大的问题是相关市场预测、产品把控等等,不像以前就是做评估报表。在这个时候我们需要精准、精确、可预测的方法,而且在中国这些中小型企业中,把大家的数据有效的分析共享,结合起来,才是中国中小企业发展大数据的必要性和必然性。
李鸿飞:我始终感觉教育应用大数据是一个非常典型的行业,我们说要用教育信息化实现教育现代化,我觉得大数据的应用是一个突破的方向和思考点。因为在目前,高校使用大数据这样一个工具,基础已经具备了,但是有非常多的需求和痛点。我感觉教育行业应用大数据特别需要企业方面的提供方、技术方能够共同参与。我这里简单提供几个数字,就可以知道里面的机会到底有多少。目前普通高校在教育部备案的有2491所,在校大学生有3460万人,在校普通教职工22.96万人。我想说的是,教育就是关于人的行为和人的态度、人的情感,随着信息技术新的发展,量化过来一些技术,等等,实际上已经走进了教育的整个过程、科研过程,所以我感觉到教育现代化一定会拥抱大数据。
张旭:大家好,我来自物品编码中心。最开始我们做商品条码的,为了解决跨地域贸易的最终快速结算问题。有了条码以后,人们发现不仅可以用来结算,也可以用来供应链的管理。随着近年来的发展,我们对于数据逐渐重视起来,我们建立了一个信息平台,其中有24万家国内相关企业,在超市里或者以快消品、食品为主的企业,这些企业里面有4200万条商品信息的数据,这4200万条数据就代表4200万种产品,我们给超市等企业做全球数据同步,比如宝洁的产品,每个超市进它的产品都要做相应的信息录入,我们做成一个数据库。这是一个基于商品条码的数据。
我们知道,阿里掌握着制造业,掌握了很多人的购物习惯。其实还有超市的POS机里也有很大的数据,每一天POS机扫描数据量是5亿次,这里面大量的数据没有被利用起来,除了少数的,比如说便利店,711是利用的最好的。为什么711发展的规模这么快、做得这么好,它就是把店面分布、销售数据拿过来做数据分析和挖掘,来指导他的进货、开分店的位置等。现在也有一些超市收集这样的数据、做数据分析,我觉得这也是一个数据的金矿。谢谢。
施青弦:大家好。我们对大数据分析接触比较早一点。我们会从各个的主要市场国家智库购买大量资料,然后做分析,分析未来的转型方向。现在慢慢转移到信息化上面,提出一些资料来做判断。
孙有平:大家好,我来自数据价值网络。我们有两个方面的构想,首先从SAT咨询顾问角度参与了不少项目,比如顺丰的CRM系统建设、永辉整个零售的O2O,还有电商平台的搭建。始终有一个体会,其实从最高层的领导来讲,他们更多看的是经营决策,他们明白数据对他们是很有用的。其实,顺丰就解决一个问题,顺丰2%的用户带来80%的利润。就是要把从第3%到8%那个5%怎么样把单价提高到跟20%一样,这是唯一的诉求。其实信息化工作、大数据处理都是围绕这个目标的。因为对于一个上门接快递的人员,他只能识别到4%到5%的人群。第二,呼叫中心接到电话就是这5%的人群,这是唯一的诉求。这是管理层看数据,第一个维度,从接触的项目有的一些感受。
今年我们也勇敢出来创业了,我们跟七牛云有点类似但不太一样。现在政府大力推动政务数据,包括电信数据。这两个数据逐步跟政府数据进行匹配,匹配完以后你会发现,其实我们发现可用的资源非常多。所以我们创业方向不在这,我们的一个方向,我们做的是PC网站转换到移动端。目前转到手机、Pad,未来会转到手表、大屏等任何一个载体。它会是物联网的接口,这里产生的流量是非常巨大的。如果按今天的技术来讲就是把它转成H5,重新组织变成需要的一些移动化的页面,然后我们加入一些公共组件,不用再开发了。
主持人:好的,各自嘉宾来自不同行业,我们从行业角度了解一下,在大数据应用方面有哪些创新?先从施总开始。
施青弦:目前我们公司在互联网上比较透明,我们希望拓展一些新兴的市场和行业。在大数据分析里,目前做的比较多的是产业分析,比较经典的例子是三四年前我们分析了一个产业是LED。目前在做的是市场的新开发,这块是依据内部资料和投资部门资料来判断。
主持人:主要是通过大数据分析来帮助商业决策部分。
张旭:我们在做大数据过程就发现要如何去提高数据质量。早期时并没有考虑要建数据系统,商品信息质量问题这块其实也花了很多成本。数据要分享,不分享就是死数据。比如说把数据提供出来,其实是会产生新的价值。这是我们的体会。
主持人:张主任那边来自商品编码中心,给我的印象是他们那里有非常多的条形码、二维码,今天二维码无所不在。之前我和业界朋友也在聊,聊到二维码这块,现在食品、药品、保健品、酒类,都有食品溯源要求。其实是可以有突破性的商业模式,就是说不要用传统的方式来处理,我们可以用大数据的方式,因为二维码是放在产品上,很多消费品、产品,比如说奶粉、药品走进了千家万户,有很多大量用户。有大量用户意味着它的入口很大,这样的话就可以把二维码当做一个流量的入口,把以前乙方帮甲方做项目置换成,乙方和甲方一商量,拥有流量入口和其他第三方交换资源,比如说扫他的药品,比如说这是高血压的药,扫完二维码以后可以导流到其他保健品,可以作为辅助的治疗方式。这块我们在交流时,也是能够想到的一个场景。所以给我感觉是,大数据无所不在。
李鸿飞:从进展情况,目前高校数据基础还是不错的,现在有很多不同的数据,可以说已经有了一定的基础。比如说学习分析,高校也在测量、收集、分析一些学习场景的状态,经过深度挖掘以后对学生、老师整个教学行为、教学过程、学生成长、就业趋向等会作出比较好的分析。另外,科研这块运用大数据是比较早的。我们学校还有人类社科方面的项目。从教学科研方面处在跨界之中。从管理来看,从去年开始我们逐步在做整个学生的网络化管理,这也是教育部的试点项目,我们对学生四年的行为做很好的分析。在教育服务这块,我们最近也正在做一个智能水电的监测。从国家来看,包括互联网+战略提出来之后,我们学校也正在做一个关于互联网+教育的方案。我目前感觉到,大数据在高校融合创新有八个方面需要很多的合作:一是教育资源的缺乏。二是主题业务的参考模型。三是业务数据包括内容资源的高水平质量。高质量数据也是比较稀缺的。四是数据整合解决方案和工具。五是数据标准化、本地化的解决方案。六是智能云数据平台的框架及其基本参考框架。七是关于教育业务数据服务融合性关键技术。目前还找不到更多成功的案例。八是安全框架。
我们感觉到2014年教育信息化、大数据真正开始应用开展,我们也感觉到它是亿万级市场,希望各界能够参与到其中。
主持人:李老师在这方面做了很多研究,所以说了很多干货。我看他列了一系列清单,都是一些大数据的痛点。我想这也是代表了教育行业对大数据的需求。我相信在座的来自各个行业的专家,包括方案解决商,大数据应用领域,我们传统理解的,比如说在消费品、电商行业、连锁零售会有很多大数据应用,稍候我们再继续深挖教育行业的大数据应用。
齐亚卓:冀凯在2012年,通过一系列数据决策、分析,我们旗下盈利最好的公司毛利润可以达到25%以上。我们有一个例子,财务报表是每秒输出的,这后面意味着有庞大的计算。我们的数据统计和分析绝对不是传统的报表输出。我们大数据从数据量到计算规模都符合。第二,我们在管理上,实现所有人最小部门的独立核算。另外,我们的执行力,我们对在职所有员工,基于他的工作行为、工作时间、工作习惯,包括到岗情况等等形成一个精准画像,对人的可靠度、忠诚度进行评估,确定他的级别、工作年限等等。我们真正投入使用大数据不足三年,但是我们应用的几个领域有很明显的改变,一个是销售方面,核心部件的损坏等我们第一时间掌握。再一个就是财务方面,还有就是员工管理执行,因为我们有准确的员工画像,我们知道应该如何管人、如何调整。因为大数据的使用,使我们的管理更精密,获得了很大利润。2012年,整体人力节约在580万左右。这是我对大家的一个简单汇报。
主持人:刚才分享了冀凯内部应用大数据的情况。待会儿继续分享。
李红:传统企业如何使用大数据是一个新的课题。我们在三个方面进行探索。2B目前还在探索之中,一是如何重构企业的数据结构,现在我们的数据都是基于以前的规划,我们以前的规划比如说10年前写的规划都是确定企业是什么业务方向,信息化干什么、解决什么问题。在这个情况下,像我们研究电商,我们现在的数据无法支撑分析。最重要的是传统企业需要什么样的数据,这个是传统企业用大数据首要的问题。业务需求和技术的衔接很重要。再有,现有的数据如何发挥价值。现在很多传统企业的数据没有应用起来。财务就在财务、业务就在业务,我们现在只是负责保管。有数据在那,但是没有用。现在我们也在和大数据公司探讨,如何打破这个僵局。我们作为CIO怎么办!我们和相关大数据厂商研究,怎么打破这个僵局。就是实现信息部门的功能,体现出你的价值,包括我们的痛点是什么。好多问题不是原来传统的分析可以解决的,都要通过大数据来实现、提升。如果这个突破实现了,可以实现企业IT到DT的转变。就是数据和业务要衔接。第三,我们如何提升素质业务能力。我们要提高对数据分析的能力。对我们自己来说,要引进、合作。还有要和大数据公司探讨,引进哪些方面的技术用什么样的方式,这些都在进一步探讨。
[page] 王才有:医疗行业,最有发展前途,竞争度最高的市场。美国是信息化发展最发达的国家,不单单是信息技术,包括数据利用的能力。今年2月份美国总统奥巴马宣布启动精准化医疗信息化。为什么要精准化医疗?大家知道现在的医疗,没有一个医生说吃了这个药包治、做了这个首先保证不复发。人的健康受环境的影响、治愈的方法太复杂了,所以美国启动精准医疗信息化非常必要。从医疗健康大数据来看,确实是空间无限。因为我们对生命的认识刚刚逐步的深化。
第一,从生物医学来讲,医疗健康以及公共卫生,有很多难题没有破解。曾经说过Google的预测流行病,预测了一次可以,但是第二次就不行了。所以说我们对信息认识是片面的,因为健康这个事情太复杂。这是第一个要和大家分享的。所以大家做医疗健康大数据,一定要作为一个战略,不要想着急于出成果。
第二,从医疗数据来讲,医疗数据的综合应用、具有大数据特征的数据应用,实际上最近这几年可以看到,医院里面各个科室都用计算机,其中沉淀下来很多医疗数据。挂号系统解决挂号问题、电子病历解决电子病历问题,一个医院几十个系统很正常,每个系统沉淀出来的数据怎么用?大数据的最基本特点,我认为不完全只是说复杂、变化快,它最主要的特征就是以前我们做决策、做判断的时候,做一个决策跟一个数据,而大数据不一样,医生诊断时,这个患者的数据一定要完全,他才能做准确的决策。首先要把碎片化的信息整合成一个集中的数据平台,CDR。给医生提供一个完整的数据。这个已经在应用,而且有些大医院集团在这方面的应用已经开始。
第三,我需要跟大家说明的是我们的差距在哪。我在卫生信息化领域干了25年,在这个过程中,找IT公司好找,找数据公司几乎没有。就像医院里面用的临床药品知识库都是国外的,我们没有这么一个做数据的公司,我们都是做技术的公司,安全问题、存储问题、计算问题都可以解决,但是涉及到数据那只有国外的公司。我帮你做决策,看看你的临床工作中有没有问题。我们缺少这方面的企业。这个企业做什么?一定是收集具有行业特征的数据,他能从这些数据里推算出基本特征、基准值,可以给你一个标准值,比如什么叫发烧?这是有标准值的。一个企业是这样、一个医院、一个医疗团队都有这种值。我最希望我们的企业应该关注这方面的需求,在这方面的市场上创造出一些有价值的东西,能够解决医疗健康领域里面对数据、对决策的支持。
总的观点,医疗健康大数据,它的应用是无限的。不但医生要用,实际上我们看到,我们每个人都在关注自己的健康,年轻的人可能无所谓,大家搞IT的都熬夜。但是老龄化之后,这些老人把自己很多钱砸在保健品上了,砸在这些方面了,现在有没有公司能给他提出一个好的针对个人的服务,这是一个很大的市场。中国人多,市场大,需求大,数据多,我觉得这方面是一个很好的领域,就是健康大数据的领域。
主持人:好。这个确实是非常有意义,移动健康、移动医疗在应用场景这块绝对有很多商机。做技术的非常多,但是做数据的是非常欠缺的。比如说中国人体制分析的数据库,非常缺乏。前一段我们入股了北京一家公司,专门做老年人健康数据,这个公司股指也是在逐步提升。接下来,请各位嘉宾用30秒的时间,分享一下,从你的行业或者是行业跨界里,有哪些商机。假设你个人想创业的话,你会选择什么?
孙有平:我会获取动态数据,建立数据获取渠道。云端转化过去获取流量信息,如果用我的系统,逐步往后走,建立产业的联盟,建立联合跨界的联盟。
施青弦:刚才王主任说缺数据公司。其实还有建模师,这方面的人才也是蛮需求的。
张旭:通过互联网技术拉近消费者与生产者之间的距离。好多是不知道最终消费者是谁,建立一个全生命周期的供应链系统,把整个环节,产品生产以后,包括后期营销,通过大数据信息挖掘,把价值挖掘出来,我觉得这是一个未来的方向。
主持人:用跨界的思维,传统的是乙方为甲方做一个解决方案,一个项目收你多少钱。我们想如果有一个来自行业外,类似于马云这样的,比如说硬件、软件、实施费用免费,你们公司生产几千万的产品,每个产品到达千家万户,这些免费,但是你的二维码,扫你二维码可以防伪,这个查了之后可以点我们的优惠券,可以拿到某个礼品或者以非常低折扣的去买到另外一个厂家的产品。比如说买奶粉的妈妈可以用五六折买到纸尿片,我想这是用户会非常喜欢的。
张旭:这种互联网想法加进来也许会颠覆这个行业。
李鸿飞:刚才说了八个痛点。
主持人:那么有哪些商机。
李鸿飞:假如能够成功做某一个专业的数据,这里会有无限想象空间。我是觉得这个空间非常大。我想说,你拥抱教育大数据就是拥抱未来。因为教育关系到每一个家庭、每一个人的未来。
齐亚卓:将数据开放透明化。
李红:明确大数据在传统企业的转型升级创新发展的作用,提升企业从IT到DT的转变,希望有更多面向传统企业大数据分析的例子。
王才有:如果互联网思维的话,羊毛出在猪身上,关键是猪。猪在哪呢?现在的很多猪,在服务过程中积累的数据所创造出来的价值就是那个猪。所以医疗健康大数据,这是一个创新点。现在信息还是在碎片化状态,谁能把这些信息堆在一个人身上,可能就会创造出财富来。我就提这么一个创新点。
主持人:找到这把钥匙就找到了巨大的机会。
王才有:是的。
主持人:医疗健康这块,我也非常的关注。我有五到六万连锁门店终端的数据,还有一百万个导购的数据,我本企业就有接近千万的数据。我的连锁门店,我们有战略合作伙伴,每个手上也掌握了非常庞大的数据。我们每年为会员消费者提供相应的服务,每年也会有这方面的数据。所以我们一方面在逐渐布局,比如说我们又投资了北京养老方面的公司,也有投资了移动健康智能方面的公司,同时也跨界,跟平安保险“平安健康”有合作,未来买我们的产品会享受到“平安好医生”的服务,这块数据也是可观的。同时跨界还有很多想象的空间,我们也跟一些高端化妆品合作,比如说他的会员这块就有非常多的数据(更多是年轻女性的),这块也是我们非常重要的客户群。我们也在思索,有这么多的信息量,怎么定义到具体的用户或者人群,另外我们也在做社群,社交化数据又引导着另外一个模式,就是微商模式。
今天跟来自各个行业的嘉宾进行讨论,听听大家对不同行业在大数据应用、场景化、创新,他们在不断探索也说了很多需求。
数据分析咨询请扫描二维码
数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21