中美大数据差异 如何发展大数据产业_数据分析师
以下内容根据清华苏研院大世界中心主任林辉讲话稿整理:
大数据时代到来的时候人类文化将进入一场革命。因为前面三个阶段是在用设备和网络为我们提供服务,这是一个整体的服务系统;当服务关联到数据本身时,信息化建设也就发生了变化,而数据就是信息化的核心。
大数据源于云计算、物联网和移动互联,而云计算是人们追求的一种模式和路径,数据是由它带来的。无论是国家还是城市,都会涉及到四块内容:经济产业发展、政府职能、社会的公共职能、军事和国防安全。关于经济产业的发展和政府职能的关系,近日召开的十八届三中全会提出“治理”,而不是“管理”,就是使管理的主体变得多元化。另外,十八届三中全会还设立了国家安全委员会。各个行业都可以涵盖到这四部分当中。在社会发展和技术发展过程中,会涉及到各种数据处理问题,技术发展和社会发展都需要突破这个问题瓶颈。所以我认为,大数据是智慧城市和移动互联发展的瓶颈。如果没有解决这个问题,我们将永远沉浸在云计算、物联网、移动互联、智慧城市等所有的梦幻当中。你的数据没有互联、没有互通、没有互享、没有互用,云计算、物联网、移动互联、智慧城市都只能是梦幻。
中国和美国对大数据的理解和重视程度是不同的。美国提出这个概念的时候是基于用数据创造了新的模式和内容。而中国在基础设施建设和整个信息系统的发展上,跟美国有着非常大的差距,这个差距能够大到十年、二十年。但是关于云计算、移动互联网这块,中国起步比美国仅仅晚两到三年,传统的信息系统的技术中国跟美国又差很多,特别是在应用系统完善性上。
所以美国对大数据的理解是要用数据分析新的模式、新的路径,那中国对大数据到底是怎样的?
无论是政府、企业,还是其他各行各业,我们要提大数据,一定要从数据的起源,从它的产生、存储、处理、统计、分析、挖掘、应用、互联互通等角度出发。站在整个数据价值链上去考虑,不能像美国那样去考虑。因为美国的系统基本成熟,中国不能照它的路去走,否则就会像中国的汽车一样,发展这么长时间仍然存在很大的问题:虽然产能第一,但汽车的核心发动机、电速箱、底盘,甚至是外形设计,都受到别人的严重制约。
因此,我们一定要用自身对数据的理解迎合中国的大数据时代,从而能够用我们的一种办法,去实现对数据的使用。
目前,包括美国在内,大数据问题也不能完全解决,中国也是一样的。只有解决了大数据问题,才能真正的让云计算、移动互联网落地。国家呼吁了多年云计算,也花了不少冤枉钱,除却政策、体制、机制问题外,还有一个问题就是没有办法解决数据分析这个根本问题。
信息化的核心就是数据。数据是信息化的部分表述,无论用了什么硬件,用什么手段,安装什么系统,里面窜动的永远是不变的数据。在信息化建设过程当中,只有将数据真正关联起来、关注数据、聚焦数据的时候,才是真正的懂得了信息化的实质。
在发展模式转型的过程中,尤其是制造业,产业结构需要升级,需要创新驱动。创新驱动要从底层基础材料等各方面出发,并把信息技术当中的数据量给挖掘出来,这时候才是全面的融合。
数据的实质和作用正在发生质变。任何生产、生活必须要具备几个因素:生产要素、劳动力、土地及自然资源。土地不言而喻;自然资源是指能源、矿产等;很多年前,有人曾经提出信息和技术也可以成为生产要素,未果。但在大数据时代,我们可以将数据定性为生产要素,它不仅是技术和信息的载体,还是其表现形式。比如,专利技术可以注册资金,其实就是一个文件,它的具体表现形式可能是专利、著作等方面。这样做了以后我们更能清楚的阐述当今科技的核心实质。将来人类大脑里的经验和知识都可以逐渐的转化为数据。别人采用你的经验,其实就是使用你经验当中的数据。
为什么目前所有媒体、政府、天使投资人、VC等都关注大数据?因为当一个新的生产要素加入到任何原有的生产方式的时候,就会对原有要素的比例、权重和质量的原有存在状态产生影响,并形成新的爆发式的增长,甚至是技术性和产业性的革命,进而促进人类文明的进步。
举例来说新要素对原有要素的影响,比如,近日在网上一直热炒的“马云和王健林口水战”,马云说做阿里巴巴根本目的还有一个就是要把地产价格拉下去。为什么阿里巴巴能打动地产价?原因就在于电商平台可以用数据的力量形成了一个虚拟的交易平台,使线下商品销量降低,这样一来门面租金减少,从而地价降低,房价下降,不能形成非常大的商业圈,商业地产价格也会下降。这就是利用数据在撼动原来的资本和土地要素。未来经过五年到十年的发展,总会有一天,很多的经营店会变成应用感受店,甚至还会有一些新的模式的出现。
以前是各种传播公司和科技巨头如IBM、微软、甲骨文等控制着信息系统的发展方向,是他们在引导技术的发展。但随着云计算、大数据的发展,这种模式好像遇到了挑战。
那么如何发展大数据产业?大概有以下三个方面:众包、开源和长尾。
众包——集众人之力。现在能向IBM、甲骨文、EMC、微软发起挑战的都是通过众包的模式进行的。集众人之力,也称作“群狼战术”。因为单个的某个企业买不起IBM的服务器,买不起甲骨文的数据库,买不起EMC的存储,所以要做分布式、虚拟化的调度。
因为有这样一群人开始尝试,于是出现了开源。开源的概念其实源于原来的传统产业。有一个做化妆品的大企业聘请了大量的科研人员,研究各种配方,但后来发现这样做的产品成本会非常高,每个新出的化妆品价格必须在六百到八百美元左右,而且科研人员因研究任务复杂几乎被逼疯了。其中有一个化学工程师索性把他要研究的任务扔到网上了,许多志愿者开始研究这个东西,给他出各种的主意后又把结果反馈给他,这就是开源的由来。后来该企业的研究经费降低了20%左右。开源可以汇众人之智,降低成本。
长尾——享众人之功。长尾就是指原来龙头企业能占领60%、70%的市场份额,然后逐渐的被长尾现象所替代,即龙头企业占到30%左右的市场份额,剩下的被各个领域占领,各个方向的人一起分享。因为“群狼战术”,“狼”的筹码不能缺太多,“群狼”一起分享,这样效率就提高了。
大数据时代,建设智慧城市还会遇到很多问题,有一个问题就是以数据为生产要素的新一代信息化建设处处繁华似锦,但肯定不能一花一果。所以我建议:一定要做好顶层化的设计,整个的部门想做什么,先有一个大概的方向;第二是强制化,成熟一些了,马上就往前推进行;第三一定要市场化。市场化、强制化、顶层化才能形成创新驱动。
数据驱动建设信息化是有量化指标和架构的,有的东西能做,有的东西暂时不要做。从技术上看着都能实现,但是有的一踩就是地雷,有的就是结果。所以我认为有几个指标供参考,什么可以用数据驱动创新,什么不可以。
1.架构力度,是指某个产业单位时间内创造出来的生产总值。
2.基础约束度一定要小,不要受体制、机制、政策、资本的各种约束。如果政府在体制和机制上,没有形成突破,诸如国家统计局,从下面采集上来的数据就有很多的问题,掺沙和水,这时候让做大数据挖掘优化,挖出来的还是沙子和水,体制和机制都有问题的时候,没有办法挖,这是一个约束度的问题。
3.投资收益度,投的少,收的多,或者叫公益度。公益度指社会服务,诸如我们的社保、文化、教育、医疗。
4.市场接受数据的力度和敏感度。力度越粗,敏感度越敏锐的才有利。比如,你给他一堆甚至都带有错误信息的数据,他都愿意买的时候,这个就可以做;你给了他一个说全国中考的50万个重点要素,孩子们读完以后能涨20分,所有的家长都觉得是谎话,但是觉得能涨20分也行,这就是力度很粗糙,敏感度很高,这可以让你迅速的形成商业模式。
5.具体的实现和应用的速度要快,中国是发展中国家,速度一定要快,速度慢不仅不能追赶别人还会被落的更远。
6.用户群和地域区域覆盖一定要广。要能跨越行业门槛。在技术上不要总想挑战世界性的难题,只要挑战你的门槛,能跨越这个高度也是可以行的。
7.社会经济发展的支撑度。如果你跑到贵州一个乡里面搞智慧城镇,那他们的收入和需求,根本没办法支撑信息系统建设的成本。
8.行业的关联度、渗透度和应用维度。你做的数据产品服务除了关注你这个行业以外还要能为别的行业服务。关联度越高,成功的可能性越大。即使我选择错了,也能够转向调头。
9.原有行业规模竞争激烈的程度。行业的规模尽量大,竞争尽量的激烈,它正在转型期,需要这样一个创新的手段去推动。
如果用以上这些指标去衡量阿里巴巴、淘宝、facebook、推特,它们几乎完全满足。
数据分析咨询请扫描二维码
在当今数据驱动的世界中,数据科学与工程专业的重要性愈发凸显。无论是推动技术进步,还是在商业决策中提供精准分析,这一专业都 ...
2024-10-30在当今信息爆炸的时代,数据已成为企业决策和战略制定的核心资源。爬虫工程师因此成为数据获取和挖掘的关键角色。本文将详细介绍 ...
2024-10-30在当今数据驱动的世界中,数据分析是揭示商业洞察和推动决策的核心力量。选择合适的数据分析工具对于数据专业人士而言至关重要。 ...
2024-10-30能源企业在全球经济和环境保护双重压力下,正面临前所未有的挑战与机遇。数字化转型作为应对这些挑战的关键手段,正在深刻变革传 ...
2024-10-30近年来,随着数据科学的逐步发展,Python语言的使用率也越来越高,不仅可以做数据处理,网页开发,更是数据科学、机器学习、深度 ...
2024-10-30大数据分析师证书 针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。 ...
2024-10-30拥抱数据分析的世界 - 成为一名数据分析工程师是一个充满挑战和机遇的职业选择。要成功地进入这个领域,你需要掌握一系列关键技 ...
2024-10-28降本增效:管理战略的关键 企业管理中的降本增效不仅是一项重要的战略举措,更是激发竞争力、提高盈利能力的关键。这一理念在当 ...
2024-10-28企业数字化是指利用数字技术和信息化手段,对企业的各个方面进行改造和优化,以提升生产效率、服务质量和市场竞争力的过程。实现 ...
2024-10-28数据科学专业毕业后,毕业生可以选择从事多种不同的岗位和领域。数据科学是一个快速发展且广泛应用的领域,毕业生在企业、学术界 ...
2024-10-28学习数据科学与大数据技术是当今职业发展中至关重要的一环。从基础到高级,以下是一些建议的课程路径: 基础课程: Python编程 ...
2024-10-28在信息技术和数据科学领域,数据架构师扮演着至关重要的角色。他们负责设计和管理企业中复杂的数据基础设施,以支持数据驱动的决 ...
2024-10-28进入21世纪以来,随着信息技术的迅猛发展,大数据已经成为全球最具影响力的技术之一,并成为企业数字化转型的核心驱动力。大数据 ...
2024-10-28随着科技的迅猛发展,数字化转型已成为现代企业保持竞争力和推动增长的关键战略之一。数字化不仅仅是技术的应用,它代表着一种全 ...
2024-10-28银行业正处于一个前所未有的数字化转型时期。在数字经济的驱动下,金融科技如大数据、人工智能、生物识别、物联网和云计算等技术 ...
2024-10-28数据分析可视化是一门艺术与科学相结合的技术,其主要目标是将复杂的数据变得更易于理解和分析。通过将数据以图表的形式呈现,我 ...
2024-10-28数据分析师在现代信息密集型的商业世界中扮演着至关重要的角色。他们通过专业的技能和敏锐的商业洞察力,帮助企业从大量数据中提 ...
2024-10-28在当今快速发展的数据驱动世界中,数据专员的角色变得愈发重要。无论是在企业决策、市场分析还是产品开发中,数据专员都扮演着不 ...
2024-10-27在当今迅速发展的科技时代,数字化对企业的意义无比深远。它不仅提升了企业的竞争力和运营效率,还显著改善了客户体验,推动了企 ...
2024-10-27企业数字化转型是一个全方位的变革过程,旨在通过应用新兴数字技术,重新设计企业的业务流程、组织结构、产品和服务,以在竞争激 ...
2024-10-27