大数据资本市场下一波的宠儿
大数据企业近期在境外资本市场有越来越备受关注的趋势。本文对有关情况作出详细的介绍。
背景
2014年可称为大数据于国际资本市场开始腾飞的年份。不论在公司数量、总市值、销售、利润、并购频繁度、及主流媒体关注度均呈现爆炸性之质与量的增长。其中大数据龙头企业,2012年在美国本土IPO的软件公司Splunk的市值于2014年首次超过126亿美元。另外一家于2013年IPO的美国软件公司Tableau,承过去两年每年超过90%之销售增长及103%之利润增长之势,市值已傲然挑战70亿美元。
与此同时,众多国际明星企业亦以行动证明它们对大数据的重视。苹果、IBM、微软、沃尔玛、英特尔、谷歌、亚马逊、甲骨文、思科、SAP、迪斯尼、VISA、花旗银行、eBay、雅虎、脸书、推特等均相继开始并购及投资于为数众多的大数据相关的创业企业。究竟大数据的魅力来自何方?
「大数据」概念的产生及历史沿革
要了解大数据如何成为国际资本市场的宠儿,必须先知道大数据概念的演进。1986年,全世界所有的数据存储总量为3 Exabytes/EB(= 3,000,000TB = 3,000,000,000GB),而其中只有1%以数码形 式存在,余下的99%均以模拟形式存在。简单一点来说,一部全新基础型号的iPhone 6有16GB的内存,大概可以存储3,500首歌曲。10TB(=625台iPhone)的计算器硬盘便足够容纳美国最大的国会图书馆里面所有书本及印刷 品所载数据。3EB约等于300,000个美国国会图书馆的书本及印刷品总量。可以说,在1986年当时人类所拥有的资料和信息量已经是相当惊人的。
到了互联网开始普及化的1993至2000年期间,全世界所有的数据存储量从1993年的16EB迅速猛增至2000年的54EB,其中数码资 料占比重更从1993年的3%飞跃到2000年的25%。至2007年,全球资料存储总量达到了295EB,而其中超过94%为数码资料。更令人惊叹的 是,在之后短短5年,即到2012年,全世界资料量膨胀至2,750EB,并预计于2015年将会达到8,000EB,而其中99%将为数码资料。短短的 20年间,数据总量增加了超过500倍。
如此巨大变化的源头可以追溯到1977年第一台在销售上获得普遍性成功的微电脑苹果Apple II。其后IBM于1981年推出成为业界标准的IBM PC微电脑。计算机的普及化,同时带动了计算机软件、通讯标准、零件配件各产业的高速增长,成就了苹果、IBM、微软、甲骨文、英特尔等到现在还迄立不倒的资本市场巨人的奇迹。随后计算机的计算能力大致维持每18个月增加一倍(所谓的『摩尔定律』)的持续增长。同样有关的是摩托罗拉于1983年推出第一台普及的流动电话。这一阶段可以称为大数据的奠基期。
第二阶段的标志年份为1994年。那一年,网景(Netscape)推出互联网浏览器,令『上网』不再是一个艰难和难以明白的活动。此后风起云 涌、豪杰此起彼落。巧合地,上述的第一阶段和第二阶段正是美国资本市场有史以来历时最长、增长最大的大牛市。后来,2000年的科网热潮推动了无数资信科技企业的腾飞,谷歌、亚马逊、思科等举世瞩目的企业均于此时成就大业。计算机与互联网成为了人们生活与工作中不可或缺的工具。
第三阶段的推动力来自多方面。搜索引擎的圆满成熟,社交网络的燎原之势,视频网 站的高速成长,创新产品和相关应用—特别是智能手机的横空出世,彻底改变了人们对科技产品的态度,也创造了与以前截然不同的生活习惯及态度。单在2014 年一年里估计有62亿台全新制造,具有上网能力的智慧手机、平板计算机、计算机和其他智能电器投入市场。全球互联网用家也从2000年总人口的21%升至 2014年的39%(28亿人)。
另一方面,随着科技普及化市场化带动的规模经济,令所有相关零件产品面对前所未有速度的降价、提速、升级。20年前,一个精确性远远不如现今的 GPS组件,价格却是现在的200-300倍。现在的上网速度是10年前的10倍,但成本却便宜10倍。30年前5GB的硬盘需要5,000,000美 元,今天每5GB只需要5美元, 价格便宜一千万倍。15年前数码照相机的感光组件成本是现在的100倍,但像素比现在差8倍。功能的提升配合成本的下降,容许产品安装各类收发器与传感 器;收发器传感器的无处不在,容许产品记录顾客、供货商、员工、货品等等的各种状态和位置;存储容量的上升与成本的急速下降,容许企业存储并处理以前不能 想象的数据。
在此过程中,大数据相关项目悄悄的诞生。大数据既是果,也是因。用户不断渴求和使用天量的数据:搜索、文件、网页、音乐、视频、娱乐、和林林总 总通过新媒体的社交体验。在用户利用数据时,他们也同时产生天量的使用数据:搜索历史、浏览历史、评论、自创内容、工作成果等等。相应的企业不断推陈出 新,开发以天量数据为基准的新产品新服务(例如:搜索结果、网购、视频、网游),并千方百计研究如何利用过程中收集的天量顾客与营运数据,极力优化销售资 源、提高生产效率及降低供应链成本。
全球大数据基础市场(直接提供大数据硬件、软件、专业服务)预计2014年为300亿美元,并以每年17%的速度增长。欧美国家预估,从大数据 项目引发的额外GDP增长,于2020年会达到每年额外4,000亿美元的庞大数目,其中贸易转运占23%,制造业占22%,财经保险占13%,公共开支占13%,信息工业占6%,医疗服务占5%。
大数据的五个「V」
经过理论的完善配合实践获得的经验,国际学术和企业界把大数据总结为五个『V』,笔者试称之为『两多三高』:
『多数量』的涵义为:极大量的原始或已经处理过的数据。此不单是指企业数据库绝对容量的爆发性增长,更泛指企业具有的收集、处理、分析与储存极 大量数据的能力。而其中大数据数据和传统分析数据的重大差异为, 大数据数据包含总体及其所有数据,而传统分析数据以取样数据(总体之一部分)做出推论。亦是这个优势令大数据分析拥有更完整更强大的预测能力。
『多种类』(Variety)
『多种类』的涵义为:多种格式、多种来源、而通常为结构不规范的数据。数据可能为文字,数据、语音、图片、影片,可能来自散布全球的来源和数据 库,更可能的是各自拥有各自的数据结构。如何把这些数据联系并统一规范是巨大的挑战,但亦代表一旦发掘成功,会赋予企业一个前所未闻的商机机遇。
『高速度』(Velocity)
『高速度』的涵义为:实时数据,实时处理,实时分析,实时行动,实时演进。授予实时的分析能力,并容许不断而快速改进数据库和分析方案。不同范 畴的数据,配合完整的、极精细的数据收集,令企业可以实时改进分析方案,并探测到之前传统分析工具不可能解决的短期模式与微观趋势。高速度的挑战性在于需 要专用的高性能、超低延时的硬件、软件与联网配套。
『高精确』(Veracity)
『高精确』的涵义为两重:数据来源必须为可信的、高质素及没有犯系统性的谬误。如能做到此基本要求,大数据框架可以解决传统方法不能或不足以运 作的分析或数据。随着数据量之增加,分析会更精准。笔者在这里试举瞎子摸象的故事。无论有多少个瞎子,如果引导他们去摸一头河马,最后他们也不可能推论出 大象的外观(喻示不可信的数据源)。如果让3个瞎子去分别摸大象的鼻子、耳朵、腿,但不准他们互相沟通,他们对大象的外观会有各异其趣的结论(喻示传统分 析方法的局限);如果让1个瞎子任意无时限去摸象,经过一段时间后,他对大象的评述应该无限接近事实。这个就是大数据时代的核心理念。
『高价值』(Value)
『高价值』的涵义为:改善效率,降低成本,创新产品,增加企业与国家安全。大数据令企业更加明白自身的运作,强势和弱点,并指引明确的方向,让 企业可以争分夺秒改善供应链、制造、营运和销售上的任何短板。也容许企业实时地、准确地抓紧稍瞬即逝的任何微小的、短暂的商机,推出更符合市场以至每个顾 客特定需要的产品与服务。最重要的是,正确实行的大数据方案,保证企业牢牢掌握资金、资源、和顾客的宏观流向,在每步均独占先机,确保企业的生存和持续经 营。
资本市场与大数据企业的化学作用
如上文所说,第二阶段中的科网热潮成就了无数的大型企业。究竟资本市场在当时扮演了什么样的角色?回想当年,资本市场对当时“新概念”的科网公 司给予了突破性的估值方式,不以收入、营利、资产等传统的估值参数为重点。根据当时的“科网理论”,互联网公司的价值取决于吸引客户/用户的速度,即使亏 损也在所不计,他们买的压根儿就是公司的未来。在巅峰时期,主要衡量科技公司股价的纳斯达克指数曾经超越5000点的历史高位。很多“纯概念”公司,即使 从来没有赚过钱(甚至从来没有收入)都能通过首次股票发行(IPO)于主要的交易市场挂牌并筹集巨额的资金。虽然不少公司最终在科网泡沫爆破时倒闭,但这 狂热投资的大时代仍造就了不少现在家传户晓的品牌。如亚马逊,在科网年代时为了增大市场占有率,不惜以低于成本价销售产品,导致连年录得巨额亏损。但现在 他的商业模式已获得肯定,成为赚钱的公司,股价对比2001年的“谷底”翻了50多倍。谷歌更加从云云的搜索引擎公司脱颖而出,成为从多网民每天生活的一 部分,身价也跃升成全球市值最大的公司之一。 这些企业的成功也带动其商业模式的“国际化”。百度、携程、优酷等很多著名国内企业都是以先优化(ENHANCE)及地方化(LOCALIZE)这些商业 模式,再通过美国资本市场融资而最终获得成功。
可以说,资本市场对科网概念的亢奋成了上述科网公司成功的主引擎。创投资金的泛滥,营造了特殊的环境,让科网公司可以在长期没有实质盈利的情况下成长,时势创造了“英雄”。近年来,越来越多迹象显示大数据行业将成为资本市场下一波的“宠儿“。随着资本市场对大数据概念的肯定,创业投资基金以及私募基金不遗余力加大对大数据创业公司投入的力度。按非正式统计,2013年投入的资金已超过2008至2012年之总和。大部分的目标公司都是从事数据储存,数据管理及数据分析的软件/方案开发,其中之皎皎者为:
——估值已超过90亿美元的Palantir,主力从事资料分析,已募集创投基金6亿5千万美元。
——估值达至少40亿美元的Cloudera,从事HADOOP数据储存及处理平台的开发,已募集创投基金10亿4千万美元,投资者包括行业中有名的英特尔(Intel)及谷歌创投(Google Ventures)等明星团队。
还有估值达70亿美元的Mu Sigma,12亿美元的MongoDB,及分别估值为10亿美元的HortonWorks和New Relic,案例多不胜数,大部分(92%)都在美国(60%集中在加里福尼亚州)。数据显示,这些公司提出的商业模式以及产品开发方向都非常类似,这意 味着创投基金对这些商业模式的肯定。加上上面提到过大数据应用的持续普及,和之前科网热潮的百花齐放,以宽松的估值方式“宁可投错,不可放过”的局面很有 可能会再次出现。目前中国的资信科技行业,从事大资料技术开发的公司并不太多,从业者如能好好把握未来的发展与机会,说不定就能成为下一波的“英雄”。
另外,最近发数据的行业应用也开始火热起来。最近在深圳前海开始营业的“微众银行”的大数据金融概念深得国家支持,符合“普惠银行”的政策。相信以后会有更多的行业跟大数据扯上关系,走向资本市场。
结语
随着境外大数据企业近年在美国资本市场的落地开花,相信会为国内的信息产业带来新的灵感及发展方向。作为世界上其中一个数据使用量最大的国家,我们期待的是国内大数据企业在未来资本市场的大爆发。
作者简介
马加玮,毕业于美国加利福尼亚大学伯克利分校计算机及电子工程系及南加州大学工商管理硕士。回流香港后任职著名创投基金分析员,专门投资互联网及电子商贸类企业。及后任职企业财务顾问,有15年资本市场经验,曾协助多家大中华区不同行业企业成功在香港及海外上市融资。
罗干淇,毕业于香港大学法律系,香港特别行政区高等法院律师。有十五年国际资本市场经验,曾协助超过十家民营企业成功在境外上市及融资,并曾担任境外上市公司董事、董秘、法务总监、上市组组长及境外基金副总裁等职。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31