我们都是大数据的俘虏_数据分析师
在大数据面前,“一切稳固的东西都烟消云散,一切神圣的东西都将被亵渎”。刚刚过去的世界杯,就是最好的例证。
今年没有“章鱼帝”,但有“乌贼刘”和大数据公司的“对赌”。最终理工男设计的数学模型挫败了美女的好运气,央视体育频道主播刘语熙不敌百度。
就在巴西世界杯的另一个赛场上,微软、谷歌等国内外技术巨头和大投资银行高盛、德意志银行乃至彭博等,纷纷登台角逐,初试大数据预测。
百度脱颖而出,在14场淘汰赛和总决赛预测中,准确度达到100%。即使在频爆冷门的小组赛中,百度预测准确率也达到58.33%。而微软的准确率也达到56.25%。
人们不禁惊呼并大胆联想:在大数据面前,互联网公司完胜华尔街。2014年世界杯将成为一个新起点:大数据业务正式从单纯的技术走入日常生活的实际应用。
目前,全球都在制定具体措施发展大数据业务,将之应用于医疗、能源、农业等各个领域。毫无疑问,大数据将在未来扮演越来越重要的角色。在此背景下,如何充分利用大数据、借助大数据掘金,成为所有行业,特别是传统行业关注的焦点。
当我们的情感都可以被衡量、预测,大数据就将俘虏一切。
这个夏天,足球,绝对是运用大数据最领先、最成功的领域。
抛开预测比分之类的“业余活动”,对捧回大力神杯的德国队来说,大数据分析犹如被安插上场的“第12人”——据透露,德国队在赛前就“私人定制”了一款名为“比赛洞察力”的足球解决方案,其核心就是大数据分析。
放眼球场之外的世界,大数据正在开启一次重大的时代转型——通过渗透各行各业的核心职能领域,成为社会的重要生产因素。
“就像望远镜能让我们感受宇宙,显微镜能让我们观测微生物一样。大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正在蓄势待发……”
《大数据时代》一书的作者舍恩伯格一再提醒读者:大数据时代不再是追求因果的时代,而更多是追求相关性,我们正在进入一个“有时候是什么比为什么更重要”的时代。这是一场思维的变革。
大数据“正解”
“大数据”这三个字叫错了?!
阿里巴巴首席技术官王坚在《大数据时代》的研讨会上,以一场颠覆性的讲话,抛给大家一个问题:大数据到底是什么?
与会的还有这本书的作者舍恩伯格,可他也从未能给大数据下一个确切的定义。
这正是大数据时代的特征:其本身定义都将随着时代不断被更新。
尽管王坚没有给出明确答案,但他提出一个有意思的观点:今天的数据不是大,真正有意思的是数据变得在线了,这恰恰是互联网的特点。数据分析古已有之,但如果是记录在纸上,记录在磁带上,“与在线就有着天壤之别”。
刚刚结束的世界杯的确让人感受到“在线”的威力,草根战胜博彩公司的案例越来越多。彩票宝网站上大名鼎鼎的“xxiu1121”是个85后女孩,世界杯期间收获颇丰。数据显示,“xxiu1121”猜中61场比赛,准确率接近70%。在博彩行业,这个数字堪称奇迹,连专业人士都很难想象。
这位85后彩迷坦言,“百度大数据”对她帮助很大。
“xxiu1121”所说的“百度大数据”,是指百度推出的世界杯预测产品。据称,这个产品综合了过去5年内全世界987支球队的3.7万场比赛数据以及469家欧赔公司的赔率数据。“xxiu1121”击败专业博彩公司正是借助百度免费、开放、在线的数据分析。
数据免费、开放、在线令以往博彩公司凭借信息不对称占据的优势被迅速抹平。利用大数据帮助投注者“击败庄家”的分析公司正不断涌现。
英国一家名不见经传的Betegy公司称,可以通过一种复杂算法,准确预测90%的英超比赛结果。
Betegy公司称,普通人只要用不到400英镑买下一台存储容量为1Tb的电脑,就有足够能力去建立十分复杂的模型。客户可以装载各种不同的统计数据和已知结果,从而实现类似神经网络这类尖端技术。该软件会根据所有可用数据建立“最佳匹配”模型,结果10次中有9次会击败专家。
摧毁“旧格局”
越来越多的行业因大数据介入开始变得“晃晃悠悠”,在线的数据悄然改变着所有稳固的格局。
如打车软件,通过乘客需求以及出租车空车率等数据,反过来影响承运行业,这远比过去出租车公司对司机的影响更直观。
再比如,预测美国总统当选的盖勒普调查,很可能被Twitter干掉。现在无需派发纸质调查问卷,只要在社交媒体上做调查就可以预测谁会当选总统了。
同时,市场上还出现了基于社交媒体Twitter的对冲基金,Derwent Capital Markets创始人保罗·赫汀认为,用在线数据可以量化贪婪与恐惧,从而作出更理性的决策。
值得一提的是,过去数次科技革命中,中国均是学习者,而这一次,中国与世界最先进水平的差距比以往任何时候都要小,甚至站到了最前沿。
在大数据与人工智能结合的领域,百度暂时将微软、谷歌等大腕甩在身后。在国内,有更多的“百度们”正在演绎一次“中国式抢跑”,公共卫生、文化产业、理财投资等更多传统领域与大数据分析不断融合,打开跨界应用的空间。
未来十年,还有哪个行业可以增长十倍?是汽车、房地产还是服装?答案都是否定的。新希望集团董事长刘永好在搜狐财经夏季峰会上提出问题并回答了问题:基于大数据和云计算的行业完全有可能增长十倍。
这种判断有数据作为支撑。据赛迪顾问统计,以2012年作为大数据技术发展元年,当时国内大数据市场规模为4.5亿元,但到2016年预计将达到百亿以上,从2014年开始年增速几乎每年超过100%。
目前大数据主要涉及10个领域,包括数据处理、分析环节、综合处理、语音识别、视频识别、商业智能软件、数据中心建设与维护、IT咨询、方案实施、信息安全等,而提供平台系统以及数据分析的则更被市场看重。
缔造“新秩序”
大数据不仅会摧毁旧格局,还可以打破几乎一切行业的固有边界。新希望集团董事长刘永好就深谙此道。
虽然无缘做成销售行业的阿里巴巴,但刘永好渴望布局一个大健康产业的平台系统。
“我们投资了一个远程医疗,做硬件也做很多软件,更重要的是,我们跟很多医院达成协议,在远程医疗方面做了相当多的工作,这是未来的方向。”刘永好透露。
仔细梳理刘永好的布局,其远程医疗最早布局始于2013年11月份,他与冯仑等成立了中国医疗健康产业策略联盟(简称“医健联”)。2014年4月份,新希望集团出资1亿元收购了中国香港上市公司华夏医疗19.5%股份;2014年5月份,新希望旗下的厚生投资出资近2亿元,成为浙江好络维医疗技术有限公司的第二大股东。
新希望勇敢的跨界投资,背后潜藏着传统产业搭上大数据分析后,迅速拓展的市场空间。
现在就连新希望这样的“外行”都来抢食,IT尖兵就更加不淡定了。
近日,朗玛信息(300288,股吧)收购39健康网,欲抢占大数据分析市场。朗玛信息看重的正是39健康网1.2亿人次/月的用户群体及广泛的三甲医院、知名医师资源,朗玛通过收购获取了流量入口及海量的数据。
新希望和朗玛信息仅是大数据平台以及大数据分析领域的两个个案,在诸多传统领域更多的大数据故事正在上演。现在百度的合作伙伴不仅有指数基金,也有文化产业公司。如果说传统产业之间的边界是相对分明的,那么大数据则不会过多顾忌这些“界限”,大有无孔不入的趋势。
信达证券分析师边铁城认为:“大数据无论是在政府和军事应用,还是在零售业、制造业以及涉及个人位置服务等领域都有望得到广泛应用,并产生巨大的社会价值和产业空间。”数据显示,目前大数据概念主要涉及平台系统、数据分析、专用设备等领域,有些上市公司甚至涉及多个领域。
目前,几乎所有产业都站在大数据时代的门口,希冀寻求一条另类的升级道路。据外媒报道,近日欧盟正在制定大数据产业政策,采取具体措施发展大数据业务。就连苹果这样以高科技闻名的公司也开始寻求大数据升级方案。
本周二,苹果和IBM宣布,两家公司已经达成一项排他性的合作协议,未来将联合双方的市场领先优势,创造一种新类别的商务应用,将IBM的大数据和分析能力带给iPhone智能手机和iPad平板电脑,从而改造整个企业移动市场。
被“俘虏”的思维
1996年,美国计算机专家尼葛洛庞帝在《数字化生存》一书中预言,互联网将最先改变销售、出版、汽车和医疗事业。现在,大数据分析迅猛发展将预言变为现实。
国际咨询机构的数据显示,近两年产生的数据总量等于人类有史以来产生的数据量总和。
数据不再是静止、陈旧的,而成为一种商业资本,一项重要的经济投入,可以创造新的经济利益。
最近两年,从地产到医疗,从文化到金融,“互联网思维”被反复提及。无论如何应用,互联网思维离不开大数据分析,大数据的价值在于提供了多维度、多来源、多形式的数据,能更完整、全面和客观地描述我们所要研究的对象。
如果这样描述过于抽象,那么近期诞生的“南方新浪财经大数据策略指数”就是这种多维度、多来源的实证。
该指数正是基于投资者在互联网上的互动情况,编制的一项更多维度、多来源、多形式的“恐慌指数”。除了市场变动数据之外,其信息来自新浪股票频道、财经新闻、股吧论坛,尤其是微博相关财经账号。全方位展现投资者与股票间的互动情况,隐含了海量的投资辅助信息。
而此前被市场熟悉的芝加哥期权交易所波动性指数(VIX)仅反映的是市场的波动,对于人的分析是缺位的。
可见,互联网思维颠覆的并不是指数,而是我们对指数的认知。魔鬼往往藏于细节之中,原来被认为是草根论坛的“股吧”、“微博”、“论坛”却成为最新编制指数的依据。
大数据时代不再是追求因果的时代,而更多是追求相关性,我们正在进入一个“有时候是什么比为什么更重要”的时代。这就是一种思维的变革。(文章来源:CDA数据分析师)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31