大数据时代的“最强大脑” _数据分析师
是否想过这样的情景:某一天,当你打开电视看天气预报,发现它能精确地预报明天早上8时你家门口的天气情况。
或者某天你要买房,你再也不用饱受奔波看房之苦,足不出户,只要打开电脑,在一个数字地图上敲入几个关键词,就可以看到房子周边的景色、房子的内在结构、甚至能够体验自己置身阳台所能观看到的景色。
甚至当你走进电影院,看到好莱坞科幻大片《盗梦空间》,你也想像电影里那样,在梦境里轻易模拟出一个现实空间,其逼真程度可以蒙骗那些被拐到梦境里来的人,让他们误以为身处现实
也许你会说,这只在盗梦空间里才会有。的确,在现实生活中,如果要模拟一个现实空间,特别是要达到以假乱真的程度,所需要的计算量和渲染工程,别说人脑,一台普通的电脑都有可能被烧爆。
但是在大数据时代即将来临之际,借助一台拥有最强大脑的超级计算机,这一切都将不是梦。
1.海量计算
如果普通电脑的运算速度像成人走路,那么超级计算机就是火箭速度。在极高的运算速度下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。
对于很多人而言,电脑已经成为生活中密不可分的一部分。是不是觉得你家中的四核PC就已经性能很强大了?在广州中山大学的国家超级计算机中心里,有一台拥有312万核心、浮点运算速度达到每秒33.86千万亿次的超级计算机,这就是由国防科学技术大学所研发的天河二号。
走进广州超算中心,记者看到了目前世界最快的超级计算机天河二号。一排排狭长的黑色机柜整齐地摆放在接近三个篮球场那么大的实验室中。虽然每排机柜彼此分开,但是工作人员告诉我们,它们工作时是彼此相连的,其实是一台计算机。
计算速度快,存储量大,体积也非常大,这是记者看到超级计算机时最直观的感受。
为了更好地理解超级计算机这个大块头,我们不妨把时钟往回拨一个甲子。
1946年2月14日,这是人类历史上划时代的一天。世界上第一台电子计算机埃尼阿克在美国宾夕法尼亚大学的实验室里诞生。埃尼阿克着实是个庞然大物,它由17468个电子管、6万个电阻器、1万个电容器和6000个开关组成,重达30吨,占地160平方米,耗电174千瓦/时,耗资45万美元,每秒能运行5000次加法运算。
在此后的60多年中,以电子计算机为代表的科技广泛应用到社会和人们的生活中。然而,当人类越来越深地涉足高科技领域时,遇到的是更为海量、超越一般电脑运算能力的计算难题。
这时,超级计算机适时出现了。超级计算机(supercomputer),通常是指由数百数千甚至更多的处理器(机)组成的,能够执行一般个人电脑和服务器无法处理的大资料量高速运算的计算机。如果把普通计算机的运算速度比做成人走路,那么超级计算机就达到了火箭的速度。在极高的运算速度下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。就拿天河二号来说,13亿人用计算器算1000年才能达到天河二号1小时的计算量。
由于超级计算机的基本组成组件与个人电脑的概念无太大差异,所以很多人会误以为超级计算机就是简单的cpu叠加。但这是一个认识误区。
浪潮集团高效能服务器和存储技术国家重点实验室副主任胡雷钧打了个比方:你用1000台PC,用普通的网线把它们连接在一起,你可能花了1万度电,算了10天,但是你用真正的超级计算机,可能只用5000度电,花了两天就算出来了。
超级计算机做的所有工作都是在提高性能和效率。在信息爆炸和科学不断进步的时代里,要推动一个领域继续向前发展,超级计算机的存在必不可少。如今,超级计算机也成为衡量一国科技实力的标志,在诸如天气预报、基因工程、核工业、军事、天体物理模拟、航空航天等高科技领域大展身手。
2.超级应用
随着超级计算机的不断发展,它所延伸的领域大多已与民生息息相关,例如与人们生活密切相关的天气预报和气候模拟、地震预报、三维地图以及大数据等应用
作为现代科学技术的大脑,超级计算机广泛应用于地球气候模拟、宇宙天体研究、基因研究、石油勘探、自然灾害预报等高、精、尖的前沿领域,已成为世界各国竞相争夺的科技战略制高点。
而即将到来的大数据时代,更是对人类的数据驾驭能力提出了全新的挑战,运用超级计算机解决大数据时代的重大问题迫在眉睫。
我国走在世界前沿的石油勘探超算应用,其发展经历过一段艰苦的时期。中国石油集团东方地球物理公司研发中心首席工程师赵长海对此感受颇深,所谓上天容易入地难,说的就是石油勘探。
在青海柴达木盆地,海拔4000米的英雄岭地区地质条件恶劣,地震地质条件使得该地区地震勘探久攻不克。
赵长海说:石油勘探,我们看不见油,最直接的方式就是打孔,但打孔成本太高,要靠人工地震波进行探测,再进行数据分析。这种计算,不管是硬件还是软件,负荷都是非常庞大的。
所谓的人工地震波探测,也叫地震勘探,就是向地下发射一个地震波,地震波发射之后地面有接收器,接收完这些地震波之后再进行分析,从而确定石油的位置。但是要接收并分析这些地震波,不仅要有瞬时获取大量数据的能力,还涉及到许多复杂的计算。
最后,借助超级计算机的不断发展,庞大的石油勘探地震数据计算才成为可能。
除了石油勘探,超级计算机在智慧城市、个性化医疗、天体物理等方面也有着广泛的应用前景。有专家大胆预言,借助于超级计算机强大而快速的运算能力,在实验室就能实施亚临界核试验,其与真正核试爆的效果是相同的,这意味着超级计算完全可以取代核试验。
尽管如此,由于早期的超级计算机大量应用于国家级的科研项目,让公众对超级计算机还十分陌生,造成一个超级计算机跟自己的生活关系不大的印象。但实际上,随着超级计算机的不断发展,它所延伸的领域大多已与民生息息相关。
数据显示,天河一号为汽车装备、石油物探、动漫渲染、生物医药等相关企业带来上亿元效益,辐射区域和行业经济规模近百亿元。
就拿天气预报来说,人们都关心第二天出行的天气状况,但是天气情况的预测为什么需要超级计算机呢?
气象局专家介绍,目前的中短期天气预报主要是根据气象卫星等观测的大气实况资料,通过求解描述天气演变过程的动力学方程组实现的。这种运算涉及数据量庞大,运算过程复杂,一般的计算机要计算出第二天的天气情况可能需要几个月的时间,这种预报就失去了意义。
也就是说,超级计算机可以帮助我们实时地掌握自己附近地区的天气情况,不再感叹六月的天,孩子的脸或者东边日出西边雨了。
3.超级算法
超级计算机就好比算盘,如果没有口诀,它就毫无用处。要让超级计算机真正运行起来,需要各种庞大、复杂的口诀和算法,这个被称作超级算法理论
中国是算盘的故乡。借助老祖宗们留下来的许多计算口诀,在即便已经进入电子计算机时代的今天,用算盘进行10以内的加减乘除,速度甚至比计算器还快。
超级计算机就好比算盘,如果没有口诀,它就毫无用处。中山大学数学与计算科学学院教授、广东省计算科学重点实验室主任许跃生形象地说。对于超级计算机而言,要让它真正运行起来,也需要各种口诀,但这些口诀更庞大、更复杂。目前科学界把这个算法称为超级算法理论。
许跃生介绍,超级算法理论是研究如何设计高性能的并行计算系统,如何发挥超级计算机的性能,为超级计算科学服务。
尽管超级计算机的运行速度越来越快,但它也面临着瓶颈:体积越来越大,产生更多的热量,耗电量也越来越大。
如果仅仅是算得更快,但耗电量更大、成本更高,就失去了应用意义。浪潮集团高性能计算总经理刘军说,现在超级计算机的研究方向是不断提升性价比,在额定功耗下尽可能提升运算速度。
这时,超算算法的意义就不言而喻。通俗地说,超算算法的意义在于,找出更高效率的计算方法,最大限度地充分利用超级计算机的计算能力,这是对人们体力、脑力和基础知识的考验。
一则2010年初轰动世界的新闻,刚好可以验证算法的威力。法国一名程序员用一台价值2000欧元的普通台式机,打破当时世界排名第42位的T2K Open超级计算机保持的世界纪录。
因此,相比超级计算机硬件的快速发展,目前全世界更看重超算应用领域的研究。
刘军介绍,虽然中国拥有世界最快的超级计算机天河二号,但我国在超算应用领域还十分薄弱,九成以上的超算软件都依赖国外进口。这也导致我国虽然拥有性能很强的大型超算系统,却缺乏相匹配的大规模并行软件,很多大型超级计算机不得不拆分成小规模的集群来跑应用,大系统并没有发挥出应有的价值,这实在是一种很大的浪费。
目前,我国在应用软件上能跑到万亿次以上的不是非常多,也就是说超级计算机的利用率并不高。超级计算机的使用要非常谨慎,用不好就是烧钱的。高效能服务器和存储技术国家重点实验室主任、浪潮集团执行总裁王恩东也告诉南方日报记者,如何把超算用好是全球性问题,要想让超级计算机真正成为推动科学技术创新和社会经济发展的发动机,必须要从应用创新和人才培养入手,充分发挥硬件的计算潜力。
链接
全球500强超级计算机美国拥有一半
从1983年我国第一台被命名为银河的亿次巨型电子计算机诞生,到2013年天河二号以峰值计算速度每秒5.49亿亿次再度夺冠,可以说,中国人用30年实现了超算赶超的大跨越。
不过,虽然天河二号成功突围,但在整体实力上,中国与超级计算机第一大国美国相比还有不小的差距。
《人民日报》2014年1月统计数据显示,单论超级计算机的数量,美国拥有全球500强超级计算机中的253个,总数较其他国家和地区的总和还要多,优势明显。中国大陆共有65个超级计算机进入500强榜单,位居第二。日本以30个位列第三。英、法、德国分别以29个、23个和19个位列第四至第六位。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel是数据分析的重要工具,强大的内置功能使其成为许多分析师的首选。在日常工作中,启用Excel的数据分析工具库能够显著提升数 ...
2024-12-23在当今信息爆炸的时代,数据分析师如同一位现代社会的侦探,肩负着从海量数据中提炼出有价值信息的重任。在这个过程中,掌握一系 ...
2024-12-23在现代的职场中,制作吸引人的PPT已经成为展示信息的重要手段,而其中数据对比的有效呈现尤为关键。为了让数据在幻灯片上不仅准 ...
2024-12-23在信息泛滥的现代社会,数据分析师已成为企业决策过程中不可或缺的角色。他们的任务是从海量数据中提取有价值的洞察,帮助组织制 ...
2024-12-23在数据驱动时代,数据分析已成为各行各业的必需技能。无论是提升个人能力还是推动职业发展,选择一条适合自己的学习路线至关重要 ...
2024-12-23在准备数据分析师面试时,掌握高频考题及其解答是应对面试的关键。为了帮助大家轻松上岸,以下是10个高频考题及其详细解析,外加 ...
2024-12-20互联网数据分析师是一个热门且综合性的职业,他们通过数据挖掘和分析,为企业的业务决策和运营优化提供强有力的支持。尤其在如今 ...
2024-12-20在现代商业环境中,数据分析师是不可或缺的角色。他们的工作不仅仅是对数据进行深入分析,更是协助企业从复杂的数据信息中提炼出 ...
2024-12-20随着大数据时代的到来,数据驱动的决策方式开始受到越来越多企业的青睐。近年来,数据分析在人力资源管理中正在扮演着至关重要的 ...
2024-12-20在数据分析的世界里,表面上的技术操作只是“入门票”,而真正的高手则需要打破一些“看不见的墙”。这些“隐形天花板”限制了数 ...
2024-12-19在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17