大数据时代 广州超算能否成为创新“新引擎”
2014年底,全球超级计算机TOP500组织在美国正式发布了全球超级计算机500强最新排行榜,广州超算中心“天河二号”超级计算机,以每秒33.86千万亿次的浮点运算速度,第四次摘得全球运行速度最快的超级计算机桂冠。2015年底,“天河二号”将提供每秒11亿亿次高性能计算机系统。
大数据时代,广州超算能否成为创新“新引擎”?近日,笔者采访了国家超级计算广州中心(以下简称广州超算中心)“天河二号”研究团队及相关人员,以探寻国之重器“天河二号”背后的故事。
依靠大数据提升原始创新能力
在位于中山大学东校区的国家超级计算广州中心。笔者看到占地约800平方米,由170个机柜组成的“天河二号”。
“如果把普通计算机的运算速度比做成人走路,那么超级计算机就达到了火箭的速度。在极高的运算速度下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。就拿‘天河二号’来说,13亿人用计算器算1000年才能达到‘天河二号’1小时的计算量。”广州超级计算中心常务副主任卢泽新说。
国家超级计算广州中心于2013年11月由国家科技部正式授牌,总投资超过25亿元人民币,是国家“十二五”“863计划”重大科技项目,由广东省政府、广州市政府、国防科学技术大学、中山大学四方共同建设。
卢泽新自豪地说:“‘天河二号’是当今世界上运算速度最快的超级计算机,综合技术处于国际领先水平。它有五大特点:一是高性能,峰值速度和持续速度都创造了新的世界纪录。二是低能耗,能效比为每瓦特19亿次,达到了世界先进水平。三是应用广,主打科学工程计算,兼顾了云计算。四是易使用,创新发展了异构融合体系结构,提高了软件兼容性和易编程性。五是性价比高。”
近年来,广东加快珠三角大科学工程创新体系建设步伐,积极争取国家重大科技基础设施建设项目落户广东,通过推进重大科技基础设施建设应用,加快提升原始创新能力。
在卢泽新看来,强大的计算能力将更好的支撑大科学问题的研究。近5年来,获得Gor-don Bell奖的超算应用所需要的计算资源都超过了1P,2013年获得Gordon Bell奖的超算应用甚至实现了14P的计算峰值,占用了红杉(位于美国劳伦斯利弗莫国家实验室的超级计算机,目前计算能力排名世界第三)约73%的计算资源。由此可见,大科学问题的研究对计算能力提出了更高的要求,只有“天河二号”这样具有强大计算能力的超级计算机,才能更好的支撑大科学问题研究的计算需求,“大数据时代的到来,超级计算机的作用将会凸显”。
卢泽新介绍,广州超算中心“天河二号”主机系统的设计计算能力为110P,目前一期系统已经达到54.9P,远远超过天津(4.7P)、深圳(1.3P)、长沙(1.4P)和济南(1.1P)等超算中心主机系统的计算能力。超级计算机可广泛应用于高新产业和现代服务业、数字城市建设及科研等多种领域,成为融高性能计算、海量数据处理、信息管理服务于一体的世界一流的超级计算中心,为广州、广东乃至华南地区的经济社会发展提供强大引擎。
运用超算中心为产业升级服务
然而无论是中国还是欧美、日本等超算大国,在超算中心商业化的问题上都遇到了困难,几乎所有的超算中心都需要政府的财政支持。对于“天河二号”这样庞大的系统来说,如何让它为产业升级服务而实现商业化?
广州超级计算中心主任袁学锋认为,目前世界上都在酝酿着所谓的第三次产业革命,其核心的内容就是如何把信息技术的大数据向制造业、实体经济辐射。所以如何利用大数据将信息技术转化为生产力,是广州超算中心在应用方面的核心内容,这也是衡量一个国家创新型经济竞争能力的核心内容。
以当下热门的3D打印为例,就是通过材料实现了对制造业的颠覆性创新,从这一点来说广州超算中心可以提供在材料和制造方面的高性能计算能力。
让袁学锋格外得意的是,目前广州超算中心已经与世界领先的基因公司华大基因展开基于基因科学的合作内容,将医疗与基因工程集成化、个性化。“这其中牵扯大数据、高性能计算的东西,还有云计算技术等多项内容,广州超算中心则负责所有数据的汇总与分析。”
另外,中国商飞(中国商用飞机有限责任公司)已经在天河二号上实现了C919的运行模拟,这是一款与波音737类似的中型客机。
除此之外,广州超算中心还负责广东省的政务云系统,包括电子政务、电子教育、电子医疗、电子环境、电子灾害预报等内容都将在“天河二号”上实现。
“天河二号”作为广州超算中心的主机,如今它的运用已渗入广州多个产业。卢泽新介绍,广汽研究院也是“天河二号”的用户,以该院汽车设计为例,在超级计算机的帮助下,原来需要两至三年的新车型设计,缩短到5个月完成,并可模拟实现优化设计、防撞性能测试,大大节约了成本。
“智慧城市的建设也可以用到‘超算’。广州有20万个摄像头,过去处于有事才找视频的状态,现在有关部门正与超算中心合作对这些信息进行管理、控制,进行数据分析后再加以利用,这将对城市建设产生很大帮助。”卢泽新表示。
随着软件技术开发的国际化,“天河二号”云服务应用收获积极成效。截至目前,云平台共有用户约20家。部分机柜与应用单位通过专线连接,为用户提供了高安全等级资源服务。主要服务领域包括:电子政务应用——已适配完成了广州市政府网站群、电子政务数据交换平台等应用,目前正在支持中山市电子政务应用,同时作为省级教育数据中心主要资源池,广州超算中心将为各类教育管理系统提供所需计算和存储资源;动漫渲染应用——为动漫产业提供海量的计算资源,目前正在支持华强、奥飞、酷卡等多个用户的渲染业务。
卢泽新表示,广州在“天河二号”的开发过程中,还将在番禺南沙等地,建立超算分中心,利用光纤与位于大学城的主中心连接,更贴近的满足企业实时运算需求。
呼吁政府补助中小企业上机费用
卢泽新认为,数据开放可充分利用蕴藏着的社会能量,调动大众的智慧。数据是知识生产和创新的资源,通过互联网开放数据,就是将原来由部分社会精英垄断的知识和创新资源,开放给大众,进一步调动大众智慧,推动大众创新。每个人贡献一点点,大数据就可能还原事件的真相,或者推动某种创新。例如,开源项目、开源社区、开放性创新联盟组织的兴起,有效降低了产业技术的壁垒,推动更多的创业者介入。因此大数据时代“国之重器”应该大展身手。
然而自2013年以来,大数据应用基本上还是自发状,并没有形成燎原之势。大数据现有技术水平的主要受益产业仍然主要是云计算的科研。用卢泽新的话来说,超级计算机可以“算天”“算地”“算人”,但最为迫切的是把它运用到为经济服务上。在产业升级方面,大数据的市场发展前景是非常广阔的。珠三角以及港澳地区,均有大量的数据运算需求。以广州地区为例,共有规模以上医药企业86家,产值近180亿元,均拥有极高的药理试验性数据运算需求。
笔者在调查中了解到,虽然“天河二号”的资源是完全向社会开放的,包括中小微企业等用户,如果有超算的需要,未来都可在国家超算广州中心的网页上进行申请,提交课题。但因为费用门槛,中小企业申请者寥寥。
缺乏核心技术、产品附加值低是广州实施创新驱动的短板。如今广州在大数据领域拥有了“天河二号”,将迎来了突破核心技术短板的机会。未来的工业发展模式是信息技术与工业技术的高度融合,是网络、计算机、数据信息、软件与自动化技术的深度交织。广州制造业基于过去30年发展已积累了一定的技术基础和研发能力,抓住大数据这一机遇,完全有可能实现战略性的重点突破、重点跨越,在制造业上实现创新驱动发展。
袁学锋希望,政府对有需要的中小企业提供上机费用补助。“只有当超级计算机的能力为社会广泛应用时,人人可以公平自由参与、竞争合作、创造分享,大数据时代才能发挥它应有的作用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31