大数据时代 广州超算能否成为创新“新引擎”
2014年底,全球超级计算机TOP500组织在美国正式发布了全球超级计算机500强最新排行榜,广州超算中心“天河二号”超级计算机,以每秒33.86千万亿次的浮点运算速度,第四次摘得全球运行速度最快的超级计算机桂冠。2015年底,“天河二号”将提供每秒11亿亿次高性能计算机系统。
大数据时代,广州超算能否成为创新“新引擎”?近日,笔者采访了国家超级计算广州中心(以下简称广州超算中心)“天河二号”研究团队及相关人员,以探寻国之重器“天河二号”背后的故事。
依靠大数据提升原始创新能力
在位于中山大学东校区的国家超级计算广州中心。笔者看到占地约800平方米,由170个机柜组成的“天河二号”。
“如果把普通计算机的运算速度比做成人走路,那么超级计算机就达到了火箭的速度。在极高的运算速度下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。就拿‘天河二号’来说,13亿人用计算器算1000年才能达到‘天河二号’1小时的计算量。”广州超级计算中心常务副主任卢泽新说。
国家超级计算广州中心于2013年11月由国家科技部正式授牌,总投资超过25亿元人民币,是国家“十二五”“863计划”重大科技项目,由广东省政府、广州市政府、国防科学技术大学、中山大学四方共同建设。
卢泽新自豪地说:“‘天河二号’是当今世界上运算速度最快的超级计算机,综合技术处于国际领先水平。它有五大特点:一是高性能,峰值速度和持续速度都创造了新的世界纪录。二是低能耗,能效比为每瓦特19亿次,达到了世界先进水平。三是应用广,主打科学工程计算,兼顾了云计算。四是易使用,创新发展了异构融合体系结构,提高了软件兼容性和易编程性。五是性价比高。”
近年来,广东加快珠三角大科学工程创新体系建设步伐,积极争取国家重大科技基础设施建设项目落户广东,通过推进重大科技基础设施建设应用,加快提升原始创新能力。
在卢泽新看来,强大的计算能力将更好的支撑大科学问题的研究。近5年来,获得Gor-don Bell奖的超算应用所需要的计算资源都超过了1P,2013年获得Gordon Bell奖的超算应用甚至实现了14P的计算峰值,占用了红杉(位于美国劳伦斯利弗莫国家实验室的超级计算机,目前计算能力排名世界第三)约73%的计算资源。由此可见,大科学问题的研究对计算能力提出了更高的要求,只有“天河二号”这样具有强大计算能力的超级计算机,才能更好的支撑大科学问题研究的计算需求,“大数据时代的到来,超级计算机的作用将会凸显”。
卢泽新介绍,广州超算中心“天河二号”主机系统的设计计算能力为110P,目前一期系统已经达到54.9P,远远超过天津(4.7P)、深圳(1.3P)、长沙(1.4P)和济南(1.1P)等超算中心主机系统的计算能力。超级计算机可广泛应用于高新产业和现代服务业、数字城市建设及科研等多种领域,成为融高性能计算、海量数据处理、信息管理服务于一体的世界一流的超级计算中心,为广州、广东乃至华南地区的经济社会发展提供强大引擎。
运用超算中心为产业升级服务
然而无论是中国还是欧美、日本等超算大国,在超算中心商业化的问题上都遇到了困难,几乎所有的超算中心都需要政府的财政支持。对于“天河二号”这样庞大的系统来说,如何让它为产业升级服务而实现商业化?
广州超级计算中心主任袁学锋认为,目前世界上都在酝酿着所谓的第三次产业革命,其核心的内容就是如何把信息技术的大数据向制造业、实体经济辐射。所以如何利用大数据将信息技术转化为生产力,是广州超算中心在应用方面的核心内容,这也是衡量一个国家创新型经济竞争能力的核心内容。
以当下热门的3D打印为例,就是通过材料实现了对制造业的颠覆性创新,从这一点来说广州超算中心可以提供在材料和制造方面的高性能计算能力。
让袁学锋格外得意的是,目前广州超算中心已经与世界领先的基因公司华大基因展开基于基因科学的合作内容,将医疗与基因工程集成化、个性化。“这其中牵扯大数据、高性能计算的东西,还有云计算技术等多项内容,广州超算中心则负责所有数据的汇总与分析。”
另外,中国商飞(中国商用飞机有限责任公司)已经在天河二号上实现了C919的运行模拟,这是一款与波音737类似的中型客机。
除此之外,广州超算中心还负责广东省的政务云系统,包括电子政务、电子教育、电子医疗、电子环境、电子灾害预报等内容都将在“天河二号”上实现。
“天河二号”作为广州超算中心的主机,如今它的运用已渗入广州多个产业。卢泽新介绍,广汽研究院也是“天河二号”的用户,以该院汽车设计为例,在超级计算机的帮助下,原来需要两至三年的新车型设计,缩短到5个月完成,并可模拟实现优化设计、防撞性能测试,大大节约了成本。
“智慧城市的建设也可以用到‘超算’。广州有20万个摄像头,过去处于有事才找视频的状态,现在有关部门正与超算中心合作对这些信息进行管理、控制,进行数据分析后再加以利用,这将对城市建设产生很大帮助。”卢泽新表示。
随着软件技术开发的国际化,“天河二号”云服务应用收获积极成效。截至目前,云平台共有用户约20家。部分机柜与应用单位通过专线连接,为用户提供了高安全等级资源服务。主要服务领域包括:电子政务应用——已适配完成了广州市政府网站群、电子政务数据交换平台等应用,目前正在支持中山市电子政务应用,同时作为省级教育数据中心主要资源池,广州超算中心将为各类教育管理系统提供所需计算和存储资源;动漫渲染应用——为动漫产业提供海量的计算资源,目前正在支持华强、奥飞、酷卡等多个用户的渲染业务。
卢泽新表示,广州在“天河二号”的开发过程中,还将在番禺南沙等地,建立超算分中心,利用光纤与位于大学城的主中心连接,更贴近的满足企业实时运算需求。
呼吁政府补助中小企业上机费用
卢泽新认为,数据开放可充分利用蕴藏着的社会能量,调动大众的智慧。数据是知识生产和创新的资源,通过互联网开放数据,就是将原来由部分社会精英垄断的知识和创新资源,开放给大众,进一步调动大众智慧,推动大众创新。每个人贡献一点点,大数据就可能还原事件的真相,或者推动某种创新。例如,开源项目、开源社区、开放性创新联盟组织的兴起,有效降低了产业技术的壁垒,推动更多的创业者介入。因此大数据时代“国之重器”应该大展身手。
然而自2013年以来,大数据应用基本上还是自发状,并没有形成燎原之势。大数据现有技术水平的主要受益产业仍然主要是云计算的科研。用卢泽新的话来说,超级计算机可以“算天”“算地”“算人”,但最为迫切的是把它运用到为经济服务上。在产业升级方面,大数据的市场发展前景是非常广阔的。珠三角以及港澳地区,均有大量的数据运算需求。以广州地区为例,共有规模以上医药企业86家,产值近180亿元,均拥有极高的药理试验性数据运算需求。
笔者在调查中了解到,虽然“天河二号”的资源是完全向社会开放的,包括中小微企业等用户,如果有超算的需要,未来都可在国家超算广州中心的网页上进行申请,提交课题。但因为费用门槛,中小企业申请者寥寥。
缺乏核心技术、产品附加值低是广州实施创新驱动的短板。如今广州在大数据领域拥有了“天河二号”,将迎来了突破核心技术短板的机会。未来的工业发展模式是信息技术与工业技术的高度融合,是网络、计算机、数据信息、软件与自动化技术的深度交织。广州制造业基于过去30年发展已积累了一定的技术基础和研发能力,抓住大数据这一机遇,完全有可能实现战略性的重点突破、重点跨越,在制造业上实现创新驱动发展。
袁学锋希望,政府对有需要的中小企业提供上机费用补助。“只有当超级计算机的能力为社会广泛应用时,人人可以公平自由参与、竞争合作、创造分享,大数据时代才能发挥它应有的作用。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 2 Pandas数据类型 Pandas 有两种自己独有的基本数据结构。需要注意的是,它固然有着两种数据 ...
2024-11-01《Python数据分析极简入门》 第2节 1 Pandas简介 说好开始学Python,怎么到了Pandas? 前面说过,既然定义为极简入门,我们只抓 ...
2024-10-31在当今数据驱动的世界中,数据科学与工程专业的重要性愈发凸显。无论是推动技术进步,还是在商业决策中提供精准分析,这一专业都 ...
2024-10-30在当今信息爆炸的时代,数据已成为企业决策和战略制定的核心资源。爬虫工程师因此成为数据获取和挖掘的关键角色。本文将详细介绍 ...
2024-10-30在当今数据驱动的世界中,数据分析是揭示商业洞察和推动决策的核心力量。选择合适的数据分析工具对于数据专业人士而言至关重要。 ...
2024-10-30能源企业在全球经济和环境保护双重压力下,正面临前所未有的挑战与机遇。数字化转型作为应对这些挑战的关键手段,正在深刻变革传 ...
2024-10-30近年来,随着数据科学的逐步发展,Python语言的使用率也越来越高,不仅可以做数据处理,网页开发,更是数据科学、机器学习、深度 ...
2024-10-30大数据分析师证书 针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。 ...
2024-10-30《Python数据分析极简入门》 附:Anaconda安装教程 注:分Windows系统下安装和MacOS系统安装 1. Windows系统下安装 第一步清华大 ...
2024-10-29拥抱数据分析的世界 - 成为一名数据分析工程师是一个充满挑战和机遇的职业选择。要成功地进入这个领域,你需要掌握一系列关键技 ...
2024-10-28降本增效:管理战略的关键 企业管理中的降本增效不仅是一项重要的战略举措,更是激发竞争力、提高盈利能力的关键。这一理念在当 ...
2024-10-28企业数字化是指利用数字技术和信息化手段,对企业的各个方面进行改造和优化,以提升生产效率、服务质量和市场竞争力的过程。实现 ...
2024-10-28数据科学专业毕业后,毕业生可以选择从事多种不同的岗位和领域。数据科学是一个快速发展且广泛应用的领域,毕业生在企业、学术界 ...
2024-10-28学习数据科学与大数据技术是当今职业发展中至关重要的一环。从基础到高级,以下是一些建议的课程路径: 基础课程: Python编程 ...
2024-10-28在信息技术和数据科学领域,数据架构师扮演着至关重要的角色。他们负责设计和管理企业中复杂的数据基础设施,以支持数据驱动的决 ...
2024-10-28进入21世纪以来,随着信息技术的迅猛发展,大数据已经成为全球最具影响力的技术之一,并成为企业数字化转型的核心驱动力。大数据 ...
2024-10-28随着科技的迅猛发展,数字化转型已成为现代企业保持竞争力和推动增长的关键战略之一。数字化不仅仅是技术的应用,它代表着一种全 ...
2024-10-28银行业正处于一个前所未有的数字化转型时期。在数字经济的驱动下,金融科技如大数据、人工智能、生物识别、物联网和云计算等技术 ...
2024-10-28数据分析可视化是一门艺术与科学相结合的技术,其主要目标是将复杂的数据变得更易于理解和分析。通过将数据以图表的形式呈现,我 ...
2024-10-28数据分析师在现代信息密集型的商业世界中扮演着至关重要的角色。他们通过专业的技能和敏锐的商业洞察力,帮助企业从大量数据中提 ...
2024-10-28