大数据助天文学研究风光无限
战国时期,一本记载着800多颗恒星名字和位置的《石氏星经》,是祖辈们探索宇宙的秘笈,被誉为最古老的天文数据库。
2400年后,美国天文学家发现了一颗超高速星。有趣的是,这个发现并非由天文观测获得,而是利用中国虚拟天文台公布的数据“算”出来的。
事实上,除了科学家,普通百姓也能借助大数据、云计算等高科技来实现“天文突破”。此前,安徽合肥一名年仅10岁的小学生廖家铭,在没有任何观测设备的前提下,通过中国虚拟天文台的数据发现了一颗超新星,是迄今为止全球年龄最小的超新星发现者。
“打电脑”的天文学家
“由于我们观测的是宇宙中比较遥远的星体,到达地球的信号很弱,很容易淹没在城市的灯光里,因此天文望远镜一般都建在大山深处。”从北京市区驱车前往位于河北省的观测站,是中科院国家天文台郭守敬望远镜运行和发展中心常务副主任赵永恒的工作常态。
然而,从2017年4月份起,赵永恒把更多时间花在了另一项工作上:“打电脑”,因为他加入了一支特殊的“尖兵部队”—— 由国台联合阿里云成立的科技指导委员会,成了首批受聘专家之一。
毕业于河北师大的赵永恒,走出校园后就进入了中科院国家天文台工作,成为一名“追星人”,除了观星星,还有一大爱好就是玩电脑。
十几年前,作为国台最懂电脑的研究员,赵永恒用一台从中关村市场淘来的旧电脑鼓捣出了一个网站,这就是中国虚拟天文台的雏形。“我们的想法很简单,把国内外天文望远镜的观测数据放到这个平台上。”
广袤的宇宙意味着海量的数据,这也是天文学不同于其他学科的重要特征。
以赵永恒负责的LAMOST郭守敬望远镜为例,它可以同时观测四千个天体,相当于同时启动四千台天文望远镜。到目前为止,已经观测了将近3000个天区,收集了超过600万条光谱数据。
“天文学已经进入大数据时代,两年数据就翻一番。一个团队或者一个国家,不可能及时地把所有数据都分析完,所以数据开放程度越高,被研究的机会就越多,产生的科学成果就会越多。”赵永恒说。
开放共享的天文数据
正是基于这样的思考,2016年,中科院国家天文台与阿里云达成了战略合作,引入最前沿的云计算、大数据技术,实现天文数据开放共享。
“今天不懂互联网几乎是寸步难行。”每次跟阿里云的技术团队开会,赵永恒都感觉收获良多,“15年前,我们只有一个简单的网站,如今中国虚拟天文台主节点迁移到云端后,成为一个集成超过500TB的科学数据、1.5PB的存储能力、700多Tflops计算能力和100多种软件的超级平台。”
赵永恒希望,未来的虚拟天文台能够成为全世界天文学者和爱好者获取天文数据、开展天文研究、进行科普教育的综合基地。
“科学离不开技术,技术也离不开科学。”正如赵永恒理解的,国家天文台联合阿里云成立的跨界“尖兵部队”,由最懂天文的技术专家和最懂技术的天文学家组成。
“我们从哪里来?时间有没有起点?宇宙是怎样诞生和演化的?要想回答这些终极问题,需要建立更加庞大的天文数据库,而技术则是通往未来的钥匙。”赵永恒表示。
将天文科普进行到底
为了给国内的天文爱好者提供一个稳定地展示自己才华和交流的平台,在中科院国家天文台—阿里云天文大数据联合研究中心主任崔辰州等的多方努力下,国家天文台LAMOST大科学工程设立了一台专门无偿为天文爱好者和业余天文组织提供主页空间的服务器——“宇宙驿站”,并于2002年3月12日对外开放。
2005年中国互联网协会大会上,“宇宙驿站”荣获组委会特别提名奖,理由是“走出了一条独特的网络科普道路”。
“宇宙驿站”是国内目前唯一一台专为天文科普服务的网络服务器。服务器在天文爱好者心中的地位日渐升高,国内许多爱好者和组织把自己的主页建立或迁移到这台服务器上。
2017年1月,“国家天文台—阿里云天文大数据联合研究中心”成立。前不久,中国虚拟天文台主节点和郭守敬望远镜巡天数据成功上云,“宇宙驿站”天文科普网站群100多个天文科普网站同时上云,更好地服务广大天文爱好者。
崔辰州认为:“天文学是名副其实的‘大数据’科学,每天由天文观测设备捕捉到的海量天文数据,不仅是科学研究的必需品,也是宝贵的科学普及和教育资源。”
“过去由于技术限制,这些数据无法得到充分的利用和分享,而在互联网+时代,云计算和大数据技术的成熟,加速了学科发展和大众科普。”崔辰州表示,“因此,天文科普教育工作必须由数据、由新技术来驱动,通过互联网把国际、国内的专家以及广大公众连接起来。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-12