超算发力 新毫秒脉冲星“现身”
科技日报记者王延斌
2月28日,科技日报记者从齐鲁工业大学国家超级计算济南中心(以下简称济南超算)了解到,该中心与齐鲁师范学院组成的科研团队借助500米口径球面射电望远镜(FAST)合作发现一颗新的毫秒脉冲星,并被命名为“PSRJ1810-0622”。中国科学院国家天文台FAST首席科学家李菂表示,该毫秒脉冲星自转周期为4.55毫秒,依照银河系电子密度模型估算,这颗脉冲星距离地球约678光年。
该项研究由济南超算FAST联合研究中心科研团队在山河超级计算平台上计算筛选,是国家天文台-齐鲁师范学院-济南超算联合研究团队的首个重大成果,并且也是FAST基于山东省彻底自有科研资源发现的首颗毫秒脉冲星。
十亿年慢一秒,可媲美“地球上最好的钟”
“脉冲星的旋转非常稳定,能够做到十亿年慢一秒,能够媲美地球上最好的钟。有了时刻,能够锚定不少基本的物理测量量,来研究宇宙的一系列基本的性质。”李菂讲。
毫秒脉冲星,是自转周期在1—10毫秒范围内的脉冲星,它仅能在微波或X射线的电磁波频谱上被观察到。
脉冲星被称为20世纪60年代的四大发现之一,是一种快速旋转的中子星,源于8—25倍太阳质量的恒星演化到末期记忆超新星爆发而形成。脉冲星中心的物质大约是一个太阳质量塌缩成中子星,其物质密度大约是水的密度千万亿倍。
齐鲁师范学院物理与电子工程学院院长张洁向记者表示,脉冲星的辐射来自其强大磁场的极冠区,每当中子星极冠转到地球视线方向,人类便看到其辐射信号。经过观测脉冲星的辐射信号,能够探测银河系中星际介质的分布和密度以及银河系的磁场分布与强度。此外,科学家们也在探究将脉冲星用于建立标准时刻系统、检验爱因斯坦广义相对论和探测低频引力波信号等。在不到20年的时刻里,脉冲星领域在1974年与1993年接连两次获得“诺贝尔物理学奖”。
研究脉冲星,其广义意义在于帮助拓展现代物理学理论研究,对空天信息和太空导航有重要的应用前景,但此次发现的脉冲星,还需科学家后续研究才能界定其科学意义。
在浩渺的宇宙中搜寻脉冲星并非易事。
专家表示,中国天眼FAST夜以继日地巡视着浩瀚星空,每秒接收到的宇宙电磁信号数据规模约为1.6GB,一天的数据量高达144TB,而每年则新产生约20PB的数据量,脉冲星的微弱信号便隐藏其中。传统搜寻办法要求科研人员首先需要对这些数据进行消色散、匹配滤波等处理后,生成脉冲星候选体数据结果图,再经过肉眼辨识出隐藏在其中的真实脉冲星信号。而如此的传统搜寻算法存储吞吐和计算规模很大,得到的候选体数量庞大,搜寻效率相对较低。
在国家超级计算济南中心研究员郭猛看来,现在尽管有国外开辟脉冲星候选体辅助预筛选软件,但面对这样庞大数据量,这类软件也难以实时生成脉冲星候选体,并且对算力需求的急剧增加。
“举例来讲,上述软件利用最常见的粗浅搜寻办法处理单个观测数据文件需要近几十个小时;若要进行更精细搜索,那么所需时刻将会成倍增加,且得到的候选体数量也有成千上万个。”郭猛表示,怎么有效地提高脉冲星数据筛选的速度和效率,使科研人员更快找到真正的脉冲星信号,极具挑战性。
FAST每年搜寻近20PB数据,天文咨询题变成了计算咨询题
记者了解到,济南超算科研团队介入上述任务的关键一步,便是依托其卓越的计算和存储能力,对符合脉冲星特征的数据进行优化提取。
“将现有的脉冲星候选体辅助预筛选软件移植在我们的山河超级计算平台上,进行算法改进和并行优化,充分利用多个处理器核心进行并行计算来提高筛选效率,经过数据并行的方式将不同计算节点上的数据进行并行读取和处理,提高整体计算吞吐量。”郭猛表示,“新算法相比该软件传统算法提速22倍,大大提升了探测到脉冲星的效率。”
并且,该团队还将目标识别、图像分类等AI算法与天文射电信号处理知识相结合,经过对AI模型的一系列深度学习训练,辅助筛选脉冲星候选体信息,大大降低依赖人眼大量识图的数量。
据介绍,该团队还创新性研究开辟了FAST脉冲星及快速射电暴筛图平台,并正在筹建国际率先的脉冲星数据库。该筛图平台解决了FAST脉冲星及快速射电暴在线筛选、候选体认证的存储和归档咨询题,实现了FAST信号图在线筛选、候选体存储、认证、归档治理。与传统筛选流程相比,该平台在web上即可登录使用,增加了更多用户交互,实现了多人筛选投票,提高了筛选正确率,降低了脉冲星的筛选流程繁琐程度,且系统提供数据统计分析功能,无需人工再进行繁琐的数据分析统计工作。
利用FAST脉冲星及快速射电暴筛图平台,济南超算对“中国天眼FAST多科学目标并且扫描巡天项目(CRAFTS)”脉冲星做认证的后随格网观测的约500TB存档数据,利用AI算法对产生的海量图片进行智能筛选,历经一年的攻关,最终找到219个候选体,并在这些候选体中首个认证了这颗新脉冲星PSRJ1810-0622。
“FAST一年的搜寻数据量能够达到10到20个PB,对这些数据进行有效处理差不多从纯粹的天文咨询题变成了计算机咨询题,更多地依赖计算和存储能力以及算法的改进。”国家天文台博士后张蕾讲。要从这样海量的数据中筛选分析出脉冲星的痕迹,依赖的是高速计算系统。而济南超算被誉为黄河流域“最强大脑”的美誉,它数据储存量大、算力高,为千行百业提供强大的算力支撑作用。
来源:中国科技网