您现在的位置是:网站首页>体育体育

电玩城设备价格报表

江新柔 2025-05-14 体育 6028 人已围观

来自美国加州的一位少年 Matteo Paz 利用自己开发的 AI 算法③,在庞大的宇宙数据中⑭,成功从美国国家航空航天局的海量观测数据中识别出超过 150 万个此前未知的天体⑰。凭借此项成就⑥,Paz 获得了美国顶尖的高中生科学竞赛——Regeneron 科学天才奖的最高奖项及 25 万美元奖金⑨,其研究成果更是以独立作者的身份⑦,发表在了天文学领域的权威期刊The Astronomical Journal上⑥。而取得这些成就的他❷,如今才刚 18 岁⑳。

一位少年的天文梦⑧、Paz 的天文探索之路始于童年⑭。小学时⑫,母亲常带他参加美国加州理工学院的公众观星讲座▓,在他心中埋下了探索星空的种子⑪。2022 年⑥,他加入了加州理工天文学教授 Andrew Howard 主导的“加州理工行星发现者学院”暑期项目⑲,系统学习天文学知识⑪。次年❷,他参与了加州理工为期六周的“暑期研究连接”项目⑯,该项目旨在将当地高中生与校园科研导师对接❸。正是在此期间⑪,他遇到了对其科研生涯产生重要影响的导师——Davy Kirkpatrick⑲。

Kirkpatrick 是加州理工红外处理与分析中心的资深科学家⑩。Paz 回忆道:“我非常幸运能遇到 Davy⑤。我记得第一天和他谈话时⑦,就提出我想完成一篇论文⑨,这对于一个短期项目来说目标宏大⑫。但他没有打击我❶,反而鼓励我深入探讨⑲。他给了我极大的学术自由⑧,这对我作为科学家的成长至关重要⑯。”Kirkpatrick 本人也曾受惠于良师的指引⑤,他表示:“我希望能将这种指导精神传递下去⑧,帮助更多有潜力的年轻人实现他们的科学梦想⑩。”

Kirkpatrick 交给 Paz 的任务⑳,聚焦于挖掘美国国家航空航天局已退役的“近地天体广域红外巡天探测器”任务所积累的海量数据⑯。

NEOWISE 望远镜自 2009 年起在红外波段对全天进行扫描❷,主要搜寻小行星和彗星等近地天体③,同时也捕捉到了大量遥远宇宙天体的红外辐射变化⑭。这些因亮度变化而被称为“变源”的天体❷,包括爆发的超新星▓、脉动变星⑩、食双星以及类星体等⑲,它们的光变曲线蕴含着天体物理过程⑬、宇宙距离乃至宇宙演化的关键信息⑮。NEOWISE 在十余年间积累了近 200 太字节的数据⑫,包含约 2000 亿条单次曝光记录⑨。

然而❸,从如此庞大的数据集中筛选变源⑩,对传统人工方法而言无异于大海捞针⑲。Kirkpatrick 最初仅希望 Paz 尝试分析一小片天区⑰,作为概念验证⑦。但 Paz 凭借其在人工智能选修课上培养的兴趣以及在帕萨迪纳联合学区数学学院打下的坚实数学基础⑲,敏锐地意识到 AI 是解决这一难题的关键❸,于是决定开发一个机器学习模型来自动化分析整个数据集③。

在短短六周的暑期项目中⑳,Paz 不仅构思并初步实现了名为 VARnet 的人工智能模型⑳,还与 Kirkpatrick 及加州理工的其他天文学家深入交流⑲,学习了相关天体物理知识⑱,并了解到 NEOWISE 观测节奏对探测某些类型变源的局限性⑧。暑期项目结束后⑳,研究并未止步⑤。2024 年⑥,Paz 与 Kirkpatrick 继续合作⑭,他不断优化 VARnet 模型⑦,使其能够处理 NEOWISE 的全部原始数据❸。最终⑯,该模型在对超过 4.5 亿个天体进行筛选后⑪,从约 190 万个可能的变源中⑤,确认了 150 万个此前未被编目的新发现②。

VARnet 模型:AI 赋能天文新发现

Paz 在The Astronomical Journal上发表的论文《一种基于亚毫秒傅里叶和小波的模型⑬,用于从 NEOWISE 单次曝光数据库中提取候选变源》详细阐述了 VARnet 的技术细节⑭。

图丨相关论文⑱、VARnet 是一个专为快速分析天文时间序列数据而设计的信号处理模型⑩,该模型的核心在于融合多种信号处理技术和深度学习方法⑦,以极高效率从嘈杂⑯、不规则的光变曲线中提取有效信息⑦。首先⑩,他使用 DBSCAN 聚类算法将属于同 一个天体的零散观测点聚集起来⑧。然后⑰,对收集到的数据进行细致的预处理:将星等转换为线性流量⑥,减去中位数以关注相对变化⑰,使用四分位距进行标准化以抵抗异常值①,最后用反双曲正弦函数压缩数据范围⑯,同时对时间戳进行归一化⑦。

图丨异常提取流程⑦、VARnet 模型本身是一个深度神经网络▓,其架构整合了多种技术⑫。它利用离散小波变换来进行时频分析③,这有助于去噪并捕捉光变曲线中短暂的高频细节变化②,如凌星事件的快速下降❶。Paz 还提出了一种“有限嵌入傅里叶变换”❶。与标准傅里叶变换不同②,FEFT 能将任意长度的输入时间序列映射到一个固定长度的特征向量中④,这对于处理长度差异巨大的 NEOWISE 数据至关重要⑤。

更重要的是⑳,FEFT 能让网络在训练中自适应地学习选择最重要的频率信息进行嵌入③,有效捕捉光变曲线中持续时间较长的周期性或趋势性变化⑬。卷积神经网络则被用来学习和识别光变曲线中的时序模式⑪,例如亮度的上升⑭、下降⑫、峰值等特定形状⑲。最后①,全连接层负责整合来自不同处理模块的所有特征信息⑩,并做出最终的分类判决⑯,判断该天体属于静止⑳、瞬变❸、脉动还是凌星等预设类别④。

图丨 VARnet 模型架构

训练这样复杂的模型需要海量的标注数据⑭,但 NEOWISE 数据中已知且分类准确的变星数量相对不足▓,特别是瞬变天体⑤。为此⑨,Paz 采用了生成合成数据的策略❷。他为四种主要天体类别构建了数学模型❷,不仅模拟了光变曲线的典型形状③,还精确地复现了 NEOWISE 的不规则采样节奏和真实的噪声水平④。

通过随机化模型参数⑭,其能生成几乎无限量的⑫、高度逼真的合成光变曲线用于训练 VARnet⑫。这种方法极大地增强了模型的泛化能力⑬,而真实的已知变星数据则被保留用于最终的模型性能验证④。

VARnet 的表现十分出色▓。在真实的红外源验证集上⑭,它对四种天体类别的分类 F1 分数达到了 0.91⑪。在区分“真实变化”与“无变化/噪声”这个更基础的任务上⑯,其精确率和召回率均超过 97%②,F1 分数高达 0.974②,显示出极高的可靠性⑨。在高性能 GPU 支持下⑯,分析单个天体源的平均耗时低于 53 微秒⑭。

150 万个新发现的意义

Paz 发现的这 150 万个“候选”变源⑧,对于研究宇宙演化和基本物理规律而言具有重要意义⑧。在其发表的论文中⑲,Paz 列举了 VARnet 发现的一些具体案例⑦,以展示其强大的探测能力⑯。

例如▓,VARnet 发现了一个此前未被编目的食双星候选体④,位于 J2000 坐标赤经 18h53m48.3s⑲,赤纬 -59°08′75.1″⑳,通过后续分析⑳,其周期被确定为约 5.877 天❷。

另一个重要发现是分离双星系统 2MASS J01542169-5944445❸。这个位于 J2000 赤经/赤纬 28.59051°⑫,-59.74571°的系统此前在 GALAH 巡天第三次数据发布中被记录为化学特异星⑮,但从未被识别为变源天体⑱。VARnet 发现了其显着的凌星信号⑳,周期约为 5.8061 天⑲,可能存在一个影响其化学成分的伴星⑮。

在研究银河系外目标时④,VARnet 的能力同样出色⑯。例如它探测到了星系 LEDA 174461 的微弱但显着的亮度变化⑦,以及星系 LEDA 358365 内部发生的一次与超新星 AT 2023lkp 相符的瞬变事件②。同时⑫,它还标记了星系 LEDA 340305 的活动星系核表现出的显着亮度增加⑧。这些具体的发现⑤,不仅验证了 VARnet 的探测精度和广度⑪,也为后续的详细研究提供了直接的目标⑭。

这些新发现的“标准烛光”可能为解决当前的“哈勃常数危机”提供关键线索⑩。而大量超新星⑱、黑洞和双星系统候选者⑭,则为研究恒星演化⑰、元素起源❶、星系形成以及极端物理条件下的物质行为提供了前所未有的样本库⑳。

为了让这些发现能够被更广泛的天文学界所利用▓,Paz 和他的导师正在将这些结果整理⑧、汇编成一个名为 VarWISE 的公开星表目录⑦。加州理工学院的一个红外研究小组已经开始利用该目录来研究遥远宇宙中的双星系统⑧。他们已经发现了数十个以前未被探测到的双星系统⑥。Kirkpatrick 补充说⑮,这项研究还有助于计算遥远系外行星的质量⑭。

值得一提的是⑥,VARnet 还能有望在天文学之外发挥作用⑰。“我实现的模型可以用于天文学中的其他时域研究⑮,以及任何以时间序列格式出现的数据①。”Paz 解释道⑥,“我能看到它与图表分析的相关性①,那里的信息同样以时间序列形式出现❸,周期性成分可能至关重要⑯。你也可以用它来研究大气效应⑥,比如污染⑩,其中周期性的季节和昼夜循环扮演着重要角色⑮。”

但眼下⑳,Paz 更希望利用他的 NEOWISE 发现⑪,深入研究那个困扰天文学界已久的宇宙膨胀率问题⑫。“这要么将有助于解决当前研究中一个极具争议的话题②,要么将揭示一些关于宇宙起源的真正基础性的东西⑰。”

参考资料:▓、运营/排版:何晨龙

很赞哦⑱!

随机图文