您现在的位置是:网站首页>足球足球

178移动电玩城

覃香巧 2025-05-13 足球 5994 人已围观

机器之心报道⑯、开启「分步思考」新范式⑭。

科学界的一个共识是:即使是最复杂的现代人工智能⑨,也难以媲美人类大脑的表现和效率⑩。

研究者经常从大自然中寻找灵感⑱,了解如何在人工智能领域取得进步⑰,例如利用进化来合并模型⑩、为语言模型进化出更高效的记忆或探索人工生命的空间⑮。虽然人工神经网络近年来让人工智能取得了非凡的成就⑲,但它们仍然是其生物对应物的简化表征⑪。所以④,能否通过结合生物大脑中的特征①,将人工智能的能力和效率提升到新的水平⑯?

他们决定重新思考认知核心的一个重要特征:时间⑦。

刚刚❸,Transformer 作者之一 Llion Jones 联合创立的的Sakana AI 发布了「连续思维机器」⑩,这是一种将神经元活动同步作为其核心推理机制的人工智能模型⑧,也可看作一种新型人工神经网络⑪,它利用神经元动态之间的同步来完成任务⑮。

博客地址:https://sakana.ai/ctm/

技术报告:https://pub.sakana.ai/ctm/paper/index.html

代码地址:https://github.com/SakanaAI/continuous-thought-machines/

与传统人工神经网络不同❶,CTM 在神经元层面使用定时信息⑲,从而实现了更复杂的神经行为和决策过程⑮。这一创新使该模型能够逐步「思考」问题①,使其推理过程具有可解释性和类人性⑨。

研究表明⑤,在各种任务中⑳,机器人解决问题的能力和效率都有所提高⑭。

Sakana AI 表示⑯,CTM 是弥合人工神经网络与生物神经网络之间差距的重要一步⑱,有可能开启人工智能能力的新领域⑥。

CTM 解迷宫和思考真实照片的可视化③。值得注意的是④,尽管 CTM 的设计并不明确⑰,但它在迷宫中学会的解法却非常容易解释⑳,而且类似于人类④,可以看到它在「思考」解法时描绘出通过迷宫的路径⑰。对于真实图像⑨,虽然没有明确的激励措施让它四处查看⑪,但它会以直观的方式查看⑯。

研究创新④、尽管随着 2012 年深度学习的出现⑤,人工智能的能力有了重大飞跃⑥,但自 20 世纪 80 年代以来❷,人工智能模型中使用的人工神经元基本模型在很大程度上一直没有改变❷。研究人员仍然主要使用神经元的单一输出⑳,这代表了神经元的激发情况⑳,却忽略了神经元相对于其他神经元激发的精确时间⑮。

不过▓,有力的证据表明⑩,这种定时信息在生物大脑中至关重要⑮,例如在依赖于尖峰定时的可塑性中⑧,它是生物大脑功能的基础❷。

在新模型中③,Sakana AI 用来表示这种信息的方法是让神经元访问自身的行为历史⑲,并学习如何利用这些信息来计算自身的下一个输出⑦,而不仅仅是知道自身的当前状态③。这样❷,神经元就能根据过去不同时期的信息改变自己的行为⑯。此外⑩,新模型的主要行为是基于这些神经元之间的同步③,这意味着它们必须学会利用这些时间信息来协调完成任务❷。研究者认为⑳,与当代模型中观察到的情况相比⑪,这将产生更丰富的动态空间和不同的任务解决行为⑬。

在添加了这种定时信息后⑱,Sakana AI 在许多任务中看到了一系列非同寻常的行为④。他们看到的行为具有很强的可解释性:在观察图像时⑩,CTM 会小心翼翼地在场景中移动其视线❸,选择关注最显着的特征⑦,而且它在某些任务中的表现有所提高⑪。这让研究者惊讶于神经元活动动态中的行为多样性⑲。

CTM 中的神经元动态样本⑫,显示神经元如何随不同的输入而变化❷。CTM 显然学会了多种神经元行为❸。每个神经元如何与其他神经元同步④。研究者对其进行测量❸,并将其作为 CTM 的表征⑧。

新模型的行为基于一种新的表征:神经元之间随时间的同步⑳。研究者认为这更容易让人联想到生物大脑③,但并非严格意义上的仿真⑰。他们将由此产生的人工智能模型称为「连续思考机器」①,它能够利用这种新的时间维度②、丰富的神经元动态和同步信息来「思考」任务⑫,并在给出答案前制定计划⑳。

命名中使用「连续」一词①,是因为 CTM 在推理时完全在内部「思考维度」运行⑲。它对所消耗的数据是异步的:它可以以相同的方式对静态数据或顺序数据进行推理⑩。研究者在大量任务中测试了这一新模型❶,发现它能够解决各种问题⑯,而且通常是以一种非常可解释的方式①。

研究者观察到的神经元动态在某种程度上更像是在真实大脑中测量到的动态⑱,而不是更传统的人工神经网络❶,后者表现出的行为多样性要少得多②。CTM 显示了以不同频率和振幅振荡的神经元⑲。有时⑨,单个神经元会出现不同频率的振荡④,而其他神经元只有在完成任务时才会出现活动⑳。值得强调的是①,所有这些行为都是完全突发的④,并没有设计到模型中⑯,而是作为添加定时信息和学习解决不同任务的副作用出现的❸。

CTM 完整架构如下图所示⑩,其中①为突触模型③,建模跨神经元交互以产生预激活⑱。对于每个神经元⑪,②都会保留预激活的历史记录⑳,其中最新的历史记录被 ③神经元级模型用于产生④后激活④。此外还会保留 ⑤ 后激活的历史记录⑦,并用于 ⑥ 计算同步矩阵④。从同步矩阵中选择⑦神经元对②,从而产生⑧潜在表征③。CTM 用这些表征⑨产生输出并通过交叉注意力机制调制数据①。调制后的数据将与后激活连接起来⑩❷,用于下一个内部时钟周期⑧。

CTM 架构的测试效果③、由于新增了时间维度⑩,CTM 的一大优势在于:可以观察并直观地看到它如何随着时间的推移解决问题❸。传统的 AI 系统可能只需通过神经网络一次性对图像进行分类⑪,而 CTM 可以分多个步骤来「思考」如何解决任务⑰。

下面展示了两个任务:解迷宫和照片中的物体分类⑫。

首先来看解迷宫任务⑱。在这个任务中⑤,CTM 会被呈现一个自上而下的 2D 迷宫⑳,并被要求输出走出迷宫所需的步骤⑧。这种模式尤其具有挑战性❸,因为模型必须理解迷宫构造并规划解决方案④,而不是简单地输出路径的视觉表示⑰。

CTM 内部连续的「思考步骤」使其能够制定计划⑥,从而可以直观地看到它在每个思考步骤中关注迷宫的哪些部分①。值得注意的是②,CTM 学会了一种非常类似于人类的解迷宫方法 —— 在它的注意力模式中沿着迷宫路径前进❸。

CTM 的行为模式尤其令人印象深刻⑤,因为它自然而然地从模型架构中涌现出来▓。研究者并没有特意设计 CTM 来追踪迷宫中的路径⑯,它通过学习自行开发展了这种方法⑥。他们还发现⑭,当允许 CTM 进行更多思考步骤时❶,它会持续沿着训练好的路径前进⑬,这表明它确实学会了解决这个问题的通用方法❸。

接下来是图像识别任务⑤。传统的图像识别系统只需一步即可做出分类决策⑳,而 CTM 则需要多个步骤来检查图像的不同部分⑥,然后再做出决策❷。这种循序渐进的方法不仅使人工智能的行为更易于解释①,也提高了准确率:它「思考」的时间越长❸,答案就越准确⑰。

研究者还发现⑫,这种方法使得 CTM 能够减少在简单图像上思考的时间⑪,从而节省算力❶。例如⑭,在识别大猩猩时③,CTM 的注意力会从眼睛转移到鼻子⑱,再转移到嘴巴❸,这与人类的视觉注意力模式非常相似⑨。

这些注意力模式为我们了解模型的推理过程提供了一个窗口③,展示了它认为哪些特征与分类目标最相关⑧。这种可解释性不仅有助于理解模型的决策❸,还可能有助于识别和解决偏差或故障模式▓。

结论⑤、尽管现代人工智能以「人工神经网络」的形式建构在大脑之上⑧,但即使在今天④,人工智能研究与神经科学之间的重叠仍然少得惊人❷。AI 研究人员选择沿用上世纪 80 年代开发的极简模型⑥,并且得益于简单易用⑨、训练高效等属性⑨,这些模型在推动人工智能发展方面持续取得成功⑫。

另一方面③,神经科学可以创建更精确的大脑模型⑥,但其主要目的是理解大脑⑬,而非试图创建更高级的智力模型④。当然❶,两者之间可能存在某种关联❷。这些神经科学模型尽管更加复杂⑮,但性能往往仍低于当前最先进的 AI 模型▓,因此④,这类模型可能在人工智能应用领域缺乏进一步研究的吸引力⑰。

尽管如此❷,研究者认为④,如果现代人工智能在某些方面不能继续向大脑的工作方式靠拢⑲,我们将错失良机⑳。我们或许能够通过这种方式创建更强大⑨、更高效的模型⑤。2012 年⑱,得益于受大脑启发的神经网络模型⑮,AI 能力出现跃升⑦,「深度学习革命」才出现⑰。

为了继续推动这一进步⑧,是否应该继续受到大脑的启发呢⑩?CTM 是研究者首次尝试弥合这两个领域之间的差距⑯,它展现出一些更像大脑行为的初步迹象⑨,同时仍然是一个可以解决重要问题的实用人工智能模型⑦。

研究者希望能够继续推动模型朝着这个受自然启发的方向发展❶,并探索可能出现的新功能⑤。关于 CTM 在不同任务中的行为⑰,请参阅原始技术报告⑥。

很赞哦▓!

随机图文