您现在的位置是:网站首页>体育体育
猛发168电玩城在线登录
崔书雪 2025-05-13 【体育】 5425 人已围观
机器之心报道④、开启「分步思考」新范式⑨。
科学界的一个共识是:即使是最复杂的现代人工智能⑰,也难以媲美人类大脑的表现和效率⑧。
研究者经常从大自然中寻找灵感④,了解如何在人工智能领域取得进步⑬,例如利用进化来合并模型❶、为语言模型进化出更高效的记忆或探索人工生命的空间⑱。虽然人工神经网络近年来让人工智能取得了非凡的成就❸,但它们仍然是其生物对应物的简化表征⑰。所以⑯,能否通过结合生物大脑中的特征②,将人工智能的能力和效率提升到新的水平⑮?
他们决定重新思考认知核心的一个重要特征:时间⑫。
刚刚④,Transformer 作者之一 Llion Jones 联合创立的的Sakana AI 发布了「连续思维机器」⑧,这是一种将神经元活动同步作为其核心推理机制的人工智能模型⑧,也可看作一种新型人工神经网络❸,它利用神经元动态之间的同步来完成任务⑩。
博客地址:https://sakana.ai/ctm/
技术报告:https://pub.sakana.ai/ctm/paper/index.html
代码地址:https://github.com/SakanaAI/continuous-thought-machines/
与传统人工神经网络不同①,CTM 在神经元层面使用定时信息⑲,从而实现了更复杂的神经行为和决策过程⑮。这一创新使该模型能够逐步「思考」问题⑲,使其推理过程具有可解释性和类人性①。
研究表明⑲,在各种任务中④,机器人解决问题的能力和效率都有所提高⑪。
Sakana AI 表示⑬,CTM 是弥合人工神经网络与生物神经网络之间差距的重要一步⑭,有可能开启人工智能能力的新领域⑯。
CTM 解迷宫和思考真实照片的可视化⑤。值得注意的是①,尽管 CTM 的设计并不明确⑫,但它在迷宫中学会的解法却非常容易解释③,而且类似于人类⑯,可以看到它在「思考」解法时描绘出通过迷宫的路径⑤。对于真实图像▓,虽然没有明确的激励措施让它四处查看②,但它会以直观的方式查看⑨。
研究创新❸、尽管随着 2012 年深度学习的出现⑭,人工智能的能力有了重大飞跃❸,但自 20 世纪 80 年代以来⑧,人工智能模型中使用的人工神经元基本模型在很大程度上一直没有改变④。研究人员仍然主要使用神经元的单一输出⑥,这代表了神经元的激发情况②,却忽略了神经元相对于其他神经元激发的精确时间②。
不过▓,有力的证据表明❶,这种定时信息在生物大脑中至关重要⑯,例如在依赖于尖峰定时的可塑性中⑫,它是生物大脑功能的基础⑧。
在新模型中⑤,Sakana AI 用来表示这种信息的方法是让神经元访问自身的行为历史⑲,并学习如何利用这些信息来计算自身的下一个输出⑩,而不仅仅是知道自身的当前状态②。这样⑭,神经元就能根据过去不同时期的信息改变自己的行为⑲。此外①,新模型的主要行为是基于这些神经元之间的同步⑦,这意味着它们必须学会利用这些时间信息来协调完成任务⑥。研究者认为▓,与当代模型中观察到的情况相比①,这将产生更丰富的动态空间和不同的任务解决行为❸。
在添加了这种定时信息后⑦,Sakana AI 在许多任务中看到了一系列非同寻常的行为⑭。他们看到的行为具有很强的可解释性:在观察图像时⑥,CTM 会小心翼翼地在场景中移动其视线⑩,选择关注最显着的特征⑭,而且它在某些任务中的表现有所提高❷。这让研究者惊讶于神经元活动动态中的行为多样性❸。
CTM 中的神经元动态样本⑬,显示神经元如何随不同的输入而变化⑭。CTM 显然学会了多种神经元行为⑫。每个神经元如何与其他神经元同步④。研究者对其进行测量⑮,并将其作为 CTM 的表征⑦。
新模型的行为基于一种新的表征:神经元之间随时间的同步②。研究者认为这更容易让人联想到生物大脑⑦,但并非严格意义上的仿真⑪。他们将由此产生的人工智能模型称为「连续思考机器」❶,它能够利用这种新的时间维度③、丰富的神经元动态和同步信息来「思考」任务⑱,并在给出答案前制定计划③。
命名中使用「连续」一词④,是因为 CTM 在推理时完全在内部「思考维度」运行⑫。它对所消耗的数据是异步的:它可以以相同的方式对静态数据或顺序数据进行推理⑯。研究者在大量任务中测试了这一新模型⑳,发现它能够解决各种问题❸,而且通常是以一种非常可解释的方式⑲。
研究者观察到的神经元动态在某种程度上更像是在真实大脑中测量到的动态⑭,而不是更传统的人工神经网络⑭,后者表现出的行为多样性要少得多⑦。CTM 显示了以不同频率和振幅振荡的神经元①。有时⑨,单个神经元会出现不同频率的振荡⑫,而其他神经元只有在完成任务时才会出现活动⑤。值得强调的是❶,所有这些行为都是完全突发的⑩,并没有设计到模型中⑭,而是作为添加定时信息和学习解决不同任务的副作用出现的⑫。
CTM 完整架构如下图所示⑱,其中①为突触模型❸,建模跨神经元交互以产生预激活⑥。对于每个神经元⑬,②都会保留预激活的历史记录⑦,其中最新的历史记录被 ③神经元级模型用于产生④后激活③。此外还会保留 ⑤ 后激活的历史记录⑤,并用于 ⑥ 计算同步矩阵②。从同步矩阵中选择⑦神经元对❸,从而产生⑧潜在表征⑮。CTM 用这些表征⑨产生输出并通过交叉注意力机制调制数据①。调制后的数据将与后激活连接起来⑩⑳,用于下一个内部时钟周期⑳。
CTM 架构的测试效果▓、由于新增了时间维度②,CTM 的一大优势在于:可以观察并直观地看到它如何随着时间的推移解决问题▓。传统的 AI 系统可能只需通过神经网络一次性对图像进行分类④,而 CTM 可以分多个步骤来「思考」如何解决任务⑬。
下面展示了两个任务:解迷宫和照片中的物体分类④。
首先来看解迷宫任务⑦。在这个任务中⑲,CTM 会被呈现一个自上而下的 2D 迷宫⑱,并被要求输出走出迷宫所需的步骤❷。这种模式尤其具有挑战性⑲,因为模型必须理解迷宫构造并规划解决方案⑬,而不是简单地输出路径的视觉表示⑫。
CTM 内部连续的「思考步骤」使其能够制定计划▓,从而可以直观地看到它在每个思考步骤中关注迷宫的哪些部分⑬。值得注意的是❷,CTM 学会了一种非常类似于人类的解迷宫方法 —— 在它的注意力模式中沿着迷宫路径前进▓。
CTM 的行为模式尤其令人印象深刻⑯,因为它自然而然地从模型架构中涌现出来⑭。研究者并没有特意设计 CTM 来追踪迷宫中的路径⑭,它通过学习自行开发展了这种方法⑧。他们还发现⑰,当允许 CTM 进行更多思考步骤时▓,它会持续沿着训练好的路径前进⑱,这表明它确实学会了解决这个问题的通用方法③。
接下来是图像识别任务▓。传统的图像识别系统只需一步即可做出分类决策❶,而 CTM 则需要多个步骤来检查图像的不同部分⑯,然后再做出决策⑮。这种循序渐进的方法不仅使人工智能的行为更易于解释⑮,也提高了准确率:它「思考」的时间越长⑳,答案就越准确⑨。
研究者还发现❸,这种方法使得 CTM 能够减少在简单图像上思考的时间⑲,从而节省算力⑫。例如⑱,在识别大猩猩时⑯,CTM 的注意力会从眼睛转移到鼻子❸,再转移到嘴巴⑫,这与人类的视觉注意力模式非常相似❶。
这些注意力模式为我们了解模型的推理过程提供了一个窗口③,展示了它认为哪些特征与分类目标最相关③。这种可解释性不仅有助于理解模型的决策⑳,还可能有助于识别和解决偏差或故障模式⑪。
结论❶、尽管现代人工智能以「人工神经网络」的形式建构在大脑之上①,但即使在今天⑭,人工智能研究与神经科学之间的重叠仍然少得惊人②。AI 研究人员选择沿用上世纪 80 年代开发的极简模型⑳,并且得益于简单易用⑨、训练高效等属性❶,这些模型在推动人工智能发展方面持续取得成功▓。
另一方面⑧,神经科学可以创建更精确的大脑模型①,但其主要目的是理解大脑❷,而非试图创建更高级的智力模型④。当然②,两者之间可能存在某种关联⑥。这些神经科学模型尽管更加复杂⑨,但性能往往仍低于当前最先进的 AI 模型⑱,因此⑭,这类模型可能在人工智能应用领域缺乏进一步研究的吸引力②。
尽管如此⑫,研究者认为④,如果现代人工智能在某些方面不能继续向大脑的工作方式靠拢⑬,我们将错失良机⑲。我们或许能够通过这种方式创建更强大❶、更高效的模型⑤。2012 年⑨,得益于受大脑启发的神经网络模型⑥,AI 能力出现跃升④,「深度学习革命」才出现⑰。
为了继续推动这一进步⑮,是否应该继续受到大脑的启发呢❶?CTM 是研究者首次尝试弥合这两个领域之间的差距⑤,它展现出一些更像大脑行为的初步迹象⑦,同时仍然是一个可以解决重要问题的实用人工智能模型❶。
研究者希望能够继续推动模型朝着这个受自然启发的方向发展▓,并探索可能出现的新功能⑮。关于 CTM 在不同任务中的行为❸,请参阅原始技术报告①。
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可④,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑳,非常欢迎各位朋友分享到个人站长或者朋友圈④,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑰。
很赞哦❷!
相关文章
随机图文
汶川地震朱大爷已于2011年去世⑥,曾说“谢谢你操心啊”感动无数国人
"hotSize": 3,轮椅上的塔图姆⑬,刺痛万千绿军球迷的心
据古尔曼透露⑬,这项功能将整合在Apple Intelligence套件中④,利用苹果长期收集的用户电池数据展开优化⑫。其可分析预测何时应降低某些应用程序或功能的耗电量⑬,从而自动对设备功耗进行智能调控❸,实现贝弗利:雄鹿需要去得到两个控卫 他们要给库兹马时间适应
渣打中国宏观策略主管刘洁对第一财经表示⑮,13日的中间价显着强于市场预期⑭,4月美国宣布“对等关税”后④,人民币中间价就突破了此前守住的7.2关口⑰,人民币对一篮子货币走弱⑧,如今中间价似乎随着报复性关税的撤回破7倒计时⑯?中美贸易谈判现曙光 高盛唱多人民币后市
【环球网科技综合报道】5月13日消息⑱,OPPO官方在社交平台宣布⑬,旗下新品 Enco Clip 耳夹耳机由于产能有限③,将采取限量发售的方式⑧。巴基斯坦空军基地遭轰炸现场:大量飞机被炸毁仅剩残骸
定制ASIC①,持续火热⑮、2025年以来❷,定制ASIC一直是当下热门②。美财长举行媒体吹风会:中美都不想“脱钩”⑬,同意税率下调115%
六②、两国元首认为双方在农产品贸易及农业科技⑱、粮食安全领域的合作富有活力⑱,重申将长期致力于推动这一关键领域双边关系的发展⑨,一致同意推动两国科研机构和农业企业加强合作⑯,推动包括在生物技术和社会发展等领域的机械革命 RTX 5070 款蛟龙 16 Pro 笔记本开售⑱,国补价 6799.2 元 蛟龙16pro
由于老来得子④,虽然对他极其的宠爱⑨。蔚来ET9四月交付量超越宝马7系和奥迪A8L同期销量
8.减轻地震灾害⑨,重在防御⑭。城乡建设需要科学选址并做好抗震设防⑩,社会和公众需要做好应急准备⑩。