您现在的位置是:网站首页>房产房产
HY电玩城
汪白晴 2025-05-14 【房产】 7368 人已围观
机器之心报道⑦、开启「分步思考」新范式⑳。
科学界的一个共识是:即使是最复杂的现代人工智能⑳,也难以媲美人类大脑的表现和效率⑲。
研究者经常从大自然中寻找灵感⑰,了解如何在人工智能领域取得进步①,例如利用进化来合并模型⑨、为语言模型进化出更高效的记忆或探索人工生命的空间⑪。虽然人工神经网络近年来让人工智能取得了非凡的成就⑲,但它们仍然是其生物对应物的简化表征⑳。所以①,能否通过结合生物大脑中的特征⑧,将人工智能的能力和效率提升到新的水平⑰?
他们决定重新思考认知核心的一个重要特征:时间⑮。
刚刚▓,Transformer 作者之一 Llion Jones 联合创立的的Sakana AI 发布了「连续思维机器」⑩,这是一种将神经元活动同步作为其核心推理机制的人工智能模型⑨,也可看作一种新型人工神经网络⑨,它利用神经元动态之间的同步来完成任务⑦。
博客地址:https://sakana.ai/ctm/
技术报告:https://pub.sakana.ai/ctm/paper/index.html
代码地址:https://github.com/SakanaAI/continuous-thought-machines/
与传统人工神经网络不同②,CTM 在神经元层面使用定时信息⑳,从而实现了更复杂的神经行为和决策过程⑥。这一创新使该模型能够逐步「思考」问题②,使其推理过程具有可解释性和类人性⑧。
研究表明②,在各种任务中⑮,机器人解决问题的能力和效率都有所提高③。
Sakana AI 表示⑨,CTM 是弥合人工神经网络与生物神经网络之间差距的重要一步⑯,有可能开启人工智能能力的新领域①。
CTM 解迷宫和思考真实照片的可视化⑭。值得注意的是⑫,尽管 CTM 的设计并不明确⑰,但它在迷宫中学会的解法却非常容易解释⑤,而且类似于人类⑤,可以看到它在「思考」解法时描绘出通过迷宫的路径⑦。对于真实图像⑥,虽然没有明确的激励措施让它四处查看❷,但它会以直观的方式查看⑫。
研究创新⑬、尽管随着 2012 年深度学习的出现⑩,人工智能的能力有了重大飞跃⑩,但自 20 世纪 80 年代以来④,人工智能模型中使用的人工神经元基本模型在很大程度上一直没有改变❶。研究人员仍然主要使用神经元的单一输出⑱,这代表了神经元的激发情况⑮,却忽略了神经元相对于其他神经元激发的精确时间④。
不过❸,有力的证据表明▓,这种定时信息在生物大脑中至关重要⑪,例如在依赖于尖峰定时的可塑性中⑮,它是生物大脑功能的基础❶。
在新模型中⑬,Sakana AI 用来表示这种信息的方法是让神经元访问自身的行为历史③,并学习如何利用这些信息来计算自身的下一个输出❶,而不仅仅是知道自身的当前状态⑨。这样❶,神经元就能根据过去不同时期的信息改变自己的行为④。此外⑬,新模型的主要行为是基于这些神经元之间的同步▓,这意味着它们必须学会利用这些时间信息来协调完成任务▓。研究者认为⑨,与当代模型中观察到的情况相比②,这将产生更丰富的动态空间和不同的任务解决行为⑫。
在添加了这种定时信息后⑱,Sakana AI 在许多任务中看到了一系列非同寻常的行为⑳。他们看到的行为具有很强的可解释性:在观察图像时▓,CTM 会小心翼翼地在场景中移动其视线⑤,选择关注最显着的特征⑲,而且它在某些任务中的表现有所提高①。这让研究者惊讶于神经元活动动态中的行为多样性⑧。
CTM 中的神经元动态样本⑲,显示神经元如何随不同的输入而变化⑫。CTM 显然学会了多种神经元行为⑫。每个神经元如何与其他神经元同步④。研究者对其进行测量⑬,并将其作为 CTM 的表征⑨。
新模型的行为基于一种新的表征:神经元之间随时间的同步⑩。研究者认为这更容易让人联想到生物大脑❸,但并非严格意义上的仿真❶。他们将由此产生的人工智能模型称为「连续思考机器」❸,它能够利用这种新的时间维度③、丰富的神经元动态和同步信息来「思考」任务⑬,并在给出答案前制定计划❸。
命名中使用「连续」一词❷,是因为 CTM 在推理时完全在内部「思考维度」运行⑬。它对所消耗的数据是异步的:它可以以相同的方式对静态数据或顺序数据进行推理❸。研究者在大量任务中测试了这一新模型⑤,发现它能够解决各种问题⑪,而且通常是以一种非常可解释的方式❸。
研究者观察到的神经元动态在某种程度上更像是在真实大脑中测量到的动态⑧,而不是更传统的人工神经网络②,后者表现出的行为多样性要少得多❸。CTM 显示了以不同频率和振幅振荡的神经元⑫。有时⑳,单个神经元会出现不同频率的振荡❶,而其他神经元只有在完成任务时才会出现活动⑤。值得强调的是⑰,所有这些行为都是完全突发的⑩,并没有设计到模型中❶,而是作为添加定时信息和学习解决不同任务的副作用出现的⑳。
CTM 完整架构如下图所示⑰,其中①为突触模型⑪,建模跨神经元交互以产生预激活❶。对于每个神经元▓,②都会保留预激活的历史记录⑲,其中最新的历史记录被 ③神经元级模型用于产生④后激活⑨。此外还会保留 ⑤ 后激活的历史记录⑮,并用于 ⑥ 计算同步矩阵⑦。从同步矩阵中选择⑦神经元对⑫,从而产生⑧潜在表征⑨。CTM 用这些表征⑨产生输出并通过交叉注意力机制调制数据③。调制后的数据将与后激活连接起来⑩④,用于下一个内部时钟周期⑮。
CTM 架构的测试效果⑯、由于新增了时间维度⑱,CTM 的一大优势在于:可以观察并直观地看到它如何随着时间的推移解决问题⑦。传统的 AI 系统可能只需通过神经网络一次性对图像进行分类⑦,而 CTM 可以分多个步骤来「思考」如何解决任务⑨。
下面展示了两个任务:解迷宫和照片中的物体分类③。
首先来看解迷宫任务②。在这个任务中▓,CTM 会被呈现一个自上而下的 2D 迷宫⑬,并被要求输出走出迷宫所需的步骤⑧。这种模式尤其具有挑战性❸,因为模型必须理解迷宫构造并规划解决方案⑭,而不是简单地输出路径的视觉表示⑩。
CTM 内部连续的「思考步骤」使其能够制定计划④,从而可以直观地看到它在每个思考步骤中关注迷宫的哪些部分⑬。值得注意的是❸,CTM 学会了一种非常类似于人类的解迷宫方法 —— 在它的注意力模式中沿着迷宫路径前进①。
CTM 的行为模式尤其令人印象深刻⑯,因为它自然而然地从模型架构中涌现出来⑤。研究者并没有特意设计 CTM 来追踪迷宫中的路径②,它通过学习自行开发展了这种方法❷。他们还发现②,当允许 CTM 进行更多思考步骤时▓,它会持续沿着训练好的路径前进⑳,这表明它确实学会了解决这个问题的通用方法②。
接下来是图像识别任务①。传统的图像识别系统只需一步即可做出分类决策⑰,而 CTM 则需要多个步骤来检查图像的不同部分④,然后再做出决策▓。这种循序渐进的方法不仅使人工智能的行为更易于解释⑥,也提高了准确率:它「思考」的时间越长③,答案就越准确⑫。
研究者还发现⑨,这种方法使得 CTM 能够减少在简单图像上思考的时间⑱,从而节省算力❸。例如⑨,在识别大猩猩时⑥,CTM 的注意力会从眼睛转移到鼻子①,再转移到嘴巴⑭,这与人类的视觉注意力模式非常相似⑲。
这些注意力模式为我们了解模型的推理过程提供了一个窗口⑲,展示了它认为哪些特征与分类目标最相关⑦。这种可解释性不仅有助于理解模型的决策④,还可能有助于识别和解决偏差或故障模式①。
结论⑥、尽管现代人工智能以「人工神经网络」的形式建构在大脑之上❸,但即使在今天⑳,人工智能研究与神经科学之间的重叠仍然少得惊人⑰。AI 研究人员选择沿用上世纪 80 年代开发的极简模型❷,并且得益于简单易用❶、训练高效等属性❶,这些模型在推动人工智能发展方面持续取得成功③。
另一方面⑳,神经科学可以创建更精确的大脑模型⑯,但其主要目的是理解大脑⑤,而非试图创建更高级的智力模型⑦。当然❷,两者之间可能存在某种关联⑭。这些神经科学模型尽管更加复杂❶,但性能往往仍低于当前最先进的 AI 模型❷,因此⑮,这类模型可能在人工智能应用领域缺乏进一步研究的吸引力⑦。
尽管如此⑰,研究者认为③,如果现代人工智能在某些方面不能继续向大脑的工作方式靠拢⑭,我们将错失良机①。我们或许能够通过这种方式创建更强大①、更高效的模型⑯。2012 年⑱,得益于受大脑启发的神经网络模型⑬,AI 能力出现跃升⑰,「深度学习革命」才出现⑱。
为了继续推动这一进步❶,是否应该继续受到大脑的启发呢③?CTM 是研究者首次尝试弥合这两个领域之间的差距⑧,它展现出一些更像大脑行为的初步迹象❷,同时仍然是一个可以解决重要问题的实用人工智能模型①。
研究者希望能够继续推动模型朝着这个受自然启发的方向发展▓,并探索可能出现的新功能⑮。关于 CTM 在不同任务中的行为②,请参阅原始技术报告⑤。
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可⑨,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐①,非常欢迎各位朋友分享到个人站长或者朋友圈⑯,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑧。
很赞哦⑧!
相关文章
随机图文
-
美国高中生利用AI发现150万颗隐藏星体⑰,登上天文学顶级期刊
我于2024年12月29号在理想汽车合肥包河交付中心购买一台理想24款L6max汽车❷,当时理想销售在店内承诺送一套车窗龙膜⑨,至今仍没兑现⑳,电话微信不接⑲,投诉要求是立马兑现承诺一套车窗龙膜④。销售电话18 -
中型车性价比之王❶!比亚迪e7将于5月17日上市
[中方是否对中美会谈结果满意⑬?外交部回应]外交部发言人林剑主持5月12日例行记者会④。会上有记者提问称:美国总统特朗普称中美经贸会谈取得了很好的成果⑫,请问中方对会谈结果满意吗⑤? 前景广阔❷,国内半导体IP市场有望继续保持快速增长
特别声明:以上文章内容仅代表作者本人观点⑧,不代表新浪网观点或立场⑥。如有关于作品内容①、版权或其它问题请于作品发表后的30日内与新浪网联系⑨。已无理论可能⑨!吉达联合已领先胜利14分⑬,C罗确定本赛季四大皆空
在研究过程中⑬,他为我提供了充分的自主探索空间⑩,而正是这种自由⑫,使我在科研道路上得以迅速成长③。联想被曝将推“来酷斗战者”游戏本:定位低于拯救者 7000 系列
活动期间⑱,平台将通过短视频⑤、直播⑭、商城④、搜索等多个购物场景呈现海量优质商品⑲,涵盖数码家电⑳、家具家装❸、美妆个护⑰、运动户外⑥、生鲜酒水等品类⑤。超值天团直播间⑮、大牌巨惠⑭、超值购万人团⑦、多人团和大牌奥莱等玩法将政企校协同赋能 打造数字经济人才新高地
泳装是显示中国主导海滩度假产品供应链的良好例证⑲。中国福建省官方数据显示❷,该省沿海城市晋江生产的泳装几乎占到全球泳装产量的1/3①。过去十年⑦,这座城市已经成为泳装行业的“一站式商店”⑫,建立完整的面料供应❶、朱洁静在遭遇病魔侵袭沉寂八个月后❷,重归舞台▓,再跳《朱鹮》
对于MATH数据集⑤,当以40%的推理步骤退出时达到最高的纠错率⑨;而对于GPQA数据集⑭,当以50%的推理步骤退出时达到最佳纠错率③。Linux PC 厂商 Slimbook 推出高性能台式整机 Kymera Black windows slimbook
资金分析⑪、今日主力净流入15.49万①,占比0%⑳,行业排名18/51⑰,该股当前无连续增减仓现象⑭,主力趋势不明显⑰;所属行业主力净流入-5067.70万▓,连续3日被主力资金减仓⑥。