您现在的位置是:网站首页>国际国际
UU电玩城官方网站
覃晓绿 2025-05-13 【国际】 8396 人已围观
机器之心报道⑨、递归思考 + 自我批判▓,CoRT 能带来 LLM 推理力的飞跃吗❶?
CoT大家都很熟悉了⑬,通过模仿「人类解题思路」①,进而大幅提升语言模型的推理能力❷。
这几天⑰,一个名为 CoRT的概念火了⑰!从名称上来看⑰,它在 CoT 中加入了「递归思考」这一步骤⑪。
具体来讲⑱,CoRT 能让 AI 模型递归地思考它们的响应②,生成替代性方案②,并从中选择最佳的一个④。
这就像赋予了 AI 自我质疑或反驳的能力④,并一遍一遍地尝试⑳。
通过将「结构化自我批判」和「递归思考模式」结合起来⑫,提升语言模型的推理能力⑰。
短短两周时间②,CoRT 在 GitHub 的星标数已经快突破 2k 了❸。
GitHub 地址:https://github.com/PhialsBasement/Chain-of-Recursive-Thoughts
从技术原理来讲⑲,相较于传统的 CoT④,CoRT 让语言模型不仅能分步骤思考④,还能在思考过程中反复回头检查⑱、修正⑬,形成类似于人类的「反思性思维」或「内省」的推理路径⑦。
然而⑭,很多网友对 CoRT 的出现并没有感到太激动⑰。CoRT 是让 LLM 更努力思考的不错技巧⑨,但称不上什么新颖的 idea⑫。它的工作原理就像一个加入了递归组件的元提示❷。
还有网友指出❸,这种方法在 2023 年的论文中《Improving Factuality and Reasoning in Language Models through Multiagent Debate》就出现了⑭。
有网友发出疑问:CoRT 不就是现在大多数 LLM 的思考模式吗❷?
比如在 Cursor 中配置的 Gemini 2.5 Pro▓,它的 CoT 就是这样做的⑦。模型会思考一分钟③,并反驳自己的答案⑫,直到找到最无力反驳的答案⑩。
再比如⑤,CoRT 不就是 Qwen 和 R1 中的「but wait」模式吗⑩?模型一直思考⑲,并自我反驳①,两者似乎没有什么不同⑰。
大家觉得⑥,CoRT 是不是「新瓶装旧酒」呢⑧?请在评论区留言⑫。
项目介绍⑭、根据项目介绍⑤,CoRT 的诀窍在于以下四个方面:
自我评估⑰;
有竞争力的替代生成方案⑰;
迭代优化▓;
动态思维深度⑨。
工作流程包括了以下四个步骤:
首先⑨,AI 生成初始响应▓。
其次⑮,AI 决定它需要多少轮「思考」⑨。
接着⑩,对于每一轮思考:⑱、生成 3 个替代性响应⑱;
评估所有响应⑩;
选择最佳响应❸。
最后⑮,最终响应就是这场 AI 大混战的幸存者③。
Web 界面使用方式⑱、一②,打开 start_recthink.bat
二③,等待一会③,让它安装依赖项
三⑳,配置成功❶、如果你是运行在 linux 系统上⑲,则依如下:
打开一个新的壳层:
效果怎么样呢①?
作者使用 Mistral 3.1 24B 进行了测试⑰,根据他的说法⑧,CoRT 在编程任务中的表现从「meh」升到了「holy crap」①。
我们来看一下示例▓,下图为 Mistral 3.1 24B+CoRT:
下图为 Mistral 3.1 24B 无 CoRT:
从结果来看①,使用 CoRT 前后⑰,Tic-tac-toe游戏从基础的 CLI变成了完全的 OOP⑳。
参考链接:https://x.com/omarsar0/status/61818478
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可⑦,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑭,非常欢迎各位朋友分享到个人站长或者朋友圈⑭,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”▓。
很赞哦③!
相关文章
随机图文
天空:皇马尚未向利物浦发出提前签约阿诺德的报价
如果不是心理和身体上获得完全的放松❸,这种得分方式⑥,即使对男球员来说都是很难做到的⑱!今年4月我国动力电池销量为86.6GWh⑮,同比增长72.8%
1916年约翰・洛克菲勒成为世界上第一个亿万富翁⑫,他的财富在巅峰时达到过14亿美元②,是历史上最富有的人之一❶。今年才31岁⑭!Shams:我仍在持续进步 还远没有达到自己的巅峰
投资者关系活动重要信息⑱、项目❶、详情▓、投资者活动关系类别③、业绩说明会⑯、时间④、2025年5月13日15:00 - 17:00亏损260亿后⑦,吉利踩下“急刹车”
每一集都像是高圆圆的时装大秀⑱,实在太养眼了⑰。杀疯了⑲!冲着宋祖儿看《折腰》②,没想到却被75岁女配角刘晓庆惊艳
北京时间5月12日①,中超官方发布了联赛第12轮球员跑动距离榜前5⑩,成都蓉城队长周定洋以13498米居首⑲,连续5轮登顶⑬,深圳新鹏城球员张昱杰⑤、卡尔采夫位列二三位④。新思想引领新征程丨我国持续完善风险防控体系 加强防灾减灾救灾能力建设
此次爆料与近期韩媒报道的消息相吻合⑱,不过 Galaxy Z Flip7 仍有望搭载特供版骁龙 8 至尊版处理器⑨,三星此前常在旗舰上使用双处理器策略⑧。为生命“破例” 列车临时停靠2分钟
站在学校立场⑩,吴德认为⑬,撤销专业的决策基于三大考量因素:首先③,高质量就业是一个非常重要的参考指标⑥;其次⑫,师资力量的供给情况也是核心要素❶;最后是招生状况⑭,如果一个专业招生时⑦,第一志愿的录取率持续偏低⑪,也舒梅切尔:阿尔特塔对球员就是控制狂⑰,斯洛特执教就显得非常冷静
不过②,其中不少企业瞄准的场景为餐厅⑦,比如普渡科技推出的智能送餐机器人“欢乐送”⑪,主要服务于海底捞⑪、巴奴⑳、呷哺呷哺⑱、西贝等餐饮企业⑤;而国内最早一批进入室内服务机器人行业的公司擎朗智能⑩,也是围绕餐饮行业❸,