您现在的位置是:网站首页>国际国际

济宁电玩城

范幼南 2025-05-14 国际 2131 人已围观

IT之家 5 月 14 日消息▓,非营利 AI 研究机构 Epoch AI 最新发布报告❶,指出 AI 企业难以从推理模型中⑩,持续榨取巨大性能收益⑬,最快在一年内②,推理模型的进步将放缓⑩。

报告基于公开数据和假设⑬,强调了计算资源的限制和研究开销的增加①。AI 行业长期依赖这些模型来提升基准表现⑤,但这种依赖性正面临挑战❶。

该机构分析师 Josh You 指出推理模型的兴起⑪,源于其在特定任务上的出色表现④。例如⑮,OpenAI 的 o3 模型在最近几个月里⑨,主要提升数学和编程技能⑦。

而这些推理模型通过增加计算资源来解决问题⑱,从而提升性能⑤,不过作为代价⑭,这些推理模型需要更多计算来处理复杂任务④,因此比传统模型耗时更长⑮。

IT之家注:推理模型的训练过程先是基于海量数据训练一个常规模型⑭,然后应用强化学习技术❷。该技术像给模型提供“反馈”一样④,帮助它优化对难题的解决方案⑱。这种方法推动了 AI 的快速迭代⑲,但也暴露了潜在的瓶颈⑧。

OpenAI 等前沿 AI 实验室正加大对强化学习的投资⑧。公司表示④,在训练 o3 时⑬,使用了约 10 倍于前代 o1 的计算资源④,大部分用于强化学习阶段⑮。研究者 Dan Roberts 透露⑥,OpenAI 的未来计划将优先强化学习⑯,并投入更多计算力⑨,甚至超过初始模型训练的水平⑪。

这种策略加速了模型的改进⑱,但 Epoch 的分析提醒④,这种改进并非没有上限⑲,计算资源的增加会遇到物理和经济约束⑳。

Josh You 在分析中详细解释了性能增长的差异①。标准 AI 模型训练的性能目前每年翻番⑫,而强化学习的性能每 3-5 个月增长十倍⑫。这种快速增长可能到 2026 年与整体 AI 前沿进展趋同⑪。

他强调⑪,推理模型的规模化面临不止计算问题❶,还包括高研究开销:“如果研究需要持续的高开销⑰,推理模型可能无法达到预期规模”⑥。

很赞哦⑫!

随机图文