您现在的位置是:网站首页>房产房产

电玩城怎么规避退分

姚白晴 2025-05-14 房产 7258 人已围观

大模型进化路线持续分野▓,阶跃星辰追求AGI的决心反而更加坚定⑱。

成立于2023年4月的阶跃星辰刚刚过完两岁生日▓,模型发布频率和产业落地探索正在前所未有地加速⑬。

阶跃星辰累计发布了22款自研基座模型⑮,覆盖文字⑮、语音⑦、图像①、视频⑮、音乐⑫、推理等全系列②。其中❸,16款是多模态模型❷,占比七成⑬。目前仍然保持“月更”状态⑨。

阶跃星辰创始人⑩、CEO姜大昕说⑫,追求智能的上限仍然是当下最重要的一件事⑨。

姜大昕的目标是坚决探索通往AGI④,且多模态是实现AGI的必由路径⑯。他把模型演进路线图划分为三个阶段⑦,即模拟世界—探索世界—归纳世界⑫。

首先⑱,模拟世界的训练范式是模仿学习❶,核心是学习海量互联网数据⑥;其次⑬,探索世界是追求“系统二”的能力⑬,实现慢思考③;其三⑱,智能的尽头是归纳世界⑬,机器能够自主学习①、主动发现人类尚未发现的物理规律⑭。

姜大昕还特别强调从多模态融合走向多模态理解生成一体化❸,因为“在多模态领域任何一个方向出现短板▓,都会延缓实现 AGI 的进程⑪。”

在国内大模型公司里③,像这样重视模态全覆盖②,并且坚持原生多模理念的公司并不多❸。这被视为阶跃星辰的独特优势⑮。“我们需要 AI 能听⑬、能看⑪、能说⑰,这样它才能更好地理解用户所处的环境⑲,并且和用户进行更为自然的交流❸。目前的大模型公司有能力去全面自研预训练模型⑮,并构成模型矩阵的⑤,即使是大公司也不多③,更不用说是初创公司了▓,这是阶跃星辰的一个特色⑬,也是我们的优势④。”

多模态模型的两大趋势⑫、强调多模型理解生成的阶跃星辰⑪,是这么想也是这么做的⑧,不断探索模型能力的同时加速落地验证⑥。

第一是预训练加上强化学习⑰,激发模型推理的时候产生长思维链⑨,极大地提高模型的推理能力①。

姜大昕说⑨,推理模型已经从趋势变成了范式⑬。

阶跃星辰在今年1月份发布了一款推理模型 Step R-Mini⑱,“它的速度很快⑩,推理能力挺强⑮,超出了当时的 o1的 preview 的版本②,我们预计在未来的三个月内发布满血版的 Step-R1⑥。”

第二个趋势是多模态理解生成一体化⑬,也就是如何把推理引入到多模态领域⑤。

姜大昕举一个例子⑧,有一张足球比赛现场的图片⑨,一般视觉理解是训练时看到过类似的图⑪,然后给出结果⑪。而加了推理的视觉模型可以根据图片中的广告牌❶、球衣颜色等更多特征信息给出更准确的答案⑨。

这样的探索已经延伸到短剧领域⑱。“现在短剧最卡脖子①、最瓶颈的地方不是短剧生产⑱,而是短剧审核⑮。因为全部需要人工审核⑨,效率非常低⑪,用了阶跃星辰的模型后审核效率从原来的90天可以变成一个星期⑧。”

姜大昕还进一步解释了“多模理解生成一体化”路线的正确性:

为什么要做理解和生成❷?因为生成的内容需要理解来控制⑥,为了保证生成的内容有意义⑩,即生成需要理解来控制⑥。反过来⑮,理解需要生成来监督⑦。但他也表示③,从整个行业看②,这个路线还有卡点和挑战⑲。

“到现在为止计算机视觉做了几十年⑨,不幸的是这个问题仍然没有被解决⑫。”姜大昕表示❸,理解生成一体化是整个计算机视觉需要突破的一个堡垒⑦。

AGI的实现路径清晰了❸、何时能实现世界模型②,姜大昕眼中的 AGI 就实现了③,他近期感受最深的一点是⑦,路线越来越清晰了⑳。

他回顾技术发展路线说⑮,2017年transformer 架构对业界最大的意义在于它是一个 scalable 的文本的理解生成一体化的架构⑰。

在那之前⑳, LSTM或者RNN循环神经网络或者其他模型都不能 scalable⑭。正因为有了这个 scalable 的架构以后⑨,到了2020年 GPT-3来了⑥,GPT-3的意义在于我们第一次把海量的互联网数据放到了这个 scalable 的架构上⑯,可以让它用一个模型去处理所有 NLP 的任务⑩。但那个时候它需要一些例子❸,然后它用一个模型来告诉你要怎么做⑩。

再往前一步③,到了2022年 ChatGPT来了⑬,就是在预训练模型的基础上再加上指令跟随⑪,这是 GPT-3.5做的事情⑥,到了 GPT-4的时候这个能力进一步增强❶,所以我们经常谈到 "GPT-4时刻"⑨,指的就是在这个模态上⑳,模型真正能达到跟人的智能差不多的水平⑫。

到目前为止❷,语言模型的技术路线基本上收敛了❶,没有出现别的分支▓,不管是 OpenAI 也好⑨、Google 也好⑬、Anthropic 也好⑱,或者国内任何的公司⑯,语言模型都在朝着这条路往下走❸。

姜大昕相信▓,视觉也是可以 follow 同样的路线⑦。“如果我能够用海量的视频去做预训练⑤,它能 predict next frame 以后②,然后类似语言模型一样加各种指令⑬,让它去预测❷,再往后做推理⑲,如果能做到时空推理⑬、加上3D ⑱、再加上自然语言学习⑦,那就是世界模型了⑥。”

而世界模型②,就是姜大昕眼中AGI的模样⑪。而挑战正在于此①,这件事的原点就是彻底地解决理解生成一体化⑩。

姜大昕断言❸,这个问题一旦突破以后❶,今后的道路会非常顺畅❶,视频就会和文本一起发展到世界模型②。直到抵达AGI▓。

智能体将从数字走向物理⑦、2025年是Agent 元年②,姜大昕总结了两个之所以爆发的条件⑦,一个是多模态的能力❸,一个是慢思考的能力⑩,这两个能力恰好在2024年的时候取得了突破性进展❶。

阶跃星辰的发力方向是智能终端 Agent⑲,并在此投入重兵⑦。

姜大昕认为⑨,终端是用户感知和体验的延伸⑳,而且它能帮你完成任务②。这是阶跃星辰选择这个赛道的原因❷。

目前倾注精力的有四个方向⑳,一个是与OPPO等厂商合作的AI手机赛道③。一个是和吉利汽车⑮、千里科技合作的智能汽车赛道⑦。一个是和TCL等厂商合作的IoT设备领域⑧。一个是具身智能领域①。

阶跃星辰正在具身智能领域投注精力⑬,与智元机器人和原力灵机机器人合作①,其中阶跃的多模态大模型是机器人的大脑①,以感知⑱、理解这个世界⑮。未来目标是实现视觉的泛化⑭、机器人的泛化⑰。

在家庭场景⑳,姜大昕还描绘了这样一幅场景⑬,在未来⑱,大家不需要了解微波炉的功能⑭,不需要去研究每个功能怎么使用⑨,把鸡蛋放进去⑩,给出指令即可❶。也不需要知道如何设定❷,这就是智能终端⑤。家庭场景的想象力大有可为⑤。

姜大昕用三点来概括阶跃星辰的发展蓝图⑭。

第一⑲,坚持基础大模型研发⑯,追求 AGI 不会改变⑮。第二⑨,阶跃差异化的特点就是多模态的能力⑩。第三⑨,在智能终端 Agent 方向上发力⑥,最终形成从模型到 Agent▓,从云侧到端侧的生态体系⑮。

在Agent 元年❸,姜大昕希望有所坚持⑩,有所选择⑱。摆在他们眼前的任务⑳,是让智能体从数字世界走向物理世界⑩。

很赞哦⑤!

随机图文