您现在的位置是:网站首页>世界足球世界足球
手游电玩城平台app
傅雁卉 2025-05-13 【世界足球】 8033 人已围观
大模型进化路线持续分野⑩,阶跃星辰追求AGI的决心反而更加坚定⑫。
成立于2023年4月的阶跃星辰刚刚过完两岁生日❷,模型发布频率和产业落地探索正在前所未有地加速⑦。
阶跃星辰累计发布了22款自研基座模型②,覆盖文字⑰、语音①、图像⑧、视频⑯、音乐①、推理等全系列❷。其中⑥,16款是多模态模型⑯,占比七成⑭。目前仍然保持“月更”状态⑭。
阶跃星辰创始人❸、CEO姜大昕说❷,追求智能的上限仍然是当下最重要的一件事①。
姜大昕的目标是坚决探索通往AGI⑲,且多模态是实现AGI的必由路径⑲。他把模型演进路线图划分为三个阶段⑦,即模拟世界—探索世界—归纳世界⑯。
首先②,模拟世界的训练范式是模仿学习❷,核心是学习海量互联网数据❷;其次⑨,探索世界是追求“系统二”的能力⑨,实现慢思考⑩;其三⑨,智能的尽头是归纳世界▓,机器能够自主学习▓、主动发现人类尚未发现的物理规律⑳。
姜大昕还特别强调从多模态融合走向多模态理解生成一体化⑬,因为“在多模态领域任何一个方向出现短板⑪,都会延缓实现 AGI 的进程⑰。”
在国内大模型公司里⑩,像这样重视模态全覆盖⑰,并且坚持原生多模理念的公司并不多⑱。这被视为阶跃星辰的独特优势④。“我们需要 AI 能听❶、能看⑩、能说❸,这样它才能更好地理解用户所处的环境②,并且和用户进行更为自然的交流⑳。目前的大模型公司有能力去全面自研预训练模型▓,并构成模型矩阵的③,即使是大公司也不多⑧,更不用说是初创公司了⑨,这是阶跃星辰的一个特色①,也是我们的优势▓。”
多模态模型的两大趋势❶、强调多模型理解生成的阶跃星辰❸,是这么想也是这么做的⑭,不断探索模型能力的同时加速落地验证②。
第一是预训练加上强化学习⑪,激发模型推理的时候产生长思维链⑰,极大地提高模型的推理能力⑨。
姜大昕说②,推理模型已经从趋势变成了范式⑪。
阶跃星辰在今年1月份发布了一款推理模型 Step R-Mini⑱,“它的速度很快⑲,推理能力挺强②,超出了当时的 o1的 preview 的版本⑨,我们预计在未来的三个月内发布满血版的 Step-R1⑲。”
第二个趋势是多模态理解生成一体化❸,也就是如何把推理引入到多模态领域③。
姜大昕举一个例子②,有一张足球比赛现场的图片③,一般视觉理解是训练时看到过类似的图⑮,然后给出结果⑧。而加了推理的视觉模型可以根据图片中的广告牌⑫、球衣颜色等更多特征信息给出更准确的答案⑤。
这样的探索已经延伸到短剧领域❶。“现在短剧最卡脖子❶、最瓶颈的地方不是短剧生产❶,而是短剧审核⑮。因为全部需要人工审核⑰,效率非常低⑳,用了阶跃星辰的模型后审核效率从原来的90天可以变成一个星期①。”
姜大昕还进一步解释了“多模理解生成一体化”路线的正确性:
为什么要做理解和生成⑮?因为生成的内容需要理解来控制⑥,为了保证生成的内容有意义⑪,即生成需要理解来控制⑬。反过来⑰,理解需要生成来监督④。但他也表示⑰,从整个行业看⑰,这个路线还有卡点和挑战①。
“到现在为止计算机视觉做了几十年⑭,不幸的是这个问题仍然没有被解决⑦。”姜大昕表示③,理解生成一体化是整个计算机视觉需要突破的一个堡垒❸。
AGI的实现路径清晰了⑤、何时能实现世界模型⑭,姜大昕眼中的 AGI 就实现了⑪,他近期感受最深的一点是⑧,路线越来越清晰了⑨。
他回顾技术发展路线说⑭,2017年transformer 架构对业界最大的意义在于它是一个 scalable 的文本的理解生成一体化的架构⑭。
在那之前⑯, LSTM或者RNN循环神经网络或者其他模型都不能 scalable⑨。正因为有了这个 scalable 的架构以后⑰,到了2020年 GPT-3来了①,GPT-3的意义在于我们第一次把海量的互联网数据放到了这个 scalable 的架构上⑤,可以让它用一个模型去处理所有 NLP 的任务⑤。但那个时候它需要一些例子⑥,然后它用一个模型来告诉你要怎么做⑯。
再往前一步▓,到了2022年 ChatGPT来了⑦,就是在预训练模型的基础上再加上指令跟随⑲,这是 GPT-3.5做的事情③,到了 GPT-4的时候这个能力进一步增强⑩,所以我们经常谈到 "GPT-4时刻"⑲,指的就是在这个模态上❸,模型真正能达到跟人的智能差不多的水平⑭。
到目前为止❸,语言模型的技术路线基本上收敛了⑰,没有出现别的分支⑨,不管是 OpenAI 也好⑨、Google 也好⑬、Anthropic 也好⑲,或者国内任何的公司⑩,语言模型都在朝着这条路往下走②。
姜大昕相信⑥,视觉也是可以 follow 同样的路线⑥。“如果我能够用海量的视频去做预训练⑪,它能 predict next frame 以后⑭,然后类似语言模型一样加各种指令①,让它去预测⑭,再往后做推理④,如果能做到时空推理⑭、加上3D ❷、再加上自然语言学习❷,那就是世界模型了⑭。”
而世界模型❷,就是姜大昕眼中AGI的模样⑦。而挑战正在于此⑱,这件事的原点就是彻底地解决理解生成一体化⑯。
姜大昕断言⑳,这个问题一旦突破以后▓,今后的道路会非常顺畅⑪,视频就会和文本一起发展到世界模型⑰。直到抵达AGI⑫。
智能体将从数字走向物理⑥、2025年是Agent 元年⑰,姜大昕总结了两个之所以爆发的条件⑨,一个是多模态的能力⑪,一个是慢思考的能力❶,这两个能力恰好在2024年的时候取得了突破性进展⑳。
阶跃星辰的发力方向是智能终端 Agent⑩,并在此投入重兵⑯。
姜大昕认为⑳,终端是用户感知和体验的延伸⑮,而且它能帮你完成任务⑦。这是阶跃星辰选择这个赛道的原因⑥。
目前倾注精力的有四个方向⑪,一个是与OPPO等厂商合作的AI手机赛道❸。一个是和吉利汽车⑦、千里科技合作的智能汽车赛道⑳。一个是和TCL等厂商合作的IoT设备领域⑭。一个是具身智能领域⑯。
阶跃星辰正在具身智能领域投注精力⑤,与智元机器人和原力灵机机器人合作⑥,其中阶跃的多模态大模型是机器人的大脑⑲,以感知⑯、理解这个世界③。未来目标是实现视觉的泛化⑩、机器人的泛化⑬。
在家庭场景⑦,姜大昕还描绘了这样一幅场景⑤,在未来⑫,大家不需要了解微波炉的功能⑧,不需要去研究每个功能怎么使用❶,把鸡蛋放进去⑮,给出指令即可▓。也不需要知道如何设定⑱,这就是智能终端⑯。家庭场景的想象力大有可为④。
姜大昕用三点来概括阶跃星辰的发展蓝图⑬。
第一⑯,坚持基础大模型研发⑰,追求 AGI 不会改变⑬。第二⑥,阶跃差异化的特点就是多模态的能力④。第三⑱,在智能终端 Agent 方向上发力⑳,最终形成从模型到 Agent▓,从云侧到端侧的生态体系⑮。
在Agent 元年⑪,姜大昕希望有所坚持⑨,有所选择⑯。摆在他们眼前的任务⑦,是让智能体从数字世界走向物理世界❷。
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可❶,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐❷,非常欢迎各位朋友分享到个人站长或者朋友圈⑨,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑧。
很赞哦⑱!
相关文章
随机图文
石川佳纯:从未因获亚军季军感到快乐⑨,竞技体育目标就是夺冠
如果是我们以郑钦文刚刚伤愈复出⑫,且对接下来的法网没有特别大的期待的话⑯,那这样的表现值得称赞⑥!竞技体育⑭,胜者为王⑫,能赢就不要管怎么样赢的②,不管是漂亮地赢❷,还是丑陋地赢⑫,赢了就没有话说②,赢了就值得肯定⑮,而中国科学家实现1.36公里外毫米级高分辨成像技术
步行者一边倒碾压骑士完成一场大胜⑦,最多时刻领先44分优势⑭,最终也是129-109大胜夺得赛点⑲。西亚卡姆成为步行者的头号功臣⑮,他此役10中9高达9成投篮命中率⑯,其中三分2中2与罚球1中1⑭,高效得到21分吉索尔菲:我们有低调却又卓越的老板⑨;斯维拉尔是罗马的未来
加载中⑳、阅读排行榜⑩、评论排行榜⑯、印度军方:击落了“数架”巴基斯坦飞机首批海南荔枝上市③,拼多多千亿扶持如何发起水果分级革命”⑳?
2026年推出城市辅助驾驶⑲,应对复杂路口的红绿灯识别和自动转向⑯。尽力了⑥!周琦15中11高效空砍26分13板2帽 正负值+6全队最高
中方代表是国务院副总理何立峰▓,美方代表是财政部长斯科特 · 贝森特和美国贸易代表贾米森 · 格里尔⑯。伟时电子:超大尺寸⑥、曲面屏车载背光模组量产⑯,定点项目已逐步进入量产阶段
第九届国际月季大会主展厅位于北京市门头沟区龙泉镇三家店村的京西月季洲①,总占地面积约23万平方米⑬。全园月季种植品种达千余种⑨,园内建设有3个国内城市展园和4个国外风情展园❶,可欣赏到来自不同国家和地区的千余破7倒计时④?中美贸易谈判现曙光 高盛唱多人民币后市
值得注意的是⑲,近两年重庆银行副行长一职经历“大换血”❸,当前6名副行长的任职资格均为近半年内获批⑮。其中④,张松⑱、李聪⑩、颜小川⑲、王伟列为重庆银行内部升迁❸,侯曦蒙④、张培宗为外聘③,侯曦蒙此前任西南证券副总裁⑲。6vivo S30系列处理器敲定:标准版骁龙7 Gen4 Pro版天玑9400e
波尔透露早在2017年中国公开赛时⑱,自己就关注到孙颖莎了④,当时两人一起在训练馆练球并且特别拍摄合影▓,当时只有16岁的孙颖莎令波尔印象极为深刻⑦。