您现在的位置是:网站首页>CBACBA

HY电玩城

汪飞风 2025-05-14 CBA 1675 人已围观

◎记者 罗茂林⑥、5月13日⑬,字节跳动旗下火山引擎开启上海站的大模型巡展活动④,一批新的大模型产品亮相⑩。与此前大幅跃迁的产品更迭不同⑯,小而专⑭、聚焦实用⑦,甚至是推出大模型工具⑨,成为此次发布会产品的特点⑬。

实用至上⑰,火山引擎这场发布会可视为如今行业巨头布局的一个缩影❷。“字节在大模型产品迭代上的思路越来越清晰③,要能有可靠的商业场景❶,能被客户用起来⑪,这很重要⑥。”一位接近字节跳动的相关人士告诉记者❶,相比执着于“一鸣惊人”的大招⑪,今年以来⑳,“小步快跑”“多线程并进”成为字节发展的思路⑥。

更小更便宜 实用至上❶、依靠短视频崛起的字节跳动在视频生成模型上有了新动作❶。5月13日⑲,在上海站的发布会上⑰,火山引擎发布了豆包视频生成模型Seedance 1.0 lite⑮,支持文生视频⑮、图生视频⑮,视频生成时长支持5s⑫、10s❸,分辨率提供480P❸、720P⑯。“这是一款参数规模很小的模型⑲,但同时依然能够实现影视级的质量②,且视频生成速度大幅提升③。”火山引擎相关负责人介绍道⑰,这款产品可谓兼顾效果②、速度⑬、性价比⑩。“这次大模型优化的一个重要思路就是要在指令遵循方面进一步提升精度⑱。”一位相关技术人士告诉记者⑧,通过优化语义理解能力⑧,在生成视频上可以更加精确控制人物表情②、衣着服装⑱。包括一些文本中对于程度副词的理解与响应⑱,都做了不小的提升⑬。

这样的调整在持续优化模型推理成本的背景下⑩,显然有着更为明确的市场意图⑲。火山引擎希望这款大模型能够在电商广告⑧、娱乐特效⑩、影视创作❷、动态壁纸等场景中发挥更大的作用③。在现场❶,不少电商客户表示⑨,如今不少的营销广告素材都可以通过相关大模型制作③,从而降低制作成本与周期⑨。

火山引擎发布的另一款大模型——豆包1.5·视觉深度思考模型也遵循了“实用至上”的思路❷。

数据显示③,豆包1.5·视觉深度思考模型⑮,激活参数仅20B⑧,但具备强大的多模态理解和推理能力▓,在60个公开评测基准中⑪,有38个取得业内最佳表现⑦,在视频理解⑯、视觉推理⑮、GUI Agent能力等方面均处于第一梯队⑫。

值得一提的是③,该模型新增GUI Agent能力⑬。基于强大的GUI定位性能①,可在PC端⑯、手机端等不同环境中完成复杂交互任务⑫。例如⑥,可对新开发的App功能进行自动化检测⑫。

布局AI生态⑯、企业⑤,无疑是这场大模型商战中各方争夺的焦点⑬。火山引擎披露了如今的AI生态图景:已在汽车⑯、智能终端⑯、互联网③、金融❶、教育科研⑨、零售消费等行业广泛落地⑯,覆盖4亿终端设备⑯、八成主流车企③、70%系统重要性银行和数十家证券基金公司❸、近七成C9顶级高校和100多家科研院所❸。

同时⑦,火山引擎进一步介绍了Data Agent——这是一款面向企业的数据全场景智能体❷。从介绍来看⑧,这款智能体具备主动思考⑳、洞察⑲、分析❸、行动能力⑯,可以帮助企业挖掘数据资产价值⑦,功能覆盖数据分析⑤、智能营销等关键领域④。“火山引擎相关业务自成立之初就坚持内外统一⑭,这样既能保障对内服务❶,又能做好对外支持⑤。”火山引擎总裁谭待说⑱,这样的原则在这场AI Agent的布局中依然适用⑩,“通过技术和资源复用⑥,我们能为内外客户提供性价比更高的服务”⑪。

为帮助开发者更便捷地利用AI提升开发效率⑫,字节旗下国内首款AI原生IDE产品Trae也宣布升级⑱。值得注意的是⑥,此次更新后这一工具可以通过MCP让AI主动调用外部工具等①。

MCP即基于模型上下文协议⑥,由国外大模型公司Anthropic开发③,并于2024年11月正式发布⑩。这一工具被谭待称为类似HTML和HTTP的协议⑱,因此被业内称为AI领域的“万能插座”⑯。

这是字节跳动方面又一次对外释放布局MCP协议的重要信号⑬。谭待此前表示⑦,统一协议有助于降低开发成本⑩、加速行业发展②。火山引擎将专注于企业端的垂类智能体开发④,并为AI开发者提供便利工具①。“我们内部使用Data Agent进行数据分析④,Trae也在内部应用⑯,火山引擎要成为AI原生⑨、AI实践的典范❷,这样才能助力客户和开发者实现AI转型⑱。”在之前的采访中❸,谭待如是表示②。

文章关键词:⑫、火山引擎⑱、字节⑥、字节跳动

VIP课程推荐⑤、加载中...⑱、收起

新浪财经公众号⑮、24和视频⑨,更多粉丝福利扫描二维码关注

很赞哦⑪!

随机图文