您现在的位置是:网站首页>NBANBA

电玩城777版

杜夏岚 2025-05-14 NBA 5684 人已围观

◎记者 罗茂林❸、5月13日⑭,字节跳动旗下火山引擎开启上海站的大模型巡展活动③,一批新的大模型产品亮相⑦。与此前大幅跃迁的产品更迭不同⑦,小而专⑦、聚焦实用⑳,甚至是推出大模型工具⑫,成为此次发布会产品的特点⑱。

实用至上④,火山引擎这场发布会可视为如今行业巨头布局的一个缩影❸。“字节在大模型产品迭代上的思路越来越清晰⑬,要能有可靠的商业场景❷,能被客户用起来⑱,这很重要⑯。”一位接近字节跳动的相关人士告诉记者②,相比执着于“一鸣惊人”的大招⑲,今年以来⑭,“小步快跑”“多线程并进”成为字节发展的思路▓。

更小更便宜 实用至上⑧、依靠短视频崛起的字节跳动在视频生成模型上有了新动作⑭。5月13日▓,在上海站的发布会上③,火山引擎发布了豆包视频生成模型Seedance 1.0 lite❶,支持文生视频⑱、图生视频⑳,视频生成时长支持5s❷、10s⑫,分辨率提供480P⑲、720P③。“这是一款参数规模很小的模型⑦,但同时依然能够实现影视级的质量⑭,且视频生成速度大幅提升⑨。”火山引擎相关负责人介绍道⑭,这款产品可谓兼顾效果⑰、速度▓、性价比❸。“这次大模型优化的一个重要思路就是要在指令遵循方面进一步提升精度⑬。”一位相关技术人士告诉记者⑧,通过优化语义理解能力⑲,在生成视频上可以更加精确控制人物表情⑮、衣着服装②。包括一些文本中对于程度副词的理解与响应❷,都做了不小的提升⑮。

这样的调整在持续优化模型推理成本的背景下⑫,显然有着更为明确的市场意图④。火山引擎希望这款大模型能够在电商广告③、娱乐特效⑯、影视创作①、动态壁纸等场景中发挥更大的作用⑳。在现场⑩,不少电商客户表示⑫,如今不少的营销广告素材都可以通过相关大模型制作⑱,从而降低制作成本与周期⑬。

火山引擎发布的另一款大模型——豆包1.5·视觉深度思考模型也遵循了“实用至上”的思路⑫。

数据显示❸,豆包1.5·视觉深度思考模型⑤,激活参数仅20B⑤,但具备强大的多模态理解和推理能力②,在60个公开评测基准中⑩,有38个取得业内最佳表现⑲,在视频理解⑯、视觉推理⑭、GUI Agent能力等方面均处于第一梯队❷。

值得一提的是⑬,该模型新增GUI Agent能力⑨。基于强大的GUI定位性能⑱,可在PC端⑧、手机端等不同环境中完成复杂交互任务⑫。例如⑤,可对新开发的App功能进行自动化检测①。

布局AI生态⑰、企业⑰,无疑是这场大模型商战中各方争夺的焦点⑱。火山引擎披露了如今的AI生态图景:已在汽车①、智能终端⑯、互联网⑧、金融⑩、教育科研⑦、零售消费等行业广泛落地②,覆盖4亿终端设备⑭、八成主流车企⑳、70%系统重要性银行和数十家证券基金公司⑱、近七成C9顶级高校和100多家科研院所⑥。

同时⑳,火山引擎进一步介绍了Data Agent——这是一款面向企业的数据全场景智能体⑳。从介绍来看⑩,这款智能体具备主动思考❸、洞察①、分析⑩、行动能力⑪,可以帮助企业挖掘数据资产价值①,功能覆盖数据分析④、智能营销等关键领域⑨。“火山引擎相关业务自成立之初就坚持内外统一①,这样既能保障对内服务⑮,又能做好对外支持⑭。”火山引擎总裁谭待说▓,这样的原则在这场AI Agent的布局中依然适用▓,“通过技术和资源复用▓,我们能为内外客户提供性价比更高的服务”⑱。

为帮助开发者更便捷地利用AI提升开发效率⑲,字节旗下国内首款AI原生IDE产品Trae也宣布升级⑫。值得注意的是⑪,此次更新后这一工具可以通过MCP让AI主动调用外部工具等⑧。

MCP即基于模型上下文协议⑳,由国外大模型公司Anthropic开发⑱,并于2024年11月正式发布⑤。这一工具被谭待称为类似HTML和HTTP的协议⑦,因此被业内称为AI领域的“万能插座”⑧。

这是字节跳动方面又一次对外释放布局MCP协议的重要信号❷。谭待此前表示⑲,统一协议有助于降低开发成本❸、加速行业发展⑦。火山引擎将专注于企业端的垂类智能体开发⑱,并为AI开发者提供便利工具❷。“我们内部使用Data Agent进行数据分析③,Trae也在内部应用②,火山引擎要成为AI原生❷、AI实践的典范⑳,这样才能助力客户和开发者实现AI转型①。”在之前的采访中⑮,谭待如是表示⑩。

文章关键词:⑦、火山引擎⑫、字节①、字节跳动

VIP课程推荐❶、加载中...⑪、收起

新浪财经公众号⑮、24和视频⑱,更多粉丝福利扫描二维码关注

很赞哦❷!

随机图文