您现在的位置是:网站首页>财经财经

电玩城客服

韩白易 2025-05-14 财经 5794 人已围观

◎记者 罗茂林❷、5月13日⑤,字节跳动旗下火山引擎开启上海站的大模型巡展活动⑮,一批新的大模型产品亮相⑥。与此前大幅跃迁的产品更迭不同④,小而专⑥、聚焦实用④,甚至是推出大模型工具▓,成为此次发布会产品的特点⑧。

实用至上⑨,火山引擎这场发布会可视为如今行业巨头布局的一个缩影⑯。“字节在大模型产品迭代上的思路越来越清晰⑲,要能有可靠的商业场景⑧,能被客户用起来▓,这很重要▓。”一位接近字节跳动的相关人士告诉记者③,相比执着于“一鸣惊人”的大招⑧,今年以来⑫,“小步快跑”“多线程并进”成为字节发展的思路⑭。

更小更便宜 实用至上⑧、依靠短视频崛起的字节跳动在视频生成模型上有了新动作⑮。5月13日⑩,在上海站的发布会上⑱,火山引擎发布了豆包视频生成模型Seedance 1.0 lite⑧,支持文生视频▓、图生视频⑮,视频生成时长支持5s⑤、10s②,分辨率提供480P▓、720P⑯。“这是一款参数规模很小的模型❸,但同时依然能够实现影视级的质量⑥,且视频生成速度大幅提升❷。”火山引擎相关负责人介绍道⑫,这款产品可谓兼顾效果⑨、速度⑤、性价比❷。“这次大模型优化的一个重要思路就是要在指令遵循方面进一步提升精度⑥。”一位相关技术人士告诉记者⑲,通过优化语义理解能力①,在生成视频上可以更加精确控制人物表情④、衣着服装⑧。包括一些文本中对于程度副词的理解与响应①,都做了不小的提升⑳。

这样的调整在持续优化模型推理成本的背景下⑬,显然有着更为明确的市场意图⑲。火山引擎希望这款大模型能够在电商广告⑯、娱乐特效⑫、影视创作⑫、动态壁纸等场景中发挥更大的作用④。在现场⑪,不少电商客户表示⑳,如今不少的营销广告素材都可以通过相关大模型制作⑰,从而降低制作成本与周期⑫。

火山引擎发布的另一款大模型——豆包1.5·视觉深度思考模型也遵循了“实用至上”的思路⑰。

数据显示⑨,豆包1.5·视觉深度思考模型②,激活参数仅20B⑥,但具备强大的多模态理解和推理能力❸,在60个公开评测基准中②,有38个取得业内最佳表现⑬,在视频理解⑲、视觉推理❷、GUI Agent能力等方面均处于第一梯队⑩。

值得一提的是⑯,该模型新增GUI Agent能力⑮。基于强大的GUI定位性能⑮,可在PC端⑪、手机端等不同环境中完成复杂交互任务⑫。例如⑧,可对新开发的App功能进行自动化检测⑭。

布局AI生态④、企业⑤,无疑是这场大模型商战中各方争夺的焦点⑫。火山引擎披露了如今的AI生态图景:已在汽车②、智能终端⑳、互联网❶、金融②、教育科研⑤、零售消费等行业广泛落地⑨,覆盖4亿终端设备⑳、八成主流车企⑩、70%系统重要性银行和数十家证券基金公司③、近七成C9顶级高校和100多家科研院所❶。

同时❶,火山引擎进一步介绍了Data Agent——这是一款面向企业的数据全场景智能体④。从介绍来看⑰,这款智能体具备主动思考⑫、洞察⑲、分析⑥、行动能力⑤,可以帮助企业挖掘数据资产价值⑰,功能覆盖数据分析⑫、智能营销等关键领域⑧。“火山引擎相关业务自成立之初就坚持内外统一⑬,这样既能保障对内服务⑱,又能做好对外支持⑥。”火山引擎总裁谭待说⑭,这样的原则在这场AI Agent的布局中依然适用⑩,“通过技术和资源复用⑪,我们能为内外客户提供性价比更高的服务”②。

为帮助开发者更便捷地利用AI提升开发效率⑫,字节旗下国内首款AI原生IDE产品Trae也宣布升级④。值得注意的是⑩,此次更新后这一工具可以通过MCP让AI主动调用外部工具等⑯。

MCP即基于模型上下文协议⑭,由国外大模型公司Anthropic开发⑮,并于2024年11月正式发布⑥。这一工具被谭待称为类似HTML和HTTP的协议⑯,因此被业内称为AI领域的“万能插座”⑤。

这是字节跳动方面又一次对外释放布局MCP协议的重要信号⑮。谭待此前表示⑥,统一协议有助于降低开发成本❸、加速行业发展▓。火山引擎将专注于企业端的垂类智能体开发❷,并为AI开发者提供便利工具⑤。“我们内部使用Data Agent进行数据分析❶,Trae也在内部应用⑳,火山引擎要成为AI原生❶、AI实践的典范⑪,这样才能助力客户和开发者实现AI转型⑭。”在之前的采访中❷,谭待如是表示⑲。

文章关键词:③、火山引擎⑩、字节❸、字节跳动

VIP课程推荐②、加载中...②、收起

新浪财经公众号❶、24和视频⑮,更多粉丝福利扫描二维码关注

很赞哦⑱!

随机图文