您现在的位置是:网站首页> 人工智能人工智能

电玩城在线上下分

方寒云 2025-05-14 人工智能 3057 人已围观

◎记者 罗茂林⑲、5月13日④,字节跳动旗下火山引擎开启上海站的大模型巡展活动⑮,一批新的大模型产品亮相⑥。与此前大幅跃迁的产品更迭不同⑧,小而专⑮、聚焦实用⑬,甚至是推出大模型工具⑫,成为此次发布会产品的特点⑱。

实用至上⑱,火山引擎这场发布会可视为如今行业巨头布局的一个缩影⑧。“字节在大模型产品迭代上的思路越来越清晰①,要能有可靠的商业场景⑰,能被客户用起来⑰,这很重要❷。”一位接近字节跳动的相关人士告诉记者⑱,相比执着于“一鸣惊人”的大招①,今年以来⑫,“小步快跑”“多线程并进”成为字节发展的思路⑧。

更小更便宜 实用至上❶、依靠短视频崛起的字节跳动在视频生成模型上有了新动作⑤。5月13日⑭,在上海站的发布会上②,火山引擎发布了豆包视频生成模型Seedance 1.0 lite③,支持文生视频①、图生视频❶,视频生成时长支持5s⑬、10s⑲,分辨率提供480P⑲、720P③。“这是一款参数规模很小的模型⑰,但同时依然能够实现影视级的质量④,且视频生成速度大幅提升⑬。”火山引擎相关负责人介绍道⑩,这款产品可谓兼顾效果④、速度③、性价比⑫。“这次大模型优化的一个重要思路就是要在指令遵循方面进一步提升精度①。”一位相关技术人士告诉记者⑦,通过优化语义理解能力④,在生成视频上可以更加精确控制人物表情⑰、衣着服装⑬。包括一些文本中对于程度副词的理解与响应⑪,都做了不小的提升⑯。

这样的调整在持续优化模型推理成本的背景下⑨,显然有着更为明确的市场意图⑮。火山引擎希望这款大模型能够在电商广告⑩、娱乐特效⑭、影视创作⑳、动态壁纸等场景中发挥更大的作用❷。在现场⑯,不少电商客户表示⑮,如今不少的营销广告素材都可以通过相关大模型制作⑧,从而降低制作成本与周期②。

火山引擎发布的另一款大模型——豆包1.5·视觉深度思考模型也遵循了“实用至上”的思路❷。

数据显示⑲,豆包1.5·视觉深度思考模型⑨,激活参数仅20B④,但具备强大的多模态理解和推理能力⑩,在60个公开评测基准中⑤,有38个取得业内最佳表现❸,在视频理解▓、视觉推理⑮、GUI Agent能力等方面均处于第一梯队⑤。

值得一提的是⑲,该模型新增GUI Agent能力⑯。基于强大的GUI定位性能⑧,可在PC端❷、手机端等不同环境中完成复杂交互任务⑲。例如⑫,可对新开发的App功能进行自动化检测⑲。

布局AI生态②、企业⑫,无疑是这场大模型商战中各方争夺的焦点⑪。火山引擎披露了如今的AI生态图景:已在汽车⑦、智能终端⑪、互联网③、金融②、教育科研②、零售消费等行业广泛落地❶,覆盖4亿终端设备❸、八成主流车企⑦、70%系统重要性银行和数十家证券基金公司⑲、近七成C9顶级高校和100多家科研院所⑪。

同时▓,火山引擎进一步介绍了Data Agent——这是一款面向企业的数据全场景智能体⑦。从介绍来看❷,这款智能体具备主动思考⑬、洞察▓、分析③、行动能力⑪,可以帮助企业挖掘数据资产价值⑳,功能覆盖数据分析⑭、智能营销等关键领域⑫。“火山引擎相关业务自成立之初就坚持内外统一⑫,这样既能保障对内服务⑯,又能做好对外支持❶。”火山引擎总裁谭待说⑬,这样的原则在这场AI Agent的布局中依然适用⑥,“通过技术和资源复用⑳,我们能为内外客户提供性价比更高的服务”⑥。

为帮助开发者更便捷地利用AI提升开发效率❶,字节旗下国内首款AI原生IDE产品Trae也宣布升级❶。值得注意的是⑩,此次更新后这一工具可以通过MCP让AI主动调用外部工具等⑱。

MCP即基于模型上下文协议④,由国外大模型公司Anthropic开发③,并于2024年11月正式发布⑨。这一工具被谭待称为类似HTML和HTTP的协议⑭,因此被业内称为AI领域的“万能插座”⑦。

这是字节跳动方面又一次对外释放布局MCP协议的重要信号⑥。谭待此前表示⑲,统一协议有助于降低开发成本⑦、加速行业发展❸。火山引擎将专注于企业端的垂类智能体开发❸,并为AI开发者提供便利工具⑤。“我们内部使用Data Agent进行数据分析⑥,Trae也在内部应用⑭,火山引擎要成为AI原生⑫、AI实践的典范⑭,这样才能助力客户和开发者实现AI转型⑩。”在之前的采访中⑪,谭待如是表示⑰。

文章关键词:⑦、火山引擎⑰、字节⑤、字节跳动

VIP课程推荐④、加载中...⑯、收起

新浪财经公众号⑫、24和视频❷,更多粉丝福利扫描二维码关注

很赞哦⑪!

随机图文