您现在的位置是:网站首页>科技科技

小丑电玩城

傅怜梦 2025-05-14 科技 4112 人已围观

◎记者 罗茂林❶、5月13日①,字节跳动旗下火山引擎开启上海站的大模型巡展活动▓,一批新的大模型产品亮相⑳。与此前大幅跃迁的产品更迭不同▓,小而专⑭、聚焦实用⑱,甚至是推出大模型工具⑱,成为此次发布会产品的特点⑱。

实用至上④,火山引擎这场发布会可视为如今行业巨头布局的一个缩影⑪。“字节在大模型产品迭代上的思路越来越清晰⑲,要能有可靠的商业场景⑳,能被客户用起来⑨,这很重要❸。”一位接近字节跳动的相关人士告诉记者⑰,相比执着于“一鸣惊人”的大招②,今年以来⑲,“小步快跑”“多线程并进”成为字节发展的思路❶。

更小更便宜 实用至上④、依靠短视频崛起的字节跳动在视频生成模型上有了新动作⑫。5月13日❶,在上海站的发布会上⑥,火山引擎发布了豆包视频生成模型Seedance 1.0 lite③,支持文生视频⑥、图生视频⑯,视频生成时长支持5s⑨、10s⑮,分辨率提供480P②、720P⑬。“这是一款参数规模很小的模型⑰,但同时依然能够实现影视级的质量❸,且视频生成速度大幅提升⑲。”火山引擎相关负责人介绍道❷,这款产品可谓兼顾效果⑩、速度▓、性价比⑬。“这次大模型优化的一个重要思路就是要在指令遵循方面进一步提升精度⑲。”一位相关技术人士告诉记者⑤,通过优化语义理解能力②,在生成视频上可以更加精确控制人物表情⑦、衣着服装⑦。包括一些文本中对于程度副词的理解与响应⑭,都做了不小的提升③。

这样的调整在持续优化模型推理成本的背景下⑲,显然有着更为明确的市场意图⑭。火山引擎希望这款大模型能够在电商广告⑧、娱乐特效⑲、影视创作⑧、动态壁纸等场景中发挥更大的作用⑦。在现场⑫,不少电商客户表示⑨,如今不少的营销广告素材都可以通过相关大模型制作⑥,从而降低制作成本与周期②。

火山引擎发布的另一款大模型——豆包1.5·视觉深度思考模型也遵循了“实用至上”的思路⑥。

数据显示❸,豆包1.5·视觉深度思考模型❸,激活参数仅20B⑧,但具备强大的多模态理解和推理能力①,在60个公开评测基准中⑪,有38个取得业内最佳表现④,在视频理解❸、视觉推理⑥、GUI Agent能力等方面均处于第一梯队⑮。

值得一提的是⑳,该模型新增GUI Agent能力⑦。基于强大的GUI定位性能⑬,可在PC端⑪、手机端等不同环境中完成复杂交互任务⑳。例如▓,可对新开发的App功能进行自动化检测❷。

布局AI生态⑫、企业⑮,无疑是这场大模型商战中各方争夺的焦点⑧。火山引擎披露了如今的AI生态图景:已在汽车②、智能终端⑱、互联网⑰、金融⑪、教育科研❶、零售消费等行业广泛落地⑯,覆盖4亿终端设备⑱、八成主流车企⑬、70%系统重要性银行和数十家证券基金公司②、近七成C9顶级高校和100多家科研院所⑮。

同时⑬,火山引擎进一步介绍了Data Agent——这是一款面向企业的数据全场景智能体⑧。从介绍来看⑦,这款智能体具备主动思考④、洞察⑤、分析⑲、行动能力❸,可以帮助企业挖掘数据资产价值⑦,功能覆盖数据分析⑨、智能营销等关键领域❶。“火山引擎相关业务自成立之初就坚持内外统一⑰,这样既能保障对内服务⑤,又能做好对外支持⑰。”火山引擎总裁谭待说③,这样的原则在这场AI Agent的布局中依然适用⑳,“通过技术和资源复用❸,我们能为内外客户提供性价比更高的服务”⑩。

为帮助开发者更便捷地利用AI提升开发效率④,字节旗下国内首款AI原生IDE产品Trae也宣布升级⑤。值得注意的是⑦,此次更新后这一工具可以通过MCP让AI主动调用外部工具等④。

MCP即基于模型上下文协议▓,由国外大模型公司Anthropic开发①,并于2024年11月正式发布⑧。这一工具被谭待称为类似HTML和HTTP的协议⑱,因此被业内称为AI领域的“万能插座”⑲。

这是字节跳动方面又一次对外释放布局MCP协议的重要信号④。谭待此前表示⑳,统一协议有助于降低开发成本⑮、加速行业发展❷。火山引擎将专注于企业端的垂类智能体开发❸,并为AI开发者提供便利工具❷。“我们内部使用Data Agent进行数据分析②,Trae也在内部应用③,火山引擎要成为AI原生❶、AI实践的典范⑯,这样才能助力客户和开发者实现AI转型⑪。”在之前的采访中②,谭待如是表示⑱。

文章关键词:⑩、火山引擎⑬、字节⑤、字节跳动

VIP课程推荐⑰、加载中...⑪、收起

新浪财经公众号⑫、24和视频⑭,更多粉丝福利扫描二维码关注

很赞哦⑦!

随机图文