您现在的位置是: 网站首页>NBANBA

超级电玩城无限金币版2024

万海露 2025-05-13 NBA 3976 人已围观

新智元报道⑬、【新智元导读】中国基础大模型市场▓,彻底变天了❶!如今牌桌上的玩家已经变成了「基模五强」——字节⑳、阿里⑧、阶跃星辰⑤、智谱和DeepSeek②。接下来的巅峰之战⑨,关键制胜点又会在哪里⑭?

DeepSeek的横空出世①,已经彻底改变了全球的AI局势⑭。

从此⑩,不仅中美大模型竞争格局改变①,国产大模型的产业版图❷,也被一举打破⑥!

纵观中国基础大模型的市场⑯,可以看到⑳,如今的基础大模型版图已然改天换地⑤,演变为全新的五强格局——

字节❸、阿里④、阶跃星辰⑥、智谱⑦,以及DeepSeek④。

新基模五强突围④,下一个制胜点在哪⑮?

脱颖而出的这五强②,为何能成为留在最后的玩家⑪?

答案很简单——要么有钱④,要么有人①。

前者⑫,道理不言自明③。训练大模型是明牌重注⑰,要么得自家有粮⑳,要么就得有大腿⑩。

像字节⑱、阿里▓、DeepSeek⑮,都属于有粮的类型⑫;而智谱和阶跃星辰⑬,则无疑属于后者⑨。

其中③,上海队的阶跃星辰②,最新一轮融资发生在24年底至25年初❶,B轮已融资数亿美金①;北京队的智谱▓,在2025年3月已经拿下18亿人民币的融资⑧。

而说到人⑮,当然就是高密度人才②,尤其要有行业认可的技术领军人物⑫。

我们仔细盘盘就能发现⑧,五强在这方面是分足鼎立⑪,各有骨干⑧。

字节的吴永辉①,阿里的吴泳铭⑯、周靖人⑧,阶跃星辰的姜大昕①、张祥雨⑤、朱亦博⑱,智谱的唐杰⑧、张鹏⑧,DeepSeek的梁文锋⑮,都是在业界足以撼动局势的人物⑳。

满足了有钱又有人⑥,在这方面起跑线上各家都差不多②,接下来要比拼的⑱,就是硬货了⑤。

基模五强❶,各领风骚⑦、其实仔细分析⑭,就能发现这五强的共性⑫。

要么是全才⑭,模型的能力要能做到全面覆盖❸,且性能在第一梯队③。要么就是专才⑫,模型在某一方面遥遥领先⑯。

阿里:开源王者⑬,全球第三

阿里以「开源王者」的独特定位①,不仅在国内市场占据重要席位⑮,更在全球AI开源生态中❶,稳居全球TOP 3模型贡献者⑲。

斯坦福2025年人工智能指数报告

可以说❷,阿里是国内过最开源自研LLM互联网巨头①,也是全球唯一一家实现「全尺寸❸、全模态」开源的云计算厂商⑩。

可以说①,作为开源最早⑪、最完整的大公司②,阿里在AI的投入上最坚决⑥,也是如今布局最全⑮、最先赚到钱的中国互联网大厂③。

自2023年以来❶,通义团队累积开源200+模型②,涵盖了千问大语言模型和万相视觉生成模型两大基座系列▓。

这些模型覆盖了文本生成⑤、视觉/语音理解生成⑱、文生图⑪,以及视频生成等全模态⑫,参数规模从0.5B到235B不等❶,跨越119种语言及方言❷。

两年前⑨,国内LLM市场尚处于「百模」混战阶段⑩,阿里率先将Qwen-7B开源⑯,吸引了全球开发者的关注⑤。

截至目前⑳,Qwen全球下载量超3亿⑫,衍生模型数量超10万⑤,超越Llama成为全球第一开源模型②。

在Hugging Face社区⑩,2024年Qwen系列占全球模型下载量的30%以上⑩,稳居第一⑦。

25年2月⑰,Hugging Face全球开源大模型榜单中⑳,排名前十开源模型全部基于Qwen二次开发

在这场「烧钱」的游戏中⑪,未来三年⑨,阿里还将投入3800亿元用于AI研发▓,用于云和AI硬件基础设施⑤,总额超过去十年总和⑥。

这一投入规模在国内互联网公司中首屈一指③,恰恰展现了阿里在AI赛道上的战略决心⑬。

相较于其他大模型玩家⑪,阿里凭借成熟的商业化路径和广泛的客户基础③,率先实现了投入到回报的闭环⑩。

截止2025年1月底⑯,通过阿里云百炼平台调用通义大模型API的企业已超过29万⑳。

字节:巨型航母❷,重回创业

字节的大模型以「综合能力强」为特色❷,覆盖了文本生成⑪、图像理解⑩、视频生成②、语音处理等多模态领域⑧。

在这场技术与资源的巅峰对决之中⑲,字节不仅在自研大模型和AI应用领域⑧,展现出了「凶残的战斗力」⑩。

目前⑰,字节旗下的AI应用超20多款⑥,爆火核心产品「豆包」凭借其强大文本生成和多模态能力⑮,迅速占领用户心智⑨,月活用户超1亿⑫。

视频生成工具「即梦」也被赋予了更高的战略优先级⑨,已在虚拟偶像▓、电商直播等领域⑧,实现商业化落地⑲。

同样❶,字节在AI编程领域不敢落后❷。他们推出的AI编程工具Trae❸,直接对标Cursor等AI集成开发环境⑩。

在企业服务方面⑰,基于豆包大模型⑧,火山引擎「飞连」也在多场景落地AI应用等⑭。

字节的全面布局③,还体现在其生态整合能力上⑩。通过抖音④、今日头条⑨、飞书等平台⑬,字节将大模型嵌入到内容推荐⑨、协同办公中③,形成了技术到应用的生态闭环⑥。

而如今❷,字节以「巨型航母重回创业」姿态❶,凭借雄厚资金③、超高人才密度①、多方向全面布局⑦,成为中国AI赛道领跑者之一⑫。

阶跃星辰:低调的大模型国家队

跟其他家相比②,阶跃星辰可以算是这五强中最低调的大模型国家队了❷。

可以说①,阶跃星辰是生于上海⑯、长于上海的国家队⑬。2024年底⑥,阶跃星辰完成了总额达数亿美元的融资❶,核心投资方包括上海国有资本投资有限公司及其旗下基金⑰,投资⑱、五源资本⑤、启明创投等⑲。

如今④,才成立2年的阶跃星辰②,已累计发布22款自研基座模型⑮,覆盖文字⑩、语音⑦、图像⑮、视频⑫、音乐❸、推理②,其中有16款是多模态模型❸,性能领跑全行业⑮,成为行业内公认的「多模态卷王」④。

其中❷,Step-1o Vision便在2025年初分别在知名大模型竞技场Chatbot Arena和国内权威评估平台「司南」中⑧,分别拿下了视觉领域中国大模型第一⑰,以及多模态模型榜单第一的成绩②。

更难得的是⑩,阶跃星辰的多模态矩阵既全面⑫,又在全行业领先②。要知道⑱,多模态模型的核心⑲,就是综合能力❷,既要求语音⑮、图片⑨、视频多个模态的能力②,又要求模型能理解①、生成⑲、推理❸。在此布局上❸,阶跃星辰的每条线都达到了第一梯队⑯。

而多模还有一大难点⑫,就是融合过程中不能损失单个模特的性能⑨,尤其不能降智⑬。而阶跃星辰采取了原生多模的方式⑥,在此方面经验独到▓。

在阶跃星辰看来⑮,多模态是通往AGI的必经之路⑪。随着多模态交互和推理的融合愈加成熟⑱,更多Agent会在智能终端上涌现⑨。

现在⑭,阶跃星辰正在发力彻底解决视觉领域根本难题——表征和对齐的基础问题⑭,也即「predict next frame」③。

未来⑩,按照阶跃星辰的多模研发路径⑱,AI将能建模物理世界交互⑭,模拟整个世界⑲,构建世界模型⑩。至此⑭,AGI就将实现②。

在成立之初❸,姜大昕团队曾绘制过这样一幅智能演进路线图⑦,将智能进化分为模拟世界⑰、探索世界⑳、归纳世界三个阶段

与此同时⑤,阶跃星辰的核心技术人员已经在一线亲历十年AI发展③,这支队伍的人才密度极高⑧,既有技术洞察⑧,又有实战经验⑧,堪称是基模的「梦之队」⑰。

其中⑩,创始人②、CEO姜大昕曾担任微软全球副总裁❶,微软亚洲互联网工程院副院长⑩、首席科学家④。入选2025年IEEE Fellow的姜大昕博士❸,是唯一来自中国大模型创业公司的入选者⑧。

而首席科学家张祥雨❷,其参与着作的《用于图像识别的深度残差学习》论文是21世纪以来全球被引用次数最多的论文③,引用量已超过25万次⑧。

商业化方面⑫,目前已有多家头部企业和大量AI应用开发者对阶跃的多模态模型表示认可②,纷纷接入①。同时⑯,阶跃还将智能终端Agent视为大模型落地的核心突破点⑯,已和吉利汽车④、千里科技②、OPPO③、智元机器人⑧、原力灵机❶、TCL等达成了深度合作③。

智谱:全栈创新⑳,发力智能体

作为国内首个开启IPO大模型创业公司⑯,智谱背靠清华技术底蕴以「学院派」独特气质脱颖而出▓,在基座模型⑪、多模态技术和智能体展开全面布局②。

目前⑳,智谱已经建立了新一代认知大模型技术体系⑬,研发了全栈自主GLM系模型⑳,性能指标与国际顶尖LLM对齐④。

去年8月④,GLM-4-Plus问世在多个任务上表现优异⑳,与GPT-4系不相上下②。

今年4月⑨,智谱再次开源32B/9B系列GLM模型⑪,包括基座⑪、推理和沉思模型②。以320亿参数比肩千亿参数主流模型性能⑮。

其中的GLM-Z1-Rumination沉思模型⑩,便是智谱对AGI下一代技术的最新探索⑰。

在智能体方面⑮,智谱先于OpenAI提出Phone Use概念并推出Agent产品⑤,并发布了全球首个集深度研究与实际操作于一体L3级智能体——AutoGLM沉思③。

如今③,他们正凭借AutoGLM及GLM-PC与全球车企⑲、PC及手机厂商展开深度合作⑥,推动大模型从Chat走向Act⑬。

智谱的商业化路径以2G和2B业务为核心②,深度绑定政府和企业需求⑥。

其构建了MaaS私有化部署和智能体平台等服务模型❶,形成了包含百万规模开发者的模型服务新生态⑫。

据统计③,MaaS平台支撑80余万企业❸、应用开发者⑪。

这种学院派创业模式④,使得智谱在技术深度和战略稳定上⑮,占据领先优势⑬。

DeepSeek:研究导向⑥,厚积薄发

DeepSeek④,则是五强中目前最受国外瞩目的一位▓。在中美AI竞赛中②,也是被提及最多②、存在感最强的一家❶。

可以说⑱,这是一位特立独行的技术奇兵⑳,直接以一己之力⑧,掀翻了大模型的牌桌❸。

DeepSeek技术的特点⑲,就是聚焦语言模型⑧,特别是数理能力⑰,走坚定的开源路线⑦。

今年过年时④,DeepSeek-R1给全世界带来了亿点点震撼⑨,以极低的计算资源❶,取得了媲美GPT-4等顶级AI模型的性能⑳。

相比OpenAI⑰、Anthropic训模型时动辄投入的数亿美元资金⑰、数万张高端GPU❸,DeepSeek四两拨千斤的核心秘诀④,就在于下面这种极致的工程优化⑲。

比如③,MoE架构让模型总参数量达到671B⑫,而在运行时却只需激活37B⑦,大幅降低了计算需求⑫;多token预测⑥,则提高了AI的训练效率③,避免逐字预测⑯;多头潜注意力⑪,让模型更精准地分配了计算资源▓。

总之⑫,DeepSeek成功的关键⑦,就在于偏研究型的导向⑤,而非以盈利为短期目标▓。从研究角度鼓励工程师提效⑧,不必面临财务变现压力⑰。

而DeepSeek团队⑬,也汇聚了多位顶尖人才⑱。创始人梁文锋⑩,在用人上也有着自己独特的原则⑳。

比如⑤,以应届和毕业一两年的人才为主⑧,不追求规模❷,而是构建小而精的团队⑮。

随着大规模的破圈⑮,云厂商⑧、行业伙伴纷纷积极接入⑯,让模型的生命力持续旺盛▓。

在DeepSeek的热潮下⑱,如今已经有亿万普通用户开始拥抱AI⑩。

决战下一阶段⑮、「智能上限」与「多模态能力」

当「基模五强」的格局初步形成⑱,竞争的焦点也随之转向更为核心和前沿的技术领域⑬。

技术决胜点⑫,聚焦何处①?

显然⑧,追求更高的「智能上限」和突破的「多模态能力」⑳,已成为通往AGI路上必须抢攻的两大技术高地⑯。

一方面③,追求智能的上限⑫,仍是当下大模型领域最重要的事情④。

当前领先的模型虽然在许多任务中表现惊艳⑰,但在逻辑推理⑯、常识理解②、长文本处理等方面⑳,仍有较大的提升空间⑦。

提升智能上限的最终目标❷,是迈向能够执行任何人类智力任务的AGI③,这需要模型具备更深层次的理解❶、学习③、推理和创造能力⑳。

另一方面⑰,多模态理解与生成的统一是走向AGI的必经之路③。

人类通过多种感官与世界交互❸,并获取信息⑫。要让AI真正理解并融入复杂的世界❶,就必须赋予其处理和融合文本①、图像③、音频⑭、视频等多种模态信息的能力❷。

当理解与生成统一④,不仅能推动智能体在智能终端的普及②,还能通过具身智能与物理世界交互❷,自己收集环境数据⑥,构建世界模型❷。

在世界模型的基础上⑳,再加上复杂任务的规划④、抽象概念归纳的能力⑤,强化学习算法能力⑭,以及超级对齐能力①,就有可能实现AGI⑪。

总而言之⑬,未来对更高智能上限的无尽探索和多模态能力的深度融合▓,将是决定这场竞赛胜负的关键❸。

如今站在AGI的门槛前④,「基模五强」的竞争不仅是技术的较量⑧,更是资源⑪、人才⑩、生态的全面博弈⑮。

字节②、阿里⑧、阶跃星辰①、智谱⑲、DeepSeek这五大领军者⑯,正以其各自独特的优势和战略远见⑨,引领中国AI不断逼近世界前沿⑥。

而这场竞争的终点③,或许正是AGI的曙光⑤。

参考资料:

很赞哦⑰!

随机图文