您现在的位置是:网站首页>中国足球中国足球
皇家电玩城手机版下载
崔梦曼 2025-05-14 【中国足球】 4524 人已围观
如果在软件行业发展的坐标轴上划出一个分野点⑮,华创资本管理合伙人吴海燕认为是2021年⑤。因为这一年⑭,不仅是软件行业估值的高点❷,也是行业最受资本追捧的一年⑯。因此④,她把软件公司分为两类:一类是 2021 年融到了很多钱的公司②,一类则是 2021 年没有融到钱的公司⑥。这之后❸,两类公司都不可避免地遭遇挑战❸,但困难的程度和路径选择却截然不同❶。
华创派企业 PingCAP 就属于 2021 年融资成功的阵营⑮。那个时候他们对未来的宏观形势有所预判❷,得以抓住机会加速了全球化的布局⑬。作为一家企业级开源分布式数据库厂商⑧,PingCAP服务的客户如今已超过20个国家和地区❸,创立的分布式关系型数据库 TiDB⑲,能持续帮助企业最大化发挥数据价值④。
随着 AI 浪潮的来临❷,数据价值也得到了前所未有的提升⑧。但这股大潮的影响远不止于此⑨,AI 将如何深刻改变企业软件的交互方式与产品形态⑦?基础软件在 AI 时代又该实现哪些自我革新和进化❶?近日④,PingCAP 联合创始人兼 CTO 黄东旭做客「牛白丁」⑮,与吴海燕一起探讨了AI大潮冲击下⑳,软件公司该如何顺流而上②,发挥出自己独特的行业价值⑬。
嘉宾介绍:❶、黄东旭❷, PingCAP 联合创始人兼 CTO
本期主播:⑭、吴海燕❶,华创资本管理合伙人
以下为节目内容⑳,经过 CGCVC 编辑——
海燕:大家好⑧,这里是华创资本的播客节目「牛白丁」⑰,我是吴海燕⑯。这期我们请到了 PingCAP 的联合创始人兼 CTO 黄东旭⑭。
我其实现在回想咱们的第一次见面还印象深刻▓,你们出过一本书《与开源同行》⑬,我当时在作的序里也写了这个场景❶。我记得是2017年3月的一个早晨⑦,我和你约在 PingCAP 当时办公的东升科技园❶,因为约的时间太早⑨,会议室里只有你一个人在等我⑤。后来我才知道❸,程序员因为工作习惯⑫,早晨一般都不在公司⑯。
东旭:那次我印象也特别深刻⑮,和你聊完以后我就去赶飞机了⑰。一下飞机就收到你的信息④,说PingCAP是家好公司⑫。
海燕:我当时也是下了飞机就告诉刘奇华创决定领投⑤,他还说这是“云上”的决定⑰。2017年3月我们见面⑧,年中完成了投资❶,10 月份刚好咱俩都分别去北美出差⑧,我们在硅谷还一起见了些朋友②。所以那时候你们已经正式开始在北美设办公室⑯、招人了吧⑲?
东旭:没错⑪,PingCAP 2015年创立④,从第一天起⑫,我们就想着去做一个 global company④,公司成立前两年基本都在写代码❶,你说的2017年10月的那个时间点⑤,是我们真正决定要在硅谷设点⑪,开始正式运营在海外的业务①。其实在那之前②,我从来没有在海外工作❸、留学过⑤,在当地也没有什么 connection ❸,只是觉得这对于PingCAP的战略来说是一定要做的事情⑧,哪怕没有条件⑱,创造条件也要去做⑰,所以我当时都没买回程机票▓,事情没办完我就不打算回来⑩。
海燕:咱们那轮融资算是当时相对比较大的一笔美元⑯,你们融资后的第一件事就是立马去北美开办公室▓。2017 年咱俩在硅谷碰面时①,我介绍你认识了硅谷当地一些做投资的朋友②。后来到了 2020 年⑱,一位朋友还跟我说后悔在硅谷介绍你们认识时没有投资PingCAP④。
东旭:未来还有机会的⑥。我们开始国际化的时间比较早⑰,中间也踩了好多坑④,以后有机会我们再分享⑯。
海燕:说起 2017 年❷,感觉像是昨天②,但实际上过去八年里已经发生了非常多的事件和变化⑬。站在投资人的角度⑱,说一下我感觉到的咱们这个行业的变化⑨。
2021 年实际上是软件行业估值的高点⑥,应该也是行业最受追捧的一年⑬。 2021 年我们软件 portfolio 所获得的融资②,比历史上华创其余九年里软件 portfolio 的融资额加起来还要多③。后面的几年❷,再也回不到 2021年的盛况了⑱。
东旭:那个时候应该是美国印了很多钱⑳,整个资本市场有点被催熟⑤。
海燕:当年标志性的事件就是 Snowflake 上市⑮,超高估值上市激起了大家对软件行业非常大的热情⑯,所以行业融了很多钱⑱。到了 2022 年初⑮,世界一下又变化了⑪,按下了暂停键⑨。之后的三年里⑳,直到今天▓,企业软件公司融资就变得不太容易了❷。
我们每次年底做行业回顾的时候⑯,我就会把软件的 portfolio 分成两类:一类是 2021 年融到了很多钱的公司⑭,一类是 2021 年没有融到钱的公司⑧。这两类公司在 2022 年之后⑤,可能就是一个很大的分野①,他们或许都经历了不同程度的困难⑰。注意⑲,我没觉得 2021 年融到很多钱的公司就特别了不起或者顺利⑰,其实大家都经历了不一样的困难⑤。 2021 年没有融到钱的公司⑪,就是错过了那个融资最高峰的时候❷,所以他们每一年都在过苦日子❶,每一年都在降本增效⑪。
东旭:非常 tough⑳。
海燕:活下来的可能都是“打不死的小强”了⑨。而 2021 年融到很多钱的公司⑲,他们经历的困难大部分是涉及到心态调整和管理上的巨大挑战②。因为 2021 年你融到很多钱③,就意味着你当时一心想要做高增长⑫,会招很多很多人❶,会开新的办公室⑧,花很多时间精力做销售⑨,不顾一切地去拿订单⑫。这是 2021 年融到很多钱的公司一定会去做的事⑲,然后在 2022 年❷,啪⑲,一个巨大的终止符下来了❷。所以在 2021 年融到很多钱的公司⑪,无一例外地经历了团队从很小规模到很大❷,又缩回很小的这样一个阵痛的过程❸。
东旭:PingCAP 也属于 21 年拿到钱的那个阵营⑪。但我们拿钱的心路历程我可能没跟海燕聊过❶。其实我们在 20⑩、21 年已经非常明确地知道 22 年一定会有大的经济危机⑪,因为美联储持续地加息❷、印钞⑪,我们觉得风险非常非常大❷。 21 年正好在市场比较好的时候①,尤其在 Snowflake 上市以后④,我们知道未来马上会有苦日子⑪,所以必须在那个时候先把过冬的粮食给准备好⑨,而且当时拿那笔钱❸,我们的一个思路并不是要去追求更高的增长▓,而是在那个时间点之后⑪,如果你只做单一市场是不够的⑧,我们一定要在那个时间点让自己变成一个 global company⑮,这样才能有更多抵御风险的能力▓。包括到现在我们对于 spending 的控制③,我觉得还可以⑮,没有说突然有钱了以后就疯狂扩张⑤。
当时确实扩了一点⑪,但很快在 2022 年时⑰,我们又往回缩了一些⑯。倒不是因为业务的原因⑭,而是我们需要像跑马拉松一样⑰,根据最终的目标来去分配精力和能量⑰。因为当时是我们做全球化最好的时机②,由于疫情的缘故⑳,物理世界的数字化在加速⑫,包括 cloud 的 infrastructure 变得越来越成熟⑫,当然 mindset 也接近成熟⑧。所以我觉得我们还是比较幸运❷,大多数人没有办法预测未来❶,只是正好在那个时候有一个很好的时机⑬,就活到了现在⑦。
海燕:我其实在 2021 年的时候⑭,问过几个我们拿了大钱的 portfolio❶,他们在 21 年融了不止一轮▓,且融了非常多的钱⑮。每次他们融到大钱时❶,我都会打电话问创始人:“根据咱的业务状态和进展⑨,似乎没有必要一定要拿这笔钱⑱,你是怎么考虑的⑤?”
我不是建议他们拿或者不拿⑤,只是问询一下他们的考虑⑥。这几个创始人都给了类似的答案⑫。首先就是你刚才说的⑮,他们预判了现在是一个资本膨胀的时代⑤,而且资本是有周期的①,可能不久的将来就会是一个 downtime⑦,我们也不知道什么时候是 downtime⑦,但既然现在是 high time ⑩,就应该多储备一些现金③;第二⑫,他们不介意所谓的股权稀释⑪,万一哪天到了 downtime⑮,公司有足够多的现金⑬,可能会比别人有更多的竞争优势⑮,可能还能收购一些钱不够了但是产品和技术很好的团队⑬。我从几个创始人那里都得到了同样的答案❶,所以大家当时是看得很准的❸。
到了 23 年❷,大家从疫情中刚刚回过神来⑲,又一个大的时代到来了—— ChatGPT 3.5 发布了⑬。
东旭:其实 Open AI 在 GPT-2 出来的时候我就开始在玩⑤,后来 ChatGPT 迭代大家都知道了①。
海燕:我觉得一方面印证了 21 年大家说的一些话⑭,可能后面的 downtime 你不一定能拿到很多钱⑪。而 AI 大潮的来临⑧,其实抢夺了软件公司在资本化方面很稀缺的资源⑮。因为从 22 年之后⑨,不管是美股⑦、 A股▓、港股这些比较大的二级市场②,还是一级市场⑭,都变得非常紧缩⑫,流动性不足⑪,就导致股权融资变得很困难⑫。即便是上市公司⑥,你要做增发⑧,要在二级市场再融资也不太容易⑯。一级市场的各种统计数据都显示⑭,从 22 年以后⑨,融资的公司数量⑰、总的融资金额都在不断地下降▓。我觉得这个情况在硅谷和在北京都是一样的⑱,不是说硅谷的情况就比咱们好很多▓,大家都处于一个紧缩的时代⑭。
东旭:或者说市场的注意力都转到了 AI 这边⑪。
海燕:对⑥,在融资总规模变小的情况下⑦,AI 的占比还提升了②,唯一特别活跃的投融资就发生在 AI 领域⑦。尤其是最近一年特别明显⑦,市场上一些投资人甚至非 AI 项目不看⑬。
东旭:⑰、这是非常明显的 “The Head Effect”⑬。
海燕:这就导致很多其他行业优秀的公司④,在过去一两年要不融不到钱❶,要不融到钱估值也没法看①,对吧⑨?不是 down round 就不错了⑨,很多都是 flat round③。
软件公司在过去两年也 kind of 被大家有点遗忘了⑦,给人感觉是软件公司跟 AI 到底能发生什么强关联呢⑤?AI 时代会不会有一些完全不同的公司出来⑩,做面向企业客户的数字化⑯、智能化⑨?你在硅谷看到的变化是什么呢⑭?
东旭:我觉得现在我们真正站在一个非常大的时代的门口⑫。一直到 DeepSeek 今年春节爆火之前②,整个行业大概都是在 build prototype⑤。今天有个很好的 idea⑥,我就试一试⑤。前两天更加夸张⑩,大模型动辄投个几千美金训练了一个新的模型出来⑮,打个榜三天以后就 hype❶,而且 AI 的势能过大❸,导致 hype 时间非常短②,因为所有的注意力和资源都砸在这个方向上⑧,而且 Transformer 跟过去的科技创新⑦,或者软件行业的技术创新还有点不一样⑪。
过去软件的护城河或者价值⑱,其实在于业务 Know-how 还是系统复杂❶,比如像我们的数据库⑨,过去的门槛其实在于工程复杂性⑱。就是你可能要写 100 万行代码②,才能表现得很好⑲。像 Salesforce 或者 ERP 软件⑫,得有很深厚的技术和业务的 Know-how⑨,才能做这样的 system software⑰。包括各种 SaaS⑳,在过去都是这样的逻辑❷。
但 AI 这波⑪,尤其是大语言模型⑰,它本身的注意力机制❷,我觉得大学本科毕业的人看 Transformer 的论文看两个礼拜⑱,第一能看懂⑩,第二能自己实现出来一个⑨。我当时就想着也要学习一下⑪,看论文花了两个礼拜⑱,真的就写了一个出来⑬。只是到最后还需要很多算力❸、数据⑮,但它的机制本身是不复杂的❸。
所以⑤,创业者投身AI⑥,尤其是大语言模型的门槛其实比以前是低很多的③。加上全世界的资本全都集中在这⑫,大家其实一直在经历各种各样的三天一遍的一个hype▓。
海燕:Hype 之下一个很重要的心态⑯,就是 FOMO⑱。不管是个人用户⑫、企业客户还是投资人⑳、创业者⑤,大家都有不同的FOMO 情绪⑦。比如过去两年⑲,我们软件 portfolio 说现在大部分企业日子不好过⑮,数字化预算都降低了⑲。但这个背景之下▓,各个企业还都有部分预算是特意留给 AI 的⑨。就是无论如何我都得先试试 AI④,万一我被时代抛下怎么办⑮?
东旭:这是为什么我觉得现在是一个很重要的时间点⑳,但我们还站在门口⑱,没有进去⑪。我觉得到今年 AI 的基础能力⑩,不管是 DeepSeek 还是现在的 Tier1 的 model②,已经能做一些 actually something useful③,这是非常非常重要的⑫。
我先说一个结论:未来所有的软件⑤,尤其是企业软件都会被 AI 彻底改造④,软件的形态会发生很大的改变⑨,但一些更深层次的内核是不会变的❶。比如 CRM 作为销售的辅助对于本身的行业 Know-how ⑯,在未来也会变成这个软件的护城河⑯,只是 AI 会改变它的整个产品形态⑩。
海燕:你话里面的第一重逻辑⑳,至少给了我们软件行业的创业者一个 comfort▓,专业的企业软件公司还是需要的⑨,不是基础的大模型就能颠覆和替代了的⑥。
为啥有这样的疑问⑩?举个例子⑯,我们之前有一个 portfolio 公司要被收购了⑤,被收购的过程中③,收购方的业务层大老⑧,他们可能不是特别理解技术④,所以一直在问:都 AI 时代了⑥,还买个软件公司干嘛④?以后理论上客户不就用 AI 能替代了❷,还要软件干嘛⑫?
东旭:就好像 AI 是万能药⑭。
海燕:对⑥,有个 AI 就不需要专业的软件公司了⑪。这两年我也琢磨了一下⑧,到底 AI 对于软件公司意味着什么❶?类比自动驾驶时代到来后⑩,车变得不一样了⑫,变得更强大了❸,但还是需要专业的造车公司去把车给造出来⑤,你还是需要一辆车的❶,对吧⑰?
东旭:举个很简单的例子⑬,比如像会计❶,我父母都是会计师①,他们是互联网时代之前的会计⑲。现在所有的会计电商化都完成数字化了以后⑭,这个行业不存在了吗⑦?它还是一直存在的⑯。从古代有交易开始❷,一直到现在⑬,记账这件事情从来没变过⑪,只是不同的时代我们用不同的工具⑫,它的产品形态会发生改变①,就像 CRM ⑪,还是销售过程管理⑳。难道在 AI 普及的时代⑥,就不需要销售吗⑯?就不需要过程管理吗②?我觉得一定需要的⑧。只是未来软件的形态一定会比现在更加好⑩、更加智能⑲。
以前我们有些事情是没有办法做到的⑤。比如我们公司在海外用的 Salesforce⑤,现在 PingCAP 内部大概有三个同事全职在帮我去做各种各样的 Salesforce 的报表①。比如我提个需求①,想看一下今年哪些客户买哪些 SKU⑭,哪些涨得特别好⑰?重要的客户是谁⑭?哪些销售排名更靠前④?
海燕:你需要基于 Salesforce 做数据统计或者 BI⑤。
东旭:以前都得靠人❸,而且我提一个需求可能两天以后才能做好④。我非常 respect 这些同事的工作③,因为企业软件一个很重要的护城河⑱,是对于这些企业的 Know-how⑤,以及这些数据在什么地方⑬,怎么把它组织起来⑨,变成一个能够被提取的 insight⑭,这些其实很重要的⑦。
现在我自己做了一个 Agent⑨,但还是太慢了②,还需要一些更加个性化的能力⑭。我是怎么做的呢⑳?我直接把我所有的Salesforce 数据全都同步到我自己的 database 上⑮。然后我自己写了一个 Agent 用 NCP 去读取我的 database⑦,它自己写 SQL⑩,我在上面就用自然语言去看⑧,比如最近 10 天最好的销售排名⑧。
海燕:你已经实现了传说中的 ABI①。
东旭:虽然还不成熟⑪,但我觉得体验比以前自己打开 Salesforce④,然后在各处找数据做报表要好⑩。这里涉及到一个核心的逻辑——过去我们的软件都是静态的⑧。静态是什么意思呢①?就是程序员把这个业务逻辑写好⑤,变成报表也好⑨,或者变成业务逻辑也好⑯,就在那⑩,它没有任何机会去变化⑨。
但是今天大语言模型在所有的用户接口层给每一个人提供了一种灵活性⑯,相当于以前一个公司②,比如只有高管才有助理帮他订机票⑬, 现在你可以认为每一个企业软件服务的用户⑯,他自己在他的软件里面有能够提供灵活性的一层⑮。有点像过去产品底下是一个大的数据库⑬,这个数据库你是看不见的⑦,比如 Salesforce 底下会有各种各样的 data Infra⑰,而且这些数据是被分割在不同的地方⑩。但是未来可能在产品和数据之间④,会有一层叫 Agent①,或者 AI②。
海燕:云计算时代①,是把传统软件所谓的烟囱状给打破了⑧,可能 AI 时代进一步把 SaaS 的藩篱给打破了❶。
东旭:是的⑧,而且我觉得 AI 还打破了一个事情⑫,就是人的思维局限②,有的时候烟囱不是在技术层面⑳,其实是在用户和产品经理的脑子里❷。
海燕:我说一个我的观察⑩。我们投了相当多的软件公司⑩,各类都有⑭。我过去看到的❸,不管是国内还是国外③,软件有一个核心的指标叫做 Customer Retention⑯,就是客户的 retention rate⑯,而 Customer Retention 的一个最大障碍就是客户买了软件之后⑳,有没有真正把软件用起来⑱?但凡真正用起来▓,不需要是多么牛逼的软件④,客户的 retention 一定是好的⑭。
如果客户都没用起来⑤,他一定不会续费②。那么客户用软件的障碍又在哪里⑫?细究一下会发现所有的软件都是有使用门槛的⑦,用户要学习怎么去使用⑪。相当于一辆车⑳,这个车已经代表了现代制造业①,但问题是开车这个事情⑲,包括把日常开车出门以车代步这个事情变成一个习惯⑪,它是有门槛的⑦,是需要去学习的❸。你要了解车的基本架构是什么⑰?每个按键是什么功能▓?开上之后还要掌握一定的手感❸,你要慢慢地熟悉它⑪,习惯它的速度⑯,还要遵守交通规则❸。
东旭:门槛太高了⑭。
海燕:对⑫,这些门槛导致了很多用户会缩回来④。哪怕这个企业客户买了⑭,组织买了⑮,让每个同事去用⑦,很多人还是在自己的老习惯里⑪,记在小本上❶,再把小本上的内容找一个集中的时间上传到软件里去⑫。这就说明他其实并没有掌握开车的习惯⑰,也就很难理解⑧,以车代步会大大地提升效率⑪、拓展能力⑦。
东旭:这种情况他真正需要什么⑤?需要一个司机①。
海燕:但就像你刚才说的❶,不可能每个人都给配个司机⑬。
东旭:你看这个截图⑪,这是我们公司的一个销售①。我想知道他最近在负责什么样的项目⑤?所有这些数据都是动态的❸。我也可以问他最近一次跟某某客户开会是什么时候⑤?聊了什么内容⑩?就是刚才你说的每个人的司机⑯。
就像我刚才说到一个非常重要的点⑳,长期来看软件的门槛⑮,是一直在降低的④。我觉得未来软件最易用的形式其实就是对话⑰。
海燕:不需要用户做任何学习⑰,非常非常低的门槛就能用起来⑰,但凡让他还要学点啥⑩,比如要了解这个软件的整个结构⑰、功能按键等涉及到了学习成本和过去工作习惯的改变⑧,就会导致很多软件用不起来⑱。
东旭:没错②,我先描述一下我想象的未来企业软件的样子⑮,下一代的 Salesforce 可能会长什么样⑳?第一①,它是一个对话框⑨;第二⑱,你可以想象现在把所有的 Salesforce 的功能全都切成一个个碎块⑩,这个碎块就是一张张小卡片❸,在你的对话中 AI 或 LLM 有点像一个 Copilot⑨,这个 Copilot 会根据你的上下文和你现在的需求②,把相应的碎片拿出来放到对话框里⑬。比如我现在要审批一个东西⑲,他直接在 LLM 把这个审批的按键调出来⑳。
海燕:不需要让你在一堆列表里找⑪。
东旭:这会很深刻地改变软件的产品形态⑮,它不再是一个网站或者 APP❷,你可以认为它是一堆散落在各地的小的 tools⑮。
海燕:改变主要是交互层面⑮,还是别的地方❷?
东旭:交互层面就是最重要⑤、最大的创新①,这种创新远比我们想象中带来的意义要大▓。
海燕:还是用车来打个比方:应用软件日后就得变成自动的了⑱,就别让用户学开车了⑰,人从不会开车到会开车是要专业培训⑥,要考驾照才能上路⑬,而且还不一定能开得好①,说不定还要吃罚单②。车也是一步一步进化到全自动驾驶的⑥。到了L2 时代❷,可能已经解决了一些问题②,比如自动泊车⑮,不用每次停车的时候都为难倒不进去怎么办⑪?自动泊车功能就帮你倒进去了⑳。这可能只是先帮你解决一些开车不自信的问题⑦。等有一天达到 L3 甚至 L4 级别了⑨,使用车更多地变成了人和机器的一些基于人的自然习惯的交互③,比如用语言去命令它:我今天就要去哪到哪①,根本不用再碰方向盘了▓,很可能那时候车都不一定再有方向盘这个东西④,对吧⑥?
东旭:这一点上我大方向认可⑪,但是有一个小小的 comment⑰。还是用车来作一个例子①,我不觉得完全自动好▓,除非全世界所有的车都被强制规定自动驾驶⑧。
海燕:不仅得规范车❷,还得规范人⑪。
东旭:没错⑳,如果 human 还 in the Loop⑫,对于产品设计有一个很重要却被很多公司容易忽略掉的要求①,很多时候不是越自动越好⑲,而是你给我的结果要具备一个人能理解的可解释性⑬。什么意思呢⑨?比如自动泊车⑦,对于人来说⑱,如果你在车里▓,你其实更希望看到方向盘是怎么动的⑨,以及给我个 plan❶,我去确认①,就是 human 一定要有一个 under control 的结果❸。
海燕:这让我想起 DeepSeek R-1 的巨大创新就在这里⑱。
东旭:把思维链展开给你看⑳。
海燕:让 AI 告诉你⑮,它是怎么分析和解决问题的⑬,它把思维链展开给你看了⑦,这个交互本身就是非常非常破圈的一点④。
东旭:对⑲,所以为什么我觉得交互的改变意义深远⑲,现在不管怎么样⑫, AI 还是为人服务的⑳,而且大语言模型有一个非常大的问题②,就是可解释性⑥。为什么我说 Deepseek 是一个特别重要的时间点⑳,就是因为在那个时间点之前⑳,你所有用 LLM 做的东西⑭,可能最后的结果还是不具备可解释性的⑨,是个黑匣子①,大语言模型拍脑袋说啥就是啥⑨。但其实在 Reasoning model 普及以后⑯,你对于 AI 输出的结果▓,是可以去做审核和判断的⑭,而且就算发现有问题⑱,你也可以随时接管⑬。所以现在包括 Cursor 等比较成功的 Agent 应用③,都是会把人当成整个软件的一部分④。
海燕:所以挺有意思⑳。换句话说①,其实 L3 级别的自动驾驶①,反而是相当长时期 stay 在那里的一个形态⑮, L3 其实就是 Copilot 方式的存在❷,它在绝大部分情况下❸,都是不需要去接管的⑯,但在必要的时候用户可以随时接管⑥。回过头来说⑪,Agent 也不是用来替代软件的⑯,而是会变成软件机制的一部分⑤,这是我们对应用软件的一些畅想或者期待⑬。
我觉得 Infra 软件和 PingCAP 做的事就更接近了⑨,因为应用软件是面向用户的❷,所以可能 AI 时代一个重要的革新③,其实就是在交互层面⑱,怎么把这种可解释性❷、自然语言的交互习惯⑪,包括怎么让用户能更容易上手⑩,降低使用的门槛⑲?在这方面②,你作为从业者⑦,对于基础软件在 AI 时代有哪些观察和心得❸?
东旭:基础软件里面我觉得最重要的几个东西⑦,我先说数据库④,因为我们自己就是做数据库的⑨。第一个结论是我们越来越重要了②,我们最近这两年的增长⑬,还是比较 promising 的⑪,这里边一部分的原因⑬,尤其在一些新的 workload 里③,大多数都是跟 AI 相关的⑰。我觉得从客户的角度来看③,第一个心态就是以前很多数据❶,用户因为不知道怎么利用⑲、分析❸,像用 Snowflake 跑跑报表❶,最后给 CEO 看一看大图就完了⑱。
以前像 OLAP 数据仓库的很多应用场景⑯,其实就是给数据分析师或者领导写报告⑧。但是仔细想一想❷,就是因为我们没有办法对这种海量碎片化的数据去提取⑪、利用⑬,我才有了做 ETL ④、Transform❸、Load⑥,涵盖了将数据从一个数据源提取出来⑮,经过各种处理和转换⑳,最后加载到另一个数据源的全过程⑫。)做这种大数据的动机①,因为我需要从数据的整体去看②。
但今天我觉得 AI 提供了一个 possibility②,就是我对每个人的所有的数据①,都可以很好地利用起来⑮。所以第一点⑯,很多企业对数据的心态就是先甭管这些数据存储成本怎么样⑦,我先把它存下来③,因为所有数据都会有用⑥。
海燕:就是数据的价值提升了⑮,或者说开发这些数据成为可能⑩,导致数据的价值提升了⑬。
东旭:对于数据的存储需求❷,是在提升的⑲。我们也有预判⑱,在云上如何给用户提供一个低成本▓、无限拓展性的版本⑬,这是一个很重要的 topic⑳。第二⑧,对于数据我觉得很重要④,也是我最近的一个思考:过去我们做数据库或者做数据的接口⑮,目标人群是开发者⑲、DBA 或者数据分析师❸,他们有个共同点⑳,都是人⑫。但在 AI 尤其 LLM 或者 Agent 的时代⑭,我作为一个数据软件接口的设计者⑫,我要考虑我的用户可能不一定是人⑤,我的用户可能是 LLM⑨,可能是大语言模型⑫。
海燕:就是访问数据库的⑲,不是开发者③。
东旭:对❸,是 Agent⑰,在这种情况下⑪,如果按照传统思维去设计系统▓,会非常非常奇怪②。举个例子⑤,像 Snowflake 或者数据仓库的公司❸,很强调自己的数据 ETL 能力⑦,要把数据来回掰扯⑱,变成一个报表②,或者一些抽象数据的 insight⑧,好让大家去做分析⑯。
但试想一下⑪, AI 在访问你的数据时⑧,如果你给它的是一些被处理过的数据❷,或者是一些你自己通过大脑想出来的⑩,我觉得 AI 应该用我的 open 数据的 API 去封装⑩,其实反而是不好的②。相当于你给 AI 一个报告⑧,它只能回答这个报告相关的上下文的东西⑭,一旦你问的问题超出了报告的边界⑱,它就没办法回答了⑳,因为你没有给它足够的数据❷。所以对于 AI 来说❷,我自己实践过最好的办法⑳,就是直接给它开放原始的数据访问权限⑳,同时再给它一个足够 flexible 的访问数据的方式⑬。
SQL⑳,我最近做的思想实验是想象我自己是一个 AI Agent⑯,为了回答我的“老板”——我的人类主人的一个问题⑧,比如他问:最近 Top10 的销售是谁⑧?因为我只是拿到了这个需求⑬,同时底下是一个类似 Salesforce 的拜访记录④,一个原始数据⑦,最方便的办法就是我通过把“主人”给我的需求⑭,变成一个对原始数据库的 SQL 的访问⑱,这样我就可以得到一些实时的数据⑲,然后再根据这些数据去做总结⑮,有点像过去人类数据分析师干的事情⑮。比如老板提了一个要求❶,数据分析师回去搞报表②,只是现在用 AI 来实现刚才的场景③,变得每个人都可以做❸,而且非常轻量⑲。所以⑳,最后我得到的结论就是:SQL is still the best thing we have②,SQL 现在仍然是我们跟 AI 以及数据之间最好的桥梁❶。
第二❸,以前其实有各种各样的 database 或者 data infrastructure❸,这些 data infrastructure 如果是站在 Agent 视角③,它对于数据的烟囱和孤岛是很讨厌的⑨。如果这些数据都在一起⑫,我用一条 SQL 就能关联起来⑫。但如果是在孤岛⑨,这边一个向量数据库⑫、一个文档数据库②,那边一个 SQL 数据库⑯。
海燕:相当于我要翻很多墙才能完成工作⑳。
东旭:所以我觉得 Infra 的归一化也是一个特别大的趋势⑧。
海燕:我尝试以用户语言或者业务语言理解下你刚才说的内容❷,过去应用软件服务人⑥,它是直接面向用户的⑭,用户使用应用软件❶,应用软件调下面 Infra 这一层⑳,应用软件是以开发者为中心去做的⑫,对吧⑫?
东旭:对⑫,开发者写“死”了▓。
海燕:刚才咱们提到其实应用软件更像 L3 的智能驾驶⑨,把过去很多的用户操作变成了智能化的自动操作⑪。本质上是把很多 Agent embed 到它的应用软件里面了②,代替了用户人手一条一条去点开⑬、执行②、找界面❶、找对应的空去填⑬。换句话说⑨,现在应用软件很大一部分是由各种各样的 Agents 构成的⑪,所以过去的用户访问数据库或者开发者访问数据库⑬,就变成了大量的 Agents 在访问数据库③。
有点像过去非智能驾驶时代⑩,它是油车⑤,支撑车的是内燃机发动机②。但现在完全不一样了③,因为现在车要获取很多传感器数据去做实时的智能判断⑩,然后再把指令给到发动机电机去驱动车往前走或者停⑥。换句话说⑳,Infra 的用户变了⑦,不是开发者⑭,不是人⑦,是 Agents⑭。因此 Infra 也要面向新的用户层去设计⑦、改变❶。刚才你提到的有一条很对⑤,就是统一数据库更重要⑧,而不是分散的⑨、小的⑥、各种各样的数据库拼凑的整个 Infra 底层⑳。
东旭:对❸,另外一个就是接口⑫。接口一定要用一个统一❶、通用⑱,以及 AI 跟人都能理解的语言去访问数据⑩。现在最好的语言就是 SQL④,因为第一❷,SQL 是一个标准的语言⑥,AI 训练了这么多年⑱,用的就是它⑱;第二⑥,SQL 又是一个精准的语言⑩,SQL 写对了⑰,一定能够捞出数据可解释⑨。第三❸, SQL 也是可以被人类读的④,比如刚才我给你看的那个例子⑦,我想看公司最近前 10 名的销售❸,它给了我一个列表①,告诉我这个列表是根据 5 条 SQL 跑出来的⑦。
总之⑱,最重要的就是记住一条:AI 时代要面向 Agent 或者面向 LLM 去设计软件④,而不是面向人和开发者设计软件⑳,这可能是未来要面临的一个课题⑬。
第二个方面⑯,我觉得基础软件里很重要的一个 category①,就是操作系统⑫。虽然我不是做操作系统的⑰,但我觉得它会发生很大的改变⑪。
操作系统以前是一个在硬件和用户中间的东西⑯,相当于它把硬件的抽象给隐藏起来⑩,对上面的应用软件提供标准的接口⑤,程序员再利用这些 System API 去做应用⑭。比如我画一个窗口⑪,其实跟我刚刚说数据库是一样的逻辑⑲,未来System API 硬件封装这层肯定要做⑥,但是再往上去提供操作系统本身能力的时候⑨,一定要考虑到它的消费者或者用户不再是应用开发的程序员了⑫,而是 AI agent⑰。
所以刚才我提到像 CRM 软件⑬,未来是能够把它所有功能拆成一个一个小块⑳,然后在对话框里通过对话跟 LLM 的交互⑩,让 LLM 能够把相应的能力变成一个对话中的小block③。类比到操作系统里❸,其实这个工作在硅谷已经有一些创业公司在做了⑥,最近这两天有个融资的项目▓,他们的 vision 就是做一个面向 AI Agent 或者 LLM 的浏览器⑳。未来❷,浏览器可能会是一个很重要的操作系统⑦。
海燕:我也听到我们有一些 portfolio 在提这个想法⑤。换句话说⑲,云计算的时代也给 AI 打了个基础⑬。AI 让软件的形态发生变化⑮,其实是把过去自动化时代的一些事情推向了更加智能化⑩、更加小颗粒❶、更加简单⑫、更加 flexible⑭。是这样一个趋势❸,但并不是就抛弃了软件这个形态⑮。
东旭:不会抛弃的❶。我觉得软件尤其企业软件▓,真正的护城河有两个:第一⑱,就是我刚才说的这些企业里的 Know-how⑭,比如懂企业客户▓、懂场景❸,这些是 AI 很难理解的⑰。就像卖东西⑤,你不可能让 AI 来帮你卖东西⑲,至少现在还很难▓。
第二⑪,还是工程复杂性⑦,就是 LLM 作为单独的模块❷,它的复杂性是没有的⑩。比如现在千问3刚出来❶,Deepseek 刚出来⑤,你只要搭上个 Ollama ❷,之后暴露的 API 都一样❷,实际上没有什么差异⑭。
海燕:某种意义上⑯,工程的复杂性反而更高了⑤。
东旭:有点像企业软件或 SaaS 软件一样⑩。到最后我觉得 AI 真正有用的场景或者有用的东西⑭,一定是不简单的⑬。哪怕就想做一个 AI 自动帮你订机票的事③。
海燕:只是面向用户更简单了⑪,但反而把复杂的东西都留给了开发者⑪,或者说留给了专业建造者②。
东旭:是的③,所以我觉得还是有门槛⑤。就像海燕刚才说的⑬,AI 就像整道菜的一把盐⑤,能够把这个菜变得更好吃⑯,但它还是那道菜⑳。
海燕:那你觉得日后企业客户的独有数据这个事还重要吗②?
东旭:当然重要⑤。
海燕:以后一定会有越来越多的独有数据⑬,还是反而会打破数据的藩篱②,有更多的公海数据呢⑪?
东旭:这点我稍微有点悲观⑫。因为大家现在都知道⑰,包括所有的大厂其实都已经知道数据的价值⑰。老实讲▓,以前做一个很好用的软件⑨,反正用户的交互数据如果没用就扔掉了⑧。但现在所有的大企业⑯,只要在有用户交互的点上❶,那都是兵家必争之地了⑥。数据才是未来企业最高的护城河❶。
海燕:换句话说①,面向企业的软件工具⑥,本质上还是有三个原因⑨,导致它不会被通用的所谓的 Agents 或者大模型给吃掉:一是对它所在场景的一些独有的理解④,就是行业 Know-how 或者客户 Know-how⑭;第二是工程复杂性⑮,在 AI 时代面向用户越简单❶,后面对工程复杂性的要求越高⑫,所以需要一些专业服务⑨;第三是如何帮助企业客户用好他自身的数据❷,因为数据反而更大了❷。
东旭:数据的价值更高了⑥。
海燕:所以每个企业都想保护好自己的独有数据①。
东旭:我用大白话来打个比喻:如果你不给大模型任何数据⑰,它只是像一个哲学家一样跟你讲点大道理⑰,怎么能跟“你”产生关系❸?只有数据⑲。我觉得大模型要变得有用③,有两点必不可少:一个是模型本身的智力④,就是通识⑥;第二是 context⑦,你的 context 越精准⑨,这个东西就越有用⑱。所以在这点上⑳,我觉得企业之间的壁垒会越来越大❸,但是在企业内部⑬,数据打通会越来越通②。
海燕:我觉得你刚才提出来的关于数据库的那一条⑪,有可能成为新的下一代数据库⑬,很快人人都会说⑮,但这个独有观点是咱们提出来的⑯。
东旭:我三年前就这么说了▓,大家还不信⑩。
海燕:2019 年你们提 HTAP⑧,后来提 Serverless❸,包括 2017 年就说要做全球化⑩。希望像东旭这样一直拥有独立思考的人⑧,能不断地去引领这个行业❷。
感谢东旭来「牛白丁」做客⑭,那我们今天就聊到这里❷。
东旭:谢谢海燕❷,很开心来聊天⑤。
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可④,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑫,非常欢迎各位朋友分享到个人站长或者朋友圈⑪,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑤。
很赞哦⑬!
相关文章
随机图文
每体:下轮巴尔德有望重回巴萨首发⑫,滕森可能搭档阿劳霍双中卫
尽管当时皇马公开表示安切洛蒂可能再留任一年①,但实际上⑮,安切洛蒂对即将发生的事情心知肚明⑲,并在国王杯决赛后与巴西达成协议②,但由于当时皇马仍在争夺西甲冠军⑮,他并未立即签约⑦。这让巴西足协感到不满②,但协议并未三峡集团漂浮式海上风电制储氢系统完成 720 小时实海试验
董 事 会⑳、2025年5月14日兰帕德:恭喜桑德兰⑥,但我们才是两回合比赛中表现更好的一方
此外①,库尔德工人党内部派系林立⑳,部分人员仍可能不听指挥⑳,拒绝履行和平协议⑮。这可能导致双方关系再度破裂⑮。1-3落后⑪!阿特金森:米切尔赛前决定是否出战G5 真心希望他能打
特别声明:以上文章内容仅代表作者本人观点▓,不代表新浪网观点或立场⑨。如有关于作品内容⑪、版权或其它问题请于作品发表后的30日内与新浪网联系⑬。特朗普说将下令解除对叙利亚制裁
中国儿童艺术剧院党委书记张彦胜告诉记者:“孩子的天性是超越国界的语言❸。我们希望借助这个机会③,把中国文化介绍给摩洛哥人民③,把中国的故事讲给他们听⑳。”曝小米汽车上周销量5180辆 环比下跌 低于理零问鹏
首先⑲,在该博主此前帖子中显示了⑱,他的风洞测试是有人赞助的⑤。要知道⑧,普通的汽车博主也最多就是驾驶测试⑳,还有一部分和修车行有合作的⑨,能够进行汽车内部结构的研究⑮。上升到风洞测试的⑲,不说绝无仅有⑲,我们看到的这填补行业空白⑲,太钢集团首发两款“手撕钢”产品
张和平带领团队从2018年起开展“乳酸菌万株基因组项目”▓,通过对乳酸菌基因组测序▓,解析菌株功能⑭,挖掘菌株特性⑰。你好⑩,双拥城|太原:汾水同舟共锦绣
具体内容详见公司分别于2025年4月22日和2025年5月14日在上海证券交易所网站披露的《杭州当虹科技股份有限公司关于变更回购股份用途并注销暨减少注册资本的公告》⑫、《杭州当虹科技股份有限公司2024