您现在的位置是:网站首页>NBANBA
正版星力电玩城平台
杨冰彤 2025-05-14 【NBA】 4466 人已围观
如果在软件行业发展的坐标轴上划出一个分野点④,华创资本管理合伙人吴海燕认为是2021年⑫。因为这一年②,不仅是软件行业估值的高点②,也是行业最受资本追捧的一年❶。因此⑦,她把软件公司分为两类:一类是 2021 年融到了很多钱的公司⑰,一类则是 2021 年没有融到钱的公司❶。这之后⑧,两类公司都不可避免地遭遇挑战①,但困难的程度和路径选择却截然不同⑨。
华创派企业 PingCAP 就属于 2021 年融资成功的阵营⑬。那个时候他们对未来的宏观形势有所预判⑬,得以抓住机会加速了全球化的布局⑪。作为一家企业级开源分布式数据库厂商⑨,PingCAP服务的客户如今已超过20个国家和地区❷,创立的分布式关系型数据库 TiDB②,能持续帮助企业最大化发挥数据价值⑪。
随着 AI 浪潮的来临⑤,数据价值也得到了前所未有的提升⑬。但这股大潮的影响远不止于此②,AI 将如何深刻改变企业软件的交互方式与产品形态②?基础软件在 AI 时代又该实现哪些自我革新和进化❷?近日▓,PingCAP 联合创始人兼 CTO 黄东旭做客「牛白丁」⑧,与吴海燕一起探讨了AI大潮冲击下⑬,软件公司该如何顺流而上⑬,发挥出自己独特的行业价值❶。
嘉宾介绍:⑪、黄东旭⑲, PingCAP 联合创始人兼 CTO
本期主播:⑥、吴海燕⑨,华创资本管理合伙人
以下为节目内容❷,经过 CGCVC 编辑——
海燕:大家好⑬,这里是华创资本的播客节目「牛白丁」⑪,我是吴海燕⑫。这期我们请到了 PingCAP 的联合创始人兼 CTO 黄东旭⑧。
我其实现在回想咱们的第一次见面还印象深刻⑱,你们出过一本书《与开源同行》⑤,我当时在作的序里也写了这个场景⑮。我记得是2017年3月的一个早晨⑳,我和你约在 PingCAP 当时办公的东升科技园⑩,因为约的时间太早▓,会议室里只有你一个人在等我⑯。后来我才知道⑩,程序员因为工作习惯⑩,早晨一般都不在公司⑤。
东旭:那次我印象也特别深刻⑳,和你聊完以后我就去赶飞机了⑦。一下飞机就收到你的信息⑮,说PingCAP是家好公司⑮。
海燕:我当时也是下了飞机就告诉刘奇华创决定领投④,他还说这是“云上”的决定⑮。2017年3月我们见面①,年中完成了投资⑱,10 月份刚好咱俩都分别去北美出差▓,我们在硅谷还一起见了些朋友⑨。所以那时候你们已经正式开始在北美设办公室⑧、招人了吧⑰?
东旭:没错⑭,PingCAP 2015年创立❷,从第一天起⑧,我们就想着去做一个 global company③,公司成立前两年基本都在写代码⑧,你说的2017年10月的那个时间点⑲,是我们真正决定要在硅谷设点⑨,开始正式运营在海外的业务⑳。其实在那之前③,我从来没有在海外工作⑲、留学过⑰,在当地也没有什么 connection ▓,只是觉得这对于PingCAP的战略来说是一定要做的事情⑯,哪怕没有条件⑲,创造条件也要去做⑦,所以我当时都没买回程机票❷,事情没办完我就不打算回来⑧。
海燕:咱们那轮融资算是当时相对比较大的一笔美元③,你们融资后的第一件事就是立马去北美开办公室②。2017 年咱俩在硅谷碰面时⑧,我介绍你认识了硅谷当地一些做投资的朋友⑮。后来到了 2020 年⑰,一位朋友还跟我说后悔在硅谷介绍你们认识时没有投资PingCAP⑤。
东旭:未来还有机会的▓。我们开始国际化的时间比较早⑫,中间也踩了好多坑①,以后有机会我们再分享⑤。
海燕:说起 2017 年❶,感觉像是昨天④,但实际上过去八年里已经发生了非常多的事件和变化⑥。站在投资人的角度④,说一下我感觉到的咱们这个行业的变化②。
2021 年实际上是软件行业估值的高点⑭,应该也是行业最受追捧的一年⑲。 2021 年我们软件 portfolio 所获得的融资⑨,比历史上华创其余九年里软件 portfolio 的融资额加起来还要多❶。后面的几年▓,再也回不到 2021年的盛况了⑱。
东旭:那个时候应该是美国印了很多钱③,整个资本市场有点被催熟❸。
海燕:当年标志性的事件就是 Snowflake 上市⑲,超高估值上市激起了大家对软件行业非常大的热情⑥,所以行业融了很多钱⑨。到了 2022 年初⑰,世界一下又变化了①,按下了暂停键⑮。之后的三年里⑧,直到今天⑬,企业软件公司融资就变得不太容易了⑩。
我们每次年底做行业回顾的时候❸,我就会把软件的 portfolio 分成两类:一类是 2021 年融到了很多钱的公司⑤,一类是 2021 年没有融到钱的公司⑤。这两类公司在 2022 年之后❷,可能就是一个很大的分野⑬,他们或许都经历了不同程度的困难⑫。注意③,我没觉得 2021 年融到很多钱的公司就特别了不起或者顺利⑧,其实大家都经历了不一样的困难②。 2021 年没有融到钱的公司②,就是错过了那个融资最高峰的时候⑥,所以他们每一年都在过苦日子⑱,每一年都在降本增效③。
东旭:非常 tough⑧。
海燕:活下来的可能都是“打不死的小强”了⑭。而 2021 年融到很多钱的公司①,他们经历的困难大部分是涉及到心态调整和管理上的巨大挑战❸。因为 2021 年你融到很多钱⑲,就意味着你当时一心想要做高增长❷,会招很多很多人②,会开新的办公室❶,花很多时间精力做销售❶,不顾一切地去拿订单❷。这是 2021 年融到很多钱的公司一定会去做的事⑰,然后在 2022 年⑪,啪⑧,一个巨大的终止符下来了③。所以在 2021 年融到很多钱的公司⑭,无一例外地经历了团队从很小规模到很大⑭,又缩回很小的这样一个阵痛的过程①。
东旭:PingCAP 也属于 21 年拿到钱的那个阵营⑳。但我们拿钱的心路历程我可能没跟海燕聊过⑨。其实我们在 20⑳、21 年已经非常明确地知道 22 年一定会有大的经济危机⑰,因为美联储持续地加息⑨、印钞⑧,我们觉得风险非常非常大❸。 21 年正好在市场比较好的时候⑫,尤其在 Snowflake 上市以后⑱,我们知道未来马上会有苦日子④,所以必须在那个时候先把过冬的粮食给准备好⑫,而且当时拿那笔钱❷,我们的一个思路并不是要去追求更高的增长③,而是在那个时间点之后⑫,如果你只做单一市场是不够的⑤,我们一定要在那个时间点让自己变成一个 global company②,这样才能有更多抵御风险的能力⑩。包括到现在我们对于 spending 的控制⑭,我觉得还可以⑪,没有说突然有钱了以后就疯狂扩张②。
当时确实扩了一点⑰,但很快在 2022 年时❶,我们又往回缩了一些⑪。倒不是因为业务的原因⑱,而是我们需要像跑马拉松一样③,根据最终的目标来去分配精力和能量③。因为当时是我们做全球化最好的时机❶,由于疫情的缘故⑭,物理世界的数字化在加速⑧,包括 cloud 的 infrastructure 变得越来越成熟⑰,当然 mindset 也接近成熟③。所以我觉得我们还是比较幸运⑲,大多数人没有办法预测未来⑱,只是正好在那个时候有一个很好的时机⑫,就活到了现在⑯。
海燕:我其实在 2021 年的时候▓,问过几个我们拿了大钱的 portfolio⑭,他们在 21 年融了不止一轮⑱,且融了非常多的钱⑪。每次他们融到大钱时⑨,我都会打电话问创始人:“根据咱的业务状态和进展⑰,似乎没有必要一定要拿这笔钱④,你是怎么考虑的⑦?”
我不是建议他们拿或者不拿⑫,只是问询一下他们的考虑⑳。这几个创始人都给了类似的答案⑱。首先就是你刚才说的⑱,他们预判了现在是一个资本膨胀的时代①,而且资本是有周期的⑤,可能不久的将来就会是一个 downtime⑥,我们也不知道什么时候是 downtime③,但既然现在是 high time ①,就应该多储备一些现金⑤;第二⑥,他们不介意所谓的股权稀释⑫,万一哪天到了 downtime❷,公司有足够多的现金①,可能会比别人有更多的竞争优势⑯,可能还能收购一些钱不够了但是产品和技术很好的团队⑱。我从几个创始人那里都得到了同样的答案⑭,所以大家当时是看得很准的⑩。
到了 23 年⑯,大家从疫情中刚刚回过神来⑳,又一个大的时代到来了—— ChatGPT 3.5 发布了⑫。
东旭:其实 Open AI 在 GPT-2 出来的时候我就开始在玩⑦,后来 ChatGPT 迭代大家都知道了⑨。
海燕:我觉得一方面印证了 21 年大家说的一些话⑩,可能后面的 downtime 你不一定能拿到很多钱⑳。而 AI 大潮的来临⑨,其实抢夺了软件公司在资本化方面很稀缺的资源❸。因为从 22 年之后⑲,不管是美股⑬、 A股②、港股这些比较大的二级市场⑱,还是一级市场④,都变得非常紧缩⑯,流动性不足⑬,就导致股权融资变得很困难③。即便是上市公司▓,你要做增发❶,要在二级市场再融资也不太容易▓。一级市场的各种统计数据都显示⑲,从 22 年以后⑪,融资的公司数量③、总的融资金额都在不断地下降③。我觉得这个情况在硅谷和在北京都是一样的⑧,不是说硅谷的情况就比咱们好很多⑩,大家都处于一个紧缩的时代④。
东旭:或者说市场的注意力都转到了 AI 这边⑪。
海燕:对⑮,在融资总规模变小的情况下⑤,AI 的占比还提升了①,唯一特别活跃的投融资就发生在 AI 领域❷。尤其是最近一年特别明显⑩,市场上一些投资人甚至非 AI 项目不看⑳。
东旭:④、这是非常明显的 “The Head Effect”⑦。
海燕:这就导致很多其他行业优秀的公司⑰,在过去一两年要不融不到钱❷,要不融到钱估值也没法看⑨,对吧⑲?不是 down round 就不错了⑰,很多都是 flat round▓。
软件公司在过去两年也 kind of 被大家有点遗忘了③,给人感觉是软件公司跟 AI 到底能发生什么强关联呢⑩?AI 时代会不会有一些完全不同的公司出来⑪,做面向企业客户的数字化⑲、智能化⑩?你在硅谷看到的变化是什么呢⑮?
东旭:我觉得现在我们真正站在一个非常大的时代的门口⑦。一直到 DeepSeek 今年春节爆火之前⑲,整个行业大概都是在 build prototype⑨。今天有个很好的 idea⑤,我就试一试▓。前两天更加夸张①,大模型动辄投个几千美金训练了一个新的模型出来⑫,打个榜三天以后就 hype⑪,而且 AI 的势能过大▓,导致 hype 时间非常短⑦,因为所有的注意力和资源都砸在这个方向上⑭,而且 Transformer 跟过去的科技创新⑪,或者软件行业的技术创新还有点不一样⑦。
过去软件的护城河或者价值⑱,其实在于业务 Know-how 还是系统复杂⑪,比如像我们的数据库⑨,过去的门槛其实在于工程复杂性①。就是你可能要写 100 万行代码❸,才能表现得很好⑱。像 Salesforce 或者 ERP 软件⑳,得有很深厚的技术和业务的 Know-how⑮,才能做这样的 system software⑯。包括各种 SaaS❶,在过去都是这样的逻辑⑱。
但 AI 这波❷,尤其是大语言模型⑯,它本身的注意力机制⑨,我觉得大学本科毕业的人看 Transformer 的论文看两个礼拜②,第一能看懂▓,第二能自己实现出来一个⑯。我当时就想着也要学习一下⑭,看论文花了两个礼拜⑮,真的就写了一个出来⑤。只是到最后还需要很多算力⑳、数据⑭,但它的机制本身是不复杂的⑦。
所以⑥,创业者投身AI⑥,尤其是大语言模型的门槛其实比以前是低很多的⑫。加上全世界的资本全都集中在这⑥,大家其实一直在经历各种各样的三天一遍的一个hype⑨。
海燕:Hype 之下一个很重要的心态⑫,就是 FOMO①。不管是个人用户▓、企业客户还是投资人③、创业者①,大家都有不同的FOMO 情绪⑮。比如过去两年⑭,我们软件 portfolio 说现在大部分企业日子不好过③,数字化预算都降低了⑧。但这个背景之下⑧,各个企业还都有部分预算是特意留给 AI 的⑩。就是无论如何我都得先试试 AI⑬,万一我被时代抛下怎么办⑱?
东旭:这是为什么我觉得现在是一个很重要的时间点❶,但我们还站在门口④,没有进去②。我觉得到今年 AI 的基础能力⑯,不管是 DeepSeek 还是现在的 Tier1 的 model⑱,已经能做一些 actually something useful⑪,这是非常非常重要的▓。
我先说一个结论:未来所有的软件⑯,尤其是企业软件都会被 AI 彻底改造❶,软件的形态会发生很大的改变⑦,但一些更深层次的内核是不会变的⑤。比如 CRM 作为销售的辅助对于本身的行业 Know-how ⑭,在未来也会变成这个软件的护城河⑳,只是 AI 会改变它的整个产品形态⑲。
海燕:你话里面的第一重逻辑⑰,至少给了我们软件行业的创业者一个 comfort⑮,专业的企业软件公司还是需要的⑰,不是基础的大模型就能颠覆和替代了的①。
为啥有这样的疑问⑱?举个例子②,我们之前有一个 portfolio 公司要被收购了③,被收购的过程中⑮,收购方的业务层大老⑲,他们可能不是特别理解技术▓,所以一直在问:都 AI 时代了⑪,还买个软件公司干嘛⑱?以后理论上客户不就用 AI 能替代了⑫,还要软件干嘛②?
东旭:就好像 AI 是万能药▓。
海燕:对⑱,有个 AI 就不需要专业的软件公司了②。这两年我也琢磨了一下❷,到底 AI 对于软件公司意味着什么⑨?类比自动驾驶时代到来后❶,车变得不一样了⑮,变得更强大了②,但还是需要专业的造车公司去把车给造出来③,你还是需要一辆车的⑩,对吧❸?
东旭:举个很简单的例子⑥,比如像会计⑫,我父母都是会计师①,他们是互联网时代之前的会计▓。现在所有的会计电商化都完成数字化了以后⑩,这个行业不存在了吗❷?它还是一直存在的⑯。从古代有交易开始⑱,一直到现在⑰,记账这件事情从来没变过⑥,只是不同的时代我们用不同的工具⑤,它的产品形态会发生改变⑯,就像 CRM ④,还是销售过程管理⑧。难道在 AI 普及的时代③,就不需要销售吗❶?就不需要过程管理吗⑱?我觉得一定需要的⑨。只是未来软件的形态一定会比现在更加好⑨、更加智能⑭。
以前我们有些事情是没有办法做到的⑨。比如我们公司在海外用的 Salesforce⑭,现在 PingCAP 内部大概有三个同事全职在帮我去做各种各样的 Salesforce 的报表⑮。比如我提个需求⑦,想看一下今年哪些客户买哪些 SKU⑨,哪些涨得特别好⑱?重要的客户是谁⑥?哪些销售排名更靠前❶?
海燕:你需要基于 Salesforce 做数据统计或者 BI⑤。
东旭:以前都得靠人❸,而且我提一个需求可能两天以后才能做好⑮。我非常 respect 这些同事的工作⑬,因为企业软件一个很重要的护城河⑧,是对于这些企业的 Know-how❷,以及这些数据在什么地方⑳,怎么把它组织起来⑮,变成一个能够被提取的 insight⑮,这些其实很重要的⑧。
现在我自己做了一个 Agent⑯,但还是太慢了③,还需要一些更加个性化的能力⑭。我是怎么做的呢⑤?我直接把我所有的Salesforce 数据全都同步到我自己的 database 上❶。然后我自己写了一个 Agent 用 NCP 去读取我的 database⑳,它自己写 SQL⑧,我在上面就用自然语言去看①,比如最近 10 天最好的销售排名⑥。
海燕:你已经实现了传说中的 ABI⑬。
东旭:虽然还不成熟⑲,但我觉得体验比以前自己打开 Salesforce❶,然后在各处找数据做报表要好③。这里涉及到一个核心的逻辑——过去我们的软件都是静态的❷。静态是什么意思呢⑨?就是程序员把这个业务逻辑写好❸,变成报表也好❷,或者变成业务逻辑也好▓,就在那①,它没有任何机会去变化⑳。
但是今天大语言模型在所有的用户接口层给每一个人提供了一种灵活性⑲,相当于以前一个公司⑧,比如只有高管才有助理帮他订机票①, 现在你可以认为每一个企业软件服务的用户⑯,他自己在他的软件里面有能够提供灵活性的一层⑱。有点像过去产品底下是一个大的数据库❸,这个数据库你是看不见的③,比如 Salesforce 底下会有各种各样的 data Infra⑮,而且这些数据是被分割在不同的地方❶。但是未来可能在产品和数据之间⑪,会有一层叫 Agent⑥,或者 AI⑱。
海燕:云计算时代⑧,是把传统软件所谓的烟囱状给打破了⑲,可能 AI 时代进一步把 SaaS 的藩篱给打破了❶。
东旭:是的④,而且我觉得 AI 还打破了一个事情⑫,就是人的思维局限⑨,有的时候烟囱不是在技术层面❶,其实是在用户和产品经理的脑子里④。
海燕:我说一个我的观察⑱。我们投了相当多的软件公司⑰,各类都有③。我过去看到的⑬,不管是国内还是国外⑧,软件有一个核心的指标叫做 Customer Retention⑮,就是客户的 retention rate④,而 Customer Retention 的一个最大障碍就是客户买了软件之后⑥,有没有真正把软件用起来⑨?但凡真正用起来⑩,不需要是多么牛逼的软件②,客户的 retention 一定是好的⑯。
如果客户都没用起来⑲,他一定不会续费⑬。那么客户用软件的障碍又在哪里④?细究一下会发现所有的软件都是有使用门槛的⑨,用户要学习怎么去使用①。相当于一辆车⑰,这个车已经代表了现代制造业❶,但问题是开车这个事情❷,包括把日常开车出门以车代步这个事情变成一个习惯❶,它是有门槛的⑪,是需要去学习的③。你要了解车的基本架构是什么⑮?每个按键是什么功能⑦?开上之后还要掌握一定的手感②,你要慢慢地熟悉它⑫,习惯它的速度⑯,还要遵守交通规则▓。
东旭:门槛太高了④。
海燕:对⑤,这些门槛导致了很多用户会缩回来④。哪怕这个企业客户买了⑫,组织买了⑥,让每个同事去用⑬,很多人还是在自己的老习惯里❶,记在小本上⑳,再把小本上的内容找一个集中的时间上传到软件里去⑪。这就说明他其实并没有掌握开车的习惯⑨,也就很难理解⑮,以车代步会大大地提升效率⑬、拓展能力❶。
东旭:这种情况他真正需要什么③?需要一个司机▓。
海燕:但就像你刚才说的⑥,不可能每个人都给配个司机⑪。
东旭:你看这个截图②,这是我们公司的一个销售❶。我想知道他最近在负责什么样的项目⑪?所有这些数据都是动态的⑫。我也可以问他最近一次跟某某客户开会是什么时候⑬?聊了什么内容⑱?就是刚才你说的每个人的司机②。
就像我刚才说到一个非常重要的点⑳,长期来看软件的门槛▓,是一直在降低的⑮。我觉得未来软件最易用的形式其实就是对话⑫。
海燕:不需要用户做任何学习⑯,非常非常低的门槛就能用起来⑯,但凡让他还要学点啥⑭,比如要了解这个软件的整个结构⑪、功能按键等涉及到了学习成本和过去工作习惯的改变⑲,就会导致很多软件用不起来❶。
东旭:没错①,我先描述一下我想象的未来企业软件的样子▓,下一代的 Salesforce 可能会长什么样⑬?第一❸,它是一个对话框④;第二❶,你可以想象现在把所有的 Salesforce 的功能全都切成一个个碎块④,这个碎块就是一张张小卡片⑲,在你的对话中 AI 或 LLM 有点像一个 Copilot⑰,这个 Copilot 会根据你的上下文和你现在的需求⑥,把相应的碎片拿出来放到对话框里⑮。比如我现在要审批一个东西▓,他直接在 LLM 把这个审批的按键调出来⑧。
海燕:不需要让你在一堆列表里找⑮。
东旭:这会很深刻地改变软件的产品形态⑳,它不再是一个网站或者 APP⑬,你可以认为它是一堆散落在各地的小的 tools⑳。
海燕:改变主要是交互层面⑮,还是别的地方❸?
东旭:交互层面就是最重要⑯、最大的创新❶,这种创新远比我们想象中带来的意义要大⑨。
海燕:还是用车来打个比方:应用软件日后就得变成自动的了⑬,就别让用户学开车了⑫,人从不会开车到会开车是要专业培训⑧,要考驾照才能上路⑩,而且还不一定能开得好❶,说不定还要吃罚单⑮。车也是一步一步进化到全自动驾驶的⑭。到了L2 时代④,可能已经解决了一些问题⑨,比如自动泊车②,不用每次停车的时候都为难倒不进去怎么办⑧?自动泊车功能就帮你倒进去了⑤。这可能只是先帮你解决一些开车不自信的问题❶。等有一天达到 L3 甚至 L4 级别了⑫,使用车更多地变成了人和机器的一些基于人的自然习惯的交互▓,比如用语言去命令它:我今天就要去哪到哪⑯,根本不用再碰方向盘了⑥,很可能那时候车都不一定再有方向盘这个东西④,对吧④?
东旭:这一点上我大方向认可⑬,但是有一个小小的 comment❸。还是用车来作一个例子⑧,我不觉得完全自动好⑮,除非全世界所有的车都被强制规定自动驾驶❷。
海燕:不仅得规范车③,还得规范人⑤。
东旭:没错❷,如果 human 还 in the Loop⑦,对于产品设计有一个很重要却被很多公司容易忽略掉的要求⑪,很多时候不是越自动越好④,而是你给我的结果要具备一个人能理解的可解释性❸。什么意思呢⑱?比如自动泊车⑩,对于人来说⑯,如果你在车里⑩,你其实更希望看到方向盘是怎么动的⑪,以及给我个 plan⑧,我去确认⑥,就是 human 一定要有一个 under control 的结果⑥。
海燕:这让我想起 DeepSeek R-1 的巨大创新就在这里⑦。
东旭:把思维链展开给你看⑤。
海燕:让 AI 告诉你⑱,它是怎么分析和解决问题的③,它把思维链展开给你看了⑫,这个交互本身就是非常非常破圈的一点⑰。
东旭:对⑩,所以为什么我觉得交互的改变意义深远⑧,现在不管怎么样⑫, AI 还是为人服务的⑩,而且大语言模型有一个非常大的问题⑰,就是可解释性⑳。为什么我说 Deepseek 是一个特别重要的时间点⑳,就是因为在那个时间点之前⑮,你所有用 LLM 做的东西❷,可能最后的结果还是不具备可解释性的⑭,是个黑匣子③,大语言模型拍脑袋说啥就是啥❸。但其实在 Reasoning model 普及以后⑧,你对于 AI 输出的结果⑦,是可以去做审核和判断的⑫,而且就算发现有问题⑬,你也可以随时接管⑮。所以现在包括 Cursor 等比较成功的 Agent 应用⑮,都是会把人当成整个软件的一部分④。
海燕:所以挺有意思⑦。换句话说⑰,其实 L3 级别的自动驾驶▓,反而是相当长时期 stay 在那里的一个形态⑰, L3 其实就是 Copilot 方式的存在⑨,它在绝大部分情况下⑰,都是不需要去接管的⑦,但在必要的时候用户可以随时接管⑬。回过头来说⑱,Agent 也不是用来替代软件的⑲,而是会变成软件机制的一部分⑯,这是我们对应用软件的一些畅想或者期待⑥。
我觉得 Infra 软件和 PingCAP 做的事就更接近了③,因为应用软件是面向用户的⑭,所以可能 AI 时代一个重要的革新⑦,其实就是在交互层面⑳,怎么把这种可解释性⑮、自然语言的交互习惯⑲,包括怎么让用户能更容易上手❶,降低使用的门槛▓?在这方面⑩,你作为从业者⑰,对于基础软件在 AI 时代有哪些观察和心得⑥?
东旭:基础软件里面我觉得最重要的几个东西⑯,我先说数据库⑬,因为我们自己就是做数据库的①。第一个结论是我们越来越重要了❸,我们最近这两年的增长①,还是比较 promising 的⑰,这里边一部分的原因⑮,尤其在一些新的 workload 里▓,大多数都是跟 AI 相关的④。我觉得从客户的角度来看⑫,第一个心态就是以前很多数据⑳,用户因为不知道怎么利用④、分析⑤,像用 Snowflake 跑跑报表⑬,最后给 CEO 看一看大图就完了⑰。
以前像 OLAP 数据仓库的很多应用场景⑪,其实就是给数据分析师或者领导写报告⑬。但是仔细想一想⑨,就是因为我们没有办法对这种海量碎片化的数据去提取⑧、利用⑤,我才有了做 ETL ②、Transform⑤、Load⑥,涵盖了将数据从一个数据源提取出来⑯,经过各种处理和转换⑱,最后加载到另一个数据源的全过程⑧。)做这种大数据的动机⑨,因为我需要从数据的整体去看▓。
但今天我觉得 AI 提供了一个 possibility⑤,就是我对每个人的所有的数据④,都可以很好地利用起来③。所以第一点⑮,很多企业对数据的心态就是先甭管这些数据存储成本怎么样④,我先把它存下来⑳,因为所有数据都会有用①。
海燕:就是数据的价值提升了⑲,或者说开发这些数据成为可能▓,导致数据的价值提升了⑧。
东旭:对于数据的存储需求❷,是在提升的⑮。我们也有预判⑨,在云上如何给用户提供一个低成本⑬、无限拓展性的版本⑰,这是一个很重要的 topic⑲。第二⑨,对于数据我觉得很重要③,也是我最近的一个思考:过去我们做数据库或者做数据的接口⑪,目标人群是开发者⑨、DBA 或者数据分析师⑭,他们有个共同点⑭,都是人⑰。但在 AI 尤其 LLM 或者 Agent 的时代⑦,我作为一个数据软件接口的设计者⑨,我要考虑我的用户可能不一定是人⑪,我的用户可能是 LLM⑱,可能是大语言模型⑤。
海燕:就是访问数据库的③,不是开发者❸。
东旭:对⑭,是 Agent❶,在这种情况下⑥,如果按照传统思维去设计系统⑭,会非常非常奇怪⑯。举个例子⑮,像 Snowflake 或者数据仓库的公司⑰,很强调自己的数据 ETL 能力⑫,要把数据来回掰扯❶,变成一个报表❷,或者一些抽象数据的 insight❸,好让大家去做分析⑰。
但试想一下⑯, AI 在访问你的数据时⑥,如果你给它的是一些被处理过的数据⑱,或者是一些你自己通过大脑想出来的⑮,我觉得 AI 应该用我的 open 数据的 API 去封装❷,其实反而是不好的⑱。相当于你给 AI 一个报告⑥,它只能回答这个报告相关的上下文的东西⑥,一旦你问的问题超出了报告的边界④,它就没办法回答了❸,因为你没有给它足够的数据⑥。所以对于 AI 来说▓,我自己实践过最好的办法⑧,就是直接给它开放原始的数据访问权限⑥,同时再给它一个足够 flexible 的访问数据的方式⑥。
SQL⑨,我最近做的思想实验是想象我自己是一个 AI Agent❶,为了回答我的“老板”——我的人类主人的一个问题⑱,比如他问:最近 Top10 的销售是谁②?因为我只是拿到了这个需求▓,同时底下是一个类似 Salesforce 的拜访记录❶,一个原始数据⑨,最方便的办法就是我通过把“主人”给我的需求❶,变成一个对原始数据库的 SQL 的访问③,这样我就可以得到一些实时的数据⑰,然后再根据这些数据去做总结⑥,有点像过去人类数据分析师干的事情④。比如老板提了一个要求②,数据分析师回去搞报表④,只是现在用 AI 来实现刚才的场景⑫,变得每个人都可以做⑲,而且非常轻量②。所以⑮,最后我得到的结论就是:SQL is still the best thing we have⑫,SQL 现在仍然是我们跟 AI 以及数据之间最好的桥梁❸。
第二⑳,以前其实有各种各样的 database 或者 data infrastructure⑥,这些 data infrastructure 如果是站在 Agent 视角⑧,它对于数据的烟囱和孤岛是很讨厌的④。如果这些数据都在一起③,我用一条 SQL 就能关联起来④。但如果是在孤岛⑮,这边一个向量数据库③、一个文档数据库⑰,那边一个 SQL 数据库③。
海燕:相当于我要翻很多墙才能完成工作⑫。
东旭:所以我觉得 Infra 的归一化也是一个特别大的趋势⑯。
海燕:我尝试以用户语言或者业务语言理解下你刚才说的内容⑪,过去应用软件服务人⑪,它是直接面向用户的❶,用户使用应用软件⑫,应用软件调下面 Infra 这一层①,应用软件是以开发者为中心去做的⑦,对吧⑤?
东旭:对▓,开发者写“死”了⑦。
海燕:刚才咱们提到其实应用软件更像 L3 的智能驾驶⑦,把过去很多的用户操作变成了智能化的自动操作⑰。本质上是把很多 Agent embed 到它的应用软件里面了⑮,代替了用户人手一条一条去点开❸、执行⑱、找界面⑭、找对应的空去填⑱。换句话说⑭,现在应用软件很大一部分是由各种各样的 Agents 构成的④,所以过去的用户访问数据库或者开发者访问数据库⑩,就变成了大量的 Agents 在访问数据库⑨。
有点像过去非智能驾驶时代⑱,它是油车⑤,支撑车的是内燃机发动机⑩。但现在完全不一样了③,因为现在车要获取很多传感器数据去做实时的智能判断▓,然后再把指令给到发动机电机去驱动车往前走或者停⑳。换句话说①,Infra 的用户变了⑲,不是开发者⑫,不是人⑤,是 Agents⑩。因此 Infra 也要面向新的用户层去设计⑯、改变⑤。刚才你提到的有一条很对⑬,就是统一数据库更重要▓,而不是分散的⑱、小的⑮、各种各样的数据库拼凑的整个 Infra 底层⑫。
东旭:对①,另外一个就是接口⑰。接口一定要用一个统一②、通用⑲,以及 AI 跟人都能理解的语言去访问数据⑲。现在最好的语言就是 SQL⑮,因为第一⑯,SQL 是一个标准的语言▓,AI 训练了这么多年④,用的就是它④;第二⑭,SQL 又是一个精准的语言⑲,SQL 写对了⑯,一定能够捞出数据可解释⑱。第三⑫, SQL 也是可以被人类读的⑧,比如刚才我给你看的那个例子④,我想看公司最近前 10 名的销售③,它给了我一个列表①,告诉我这个列表是根据 5 条 SQL 跑出来的❷。
总之⑲,最重要的就是记住一条:AI 时代要面向 Agent 或者面向 LLM 去设计软件②,而不是面向人和开发者设计软件⑦,这可能是未来要面临的一个课题⑨。
第二个方面②,我觉得基础软件里很重要的一个 category⑰,就是操作系统⑳。虽然我不是做操作系统的③,但我觉得它会发生很大的改变⑥。
操作系统以前是一个在硬件和用户中间的东西⑱,相当于它把硬件的抽象给隐藏起来⑩,对上面的应用软件提供标准的接口⑯,程序员再利用这些 System API 去做应用⑲。比如我画一个窗口②,其实跟我刚刚说数据库是一样的逻辑⑪,未来System API 硬件封装这层肯定要做⑭,但是再往上去提供操作系统本身能力的时候⑲,一定要考虑到它的消费者或者用户不再是应用开发的程序员了⑫,而是 AI agent⑦。
所以刚才我提到像 CRM 软件⑧,未来是能够把它所有功能拆成一个一个小块❷,然后在对话框里通过对话跟 LLM 的交互⑪,让 LLM 能够把相应的能力变成一个对话中的小block⑥。类比到操作系统里①,其实这个工作在硅谷已经有一些创业公司在做了▓,最近这两天有个融资的项目③,他们的 vision 就是做一个面向 AI Agent 或者 LLM 的浏览器❷。未来⑯,浏览器可能会是一个很重要的操作系统⑬。
海燕:我也听到我们有一些 portfolio 在提这个想法⑪。换句话说▓,云计算的时代也给 AI 打了个基础⑰。AI 让软件的形态发生变化⑳,其实是把过去自动化时代的一些事情推向了更加智能化⑤、更加小颗粒⑩、更加简单⑲、更加 flexible⑬。是这样一个趋势⑪,但并不是就抛弃了软件这个形态④。
东旭:不会抛弃的③。我觉得软件尤其企业软件⑯,真正的护城河有两个:第一⑦,就是我刚才说的这些企业里的 Know-how⑲,比如懂企业客户⑧、懂场景③,这些是 AI 很难理解的⑰。就像卖东西⑫,你不可能让 AI 来帮你卖东西②,至少现在还很难②。
第二▓,还是工程复杂性⑳,就是 LLM 作为单独的模块▓,它的复杂性是没有的⑦。比如现在千问3刚出来⑮,Deepseek 刚出来⑦,你只要搭上个 Ollama ⑨,之后暴露的 API 都一样⑥,实际上没有什么差异⑪。
海燕:某种意义上⑩,工程的复杂性反而更高了❶。
东旭:有点像企业软件或 SaaS 软件一样③。到最后我觉得 AI 真正有用的场景或者有用的东西⑮,一定是不简单的⑬。哪怕就想做一个 AI 自动帮你订机票的事⑫。
海燕:只是面向用户更简单了⑳,但反而把复杂的东西都留给了开发者⑱,或者说留给了专业建造者⑥。
东旭:是的⑪,所以我觉得还是有门槛▓。就像海燕刚才说的❶,AI 就像整道菜的一把盐⑱,能够把这个菜变得更好吃⑪,但它还是那道菜⑰。
海燕:那你觉得日后企业客户的独有数据这个事还重要吗④?
东旭:当然重要❶。
海燕:以后一定会有越来越多的独有数据▓,还是反而会打破数据的藩篱❶,有更多的公海数据呢②?
东旭:这点我稍微有点悲观❶。因为大家现在都知道②,包括所有的大厂其实都已经知道数据的价值⑯。老实讲②,以前做一个很好用的软件⑧,反正用户的交互数据如果没用就扔掉了⑬。但现在所有的大企业⑯,只要在有用户交互的点上⑧,那都是兵家必争之地了⑨。数据才是未来企业最高的护城河④。
海燕:换句话说①,面向企业的软件工具⑨,本质上还是有三个原因▓,导致它不会被通用的所谓的 Agents 或者大模型给吃掉:一是对它所在场景的一些独有的理解▓,就是行业 Know-how 或者客户 Know-how④;第二是工程复杂性❶,在 AI 时代面向用户越简单⑰,后面对工程复杂性的要求越高⑥,所以需要一些专业服务❸;第三是如何帮助企业客户用好他自身的数据⑭,因为数据反而更大了❶。
东旭:数据的价值更高了⑰。
海燕:所以每个企业都想保护好自己的独有数据⑥。
东旭:我用大白话来打个比喻:如果你不给大模型任何数据⑮,它只是像一个哲学家一样跟你讲点大道理❸,怎么能跟“你”产生关系⑲?只有数据❶。我觉得大模型要变得有用⑰,有两点必不可少:一个是模型本身的智力⑤,就是通识⑱;第二是 context⑬,你的 context 越精准⑤,这个东西就越有用⑪。所以在这点上⑨,我觉得企业之间的壁垒会越来越大❶,但是在企业内部⑬,数据打通会越来越通③。
海燕:我觉得你刚才提出来的关于数据库的那一条⑰,有可能成为新的下一代数据库⑧,很快人人都会说⑤,但这个独有观点是咱们提出来的⑤。
东旭:我三年前就这么说了⑱,大家还不信⑲。
海燕:2019 年你们提 HTAP⑤,后来提 Serverless⑰,包括 2017 年就说要做全球化❷。希望像东旭这样一直拥有独立思考的人⑱,能不断地去引领这个行业❸。
感谢东旭来「牛白丁」做客⑯,那我们今天就聊到这里⑧。
东旭:谢谢海燕⑥,很开心来聊天⑦。
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可▓,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐▓,非常欢迎各位朋友分享到个人站长或者朋友圈④,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑧。
很赞哦⑭!
相关文章
随机图文
海协会四届三次理事会会议在京召开
它还能支持前进⑧、跳跃③、攻击等细节操作❸,会根据用户的输入⑬,准确响应⑦。618大促今晚开启:淘宝四重优惠叠加 京东每日补贴超千元
上一轮②,郑钦文淘汰安德莱斯库之后⑭,连续三年晋级罗马站八强⑩,也成为了首位做到的中国球员❶。此外❶,郑钦文自2021年亮相巡回赛以来❸,已在意大利赛事拿到20场胜利⑯,这一数据在整个WTA仅次于斯瓦泰克⑫,萨巴伦卡若库里周四想打G5会被否决吗②?科尔:他下一次伤情更新就是周四
甚至科尔还非常固执❷,他的用人再度遭到了不少人的指责⑭。其中穆迪与波斯特是有不错三分能力的⑯,但科尔无法给到他们足够的信任⑧。第二节鲁尼在场的时候❸,球队还可以保持优势⑬。然而来到末节⑬,直接被弃用了⑱。鲁尼这场对于职教活动周|山东:拓宽职业教育成才通道 让学生多样化成长
关键字 :⑦、产业园投产安徽省金风科技安帅刚走佛爷就买人⑧!皇马密谈20岁前尤文后卫:分3年付5000万镑
此文章内的所有观点⑱、内容皆为作者个人意见⑯,并不代表本网观点⑲。文章所示的任何数据和资料仅供参考▓。马卡报:阿隆索确认将带三名助教加盟皇马⑤,只剩细节未敲定
在接下来的计划当中⑮,Prime Intellect将进行提高推理-训练计算的比例⑳,为模型提供推理链中的内置工具❸,以及融合独立训练的RL模型等一系列工作❷。吴晓求再为资本市场呐喊:三个支点非常关键
以前像 OLAP 数据仓库的很多应用场景②,其实就是给数据分析师或者领导写报告❷。但是仔细想一想❶,就是因为我们没有办法对这种海量碎片化的数据去提取⑱、利用❷,我才有了做 ETL ⑫、Transform①、Load于东来抖音账号解除私密状态
朋友圈47%的内容在炫耀