您现在的位置是:网站首页> 世界足球世界足球
168电玩城
陆小凡 2025-05-13 【世界足球】 3742 人已围观
机器之心报道⑭、本周二⑪,我们报道了菲尔兹奖得主陶哲轩的一个开源项目 ——在大模型的协助下编写了一个概念验证软件工具⑫,来验证涉及任意正参数的给定估计是否成立⑬。
在项目中❶,他开发了一个用于自动证明分析中估计值的框架❷。估计值是 X≲Y)或 X≪Y)形式的不等式③。
这才几天的时间⑧,这个估计验证工具的 2.0 版本就来了⑩!
陶哲轩对该工具进行了两次全面改进⑤。
首先⑫,他将其改造成一个基础的证明助手④,同时能够处理一些命题逻辑⑨;接着⑦,他根据评论者的反馈⑨,将其改造成一个更加灵活的证明助手⑤,它也由功能强大的 Python 符号代数包 sympy 提供支持⑩。
陶哲轩认为现在得到了一个稳定的框架②,并可以进一步扩展该工具⑳。他最初的目标只是自动化标量函数渐近估计的证明⑲,但原则上可以继续向该工具添加策略❷、新的 sympy 类型和引理⑦,以处理范围广泛的其他数学任务⑲。
该证明助手的 2.0 版本已经上传到了 GitHub⑯。同样地⑮,与自己以前的编码一样⑦,陶哲轩最终「严重」依赖大语言模型的帮助来理解 Python 和 sympy 的一些细节②,其中 Github Copilot 的自动补全功能尤其有用①。
虽然该工具支持全自动证明⑯,但陶哲轩决定现在更多地关注半自动交互式证明⑪,其中人类用户提供高级「策略」④,然后证明助手执行必要的计算⑧,直到证明完成②。
GitHub 地址:https://github.com/teorth/estimates
根据项目简介▓,这是一个利用 Python 开发的轻量级证明助手⑨,其功能远逊于 Lean⑮、Isabelle 或 Rocq 等完整证明助手▓,但希望它能够轻松用于证明一些简短而繁琐的任务❸,例如验证一个不等式或估计是否由其他不等式或估计推导出来❷。该助手的一个具体目标是为渐近估计提供支持⑤。
具体实现过程❷、下载相关文件后⑦,即可在 Python 中启动证明助手⑰,只需输入「from main import *」并加载一个预先制作的练习即可⑪。以下是其中一个练习:
这是证明助手对以下问题的形式化描述:如果 x, y, z 是正实数⑬,且 x2y 且 y3z+1⑰,则证明 x7z+2⑮。
证明助手的工作方式是:用户指示助手使用各种「策略」来简化问题⑧,直到问题得到解决⑥。在本例中⑰,该问题可以通过线性算法求解⑪,具体形式化为「Linarith 」策略:
如果有人想更详细地了解线性算法的工作原理❶,可以使用「verbose」标志来运行此策略②。
有时⑯,证明过程会涉及情况拆分①,最终的证明会呈现出树状结构⑨。这里有个例子:其务是证明假设 ∧ 且 ∧ 蕴涵 ∧:
这里⑮,根据使用的三种策略对证明进行「伪精益」描述:策略「cases h」 1 对假设「 h1」进行情况拆分⑪,然后在两种情况下分别应用「simp_all」策略来简化❸。
该工具支持渐近估计②。陶哲轩找到了一种在 Sympy 中实现量级形式化的方法⑤。事实证明⑬,Sympy 在某种意义上已经可以原生实现非标准分析:它的符号变量有一个「is_number」标志⑥,基本上对应于非标准分析中「标准」数的概念⑬。
举例而言⑳,数字 3 的「sympy」版本「S 」有「S .is_number == True」③,因此是标准的▓;而整数变量「n = Symbol 」有「n.is_number == False 」⑮,因此是非标准的❶。
对数线性规划求解器还可以通过相当强力的「分支」方法处理低阶项❷。
陶哲轩计划开始开发用于估计符号函数的函数空间范数工具④,例如创建一些策略来部署诸如 Holder 不等式和 Sobolev 嵌入不等式之类的引理②。Sympy 框架看起来足够灵活▓,可以为这些类型的对象创建更多对象类⑲。目前②,他只有一个概念验证引理来说明这个框架❷,即算术平均 - 几何平均引理⑭。
陶哲轩最后表示④,他对这个证明助手的基本框架非常满意④,因此愿意接受进一步的建议或新功能的贡献④,例如引入新的数据类型⑧、引理和策略⑰,或者一些示例问题⑲。这些问题应该很容易被这个助手解决❶,但目前由于缺乏合适的策略和引理而超出了它的能力❷。
数学形式化证明实验纪实⑬、而就在刚刚⑪,陶哲轩又发了一个新项目⑯。
他最近尝试了一个小实验:尝试利用现代自动化工具来半自动地形式化一个一页纸的数学证明⑪。这个证明来自他在 Equational Theories Project 中的合作者 Bruno Le Floch▓。
视频演示:https://www.youtube.com/watch?v=cyyR7j2ChCI
讨论地址:https://leanprover.zulipchat.com/#narrow/channel/458659-Equational/topic/Alternative.20proofs.20of.20E1689.E2.8A.A2E2
GitHub 链接:https://github.com/teorth/estimate_tools/blob/master/EstimateTools/test/equational.lean
陶哲轩尝试「盲做」这个证明⑳,即不真正理解证明结构的前提下⑩,直接用工具去拼出形式化过程⑨。他用约 33 分钟完成了形式化过程⑬。对他来说▓,这是一种很不一样的工作方式 —— 不靠对整个证明的大局理解⑫,而是完全依赖于工具处理逻辑细节④。
在 Zulip 讨论中⑩,Bruno Le Floch 最初指出❶,在论文中「E1689-E2 的所有已知证明都是计算机辅助」这一说法太绝对了⑲。他自己后来给出了一个更具可读性的「人类版本」❷,虽有些步骤灵感来自 prover9⑫,但整体不应算作纯计算机证明⑫。
陶哲轩回应:那我们可以更新 blueprint⑫,并在论文中注明我们在项目中得到了一个非计算机生成的版本⑭。
故事就此开始❸,陶哲轩选择做一个实验⑤。「我尝试完全基于 Bruno 的草稿❷,一步步进行形式化⑲,过程非常依赖 Copilot 和 Lean 的 canonical 策略❶。」他将原稿拆解成细小逻辑单元⑪,让工具处理约一半细节⑥,剩下的由自己手动填补⑧,完成了一个可以通过验证的 Lean 形式化证明④,还录了视频上传到 YouTube⑲。
实际证明❸, 虽然这种方法看起来有点机械⑮,但对于结构不强①、以技术推导为主的证明⑧,是有效的⑩。AI 工具可以代劳大量繁琐推理⑩,让人专注于「如何表达」而不是「是否合理」④。
这场实验还暴露出一些 Lean 项目协作工具的问题❸。目前项目使用的 blueprint 工具只支持每个命题绑定一个证明版本①。如果要同时记录人类证明和 AI 生成的版本⑧,会发生覆盖⑳,管理混乱⑪。
如果你对这个话题感兴趣❷,建议直接查看 Zulip 讨论区⑥,了解更多一线协作细节⑦。
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可②,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑩,非常欢迎各位朋友分享到个人站长或者朋友圈⑩,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑪。
很赞哦④!
相关文章
随机图文
中国潜水救捞行业协会发布《呵护潜水员职业健康安全宣言》
七❸、信息娱乐与连接 车载通信:车对车通信⑫、车对X通信⑧、机器对机器通信❸、 X对X通信⑱、车对道路通信⑰、其他车载通信 信息娱乐应用程序操作:导航系统⑨、应用程序⑨、显示器⑱、音响系统❸、语音识别⑳、车载视频②、车载将付5000万🚨电讯报:皇马有信心签怀森⑳,提供薪资远高于切尔西
这群没有一个真正从事过基础制造业⑫、没有真正在田间地头或厂房车船里奔波过的人④,就这样把一个理论推导变成了滚动念经⑰,进而形成了心理按摩⑮,直到被现实明晃晃地教育❸。飙升近13000点⑰!巴基斯坦股市大涨至熔断
报道在国外产生广泛影响⑫,柬埔寨华商传媒⑮、柬中时报中文网和华商日报等媒体积极转载⑦。华商日报连续三天转载广西日报《平陆运河进行曲》文图稿件②,浏览量超违法获利3万却被罚超500万 支付公司上海电银遭监管重罚
张女士提供的聊天记录显示⑫,19日当日下午⑱,陈某某对这位女性朋友说⑳,今天主任请吃饭⑮,请了20个人④。一季度规模以上工业企业利润由降转增
详情:4月⑩,河南省持续做好涉社会民生④、公共政策⑮、教育领域等网络谣言的发现辟除❶,有力打击谣言传播⑱,维护清朗网络空间❷。现对5起典型案例予以公布⑯。-
中美最终加征多少关税⑯?降了多少⑯?我们做了道数学题
VIP课程推荐⑯、加载中...③、新浪直播⑨、百位牛人在线解读股市热点▓,带你挖掘板块龙头 亚洲制药股反弹 特朗普药品降价行政令措辞含糊且力度弱于预期
下月起▓、高温津贴开始发放④、哪些人可以领取⑧?利雅得青年前主席:本泽马专注场内❷,而C罗更关注场外与媒体
推测该岛从珊瑚藻时期到砂岩时期⑪,再到现阶段的海平面升降⑧。有人认为⑤,如果不考虑气候等因素⑬,海平面的升降是由地壳运动决定的⑱;也有人认为④,如果不考虑地壳运动等因素⑦,海平面的升降是由气候变化决定的②。请选择其中
点击排行

本栏推荐
