您现在的位置是:网站首页>足球足球
超级电玩城免广告版安卓下载
姚以山 2025-05-14 【足球】 9376 人已围观
机器之心报道⑬、本周二⑪,我们报道了菲尔兹奖得主陶哲轩的一个开源项目 ——在大模型的协助下编写了一个概念验证软件工具③,来验证涉及任意正参数的给定估计是否成立⑨。
在项目中⑦,他开发了一个用于自动证明分析中估计值的框架①。估计值是 X≲Y)或 X≪Y)形式的不等式❶。
这才几天的时间⑪,这个估计验证工具的 2.0 版本就来了⑫!
陶哲轩对该工具进行了两次全面改进②。
首先⑦,他将其改造成一个基础的证明助手④,同时能够处理一些命题逻辑⑲;接着⑰,他根据评论者的反馈⑰,将其改造成一个更加灵活的证明助手⑤,它也由功能强大的 Python 符号代数包 sympy 提供支持⑰。
陶哲轩认为现在得到了一个稳定的框架⑭,并可以进一步扩展该工具⑲。他最初的目标只是自动化标量函数渐近估计的证明❶,但原则上可以继续向该工具添加策略⑥、新的 sympy 类型和引理⑰,以处理范围广泛的其他数学任务⑳。
该证明助手的 2.0 版本已经上传到了 GitHub⑧。同样地⑨,与自己以前的编码一样❸,陶哲轩最终「严重」依赖大语言模型的帮助来理解 Python 和 sympy 的一些细节⑰,其中 Github Copilot 的自动补全功能尤其有用⑤。
虽然该工具支持全自动证明⑫,但陶哲轩决定现在更多地关注半自动交互式证明❸,其中人类用户提供高级「策略」⑫,然后证明助手执行必要的计算⑲,直到证明完成③。
GitHub 地址:https://github.com/teorth/estimates
根据项目简介⑧,这是一个利用 Python 开发的轻量级证明助手⑭,其功能远逊于 Lean⑫、Isabelle 或 Rocq 等完整证明助手❶,但希望它能够轻松用于证明一些简短而繁琐的任务⑩,例如验证一个不等式或估计是否由其他不等式或估计推导出来⑯。该助手的一个具体目标是为渐近估计提供支持⑯。
具体实现过程④、下载相关文件后⑦,即可在 Python 中启动证明助手①,只需输入「from main import *」并加载一个预先制作的练习即可▓。以下是其中一个练习:
这是证明助手对以下问题的形式化描述:如果 x, y, z 是正实数❷,且 x2y 且 y3z+1⑦,则证明 x7z+2④。
证明助手的工作方式是:用户指示助手使用各种「策略」来简化问题⑧,直到问题得到解决⑱。在本例中⑥,该问题可以通过线性算法求解⑫,具体形式化为「Linarith 」策略:
如果有人想更详细地了解线性算法的工作原理⑳,可以使用「verbose」标志来运行此策略⑱。
有时⑫,证明过程会涉及情况拆分▓,最终的证明会呈现出树状结构⑬。这里有个例子:其务是证明假设 ∧ 且 ∧ 蕴涵 ∧:
这里❸,根据使用的三种策略对证明进行「伪精益」描述:策略「cases h」 1 对假设「 h1」进行情况拆分⑲,然后在两种情况下分别应用「simp_all」策略来简化⑰。
该工具支持渐近估计❸。陶哲轩找到了一种在 Sympy 中实现量级形式化的方法⑦。事实证明⑯,Sympy 在某种意义上已经可以原生实现非标准分析:它的符号变量有一个「is_number」标志⑳,基本上对应于非标准分析中「标准」数的概念⑪。
举例而言⑭,数字 3 的「sympy」版本「S 」有「S .is_number == True」⑬,因此是标准的⑦;而整数变量「n = Symbol 」有「n.is_number == False 」⑤,因此是非标准的❸。
对数线性规划求解器还可以通过相当强力的「分支」方法处理低阶项❶。
陶哲轩计划开始开发用于估计符号函数的函数空间范数工具❶,例如创建一些策略来部署诸如 Holder 不等式和 Sobolev 嵌入不等式之类的引理①。Sympy 框架看起来足够灵活④,可以为这些类型的对象创建更多对象类⑩。目前▓,他只有一个概念验证引理来说明这个框架③,即算术平均 - 几何平均引理⑮。
陶哲轩最后表示⑲,他对这个证明助手的基本框架非常满意⑦,因此愿意接受进一步的建议或新功能的贡献③,例如引入新的数据类型⑭、引理和策略⑩,或者一些示例问题⑨。这些问题应该很容易被这个助手解决❷,但目前由于缺乏合适的策略和引理而超出了它的能力⑮。
数学形式化证明实验纪实①、而就在刚刚⑪,陶哲轩又发了一个新项目⑯。
他最近尝试了一个小实验:尝试利用现代自动化工具来半自动地形式化一个一页纸的数学证明⑳。这个证明来自他在 Equational Theories Project 中的合作者 Bruno Le Floch⑨。
视频演示:https://www.youtube.com/watch?v=cyyR7j2ChCI
讨论地址:https://leanprover.zulipchat.com/#narrow/channel/458659-Equational/topic/Alternative.20proofs.20of.20E1689.E2.8A.A2E2
GitHub 链接:https://github.com/teorth/estimate_tools/blob/master/EstimateTools/test/equational.lean
陶哲轩尝试「盲做」这个证明⑦,即不真正理解证明结构的前提下⑦,直接用工具去拼出形式化过程⑲。他用约 33 分钟完成了形式化过程⑳。对他来说①,这是一种很不一样的工作方式 —— 不靠对整个证明的大局理解⑪,而是完全依赖于工具处理逻辑细节⑰。
在 Zulip 讨论中⑰,Bruno Le Floch 最初指出⑩,在论文中「E1689-E2 的所有已知证明都是计算机辅助」这一说法太绝对了④。他自己后来给出了一个更具可读性的「人类版本」③,虽有些步骤灵感来自 prover9⑳,但整体不应算作纯计算机证明⑲。
陶哲轩回应:那我们可以更新 blueprint⑬,并在论文中注明我们在项目中得到了一个非计算机生成的版本⑳。
故事就此开始⑥,陶哲轩选择做一个实验⑭。「我尝试完全基于 Bruno 的草稿⑩,一步步进行形式化①,过程非常依赖 Copilot 和 Lean 的 canonical 策略③。」他将原稿拆解成细小逻辑单元❷,让工具处理约一半细节⑯,剩下的由自己手动填补⑥,完成了一个可以通过验证的 Lean 形式化证明③,还录了视频上传到 YouTube▓。
实际证明⑳, 虽然这种方法看起来有点机械⑮,但对于结构不强⑤、以技术推导为主的证明⑳,是有效的②。AI 工具可以代劳大量繁琐推理⑨,让人专注于「如何表达」而不是「是否合理」⑤。
这场实验还暴露出一些 Lean 项目协作工具的问题⑱。目前项目使用的 blueprint 工具只支持每个命题绑定一个证明版本▓。如果要同时记录人类证明和 AI 生成的版本⑮,会发生覆盖⑰,管理混乱⑤。
如果你对这个话题感兴趣⑦,建议直接查看 Zulip 讨论区❶,了解更多一线协作细节⑬。
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可⑩,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐③,非常欢迎各位朋友分享到个人站长或者朋友圈▓,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”③。
很赞哦④!
相关文章
随机图文
从523起立案到挽损16亿元 看兰州警方如何守护群众“钱袋子”
目前在多模态大模型领域❶,谷歌最新推出的大模型Gemini 2.5 Pro表现出色❶,已支持图像⑪、视频❸、音频与代码的统一理解❶,且在多个基准测试中领先于GPT-4.0⑬。-
若库里周四想打G5会被否决吗①?科尔:他下一次伤情更新就是周四
// message加载失败降级到nginx,产品可以在load事件重新初始化 阿维塔风阻系数争议落幕①?博主“苏黎世贝勒爷”公开道歉
它不仅为Matrix-Game性能提供了全面量化的依据❷,也为整个交互世界生成领域⑧,树立了统一的标准⑱。补偿机制一直存在 但NBA这次是演都不演了
据IT之家了解⑳,氦-3 是一种非放射性氦同位素⑪,地球上极为罕见⑦,仅作为核反应堆的副产品少量产生⑬。然而⑥,经过数十亿年的积累❸,由于月球缺乏磁场屏蔽⑫,太阳风持续冲击月球表面⑰,使得氦-3 在月壤中不断富集⑬。I足球报:国字号洋帅中⑯,目前和足协关系处理得最好的是安东尼奥
据媒体报道②,2025年4月27日⑧,林浩和妻子宣布“我们要升级当爸爸妈妈啦”③,让无数网友感慨万千⑳。2025年4月29日⑤,林浩在接受记者采访时表示:“除了继续通过直播助力家乡乡村振兴⑬,我们还要努力给孩子创新闻分析:为何沙尘天气近期频频“返场”⑨?
这些领域的共同特点是⑥,虽然需要不断探索⑨,但实验结果容易验证⑩,与RFT的优势高度契合③。金盘科技涨3.10%⑱,成交额3.80亿元⑭,今日主力净流入 1616.76万
同时⑱,SHARDCAST还会根据网络拓扑和带宽状况❸,动态调整传输策略和路由⑩,选择最优的分发路径④。消息称苹果拟提高iPhone 17系列售价:与新功能有关⑨,与关税无关
找到AGI最佳平衡⑩、在谈及AGI之时⑧,Mark Chen表示⑤,「我们采用非常广泛的定义⑧,它不仅是ChatGPT⑨,还包括了其他东西」⑳。