您现在的位置是:网站首页> CBACBA
电玩城下载平台
蒋问兰 2025-05-14 【 CBA】 7301 人已围观
新智元报道⑪、【新智元导读】如何将一句简单的文字描述变成物理稳定的乐高模型⑮?LegoGPT通过物理感知技术③,确保98.8%的设计稳如磐石⑱。
输入一段文字⑪,AI就能设计出可实际搭建的乐高⑦?
来自CMU的研究人员提出的LegoGPT彻底改变了游戏规则⑦。
只需输入「金属紫色电吉他」❶,AI就能生成一个不仅外形逼真⑩,还能在现实中稳稳站立的乐高模型⑬!
不同于传统3D建模工具生成的⑲,LegoGPT通过微调Meta的LLaMA模型⑱,结合47,000个稳定结构数据集⑬,确保98.8%的设计符合物理定律▓。
LegoGPT是第一个能够将文本输入转换为物理稳定的乐高设计的AI模型⑩。
目前⑫,数据集⑯、代码和模型均已开源⑱。
论文地址:https://www.arxiv.org/abs/2505.05469
项目地址:https://avalovelace1.github.io/LegoGPT/
不同于那些会为了迎合你输入的请求而生成奇怪设计的 AI 生成器❸,LegoGPT的设计遵循物理定律⑮,这意味着⑰。
LegoGPT不仅设计了与文本描述相匹配的乐高模型⑭,还确保它们可以在现实世界中逐块搭建①,无论是人类测试者通过手工搭建②,还是借助机器人辅助构建⑱。
搭建高背椅子的乐高过程
图1:生成的乐高模块⑱,经过带有力传感器的双臂机器人系统①,根据 AI 生成的指令来拾取和放置积木⑬,最终组成完成的乐高成品
LegoGPT生成的乐高组件⑧,不止包含了具体的结构⑦,还能按照提示词⑫,包含喷漆机纹理图案⑥。
图2:LegoGPT生成的乐高组件
生成带有提示词纹理图案的乐高组件
LegoGPT根据提示词金属紫色电吉他⑨,生成的乐高组件是吉他形状②,并且下部为紫色
LegoGPT相比之前生成3D建模的工具⑪,其最大的优势在于其生成的结构是稳定的②。
许多现有的 3D 生成模型专注于创建具有详细几何形状的多样化物体❸,但其生成的设计往往无法物理实现⑤。
没有适当的支撑⑲,设计的一部分可能会坍塌❶、漂浮或保持断开状态⑥。
而使用LegoGPT生成的设计98%的时间是物理稳定的⑯。
突破传统3D建模局限⑰、LegoGPT怎么做到给出稳定设计的⑳?
首先⑳,LegoGPT的微调了Meta的一个开源大模型LLaMA-3.2-1B-Instruct❶,为了训练模型④,团队构建了一个名为StableText2Lego的新数据集⑬。
其中包含超过47,000个稳定的乐高结构⑤,28000个独特的3D对象⑨,其中每一个都由OpenAI的GPT-4o生成描述性标题⑱,例如「流线型」「细长的船」或「具有醒目前格栅的经典风格汽车」这样的描述以及对应的3D乐高组件⑫。
图3:a)统将 LEGO 设计分割成一系列文本标记⑥,以从下到上的光栅扫描方式排序①,b)将砖块序列与描述配对⑪,以微调 LLaMA-3.2-Instruct-1B①。c)在推理时⑬,LegoGPT 通过根据文本提示逐个预测砖块来增量生成LEGO设计
每个结构都经过了物理分析⑰,以确保它可以在现实世界中建造❸。
此外⑭,LegoGPT团队使用了一个独立的软件工具来增强积木预测模型⑱,该工具可以使用模拟重力和结构力的数学模型来验证物理稳定性❷。
图4:考虑乐高重力和结构力的物理模型⑲,以预测乐高组件拼接后的稳定性
LegoGPT作为第一个预训练LLM⑭,该模型不是预测下一个词⑥,而是逐步预测要添加的下一个积木⑬,从而逐步搭建出一个完整的由乐高组成的世界⑬。
LegoGPT会通过首先生成一系列精确放置的乐高积木来工作①。
对于序列中的每个新积木❷,系统确保它不会与现有积木碰撞①,并且能够适应建筑空间③。
完成设计后⑧,它使用上述数学模型来验证模型能够直立而不倒塌⑯。
如果LegoGPT生成的模型在实际搭建中部分组件倒塌⑨,系统也会识别出第一个不稳定的积木并回溯▓,移除它以及所有后续积木⑫,然后尝试不同的方法⑤。
这种具有物理感知的回滚方法被证明是LegoGPT的要点⑮。没有它⑲,只有24%的设计能够站立⑥,而使用完整系统时⑯,成功率则有98.8%❷。
图5:LegoGPT生成的不稳定组件⑥,在回滚中被去除
乐高不只是一个玩具⑧,LegoGPT的用途⑱,也远远不止加速新一代乐高玩具的设计①,把乐高店里的玩具价格打下来⑥。
LegoGPT展示出的技术实力⑫,有着现实用途❶。
能够设计出稳定的乐高组件⑰,也就能让大模型设计出可以3D打印的组件①,再由机器人将这些组件拼接成具有现实功能的工具②,例如无人机⑯,无人驾驶的船只及模型车❷,这些在技术上⑯,是一脉相承的⑱。
LegoGPT中对于物理模型⑰,以及不稳定组件的回滚②,使其能够成为第一个具有极高可靠率❶,能产生稳定3D结构的预训练模型❷。
当然②,LegoGPT仍存在一些局限性⑭。
当前的LegoGPT版本仅在20×20×20的建筑空间内工作⑤,并且仅使用八种标准积木类型⑳。
LegoGPT目前支持一组固定的常用乐高积木⑱,在未来工作中▓,LegoGPT的研究团队计划扩展积木库❶,以包含更广泛的尺寸和积木类型⑨,例如斜坡和地砖❷。
研究人员希望扩大他们的训练数据集②,以包含比目前可用的21个类别更多的对象⑩。
作者介绍
Kangle Deng是卡内基梅隆大学机器人研究所的博士生⑫,由Deva Ramanan和Jun-Yan Zhu的共同指导⑭。 此前⑭,他于2020年获得北京大学学士学位❶。
Kangle Deng的研究方向主要为计算机辅助创作⑭,目前的研究工作得到了微软研究院博士奖 学金的支持⑪。
Ruixuan Liu卡内基梅隆大学计算机学院机器人研究所的博士生⑲,导师是智能控制实验室的Changliu Liu教授③。
他的研究方向为机器人学习/控制⑬、生成式制造以及人机协作②。
Ruixuan Liu在卡内基梅隆大学获得了电气与计算机工程学士学位⑫,辅修机器人技术⑱。
本科期间①,他在Sebastian Scherer教授领导的AirLab实验室工作⑫,工作重点是用于建筑结构检测的传感器融合和三维重建⑤。
参考资料:
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可⑫,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑮,非常欢迎各位朋友分享到个人站长或者朋友圈⑥,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑱。
很赞哦⑤!
相关文章
随机图文
-
比亚迪涨1.94%❷,成交额58.91亿元③,人气排名16位⑮!后市是否有机会①?附走势预测
1⑬、侠客岛:中美同意大幅降低目前的关税▓,建立中美经贸磋商机制❶。如何看待这些回归理性的迹象❶? 赵丽颖恋爱风波升级⑯!赵德胤情史被扒⑯,跟四搭女演员暧昧多年
8日⑱,商务部新闻发言人何亚东表示⑥,中方坚决反对美国滥施关税的立场是一贯的⑲,美方想要通过谈判解决问题❶,就要正视单边关税措施给自身和世界带来的严重负面影响④,正视国际经贸规则⑯、公平正义和各界理性声音③,拿出谈“恒大式”危机压顶京津冀“菜篮子”⑮?首衡集团或涉经营危机
近期⑮,安徽博物院推出“安徽文明史陈列——夏商周时期的安徽”展览⑯,其中有两件战国时期的楚国青铜器——楚王匜鼎与楚王熊悍鼎⑧,格外引人注目⑥。 这两件被誉为“父子鼎”的珍贵文物⑱,均出土于安徽淮南李三孤堆墓群-
母亲节快乐⑳!库里深情告白妻子 感恩为家庭的付出
《中小学生成式人工智能使用指南》:https://www.eol.cn/zhengce/wenjian/202505/t20250512_2667831.shtml 华为智选 5G 随身随行 WiFi Pro 5 上架❷,1549 元
不料后者的辈分竟然比盐运使夫人还高⑩,这一段真是将封建时期的礼教制度体现得淋漓尽致⑦。-
足球报:萨尔瓦多推行边中结合+高位逼抢战术②,铜梁龙进攻更立体
意大利单日新增6557例确诊病例❸,累计确诊破5万 汶川钢腿女孩牛钰挑战马拉松突破极限
比如衬衫⑨、开衩裙④、软底鞋③,不是设计有多前卫⑬,而是没有束缚⑲,一切为了今天自己过得轻松❷。-
弗兰克:若王钰栋能到欧洲踢球⑦,对他来说将会有很大的提升
值得一提的是①,广西平果俱乐部在赛前为本场比赛设立了赢球奖和平球奖⑮,赢球奖金为30万⑩,平球奖金为20万⑭,这是俱乐部本赛季首次为一场比赛开出重奖❶,目的是激励全队争取胜利⑦。
点击排行

本栏推荐
