您现在的位置是:网站首页>财经财经
7天电玩城森林舞会
许映之 2025-05-14 【财经】 2701 人已围观
新智元报道⑳、【新智元导读】如何将一句简单的文字描述变成物理稳定的乐高模型⑰?LegoGPT通过物理感知技术⑲,确保98.8%的设计稳如磐石⑧。
输入一段文字⑭,AI就能设计出可实际搭建的乐高⑲?
来自CMU的研究人员提出的LegoGPT彻底改变了游戏规则⑦。
只需输入「金属紫色电吉他」❶,AI就能生成一个不仅外形逼真⑰,还能在现实中稳稳站立的乐高模型⑦!
不同于传统3D建模工具生成的⑭,LegoGPT通过微调Meta的LLaMA模型⑮,结合47,000个稳定结构数据集④,确保98.8%的设计符合物理定律⑰。
LegoGPT是第一个能够将文本输入转换为物理稳定的乐高设计的AI模型⑨。
目前▓,数据集⑤、代码和模型均已开源▓。
论文地址:https://www.arxiv.org/abs/2505.05469
项目地址:https://avalovelace1.github.io/LegoGPT/
不同于那些会为了迎合你输入的请求而生成奇怪设计的 AI 生成器❶,LegoGPT的设计遵循物理定律⑦,这意味着⑥。
LegoGPT不仅设计了与文本描述相匹配的乐高模型⑲,还确保它们可以在现实世界中逐块搭建⑱,无论是人类测试者通过手工搭建⑬,还是借助机器人辅助构建③。
搭建高背椅子的乐高过程
图1:生成的乐高模块⑥,经过带有力传感器的双臂机器人系统①,根据 AI 生成的指令来拾取和放置积木⑥,最终组成完成的乐高成品
LegoGPT生成的乐高组件⑤,不止包含了具体的结构⑭,还能按照提示词②,包含喷漆机纹理图案⑳。
图2:LegoGPT生成的乐高组件
生成带有提示词纹理图案的乐高组件
LegoGPT根据提示词金属紫色电吉他⑭,生成的乐高组件是吉他形状❸,并且下部为紫色
LegoGPT相比之前生成3D建模的工具⑱,其最大的优势在于其生成的结构是稳定的▓。
许多现有的 3D 生成模型专注于创建具有详细几何形状的多样化物体⑫,但其生成的设计往往无法物理实现⑮。
没有适当的支撑⑩,设计的一部分可能会坍塌⑩、漂浮或保持断开状态⑪。
而使用LegoGPT生成的设计98%的时间是物理稳定的⑥。
突破传统3D建模局限③、LegoGPT怎么做到给出稳定设计的⑫?
首先⑭,LegoGPT的微调了Meta的一个开源大模型LLaMA-3.2-1B-Instruct②,为了训练模型❸,团队构建了一个名为StableText2Lego的新数据集⑦。
其中包含超过47,000个稳定的乐高结构⑧,28000个独特的3D对象⑧,其中每一个都由OpenAI的GPT-4o生成描述性标题⑱,例如「流线型」「细长的船」或「具有醒目前格栅的经典风格汽车」这样的描述以及对应的3D乐高组件③。
图3:a)统将 LEGO 设计分割成一系列文本标记⑦,以从下到上的光栅扫描方式排序①,b)将砖块序列与描述配对②,以微调 LLaMA-3.2-Instruct-1B⑦。c)在推理时②,LegoGPT 通过根据文本提示逐个预测砖块来增量生成LEGO设计
每个结构都经过了物理分析❸,以确保它可以在现实世界中建造❸。
此外⑫,LegoGPT团队使用了一个独立的软件工具来增强积木预测模型❸,该工具可以使用模拟重力和结构力的数学模型来验证物理稳定性❸。
图4:考虑乐高重力和结构力的物理模型❶,以预测乐高组件拼接后的稳定性
LegoGPT作为第一个预训练LLM▓,该模型不是预测下一个词❶,而是逐步预测要添加的下一个积木①,从而逐步搭建出一个完整的由乐高组成的世界⑫。
LegoGPT会通过首先生成一系列精确放置的乐高积木来工作⑮。
对于序列中的每个新积木⑩,系统确保它不会与现有积木碰撞⑳,并且能够适应建筑空间⑰。
完成设计后⑦,它使用上述数学模型来验证模型能够直立而不倒塌⑲。
如果LegoGPT生成的模型在实际搭建中部分组件倒塌⑯,系统也会识别出第一个不稳定的积木并回溯⑳,移除它以及所有后续积木▓,然后尝试不同的方法⑨。
这种具有物理感知的回滚方法被证明是LegoGPT的要点⑫。没有它⑤,只有24%的设计能够站立❷,而使用完整系统时⑯,成功率则有98.8%❸。
图5:LegoGPT生成的不稳定组件⑫,在回滚中被去除
乐高不只是一个玩具⑯,LegoGPT的用途⑭,也远远不止加速新一代乐高玩具的设计⑭,把乐高店里的玩具价格打下来⑮。
LegoGPT展示出的技术实力⑮,有着现实用途⑨。
能够设计出稳定的乐高组件⑦,也就能让大模型设计出可以3D打印的组件⑪,再由机器人将这些组件拼接成具有现实功能的工具⑦,例如无人机⑩,无人驾驶的船只及模型车⑭,这些在技术上⑳,是一脉相承的⑳。
LegoGPT中对于物理模型⑫,以及不稳定组件的回滚⑲,使其能够成为第一个具有极高可靠率⑥,能产生稳定3D结构的预训练模型⑰。
当然⑨,LegoGPT仍存在一些局限性⑲。
当前的LegoGPT版本仅在20×20×20的建筑空间内工作⑭,并且仅使用八种标准积木类型⑲。
LegoGPT目前支持一组固定的常用乐高积木▓,在未来工作中⑮,LegoGPT的研究团队计划扩展积木库⑥,以包含更广泛的尺寸和积木类型⑤,例如斜坡和地砖⑩。
研究人员希望扩大他们的训练数据集④,以包含比目前可用的21个类别更多的对象❶。
作者介绍
Kangle Deng是卡内基梅隆大学机器人研究所的博士生⑦,由Deva Ramanan和Jun-Yan Zhu的共同指导⑦。 此前④,他于2020年获得北京大学学士学位⑳。
Kangle Deng的研究方向主要为计算机辅助创作⑤,目前的研究工作得到了微软研究院博士奖 学金的支持⑳。
Ruixuan Liu卡内基梅隆大学计算机学院机器人研究所的博士生④,导师是智能控制实验室的Changliu Liu教授⑮。
他的研究方向为机器人学习/控制⑭、生成式制造以及人机协作⑨。
Ruixuan Liu在卡内基梅隆大学获得了电气与计算机工程学士学位⑨,辅修机器人技术❷。
本科期间⑦,他在Sebastian Scherer教授领导的AirLab实验室工作⑥,工作重点是用于建筑结构检测的传感器融合和三维重建⑯。
参考资料:
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可❸,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑳,非常欢迎各位朋友分享到个人站长或者朋友圈②,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑲。
很赞哦⑮!
相关文章
随机图文
阿斯:库巴西和加西亚可以正常出战与西班牙人的比赛
安切洛蒂在皇马执教期间共赢得过15座冠军⑯,被皇马官方称为123年队史最成功的主教练❸。一抢而空⑦!iPhone 16 Pro大降价④,天猫旗舰店近30万台苹果备战618
近期④,国内外上市车企迎来财报季⑱,2024年报和2025一季报相继出炉⑯。在经济上行压力之下⑫,资产负债率这一关键指标⑱,成为衡量车企财务健康的焦点⑭。汽车产业重资产⑲、长周期的特性⑱,决定了前期需投入巨额资金④,回-
聚焦广州南沙▓,金融支持粤港澳合作有了新举措
张亚勤:从宏观上看⑲,AI的发展方向是积极的⑫,但过程中确实会出现问题⑱。比如①,AI翻译和AI客服的出现⑱,会让相关行业受到冲击①;无人驾驶的成熟▓,会让司机面临失业⑱。这种现象我们在不久之前就曾经经历过⑱,比如打字 不带户口本 能领结婚证
目前⑯,特朗普已推行保护主义近4个月⑥,自其宣布征收关税以来做出的改变包括:大幅扩大对加拿大与墨西哥新关税措施的豁免商品范围⑥;对除中国以外所有国家暂缓实施所谓的“对等关税”90天⑳;对部分电子产品豁免“对等武汉科研团队研发新型抗感染敷料 提升伤口愈合速率
“逆人性操作”红利窗口期▓,何怀真每天能收到10多条关于消费贷的私信▓,咨询人数比以往多了至少三分之一④。他在四川一家消费金融公司做了三年产品经理▓,同时兼职干自媒体⑮,提供贷款咨询服务⑫。客户群体在利率下调前后OPPO Enco Clip 耳夹耳机因产能有限不得不限量发售
与之形成鲜明对比的是❸,岛内“台独”分子包括“台独”媒体⑭,鸦雀无声⑬。原着作者不满桐华修改兰香如故角色名⑬,陈香兰林锦楼被改
易重纯告诉澎湃新闻⑤,当时在塘湾派出所内⑲,“老板”易晓春的妻子——塘湾镇木兰溪村的村支书易立芳支付了“赔偿款”⑩。“才赔了三万八千块钱⑨,我要求赔五万她都没肯④。”易重纯称⑥,当时易立芳表示易晓春已经“进去了”-
成都2家企业入选福布斯最新榜单⑨,这家出海AI产品流量第一
全球连线丨从“60后”到“00后” 外国媒体人眼中的中国故事