您现在的位置是: 网站首页>科技科技
水浒传电玩城app下载
曾惜雪 2025-05-13 【科技】 6273 人已围观
新智元报道▓、【新智元导读】如何将一句简单的文字描述变成物理稳定的乐高模型⑩?LegoGPT通过物理感知技术❷,确保98.8%的设计稳如磐石▓。
输入一段文字⑬,AI就能设计出可实际搭建的乐高⑦?
来自CMU的研究人员提出的LegoGPT彻底改变了游戏规则❸。
只需输入「金属紫色电吉他」⑰,AI就能生成一个不仅外形逼真⑰,还能在现实中稳稳站立的乐高模型❶!
不同于传统3D建模工具生成的▓,LegoGPT通过微调Meta的LLaMA模型⑲,结合47,000个稳定结构数据集❶,确保98.8%的设计符合物理定律❶。
LegoGPT是第一个能够将文本输入转换为物理稳定的乐高设计的AI模型⑦。
目前⑯,数据集⑬、代码和模型均已开源⑦。
论文地址:https://www.arxiv.org/abs/2505.05469
项目地址:https://avalovelace1.github.io/LegoGPT/
不同于那些会为了迎合你输入的请求而生成奇怪设计的 AI 生成器⑲,LegoGPT的设计遵循物理定律⑩,这意味着⑦。
LegoGPT不仅设计了与文本描述相匹配的乐高模型⑨,还确保它们可以在现实世界中逐块搭建❷,无论是人类测试者通过手工搭建❶,还是借助机器人辅助构建⑧。
搭建高背椅子的乐高过程
图1:生成的乐高模块⑳,经过带有力传感器的双臂机器人系统⑱,根据 AI 生成的指令来拾取和放置积木⑥,最终组成完成的乐高成品
LegoGPT生成的乐高组件❷,不止包含了具体的结构⑧,还能按照提示词⑧,包含喷漆机纹理图案⑬。
图2:LegoGPT生成的乐高组件
生成带有提示词纹理图案的乐高组件
LegoGPT根据提示词金属紫色电吉他⑫,生成的乐高组件是吉他形状▓,并且下部为紫色
LegoGPT相比之前生成3D建模的工具⑫,其最大的优势在于其生成的结构是稳定的⑪。
许多现有的 3D 生成模型专注于创建具有详细几何形状的多样化物体⑭,但其生成的设计往往无法物理实现❷。
没有适当的支撑①,设计的一部分可能会坍塌⑬、漂浮或保持断开状态❸。
而使用LegoGPT生成的设计98%的时间是物理稳定的⑨。
突破传统3D建模局限❸、LegoGPT怎么做到给出稳定设计的⑰?
首先③,LegoGPT的微调了Meta的一个开源大模型LLaMA-3.2-1B-Instruct③,为了训练模型⑩,团队构建了一个名为StableText2Lego的新数据集⑭。
其中包含超过47,000个稳定的乐高结构⑪,28000个独特的3D对象⑭,其中每一个都由OpenAI的GPT-4o生成描述性标题③,例如「流线型」「细长的船」或「具有醒目前格栅的经典风格汽车」这样的描述以及对应的3D乐高组件⑯。
图3:a)统将 LEGO 设计分割成一系列文本标记⑲,以从下到上的光栅扫描方式排序⑪,b)将砖块序列与描述配对⑭,以微调 LLaMA-3.2-Instruct-1B②。c)在推理时⑰,LegoGPT 通过根据文本提示逐个预测砖块来增量生成LEGO设计
每个结构都经过了物理分析⑲,以确保它可以在现实世界中建造❷。
此外⑥,LegoGPT团队使用了一个独立的软件工具来增强积木预测模型⑲,该工具可以使用模拟重力和结构力的数学模型来验证物理稳定性④。
图4:考虑乐高重力和结构力的物理模型②,以预测乐高组件拼接后的稳定性
LegoGPT作为第一个预训练LLM⑰,该模型不是预测下一个词①,而是逐步预测要添加的下一个积木❷,从而逐步搭建出一个完整的由乐高组成的世界⑩。
LegoGPT会通过首先生成一系列精确放置的乐高积木来工作▓。
对于序列中的每个新积木⑪,系统确保它不会与现有积木碰撞⑮,并且能够适应建筑空间④。
完成设计后❶,它使用上述数学模型来验证模型能够直立而不倒塌⑩。
如果LegoGPT生成的模型在实际搭建中部分组件倒塌⑮,系统也会识别出第一个不稳定的积木并回溯①,移除它以及所有后续积木⑮,然后尝试不同的方法⑪。
这种具有物理感知的回滚方法被证明是LegoGPT的要点③。没有它①,只有24%的设计能够站立③,而使用完整系统时⑧,成功率则有98.8%②。
图5:LegoGPT生成的不稳定组件①,在回滚中被去除
乐高不只是一个玩具⑱,LegoGPT的用途⑤,也远远不止加速新一代乐高玩具的设计⑥,把乐高店里的玩具价格打下来⑥。
LegoGPT展示出的技术实力▓,有着现实用途②。
能够设计出稳定的乐高组件⑫,也就能让大模型设计出可以3D打印的组件⑪,再由机器人将这些组件拼接成具有现实功能的工具②,例如无人机▓,无人驾驶的船只及模型车⑰,这些在技术上②,是一脉相承的⑱。
LegoGPT中对于物理模型⑦,以及不稳定组件的回滚▓,使其能够成为第一个具有极高可靠率④,能产生稳定3D结构的预训练模型⑳。
当然⑥,LegoGPT仍存在一些局限性④。
当前的LegoGPT版本仅在20×20×20的建筑空间内工作⑳,并且仅使用八种标准积木类型⑩。
LegoGPT目前支持一组固定的常用乐高积木⑮,在未来工作中④,LegoGPT的研究团队计划扩展积木库③,以包含更广泛的尺寸和积木类型⑥,例如斜坡和地砖⑲。
研究人员希望扩大他们的训练数据集⑧,以包含比目前可用的21个类别更多的对象⑤。
作者介绍
Kangle Deng是卡内基梅隆大学机器人研究所的博士生⑤,由Deva Ramanan和Jun-Yan Zhu的共同指导⑲。 此前⑬,他于2020年获得北京大学学士学位⑳。
Kangle Deng的研究方向主要为计算机辅助创作⑨,目前的研究工作得到了微软研究院博士奖 学金的支持⑨。
Ruixuan Liu卡内基梅隆大学计算机学院机器人研究所的博士生⑧,导师是智能控制实验室的Changliu Liu教授④。
他的研究方向为机器人学习/控制⑫、生成式制造以及人机协作⑰。
Ruixuan Liu在卡内基梅隆大学获得了电气与计算机工程学士学位⑬,辅修机器人技术⑦。
本科期间⑲,他在Sebastian Scherer教授领导的AirLab实验室工作⑳,工作重点是用于建筑结构检测的传感器融合和三维重建⑫。
参考资料:
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可⑮,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑪,非常欢迎各位朋友分享到个人站长或者朋友圈⑤,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑱。
很赞哦④!
相关文章
随机图文
巴西足协官宣⑩!安切洛蒂签约1年⑨,6月5日首秀③,率队冲击世界杯
李锦斌现任第十四届全国人大常委会委员⑥、环境与资源保护委员会副主任委员 资料图光“才”夺目 “艺”展风采——南宁市越秀路小学举行第十二届“我行我秀”校园文化艺术节启动仪式
其中⑯,小米SU7标准版搭载的Xiaomi Pilot Pro由“小米智驾Pro”更名为“小米辅助驾驶Pro”⑪;小米SU7 Pro⑲、小米SU7 Max搭载的Xiaomi HAD由“小米智驾Max”更名为对美关税90天内大幅降低⑱,专家建议抓住窗口期长远布局
这个奖励信号会作为Solver行为的反馈❷,帮助Solver学习如何更好地解决各种类型的推理任务⑱。“果”然在云南丨云果为何能全年无休⑭?
TARGET-LONG:任务奖励同样大幅提升⑭,长度惩罚也呈下降趋势▓,但在实验的有限时间内尚未完全收敛⑭,模型还未完全学会严格遵守思考预算⑭。双牌县理家坪乡:守护花蕾 共建平安校园
娃娃 电钻 洗衣机 产业没能回流 美关税政策已诱发“涨”声一片上海“后摩尔时代”半导体产业聚集区在临港启动建设
央视新闻客户端报道称⑰,俄罗斯总统普京提议⑱,5月15日在土耳其伊斯坦布尔恢复俄乌直接谈判①。2025国际篮联女篮亚洲杯冠军奖杯发布 苗立杰任赛事大使
十五⑬、双方重申有必要对国际金融体系进行广泛改革▓,提高发展中国家在国际金融机构中的影响力和代表性④。大S家人强颜合影:S妈头巾掩白发⑯,小S哭肿双眼⑧,具俊晔暴瘦阴郁
强达电路所属申万行业为:电子-元件-印制电路板⑭。所属概念板块包括:次新股②、消费电子⑳、光通信▓、PCB概念❶、近端次新等⑫。