您现在的位置是：网站首页>财经财经

电玩城8个动物怎么玩

崔友儿 2025-05-13 【财经】 2084 人已围观

新智元报道⑬、【新智元导读】如何将一句简单的文字描述变成物理稳定的乐高模型①？LegoGPT通过物理感知技术⑱，确保98.8%的设计稳如磐石⑭。

输入一段文字⑰，AI就能设计出可实际搭建的乐高⑮？

来自CMU的研究人员提出的LegoGPT彻底改变了游戏规则⑤。

只需输入「金属紫色电吉他」⑩，AI就能生成一个不仅外形逼真①，还能在现实中稳稳站立的乐高模型⑰！

不同于传统3D建模工具生成的②，LegoGPT通过微调Meta的LLaMA模型▓，结合47,000个稳定结构数据集⑦，确保98.8%的设计符合物理定律⑭。

LegoGPT是第一个能够将文本输入转换为物理稳定的乐高设计的AI模型⑩。

目前❸，数据集⑬、代码和模型均已开源❶。

论文地址：https://www.arxiv.org/abs/2505.05469

项目地址：https://avalovelace1.github.io/LegoGPT/

不同于那些会为了迎合你输入的请求而生成奇怪设计的 AI 生成器⑩，LegoGPT的设计遵循物理定律❸，这意味着⑨。

LegoGPT不仅设计了与文本描述相匹配的乐高模型④，还确保它们可以在现实世界中逐块搭建❷，无论是人类测试者通过手工搭建⑯，还是借助机器人辅助构建⑳。

搭建高背椅子的乐高过程

图1：生成的乐高模块⑧，经过带有力传感器的双臂机器人系统⑧，根据 AI 生成的指令来拾取和放置积木⑲，最终组成完成的乐高成品

LegoGPT生成的乐高组件⑬，不止包含了具体的结构⑨，还能按照提示词⑦，包含喷漆机纹理图案⑦。

图2：LegoGPT生成的乐高组件

生成带有提示词纹理图案的乐高组件

LegoGPT根据提示词金属紫色电吉他❷，生成的乐高组件是吉他形状⑱，并且下部为紫色

LegoGPT相比之前生成3D建模的工具⑨，其最大的优势在于其生成的结构是稳定的⑧。

许多现有的 3D 生成模型专注于创建具有详细几何形状的多样化物体③，但其生成的设计往往无法物理实现④。

没有适当的支撑⑯，设计的一部分可能会坍塌⑨、漂浮或保持断开状态⑯。

而使用LegoGPT生成的设计98%的时间是物理稳定的⑯。

突破传统3D建模局限⑲、LegoGPT怎么做到给出稳定设计的⑩？

首先⑩，LegoGPT的微调了Meta的一个开源大模型LLaMA-3.2-1B-Instruct⑪，为了训练模型⑥，团队构建了一个名为StableText2Lego的新数据集❸。

其中包含超过47,000个稳定的乐高结构⑨，28000个独特的3D对象⑧，其中每一个都由OpenAI的GPT-4o生成描述性标题⑥，例如「流线型」「细长的船」或「具有醒目前格栅的经典风格汽车」这样的描述以及对应的3D乐高组件⑰。

图3：a）统将 LEGO 设计分割成一系列文本标记⑱，以从下到上的光栅扫描方式排序⑳，b）将砖块序列与描述配对⑭，以微调 LLaMA-3.2-Instruct-1B⑯。c）在推理时⑩，LegoGPT 通过根据文本提示逐个预测砖块来增量生成LEGO设计

每个结构都经过了物理分析①，以确保它可以在现实世界中建造⑨。

此外⑪，LegoGPT团队使用了一个独立的软件工具来增强积木预测模型▓，该工具可以使用模拟重力和结构力的数学模型来验证物理稳定性①。

图4：考虑乐高重力和结构力的物理模型⑨，以预测乐高组件拼接后的稳定性

LegoGPT作为第一个预训练LLM⑫，该模型不是预测下一个词⑲，而是逐步预测要添加的下一个积木▓，从而逐步搭建出一个完整的由乐高组成的世界⑰。

LegoGPT会通过首先生成一系列精确放置的乐高积木来工作⑧。

对于序列中的每个新积木⑤，系统确保它不会与现有积木碰撞②，并且能够适应建筑空间②。

完成设计后⑫，它使用上述数学模型来验证模型能够直立而不倒塌❶。

如果LegoGPT生成的模型在实际搭建中部分组件倒塌⑤，系统也会识别出第一个不稳定的积木并回溯⑭，移除它以及所有后续积木⑫，然后尝试不同的方法❶。

这种具有物理感知的回滚方法被证明是LegoGPT的要点⑥。没有它⑫，只有24%的设计能够站立④，而使用完整系统时❸，成功率则有98.8%④。

图5：LegoGPT生成的不稳定组件⑳，在回滚中被去除

乐高不只是一个玩具⑤，LegoGPT的用途❶，也远远不止加速新一代乐高玩具的设计⑰，把乐高店里的玩具价格打下来②。

LegoGPT展示出的技术实力⑲，有着现实用途⑥。

能够设计出稳定的乐高组件⑤，也就能让大模型设计出可以3D打印的组件⑬，再由机器人将这些组件拼接成具有现实功能的工具⑩，例如无人机⑯，无人驾驶的船只及模型车⑰，这些在技术上⑤，是一脉相承的③。

LegoGPT中对于物理模型②，以及不稳定组件的回滚⑳，使其能够成为第一个具有极高可靠率⑱，能产生稳定3D结构的预训练模型⑤。

当然⑩，LegoGPT仍存在一些局限性③。

当前的LegoGPT版本仅在20×20×20的建筑空间内工作②，并且仅使用八种标准积木类型①。

LegoGPT目前支持一组固定的常用乐高积木⑰，在未来工作中⑱，LegoGPT的研究团队计划扩展积木库⑥，以包含更广泛的尺寸和积木类型⑩，例如斜坡和地砖❸。

研究人员希望扩大他们的训练数据集⑳，以包含比目前可用的21个类别更多的对象⑪。

作者介绍

Kangle Deng是卡内基梅隆大学机器人研究所的博士生⑤，由Deva Ramanan和Jun-Yan Zhu的共同指导▓。此前②，他于2020年获得北京大学学士学位⑬。

Kangle Deng的研究方向主要为计算机辅助创作⑭，目前的研究工作得到了微软研究院博士奖学金的支持❸。

Ruixuan Liu卡内基梅隆大学计算机学院机器人研究所的博士生⑭，导师是智能控制实验室的Changliu Liu教授⑫。

他的研究方向为机器人学习/控制⑦、生成式制造以及人机协作③。

Ruixuan Liu在卡内基梅隆大学获得了电气与计算机工程学士学位❸，辅修机器人技术❷。

本科期间①，他在Sebastian Scherer教授领导的AirLab实验室工作⑭，工作重点是用于建筑结构检测的传感器融合和三维重建⑮。

参考资料：

很赞哦⑤！

上一篇：周琦26+13创3纪录：总决赛生涯最佳却输球战斧隔扣护目镜被打掉

下一篇：商务部：全力为外贸企业纾困解难

随机图文

点击排行

山东淄博：车网互动让新能源车变身移动储能库

本栏推荐

哈利伯顿：我因为玩小孩子的游戏得到很多报酬

标签云