您现在的位置是:网站首页>游戏游戏
恒星电玩城苹果下载
许夜蕾 2025-05-13 【游戏】 7022 人已围观
新智元报道④、【新智元导读】如何将一句简单的文字描述变成物理稳定的乐高模型⑤?LegoGPT通过物理感知技术⑯,确保98.8%的设计稳如磐石⑤。
输入一段文字❸,AI就能设计出可实际搭建的乐高⑪?
来自CMU的研究人员提出的LegoGPT彻底改变了游戏规则⑬。
只需输入「金属紫色电吉他」①,AI就能生成一个不仅外形逼真❶,还能在现实中稳稳站立的乐高模型⑭!
不同于传统3D建模工具生成的⑦,LegoGPT通过微调Meta的LLaMA模型⑲,结合47,000个稳定结构数据集⑫,确保98.8%的设计符合物理定律❸。
LegoGPT是第一个能够将文本输入转换为物理稳定的乐高设计的AI模型⑥。
目前❸,数据集❶、代码和模型均已开源⑲。
论文地址:https://www.arxiv.org/abs/2505.05469
项目地址:https://avalovelace1.github.io/LegoGPT/
不同于那些会为了迎合你输入的请求而生成奇怪设计的 AI 生成器❸,LegoGPT的设计遵循物理定律⑳,这意味着⑭。
LegoGPT不仅设计了与文本描述相匹配的乐高模型⑳,还确保它们可以在现实世界中逐块搭建⑤,无论是人类测试者通过手工搭建⑰,还是借助机器人辅助构建②。
搭建高背椅子的乐高过程
图1:生成的乐高模块⑫,经过带有力传感器的双臂机器人系统▓,根据 AI 生成的指令来拾取和放置积木③,最终组成完成的乐高成品
LegoGPT生成的乐高组件⑯,不止包含了具体的结构⑪,还能按照提示词②,包含喷漆机纹理图案⑬。
图2:LegoGPT生成的乐高组件
生成带有提示词纹理图案的乐高组件
LegoGPT根据提示词金属紫色电吉他⑫,生成的乐高组件是吉他形状⑧,并且下部为紫色
LegoGPT相比之前生成3D建模的工具⑥,其最大的优势在于其生成的结构是稳定的⑮。
许多现有的 3D 生成模型专注于创建具有详细几何形状的多样化物体⑳,但其生成的设计往往无法物理实现④。
没有适当的支撑①,设计的一部分可能会坍塌⑨、漂浮或保持断开状态①。
而使用LegoGPT生成的设计98%的时间是物理稳定的④。
突破传统3D建模局限⑨、LegoGPT怎么做到给出稳定设计的②?
首先⑪,LegoGPT的微调了Meta的一个开源大模型LLaMA-3.2-1B-Instruct⑮,为了训练模型⑭,团队构建了一个名为StableText2Lego的新数据集❷。
其中包含超过47,000个稳定的乐高结构⑬,28000个独特的3D对象⑮,其中每一个都由OpenAI的GPT-4o生成描述性标题④,例如「流线型」「细长的船」或「具有醒目前格栅的经典风格汽车」这样的描述以及对应的3D乐高组件⑱。
图3:a)统将 LEGO 设计分割成一系列文本标记❸,以从下到上的光栅扫描方式排序⑳,b)将砖块序列与描述配对⑨,以微调 LLaMA-3.2-Instruct-1B④。c)在推理时⑫,LegoGPT 通过根据文本提示逐个预测砖块来增量生成LEGO设计
每个结构都经过了物理分析⑫,以确保它可以在现实世界中建造❸。
此外⑦,LegoGPT团队使用了一个独立的软件工具来增强积木预测模型③,该工具可以使用模拟重力和结构力的数学模型来验证物理稳定性④。
图4:考虑乐高重力和结构力的物理模型⑱,以预测乐高组件拼接后的稳定性
LegoGPT作为第一个预训练LLM⑩,该模型不是预测下一个词⑱,而是逐步预测要添加的下一个积木⑫,从而逐步搭建出一个完整的由乐高组成的世界❸。
LegoGPT会通过首先生成一系列精确放置的乐高积木来工作⑭。
对于序列中的每个新积木⑲,系统确保它不会与现有积木碰撞⑫,并且能够适应建筑空间②。
完成设计后④,它使用上述数学模型来验证模型能够直立而不倒塌⑩。
如果LegoGPT生成的模型在实际搭建中部分组件倒塌④,系统也会识别出第一个不稳定的积木并回溯⑲,移除它以及所有后续积木②,然后尝试不同的方法⑭。
这种具有物理感知的回滚方法被证明是LegoGPT的要点❷。没有它⑳,只有24%的设计能够站立①,而使用完整系统时⑤,成功率则有98.8%⑦。
图5:LegoGPT生成的不稳定组件②,在回滚中被去除
乐高不只是一个玩具⑩,LegoGPT的用途⑳,也远远不止加速新一代乐高玩具的设计▓,把乐高店里的玩具价格打下来⑱。
LegoGPT展示出的技术实力⑤,有着现实用途④。
能够设计出稳定的乐高组件⑯,也就能让大模型设计出可以3D打印的组件⑧,再由机器人将这些组件拼接成具有现实功能的工具⑳,例如无人机⑬,无人驾驶的船只及模型车④,这些在技术上❶,是一脉相承的④。
LegoGPT中对于物理模型⑪,以及不稳定组件的回滚②,使其能够成为第一个具有极高可靠率⑮,能产生稳定3D结构的预训练模型⑦。
当然⑳,LegoGPT仍存在一些局限性②。
当前的LegoGPT版本仅在20×20×20的建筑空间内工作⑱,并且仅使用八种标准积木类型⑩。
LegoGPT目前支持一组固定的常用乐高积木⑯,在未来工作中❶,LegoGPT的研究团队计划扩展积木库⑳,以包含更广泛的尺寸和积木类型⑨,例如斜坡和地砖⑤。
研究人员希望扩大他们的训练数据集▓,以包含比目前可用的21个类别更多的对象②。
作者介绍
Kangle Deng是卡内基梅隆大学机器人研究所的博士生❷,由Deva Ramanan和Jun-Yan Zhu的共同指导⑰。 此前⑫,他于2020年获得北京大学学士学位④。
Kangle Deng的研究方向主要为计算机辅助创作▓,目前的研究工作得到了微软研究院博士奖 学金的支持⑯。
Ruixuan Liu卡内基梅隆大学计算机学院机器人研究所的博士生⑰,导师是智能控制实验室的Changliu Liu教授⑨。
他的研究方向为机器人学习/控制❷、生成式制造以及人机协作⑰。
Ruixuan Liu在卡内基梅隆大学获得了电气与计算机工程学士学位❸,辅修机器人技术④。
本科期间④,他在Sebastian Scherer教授领导的AirLab实验室工作⑮,工作重点是用于建筑结构检测的传感器融合和三维重建⑭。
参考资料:
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可⑤,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑧,非常欢迎各位朋友分享到个人站长或者朋友圈⑳,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑧。
很赞哦⑫!
相关文章
随机图文
腾景科技股份有限公司关于发行股份及支付现金购买资产并募集配套资金暨关联交易的进展公告
收到线索后⑱,大象新闻记者和上官正义来到涉事地点附近蹲守多日⑰,发现并拍摄记录下了长沙县安沙镇杨梓冲村内一处农村自建房存在的大量异常情况❶。逆等线模型大总结
Nexus-Gen的诞生❶,验证了从SOTA的MLLMs和扩散模型出发⑰,来对齐以GPT-4o为代表的闭源SOTA的可能性③。其效果与GPT-4o具备许多共同点⑮,比如图像编辑会导致原图部分变化⑳、可以文本润色阳光财险:增厚消费“安全垫”④,护航消费新场景
报道称⑤,之所以做出这个决定⑪,主要是因为皇马方面认识到世俱杯这项赛事的重要性⑦,此次比赛的总计奖金达到了1.5亿欧元⑥,以及赢得这个奖杯本身的意义和荣誉⑦,都让皇马意识到这个时候必须要选择他们信任的教练去带队👀名记:一旦字母哥被摆上货架 火箭和马刺将成为理想买家 吉安尼斯·安特托孔波
资料显示①,维信诺科技股份有限公司位于北京市海淀区上地东路1号院7号楼环洋大厦二层▓,成立日期1998年1月7日⑲,上市日期2010年4月13日❶,公司主营业务涉及AMOLED新型显示产品的研发⑨、生产❶、销售和青海祁连:“生态研学专航”开辟青藏高原研学新模式
《镜报》同样报道称⑪,切尔西已确认将在夏天向曼联支付500万英镑的费用⑱,这将使租借协议中的强制购买条款失效⑥。曼联愿意接受约2000万英镑的报价⑰。第2也不保⑦?阿森纳近6轮仅1胜状态不佳⑨,下轮若输球将跌至第3
于是⑥,发布会当天⑱,奥迪A6L⑮、奔驰E级⑥、宝马5系均感受到了压力⑩。带有quattro四驱的奥迪A6L④,入门版指导价在47.99万元⑱,北京的终端价格最低为33万元左右⑩。宝马5系的入门版525Li豪华套装❷,两项指南发布❸,助推中小学人工智能教育发展
俞俐均形象被游戏盗用宣传 网友:支持维权😜下一个⑩?浓眉入湖 母队补状元签🤭77入湖 母队也补状元签
这里值得一提的是⑰,以前银河E8的后排有地台高⑰、靠背陡的问题⑮,星耀8的后排地台明显比E8降低了一些▓,常规状态下的舒适性⑩,也比银河E8有了明显提升③。
点击排行

本栏推荐
