您现在的位置是:网站首页>财经财经
电玩城8个动物怎么玩
崔友儿 2025-05-13 【财经】 2084 人已围观
新智元报道⑬、【新智元导读】如何将一句简单的文字描述变成物理稳定的乐高模型①?LegoGPT通过物理感知技术⑱,确保98.8%的设计稳如磐石⑭。
输入一段文字⑰,AI就能设计出可实际搭建的乐高⑮?
来自CMU的研究人员提出的LegoGPT彻底改变了游戏规则⑤。
只需输入「金属紫色电吉他」⑩,AI就能生成一个不仅外形逼真①,还能在现实中稳稳站立的乐高模型⑰!
不同于传统3D建模工具生成的②,LegoGPT通过微调Meta的LLaMA模型▓,结合47,000个稳定结构数据集⑦,确保98.8%的设计符合物理定律⑭。
LegoGPT是第一个能够将文本输入转换为物理稳定的乐高设计的AI模型⑩。
目前❸,数据集⑬、代码和模型均已开源❶。
论文地址:https://www.arxiv.org/abs/2505.05469
项目地址:https://avalovelace1.github.io/LegoGPT/
不同于那些会为了迎合你输入的请求而生成奇怪设计的 AI 生成器⑩,LegoGPT的设计遵循物理定律❸,这意味着⑨。
LegoGPT不仅设计了与文本描述相匹配的乐高模型④,还确保它们可以在现实世界中逐块搭建❷,无论是人类测试者通过手工搭建⑯,还是借助机器人辅助构建⑳。
搭建高背椅子的乐高过程
图1:生成的乐高模块⑧,经过带有力传感器的双臂机器人系统⑧,根据 AI 生成的指令来拾取和放置积木⑲,最终组成完成的乐高成品
LegoGPT生成的乐高组件⑬,不止包含了具体的结构⑨,还能按照提示词⑦,包含喷漆机纹理图案⑦。
图2:LegoGPT生成的乐高组件
生成带有提示词纹理图案的乐高组件
LegoGPT根据提示词金属紫色电吉他❷,生成的乐高组件是吉他形状⑱,并且下部为紫色
LegoGPT相比之前生成3D建模的工具⑨,其最大的优势在于其生成的结构是稳定的⑧。
许多现有的 3D 生成模型专注于创建具有详细几何形状的多样化物体③,但其生成的设计往往无法物理实现④。
没有适当的支撑⑯,设计的一部分可能会坍塌⑨、漂浮或保持断开状态⑯。
而使用LegoGPT生成的设计98%的时间是物理稳定的⑯。
突破传统3D建模局限⑲、LegoGPT怎么做到给出稳定设计的⑩?
首先⑩,LegoGPT的微调了Meta的一个开源大模型LLaMA-3.2-1B-Instruct⑪,为了训练模型⑥,团队构建了一个名为StableText2Lego的新数据集❸。
其中包含超过47,000个稳定的乐高结构⑨,28000个独特的3D对象⑧,其中每一个都由OpenAI的GPT-4o生成描述性标题⑥,例如「流线型」「细长的船」或「具有醒目前格栅的经典风格汽车」这样的描述以及对应的3D乐高组件⑰。
图3:a)统将 LEGO 设计分割成一系列文本标记⑱,以从下到上的光栅扫描方式排序⑳,b)将砖块序列与描述配对⑭,以微调 LLaMA-3.2-Instruct-1B⑯。c)在推理时⑩,LegoGPT 通过根据文本提示逐个预测砖块来增量生成LEGO设计
每个结构都经过了物理分析①,以确保它可以在现实世界中建造⑨。
此外⑪,LegoGPT团队使用了一个独立的软件工具来增强积木预测模型▓,该工具可以使用模拟重力和结构力的数学模型来验证物理稳定性①。
图4:考虑乐高重力和结构力的物理模型⑨,以预测乐高组件拼接后的稳定性
LegoGPT作为第一个预训练LLM⑫,该模型不是预测下一个词⑲,而是逐步预测要添加的下一个积木▓,从而逐步搭建出一个完整的由乐高组成的世界⑰。
LegoGPT会通过首先生成一系列精确放置的乐高积木来工作⑧。
对于序列中的每个新积木⑤,系统确保它不会与现有积木碰撞②,并且能够适应建筑空间②。
完成设计后⑫,它使用上述数学模型来验证模型能够直立而不倒塌❶。
如果LegoGPT生成的模型在实际搭建中部分组件倒塌⑤,系统也会识别出第一个不稳定的积木并回溯⑭,移除它以及所有后续积木⑫,然后尝试不同的方法❶。
这种具有物理感知的回滚方法被证明是LegoGPT的要点⑥。没有它⑫,只有24%的设计能够站立④,而使用完整系统时❸,成功率则有98.8%④。
图5:LegoGPT生成的不稳定组件⑳,在回滚中被去除
乐高不只是一个玩具⑤,LegoGPT的用途❶,也远远不止加速新一代乐高玩具的设计⑰,把乐高店里的玩具价格打下来②。
LegoGPT展示出的技术实力⑲,有着现实用途⑥。
能够设计出稳定的乐高组件⑤,也就能让大模型设计出可以3D打印的组件⑬,再由机器人将这些组件拼接成具有现实功能的工具⑩,例如无人机⑯,无人驾驶的船只及模型车⑰,这些在技术上⑤,是一脉相承的③。
LegoGPT中对于物理模型②,以及不稳定组件的回滚⑳,使其能够成为第一个具有极高可靠率⑱,能产生稳定3D结构的预训练模型⑤。
当然⑩,LegoGPT仍存在一些局限性③。
当前的LegoGPT版本仅在20×20×20的建筑空间内工作②,并且仅使用八种标准积木类型①。
LegoGPT目前支持一组固定的常用乐高积木⑰,在未来工作中⑱,LegoGPT的研究团队计划扩展积木库⑥,以包含更广泛的尺寸和积木类型⑩,例如斜坡和地砖❸。
研究人员希望扩大他们的训练数据集⑳,以包含比目前可用的21个类别更多的对象⑪。
作者介绍
Kangle Deng是卡内基梅隆大学机器人研究所的博士生⑤,由Deva Ramanan和Jun-Yan Zhu的共同指导▓。 此前②,他于2020年获得北京大学学士学位⑬。
Kangle Deng的研究方向主要为计算机辅助创作⑭,目前的研究工作得到了微软研究院博士奖 学金的支持❸。
Ruixuan Liu卡内基梅隆大学计算机学院机器人研究所的博士生⑭,导师是智能控制实验室的Changliu Liu教授⑫。
他的研究方向为机器人学习/控制⑦、生成式制造以及人机协作③。
Ruixuan Liu在卡内基梅隆大学获得了电气与计算机工程学士学位❸,辅修机器人技术❷。
本科期间①,他在Sebastian Scherer教授领导的AirLab实验室工作⑭,工作重点是用于建筑结构检测的传感器融合和三维重建⑮。
参考资料:
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可⑯,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑪,非常欢迎各位朋友分享到个人站长或者朋友圈⑱,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”⑥。
很赞哦⑤!
相关文章
随机图文
视线:展高能创新 亮丰硕成果
帕西尼的机器人手上装有众多传感器⑩,能填补人形机器人触觉模态缺失的空白▓,这一差异化使得帕西尼侧重进入对手部精细动作要求更高的场景▓,如照顾老人⑫、手术或危险作业等⑳。近期正和帕西尼洽谈合作意向的是一家大型垃圾-
调研速递上海铁大电信科技获投资者调研⑥,2024年盈利增长显着
自1947年印巴分治以来❸,克什米尔地区争端就成为印度和巴基斯坦两个邻国间最核心的冲突之一❸。印度和巴基斯坦都宣称对克什米尔地区享有主权❶,但双方都只控制了一部分地区❷。 从广州到无锡⑧,中国男子网球选手在进步
胡金秋全场出战38分钟⑬,投篮11中6⑧,三分球3中3⑦,罚球3中2⑧,砍下27分4篮板2助攻1抢断1盖帽⑲。-
艾渝23分 肖恺17+9+9 中国矿大力克宁波大学
All Rights Reserved 新浪公司 版权所有 北京换发第三代社保卡⑮,第三批开始❶!轮到这些人——
如今⑨,在特殊历史节点❷,习近平同普京再聚首⑰。欢迎仪式⑮、小范围会谈⑯、大范围会谈⑧、签字和合作文本交换仪式⑮、共见记者⑪、欢迎宴会④、一对一茶叙……当地时间5月8日的克里姆林宫会晤⑮,两国元首在一起7个多小时⑥,从上午-
人形机器人的9个分岔口
据了解⑮,鸿蒙电脑历经5年布局⑱,集结上万名工程师⑲、联合20多家研究所共同研发⑫,积累超过2700项核心专利⑲,从内核开始重构操作系统⑤。此外⑨,鸿蒙电脑还将AI和智慧交互等功能引入操作系统⑩,带来更加智慧流畅的操 -
道路交通事故实现“双下降” 甘肃货车整治行动取得阶段性成效
关键词 : 中汽协:1至4月我国汽车产销量首次双超千万辆
宁德时代募资水平与美的集团相当⑫。