您现在的位置是:网站首页>游戏游戏
hydwc电玩城官网
杨友绿 2025-05-13 【游戏】 7053 人已围观
新智元报道❸、【新智元导读】如何将一句简单的文字描述变成物理稳定的乐高模型⑪?LegoGPT通过物理感知技术①,确保98.8%的设计稳如磐石②。
输入一段文字⑮,AI就能设计出可实际搭建的乐高⑥?
来自CMU的研究人员提出的LegoGPT彻底改变了游戏规则③。
只需输入「金属紫色电吉他」⑭,AI就能生成一个不仅外形逼真⑬,还能在现实中稳稳站立的乐高模型⑭!
不同于传统3D建模工具生成的①,LegoGPT通过微调Meta的LLaMA模型⑱,结合47,000个稳定结构数据集⑤,确保98.8%的设计符合物理定律❶。
LegoGPT是第一个能够将文本输入转换为物理稳定的乐高设计的AI模型▓。
目前⑰,数据集❷、代码和模型均已开源❸。
论文地址:https://www.arxiv.org/abs/2505.05469
项目地址:https://avalovelace1.github.io/LegoGPT/
不同于那些会为了迎合你输入的请求而生成奇怪设计的 AI 生成器⑰,LegoGPT的设计遵循物理定律①,这意味着⑤。
LegoGPT不仅设计了与文本描述相匹配的乐高模型⑥,还确保它们可以在现实世界中逐块搭建⑤,无论是人类测试者通过手工搭建⑨,还是借助机器人辅助构建⑯。
搭建高背椅子的乐高过程
图1:生成的乐高模块⑮,经过带有力传感器的双臂机器人系统⑯,根据 AI 生成的指令来拾取和放置积木⑧,最终组成完成的乐高成品
LegoGPT生成的乐高组件⑫,不止包含了具体的结构⑩,还能按照提示词▓,包含喷漆机纹理图案⑥。
图2:LegoGPT生成的乐高组件
生成带有提示词纹理图案的乐高组件
LegoGPT根据提示词金属紫色电吉他⑩,生成的乐高组件是吉他形状❷,并且下部为紫色
LegoGPT相比之前生成3D建模的工具⑭,其最大的优势在于其生成的结构是稳定的⑧。
许多现有的 3D 生成模型专注于创建具有详细几何形状的多样化物体⑯,但其生成的设计往往无法物理实现⑱。
没有适当的支撑⑭,设计的一部分可能会坍塌⑳、漂浮或保持断开状态⑬。
而使用LegoGPT生成的设计98%的时间是物理稳定的⑦。
突破传统3D建模局限③、LegoGPT怎么做到给出稳定设计的⑯?
首先⑧,LegoGPT的微调了Meta的一个开源大模型LLaMA-3.2-1B-Instruct⑧,为了训练模型▓,团队构建了一个名为StableText2Lego的新数据集⑮。
其中包含超过47,000个稳定的乐高结构⑭,28000个独特的3D对象⑬,其中每一个都由OpenAI的GPT-4o生成描述性标题⑮,例如「流线型」「细长的船」或「具有醒目前格栅的经典风格汽车」这样的描述以及对应的3D乐高组件⑮。
图3:a)统将 LEGO 设计分割成一系列文本标记②,以从下到上的光栅扫描方式排序❷,b)将砖块序列与描述配对⑨,以微调 LLaMA-3.2-Instruct-1B⑤。c)在推理时①,LegoGPT 通过根据文本提示逐个预测砖块来增量生成LEGO设计
每个结构都经过了物理分析⑤,以确保它可以在现实世界中建造⑰。
此外⑤,LegoGPT团队使用了一个独立的软件工具来增强积木预测模型⑬,该工具可以使用模拟重力和结构力的数学模型来验证物理稳定性⑰。
图4:考虑乐高重力和结构力的物理模型①,以预测乐高组件拼接后的稳定性
LegoGPT作为第一个预训练LLM⑳,该模型不是预测下一个词⑫,而是逐步预测要添加的下一个积木④,从而逐步搭建出一个完整的由乐高组成的世界❷。
LegoGPT会通过首先生成一系列精确放置的乐高积木来工作⑩。
对于序列中的每个新积木▓,系统确保它不会与现有积木碰撞▓,并且能够适应建筑空间②。
完成设计后❶,它使用上述数学模型来验证模型能够直立而不倒塌❸。
如果LegoGPT生成的模型在实际搭建中部分组件倒塌①,系统也会识别出第一个不稳定的积木并回溯①,移除它以及所有后续积木⑩,然后尝试不同的方法⑱。
这种具有物理感知的回滚方法被证明是LegoGPT的要点⑥。没有它⑪,只有24%的设计能够站立▓,而使用完整系统时⑥,成功率则有98.8%❸。
图5:LegoGPT生成的不稳定组件⑲,在回滚中被去除
乐高不只是一个玩具⑯,LegoGPT的用途⑨,也远远不止加速新一代乐高玩具的设计⑧,把乐高店里的玩具价格打下来⑱。
LegoGPT展示出的技术实力❸,有着现实用途⑪。
能够设计出稳定的乐高组件③,也就能让大模型设计出可以3D打印的组件⑭,再由机器人将这些组件拼接成具有现实功能的工具⑭,例如无人机⑬,无人驾驶的船只及模型车⑤,这些在技术上⑦,是一脉相承的❶。
LegoGPT中对于物理模型⑩,以及不稳定组件的回滚⑦,使其能够成为第一个具有极高可靠率①,能产生稳定3D结构的预训练模型❶。
当然④,LegoGPT仍存在一些局限性⑥。
当前的LegoGPT版本仅在20×20×20的建筑空间内工作⑩,并且仅使用八种标准积木类型⑰。
LegoGPT目前支持一组固定的常用乐高积木⑩,在未来工作中❷,LegoGPT的研究团队计划扩展积木库▓,以包含更广泛的尺寸和积木类型⑭,例如斜坡和地砖⑧。
研究人员希望扩大他们的训练数据集⑧,以包含比目前可用的21个类别更多的对象⑯。
作者介绍
Kangle Deng是卡内基梅隆大学机器人研究所的博士生❷,由Deva Ramanan和Jun-Yan Zhu的共同指导⑯。 此前❷,他于2020年获得北京大学学士学位⑳。
Kangle Deng的研究方向主要为计算机辅助创作③,目前的研究工作得到了微软研究院博士奖 学金的支持❷。
Ruixuan Liu卡内基梅隆大学计算机学院机器人研究所的博士生④,导师是智能控制实验室的Changliu Liu教授⑦。
他的研究方向为机器人学习/控制①、生成式制造以及人机协作⑩。
Ruixuan Liu在卡内基梅隆大学获得了电气与计算机工程学士学位⑯,辅修机器人技术⑤。
本科期间⑰,他在Sebastian Scherer教授领导的AirLab实验室工作⑮,工作重点是用于建筑结构检测的传感器融合和三维重建⑮。
参考资料:
转载:感谢您对电玩城捕鱼种类都有的软件网站平台的认可②,以及对电玩城捕鱼种类都有的软件原创作品以及文章的青睐⑲,非常欢迎各位朋友分享到个人站长或者朋友圈⑳,但转载请说明文章出处“来源电玩城捕鱼种类都有的软件”❷。
很赞哦⑲!
相关文章
随机图文
外交部:期待印度和巴基斯坦巩固和延续停火势头
校对 潘政马斯切拉诺:我已习惯面对批评①,近5场输掉4场确实有问题需要纠正
新建两条生产线分两期建设②,第一期先建冷柜生产线及配套设备设施和模具⑩,总建设期为14个月▓;第二期建设冰箱生产线及配套设备设施和模具⑮,计划于2027年底前开工建设⑮,2028年投产⑪。项目全部建成后⑥,将形成新-
第31届“五羊杯”全国象棋冠军赛在广州落幕
带着这些领悟转身投向Meshy的胡渊鸣⑮,也有了更大的目标⑲。“我要让Meshy最终成为一个能够解放每个人的创造力的公司⑰。” 记者:药厂正全力阻止维尔茨前往拜仁⑮,已与曼城达成口头协议
Diabetes care上也发表过一项研究❷,该研究对13万人进行了6年的随访⑮,结果发现相较于正常血糖的人④,糖尿病以及糖尿病前期患者均面临着全因死亡⑰、心血管死亡风险显着增加问题⑨。如若40岁时罹患糖尿病国安来了⑥,为首钢加油⑲!国安队乘坐双层大巴应援首钢男篮总决赛
拒绝追求3大球星⑳,火箭队目标明确③!有意追求字母哥的的同时⑪,休城又在乐透抽签过程中喜提10号签⑱,权威美媒ESPN更是预测火箭队在二轮选中杨瀚森⑫。阿维塔向博主发律师函④!要求立即删帖并道歉
印度尼西亚军方12日说⑪,西爪哇省加鲁特县一个村庄当天发生爆炸⑥,事发时军人正在销毁过期弹药⑪,爆炸造成4名军人和9名平民死亡▓。长沙国际工程机械展|中联重科近百台设备即将亮相展会
直播吧05月13日前《走进西班牙》节目组采访到了曾加入国少集训队的白涛⑦,他目前正带着儿子在西班牙参加青训⑩,在采访中白涛表示⑭,他已经卖掉了自己的5套房产⑧,立志将两个儿子培养成国足球员①。 八年前⑤,白涛将布朗谈失利:我们都更关心塔图姆的伤势 明天会重新振作起来
据TMZ体育从执法部门消息人士处获悉❷,一名女子指控称⑧,这起袭击事件发生在九月份——当时两人在洛杉矶地区的一处住宅内发生了争执⑯。目前尚不清楚为何该女子在数月后才报案⑬,不过据称她向警方提供了自己受伤的照片