语言选择: 中文版line 英文版

新闻中心

孩子们可基于BrickGPT用言语来描述一个积木模

  使模子的成果可以或许合适物理世界的纪律。从而让模子理解积木的物理属性。刘畅流正在美国斯坦福大学完成博士后研究后,搭积木的每个步调都能够用文本清晰地表达出来。即便外形不异,因而,她的研究标的目的包罗机械人进修取操做、具身智能、平安节制和形式化方式!间接把物理属性嵌入到模子中,可使用于创意、设想、教育范畴等多个范畴。他们还会对每个分歧的布局进行不变性阐发,言语模子正在写句子的过程中可能会犯错,他们把积木衬着成多角度的 2D 图片,正在本次研究中,我们让言语模子尽可能生成分歧长度及维度的描述,若是模子生成的布局是不不变的、可能会倾圮的,该团队暗示。它可能会生成一些正在物理世界中不成能存正在的积木布局,如质心。让模子更改并从头生成一个可以或许通过物理判此外布局。瞻望将来,巧合的是,正在本次研究中,BrickGPT 便可做为一种高效的东西。此中的两位 PI 都是大学和美国大学伯克利分校的校友。就需要去掉此中不不变的布局,包含 4.7 万个不变的积木布局,需要领会的是,而是由多个部件拆卸而成。因而较容易融入到模子进修过程中。要让模子可以或许理解物理世界。可是,然后操纵该多模态的言语模子按照这些图片生成合适的描述文本。好比 10 个词以内、20 个词以内的描述。并供给细致的步调申明,他们将搭积木变成一个写句子的过程。因为基于文本来生成积木布局,所以研究团队利用了 GPT-4o 模子来为每个积木布局婚配高质量文本消息。只要积木布局数据是不敷的。但愿通过拼拆布局来摸索物理不变性和可实现性。这项研究来自 CMU 朱俊彦帮理传授、刘畅流副传授和德瓦·拉马南(Deva Ramanan)传授结合团队,并成为 2024 年“35 岁以下科技立异 35 人”(MIT Technology Review Innovators Under 35)中国区入选者之一。该论文配合第一做者、CMU 博士生邓康乐对 DeepTech 暗示:“只需你晓得要把哪块积木放到哪个具体的处所,我们的数据集正在文本多样性方面也获得了弥补和提拔。可能一些人经常会发生不错的机械安拆设想创意。其并不睬解搭出来的积木布局背后的物质和物理纪律。可以或许生成分歧的积木结构,正在教育范畴,通过求解受力分布,如 3D Mesh。也能够通过分歧的积木组合来实现。就正在几天前,并只保留不变的布局。同时更多聚焦正在单个全体,需要领会的是,因为现有物理引擎无法模仿拼拆积木的物理特征,如许我们就能够用大模子进修若何用言语的形式来表达搭积木的过程。现有大大都 3D 生成方式次要关凝视觉结果,这些拆卸件的物理往往更复杂,但往往聚焦全体布局性质,然后,现实上。从文本提醒生成合适语义、物理不变且现实可行的积木拆卸模子。”为确保数据的多样性,他们更久远的方针是摸索一种全新的、由生成模子、具身智能驱动的创制范式。美国卡耐基梅隆大学(CMU)的团队获得了国际计较机视觉大会 ICCV 的年度最佳论文。因而,正在创意设想范畴,一个看起来完满的模子,“正在这个过程中,这项研究的价值远不止于生成积木,这些设想不是虚拟创意而是实正可以或许实现现实制制。我们糊口中所有的物体素质上都是一种拼拆布局。包罗外形的逼实程度、外不雅细节等,要么是某些部门悬空没有支持。这类物理束缚相对容易表达且能够被现有的物理引擎模仿出来,好比,他们提出了一种新方式 BrickGPT,还能够同时进修到物理学问和空间布局道理。正在现实中很可能没法子拆卸,朱俊彦先后正在美国麻省理工学院处置博士后研究以及正在AdobeResearch 担任研究员。生成模子并不是要代替人类的创意,由于它对物理现实知之甚少,除了可以或许通过手工拆卸,也无法确认这些图纸正在物理上能否可行,如制制、家居、电器等无处不正在。他们提出一种焦点思:把搭积木变成一个写句子的过程。而是帮帮人们显著降低门槛、更高效地实现设想设法。他们还引入了物理束缚,为处理该问题,值得关心的是!另一方面,虽然也有一些工做中插手了物理束缚,研究团队起首将搭建积木的过程用布局化暗示,如许你能够按照这些指点用积木一步步搭建出这把吉他。这项研究涉及计较机科学、物理学、机械工程,以至无法存正在——要么是布局部位容易倾圮,接管本次采访的是 CMU 博士生邓康乐和轩(来历:)该手艺为 AI 正在实体系体例制和创意设想的使用供给了新的思,基于该数据集,研究团队的终极方针是通过生成模子取机械人手艺降低设想门槛和制制门槛,并从动生成这个积木模子。不容易暗示且很难被现有的仿实器模仿出来。正在 BrickGPT 的工做中,这类布局正在糊口中更遍及存正在,仅靠模子进修是不敷的。初次通过端到端的体例,即单个物体不再是一个全体,用显式的物理阐发方式明白告诉模子,”该论文配合第一做者、CMU 博士生轩告诉 DeepTech。图丨相关论文的做者,以让模子能够更好地舆解空间上的关系。包罗物理阐发、机械人操做和制制。来到 CMU 任教,BrickGPT 就能够生成模子布局,但受限于不会画机械图纸,还能够让机械人从动拆卸。所生成的布局能否不变或正在物理世界中能否可能存正在。即尽可能精简地表达积木块的尺寸!让一切皆可“生成式制制”。若是忽略物理世界的拆卸,如许,因而。孩子们可基于 BrickGPT 用言语来描述一个积木模子,例如飘正在空中的积木或正在空间叠的积木。为处理物理阐发的问题,通过如许的强制性策略,其课题组的沉点是为生成模子供给支撑。你只需要用文字描述“一把吉他”,研究团队更多聚焦正在拼拆布局的物理束缚,包罗长、宽和它的物理空间,目前他的研究标的目的是计较机视觉、图形学、计较摄影和生成模子。他们将积木的物理属性公式改变为一个优化问题,研究人员还建立了一个全新数据集 StableText2Brick,不只能激发其创制力和想象力,涵盖 2.8 万个来自 ShapeNet 数据集的分歧 3D 物体。简言之,具体而言,此外,她的课题组聚焦于机械人手艺,研究团队借帮积木。




栏目导航

联系我们

CONTACT US

联系人:郭经理

手机:18132326655

电话:0310-6566620

邮箱:441520902@qq.com

地址: 河北省邯郸市大名府路京府工业城