趣AI | OpenAI 发布 Point-E “3D建模版”DALL-E 来了!

DALL-E2可以说是2022年最火的AI绘画模型之一。最近OpenAI刚刚发布了一个功能更强大的AI模型,可以用于3D建模。

在12月16日提交的一篇论文中,OpenAI团队将Point-E描述为一种从复杂的文本提示中生成3D点云的方法。

有了Point-E,人工智能爱好者可以跳过从文本生成2D图像的阶段,从文本生成3D模型。该项目也已经在Github上开源,模型各参数的权重。

趣AI | OpenAI 发布 Point-E “3D建模版”DALL-E 来了!

模型只是解决方案的一部分。本文的关键在于提出了适用于点云的扩散法创建三维物体的方法。该算法专注于虚拟现实、游戏和工业设计,因为它生成3D对象的速度是当前方法的600倍。

目前有两种从文本生成3D模型的方法。第一种方法是使用3D对象到文本配对在数据上训练生成模型。这导致无法理解更复杂的提示和3D数据集的问题。第二种方法是使用文本图像模型来优化提示的3D表示的创建。

Point-E结合了传统的文本到3D合成训练算法。通过组合两个独立的模型,Point-E可以减少创建的3D对象的数量。第一组算法是文本到图像模型,类似于DALL-E2,它可以创建用户给出的提示图像。该图像然后被用作第二模型的基础,第二模型将图像转换成3D对象。

AI团队创建了一个包含数百万个3D模型的数据集,然后通过Blender导出。然后对这些效果图进行处理,将图像数据提取为点云,这是一种表达3D物体合成密度的方式。在进一步处理之后,例如删除平面对象和通过剪辑特征聚类,数据集可以被输入到视图合成滑动模型中。

然后,研究人员通过将点云表示为形状张量,创建了一种新的点云扩散方法。然后,通过逐步去噪将这些张量从随机形状切割成所需的3D物体的形状。扩散模型的输出通过点云上采样器运行,以提高最终输出的质量。为了与常见的3D应用程序兼容,Blender用于将点云转换为网格。

最后,这些网格可以用于游戏、超宇宙应用或其他3D密集型任务,如电影后期处理。虽然DALL-E已经完全改变了文本到图像的生成过程,但Point-E的目标是为3D领域做同样的事情。

Point-E的Github开源网站:https://github.com/openai/point-e

本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系admin#jikehao.com删除。
(0)
极客号的头像极客号
上一篇 2022年 12月 21日
下一篇 2022年 12月 21日

相关推荐

合作联系:1152QQ041010