point e: OpenAI的Dall-E继任者如何使用AI来塑造你的3D梦想
从一个简单的文字提示,你将能够创建任何3D模型。
OpenAI去年一直很忙。它的两个大项目一直是互联网的热门话题:Dall-E 2和ChatGPT.在这两个庞大的人工智能平台之间,该公司帮助从一个文字提示生成图像和大量文本。
现在,该公司已经推出了第三款概念车,在圣诞节前推出,以激起大家的兴趣。第三个应用程序现在被命名为Point-E,它遵循类似的模式,仅根据提示创建内容。
什么是e点?它是如何工作的?
在许多方面,Point-E是戴尔- e2的继承者,甚至遵循相同的命名约定。戴尔- e是用来从零开始创建图像的,而Point-E则更进一步,将这些图像转化为3D模型。
宣布在这是OpenAI团队发表的一篇研究论文Point-E的工作分为两部分:首先使用文本到图像的人工智能将你的文字提示转换成图像,然后使用第二个功能将图像转换成3D模型。
dall - e2的工作是创建尽可能高质量的图像,而Point-E创建的图像质量要低得多,只需要足够的3D模型。
与传统的3D模型不同,Point-E实际上并没有生成一个完整的流体结构。相反,它正在生成一个点云(因此得名)。这仅仅意味着一些点点缀在一个空间中,代表一个3D形状。
这显然不会看起来很多,这就是为什么模型有第二步。团队训练了一个额外的人工智能模型来将点转换为网格。这是一种更像物体形状、模具和边缘的东西。
更像这样
然而,当你处理这么多因素时,事情并不总是完美的。正如OpenAI在研究论文中指出的那样,对象可能会丢失点或导致块状对象。
训练模型
为了让模型发挥作用,团队必须训练它。这个过程的前半部分,即文本到图像的部分,是按照文字提示进行训练的,就像之前的戴尔- e2一样。这意味着图像要附有替代文本,以帮助模型理解图像中的内容。
然后,图像到3d模型必须以类似的方式进行训练。这台机器接受了类似的训练,提供了一组与3D模型配对的图像,以便Point-E能够理解两者之间的关系。
这种训练重复了数百万次,使用了大量的数据集。在该模型的第一次测试中,point - e能够通过点云重现请求的彩色粗略估计,但它们距离准确表示还有很长的路要走。
这项技术仍处于早期阶段,我们可能还需要一段时间才能看到Point-E制作精确的3D渲染,甚至更长的时间才能让公众像戴尔- e2或ChatGPT那样与它互动。
如何使用e点
虽然Point-E还没有通过OpenAI正式发布,但它是可用的通过Github对于那些更有技术头脑的人来说。或者,您可以测试该技术拥抱的脸-一个机器学习社区,此前曾主持过其他大型人工智能项目。
目前,这项技术还处于初级阶段,因此无法产生最准确的反应,但它给了我们一个关于这项技术未来的想法。期待偶尔的长时间等待或长时间加载,因为我们可以想象很多人会通过拥抱脸尝试这项技术。
目前还不清楚OpenAI是否会在发布时向公众提供这项服务,或者最初是否会是一个只有受邀者才能参加的场合。
e点的应用
对于大多数现代人工智能程序,很快就会出现这样的问题:它们的设计目的是什么?随着ChatGPT和dall - e2的出现,人们越来越担心这些平台会取代美工和创意人员。
同样的担忧也可能出现在e点。3D设计是一个巨大的行业,虽然Point-E现在还不能准确地与3D艺术家的工作相匹配,但它可以在未来与这个领域竞争。
然而,据报道,OpenAI每月花费数百万美元来维持这些项目的运行,这类软件的使用和运行成本可能会很高,尤其是像3D渲染这样复杂的东西。
阅读更多: