OpenAI去年一直很忙。它的两个大项目一直是互联网的热门话题:Dall-E 2ChatGPT.在这两个庞大的人工智能平台之间,该公司帮助从一个文字提示生成图像和大量文本。

广告

现在,该公司已经推出了第三款概念车,在圣诞节前推出,以激起大家的兴趣。第三个应用程序现在被命名为Point-E,它遵循类似的模式,仅根据提示创建内容。

什么是e点?它是如何工作的?

©OpenAI
©OpenAI

在许多方面,Point-E是戴尔- e2的继承者,甚至遵循相同的命名约定。戴尔- e是用来从零开始创建图像的,而Point-E则更进一步,将这些图像转化为3D模型。

宣布在这是OpenAI团队发表的一篇研究论文Point-E的工作分为两部分:首先使用文本到图像的人工智能将你的文字提示转换成图像,然后使用第二个功能将图像转换成3D模型。

dall - e2的工作是创建尽可能高质量的图像,而Point-E创建的图像质量要低得多,只需要足够的3D模型。

与传统的3D模型不同,Point-E实际上并没有生成一个完整的流体结构。相反,它正在生成一个点云(因此得名)。这仅仅意味着一些点点缀在一个空间中,代表一个3D形状。

这显然不会看起来很多,这就是为什么模型有第二步。团队训练了一个额外的人工智能模型来将点转换为网格。这是一种更像物体形状、模具和边缘的东西。

更像这样

然而,当你处理这么多因素时,事情并不总是完美的。正如OpenAI在研究论文中指出的那样,对象可能会丢失点或导致块状对象。

训练模型

©OpenAI
©OpenAI

为了让模型发挥作用,团队必须训练它。这个过程的前半部分,即文本到图像的部分,是按照文字提示进行训练的,就像之前的戴尔- e2一样。这意味着图像要附有替代文本,以帮助模型理解图像中的内容。

然后,图像到3d模型必须以类似的方式进行训练。这台机器接受了类似的训练,提供了一组与3D模型配对的图像,以便Point-E能够理解两者之间的关系。

这种训练重复了数百万次,使用了大量的数据集。在该模型的第一次测试中,point - e能够通过点云重现请求的彩色粗略估计,但它们距离准确表示还有很长的路要走。

这项技术仍处于早期阶段,我们可能还需要一段时间才能看到Point-E制作精确的3D渲染,甚至更长的时间才能让公众像戴尔- e2或ChatGPT那样与它互动。

如何使用e点

虽然Point-E还没有通过OpenAI正式发布,但它是可用的通过Github对于那些更有技术头脑的人来说。或者,您可以测试该技术拥抱的脸-一个机器学习社区,此前曾主持过其他大型人工智能项目。

目前,这项技术还处于初级阶段,因此无法产生最准确的反应,但它给了我们一个关于这项技术未来的想法。期待偶尔的长时间等待或长时间加载,因为我们可以想象很多人会通过拥抱脸尝试这项技术。

目前还不清楚OpenAI是否会在发布时向公众提供这项服务,或者最初是否会是一个只有受邀者才能参加的场合。

e点的应用

©OpenAI

对于大多数现代人工智能程序,很快就会出现这样的问题:它们的设计目的是什么?随着ChatGPT和dall - e2的出现,人们越来越担心这些平台会取代美工和创意人员。

同样的担忧也可能出现在e点。3D设计是一个巨大的行业,虽然Point-E现在还不能准确地与3D艺术家的工作相匹配,但它可以在未来与这个领域竞争。

然而,据报道,OpenAI每月花费数百万美元来维持这些项目的运行,这类软件的使用和运行成本可能会很高,尤其是像3D渲染这样复杂的东西。

阅读更多:

广告

作者

Alex是BBC Science Focus的特约撰稿人。他曾在多个科技和科学品牌工作,对消费科技、机器人、人工智能和未来技术感兴趣。

广告
广告
广告