观点e: OpenAI的3d模型机是如何工作的b| BBC科学焦点杂志

OpenAI去年一直很忙。它的两个大项目一直是互联网的热门话题:Dall-E 2和ChatGPT．在这两个庞大的人工智能平台之间，该公司帮助从一个文字提示生成图像和大量文本。

现在，该公司已经推出了第三款概念车，在圣诞节前推出，以激起大家的兴趣。第三个应用程序现在被命名为Point-E，它遵循类似的模式，仅根据提示创建内容。

什么是e点?它是如何工作的?

在许多方面，Point-E是戴尔- e2的继承者，甚至遵循相同的命名约定。戴尔- e是用来从零开始创建图像的，而Point-E则更进一步，将这些图像转化为3D模型。

宣布在这是OpenAI团队发表的一篇研究论文Point-E的工作分为两部分:首先使用文本到图像的人工智能将你的文字提示转换成图像，然后使用第二个功能将图像转换成3D模型。

dall - e2的工作是创建尽可能高质量的图像，而Point-E创建的图像质量要低得多，只需要足够的3D模型。

与传统的3D模型不同，Point-E实际上并没有生成一个完整的流体结构。相反，它正在生成一个点云(因此得名)。这仅仅意味着一些点点缀在一个空间中，代表一个3D形状。

这显然不会看起来很多，这就是为什么模型有第二步。团队训练了一个额外的人工智能模型来将点转换为网格。这是一种更像物体形状、模具和边缘的东西。

然而，当你处理这么多因素时，事情并不总是完美的。正如OpenAI在研究论文中指出的那样，对象可能会丢失点或导致块状对象。

为了让模型发挥作用，团队必须训练它。这个过程的前半部分，即文本到图像的部分，是按照文字提示进行训练的，就像之前的戴尔- e2一样。这意味着图像要附有替代文本，以帮助模型理解图像中的内容。

然后，图像到3d模型必须以类似的方式进行训练。这台机器接受了类似的训练，提供了一组与3D模型配对的图像，以便Point-E能够理解两者之间的关系。

这种训练重复了数百万次，使用了大量的数据集。在该模型的第一次测试中，point - e能够通过点云重现请求的彩色粗略估计，但它们距离准确表示还有很长的路要走。

这项技术仍处于早期阶段，我们可能还需要一段时间才能看到Point-E制作精确的3D渲染，甚至更长的时间才能让公众像戴尔- e2或ChatGPT那样与它互动。

虽然Point-E还没有通过OpenAI正式发布，但它是可用的通过Github对于那些更有技术头脑的人来说。或者，您可以测试该技术拥抱的脸-一个机器学习社区，此前曾主持过其他大型人工智能项目。

目前，这项技术还处于初级阶段，因此无法产生最准确的反应，但它给了我们一个关于这项技术未来的想法。期待偶尔的长时间等待或长时间加载，因为我们可以想象很多人会通过拥抱脸尝试这项技术。

目前还不清楚OpenAI是否会在发布时向公众提供这项服务，或者最初是否会是一个只有受邀者才能参加的场合。

对于大多数现代人工智能程序，很快就会出现这样的问题:它们的设计目的是什么?随着ChatGPT和dall - e2的出现，人们越来越担心这些平台会取代美工和创意人员。

同样的担忧也可能出现在e点。3D设计是一个巨大的行业，虽然Point-E现在还不能准确地与3D艺术家的工作相匹配，但它可以在未来与这个领域竞争。

然而，据报道，OpenAI每月花费数百万美元来维持这些项目的运行，这类软件的使用和运行成本可能会很高，尤其是像3D渲染这样复杂的东西。

阅读更多:

亚历克斯·休斯

Alex是BBC Science Focus的特约撰稿人。他曾在多个科技和科学品牌工作，对消费科技、机器人、人工智能和未来技术感兴趣。