突破性的人工智能将很快从2D视频中生成完整的3D世界

在永无止境的最新推动中人工智能软件巨头英伟达(NVIDIA)推出了一个程序，该程序能够仅根据2D视频片段创建物体的全3D复制品。

这款软件被称为Neuralangelo(神经和米开朗基罗的混合体)，它可以生成逼真的建筑、雕塑、复杂结构和大量其他复杂的3D模型的虚拟复制品。

“Neuralangelo提供的3D重建能力将给创作者带来巨大的好处，帮助他们在数字世界中重建现实世界，”研究高级主管、该报告的合著者刘明宇说Neuralangelo纸。

“这个工具最终将使开发人员能够将详细的物体——无论是小雕像还是大型建筑——导入到视频游戏或工业数字双胞胎的虚拟环境中。”

英伟达并不是第一家创建这种人工智能模型的公司，但可以说是最先进的。虽然之前的版本很难捕捉重复的纹理图案或详细的颜色，但这对Neuralangelo来说不是什么问题。

通过使用物体、结构或场景的2D视频——所有这些都是从不同角度拍摄的——模型选择出某些帧，绘制出结构完整视图的关键角度。

一旦相机的位置决定了每一帧，程序创建一个粗略的场景3D解释。然后优化渲染，锐化细节，并产生最终的3D对象，可以放入虚拟现实，或在一系列行业中使用。

虽然该程序的功能已经公布，但软件本身尚未可供公众使用。

英伟达是今年在人工智能领域押下重注的众多公司之一。Adobe、谷歌(Google)、OpenAI、微软(Microsoft)和许多其他领先公司都投入了数十亿美元来生产这种将接管整个行业的模式。

到目前为止，我们已经看到我试着创造音乐写诗和复杂的代码，甚至制作获奖的艺术品。然而，3D生成是AI需要破解的一大难题。

由于3D形式的复杂性和不可预测性，这并不像2D图像或文字那样容易复制。这是OpenAI试图用它的点e项目，但他承认这是一个复杂的项目。

如果英伟达和其他效仿的公司最终能够创造出一款人工智能3D模型生成器，这将对人工智能领域产生深远的影响。到目前为止，AI艺术所面临的最大问题之一是它无法理解复杂的形状。

因为它是通过2D图像样本进行训练的发电机很难理解手的意思和复杂的形状。随着3d生成模型的加入，它可以更好地理解它试图复制的模型。

阅读更多:

亚历克斯·休斯

Alex是BBC Science Focus的特约撰稿人。他曾在多个科技和科学品牌工作，对消费科技、机器人、人工智能和未来技术感兴趣。

突破性的人工智能很快就能从2D视频中生成完整的3D世界