OpenAI 的 Shap-E 是什么?
Shap-E 是 OpenAI 开发的一款创新工具,利用条件生成模型来生成 3D 资产。它在配对 3D 图像和文本的大型数据集上进行训练,使其能够从文本或图像输入生成逼真且多样化的 3D 模型。 Shap-E 采用基于 Transformer 的编码器-解码器架构和神经网络来学习 3D 形状的潜在表示。通过组合这些组件,它可以生成新颖的形状视图,并将文本或图像与相应的 3D 模型相关联。
Shap-E 生成的 3D 输出有两种形式:纹理网格和神经辐射场 (NeRF)。纹理网格是具有表面颜色的多边形模型,适用于具有简单几何和纹理的低分辨率形状。另一方面,NeRF 是连续函数,可将 3D 坐标映射到颜色和密度,捕获具有复杂几何形状和外观的高分辨率形状。文本提示或图像可以用作 Shap-E 的输入来生成这些 3D 输出。
Shap-E 扩展了其前身 DALL-E 的功能,DALL-E专注于根据文本提示生成 2D 图像。它利用隐式函数的概念(以数学方式定义形状)来生成 3D 资产。这种方法允许 Shap-E 根据给定的输入(例如文本描述或图像)生成不同的 3D 形状。
如何使用 OpenAI 的 Shap-E?
与其他 OpenAI 工具不同,Shap-E 尚未向公众发布,但您可以通过从Shap-E GitHub 页面下载来访问其模型权重、推理代码和示例。要使用 Shap-E,您可以遵循以下准则:
- 下载并安装:从 Shap-E GitHub 页面下载 Shap-E 代码和模型权重后,使用 Python 的 pip 命令安装必要的依赖项。需要注意的是,Shap-E 是资源密集型的,需要 NVIDIA GPU 和高性能 CPU 才能获得最佳性能。
- 本地执行:与其他 OpenAI 工具不同,Shap-E 在您的 PC 上本地运行,无需OpenAI API 密钥或互联网连接。这使您可以完全控制该工具的功能。
- Jupyter Notebooks: OpenAI 提供了几个示例 Jupyter Notebooks,演示了 Shap-E 的不同用例。
- 文本转 3D:使用“ sample_text_to_3d.ipynb ”笔记本,您可以根据文本提示生成 3D 模型。输入所需的文本,Shap-E 将生成一个动画 GIF,从各个角度展示模型。此外,还会生成一个 PLY 文件,可以在 Paint 3D 或 Blender 等程序中打开该文件。
- 图像到 3D: “ sample_image_to_3d.ipynb ”笔记本允许您生成以图像为条件的 3D 模型。上传您选择的图像,Shap-E 将生成与文本转 3D 笔记本类似的输出,提供动画 GIF 和表示生成的 3D 模型的 PLY 文件。
- 模型编码: “ encode_model.ipynb ”笔记本演示了如何加载现有的 3D 模型或修剪网格,创建多视图渲染和点云,使用 Shap-E 将它们编码为潜在向量,然后将它们渲染回 3D 模型。此笔记本需要在您的 PC 上安装 Blender 3.3.1 或更高版本。
- 定制和故障排除: Shap-E 的 GitHub 页面提供了额外的资源,用于报告问题并查找使用过程中遇到的问题的解决方案。通过与 GitHub 页面上的社区互动,您可以解决可能遇到的任何困难,并探索增强 Shap-E 体验的方法。
您可以使用 OpenAI 的 Shap-E 做什么?
Shap-E 是一种超越 OpenAI 的 POINT-E 的高级工具。POINT-E 生成的 3D 点云存在模糊或不完整的形状等限制,而Shap-E 则提供了复杂想法的更清晰的视觉表示。以下是您可以使用 Shap-E 做的一些令人兴奋的事情:
快速 3D 实物创建
Shap-E 通过在几秒钟内生成复杂的模型,彻底改变了创建 3D 资产的过程。它可应用于电影、虚拟现实体验、工程模拟和科学研究等行业。它能够快速生成详细的 3D 模型,从而能够更快地迭代和探索设计概念。
建筑可视化
建筑师可以利用 Shap-E 将书面描述转换为建筑物和结构的 3D 模型。通过简单的句子指定尺寸、材料、颜色和风格,建筑师可以轻松地可视化和完善他们的设计。然后可以将这些模型导出到其他软件以进行进一步编辑和协作。
游戏和动画
Shap-E 使游戏玩家和动画艺术家能够增强虚拟环境和视觉体验。通过创建复杂的 3D 对象和角色,游戏开发人员可以增强游戏玩法,让玩家沉浸在迷人的世界中。动画艺术家可以利用 Shap-E 生成细节丰富、视觉上吸引人的角色,将他们的愿景变为现实。
教育与传播
通过帮助教育工作者向学生传达复杂而抽象的想法,Shap-E 被证明在教育领域具有无价的价值。在生物学、几何学和物理学等学科中,教育工作者可以使用 Shap-E 生成 3D 模型,以可视化和解释复杂的想法。该工具为学生提供了更具吸引力和身临其境的学习体验。
创意探索
Shap-E 允许用户根据自己的想象力或灵感生成 3D 对象,从而鼓励创造性探索。无论是设计独特的产品、创作艺术雕塑,还是生成荒诞异想天开的形状,Shap-E 都提供了一个实验平台,并将创意变为现实。
使用 OpenAI 的 Shap-E 生成 3D 模型
OpenAI 的 Shap-E 是一款令人印象深刻的 AI 驱动工具,可以根据文本提示或图像生成 3D 模型。通过利用这项技术,您可以为各种目的创建多样化且连贯的 3D 对象,例如计算机游戏、交互式 VR 体验、原型等。
使用 Shap-E 生成 3D 模型的过程涉及提供描述所需对象的文本提示。例如,“一条喷火的龙”、“一把看起来像牛油果的椅子”或“一艘宇宙飞船”等提示都可以生成相应的3D模型。Shap-E 生成这些模型的能力证明了其在 3D 领域释放创造力和探索的潜力。
虽然生成模型的质量和准确性根据提示的复杂性和特异性而有所不同,但 OpenAI 正在不断改进 Shap-E。输出有时可能不完整、扭曲或不切实际。但是,通过调整参数或尝试不同的提示,您可以达到预期的结果。
要亲自尝试 Shap-E,您可以从 OpenAI 的GitHub存储库访问代码和模型。这使您可以在 PC 上运行该工具并直接探索其功能。
结论
Shap-E 引入了一种创新且令人愉悦的模型,该模型利用生成式 AI 的力量将文本或图像转换为令人惊叹的 3D 对象。它有多种用途,包括设计、学习和教学。您可以自由地尝试不同的输入和输出来探索其功能。
如果您有兴趣亲自尝试 Shap-E,可以从 GitHub 下载它并按照示例笔记本中的说明进行操作。此外,您还可以与 Shap-E 社区联系,分享您的经验和创作,并参与协作平台。与Shap-E一起享受探索和创造的旅程!
文章翻译自:mlyearning;原文链接:https://www.mlyearning.org/openai-shap-e/

