Spell 是一个 AI 模型,可从图像生成 3D 世界,支持多种渲染技术。
Spell 是 Spline 推出的 AI 模型,能够从单张图像生成完整的 3D 场景。它基于扩散模型技术,通过结合真实数据和合成数据进行训练,能够在几分钟内生成具有多视图一致性的 3D 世界。该技术的主要优点是能够快速生成高质量的 3D 场景,并支持多种渲染技术如高斯绘制和神经辐射场等。Spell 的出现为 3D 设计领域带来了革命性的变化,使创作者能够更高效地生成和探索 3D 场景。目前,Spell 仍处于开发阶段,团队计划频繁更新模型以提升质量和一致性。
一种用于控制人类图像动画的方法
DisPose是一种用于控制人类图像动画的方法,它通过运动场引导和关键点对应来提高视频生成的质量。这项技术能够从参考图像和驱动视频中生成视频,同时保持运动对齐和身份信息的一致性。DisPose通过从稀疏的运动场和参考图像生成密集的运动场,提供区域级别的密集引导,同时保持稀疏姿态控制的泛化能力。此外,它还从参考图像中提取与姿态关键点对应的扩散特征,并将这些点特征转移到目标姿态,以提供独特的身份信息。DisPose的主要优点包括无需额外的密集输入即可提取更通用和有效的控制信号,以及通过即插即用的混合ControlNet提高生成视频的质量和一致性,而无需冻结现有模型参数。
Nerfstudio是一个模块化的神经辐射场开发框架
Nerfstudio是一个开源的神经辐射场(NeRF)开发框架,它提供了简单易用的API,支持模块化的NeRF构建和训练。Nerfstudio帮助用户更轻松地理解和探索NeRF技术,并提供了教程、文档和更多学习资源。欢迎用户贡献新的NeRF模型和数据集。Nerfstudio的主要功能包括模型训练、数据处理、可视化等。
多视角草图引导的文本到 3D 生成
Sketch2NeRF 是一种多视角草图引导的文本到 3D 生成框架。它通过预训练的 2D 扩散模型(如 Stable Diffusion 和 ControlNet)来优化由神经辐射场(NeRF)表示的 3D 场景。该方法还提出了一种新颖的同步生成和重建方法,以有效优化 NeRF。通过收集的两种多视角草图数据集进行实验评估,证明了我们的方法能够在高保真度的文本提示下合成具有精细草图控制的一致的 3D 内容。广泛的结果表明,我们的方法在草图相似性和文本对齐方面实现了最先进的性能。
© 2025 AIbase 备案号:闽ICP备08105208号-14