需求人群:
"适用于3D形状生成、形状完成等场景"
使用场景示例:
在设计领域中用于生成各种3D形状
用于工程建模中的形状完成
在游戏开发中用于快速生成游戏场景中的各种形状
产品特色:
高效训练大规模数据
利用1000万个公开可用的形状
小波树表示法编码形状
生成扩散模型
子带自适应训练策略
受额外输入条件控制生成形状
无条件生成、形状完成和条件生成
浏览量:20
最新流量情况
月访问量
22216.76k
平均访问时长
00:04:50
每次访问页数
5.52
跳出率
47.80%
流量来源
直接访问
46.24%
自然搜索
30.97%
邮件
0.78%
外链引荐
13.53%
社交媒体
8.45%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
15.26%
美国
13.36%
印度
6.45%
俄罗斯
3.91%
法国
3.77%
Champ:一种用于生成 3D 物体形状的生成模型
Champ 是一种用于生成 3D 物体形状的生成模型,它结合了隐函数和卷积神经网络,以生成高质量、多样化和逼真的 3D 形状。它可以生成各种类别的形状,包括动物、车辆和家具。
生成高质量的3D纹理形状
GET3D是一个生成高质量的3D纹理形状的生成模型。它能够生成具有复杂拓扑结构、丰富几何细节和高保真度纹理的3D网格。GET3D通过可微分的表面建模、可微分的渲染以及2D生成对抗网络的方法进行训练。它能够生成各种高质量的3D纹理形状,包括汽车、椅子、动物、摩托车、人物和建筑等。
TikTok验证码解决API
SadCaptcha是一个解决TikTok验证码的插件,它可以快速、准确地解决TikTok的旋转、拼图和3D形状验证码。它使用先进的计算机视觉算法,能够高效解决验证码,并且适用于任何设备和屏幕分辨率。
通过视频生成实现基于物理的3D对象交互
PhysDreamer是一个基于物理的方法,它通过利用视频生成模型学习到的对象动力学先验,为静态3D对象赋予交互式动力学。这种方法允许在缺乏真实物体物理属性数据的情况下,模拟出对新颖交互(如外力或代理操作)的真实反应。PhysDreamer通过用户研究评估合成交互的真实性,推动了更吸引人和真实的虚拟体验的发展。
通过交互式3D生成技术,实现高质量且可控的3D模型创建。
Interactive3D是一个先进的3D生成模型,它通过交互式设计为用户提供了精确的控制能力。该模型采用两阶段级联结构,利用不同的3D表示方法,允许用户在生成过程的任何中间步骤进行修改和引导。它的重要性在于能够实现用户对3D模型生成过程的精细控制,从而创造出满足特定需求的高质量3D模型。
一种用于逆渲染的先进学习扩散先验方法,能够从任意图像中恢复物体材质并实现单视图图像重照明。
IntrinsicAnything 是一种先进的图像逆渲染技术,它通过学习扩散模型来优化材质恢复过程,解决了在未知静态光照条件下捕获的图像中物体材质恢复的问题。该技术通过生成模型学习材质先验,将渲染方程分解为漫反射和镜面反射项,利用现有丰富的3D物体数据进行训练,有效地解决了逆渲染过程中的歧义问题。此外,该技术还开发了一种从粗到细的训练策略,利用估计的材质引导扩散模型产生多视图一致性约束,从而获得更稳定和准确的结果。
用于评估文本到视觉生成的创新性指标和基准测试
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。
CRM是一个高保真的单图像到3D纹理网格的卷积重建模型
CRM是一个高保真的单图像到3D纹理网格的生成模型,它通过整合几何先验到网络设计中,能够从单个输入图像生成六个正交视图图像,然后利用卷积U-Net创建高分辨率的三平面(triplane)。CRM进一步使用Flexicubes作为几何表示,便于在纹理网格上进行直接的端到端优化。整个模型能够在10秒内从图像生成高保真的纹理网格,无需测试时优化。
生成条件文本或图像的 3D 对象
Shap-E 是一个生成条件 3D 隐函数的官方代码和模型发布库。它可以根据文本或图像生成 3D 对象。该产品采用了最新的生成模型,可以根据给定的提示生成与之相关的三维模型。
单扫描生成可动画资产
GALA是一个框架,它以单层着衣的3D人体网格作为输入,并将其分解为完整的多层3D资产。输出可以与其他资产组合,创造出任意姿势的新颖着衣人体化身。通过一系列分解步骤,我们在共享的规范空间中获得了多层3D资产,以姿势和人体形状进行了规范化,从而支持对新身份的轻松组合和对新姿势的重新动画。我们的实验证明了我们的方法相对于现有解决方案在分解、规范化和组合任务中的有效性。
开源的3D生成模型评价工具
GPTEval3D是一个开源的3D生成模型评价工具,基于GPT-4V实现了对文本到3D生成模型的自动评测。它可以计算生成模型的ELO分数,并与现有模型进行对比排名。该工具简单易用,支持用户自定义评测数据集,可以充分发挥GPT-4V的评测效果,是研究3D生成任务的有力工具。
基于文本条件的3D发型生成模型
HAAR是一种基于文本输入的生成模型,可生成逼真的3D发型。它采用文本提示作为输入,生成准备用于各种计算机图形动画应用的3D发型资产。与当前基于AI的生成模型不同,HAAR利用3D发丝作为基础表示,通过2D视觉问答系统自动注释生成的合成发型模型。我们提出了一种基于文本引导的生成方法,使用条件扩散模型在潜在的发型UV空间生成引导发丝,并使用潜在的上采样过程重建含有数十万发丝的浓密发型,给定文本描述。生成的发型可以使用现成的计算机图形技术进行渲染。
利用文本描述在网格上自动生成局部风格化纹理
3D Paintbrus是一种通过文本描述自动为网格上的局部语义区域添加纹理的技术。该方法直接操作于网格上,生成无缝集成到标准图形流水线中的纹理贴图。同时产生指定编辑区域的本地化贴图和与之相适配的纹理贴图。我们利用级联扩散模型的多个阶段来监督局部编辑技术,从而增强纹理区域的细节和分辨率。该技术被称为级联分数蒸馏(CSD),能够同时以级联方式蒸馏多个分辨率的分数,实现对监督的粒度和全局理解的控制。我们展示了3D画笔在局部为不同语义区域内的各种形状添加纹理的有效性。
单文本/图像生成可导航3D场景
LucidDreamer是一种无域3D场景生成技术,通过充分利用现有大规模扩散生成模型的能力,可以从单个文本提示或单个图像生成可导航的3D场景。该方法具有梦境和对齐两个交替步骤,首先根据输入生成多视角一致的图像,然后将新生成的3D场景部分和谐地整合在一起。LucidDreamer生成的高度详细的高斯斑点与以往的3D场景生成方法相比没有目标场景域的限制。
Luma 的 3D 生成基础模型研究预览
Genie 是 Luma 的 3D 生成基础模型的研究预览版。它可以生成各种三维模型,用于设计、创作和娱乐等领域。Genie 提供了丰富的功能,包括形状生成、纹理绘制、动画创建等。它可以应用于游戏开发、虚拟现实、电影特效等多个领域。Genie 的定价和定位将在正式发布前确定。
自动化生产中的最佳质量3D打印。
iFactory3D打印机One Pro的流水线3D打印技术可以在自动化制造中制造几乎无限长度和最佳3D质量的物体。这种创新的制造技术可以打印复杂的几何形状而无需支撑结构。iFactory3D流水线3D打印技术在商业应用中具有许多优点,并可以实现无限制的连续生产。
一键生成3D模型
Farm3D是一款能够从单张图片生成可控的3D模型的软件。它通过使用图像生成器Stable Diffusion来产生训练数据,从而学习一个单目重建网络。该网络可以从单张输入图片中生成具有细节的3D模型,包括形状、外观、视角和光照方向等。Farm3D适用于设计师、艺术家和模型制作人员,能够快速生成高质量的3D模型。
基于图像学习的高质量3D纹理形状生成模型
GET3D是一种基于图像学习的生成模型,可以直接生成具有复杂拓扑结构、丰富几何细节和高保真纹理的3D模型。通过结合可微分表面建模、可微分渲染和2D生成对抗网络,我们从2D图像集合中训练了该模型。GET3D能够生成高质量的3D纹理模型,涵盖了汽车、椅子、动物、摩托车和人物等各种形态,相比之前的方法有显著改进。
3D建模无忧
Sloyd是一个快速生成3D模型的平台。选择一个生成器,进行微调,即可完成。可以通过实时预览来生成模型。Sloyd提供不断扩展的生成器库,快速定制模型,可用于实时渲染和多种级别的细节。生成的模型可以根据需要进行定制,并且已经进行了UV展开和优化,方便进行贴图和使用。Sloyd适用于各种风格的模型,提供无限的变化,并且支持实时生成。
一种用于实时渲染大型数据集的分层3D高斯表示方法
这项研究提出了一种新的分层3D高斯表示方法,用于实时渲染非常大的数据集。该方法通过3D高斯splatting技术提供了优秀的视觉质量、快速的训练和实时渲染能力。通过分层结构和有效的细节层次(Level-of-Detail, LOD)解决方案,可以高效渲染远处内容,并在不同层次之间实现平滑过渡。该技术能够适应可用资源,通过分而治之的方法训练大型场景,并将其整合到一个可以进一步优化以提高高斯合并到中间节点时的视觉质量的层级结构中。
为角色动画提供直观且价格合理的动作捕捉工具。
Rokoko是一款基于传感器的动作捕捉系统,为3D数字创作者提供高质量的身体、手指和面部动画解决方案。它具有直观易用的界面和负担得起的价格,可帮助用户轻松实现逼真的角色动画。
一款面向高质量长视频生成的实验性框架,具有扩展序列长度和增强动态特性。
Mira(Mini-Sora)是一个实验性的项目,旨在探索高质量、长时视频生成领域,特别是在模仿Sora风格的视频生成方面。它在现有文本到视频(T2V)生成框架的基础上,通过以下几个关键方面实现突破:扩展序列长度、增强动态特性以及保持3D一致性。目前,Mira项目处于实验阶段,与Sora等更高级的视频生成技术相比,仍有提升空间。
赛灵力虚拟数字人工厂提供 AI 虚拟人视频创作服务,让数字人拥有真人般交互能力。
赛灵力虚拟数字人工厂致力于 2D 虚拟人、3D 虚拟人、声音克隆等 AI 技术探索和产业应用,为企业、政府、个人提供虚拟数字人 AI 视频创作、个人形象定制、声音定制、智能语音合成等服务。
将您的照片变为生动的3D角色,并使用Mug Me,Emojimation和Pose Controls创建有趣的生动表情。
Mug Life通过将计算机图形学专业知识与最新的计算机视觉技术相结合,创造出令人惊叹的3D角色。其技术分为三个阶段:拆解、动画和重构,结合社交平台,让用户能够连接和分享创作。
无需拍摄、剪辑,一键生成 3D 视频
有言是一站式 AIGC 视频创作平台,提供上千个高质量的 3D 虚拟人角色选择,无需真人出镜。用户无需拍摄、剪辑,一键生成场景、灯光、动画、运镜和镜头,还集成了智能镜头剪辑、高质量视频后期包装。价格分为免费和付费订阅两种模式,定位于帮助用户简单快速地制作高质量视频。
定制3D头像,提升在线身份
Avatic 3D Avatars是一个定制3D头像服务,适用于游戏、社交和职业平台。通过将您的照片转换为个性化的半逼真3D头像,提升您的在线身份。无论您是为了保护隐私还是为了给您的在线形象添加独特的个性,我们的定制3D头像服务都是您一直在寻找的解决方案。我们的头像由经验丰富的3D艺术家使用Blender和Photoshop制作,呈现出独特的玩具感。我们提供100%的退款保证和无限次的修改,以确保您对最终成品完全满意。
© 2024 AIbase 备案号:闽ICP备2023012347号-1