需求人群:
"将多张图像转换成3D模糊图像, 可用于3D渲染、虚拟现实等场景"
使用场景示例:
将旅游景点照片转换成3D模糊,制作虚拟旅游体验
捕捉艺术品或雕塑照片,生成3D模糊用于线上展示
将人物照片制作成3D模糊头像,用于社交媒体
产品特色:
免费将图像转换为3D高斯模糊图像
支持预览、分享和导出生成的3D模糊图像
提供Gallery浏览和分享社区创作
浏览量:33
最新流量情况
月访问量
373.96k
平均访问时长
00:05:41
每次访问页数
3.37
跳出率
46.09%
流量来源
直接访问
51.27%
自然搜索
41.32%
邮件
0.38%
外链引荐
2.43%
社交媒体
4.60%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
美国
21.42%
英国
9.80%
德国
6.37%
俄罗斯
5.04%
捷克
3.87%
一款面向高质量长视频生成的实验性框架,具有扩展序列长度和增强动态特性。
Mira(Mini-Sora)是一个实验性的项目,旨在探索高质量、长时视频生成领域,特别是在模仿Sora风格的视频生成方面。它在现有文本到视频(T2V)生成框架的基础上,通过以下几个关键方面实现突破:扩展序列长度、增强动态特性以及保持3D一致性。目前,Mira项目处于实验阶段,与Sora等更高级的视频生成技术相比,仍有提升空间。
通过视频生成实现基于物理的3D对象交互
PhysDreamer是一个基于物理的方法,它通过利用视频生成模型学习到的对象动力学先验,为静态3D对象赋予交互式动力学。这种方法允许在缺乏真实物体物理属性数据的情况下,模拟出对新颖交互(如外力或代理操作)的真实反应。PhysDreamer通过用户研究评估合成交互的真实性,推动了更吸引人和真实的虚拟体验的发展。
通过交互式3D生成技术,实现高质量且可控的3D模型创建。
Interactive3D是一个先进的3D生成模型,它通过交互式设计为用户提供了精确的控制能力。该模型采用两阶段级联结构,利用不同的3D表示方法,允许用户在生成过程的任何中间步骤进行修改和引导。它的重要性在于能够实现用户对3D模型生成过程的精细控制,从而创造出满足特定需求的高质量3D模型。
一种用于逆渲染的先进学习扩散先验方法,能够从任意图像中恢复物体材质并实现单视图图像重照明。
IntrinsicAnything 是一种先进的图像逆渲染技术,它通过学习扩散模型来优化材质恢复过程,解决了在未知静态光照条件下捕获的图像中物体材质恢复的问题。该技术通过生成模型学习材质先验,将渲染方程分解为漫反射和镜面反射项,利用现有丰富的3D物体数据进行训练,有效地解决了逆渲染过程中的歧义问题。此外,该技术还开发了一种从粗到细的训练策略,利用估计的材质引导扩散模型产生多视图一致性约束,从而获得更稳定和准确的结果。
赛灵力虚拟数字人工厂提供 AI 虚拟人视频创作服务,让数字人拥有真人般交互能力。
赛灵力虚拟数字人工厂致力于 2D 虚拟人、3D 虚拟人、声音克隆等 AI 技术探索和产业应用,为企业、政府、个人提供虚拟数字人 AI 视频创作、个人形象定制、声音定制、智能语音合成等服务。
将您的照片变为生动的3D角色,并使用Mug Me,Emojimation和Pose Controls创建有趣的生动表情。
Mug Life通过将计算机图形学专业知识与最新的计算机视觉技术相结合,创造出令人惊叹的3D角色。其技术分为三个阶段:拆解、动画和重构,结合社交平台,让用户能够连接和分享创作。
无需拍摄、剪辑,一键生成 3D 视频
有言是一站式 AIGC 视频创作平台,提供上千个高质量的 3D 虚拟人角色选择,无需真人出镜。用户无需拍摄、剪辑,一键生成场景、灯光、动画、运镜和镜头,还集成了智能镜头剪辑、高质量视频后期包装。价格分为免费和付费订阅两种模式,定位于帮助用户简单快速地制作高质量视频。
定制3D头像,提升在线身份
Avatic 3D Avatars是一个定制3D头像服务,适用于游戏、社交和职业平台。通过将您的照片转换为个性化的半逼真3D头像,提升您的在线身份。无论您是为了保护隐私还是为了给您的在线形象添加独特的个性,我们的定制3D头像服务都是您一直在寻找的解决方案。我们的头像由经验丰富的3D艺术家使用Blender和Photoshop制作,呈现出独特的玩具感。我们提供100%的退款保证和无限次的修改,以确保您对最终成品完全满意。
快速生成三维模型的AI工具
AI 3D Generation是Spline推出的一款3D设计工具,它支持文本到3D生成和图像到3D生成,允许用户通过简单的文本提示或2D图像自动创建出详细且精确的3D模型。该工具具有生成变体与混合、直观且适合初学者、创建独特的3D库、平台集成与实时协作、易于集成和发布等功能。
连接3D可定制的AI伙伴。
ioPartners是您的个人AI助手,与您的3D AI ioPartner进行无尽对话,定制外观、互动,并塑造其个性特点,以打造完美的伙伴,共同创造独特的故事和体验。记忆保留功能让您的AI伙伴记住对话的细节,打造个性化和不断发展的互动。通过选择和组合不同特点,为您的ioPartner塑造独特的个性。保护您的隐私,对话保密,不与第三方共享数据。无需下载或安装,直接在浏览器上运行。
基于预训练的文本到图像模型生成高质量、多视角一致的3D物体图像。
ViewDiff 是一种利用预训练的文本到图像模型作为先验知识,从真实世界数据中学习生成多视角一致的图像的方法。它在U-Net网络中加入了3D体积渲染和跨帧注意力层,能够在单个去噪过程中生成3D一致的图像。与现有方法相比,ViewDiff生成的结果具有更好的视觉质量和3D一致性。
用于评估文本到视觉生成的创新性指标和基准测试
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。
在线VR看房与虚拟家装的技术提供者
123看房是国内主流看房技术方案的定义者,通过全景照片进行3D建模技术的始创者。提供在线VR看房与虚拟家装的技术,可以通过全景图生成3D模型。其技术创造了低成本、高效率、易操作的全景看房和虚拟家装方案。该产品适用于房地产行业,可以实现远程看房、720全景、商业空间等多种功能。
通过 3D 空间跟踪 2D 像素,提升视频追踪性能
SpatialTracker 是 CVPR 2024 年亮点之一的一项研究成果,致力于在 3D 空间中恢复视频中密集的像素运动。该方法通过将 2D 像素提升到 3D 空间,使用三平面表示表示每一帧的 3D 内容,并迭代更新转换器来估计 3D 轨迹。在 3D 中跟踪允许我们利用刚性约束,同时学习一个刚性嵌入,将像素聚集到不同的刚性部分中。与其他追踪方法相比,SpatialTracker 在质量和量度方面都取得了优异的成绩,尤其是在具有出平面旋转的具有挑战性的情况下。
从单张 RGB 图像生成多个逼真的 3D 人体重建
DiffHuman 是一种概率性的光度逼真的 3D 人体重建方法。它可以从单张 RGB 图像预测一个 3D 人体重建的概率分布,并通过迭代降噪采样多个细节丰富、色彩鲜明的 3D 人体模型。与现有的确定性方法相比,DiffHuman 在未知或不确定区域能生成更加细节丰富的重建结果。同时,我们还引入了一个加速渲染的生成网络,大幅提高了推理速度。
Hillbot是一家专注于机器人基础模型的公司,旨在为工业和家庭任务提供AI驱动的机器人
Hillbot致力于机器人创新的前沿,通过为机器人提供AI大脑和适应性技能,使其能够在复杂环境中执行复杂任务。公司在收集真实世界和模拟数据方面的专业知识,显著扩展了机器人基础模型的训练数据集。通过在3D场景捕捉、模拟和机器人学习算法方面的核心技术,Hillbot不仅在制造机器人,还在定义具身AI(AI与机器人技术的融合)的边界,以增强所有领域的能力。
通过文本指令自动生成和动画化卡通人物的3D纹理
Make-It-Vivid是一种创新的模型,能够根据文本指令自动生成和动画化卡通人物的3D纹理。它解决了传统方式制作3D卡通角色纹理的挑战,提供了高效、灵活的解决方案。该模型通过预训练的文本到图像扩散模型生成高质量的UV纹理图,并引入对抗性训练来增强细节。它可以根据不同的文本prompt生成各种风格的角色纹理,并将其应用到3D模型上进行动画制作,为动画、游戏等领域提供了便利的创作工具。
Garment3DGen是一个在线工具,可以生成3D服装模型
Garment3DGen是一个基于网络的工具,它允许用户通过简单的拖放界面来创建和预览3D服装模型。用户可以选择不同的服装类型,调整尺寸和颜色,然后生成可以用于进一步设计或打印的3D模型。
SceneScript:通过Reality Labs研究实现3D场景重建
SceneScript是Reality Labs研究团队开发的一种新型3D场景重建技术。该技术利用AI来理解和重建复杂的3D场景,能够从单张图片中创建详细的3D模型。SceneScript通过结合多种先进的深度学习技术,如半监督学习、自监督学习和多模态学习,显著提高了3D重建的准确性和效率。
Champ:一种用于生成 3D 物体形状的生成模型
Champ 是一种用于生成 3D 物体形状的生成模型,它结合了隐函数和卷积神经网络,以生成高质量、多样化和逼真的 3D 形状。它可以生成各种类别的形状,包括动物、车辆和家具。
一句话 GET 高品质营销海报
美间 AI 是一款智能设计平台,提供智能海报、提案 PPT、场景拼搭等功能。用户可以轻松生成高品质营销海报、快速产出意向提案,以及拖拽商品图生成 3D 效果图。该产品设计灵感丰富,使用便捷,定位于帮助用户快速实现创意设计需求。
AI社区共建未来,开源开放科学推进AI民主化
Hugging Face是一个AI社区平台,致力于通过开源和开放科学的方式来推进人工智能的发展和民主化。它为机器学习社区提供了协作模型、数据集和应用程序的环境。主要优势包括:1)协作平台,可无限托管和共享模型、数据集和应用程序。2)开源堆栈,加速ML开发流程。3)支持多模态(文本、图像、视频、音频、3D等)。4)建立ML作品集,在全球分享你的作品。5)付费计算和企业解决方案,提供优化的推理端点、GPU支持等。
基于JST-1视频-3D基础模型的可控视频生成
VIGGLE是一款基于JST-1视频-3D基础模型的可控视频生成工具。它可以让任何角色按照您的要求移动。JST-1是第一个具有实际物理理解能力的视频-3D基础模型。VIGGLE的优势在于其强大的视频生成和控制能力,可以根据用户需求生成各种动作和情节的视频。它定位于视频创作者、动画师和内容创作者等专业人群,帮助他们更高效地制作视频内容。目前VIGGLE处于测试阶段,未来可能会推出付费订阅版本。
一键将你的脸部照片转成各种好玩的风格
Face to Many 可以将一张面部照片转变成多种风格,包括 3D、表情符号、像素艺术、电子游戏风格、粘土动画或玩具风格。用户只需上传一张照片,然后选择想要转换的风格,即可轻松创建奇妙有趣的面部艺术作品。产品提供多种参数供用户自定义,包括降噪强度、提示强度、深度控制强度和 InstantID 强度。
从单张图片生成高质量3D视图和新颖视角的3D生成技术
Stable Video 3D是Stability AI推出的新模型,它在3D技术领域取得了显著进步,与之前发布的Stable Zero123相比,提供了大幅改进的质量和多视角支持。该模型能够在没有相机条件的情况下,基于单张图片输入生成轨道视频,并且能够沿着指定的相机路径创建3D视频。
© 2024 AIbase 备案号:闽ICP备2023012347号-1