浏览量:134
最新流量情况
月访问量
22216.76k
平均访问时长
00:04:50
每次访问页数
5.52
跳出率
47.80%
流量来源
直接访问
46.24%
自然搜索
30.97%
邮件
0.78%
外链引荐
13.53%
社交媒体
8.45%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
15.26%
美国
13.36%
印度
6.45%
俄罗斯
3.91%
法国
3.77%
AI工具库:OpenAI GPT工具的AI图书馆
Mojju是由我们的专业团队开发的OpenAI GPT工具的图书馆。它包括生产力工具、助手与指南、商业与财务工具等。AI工具库提供API和知识库,适用于商务、设计、加密、编程、学习、生活方式、健康和金融等多个领域。它还拥有丰富的功能,如个人助理、文件转换、图像处理、面部图像恢复、3D插图创建、商业计划编写、创业名称生成等。AI工具库适用于各种场景,包括个人使用和商业使用。
解决随机逆问题,无需直接监督
该产品是一种新型去噪扩散概率模型,学习从未直接观察到的信号分布中采样,而是通过已知的可微分前向模型测量。该产品可直接从部分观测的未知信号分布中采样,适用于计算机视觉任务。在逆图形学中,它能够生成与单个2D输入图像一致的3D场景分布。产品定价灵活,定位于图像处理和计算机视觉领域。
轻松创建和利用3D内容
3D Creation是一个提供给用户轻松创建和利用3D内容的网站。它提供了多种功能,包括AI纹理、我的模型、API等。用户可以使用AI纹理功能将图片转换为纹理,也可以使用文本转3D功能将文字描述转换为3D模型。此外,用户还可以使用Sketch to 3D功能将手绘草图转换为3D模型。3D Creation适用于各种场景,如设计、图像处理、视频制作等。该产品定位于提供简单易用的3D内容创作工具,并提供合理的定价策略。
线上数字艺术社区平台
Mon'Art是一个线上艺术创作社区平台。用户可以在平台上分享自己的艺术作品,包括绘画、雕塑、摄影等各种艺术形式。平台提供作品展示、点评、交流空间,让艺术爱好者互相欣赏、交流。平台还定期举办线上艺术展览、设计大赛等活动。用户可以上传作品参赛,获得展示机会。平台具有图像处理、3D渲染、VR显示等技术,可以从多角度展示作品。用户还可以在平台出售自己的数字艺术作品。
DySample是一种轻量级且高效的动态上采样方法。
DySample通过学习采样的视角进行上采样,完全避开了时耗的动态卷积运算和额外的子网络。与以往的基于核的动态上采样器相比,DySample不需要自定义的CUDA包,参数量和FLOPs也较少。DySample在语义分割、目标检测、实例分割、全景分割和单目深度估计等任务上都优于其他上采样器。
基于低秩参数优化的模型控制技术
Control-LoRA 是通过在 ControlNet 上添加低秩参数优化来实现的,为消费级 GPU 提供了更高效、更紧凑的模型控制方法。该产品包含多个 Control-LoRA 模型,包括 MiDaS 和 ClipDrop 深度估计、Canny 边缘检测、照片和素描上色、Revision 等功能。Control-LoRA 模型经过训练,可以在不同的图像概念和纵横比上生成高质量的图像。
Autodesk 推出的实验性生成式 AI 模型,用于 3D 形状的创建。
Project Bernini 是 Autodesk 研究项目,旨在开发用于设计和制造行业的生成式人工智能。该模型能够从多种输入(包括 2D 图像、文本、体素和点云)快速生成功能性的 3D 形状。Bernini 模型专为专业几何工作流程设计,可以生成给定输入的多个功能性变体。Autodesk 致力于创建可以用于建筑、产品设计、娱乐等多个用例的生成模型,专注于生成功能性 3D 结构,因为这些模型的输出必须在现实世界中工作,以满足设计师的意图。
TikTok验证码解决API
SadCaptcha是一个解决TikTok验证码的插件,它可以快速、准确地解决TikTok的旋转、拼图和3D形状验证码。它使用先进的计算机视觉算法,能够高效解决验证码,并且适用于任何设备和屏幕分辨率。
一种用于实时渲染大型数据集的分层3D高斯表示方法
这项研究提出了一种新的分层3D高斯表示方法,用于实时渲染非常大的数据集。该方法通过3D高斯splatting技术提供了优秀的视觉质量、快速的训练和实时渲染能力。通过分层结构和有效的细节层次(Level-of-Detail, LOD)解决方案,可以高效渲染远处内容,并在不同层次之间实现平滑过渡。该技术能够适应可用资源,通过分而治之的方法训练大型场景,并将其整合到一个可以进一步优化以提高高斯合并到中间节点时的视觉质量的层级结构中。
为角色动画提供直观且价格合理的动作捕捉工具。
Rokoko是一款基于传感器的动作捕捉系统,为3D数字创作者提供高质量的身体、手指和面部动画解决方案。它具有直观易用的界面和负担得起的价格,可帮助用户轻松实现逼真的角色动画。
一款面向高质量长视频生成的实验性框架,具有扩展序列长度和增强动态特性。
Mira(Mini-Sora)是一个实验性的项目,旨在探索高质量、长时视频生成领域,特别是在模仿Sora风格的视频生成方面。它在现有文本到视频(T2V)生成框架的基础上,通过以下几个关键方面实现突破:扩展序列长度、增强动态特性以及保持3D一致性。目前,Mira项目处于实验阶段,与Sora等更高级的视频生成技术相比,仍有提升空间。
通过视频生成实现基于物理的3D对象交互
PhysDreamer是一个基于物理的方法,它通过利用视频生成模型学习到的对象动力学先验,为静态3D对象赋予交互式动力学。这种方法允许在缺乏真实物体物理属性数据的情况下,模拟出对新颖交互(如外力或代理操作)的真实反应。PhysDreamer通过用户研究评估合成交互的真实性,推动了更吸引人和真实的虚拟体验的发展。
通过交互式3D生成技术,实现高质量且可控的3D模型创建。
Interactive3D是一个先进的3D生成模型,它通过交互式设计为用户提供了精确的控制能力。该模型采用两阶段级联结构,利用不同的3D表示方法,允许用户在生成过程的任何中间步骤进行修改和引导。它的重要性在于能够实现用户对3D模型生成过程的精细控制,从而创造出满足特定需求的高质量3D模型。
一种用于逆渲染的先进学习扩散先验方法,能够从任意图像中恢复物体材质并实现单视图图像重照明。
IntrinsicAnything 是一种先进的图像逆渲染技术,它通过学习扩散模型来优化材质恢复过程,解决了在未知静态光照条件下捕获的图像中物体材质恢复的问题。该技术通过生成模型学习材质先验,将渲染方程分解为漫反射和镜面反射项,利用现有丰富的3D物体数据进行训练,有效地解决了逆渲染过程中的歧义问题。此外,该技术还开发了一种从粗到细的训练策略,利用估计的材质引导扩散模型产生多视图一致性约束,从而获得更稳定和准确的结果。
赛灵力虚拟数字人工厂提供 AI 虚拟人视频创作服务,让数字人拥有真人般交互能力。
赛灵力虚拟数字人工厂致力于 2D 虚拟人、3D 虚拟人、声音克隆等 AI 技术探索和产业应用,为企业、政府、个人提供虚拟数字人 AI 视频创作、个人形象定制、声音定制、智能语音合成等服务。
将您的照片变为生动的3D角色,并使用Mug Me,Emojimation和Pose Controls创建有趣的生动表情。
Mug Life通过将计算机图形学专业知识与最新的计算机视觉技术相结合,创造出令人惊叹的3D角色。其技术分为三个阶段:拆解、动画和重构,结合社交平台,让用户能够连接和分享创作。
无需拍摄、剪辑,一键生成 3D 视频
有言是一站式 AIGC 视频创作平台,提供上千个高质量的 3D 虚拟人角色选择,无需真人出镜。用户无需拍摄、剪辑,一键生成场景、灯光、动画、运镜和镜头,还集成了智能镜头剪辑、高质量视频后期包装。价格分为免费和付费订阅两种模式,定位于帮助用户简单快速地制作高质量视频。
定制3D头像,提升在线身份
Avatic 3D Avatars是一个定制3D头像服务,适用于游戏、社交和职业平台。通过将您的照片转换为个性化的半逼真3D头像,提升您的在线身份。无论您是为了保护隐私还是为了给您的在线形象添加独特的个性,我们的定制3D头像服务都是您一直在寻找的解决方案。我们的头像由经验丰富的3D艺术家使用Blender和Photoshop制作,呈现出独特的玩具感。我们提供100%的退款保证和无限次的修改,以确保您对最终成品完全满意。
快速生成三维模型的AI工具
AI 3D Generation是Spline推出的一款3D设计工具,它支持文本到3D生成和图像到3D生成,允许用户通过简单的文本提示或2D图像自动创建出详细且精确的3D模型。该工具具有生成变体与混合、直观且适合初学者、创建独特的3D库、平台集成与实时协作、易于集成和发布等功能。
连接3D可定制的AI伙伴。
ioPartners是您的个人AI助手,与您的3D AI ioPartner进行无尽对话,定制外观、互动,并塑造其个性特点,以打造完美的伙伴,共同创造独特的故事和体验。记忆保留功能让您的AI伙伴记住对话的细节,打造个性化和不断发展的互动。通过选择和组合不同特点,为您的ioPartner塑造独特的个性。保护您的隐私,对话保密,不与第三方共享数据。无需下载或安装,直接在浏览器上运行。
基于预训练的文本到图像模型生成高质量、多视角一致的3D物体图像。
ViewDiff 是一种利用预训练的文本到图像模型作为先验知识,从真实世界数据中学习生成多视角一致的图像的方法。它在U-Net网络中加入了3D体积渲染和跨帧注意力层,能够在单个去噪过程中生成3D一致的图像。与现有方法相比,ViewDiff生成的结果具有更好的视觉质量和3D一致性。
用于评估文本到视觉生成的创新性指标和基准测试
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。
在线VR看房与虚拟家装的技术提供者
123看房是国内主流看房技术方案的定义者,通过全景照片进行3D建模技术的始创者。提供在线VR看房与虚拟家装的技术,可以通过全景图生成3D模型。其技术创造了低成本、高效率、易操作的全景看房和虚拟家装方案。该产品适用于房地产行业,可以实现远程看房、720全景、商业空间等多种功能。
通过 3D 空间跟踪 2D 像素,提升视频追踪性能
SpatialTracker 是 CVPR 2024 年亮点之一的一项研究成果,致力于在 3D 空间中恢复视频中密集的像素运动。该方法通过将 2D 像素提升到 3D 空间,使用三平面表示表示每一帧的 3D 内容,并迭代更新转换器来估计 3D 轨迹。在 3D 中跟踪允许我们利用刚性约束,同时学习一个刚性嵌入,将像素聚集到不同的刚性部分中。与其他追踪方法相比,SpatialTracker 在质量和量度方面都取得了优异的成绩,尤其是在具有出平面旋转的具有挑战性的情况下。
从单张 RGB 图像生成多个逼真的 3D 人体重建
DiffHuman 是一种概率性的光度逼真的 3D 人体重建方法。它可以从单张 RGB 图像预测一个 3D 人体重建的概率分布,并通过迭代降噪采样多个细节丰富、色彩鲜明的 3D 人体模型。与现有的确定性方法相比,DiffHuman 在未知或不确定区域能生成更加细节丰富的重建结果。同时,我们还引入了一个加速渲染的生成网络,大幅提高了推理速度。
Hillbot是一家专注于机器人基础模型的公司,旨在为工业和家庭任务提供AI驱动的机器人
Hillbot致力于机器人创新的前沿,通过为机器人提供AI大脑和适应性技能,使其能够在复杂环境中执行复杂任务。公司在收集真实世界和模拟数据方面的专业知识,显著扩展了机器人基础模型的训练数据集。通过在3D场景捕捉、模拟和机器人学习算法方面的核心技术,Hillbot不仅在制造机器人,还在定义具身AI(AI与机器人技术的融合)的边界,以增强所有领域的能力。
© 2024 AIbase 备案号:闽ICP备2023012347号-1