浏览量:96
最新流量情况
月访问量
13.71k
平均访问时长
00:00:38
每次访问页数
0.83
跳出率
60.02%
流量来源
直接访问
68.02%
自然搜索
4.74%
邮件
0
外链引荐
27.23%
社交媒体
0
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
美国
74.69%
俄罗斯
3.88%
中国
3.18%
印度
2.92%
德国
2.41%
实时AI聊天翻译,消除语言障碍,让Roblox用户跨语言交流。
Roblox Chat Translator通过定制的多语言模型实现实时聊天翻译,使不同语言的用户可以在Roblox的沉浸式3D体验中无缝交流。该模型支持16种语言之间的直接翻译,为人们在全球范围内消除语言障碍,提供了一个低延迟的翻译服务。Roblox拥有超过7千万日活跃用户,通过这个平台,用户可以24小时使用他们的母语进行沟通和创作。Roblox Chat Translator的目标是连接来自世界各地的人们,通过消除语言障碍,实现十亿人的联接。
大规模实景数据集,用于深度学习三维视觉研究
DL3DV-10K是一个包含超过10000个高质量视频的大规模实景数据集,每个视频都经过人工标注场景关键点和复杂程度,并提供相机姿态、NeRF估计深度、点云和3D网格等。该数据集可用于通用NeRF研究、场景一致性跟踪、视觉语言模型等计算机视觉研究。
从任何地方到任何地方的尽探索
WonderJourney 是一个模块化的场景生成框架,通过用户提供的位置信息,可以生成一系列多样且相互连贯的 3D 场景,形成想象中的 “奇妙之旅”。通过利用语言模型生成场景的文本描述,使用文本驱动的点云生成流程生成连贯的 3D 场景,通过大规模验证模型对生成的场景进行验证。WonderJourney 展示了多样的视觉效果,包括各种类型和风格的场景。
3D世界中的全能代理人
LEO是一个基于大型语言模型的多模态、多任务全能代理人,能够在3D世界中感知、定位、推理、规划和执行任务。LEO通过两个阶段的训练实现:(i)3D视觉语言对齐和(ii)3D视觉语言动作指令调整。我们精心策划和生成了一个包含物体级和场景级多模态任务的大规模数据集,需要对3D世界进行深入的理解和交互。通过严格的实验,我们展示了LEO在3D字幕、问答、推理、导航和机器人操作等广泛任务中的出色表现。
Unity Muse是基于大型语言模型的AI助手
Unity Muse是一个基于大型语言模型构建的AI助手,可以加速Unity游戏开发流程。它可以提供各种Unity相关资源和建议,帮助开发者提高工作效率。主要功能包括:代码自动补全、Debug提示、3D资源建议、代码优化等,涵盖游戏开发的多个方面。Muse使开发者可以更快地实现想法,同时保持高质量。它是Unity推出的重要新产品之一,属于生产力和编程类SaaS服务。
TikTok验证码解决API
SadCaptcha是一个解决TikTok验证码的插件,它可以快速、准确地解决TikTok的旋转、拼图和3D形状验证码。它使用先进的计算机视觉算法,能够高效解决验证码,并且适用于任何设备和屏幕分辨率。
一种用于实时渲染大型数据集的分层3D高斯表示方法
这项研究提出了一种新的分层3D高斯表示方法,用于实时渲染非常大的数据集。该方法通过3D高斯splatting技术提供了优秀的视觉质量、快速的训练和实时渲染能力。通过分层结构和有效的细节层次(Level-of-Detail, LOD)解决方案,可以高效渲染远处内容,并在不同层次之间实现平滑过渡。该技术能够适应可用资源,通过分而治之的方法训练大型场景,并将其整合到一个可以进一步优化以提高高斯合并到中间节点时的视觉质量的层级结构中。
为角色动画提供直观且价格合理的动作捕捉工具。
Rokoko是一款基于传感器的动作捕捉系统,为3D数字创作者提供高质量的身体、手指和面部动画解决方案。它具有直观易用的界面和负担得起的价格,可帮助用户轻松实现逼真的角色动画。
一款面向高质量长视频生成的实验性框架,具有扩展序列长度和增强动态特性。
Mira(Mini-Sora)是一个实验性的项目,旨在探索高质量、长时视频生成领域,特别是在模仿Sora风格的视频生成方面。它在现有文本到视频(T2V)生成框架的基础上,通过以下几个关键方面实现突破:扩展序列长度、增强动态特性以及保持3D一致性。目前,Mira项目处于实验阶段,与Sora等更高级的视频生成技术相比,仍有提升空间。
通过视频生成实现基于物理的3D对象交互
PhysDreamer是一个基于物理的方法,它通过利用视频生成模型学习到的对象动力学先验,为静态3D对象赋予交互式动力学。这种方法允许在缺乏真实物体物理属性数据的情况下,模拟出对新颖交互(如外力或代理操作)的真实反应。PhysDreamer通过用户研究评估合成交互的真实性,推动了更吸引人和真实的虚拟体验的发展。
通过交互式3D生成技术,实现高质量且可控的3D模型创建。
Interactive3D是一个先进的3D生成模型,它通过交互式设计为用户提供了精确的控制能力。该模型采用两阶段级联结构,利用不同的3D表示方法,允许用户在生成过程的任何中间步骤进行修改和引导。它的重要性在于能够实现用户对3D模型生成过程的精细控制,从而创造出满足特定需求的高质量3D模型。
一种用于逆渲染的先进学习扩散先验方法,能够从任意图像中恢复物体材质并实现单视图图像重照明。
IntrinsicAnything 是一种先进的图像逆渲染技术,它通过学习扩散模型来优化材质恢复过程,解决了在未知静态光照条件下捕获的图像中物体材质恢复的问题。该技术通过生成模型学习材质先验,将渲染方程分解为漫反射和镜面反射项,利用现有丰富的3D物体数据进行训练,有效地解决了逆渲染过程中的歧义问题。此外,该技术还开发了一种从粗到细的训练策略,利用估计的材质引导扩散模型产生多视图一致性约束,从而获得更稳定和准确的结果。
赛灵力虚拟数字人工厂提供 AI 虚拟人视频创作服务,让数字人拥有真人般交互能力。
赛灵力虚拟数字人工厂致力于 2D 虚拟人、3D 虚拟人、声音克隆等 AI 技术探索和产业应用,为企业、政府、个人提供虚拟数字人 AI 视频创作、个人形象定制、声音定制、智能语音合成等服务。
将您的照片变为生动的3D角色,并使用Mug Me,Emojimation和Pose Controls创建有趣的生动表情。
Mug Life通过将计算机图形学专业知识与最新的计算机视觉技术相结合,创造出令人惊叹的3D角色。其技术分为三个阶段:拆解、动画和重构,结合社交平台,让用户能够连接和分享创作。
无需拍摄、剪辑,一键生成 3D 视频
有言是一站式 AIGC 视频创作平台,提供上千个高质量的 3D 虚拟人角色选择,无需真人出镜。用户无需拍摄、剪辑,一键生成场景、灯光、动画、运镜和镜头,还集成了智能镜头剪辑、高质量视频后期包装。价格分为免费和付费订阅两种模式,定位于帮助用户简单快速地制作高质量视频。
定制3D头像,提升在线身份
Avatic 3D Avatars是一个定制3D头像服务,适用于游戏、社交和职业平台。通过将您的照片转换为个性化的半逼真3D头像,提升您的在线身份。无论您是为了保护隐私还是为了给您的在线形象添加独特的个性,我们的定制3D头像服务都是您一直在寻找的解决方案。我们的头像由经验丰富的3D艺术家使用Blender和Photoshop制作,呈现出独特的玩具感。我们提供100%的退款保证和无限次的修改,以确保您对最终成品完全满意。
快速生成三维模型的AI工具
AI 3D Generation是Spline推出的一款3D设计工具,它支持文本到3D生成和图像到3D生成,允许用户通过简单的文本提示或2D图像自动创建出详细且精确的3D模型。该工具具有生成变体与混合、直观且适合初学者、创建独特的3D库、平台集成与实时协作、易于集成和发布等功能。
连接3D可定制的AI伙伴。
ioPartners是您的个人AI助手,与您的3D AI ioPartner进行无尽对话,定制外观、互动,并塑造其个性特点,以打造完美的伙伴,共同创造独特的故事和体验。记忆保留功能让您的AI伙伴记住对话的细节,打造个性化和不断发展的互动。通过选择和组合不同特点,为您的ioPartner塑造独特的个性。保护您的隐私,对话保密,不与第三方共享数据。无需下载或安装,直接在浏览器上运行。
基于预训练的文本到图像模型生成高质量、多视角一致的3D物体图像。
ViewDiff 是一种利用预训练的文本到图像模型作为先验知识,从真实世界数据中学习生成多视角一致的图像的方法。它在U-Net网络中加入了3D体积渲染和跨帧注意力层,能够在单个去噪过程中生成3D一致的图像。与现有方法相比,ViewDiff生成的结果具有更好的视觉质量和3D一致性。
用于评估文本到视觉生成的创新性指标和基准测试
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。
在线VR看房与虚拟家装的技术提供者
123看房是国内主流看房技术方案的定义者,通过全景照片进行3D建模技术的始创者。提供在线VR看房与虚拟家装的技术,可以通过全景图生成3D模型。其技术创造了低成本、高效率、易操作的全景看房和虚拟家装方案。该产品适用于房地产行业,可以实现远程看房、720全景、商业空间等多种功能。
通过 3D 空间跟踪 2D 像素,提升视频追踪性能
SpatialTracker 是 CVPR 2024 年亮点之一的一项研究成果,致力于在 3D 空间中恢复视频中密集的像素运动。该方法通过将 2D 像素提升到 3D 空间,使用三平面表示表示每一帧的 3D 内容,并迭代更新转换器来估计 3D 轨迹。在 3D 中跟踪允许我们利用刚性约束,同时学习一个刚性嵌入,将像素聚集到不同的刚性部分中。与其他追踪方法相比,SpatialTracker 在质量和量度方面都取得了优异的成绩,尤其是在具有出平面旋转的具有挑战性的情况下。
从单张 RGB 图像生成多个逼真的 3D 人体重建
DiffHuman 是一种概率性的光度逼真的 3D 人体重建方法。它可以从单张 RGB 图像预测一个 3D 人体重建的概率分布,并通过迭代降噪采样多个细节丰富、色彩鲜明的 3D 人体模型。与现有的确定性方法相比,DiffHuman 在未知或不确定区域能生成更加细节丰富的重建结果。同时,我们还引入了一个加速渲染的生成网络,大幅提高了推理速度。
Hillbot是一家专注于机器人基础模型的公司,旨在为工业和家庭任务提供AI驱动的机器人
Hillbot致力于机器人创新的前沿,通过为机器人提供AI大脑和适应性技能,使其能够在复杂环境中执行复杂任务。公司在收集真实世界和模拟数据方面的专业知识,显著扩展了机器人基础模型的训练数据集。通过在3D场景捕捉、模拟和机器人学习算法方面的核心技术,Hillbot不仅在制造机器人,还在定义具身AI(AI与机器人技术的融合)的边界,以增强所有领域的能力。
通过文本指令自动生成和动画化卡通人物的3D纹理
Make-It-Vivid是一种创新的模型,能够根据文本指令自动生成和动画化卡通人物的3D纹理。它解决了传统方式制作3D卡通角色纹理的挑战,提供了高效、灵活的解决方案。该模型通过预训练的文本到图像扩散模型生成高质量的UV纹理图,并引入对抗性训练来增强细节。它可以根据不同的文本prompt生成各种风格的角色纹理,并将其应用到3D模型上进行动画制作,为动画、游戏等领域提供了便利的创作工具。
Garment3DGen是一个在线工具,可以生成3D服装模型
Garment3DGen是一个基于网络的工具,它允许用户通过简单的拖放界面来创建和预览3D服装模型。用户可以选择不同的服装类型,调整尺寸和颜色,然后生成可以用于进一步设计或打印的3D模型。
© 2024 AIbase 备案号:闽ICP备2023012347号-1