浏览量:35
最新流量情况
月访问量
3456
平均访问时长
00:00:15
每次访问页数
1.87
跳出率
46.64%
流量来源
直接访问
42.27%
自然搜索
41.35%
邮件
0.11%
外链引荐
9.54%
社交媒体
5.70%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
巴西
14.64%
英国
2.06%
印度
16.48%
波兰
9.33%
俄罗斯
3.65%
美国
54.42%
共语手势视频重现技术
TANGO是一个基于层次化音频-运动嵌入和扩散插值的共语手势视频重现技术。它利用先进的人工智能算法,将语音信号转换成相应的手势动作,实现视频中人物手势的自然重现。这项技术在视频制作、虚拟现实、增强现实等领域具有广泛的应用前景,能够提升视频内容的互动性和真实感。TANGO由东京大学和CyberAgent AI Lab联合开发,代表了当前人工智能在手势识别和动作生成领域的前沿水平。
大规模实景数据集,用于深度学习三维视觉研究
DL3DV-10K是一个包含超过10000个高质量视频的大规模实景数据集,每个视频都经过人工标注场景关键点和复杂程度,并提供相机姿态、NeRF估计深度、点云和3D网格等。该数据集可用于通用NeRF研究、场景一致性跟踪、视觉语言模型等计算机视觉研究。
360度全场景生成
ZeroNVS 是一款用于从单张真实图像进行零样本 360 度全景合成的工具。它提供了 3D SDS 蒸馏代码、评估代码和训练好的模型。用户可以使用该工具进行自己的 NeRF 模型蒸馏和评估,并且可以在各种不同的数据集上进行实验。ZeroNVS 具有高质量的合成效果,并且支持自定义的图像数据。该工具主要用于虚拟现实、增强现实和全景视频制作等领域。
创建AI头像,与其在增强现实中互动
Vara AI是一个能够创建AI头像并在增强现实中与其互动的平台。它使用先进的人工智能技术,让用户可以根据自己的喜好和需求创建自己的AI头像,并通过增强现实技术将其投射到现实世界中。用户可以与AI头像进行互动,进行对话、玩游戏等。Vara AI还提供丰富的定制选项和功能,让用户可以个性化自己的AI头像。定价方面,Vara AI提供多种套餐供用户选择,以满足不同需求。Vara AI主要定位于个人用户和AR爱好者,旨在提供一个创造和互动虚拟人物的平台。
一体化学习管理系统
Instancy是一款一体化学习管理系统,集成了电子学习内容制作、学习体验平台、移动应用、电子商务、增强现实/虚拟现实和聊天机器人等功能。它提供了可配置的学习平台,支持生成人工智能、聊天机器人、增强现实和虚拟现实的应用,帮助用户构建技能、提高生产力并推动业务增长。
开创性的实时、帧级控制的逼真世界模拟技术
The Matrix是一个先锋项目,旨在通过AI技术打造一个全沉浸式、交互式的数字宇宙,模糊现实与幻觉之间的界限。该项目通过提供帧级精度的用户交互、AAA级视觉效果以及无限的生成能力,突破了现有视频模型的局限,为用户带来无尽的探索体验。The Matrix由阿里巴巴集团、香港大学、滑铁卢大学和Vector Institute共同研发,代表了世界模拟技术的新高度。
高精度单目深度估计模型
Depth Pro是一个用于单目深度估计的研究项目,它能够快速生成高精度的深度图。该模型利用多尺度视觉变换器进行密集预测,并结合真实与合成数据集进行训练,以实现高准确度和细节捕捉。它在标准GPU上生成2.25百万像素深度图仅需0.3秒,具有速度快、精度高的特点,对于机器视觉和增强现实等领域具有重要意义。
Meta Quest 3S,混合现实体验新纪元。
Meta Quest 3S是一款混合现实头戴设备,提供沉浸式游戏体验、健身和娱乐功能,支持Facebook、Instagram和WhatsApp等应用且支持“Hey Meta”唤醒词来调用 Meta AI。它具有高分辨率显示、轻巧设计、创新的控制器设计和增强的触觉反馈。Meta Quest 3S旨在为用户带来前所未有的虚拟体验,同时保持舒适的佩戴体验和高性能的图形处理能力。
基于重力视角坐标恢复世界定位的人体运动
GVHMR是一种创新的人体运动恢复技术,它通过重力视角坐标系统来解决从单目视频中恢复世界定位的人体运动的问题。该技术能够减少学习图像-姿态映射的歧义,并且避免了自回归方法中连续图像的累积误差。GVHMR在野外基准测试中表现出色,不仅在准确性和速度上超越了现有的最先进技术,而且其训练过程和模型权重对公众开放,具有很高的科研和实用价值。
Snap Inc.推出的AR眼镜,增强现实体验。
Spectacles '24是Snap Inc.推出的一款AR眼镜,旨在通过增强现实技术将人们更紧密地联系在一起。这款眼镜配备了透明镜片,让你在保持与周围环境连接的同时,享受增强现实带来的新体验。它不仅是一款时尚的配饰,更是一个能够让你与朋友共享创意、一起玩耍、学习和工作的工具。Spectacles '24搭载了Snap OS操作系统,提供了一个自然的界面,用户无需学习即可轻松上手。
构建大型世界模型,感知、生成和与3D世界互动
World Labs 是一家专注于空间智能的公司,致力于构建大型世界模型(Large World Models),以感知、生成和与3D世界进行互动。公司由AI领域的知名科学家、教授、学者和行业领导者共同创立,包括斯坦福大学的Fei-Fei Li教授、密歇根大学的Justin Johnson教授等。他们通过创新的技术和方法,如神经辐射场(NeRF)技术,推动了3D场景重建和新视角合成的发展。World Labs 得到了包括Marc Benioff、Jim Breyer等知名投资者的支持,其技术在AI领域具有重要的应用价值和商业潜力。
高保真动态城市场景重建技术
OmniRe 是一种用于高效重建高保真动态城市场景的全面方法,它通过设备日志来实现。该技术通过构建基于高斯表示的动态神经场景图,以及构建多个局部规范空间来模拟包括车辆、行人和骑行者在内的各种动态行为者,从而实现了对场景中不同对象的全面重建。OmniRe 允许我们全面重建场景中存在的不同对象,并随后实现所有参与者实时参与的重建场景的模拟。在 Waymo 数据集上的广泛评估表明,OmniRe 在定量和定性方面都大幅超越了先前的最先进方法。
AI技术驱动的虚拟试衣体验
Kolors Virtual Try-On 是一款结合了人工智能和增强现实技术的虚拟试衣应用,能够根据给定的模特图和选定衣服生成自然美观的试穿效果。该产品支持从模特素材图到模特短视频的全流程生成,满足电商模特素材生成需求。
使用Apple Vision Pro实现人形机器人Unitree H1_2的遥控操作。
这是一个开源项目,用于实现人形机器人Unitree H1_2的遥控操作。它利用了Apple Vision Pro技术,允许用户通过虚拟现实环境来控制机器人。该项目在Ubuntu 20.04和Ubuntu 22.04上进行了测试,并且提供了详细的安装和配置指南。该技术的主要优点包括能够提供沉浸式的遥控体验,并且支持在模拟环境中进行测试,为机器人遥控领域提供了新的解决方案。
全身运动生成框架,支持多模态控制
ControlMM是一个全身运动生成框架,具有即插即用的多模态控制功能,能够在文本到运动(Text-to-Motion)、语音到手势(Speech-to-Gesture)和音乐到舞蹈(Music-to-Dance)等多个领域中生成稳健的运动。该模型在可控性、序列性和运动合理性方面具有明显优势,为人工智能领域提供了一种新的运动生成解决方案。
从文本描述生成全息3D全景世界
HoloDreamer是一个文本驱动的3D场景生成框架,能够生成沉浸式且视角一致的全封闭3D场景。它由两个基本模块组成:风格化等矩形全景生成和增强两阶段全景重建。该框架首先生成高清晰度的全景图作为完整3D场景的整体初始化,然后利用3D高斯散射(3D-GS)技术快速重建3D场景,从而实现视角一致和完全封闭的3D场景生成。HoloDreamer的主要优点包括高视觉一致性、和谐性以及重建质量和渲染的鲁棒性。
探索3D虚拟世界,体验梦想家宇宙。
Aiuni是一个提供3D虚拟世界体验的平台,用户可以在这里创建和探索个性化的3D模型,享受沉浸式的宇宙探索之旅。Aiuni以其创新的3D技术、丰富的互动性和高度的个性化定制,为用户提供了一个全新的虚拟体验空间。
3D场景重建与动态物体追踪技术
EgoGaussian是一项先进的3D场景重建与动态物体追踪技术,它能够仅通过RGB第一人称视角输入,同时重建3D场景并动态追踪物体的运动。这项技术利用高斯散射的独特离散特性,从背景中分割出动态交互,并通过片段级别的在线学习流程,利用人类活动的动态特性,以时间顺序重建场景的演变并追踪刚体物体的运动。EgoGaussian在野外视频的挑战中超越了先前的NeRF和动态高斯方法,并且在重建模型的质量上也表现出色。
利用增强现实技术为一线工人提供易于使用的知识共享工具,以在最需要的时间、地点和方式提供信息。
Ario 利用增强现实技术为一线工人提供易于使用的知识共享工具,以在最需要的时间、地点和方式提供信息。Ario 结合了扫描识别、资源库和连接技术,可以提供以下功能:
从单张图片生成交互式3D场景
WonderWorld是一个创新的3D场景扩展框架,允许用户基于单张输入图片和用户指定的文本探索和塑造虚拟环境。它通过快速高斯体素和引导扩散的深度估计方法,显著减少了计算时间,生成几何一致的扩展,使3D场景的生成时间少于10秒,支持实时用户交互和探索。这为虚拟现实、游戏和创意设计等领域提供了快速生成和导航沉浸式虚拟世界的可能性。
从单张图片生成高质量3D网格模型
Unique3D是由清华大学团队开发的一项技术,能够从单张图片中生成高保真度的纹理3D网格模型。这项技术在图像处理和3D建模领域具有重要意义,它使得用户能够快速将2D图像转化为3D模型,为游戏开发、动画制作、虚拟现实等领域提供了强大的技术支持。
AI眼镜,赋予你视觉分析与实时翻译的超能力
Frame是Brilliant Labs推出的一款AI眼镜,它通过集成的AI技术,为用户提供实时的视觉分析和翻译功能。这款眼镜结合了OpenAI和Whisper技术,允许用户通过视觉和听觉来搜索和理解他们所看到和听到的内容。Frame的主要优点在于它的开放源代码特性,鼓励开发者、艺术家和黑客探索和创造新的功能,推动产品的创新和个性化。此外,它还包括了Mister Power功能,确保全天候的电池续航。
AI生成专业头像照片,将普通照片提升为专业头像照片,轻松打造个人形象。
HeadshotsWithAI是一款使用先进的人工智能技术生成专业头像照片的产品。它能够将普通照片转化为符合专业摄影标准的头像照片,包括适用于LinkedIn头像、商务头像和视觉吸引力的考虑因素。使用HeadshotsWithAI,您可以在家中轻松完成头像照片拍摄,并以高分辨率下载选择的头像照片,用于网站、LinkedIn个人资料、名片和其他营销材料。
为角色动画提供直观且价格合理的动作捕捉工具。
Rokoko是一款基于传感器的动作捕捉系统,为3D数字创作者提供高质量的身体、手指和面部动画解决方案。它具有直观易用的界面和负担得起的价格,可帮助用户轻松实现逼真的角色动画。
Immerse是一款VR语言课程和AI辅助练习的虚拟现实产品,帮助成年人流利地学习新语言。
Immerse是一款由专家设计的虚拟现实语言沉浸式学习平台,通过提供语言课程和AI辅助练习,帮助成年人流利地学习新语言。它的主要优点包括:通过虚拟现实技术提供身临其境的语言学习体验;结合AI技术提供个性化的语言练习;专业教师指导和实时反馈等。Immerse的定位是帮助成年人实现流利地说新语言的目标。
将自拍照变成专业的AI头像,树立信任和可信度,留下深刻的第一印象,展示个人品牌的独特性。
X Headshot是一款将自拍照片转化为专业AI头像的产品。通过上传照片,我们的AI模型会生成与真实照片相似的头像。相比实体拍摄,X Headshot更加便捷、经济且效果出色。我们提供多种变化,让您的头像更加完美,价格合理,并且我们还提供7天退款保证。
© 2024 AIbase 备案号:闽ICP备08105208号-14