浏览量:156
最新流量情况
月访问量
39.81k
平均访问时长
00:00:47
每次访问页数
1.82
跳出率
50.98%
流量来源
直接访问
41.14%
自然搜索
34.31%
邮件
0
外链引荐
7.03%
社交媒体
17.52%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
印度
10.12%
中国
9.30%
土耳其
6.63%
俄罗斯
4.82%
韩国
4.78%
赛灵力虚拟数字人工厂提供 AI 虚拟人视频创作服务,让数字人拥有真人般交互能力。
赛灵力虚拟数字人工厂致力于 2D 虚拟人、3D 虚拟人、声音克隆等 AI 技术探索和产业应用,为企业、政府、个人提供虚拟数字人 AI 视频创作、个人形象定制、声音定制、智能语音合成等服务。
无需拍摄、剪辑,一键生成 3D 视频
有言是一站式 AIGC 视频创作平台,提供上千个高质量的 3D 虚拟人角色选择,无需真人出镜。用户无需拍摄、剪辑,一键生成场景、灯光、动画、运镜和镜头,还集成了智能镜头剪辑、高质量视频后期包装。价格分为免费和付费订阅两种模式,定位于帮助用户简单快速地制作高质量视频。
基于JST-1视频-3D基础模型的可控视频生成
VIGGLE是一款基于JST-1视频-3D基础模型的可控视频生成工具。它可以让任何角色按照您的要求移动。JST-1是第一个具有实际物理理解能力的视频-3D基础模型。VIGGLE的优势在于其强大的视频生成和控制能力,可以根据用户需求生成各种动作和情节的视频。它定位于视频创作者、动画师和内容创作者等专业人群,帮助他们更高效地制作视频内容。目前VIGGLE处于测试阶段,未来可能会推出付费订阅版本。
数字身份增强AI
CloneByMe利用最先进的2D/3D头像创建技术和人工智能,增强您在数字世界、元宇宙和视频游戏中的身份。我们致力于为您提供一个平台,在这里您可以真实地表达自己,没有任何限制。您可以通过自拍构建自己的2D/3D头像,利用人工智能进行个性化定制,将头像注入独特的个性,通过文本、PDF、音频、视频等形式进行个性化。您可以随时使用智能头像进行聊天、创作内容并实现身份变现。通过我们的API,您可以将智能头像集成到您最需要的平台中。
多种图像类型和视频效果生成
MiracleVision奇想智能是一款图像和视频效果生成工具,可用于动物摄影、平面商插、数字渲染、Q版卡通、数字3D等多种场景。同时可助力广告行业、电商行业、游戏行业等各行业工作流提效,支持训练视觉模型,让创作风格更统一。产品提供开放API服务,包括文生成图和图生成图,可智能生成创作图。用户可根据文字或图像智能生成多种风格丰富的创作图。
革命性视频生成,将静态图像或文本转化为视频
Stable Video Diffusion是一种AI视频生成技术,可以从静态图像或文本创建动态视频,代表了视频生成技术的新进展。它通过图像预训练、视频预训练、高质量视频微调和多视角3D先验等步骤,提供高质量的视频生成。主要功能包括将图像转化为视频、将文本转化为视频等。Stable Video Diffusion可以革新内容创作,从而自动生成创意广告、电影预告片、教育视频、游戏场景和独特的社交媒体内容。产品定位为提高视频内容创作的可访问性、效率和创造力。
用文字创建、定制、吸引,Snowpixel 让您轻松生成美丽的图片、视频、音乐等作品。
Snowpixel 是一个能够通过文字生成美丽图片、视频、音乐等作品的平台。用户可以使用自己的数据训练定制模型,为作品增添个性化的风格。Snowpixel 提供了视频生成、音乐生成、图片生成、音频生成、3D 对象生成和像素艺术模型等功能。用户可以在不同的场景下使用 Snowpixel,比如创作个性化作品、定制模型、生成音乐、生成视频等。Snowpixel 的定价灵活,用户可以按需选择付费。
Avataar是一个基于人工智能的可视化故事讲解平台
Avataar是一个利用生成式AI技术为用户提供沉浸式可视化内容创作能力的平台。它能够帮助用户无需代码快速制作3D空间场景、虚拟角色以及交互式视频。Avataar使创作者能够更高效地讲述故事,为消费者带来更好的可视化体验。该平台提供基于网页的零代码解决方案,用户可以使用Google、Apple或邮箱账号快速登录。Avataar拥有强大的AI生成能力,助力用户进行视觉化创作,大大提升工作效率。
轻松创建和利用3D内容
3D Creation是一个提供给用户轻松创建和利用3D内容的网站。它提供了多种功能,包括AI纹理、我的模型、API等。用户可以使用AI纹理功能将图片转换为纹理,也可以使用文本转3D功能将文字描述转换为3D模型。此外,用户还可以使用Sketch to 3D功能将手绘草图转换为3D模型。3D Creation适用于各种场景,如设计、图像处理、视频制作等。该产品定位于提供简单易用的3D内容创作工具,并提供合理的定价策略。
一键优化AI生成艺术创意
Prompter是一个Chrome浏览器插件,能够一键优化用户的文本提示,生成更加精美、细节丰富的AI艺术图像。关键功能包括:一键优化提示文本,实时预览创作效果,提示笔记本随时记录灵感等。适用于Midjourney、Stable Diffusion等主流生成平台,支持图像、视频、3D等创作,是创意工作者的最佳助手。
一分钟内构建无代码AI应用
Imagica是一种新的思维和创造方式,使计算机成为我们思维的延伸,让我们能够以思考的速度与计算机进行协作创作。从想法到产品,以思维的速度实现。无需编写任何代码,构建功能性应用程序。实时数据,通过URL或拖放添加真实数据源以获得准确结果。多模态,使用文本、图像、视频和3D模型等任何输入或输出。具有400万个函数,实现在真实世界中运行的应用程序。一键将应用转化为商业模式,立即产生收入。将您的应用提交给Natural OS,开始为数百万用户提供服务请求。将应用转化为漂亮的变形界面,让用户主动寻找您的应用。
一个统一的文本到任意模态生成框架
Lumina-T2X是一个先进的文本到任意模态生成框架,它能够将文本描述转换为生动的图像、动态视频、详细的多视图3D图像和合成语音。该框架采用基于流的大型扩散变换器(Flag-DiT),支持高达7亿参数,并能扩展序列长度至128,000个标记。Lumina-T2X集成了图像、视频、3D对象的多视图和语音频谱图到一个时空潜在标记空间中,可以生成任何分辨率、宽高比和时长的输出。
为角色动画提供直观且价格合理的动作捕捉工具。
Rokoko是一款基于传感器的动作捕捉系统,为3D数字创作者提供高质量的身体、手指和面部动画解决方案。它具有直观易用的界面和负担得起的价格,可帮助用户轻松实现逼真的角色动画。
一款面向高质量长视频生成的实验性框架,具有扩展序列长度和增强动态特性。
Mira(Mini-Sora)是一个实验性的项目,旨在探索高质量、长时视频生成领域,特别是在模仿Sora风格的视频生成方面。它在现有文本到视频(T2V)生成框架的基础上,通过以下几个关键方面实现突破:扩展序列长度、增强动态特性以及保持3D一致性。目前,Mira项目处于实验阶段,与Sora等更高级的视频生成技术相比,仍有提升空间。
通过视频生成实现基于物理的3D对象交互
PhysDreamer是一个基于物理的方法,它通过利用视频生成模型学习到的对象动力学先验,为静态3D对象赋予交互式动力学。这种方法允许在缺乏真实物体物理属性数据的情况下,模拟出对新颖交互(如外力或代理操作)的真实反应。PhysDreamer通过用户研究评估合成交互的真实性,推动了更吸引人和真实的虚拟体验的发展。
将您的照片变为生动的3D角色,并使用Mug Me,Emojimation和Pose Controls创建有趣的生动表情。
Mug Life通过将计算机图形学专业知识与最新的计算机视觉技术相结合,创造出令人惊叹的3D角色。其技术分为三个阶段:拆解、动画和重构,结合社交平台,让用户能够连接和分享创作。
用于评估文本到视觉生成的创新性指标和基准测试
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。
通过 3D 空间跟踪 2D 像素,提升视频追踪性能
SpatialTracker 是 CVPR 2024 年亮点之一的一项研究成果,致力于在 3D 空间中恢复视频中密集的像素运动。该方法通过将 2D 像素提升到 3D 空间,使用三平面表示表示每一帧的 3D 内容,并迭代更新转换器来估计 3D 轨迹。在 3D 中跟踪允许我们利用刚性约束,同时学习一个刚性嵌入,将像素聚集到不同的刚性部分中。与其他追踪方法相比,SpatialTracker 在质量和量度方面都取得了优异的成绩,尤其是在具有出平面旋转的具有挑战性的情况下。
通过文本指令自动生成和动画化卡通人物的3D纹理
Make-It-Vivid是一种创新的模型,能够根据文本指令自动生成和动画化卡通人物的3D纹理。它解决了传统方式制作3D卡通角色纹理的挑战,提供了高效、灵活的解决方案。该模型通过预训练的文本到图像扩散模型生成高质量的UV纹理图,并引入对抗性训练来增强细节。它可以根据不同的文本prompt生成各种风格的角色纹理,并将其应用到3D模型上进行动画制作,为动画、游戏等领域提供了便利的创作工具。
AI社区共建未来,开源开放科学推进AI民主化
Hugging Face是一个AI社区平台,致力于通过开源和开放科学的方式来推进人工智能的发展和民主化。它为机器学习社区提供了协作模型、数据集和应用程序的环境。主要优势包括:1)协作平台,可无限托管和共享模型、数据集和应用程序。2)开源堆栈,加速ML开发流程。3)支持多模态(文本、图像、视频、音频、3D等)。4)建立ML作品集,在全球分享你的作品。5)付费计算和企业解决方案,提供优化的推理端点、GPU支持等。
从单张图片生成高质量3D视图和新颖视角的3D生成技术
Stable Video 3D是Stability AI推出的新模型,它在3D技术领域取得了显著进步,与之前发布的Stable Zero123相比,提供了大幅改进的质量和多视角支持。该模型能够在没有相机条件的情况下,基于单张图片输入生成轨道视频,并且能够沿着指定的相机路径创建3D视频。
文本转3D动画工具,轻松生成角色动作
Cartwheel是一个创新的文本转3D动画工具,用户通过输入文字提示即可生成适用于视频、游戏、电影、广告、社交或VR项目的3D动画角色。其灵活性和易用性让用户能够轻松生成各种动作,并支持导出到任何3D程序中进行编辑。目前处于测试阶段,用户需要排队等待使用。
免费创建和查看高斯3D模糊图像的工具
Polycam的高斯模糊创建工具可以让你免费将图像转换为沉浸式的3D模糊图像,你可以预览、分享和导出这些模糊图像。该工具支持20-200张PNG或JPG格式图像输入,输入图像需遵循影像测量最佳实践,保证图像清晰、均匀曝光和无运动模糊效果。生成的3D模糊可在Unity和Unreal等引擎中使用,插件不断更新以支持更多软件。该工具还提供Gallery功能用于浏览和分享社区创作。
用于视觉合成的统一3D Transformer流水线
NUWA是由微软开发的一系列研究项目,包括NUWA、NUWA-Infinity、NUWA-LIP、Learning 3D Photography Videos和NUWA-XL。这些项目涉及视觉合成的预训练模型,能够生成或操纵视觉数据,如图像和视频,以执行多种视觉合成任务。
单摄像头3D动画资产转换
Move API能够将包含人体动作的视频转换为3D动画资产,支持将视频文件转换为usdz、usdc和fbx文件格式,并提供预览视频。适用于集成到生产工作流程软件、增强应用动作捕捉能力或创造全新体验。
Aria每日活动数据集,加速机器感知和人工智能发展
Aria每日活动数据集是Aria项目发布的首个试点数据集的重新发布版本,该数据集利用新的工具和位置数据进行了更新,以加速机器感知和人工智能技术的发展。数据集包含日常生活场景下的第一人称视频序列,并配有丰富的传感器数据、注释数据以及由Aria机器感知服务生成的3D点云数据等。研究人员可以使用Aria提供的专用工具快速上手使用该数据集开展研究。
基于视频的3D场景重建
VisFusion是一个利用视频数据进行在线3D场景重建的技术,它能够实时地从视频中提取和重建出三维环境。这项技术结合了计算机视觉和深度学习,为用户提供了一个强大的工具,用于创建精确的三维模型。
© 2024 AIbase 备案号:闽ICP备2023012347号-1