AI Alive是一种具有智能编辑功能的创意工具,可以将静态照片转换为动态视频。
AI Alive是TikTok推出的创新功能,利用智能编辑工具将静态照片转换为生动的视频,为用户提供丰富多彩的创作可能性,强调简单易用,提升视觉叙事体验。
多模态驱动的定制视频生成架构。
HunyuanCustom 是一个多模态定制视频生成框架,旨在根据用户定义的条件生成特定主题的视频。该技术在身份一致性和多种输入模式的支持上表现出色,能够处理文本、图像、音频和视频输入,适合虚拟人广告、视频编辑等多种应用场景。
TwelveLabs是被领先研究人员认可为视频理解中性能最出色的人工智能,超越了云计算巨头和开源模型的基准。
TwelveLabs是一个强大的视频智能平台,通过能够看、听、推理的人工智能,发现深度见解,分析、重组和自动化工作流程。它可以看到视频背后的整个故事,是视频智能的未来。
AI视频制作平台,提供数百种视频模板选择,帮助用户快速生成病毒级视频。
Reel Rabbit是一款AI视频制作平台,利用AI技术快速生成病毒级视频,帮助用户提高流量和品牌曝光。定位于为品牌和创始人节省视频制作成本,提供价格实惠的会员计划。
一种高效的无泄漏唇同步技术。
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。它解决了传统唇同步技术中的时间一致性问题,同时通过巧妙的遮罩策略处理表情泄漏和面部遮挡。KeySync 的优越性体现在其在唇重建和跨同步方面的先进成果,适用于自动配音等实际应用场景。
用于理解任意视频中的相机运动的工具。
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。它的主要优点在于利用生成性视觉语言模型进行相机运动的原理分类和视频文本检索。通过与传统的结构从运动 (SfM) 和实时定位与*构建 (SLAM) 方法进行比较,该模型在捕捉场景语义方面显示出了显著的优势。该模型已开源,适合研究人员和开发者使用,且后续将推出更多改进版本。
通过 AI 实时翻译打破视频通话中的语言障碍。
Ztalk.ai 是一款创新的实时语音翻译工具,能够在视频通话中提供超过 30 种语言的即时翻译。它利用先进的 AI 技术,支持与各类视频会议平台的无缝集成,旨在提高全球团队的沟通效率。该产品提供不同的定价方案以满足用户的需求,特别适合需要跨语言沟通的专业团队和企业。
无需注册,免费在线交换视频、照片和GIF中的面孔。
FaceswapFree是一款免费的AI人脸交换工具,使用强大的AI技术快速、准确地交换面孔。该工具的主要优点在于免费、无需注册,支持多种媒体格式,快速处理并提供高质量的交换结果。
极快的 B 站直播录制、自动切片与字幕处理工具。
bilive 是一个专为 B 站直播录制而设计的工具,支持自动切片、弹幕渲染与字幕生成,兼容低配置设备,适合广泛用户群体。其主要优势在于高效处理直播内容,支持多房间录制,同时能够生成高质量的内容与封面图,确保用户能够快速分享录制结果,适用于个人及小型团队。该产品开源且免费使用,致力于为用户提供便利。
通过 MCP 协议访问 PixVerse 最新的视频生成模型。
PixVerse-MCP 是一个工具,允许用户通过支持模型上下文协议(MCP)的应用程序访问 PixVerse 最新的视频生成模型。该产品提供了文本转视频等功能,适用于创作者和开发者,能够在任何地方生成高质量的视频。PixVerse 平台需要 API 积分,用户需自行购买。
一个基于深度学习的图像和视频描述模型。
Describe Anything 模型(DAM)能够处理图像或视频的特定区域,并生成详细描述。它的主要优点在于可以通过简单的标记(点、框、涂鸦或掩码)来生成高质量的本地化描述,极大地提升了计算机视觉领域的图像理解能力。该模型由 NVIDIA 和多所大学联合开发,适合用于研究、开发和实际应用中。
一个互动故事讲述的 AI 平台,通过图像和音频生成视频。
AvatarFX 是一个尖端的 AI 平台,专注于互动故事讲述。用户可以通过上传图片和选择声音,快速生成生动、真实的角色视频。其核心技术是基于 DiT 的扩散视频生成模型,能够高效生成高保真、时序一致的视频,特别适合需要多个角色和对话场景的创作。产品定位在为创作者提供工具,帮助他们实现想象力的无限可能。
国产视频生成大模型 Vidu Q1,支持高清 1080p 视频生成,性价比极高。
Vidu Q1 是由生数科技推出的国产视频生成大模型,专为视频创作者设计,支持高清 1080p 视频生成,具备电影级运镜效果和首尾帧功能。该产品在 VBench-1.0 和 VBench-2.0 评测中位居榜首,性价比极高,价格仅为同行的十分之一。它适用于电影、广告、动漫等多个领域,能够大幅降低创作成本,提升创作效率。
全球首个无限时长电影生成模型,开启视频生成新时代
SkyReels-V2 是昆仑万维 SkyReels 团队发布的全球首个使用扩散强迫框架的无限时长电影生成模型。该模型通过结合多模态大语言模型、多阶段预训练、强化学习和扩散强迫框架来实现协同优化,突破了传统视频生成技术在提示词遵循、视觉质量、运动动态和视频时长协调上的重大挑战。它不仅为内容创作者提供了强大的工具,还开启了利用 AI 进行视频叙事和创意表达的无限可能。
开源视频生成模型,支持多种生成任务。
Wan2.1-FLF2V-14B 是一个开源的大规模视频生成模型,旨在推动视频生成领域的进步。该模型在多项基准测试中表现优异,支持消费者级 GPU,能够高效生成 480P 和 720P 的视频。它在文本到视频、图像到视频等多个任务中表现出色,具有强大的视觉文本生成能力,适用于各种实际应用场景。
一键将视频和音频转化为各种风格的文档。
AI 视频图文创作助手是一个开源工具,旨在将视频和音频内容转化为多种格式的文档,帮助用户进行二次阅读和思考。该产品的主要优势在于其完全开源、无需注册,用户可以在本地处理音视频文件,降低了使用成本。它非常适合需要将视听内容转化为文本的学生、研究人员和内容创作者。
© 2025 AIbase 备案号:闽ICP备08105208号-14