在线转换音频和视频为文字的免费工具。
Transcriptly是一个免费的音频和视频转文字工具,支持98种语言,适用于内容创作者、学生和专业人士。其主要优点在于快速、准确转录视频内容,提供多种输出格式和支持多语言。
通过先进的MoE技术在消费级GPU上将文本和图像转换为720P视频。
Hailuo 2是一款AI视频生成器,采用MoE技术将文本和图像转换为720P视频。其主要优点包括先进的AI技术、高清视频生成、文本转视频功能等。
将您的语音立即转换为文本。完全私密,开源,由AI技术驱动。
OpenWispr是一款由AI技术驱动的语音转文本工具,注重隐私保护,完全开源。其主要优点在于处理速度快、隐私保护严格,适用于写作、编程等领域。
基于扩散变换器的多角色肖像动画生成框架。
FantasyPortrait 是一种高保真、多情感的肖像动画生成框架,使用表达增强学习策略来捕捉细腻的面部动态,适合单角色和多角色场景。该技术的优势在于其独特的掩蔽交叉注意机制,有效防止了特征干扰,提升了动画的质量与表现力。该产品背景源于对现有面部动画方法的不足的反思,尤其是在处理多角色互动时的挑战。未来将以开源形式提供代码与模型,鼓励研究与开发。
快速概括长文章,提取关键要点的AI文章摘要工具。
文章摘要器是一款使用先进技术的工具,能够快速将长文章、论文和研究论文压缩成精炼的摘要,轻松提取关键要点。它的主要优点包括快速分析、准确结果、多语言支持和易于操作,适用于教育、学生、研究人员等各种用户群。
将静态图像转换为令人惊叹的AI视频生成器。
Midjourney Video是一款革命性的AI视频生成器,利用先进的图像到视频技术,将静态图像转换为令人惊叹的视频。其主要优点在于成本低廉、灵活的动作设置、通用图像支持、专业视频输出等。
Novi AI是一款AI文本到视频生成器,可以在几分钟内将文本、脚本、故事、博客转换成高质量视频。
iMyFone Novi AI是一款AI视频生成器,可以将文本内容转换为高质量视频,适用于快速生成故事视频等。产品具有多样的视频风格、语言支持和视频大小选择。
提供经济实惠的 Veo 3 API,轻松部署 AI 视频生成。
Veo3API.ai 提供性价比最高的 Veo 3 API,支持从文本和图像生成同步音频的4K视频。具有高扩展性和稳定性,价格实惠,适合各种视频生成需求。
使用Vexub AI视频生成器,将文本和音频快速轻松地转化为高质量视频。
Vexub是一款利用人工智能技术快速生成高质量视频的工具。它可以帮助用户将文本和音频素材转化为精美的视频作品,提高视频制作效率,适用于个人创作者和商业用户。Vexub定位于为用户提供简单易用的视频制作工具,让创作变得更加轻松和高效。价格分为基础版、专业版和企业版,灵活满足不同用户需求。
AI音乐生成器和AI歌曲生成器,帮助您将文本或歌词转化为专业质量的歌曲。
LyricsToSongAI.com是领先的AI音乐生成器和AI歌曲生成器,能够从文本或歌词创建专业质量的歌曲。该产品背景信息包括拥有10K全球用户、98%满意度率、服务于150个国家。
通过 MCP 协议访问 PixVerse 最新的视频生成模型。
PixVerse-MCP 是一个工具,允许用户通过支持模型上下文协议(MCP)的应用程序访问 PixVerse 最新的视频生成模型。该产品提供了文本转视频等功能,适用于创作者和开发者,能够在任何地方生成高质量的视频。PixVerse 平台需要 API 积分,用户需自行购买。
基于 DiT 的人类图像动画框架,实现精细控制与长效一致性。
DreamActor-M1 是一个基于扩散变换器 (DiT) 的人类动画框架,旨在实现细粒度的整体可控性、多尺度适应性和长期时间一致性。该模型通过混合引导,能够生成高表现力和真实感的人类视频,适用于从肖像到全身动画的多种场景。其主要优势在于高保真度和身份保留,为人类行为动画带来了新的可能性。
AI视频,短视频,创作视频,多语言视频,AI视频创作视频,虚拟人物视频,口播视频
KreadoAI 是一款强大的 AI 视频生成工具,允许用户通过文本、图片、PPT等内容快速创建专业级视频。该平台提供 700 多种 AI 数字化身,支持 140 多种语言的 1600 多种 AI 语音,并集成了 DeepSeek AI,增强了内容创作的智能化体验。KreadoAI 致力于帮助企业、营销人员、教育机构和个人高效生成视频内容,同时提供简单易用的编辑工具,优化成本、时间和质量。
1.3B参数的图像转视频模型,用于生成3D一致的新场景视图
Stable Virtual Camera是Stability AI开发的一个1.3B参数的通用扩散模型,属于Transformer图像转视频模型。其重要性在于为新型视图合成(NVS)提供了技术支持,能够根据输入视图和目标相机生成3D一致的新场景视图。主要优点是可自由指定目标相机轨迹,能生成大视角变化且时间上平滑的样本,无需额外神经辐射场(NeRF)蒸馏即可保持高一致性,还能生成长达半分钟的高质量无缝循环视频。该模型仅可免费用于研究和非商业用途,定位是为研究人员和非商业创作者提供创新的图像转视频解决方案。
基于AI技术的智能娱乐办公助手,提供音视频转文字、文稿编辑、翻译等多功能服务
悦录是一款依托同花顺智能语音和自然语言处理技术开发的智能办公助手。它通过高效的转文字功能,帮助用户快速将音视频内容转化为文字,极大地提升了办公效率。产品支持多语种识别,准确率高,能满足不同场景下的需求。其背景是基于现代办公中对高效记录和信息整理的需求,旨在解放白领和学生群体,激发创造力。目前产品提供免费服务,定位为智能办公领域的创新工具。
ToVideo 是一个将图片转换为视频的在线工具,提供免费的 AI 功能和无缝编辑体验。
ToVideo 是一款专注于将图片转换为视频的在线工具。它利用 AI 技术,为用户提供快速、便捷的图片转视频解决方案。用户可以通过简单的操作,将静态图片转化为具有动态效果、过渡动画和背景音乐的视频。该工具的主要优点包括操作简单、支持免费使用、提供高质量的 MP4 视频下载,且无水印。它适用于个人、教育、商业等多种场景,帮助用户快速制作出适合社交媒体、广告宣传或个人展示的视频内容。ToVideo 提供免费版本,同时也有付费的高级功能,以满足不同用户的需求。
© 2025 AIbase 备案号:闽ICP备08105208号-14