Gemini Omni Flash可秒速生成AI视频,支持文本、图像及参考素材转视频
Gemini Omni Flash是一款强大的AI视频生成器,基于Gemini Omni技术,融合了多模态AI能力。它允许用户通过文本提示、图像和参考片段创建高清视频,无需专业技能。其重要性在于为创作者、营销人员等提供了灵活的视频创作方式。价格方面文中未明确提及,可能有免费试用和付费模式。产品定位为满足创作者、营销人员、电影制作人、讲故事者和AI内容团队的视频创作需求。
VeoOmni由谷歌AI驱动,可从文本或图像生成1080p电影级视频并同步音频。
VeoOmni是由谷歌最新多模态AI驱动的视频生成平台,基于谷歌统一的多模态Transformer架构,能对文本、图像、音频和视频令牌进行统一处理。其重要性在于让任何人只需通过文本提示就能轻松进行专业的电影级创作。主要优点包括统一的视频和音频生成、原生多语言唇形同步,输出具有高连贯性和电影级质量。目前平台在推出时提供首单AI视频生成50%的折扣优惠,定位是面向广大创作者,降低专业视频创作的门槛。
Veo Omni是AI视频工作区,可依场景简报等生成定向视频片段。
Veo Omni是一款AI视频工作区,它能将场景简报、参考图像、摄像机移动、动作注释和声音意图转化为生成的视频场景。其主要优点在于提供了全面的视频创作控制,从场景构思到最终生成,涵盖了文本到视频、图像到视频等多种创作方式,还能控制摄像机运动、音频效果等。该产品有不同的定价计划,包括基础版、专业版和工作室版,以满足不同用户的需求,定位从业余爱好者到专业团队。基础版每月15.83美元(原价19.90美元),适合业余爱好者和偶尔创作的用户;专业版每月34.99美元(原价49.90美元),适合需要更多功能的创作者;工作室版每月59.99美元(原价99.90美元),适合专业人士和团队。
一个统一API,可生成图像、合成语音、转录音视频,低成本访问开源模型。
deAPI是一个统一的API,可用于生成图像、合成语音、转录音频或视频。其重要性在于为用户提供了便捷的方式来接入领先的开源AI模型。主要优点包括成本低,用户可以以较低的成本使用这些模型;使用统一的API,操作更加方便。产品背景是为了满足用户对开源AI模型的需求,简化使用流程。价格方面,用户可以先领取免费额度进行试用。产品定位是为开发者和企业提供高效、低成本的AI服务。
基于Gemini Omni的AI视频生成器,支持文本、图像转视频等功能
该产品是一个专注于Gemini Omni的AI视频生成平台。其重要性在于利用先进的Gemini Omni技术,为用户提供便捷、高效的视频创作方式。主要优点包括支持多种视频创作方式,如文本到视频、图像到视频、视频混音等,还具备聊天编辑和AI视频模板等功能。产品背景是依托强大的Gemini Omni AI技术,为用户提供专业的视频创作服务。目前页面未提及价格定位,推测可能会有免费试用或付费模式。
为2 - 10岁儿童定制的睡前故事APP,基于临床儿童心理学。
Lunia是一款专为2 - 10岁儿童设计的iOS应用程序,它基于临床儿童心理学(如Wolpe、Bandura、Selman、Ehrlin的理论),通过个性化的睡前故事帮助孩子解决心理问题。每个故事都会根据孩子的名字、梦想和当晚的情绪焦点进行重写。产品强调教育性而非娱乐性,无广告、无跟踪,所有故事生成在服务器端完成,孩子数据加密存储在欧盟数据中心。其价格方面,有每月499.99里拉和每年4999.99里拉的订阅套餐。该产品的定位是为孩子提供具有教育意义的睡前故事,帮助他们克服恐惧、建立自信、培养同理心和获得安宁的睡眠。
knooth是一款macOS屏幕录制应用,具备内置编辑、AI字幕等功能。
knooth是一款专为macOS系统打造的屏幕录制应用,它结合了强大的内置编辑功能、AI字幕、音频清理和动画效果等。其主要优点是提供一体化的视频创作体验,用户无需离开应用就能完成从录制到精修的全过程。产品定位面向个人用户,无论是用于个人学习、专业工作还是制作教程等都非常合适。价格方面,提供1周免费试用,之后有每月9.99美元和每年59.99美元(相当于每月4.99美元,节省50%)两种订阅方案。
全球最大的音频库,提供有声书、播客等丰富音频资源。
Azalea Labs是一个音频资源平台,作为全球最大的音频库,它拥有海量的有声书、播客等资源。其重要性在于为用户提供了便捷获取各类音频内容的途径,满足了不同用户的音频需求。主要优点包括资源丰富、可免费试用一段时间。产品定位是打造一个集多种音频内容于一体的平台,让用户能够轻松享受音频带来的乐趣。目前未提及价格相关信息,推测可免费试用。
Google即将推出的AI视频模型,可通过聊天创建、编辑和混音视频。
Gemini Omni是Google即将推出的下一代AI视频模型,预计在2026年Google I/O大会发布。它将文本转视频、图像转视频、混音和对话式编辑四个工作流程统一在一个Gemini对话中,而不是使用四个独立的工具。该模型基于Veo系列,继承了Veo 3.1的原生音频、电影级运动和4 - 8秒剪辑质量。使用时需要消耗信用点,例如生成一个8秒、1080p分辨率的视频需要20个信用点。它的定位是覆盖完整的对话式视频创作循环,适用于多种视频创作场景,如教育、营销、企业培训等。
在ElevenMusic上流式播放音乐、混音曲目并创作自己的音乐。
ElevenMusic是一个在线音乐平台,允许用户流式播放音乐、进行混音以及创作自己的音乐作品。其主要优点在于提供了多样化的音乐体验,用户可以探索各种音乐类型,同时还能发挥自己的创意进行音乐创作。目前从页面信息无法得知价格情况,该平台定位为满足音乐爱好者对于音乐发现、创作和分享的需求。
GPT Realtime 2可实现即时、自然的AI音频生成,支持文本转语音。
GPT Realtime 2是一款基于OpenRouter的AI音频生成和文本转语音API产品。其重要性在于为用户提供便捷、高效的语音生成解决方案。主要优点包括:具有六种自然、富有情感语调的AI语音,可即时生成音频;支持流式音频响应并提供转录反馈;拥有简单的REST API和多语言SDK,便于开发者集成。产品提供免费的演示模式,可在浏览器中直接测试,无需注册。真实的音频生成则通过用户配置的OpenRouter账户和模型路由进行计费。该产品定位为帮助团队快速实现语音生成,适用于多种场景,从原型设计到实际应用开发均可使用。
集AI音乐创作、语音转换等多功能于一体的音频工具平台
Lalals是一款基于领先AI技术的音频工具平台。其重要性在于为音乐创作者、音频处理人员等提供了一站式的音频处理解决方案。主要优点包括功能丰富多样,拥有1000多种AI语音,支持多种音频处理操作,处理速度快,能极大提高工作效率。产品背景是为满足音乐创作和音频处理领域不断增长的需求而开发。关于价格,文中提到可以免费开始使用,具体是否有付费模式未明确提及,定位是面向广大音乐创作者、音频爱好者等群体。
世界排名第一的环保型神经AI媒体引擎,提供高精度转录和媒体转换。
GreenConvert是一款环保型神经AI媒体引擎,其重要性体现在以可持续、高效、安全的方式处理媒体文件。主要优点包括98%的准确转录、高保真媒体转换和8K视频处理能力。该引擎能降低CPU负载、优化能源使用,减少服务器端热能消耗,具有智能功率缩放和自适应比特率控制等功能,采用100%可再生能源数据中心进行高比特率视觉媒体渲染任务。产品背景基于对可持续和道德的神经处理框架的研究。关于价格,页面提及可免费注册,但未详细说明具体收费模式。其定位是为全球用户提供专业、环保的媒体处理服务。
字节跳动Seedance 2.0 API,支持多模态输入生成视频,有原生音频等功能。
Seedance 2.0 API是字节跳动推出的多模态视频AI模型,可通过PoYo平台直接使用,无需等待列表。该模型采用双分支扩散变压器架构,能够在一次传递中同时生成视频和音频,实现统一的音频 - 视频联合生成。它支持文本、图像、视频和音频的多模态输入,可实现多镜头叙事和8种语言的唇形同步。价格方面,从每秒0.04美元起,不同分辨率和输入情况价格有所不同。其定位是为创作者提供一种高效、便捷的视频生成解决方案,让用户能够轻松生成具有电影质感的视频。
在线将视频和音频转录为文本,支持99种语言,可导出多种格式。
Video to Text是一款在线AI转录工具,可将视频和音频文件快速准确地转换为文本。其核心技术在于先进的AI识别,能自动检测语言,支持99种语言。产品优势显著,高精度转录,能处理混合语言,有说话人识别和时间戳功能,还提供多种导出格式。价格采用按使用分钟付费模式,新用户有30分钟免费试用,无订阅要求。定位为满足多种场景下的转录需求,如视频字幕制作、会议记录、内容创作等。
Bleeper利用AI自动检测、静音并审查视频和音频中的脏话,节省编辑时间。
Bleeper是一款基于AI的内容审查工具,利用先进的人工智能技术,为视频、播客和音频材料提供自动化的脏话审查服务。其重要性在于能够显著节省创作者手动审查和编辑的时间,保护内容的传播范围和货币化。产品背景源于在电视市场的经验积累。价格方面,采用简单的令牌模型,有Starter(8.99欧元/月,1400个令牌/月)、Basic(14.99欧元/月,3400个令牌/月)、Pro(29.99欧元/月,8000个令牌/月)三种订阅套餐,还可随时充值令牌。定位是为视频和音频创作者提供高效、准确的内容审查解决方案。
SadHorse Studio由HappyHorse AI引擎驱动,可创建1080p AI视频,免费试用。
SadHorse Studio是一款由HappyHorse AI引擎驱动的AI视频生成工具。其重要性在于为用户提供了便捷高效的视频创作方式。主要优点包括能够快速将文本或图像转化为1080p高清视频,支持多种AI模型,提供同步音频,无需额外后期制作。产品背景基于先进的AI技术,如Minimax Hailuo 02 Pro。价格方面,有免费试用,注册即得10个视频信用点,足够制作1个免费视频,无需信用卡。定位为面向创作者的视频创作平台,帮助用户轻松创建高质量视频。
© 2026 AIbase 备案号:闽ICP备08105208号-14