构建创意工作代理层,可跨图像、视频和音频进行规划与执行。
Eversince是一个专注于为创意工作构建代理层的平台。其重要性在于打破了图像、视频和音频等不同创意领域之间的界限,在一个平台上实现创意的全流程规划与执行。主要优点包括提高创作效率、降低创作门槛、多模态支持等。产品背景方面,随着创意产业的迅速发展,市场对于整合性的创意工具需求增加,Eversince应运而生。关于价格,文档中未提及。产品定位为为创意工作者提供一站式的创意解决方案。
实时AI指导工具,用于面试、会议、销售电话等场景,桌面覆盖且不可见。
Hintedly是一款桌面客户端产品,由AwesomeAI Inc开发。它为面试、会议、销售电话等场景提供实时AI指导,以透明桌面覆盖层的形式呈现,其他人无法看到。主要优点包括提供即时的AI答案,帮助用户随时知道该说什么;答案基于当下场景,结合屏幕内容、对话和文件;支持多种平台和工具;会议结束后能生成会议记录、行动项和跟进邮件等。产品提供免费试用,无需复杂设置和管理员权限,适用于需要在高压力场景中保持敏锐和专业的人群。
免费的Whisper AI,先进的音频转文本工具,支持100+语言,永久免费。
Free Whisper AI是一款由OpenAI的Whisper技术驱动的先进音频转文本工具。其重要性在于能够高效、准确地将语音内容转化为文本,为用户节省大量时间和精力。主要优点包括:具备99%的准确率,支持100多种语言,实时处理能力强,且完全免费,无隐藏费用和使用限制。该产品定位广泛,适用于内容创作者、企业、教育、法律、医疗、媒体等多个领域。
无限画布串起顶尖AI模型,浏览器内完成分镜、迭代与发布
ZOOOP是一个AI原生创作平台,在浏览器端为用户提供图像、视频、音频的生成服务。它集成了各类媒体最顶级的AI模型,用户既可以在无限画布上进行创作,也能使用独立的AI工具完成专项任务,还能调用即用型AI模板。平台的个人版按需付费,新用户注册赠送启动积分,积分包购买的积分永不过期。团队版可免费起步,有3个免费创作者席位,更大团队可选择Pro订阅。其定位是满足创作者在AI创作领域的多样化需求,无论是个人创作者还是团队都能借助平台高效完成创作任务。
Stable Audio 3在线工作台,可用于AI音乐、声音设计、音频修补等
Stable Audio 3是Stability AI推出的新音频模型家族,有Small、Medium和Large版本,Small与Medium提供开放权重,Large面向更高阶生产部署。其主要优点在于支持最长约六分钟的可变长度生成,适合完整音乐弧线等;强调音频修补与续写,工作流更接近音频制作。价格方面,方案与定价随积分与用量扩展,兼顾轻度与重度使用,有入门性价比、创作者用量、团队弹性等不同方案。定位是面向艺术实验、长音频创作、声音设计以及可编辑生成的需求。
VeoOmni由谷歌AI驱动,可从文本或图像生成1080p电影级视频并同步音频。
VeoOmni是由谷歌最新多模态AI驱动的视频生成平台,基于谷歌统一的多模态Transformer架构,能对文本、图像、音频和视频令牌进行统一处理。其重要性在于让任何人只需通过文本提示就能轻松进行专业的电影级创作。主要优点包括统一的视频和音频生成、原生多语言唇形同步,输出具有高连贯性和电影级质量。目前平台在推出时提供首单AI视频生成50%的折扣优惠,定位是面向广大创作者,降低专业视频创作的门槛。
Veo Omni是AI视频工作区,可依场景简报等生成定向视频片段。
Veo Omni是一款AI视频工作区,它能将场景简报、参考图像、摄像机移动、动作注释和声音意图转化为生成的视频场景。其主要优点在于提供了全面的视频创作控制,从场景构思到最终生成,涵盖了文本到视频、图像到视频等多种创作方式,还能控制摄像机运动、音频效果等。该产品有不同的定价计划,包括基础版、专业版和工作室版,以满足不同用户的需求,定位从业余爱好者到专业团队。基础版每月15.83美元(原价19.90美元),适合业余爱好者和偶尔创作的用户;专业版每月34.99美元(原价49.90美元),适合需要更多功能的创作者;工作室版每月59.99美元(原价99.90美元),适合专业人士和团队。
可对音视频、PDF和图像进行转录、加字幕、翻译、修复和文本提取
Presentr Analyze是一款强大的媒体处理工具,其核心功能在于对音频、视频、PDF和图像进行转录、加字幕、翻译、修复以及文本提取。该产品的重要性体现在它极大地提高了媒体内容处理的效率,节省了人工处理的时间和精力。主要优点包括处理速度快,能在几分钟内完成转录、生成字幕等操作;支持多种语言翻译,方便内容的全球化传播;提供免费工具,让用户可以先体验部分功能。产品背景方面,它是为满足媒体工作者、内容创作者等对媒体内容处理的需求而开发。价格上,目前提供早期采用者定价,在正式公开推出前可锁定折扣费率。产品定位是为有媒体内容处理需求的用户提供一站式解决方案,涵盖从内容摄取到结果交付的全流程。
Demi AI是主动式一体化助手,可整理收件箱、自动起草回复等
Demi AI是一款主动式的一体化AI助手,能与Gmail和Outlook等现有客户端集成,无需设置时间。其主要优点是能节省用户时间、减少大脑负担,让用户专注于销售工作。产品背景旨在解决用户处理邮件和会议等工作的繁琐问题。价格方面,有不同套餐,如年度starter套餐38.50美元/用户/月,Pro套餐76.100美元/用户/月,Team套餐提供定制价格。产品定位为帮助销售代表和团队提高工作效率、促成更多交易。
一个统一API,可生成图像、合成语音、转录音视频,低成本访问开源模型。
deAPI是一个统一的API,可用于生成图像、合成语音、转录音频或视频。其重要性在于为用户提供了便捷的方式来接入领先的开源AI模型。主要优点包括成本低,用户可以以较低的成本使用这些模型;使用统一的API,操作更加方便。产品背景是为了满足用户对开源AI模型的需求,简化使用流程。价格方面,用户可以先领取免费额度进行试用。产品定位是为开发者和企业提供高效、低成本的AI服务。
终极AI播客工具,上传一次,获取转录、笔记、剪辑等所需内容。
Podsuite是一款专为播客打造的AI工具,其重要性在于极大提升了播客内容处理的效率。主要优点包括节省大量手动工作时间,实现一次上传获取多种内容输出,输出结果围绕播客实际工作设计,具有结构化工作流程。产品背景是满足播客创作者、营销人员和内容团队对高效处理播客内容的需求。价格方面提供免费试用,无需信用卡。定位是成为播客内容创作和推广的一站式解决方案。
为2 - 10岁儿童定制的睡前故事APP,基于临床儿童心理学。
Lunia是一款专为2 - 10岁儿童设计的iOS应用程序,它基于临床儿童心理学(如Wolpe、Bandura、Selman、Ehrlin的理论),通过个性化的睡前故事帮助孩子解决心理问题。每个故事都会根据孩子的名字、梦想和当晚的情绪焦点进行重写。产品强调教育性而非娱乐性,无广告、无跟踪,所有故事生成在服务器端完成,孩子数据加密存储在欧盟数据中心。其价格方面,有每月499.99里拉和每年4999.99里拉的订阅套餐。该产品的定位是为孩子提供具有教育意义的睡前故事,帮助他们克服恐惧、建立自信、培养同理心和获得安宁的睡眠。
knooth是一款macOS屏幕录制应用,具备内置编辑、AI字幕等功能。
knooth是一款专为macOS系统打造的屏幕录制应用,它结合了强大的内置编辑功能、AI字幕、音频清理和动画效果等。其主要优点是提供一体化的视频创作体验,用户无需离开应用就能完成从录制到精修的全过程。产品定位面向个人用户,无论是用于个人学习、专业工作还是制作教程等都非常合适。价格方面,提供1周免费试用,之后有每月9.99美元和每年59.99美元(相当于每月4.99美元,节省50%)两种订阅方案。
全球最大的音频库,提供有声书、播客等丰富音频资源。
Azalea Labs是一个音频资源平台,作为全球最大的音频库,它拥有海量的有声书、播客等资源。其重要性在于为用户提供了便捷获取各类音频内容的途径,满足了不同用户的音频需求。主要优点包括资源丰富、可免费试用一段时间。产品定位是打造一个集多种音频内容于一体的平台,让用户能够轻松享受音频带来的乐趣。目前未提及价格相关信息,推测可免费试用。
talat是私人会议笔记应用,实时转录对话,数据存本地。
Talat是一款用于会议记录的桌面客户端应用程序。它的主要功能是利用设备端AI实时转录会议内容,并将所有数据保存在本地计算机上,避免了数据存储在云端带来的隐私风险。该产品由一个两人团队快速迭代开发。其重要性在于为用户提供了一种安全、便捷的会议记录方式,既保证了数据的隐私性,又具备高效的转录和总结功能。产品为一次性购买,提供10小时免费使用时间,无需创建账户。定位是为注重隐私和数据安全的用户提供高质量的会议记录解决方案。
Askmeety:专为Apple Silicon打造,100%离线会议记录应用
Askmeety是一款专为Apple Silicon设备打造的桌面客户端应用,运行于macOS 14 Sonoma或更高版本系统。它能对会议进行捕捉、转录和总结,且整个过程完全离线,无需依赖云服务,保障了会议信息的隐私安全。产品采用一次性付费模式,提供终身访问权限,避免了云存储的持续费用。其定位是为各类会议参与者提供高效、安全、便捷的会议记录和管理解决方案。
GPT Realtime 2可实现即时、自然的AI音频生成,支持文本转语音。
GPT Realtime 2是一款基于OpenRouter的AI音频生成和文本转语音API产品。其重要性在于为用户提供便捷、高效的语音生成解决方案。主要优点包括:具有六种自然、富有情感语调的AI语音,可即时生成音频;支持流式音频响应并提供转录反馈;拥有简单的REST API和多语言SDK,便于开发者集成。产品提供免费的演示模式,可在浏览器中直接测试,无需注册。真实的音频生成则通过用户配置的OpenRouter账户和模型路由进行计费。该产品定位为帮助团队快速实现语音生成,适用于多种场景,从原型设计到实际应用开发均可使用。
© 2026 AIbase 备案号:闽ICP备08105208号-14