基于 Diffusion Transformer 架构的十亿参数文生 3D 动作模型。
HY-Motion 1.0 是腾讯研发的大语言模型,专注于生成高质量的 3D 角色动作,具有优秀的动作生成能力和对文本指令的理解能力。该模型结合了流匹配机制与三阶段训练体系,通过引入人类反馈强化学习,显著提高了动作的物理合理性。其开源计划旨在推动文生动作技术的发展,降低高质量动画制作的门槛。
ColorPage Lab是AI填色页生成器,可按需生成独特填色页,适合各年龄段。
ColorPage Lab是一款基于先进AI技术的填色页生成器。它能根据用户输入的文本提示或上传的图片,即时生成高质量的填色页。该产品的主要优点在于其强大的AI创造力,能瞬间生成符合用户兴趣的独特填色页;完全免费且无限制下载和打印,无需隐藏费用和订阅;适合所有年龄段和技能水平的人群。产品背景是为了满足人们对创意填色的需求,让不同年龄段的人都能享受填色的乐趣。价格方面,产品完全免费,定位是面向全球用户提供便捷、有趣的填色页生成服务。
无需代码,基于自有数据训练智能AI聊天机器人,快速解决业务问题。
Chatref是一个无需代码的平台,可基于用户自有数据构建AI聊天机器人。它利用RAG(检索增强生成)技术,将企业知识转化为实时对话系统,解决传统客服和聊天机器人存在的问题。其重要性在于消除运营摩擦,提高工作效率。主要优点包括高精度、可直接连接非结构化数据、能实现工作流自动化等。产品背景是为解决多数客户支持团队知识分散、传统聊天机器人功能有限的问题而存在。价格方面,提供免费计划,每月包含100条消息。定位是帮助企业将公司知识转化为对话智能,适用于多种行业。
专为Mac用户打造的转录应用,支持多种文件,准确快速,可本地或云端处理。
Whisper Snapper是一款专为Mac用户设计的转录应用程序。它采用行业领先的AI引擎,如Whisper、GPT 4o、Parakeet等,能实现快速、准确的转录。重要性在于它满足了用户对音频、视频转录的需求,无需复杂设置,用户可直接拖放文件进行转录。主要优点包括支持99种语言、6种导出格式,可选择本地或云端AI处理,保护用户敏感数据;还具备说话人识别等实用功能。产品背景是为解决Mac用户转录难题而生。价格方面,可免费试用,升级Pro版只需一次性支付9.99美元终身使用。定位是为创作者和专业人士提供高效、安全的转录解决方案。
TurboDiffusion: 视频生成加速框架,速度提升 100-200 倍。
TurboDiffusion 是一种视频生成加速框架,能够在单个 RTX 5090 上将端到端的扩散生成速度提升 100 到 200 倍,同时保持视频质量。其主要技术包括 SageAttention、稀疏线性注意力 (SLA) 以及时间步提炼 (rCM),适用于对实时视频生成有高要求的应用场景,特别适合研究和开发团队。
一体化AI创意平台,集视频、图像、音乐、语音合成等功能于一体。
Artta AI是一个一体化的AI创意平台,它整合了多种先进的AI模型,如Sora 2、Veo 3、Flux、DALL - E和Stable Diffusion等。该平台的重要性在于为现代内容创作者提供了一站式的创意解决方案,从概念到最终产品的整个流程都能在一个平台上完成。其主要优点包括支持多种AI模型、拥有自动化创意工作流程、提供专业的资产管理工具等。价格方面,图像生成最低0.04美元/张,视频生成最低0.5美元/个。平台定位是服务现代内容创作者,无论是营销人员、电影制作人还是普通创意工作者,都能借助这个平台将创意转化为专业内容。
免费生成高质量的 Sora 2 视频,无水印,最多 25 秒。
Sora 2 AI 视频生成器是一款基于 OpenAI 技术的在线工具,可以将文本描述转化为高质量的视频内容。该产品允许用户生成无水印、1080p 分辨率的视频,最长可达 25 秒。使用 Sora 2 无需支付高额的订阅费用,提供了极具性价比的选择,是个人创作者和企业的理想工具。
微软Trellis 2 AI,快速将图像转为含PBR纹理的高质量3D模型
Trellis 2 AI是微软研发的先进3D生成模型,拥有40亿参数。其核心是创新的O - Voxel表示,能处理复杂拓扑结构。该模型可在数秒内将2D图像转换为带有PBR纹理的3D资产,无需额外优化和手动操作,实现端到端工作流程。它在速度和质量上达到了前所未有的平衡,能生成高达1536³分辨率的逼真资产。在trellis3d.net平台上可直接使用,暂未提及价格信息。定位为专业的3D生成解决方案,适合有3D模型创建需求的用户。
Levelr提供AI音频修复、母带处理、语音隔离与增强等功能。
Levelr是一款专注于AI音频处理与分析的产品。其核心技术为利用人工智能算法对音频进行处理,涵盖音频修复、母带处理、语音隔离与增强等功能。该产品的重要性在于极大地简化了音频后期制作流程,提升了音频质量。主要优点包括能够高效去除背景噪音、清晰分离语音、提升语音清晰度,适用于多种音频处理场景。产品定位为满足不同行业对高质量音频处理的需求,无论是专业音频制作人员还是普通用户,都能借助其强大功能提升音频内容质量。价格方面,提供免费试用,用户可先体验产品功能。
免费的一体化AI语音创作平台,支持文本转语音等功能
Rekam AI是一款一体化的AI语音创作平台,其重要性在于为用户提供了便捷高效的语音处理解决方案。主要优点包括免费使用、具有高质量且逼真的类人AI语音模型,涵盖了文本转语音、语音转文本、语音克隆等多种功能。产品定位是为有语音创作需求的用户提供一站式服务。价格方面,有免费版本,也有Pro版可进行付费升级。
利用 Lip Sync AI 轻松创建完美的 AI 口型动画。
Lip Sync AI 是一个先进的口型动画生成器,利用 AI 技术实现视频中的唇动与音频的完美同步。该产品支持多种语言和场景,极大提高视频翻译和内容创作的效率。通过 Lip Sync AI,用户能够在短时间内创建出专业级别的视频内容,提升观众的参与度与转化率。该工具特别适合电商、营销、教育及社交媒体内容创作者使用,且提供高效、低成本的解决方案。
Blushly可语音与AI角色聊天,免费无限制,支持自定义与角色扮演。
Blushly是一个允许用户通过语音与AI角色进行对话的平台。其重要性在于提供了更自然、真实的交互体验,打破了传统文字聊天的局限。主要优点包括免费使用、无内容过滤限制、可创建自定义伴侣以及支持各种角色扮演场景。该平台定位为娱乐向,适合喜欢与AI互动、探索幻想场景的用户。价格方面,完全免费,无使用时长和次数限制。
使用Wan 2.6 AI将文本和图像转化为专业15秒视频,适配多平台。
Wan 2.6 AI视频生成器是阿里巴巴推出的一款基于多模态AI技术的视频生成工具。其重要性在于为用户提供了便捷、高效的视频创作解决方案,尤其适用于短视频内容创作。主要优点包括:能快速将文本或图像转化为专业视频,具备音频同步、视觉连贯、参考一致性高等特点。产品定位是满足社交媒体内容创作者、营销人员、品牌管理者等人群对短视频内容的创作需求。目前页面未提及价格信息。
免费的 AI 视频转换为可编辑 PowerPoint 和 PDF 工具。
Video2PPT 是一款强大的在线工具,可以将视频转换为可编辑的 PowerPoint 演示文稿。通过 AI 技术,该工具能够自动提取视频中的关键幻灯片,并支持多种视频格式的上传,确保用户能够快速而高效地生成演示材料。它不仅提供了高准确率的内容提取功能,还保证用户数据的隐私安全。其定价结构合理,提供免费和付费两种方案,适合各种需求的用户。
Nano AI是先进的AI图像生成器,用纳米香蕉技术秒速生成惊艳图像。
Nano AI是一款由先进纳米香蕉技术驱动的AI图像生成器,为创意专业人士提供免费服务。其重要性在于革新了图像生成方式,让图像创作变得轻松高效。主要优点包括:使用先进的纳米香蕉模型,能实现高质量图像生成;图像创建速度极快,仅需数秒;界面简单直观,易于操作;提供高分辨率输出,图像细节清晰。产品定位为满足创意专业人士和普通用户的图像生成需求。在价格方面,目前有圣诞节促销活动,可享受30%的折扣,使用代码“NANO2025”即可。
2025全新发布的AI语音输入法,毫秒响应,精准识别,智能重组语言。
秒言AI语音输入法是杭州点动星河科技有限公司在2025年全新发布的一款产品。它依靠强大的AI模型,具备毫秒级极速响应和精准识别能力,能智能重组碎片化语言,还原输入原意。不仅可以作为普通输入法使用,还能充当AI助理,在任何输入框中一键唤起多种AI能力。该产品免费使用,定位为提升用户输入效率和体验的生产力工具,让用户摆脱传统输入方式的束缚,开启极致输入体验。
Chunks用AI将长视频转为自动高光片段,生成可分享短片
Chunks是一款利用AI技术的视频处理工具,主要功能是将长视频自动转换为高光片段。它的重要性在于极大提高了视频处理效率,节省了用户手动筛选视频关键片段的时间。产品的主要优点包括使用AI自动分析原始视频素材,能快速找到最具价值的时刻;支持通过基本文本提示将原始视频文件转换为可分享的短片;具备面部检测和命名功能,且生成的短片无水印。该产品免费使用,定位为帮助用户轻松处理视频素材,生成适合社交媒体分享的内容。
© 2026 AIbase 备案号:闽ICP备08105208号-14