基于 Diffusion Transformer 架构的十亿参数文生 3D 动作模型。
HY-Motion 1.0 是腾讯研发的大语言模型,专注于生成高质量的 3D 角色动作,具有优秀的动作生成能力和对文本指令的理解能力。该模型结合了流匹配机制与三阶段训练体系,通过引入人类反馈强化学习,显著提高了动作的物理合理性。其开源计划旨在推动文生动作技术的发展,降低高质量动画制作的门槛。
1000+精选nano banana提示词,免费社区驱动,为Gemini Nano Banana设计
Best Nano Banana Prompt是一个专注于AI图像生成的网站,提供1000多个专为Gemini Nano Banana设计的精选提示词。该网站由社区驱动且每日更新,用户可以免费使用这些提示词来生成各种风格的AI图像。其重要性在于帮助用户更便捷地利用AI技术创造出高质量的图像。产品的主要优点包括免费使用、社区内容丰富且不断更新,还有全新的Chrome扩展可作为终极AI提示词助手。产品定位为面向广大AI图像生成爱好者,提供丰富且优质的提示词资源。
一体化AI创意平台,集视频、图像、音乐、语音合成等功能于一体。
Artta AI是一个一体化的AI创意平台,它整合了多种先进的AI模型,如Sora 2、Veo 3、Flux、DALL - E和Stable Diffusion等。该平台的重要性在于为现代内容创作者提供了一站式的创意解决方案,从概念到最终产品的整个流程都能在一个平台上完成。其主要优点包括支持多种AI模型、拥有自动化创意工作流程、提供专业的资产管理工具等。价格方面,图像生成最低0.04美元/张,视频生成最低0.5美元/个。平台定位是服务现代内容创作者,无论是营销人员、电影制作人还是普通创意工作者,都能借助这个平台将创意转化为专业内容。
微软Trellis 2 AI,快速将图像转为含PBR纹理的高质量3D模型
Trellis 2 AI是微软研发的先进3D生成模型,拥有40亿参数。其核心是创新的O - Voxel表示,能处理复杂拓扑结构。该模型可在数秒内将2D图像转换为带有PBR纹理的3D资产,无需额外优化和手动操作,实现端到端工作流程。它在速度和质量上达到了前所未有的平衡,能生成高达1536³分辨率的逼真资产。在trellis3d.net平台上可直接使用,暂未提及价格信息。定位为专业的3D生成解决方案,适合有3D模型创建需求的用户。
专业AI游戏素材生成器,支持从单张图片快速创建2D/3D动画及像素角色。
God Mode AI 是一款专为游戏开发人员设计的专业AI素材生成平台。它通过先进的AI技术简化了传统游戏动画制作中复杂的建模、蒙皮和骨骼绑定流程。该产品定位为提高10倍生产力的辅助工具,旨在消除艺术创作的技术障碍。背景上,它由开源研究项目演变而来,具有深厚的技术积累。价格采用灵活的‘按需付费’模式及针对社区分享的订阅制,非常适合追求效率的独立开发者和游戏工作室。
基于Meta的SAM 3D模型,可秒将单张图像转换成高质量3D模型。
SAM 3D是一款在线工具,基于Meta的SAM 3D研究模型,可将单张图像快速转换为高质量的3D模型。其重要性在于打破了传统摄影测量和仅使用合成数据训练的限制,为3D重建带来了语义理解。主要优点包括在复杂真实场景下的高鲁棒性、快速推理、支持标准3D格式导出等。产品背景是Meta在计算机视觉领域的研究成果,页面未提及价格信息,定位是为用户提供便捷的3D重建服务。
一款免费的 AI 照片编辑器,快速实现创意编辑。
Banana AI 是由 Google 的 Nano Banana 技术驱动的先进 AI 照片编辑器,能够通过简单的文本提示快速实现照片编辑。无论是去除对象、更换背景还是应用创意风格,Banana AI 都能在 1-2 秒内提供结果,适合需要快速编辑的用户。该产品特别适合创建头像、品牌视觉或将肖像转变为独特的艺术风格,如动漫或皮克斯风格,定位为一种便捷的在线工具,免费提供使用。
先进的文本转语音模型,提供高质量的语音合成服务。
Qwen3-TTS-Demo 是一个强大的文本转语音模型,利用先进的机器学习技术提供高质量的语音合成。它在多个应用场景中表现出色,如语音助手、教育软件和媒体内容创作,极大地提升了用户体验。该模型不仅支持多种语言,还能够生成自然流畅的语音,适用于个人和商业使用,帮助用户节省时间并提高工作效率。
Kling 2.6 Studio:AI文本转视频,支持原生音频,稳定生成高质量视频。
Kling 2.6 Studio是下一代AI视频合成平台,其核心技术是先进的Kling 2.6模型。该平台的重要性在于为用户提供了便捷、高效且高质量的视频生成解决方案,打破了传统视频制作的局限。主要优点包括:具有无与伦比的提示遵循度和时间一致性,能实现流畅的相机运动和自然的动态效果,对复杂场景有深度理解,可快速生成高质量视频。其价格定位涵盖不同套餐,如5.9美元的入门包含160积分,且无隐藏费用,适合各类视频创作人群。
Noiz AI提供自然流畅的语音合成服务,应用场景丰富,生成高效。
Noiz AI是一款提供智能语音合成服务的平台。其依托自主研发的大规模语音模型,具备成本效益高、生成效率快和个性化服务强等行业优势。该平台提供从即时生成到专业级音色定制的多样化解决方案,应用场景广泛,涵盖文本转语音、音色定制、多媒体配音及跨语言音视频翻译等。价格方面,有首年5折优惠、赠送10万积分、黑色星期五特惠购买套餐最多减免50%费用等活动,还提供免费试用。它定位为满足不同用户在语音合成方面的各种需求,无论是内容创作者、企业还是个人用户,都能借助其高效地完成语音相关工作。
Vidofy AI可秒级生成专业AI视频和独特图像,释放你的创造力。
Vidofy AI是一款一体化的AI工作室,它依托OpenAI Gemini、Kling AI、Runway、Midjourney等先进技术,能够让用户仅通过简单的文本提示,在数秒内将其转化为病毒式传播的视频、令人惊叹的图像以及逼真的音频,无需任何技能。该产品提供了丰富的AI模型库,涵盖视频生成、图像生成、语音合成等多种功能,还配备了强大的AI工具套件,可对音视频和图像进行编辑、转换和特效处理。产品定位为面向创作者的综合性AI生成平台,其中Nano Banana Pro版本具备4K超高清AI图像搜索、多图像合并、精确文本控制等专业编辑功能,让创作更加自由高效。价格方面,提供免费使用,同时也有付费的专业版本。
Pixwith AI可在线免费快速创建AI视频,无需编辑技能,多种功能助力创作。
Pixwith AI是一款综合性AI视频生成平台,整合了行业内多个领先模型,如OpenAI的Sora、Google的Veo等。其重要性在于为创作者提供了便捷、高效且功能丰富的视频创作解决方案。主要优点包括:无需编辑技能,从文本提示即可快速生成视频;支持多种分辨率和时长选择,满足不同项目需求;所有模型生成的视频均无水印,适合商业使用;新用户有免费试用额度;具备AI音频和语音合成功能,还能创建数字人和头像。价格方面,提供免费试用,具体付费模式未详细提及。该产品定位为帮助内容创作者、企业等快速、轻松地创建高质量视频。
先进AI技术,可将文字和图像瞬间转化为3D模型,无需3D建模经验。
To 3D AI是一款先进的AI 3D模型生成器,利用先进的机器学习算法,可将文字描述和图像转化为详细的3D模型。其重要性在于极大地简化了3D模型的创建过程,无需专业的3D建模经验。主要优点包括生成速度快,相比传统3D建模工作流程快10 - 100倍;支持多种格式导出,与主流3D软件和3D打印工作流程兼容;生成的模型质量高,具有优化的拓扑结构和PBR纹理。产品背景信息暂未提及价格相关内容,其定位是为开发者、设计师、艺术家等专业人士提供高效的3D模型创建解决方案。
无需登录,用预设提示生成图像,免费试用3D图、头像等AI图像工具。
Hocha是一款在线AI图像生成平台,无需登录即可免费试用。它拥有先进AI工具,能进行3D图形生成、专业头像制作、插画生成和图像编辑等操作。其优点包括闪电般的处理速度,能在数秒内生成高质量图像;提供预设提示,方便用户快速上手;具备完整的创意套件,一个平台满足多种图像创作需求。产品定位于创作者、企业、营销人员等专业人士,免费试用无需注册、提供免费额度,付费用户可获得完整商业授权。
Aivvid AI是一体化AI创意平台,可生成视频、图像、音乐和配音。
Aivvid AI是一款面向现代内容创作者的一体化AI创意平台。它结合了多种先进的AI模型,如Sora 2、Veo 3、Flux、DALL - E等,将AI视频生成、图像创作、语音合成和音乐创作整合在一个无缝的工作流程中。其重要性在于为创作者提供了一站式的内容创作解决方案,能够快速将创意转化为专业内容。该平台适合从营销人员到电影制作人等各类创作者,可实现大规模的高质量内容输出。价格方面,有免费试用,还可获取5个免费积分用于创作,之后按使用情况付费,且价格即将上涨。
SAM 3D:AI驱动,秒速将2D图像转化为专业级3D模型
SAM 3D是一款由人工智能驱动的3D重建平台,它基于先进的SAM(Segment Anything Model)技术,实现了将单张2D照片转化为精确、全纹理3D模型的突破。该平台打破了传统3D建模的壁垒,无需昂贵设备和专业技术知识,为全球开发者、设计师、研究人员和内容创作者提供了企业级的3D重建能力。其重要性在于降低了3D建模的门槛,使更多人能够轻松获得高质量的3D模型。价格方面,提供免费使用,无需信用卡信息。产品定位是为各行业提供便捷、高效的3D重建解决方案。
Meta的单图像3D重建模型,融合SAM 3分割与几何纹理布局预测生成3D资产
sam3d是Meta推出的研究级单图像3D重建模型,它将SAM 3的开放词汇分割与几何、纹理和布局预测相融合,能直接从单张RGB图像生成3D资产。该模型具有开源的检查点、推理代码和基准数据集,方便进行可重复的研究和生产试点。其重要性在于降低了3D重建的硬件和设置复杂度,提高了重建效率。主要优点包括单图像输入、开放词汇分割、开放生态系统、适用于XR、高效输入和有明确的评估套件等。产品免费开源,定位于创意工具、电商AR购物、机器人感知和科学可视化等领域。
Marble可让用户通过简单提示创建、编辑和分享高保真3D世界。
Marble是一款用于创建和分享3D世界的工具,由World Labs推出。其重要性在于为不同领域的用户提供了一个便捷的3D世界创作平台,降低了3D创作的门槛。主要优点包括强大且直观的工具、支持多种输入方式(文本、图像、视频、3D结构)、可探索社区创作的世界获取灵感等。产品定位为面向艺术家、设计师、工程师以及对3D世界感兴趣的人群。目前页面未提及价格信息。
腾讯混元3D驱动的图片转3D与STL转换器,快速生成高精度3D模型
Image3D AI是一款由腾讯混元3D(Hunyuan 3D)强力驱动的图片转3D与STL转换器。其核心技术基于腾讯尖端的混元3D AI大模型,能够理解复杂空间关系、纹理细节和几何结构。该产品的主要优点包括:多模态输入,可处理单张图或多视图;能生成高精细度的PBR材质;保证高精细度的模型输出;生成速度快,平均30 - 60秒完成。价格方面,暂未提及收费信息,推测有免费使用部分。产品定位是为不同行业提供图片转3D模型的解决方案,赋能工作流。
© 2026 AIbase 备案号:闽ICP备08105208号-14