浏览量:455
一键生成专属数字分身的APP
文心一言APP是依托百度文心大模型技术的AI应用产品。用户只需提供一张照片和三句语音,就可以一键生成专属的数字化身,可用于情感交流、求知探索、娱乐聊天等场景。该APP还具有语音交互、情绪交互、记忆能力强等特点。
高质量3D数字化身生成模型
RODIN Diffusion是一款AI系统,可自动生成高度详细的3D数字化身。生成的数字化身可以以前所未有的质量自由地360度查看。该模型显著加速了传统复杂的3D建模过程,并为3D艺术家开辟了新的机会。 RODIN模型架构:该3D数字化身扩散模型经过训练,可以生成以神经辐射场表示的3D数字化身。我们基于最先进的生成技术(扩散模型)进行3D建模。我们使用三平面表示来分解数字化身的神经辐射场,可以通过扩散模型明确地对其进行建模,并通过体积渲染将其渲染为图像。所提出的3D感知卷积在保持3D扩散建模完整性的同时带来了所需的计算效率。整个生成过程是一个分层过程,使用级联扩散模型进行多尺度建模。一旦训练了生成模型,就可以根据来自输入图像、文本提示或随机噪声的潜在代码来控制数字化身生成。 RODIN Diffusion模型的可视化。请参阅论文Rodin: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion以获取更多详细信息。
AI视频平台,创建个性化数字化身视频
Spiritme是一个AI视频平台,专注于使用数字化身创建个性化视频。用户可以通过简单的文本输入,由AI驱动的数字化身来表达内容,无需专业演技。该平台提供基础、高级、无限和定制等多种订阅计划,适用于不同的需求和预算。
数字化虚拟人与 AI 技术结合,打造全新智能交互体验。
硅基智能是一款数字化虚拟人与 AI 技术相结合的产品,主要应用于智能交互领域。其主要优点包括领先的 AI 技术、智能交互体验、商业化场景应用等。
怪兽智能科技推出的AI数字人产品,提供全息交互数字人、3D超写实交互数字人,AIGC生产、SaaS管理和直播服务平台
怪兽AI数字人是怪兽智能科技推出的产品,旨在通过AI技术提供数字人克隆、短视频生成、直播解决方案等服务。产品包括真人形象克隆、声音克隆、孪生姿态合成等核心技术,支持短视频内容生产创作及直播宣传,适用于品牌商家及本地生活商家。
帮助企业加速数字化转型的 AI 参考套件
英特尔AI和深度学习解决方案是由英特尔与 Accenture 合作推出的一系列可下载的 AI 参考套件,旨在帮助企业加速其数字化转型之旅。这些套件基于英特尔提供给数据科学家和开发人员的 AI 应用工具构建而成,每个套件包括模型代码、训练数据、机器学习流程的说明、库和英特尔 oneAPI 组件。
数字化甲骨文研究与共享平台
甲骨文AI协同平台是一个专注于甲骨文研究的数字化平台,集成了甲骨文全信息著录库、甲骨文总字表、数字工具箱等资源,通过AI技术辅助甲骨文的释读、研究和教育传播。平台汇聚了众多博物馆、专家学者以及社会各界人士的共同努力,旨在推动甲骨文研究的深入发展和甲骨文化的传承。
AI文档处理与数字化
iKapture是一款基于人工智能的文档处理解决方案,可以将文档转化为可操作的数据。它提供自动化的文档识别、提取和分类功能,帮助用户提高工作效率,减少人工操作。iKapture还支持多种文档格式的处理,包括文字、表格、图像等。价格根据使用量和功能需求而定,详情请查看官方网站。
专业的AI数字人平台,定制数字人专属IP,创造无限商业价值
怪兽智能全息舱是一个专业的AI数字人平台,致力于通过融合唤醒、语音识别、自然语音理解、虚拟人合成等AI核心技术,为用户提供多模态互动、业务办理、问题咨询、资讯播放、服务导览等服务。该平台提供智能硬件,包括业内领先的智能全息屏,以及虚拟人制作服务,帮助用户快速构建虚拟人应用产品。此外,怪兽智能全息舱还提供用户行为分析和AI多模态交互功能,以提升用户体验。该平台广泛应用于零售、文旅景区、服务型机构、政府和事业单位等场景。
AI数字人智能交互平台
DUIX是一个开源的AI数字人智能交互平台,由硅基智能打造。它允许开发者接入多种大模型和语音能力,实现数字人实时交互,并支持在Android和iOS多终端一键部署。DUIX适用于多种场景,包括地铁、银行、政务等,具有低成本快速部署、小网络依赖和功能多样化的特点。
通过AI驱动的虚拟形象,实现情感智能的实时交互体验。
Rapport AI-Driven Avatars 是一个基于AI技术的虚拟形象平台,专注于创建、动画化和部署具有情感智能的交互式虚拟角色。该平台支持多语言实时交互,适用于各种设备和平台。其核心技术包括实时音频驱动的面部动画和精准的唇部同步,通过与 Speech Graphics 的合作,提供卓越的视觉效果。该产品主要面向教育、企业培训、娱乐和营销等领域,旨在通过沉浸式体验提升用户参与度和学习效果。平台提供免费的探索者层级和付费的创作者层级,后者支持更多高级功能和定制化选项。
Articul8通过其全栈GenAI平台帮助企业加速数字化转型
Articul8提供全栈GenAI平台,可以快速将企业的数据转化为可操作的洞察,从而帮助企业加速数字化转型并释放持久的业务价值。平台具有就绪的API、托管的数据层、灵活的基础设施等功能,可以进行垂直优化和大规模部署,实现快速交付和可持续的成本。
手写笔记数字化模型,无需专业设备
InkSight是一个由Google Research开发的模型,旨在将手写笔记的照片转换成数字格式,精确还原书写笔迹,无需任何专业设备。这项技术的重要性在于它能够将传统的手写笔记转换为可编辑、可索引的数字形式,同时保留了手写的风格和感觉。InkSight通过学习“阅读”和“写作”来构建对书写的理解,使其能够在多种场景下,包括光线条件不佳、遮挡等情况下,都能良好地工作。这种技术的主要优点是它的通用性和对用户友好性,因为它不需要额外的硬件支持,降低了用户的入门门槛和成本。
下一代情感智能的对话视频界面,让AI交互更自然、更人性。
Conversational Video Interface(CVI)是Tavus推出的一种情感智能对话视频界面。它通过Phoenix-3、Raven-0和Sparrow-0三个模型协同工作,赋予AI真正的人类感知、倾听、理解和实时互动能力。CVI不仅是一个工具,更是一种全新的人机沟通方式,可应用于医疗、心理健康、销售培训、客户服务等多个领域,具有无限的使用场景。其背后的技术突破在于将人类对话的细微情感和节奏融入AI交互中,使AI不再是简单的回应,而是能思考、反应并改变我们与机器的互动方式。
国内领先的AI数字人口播视频在线创作平台
闪剪是一款 AI 数字人视频生成工具,用户可以定制自己的数字人,只需输入文字即可生成口播视频。 闪剪具备形象、声音克隆;链接成片以及直播切片等功能,手机端和网页端通用。
发现视频的情感构成
Imentiv AI是一款先进的情感AI工具,利用机器学习模型分析视频中演员的情感,深入洞察内容的情感影响。通过理解演员和故事传达的情感,您可以预测观众对内容的感知。利用Imentiv AI的情感AI解决方案,您可以创建引人入胜的内容,与观众产生共鸣,抓住他们的心灵。通过Imentiv AI的情感AI工具,释放视频的情感潜力,将您的内容提升到新的高度。
全球技术领先的AI数字人创作平台,快速复刻形象和声音,高效创作视频。
飞影数字人是上海灵之宇技术有限公司开发的AI数字人创作平台。该平台利用先进的AI技术,能够快速复刻用户的形象和声音,并生成逼真的数字人视频。其主要优点包括操作简便、生成速度快、效果逼真。该产品适用于多种场景,如口播短视频、电商直播、自媒体、广告营销和品牌宣传等,能够显著降低制作成本和时间。目前平台提供免费试用,具体价格需咨询官方。
首个面向语境智能的人类级实时交互系统,支持多情感、多风格语音交互。
SpeechGPT 2.0-preview 是一款由复旦大学自然语言处理实验室开发的先进语音交互模型。它通过海量语音数据训练,实现了低延迟、高自然度的语音交互能力。该模型能够模拟多种情感、风格和角色的语音表达,同时支持工具调用、在线搜索和外部知识库访问等功能。其主要优点包括强大的语音风格泛化能力、多角色模拟以及低延迟交互体验。目前该模型仅支持中文语音交互,未来计划扩展到更多语言。
AI数字人口型同步技术,无限多开贴牌OEM解决方案
小狐狸AI数字人分身系统是一款结合了人工智能技术的数字人口型同步产品,支持无限多开和贴牌OEM,适用于需要虚拟形象进行口型同步互动的场景。该产品背景基于人工智能技术的发展,特别是在虚拟主播和在线教育领域的应用需求日益增长。产品价格为3580元,定位于中高端市场,主要优点包括完全开源、支持自主二次开发和定制二次开发,以及免费搭建服务。
生成全身照片级人形化身的框架
Audio to Photoreal Embodiment是一个生成全身照片级人形化身的框架。它根据对话动态生成面部、身体和手部的多种姿势动作。其方法的关键在于通过将向量量化的样本多样性与扩散所获得的高频细节相结合,生成更具动态和表现力的动作。通过高度逼真的人形化身可视化生成的动作,能够表达出姿势中的重要细微差别(例如嘲笑和傲慢)。为了促进这一研究方向,我们引入了一种首次亮相的多视图对话数据集,可以进行照片级重建。实验证明,我们的模型生成了合适且多样化的动作,表现优于扩散和仅向量量化的方法。此外,我们的感知评估突出了在准确评估对话姿势中的微妙动作细节方面,照片级真实感(与网格)的重要性。代码和数据集可在线获取。
一站式AI数字人系统,支持视频合成、声音合成、声音克隆。
AIGCPanel是一个简单易用的一站式AI数字人系统,小白也可使用。支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。产品背景信息显示,AIGCPanel旨在通过集成多种AI功能,提升数字人素材管理的效率,降低技术门槛,使非专业人士也能轻松管理和使用AI数字人。产品基于AGPL-3.0开源,完全免费,可以直接使用。
实时语音交互数字人,支持端到端语音方案
VideoChat是一个实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。用户可以自定义数字人的形象和音色,支持音色克隆,无需训练,首包延迟低至3秒。该项目利用了最新的人工智能技术,包括自动语音识别(ASR)、大型语言模型(LLM)、端到端多模态大型语言模型(MLLM)、文本到语音(TTS)和说话头生成(THG),为用户提供了一个高度定制化和低延迟的交互体验。
国内领先的 AI 数字人视频在线创作平台。
闪剪是一款利用 AI 技术的数字人视频创作平台,支持用户快速生成个性化视频内容。通过输入关键词,AI 可以自动创作文案并一键生成数字人视频。该平台的优势在于提供了丰富的数字人视频模板和国际化配音,帮助企业团队实现高效的内容创作与营销。定位为助力企业的数字营销工具,闪剪通过降本增效来满足用户的需求。
AI辅助情感支持工具
Reassurance AI是一款AI辅助情感支持工具,通过提供安慰和支持的对话来帮助用户缓解焦虑和压力。它可以用于个人情感支持,同时也适用于心理咨询师和心理健康专业人士的辅助工具。该产品目前处于Beta测试阶段,定价和商业模式尚未确定。
实时交互流式数字人技术,实现音视频同步对话。
metahuman-stream是一个开源的实时交互数字人模型项目,它通过先进的技术实现数字人与用户的音视频同步对话,具有商业应用潜力。该项目支持多种数字人模型,包括ernerf、musetalk、wav2lip等,并且具有声音克隆、数字人说话被打断、全身视频拼接等功能。
数字化的个人或品牌
Personal.ai是一个数字化的个人或品牌的AI模型,使用自己的数据、事实和观点创建出与人互动的体验,可在第三方消息应用和其他场景中使用。与使用大量可用互联网数据构建的大型语言模型不同,Personal.ai可以使用一个人或品牌的数据创建独特的个人语言模型。定价详情请访问官方网站。
© 2025 AIbase 备案号:闽ICP备08105208号-14