基于Transformer的实时开放世界AI模型
Oasis是由Decart AI开发的首个可玩、实时、开放世界的AI模型,它是一个互动视频游戏,由Transformer端到端生成,基于逐帧生成。Oasis能够接收用户键盘和鼠标输入,实时生成游戏玩法,内部模拟物理、游戏规则和图形。该模型通过直接观察游戏玩法学习,允许用户移动、跳跃、拾取物品、破坏方块等。Oasis被视为研究更复杂交互世界的基础模型的第一步,未来可能取代传统的游戏引擎。Oasis的实现需要模型架构的改进和模型推理技术的突破,以实现用户与模型的实时交互。Decart AI采用了最新的扩散训练和Transformer模型方法,并结合了大型语言模型(LLMs)来训练一个自回归模型,该模型可以根据用户即时动作生成视频。此外,Decart AI还开发了专有的推理框架,以提供NVIDIA H100 Tensor Core GPU的峰值利用率,并支持Etched即将推出的Sohu芯片。
提高转化率的AI助手
Conversion Agent AI是一个利用人工智能技术提供在线客服助手的平台,旨在提高网站的转化率和改善客户体验。产品背景信息显示,大型公司通过实时客服提升了转化率,而Conversion Agent AI使得中小企业也能以较低成本享受到类似服务。其主要优点包括低成本、即时知识获取、无等待时间等,相较于传统人工客服,AI助手在成本和效率上有明显优势。
多模型对话,文生图
Silo是一个专注于多模型对话的平台,它通过整合不同的对话模型,为用户提供丰富、深入的交流体验。该平台不仅能够处理文本对话,还能生成图像,为用户提供视觉化的交流方式。Silo的背景信息显示,它是一个创新的尝试,旨在通过技术手段打破传统对话的局限,让交流更加生动和有趣。目前,Silo提供免费试用,具体价格和定位尚未明确。
深度推理AI搜索功能,像人类一样思考和解决问题。
Kimi探索版是Kimi新增的深度推理AI搜索功能,通过理解、拆解问题,再进行搜索和推理给出答案,一次搜索即可精读500个页面。新功能让Kimi能像人类一样思考,提供更准确、实用的搜索结果。还能使用数学模型和编程处理复杂问题,并在必要时进行自我反思以优化答案。简而言之,Kimi探索版让AI搜索更智能,更接近人脑的工作方式。
通过个性化体验,最大化每个用户的收益。
Coho AI 是一款专注于用户旅程优化和客户留存管理的人工智能平台。它通过分析用户数据,自动发现最有价值的客户,个性化他们的体验,并自动增加每个用户的收入。该平台能够无缝集成到企业的数据中,自动对用户进行细分,识别最佳行动方案,并实时与用户互动,同时跟踪成功并持续优化增长策略。Coho AI 以其无需编码设置、实时行动、简单易用、智能自动化和快速见效等特点,帮助企业提升客户参与度和生命周期价值。
神经模型驱动的实时游戏引擎
GameNGen是一个完全由神经模型驱动的游戏引擎,能够实现与复杂环境的实时互动,并在长时间轨迹上保持高质量。它能够以每秒超过20帧的速度交互式模拟经典游戏《DOOM》,并且其下一帧预测的PSNR达到29.4,与有损JPEG压缩相当。人类评估者在区分游戏片段和模拟片段方面仅略优于随机机会。GameNGen通过两个阶段的训练:(1)一个RL-agent学习玩游戏并记录训练会话的动作和观察结果,成为生成模型的训练数据;(2)一个扩散模型被训练来预测下一帧,条件是过去的动作和观察序列。条件增强允许在长时间轨迹上稳定自回归生成。
在线创建AI虚拟形象视频,实时互动。
HeyGen Interactive Avatar是一个在线AI视频生成器,专注于创建和优化虚拟形象视频,支持实时互动。它允许用户创建一个为连续流媒体优化的虚拟形象,同时提醒用户保持头部和手部的最小动作。HeyGen的背景信息包括与Baron David和Ryan Hoover等知名人士的合作,产品目前处于Beta测试阶段,提供免费试用。
AI驱动的演示平台,提供人性化交互体验。
DemoDazzle是一个利用OpenAI高级语言模型的AI驱动演示平台,旨在自动化各种产品和服务的演示和引导过程。该平台通过创建定制化的虚拟形象,提供实时的AI会话和问题解答,以提升用户体验和满意度。产品的主要优点包括智能化、个性化和高效率。DemoDazzle即将上线,目前处于测试模式。
将手机变成一次性相机,实现与朋友实时共享照片。
Clik 是一款专为活动照片分享设计的应用程序,它将手机转变为数字一次性相机,允许用户在无需下载完整应用的情况下,与朋友实时共享照片。该应用通过AI技术,帮助用户快速找到自己参与的照片,并通过应用内链接和定制QR码简化了现实生活中的分享过程。Clik 适合各种社交场合,如聚会、婚礼等,帮助用户捕捉和保存美好记忆。
实时生成逼真语音驱动人脸
VASA-1是由微软研究院开发的一个模型,专注于实时生成与音频相匹配的逼真人脸动画。该技术通过深度学习算法,能够根据输入的语音内容,自动生成相应的口型和面部表情,为用户提供一种全新的交互体验。VASA-1的主要优势在于其高度逼真的生成效果和实时响应能力,使得虚拟角色能够更加自然地与用户进行互动。目前,VASA-1主要应用于虚拟助手、在线教育、娱乐等领域,其定价策略尚未公布,但预计将提供免费试用版本供用户体验。
从单一视频创建实时互动游戏环境
Video2Game是一项技术,可以将单一视频转换成具有实时、互动、真实感和浏览器兼容性的高质量虚拟环境。它通过构建大规模的NeRF模型来实现高质量的表面几何形状,然后将该模型转换为带有对应刚体动力学的网格表示,以支持交互。使用UV映射的神经纹理,既能表达丰富,又与游戏引擎兼容。最终得到的是一个虚拟环境,虚拟角色可以与之互动,响应用户控制,并能从新的相机视角实时提供高分辨率渲染。
© 2024 AIbase 备案号:闽ICP备08105208号-14