需求人群:
"GameNGen的目标受众包括游戏开发者、人工智能研究人员和图形设计师。它为游戏开发者提供了一种新的工具,可以快速生成高质量的游戏环境和动画;对于人工智能研究人员,它提供了一个研究实时互动和环境模拟的平台;而对于图形设计师,它提供了一种创新的方式来创造和展示视觉内容。"
使用场景示例:
游戏开发者使用GameNGen快速生成游戏环境和动画
AI研究人员利用GameNGen进行实时互动和环境模拟的研究
图形设计师使用GameNGen创造独特的视觉展示内容
产品特色:
使用神经模型实时模拟复杂环境
在单个TPU上以超过20帧/秒的速度模拟《DOOM》游戏
下一帧预测达到29.4的PSNR,与有损JPEG压缩相当
人类评估者难以区分真实游戏片段与模拟片段
通过RL-agent学习玩游戏并记录训练数据
扩散模型训练,用于预测下一帧
条件增强技术,保持长时间轨迹的视觉稳定性
使用教程:
1. 访问GameNGen的官方网站以获取模型和相关文档
2. 理解模型的工作原理和训练过程
3. 根据需要设置和配置模型参数
4. 利用RL-agent进行游戏训练,收集数据
5. 使用扩散模型进行下一帧的预测
6. 应用条件增强技术以保持视觉稳定性
7. 根据反馈调整模型,优化性能
浏览量:105
最新流量情况
月访问量
11.76k
平均访问时长
00:00:27
每次访问页数
1.37
跳出率
47.30%
流量来源
直接访问
51.56%
自然搜索
23.19%
邮件
0.06%
外链引荐
13.85%
社交媒体
10.45%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
德国
1.60%
印度
16.81%
意大利
1.74%
乌克兰
1.50%
美国
75.42%
神经模型驱动的实时游戏引擎
GameNGen是一个完全由神经模型驱动的游戏引擎,能够实现与复杂环境的实时互动,并在长时间轨迹上保持高质量。它能够以每秒超过20帧的速度交互式模拟经典游戏《DOOM》,并且其下一帧预测的PSNR达到29.4,与有损JPEG压缩相当。人类评估者在区分游戏片段和模拟片段方面仅略优于随机机会。GameNGen通过两个阶段的训练:(1)一个RL-agent学习玩游戏并记录训练会话的动作和观察结果,成为生成模型的训练数据;(2)一个扩散模型被训练来预测下一帧,条件是过去的动作和观察序列。条件增强允许在长时间轨迹上稳定自回归生成。
从单一视频创建实时互动游戏环境
Video2Game是一项技术,可以将单一视频转换成具有实时、互动、真实感和浏览器兼容性的高质量虚拟环境。它通过构建大规模的NeRF模型来实现高质量的表面几何形状,然后将该模型转换为带有对应刚体动力学的网格表示,以支持交互。使用UV映射的神经纹理,既能表达丰富,又与游戏引擎兼容。最终得到的是一个虚拟环境,虚拟角色可以与之互动,响应用户控制,并能从新的相机视角实时提供高分辨率渲染。
社交互动游戏
Karma是一个社交互动游戏,通过提供有趣的游戏场景和挑战,让用户在游戏中互动并建立联系。Karma提供丰富的游戏功能和多样化的游戏模式,用户可以与其他玩家竞争、合作或互动。Karma定位于提供一个轻松愉快的游戏平台,让用户在游戏中享受乐趣和交流。
基于Transformer的实时开放世界AI模型
Oasis是由Decart AI开发的首个可玩、实时、开放世界的AI模型,它是一个互动视频游戏,由Transformer端到端生成,基于逐帧生成。Oasis能够接收用户键盘和鼠标输入,实时生成游戏玩法,内部模拟物理、游戏规则和图形。该模型通过直接观察游戏玩法学习,允许用户移动、跳跃、拾取物品、破坏方块等。Oasis被视为研究更复杂交互世界的基础模型的第一步,未来可能取代传统的游戏引擎。Oasis的实现需要模型架构的改进和模型推理技术的突破,以实现用户与模型的实时交互。Decart AI采用了最新的扩散训练和Transformer模型方法,并结合了大型语言模型(LLMs)来训练一个自回归模型,该模型可以根据用户即时动作生成视频。此外,Decart AI还开发了专有的推理框架,以提供NVIDIA H100 Tensor Core GPU的峰值利用率,并支持Etched即将推出的Sohu芯片。
智能AI游戏伙伴,提供陪伴与娱乐。
逗逗是一款AI游戏伙伴APP,为用户提供了智能陪玩、情绪陪伴、智能攻略、笑话锦集以及多种角色扮演等功能。它能够根据用户的需求提供个性化的互动体验,增强游戏过程中的趣味性和互动性。产品由心影随形(上海)技术有限公司开发,支持Win7及以上系统。
神经网络扩散模型实现
Neural Network Diffusion是由新加坡国立大学高性能计算与人工智能实验室开发的神经网络扩散模型。该模型利用扩散过程生成高质量的图像,适用于图像生成和修复等任务。
使用单眼视频记录产生实时4D头像合成的神经网络方法
BakedAvatar是一种用于实时神经头像合成的全新表示,可部署在标准多边形光栅化流水线中。该方法从学习到的头部等值面提取可变形的多层网格,并计算可烘焙到静态纹理中的表情、姿势和视角相关外观,从而为实时4D头像合成提供支持。我们提出了一个三阶段的神经头像合成流水线,包括学习连续变形、流形和辐射场,提取分层网格和纹理,以及通过微分光栅化来微调纹理细节。实验结果表明,我们的表示产生了与其他最先进方法相当的综合结果,并显著减少了所需的推理时间。我们进一步展示了从单眼视频中产生的各种头像合成结果,包括视图合成、面部重现、表情编辑和姿势编辑,所有这些都以交互式帧率进行。
在线创建AI虚拟形象视频,实时互动。
HeyGen Interactive Avatar是一个在线AI视频生成器,专注于创建和优化虚拟形象视频,支持实时互动。它允许用户创建一个为连续流媒体优化的虚拟形象,同时提醒用户保持头部和手部的最小动作。HeyGen的背景信息包括与Baron David和Ryan Hoover等知名人士的合作,产品目前处于Beta测试阶段,提供免费试用。
AI驱动的互动文字冒险游戏
MidReal是一款由AI技术驱动的互动文字冒险游戏。它具有超强的记忆力和写作能力,可以确保您的故事始终连贯一致,带给您身临其境的沉浸式体验。新特性包括多人互动、迷你游戏等,定价灵活,可免费试玩。
EducUper是一个互动式游戏化教育平台
EducUper是一个互动式游戏化的教育平台,优秀的教育工作者可以通过该平台创建和变现自己的知识。用户可以通过互动式的异步课程学习知识。该平台具有丰富的课程内容、积分和排名系统、社交和讨论功能等。
用神经网络预测你的涂鸦速度有多快
Doodle Dash 是一个趣味的在线游戏,它使用神经网络来预测玩家涂鸦的速度。玩家可以在游戏中尽可能快地画出指定的涂鸦,神经网络会根据你的画速给出预测结果。这个游戏基于🤗 Transformers.js 开发。
基于组件扩展,打通实时信息与服务
华藏是小i机器人长期积累自主研发倾力打造的具备多种通用能力的基础模型,融合最新人工智能算法,基于海量数据、跨语种多任务训练、强化专业领域知识,形成了可控、可定制、可交付的通用大模型。
AI驱动的在线成语学习平台,趣味互动学习中国传统文化
成语游戏大全是一个集成了多种成语游戏的在线学习平台,旨在通过趣味互动的方式让学习成语变得简单有趣。平台提供了成语闯关、成语接龙、成语消消乐等多种游戏,结合成语词典和成语故事,形成了完整的学习体系。通过游戏化学习,可以提升语言能力、文化素养、思维能力,并培养学习兴趣。产品背景信息显示,成语游戏大全适合各年龄层的用户,特别是在校学生、语言学习者和文化爱好者,有助于提升语文成绩、中文水平和对中华传统文化的理解和欣赏。
与Tyler1一起在《英雄联盟》中获得专业级实时指导
Backseat AI是由Tyler1联合创立的应用程序,它通过先进的AI技术为《英雄联盟》玩家提供实时的指导、洞察和评论。它旨在通过专业级的游戏分析帮助玩家提高游戏表现,同时保持电脑性能不受影响。Backseat AI是免费的,玩家可以选择升级到高级订阅以获得无广告体验和额外功能。
高速大型语言模型本地部署推理引擎
PowerInfer 是一个在个人电脑上利用消费级 GPU 进行高速大型语言模型推理的引擎。它利用 LLM 推理中的高局部性特点,通过预加载热激活的神经元到 GPU 上,从而显著降低了 GPU 内存需求和 CPU-GPU 数据传输。PowerInfer 还集成了自适应预测器和神经元感知的稀疏运算符,优化神经元激活和计算稀疏性的效率。它可以在单个 NVIDIA RTX 4090 GPU 上以平均每秒 13.20 个标记的生成速率进行推理,比顶级服务器级 A100 GPU 仅低 18%。同时保持模型准确性。
智能在线棋盘游戏
LLM棋盘是一个智能在线棋盘游戏,提供全自动的棋局管理和对弈功能。它基于强大的AI引擎,支持单人对战和多人对战,提供多种难度级别和棋局设置选项,使得棋盘游戏更加有趣和具有挑战性。LLM棋盘还具有友好的用户界面和实时游戏记录,可以方便地追踪棋局进展和学习棋局策略。
免费获取GPT-4、Copilot等AI生成的代码,为游戏引擎提供生成工具。
Haddock是一个为游戏引擎提供生成代码的免费库,使用GPT-4、Copilot等付费AI工具生成代码。支持Roblox、Unity、Minecraft和Unreal,即将扩展到Blender。通过Haddock,您可以加速开发过程。
实时表情生成人类模型
PROTEUS是Apparate Labs推出的一款下一代基础模型,用于实时表情生成人类。它采用先进的transformer架构的潜在扩散模型,创新的潜在空间设计实现了实时效率,并能通过进一步的架构和算法改进,达到每秒100帧以上视频流。PROTEUS旨在提供一种通过语音控制的视觉体现,为人工对话实体提供直观的接口,并且与多种大型语言模型兼容,可定制用于多种不同应用。
快速神经风格迁移的ComfyUI节点
ComfyUI-Fast-Style-Transfer是一个基于PyTorch框架开发的快速神经风格迁移插件,它允许用户通过简单的操作实现图像的风格转换。该插件基于fast-neural-style-pytorch项目,目前只移植了基础的推理功能。用户可以自定义风格,通过训练自己的模型来实现独特的风格迁移效果。
基于深度推理的神经机器翻译模型
DRT-o1-14B是一个神经机器翻译模型,旨在通过长链推理来提升翻译的深度和准确性。该模型通过挖掘含有比喻或隐喻的英文句子,并采用多代理框架(包括翻译者、顾问和评估者)来合成长思考的机器翻译样本。DRT-o1-14B基于Qwen2.5-14B-Instruct作为主干进行训练,具有14.8B的参数量,支持BF16张量类型。该模型的重要性在于其能够处理复杂的翻译任务,尤其是在需要深入理解和推理的情况下,提供了一种新的解决方案。
拜年之巅,家庭聊天冒险游戏
拜年之巅是一款家庭聊天冒险游戏,以亲戚们的群聊为背景,通过互动对话和选择来影响亲戚们的情绪。游戏中有九种亲戚角色,每个角色都有不同的性格和对话反应。你的聊天方式将影响游戏的进程和结局。此外,游戏还提供成就系统和隐藏家庭成员,玩家需要解锁白金奖杯等各种奖励。拜年之巅通过轻松幽默的方式,让玩家在传统受压抑的家庭场景中体验不同的互动和娱乐。
javascript神经网络库
Synaptic是一个开源的javascript神经网络库,提供了基本的神经元、网络、训练器和网络构建工具。它可以用于构建和训练各种类型的神经网络,如感知机、长短时记忆网络(LSTM)、液态状态机和Hopfield网络。Synaptic还提供了一些示例和演示,帮助用户学习和使用神经网络。
真实时间语音变声
AI Voice Changer是一款强大的实时语音变声软件,让你可以修改自己的声音,选择来自Voice Universe的声音,或者克隆任何你想要的声音。无限的可能性等待着你,无论你是在玩Minecraft、Fortnite、Among Us或其他你喜欢的视频游戏!通过最好的在线语音变声器,创造一个新的声音身份,并探索我们众多的声音效果。
基于深度推理的神经机器翻译模型
DRT-o1-7B是一个致力于将长思考推理成功应用于神经机器翻译(MT)的模型。该模型通过挖掘适合长思考翻译的英文句子,并提出了一个包含翻译者、顾问和评估者三个角色的多代理框架来合成MT样本。DRT-o1-7B和DRT-o1-14B使用Qwen2.5-7B-Instruct和Qwen2.5-14B-Instruct作为骨干网络进行训练。该模型的主要优点在于其能够处理复杂的语言结构和深层次的语义理解,这对于提高机器翻译的准确性和自然性至关重要。
实时视频到视频翻译的扩散模型
StreamV2V是一个扩散模型,它通过用户提示实现了实时的视频到视频(V2V)翻译。与传统的批处理方法不同,StreamV2V采用流式处理方式,能够处理无限帧的视频。它的核心是维护一个特征库,该库存储了过去帧的信息。对于新进来的帧,StreamV2V通过扩展自注意力和直接特征融合技术,将相似的过去特征直接融合到输出中。特征库通过合并存储的和新的特征不断更新,保持紧凑且信息丰富。StreamV2V以其适应性和效率脱颖而出,无需微调即可与图像扩散模型无缝集成。
字体识别游戏,挑战你的字体知识
Font Guesser是一个在线互动游戏,旨在通过趣味的方式测试和提升用户对不同字体的识别能力。用户需要根据展示的字体样本猜测其类型,包括Display、Serif、Sans-Serif、Monospace、Handwriting和Decorative等。这个游戏不仅增加了用户对字体的认识,还能提升设计感和审美能力。产品背景信息显示,该游戏由Nitin设计并制作,旨在以趣味的方式教育用户识别和了解不同的字体。目前该游戏是免费的,适合所有对字体设计感兴趣的用户。
© 2025 AIbase 备案号:闽ICP备08105208号-14