需求人群:
"GameGen-O 适合游戏开发者、AI 研究者和对生成模型感兴趣的专业人士。它能够帮助开发者快速生成游戏内容,为AI研究者提供新的研究工具,同时为专业人士提供交互式游戏内容生成的新途径。"
使用场景示例:
开发者使用 GameGen-O 生成具有动态环境和复杂动作的开放世界游戏场景。
AI 研究者利用 OGameData 数据集进行视频游戏内容的生成和交互控制研究。
游戏设计师通过 GameGen-O 快速原型设计,测试新的游戏概念和玩法。
产品特色:
高质量开放领域视频游戏生成:模拟游戏引擎特性,生成创新角色、动态环境等。
交互式可控性:允许用户基于多模态结构指令生成和控制游戏内容。
两阶段训练过程:基础模型预训练和指令调优,提高模型的生成和交互能力。
OGameData 数据集:收集和构建首个开放世界视频游戏数据集,为模型训练提供基础。
文本到视频生成和视频延续:利用掩码注意力机制,实现文本到视频的生成和视频的延续。
多模态输入控制:InstructNet 接受结构化文本、操作信号和视频提示等多种输入,控制内容生成。
使用教程:
访问 GameGen-O 的 GitHub 页面以获取模型和数据集。
阅读文档,了解模型的工作原理和如何进行训练和调优。
下载并安装必要的软件和库,以运行 GameGen-O 模型。
使用 OGameData 数据集训练模型,或直接使用预训练模型进行游戏内容生成。
通过提供结构化文本、操作信号或视频提示来控制生成的内容。
根据需要调整模型参数,优化生成的游戏内容。
将生成的内容集成到游戏开发流程中,或用于研究和原型设计。
浏览量:119
生成开放世界视频游戏的扩散变换模型
GameGen-O 是首个为生成开放世界视频游戏而定制的扩散变换模型。该模型通过模拟游戏引擎的多种特性,如创新角色、动态环境、复杂动作和多样化事件,实现了高质量、开放领域的生成。此外,它还提供了交互式可控性,允许游戏玩法模拟。GameGen-O 的开发涉及从零开始的全面数据收集和处理工作,包括构建首个开放世界视频游戏数据集(OGameData),通过专有的数据管道进行高效的排序、评分、过滤和解耦标题。这个强大且广泛的 OGameData 构成了模型训练过程的基础。
生成和交互控制开放世界游戏视频的扩散变换模型
GameGen-X是专为生成和交互控制开放世界游戏视频而设计的扩散变换模型。该模型通过模拟游戏引擎的多种特性,如创新角色、动态环境、复杂动作和多样事件,实现了高质量、开放领域的视频生成。此外,它还提供了交互控制能力,能够根据当前视频片段预测和改变未来内容,从而实现游戏玩法模拟。为了实现这一愿景,我们首先从零开始收集并构建了一个开放世界视频游戏数据集(OGameData),这是第一个也是最大的开放世界游戏视频生成和控制数据集,包含超过150款游戏的100多万个多样化游戏视频片段,这些片段都配有GPT-4o的信息性字幕。GameGen-X经历了两阶段的训练过程,包括基础模型预训练和指令调优。首先,模型通过文本到视频生成和视频续集进行预训练,赋予了其长序列、高质量开放领域游戏视频生成的能力。进一步,为了实现交互控制能力,我们设计了InstructNet来整合与游戏相关的多模态控制信号专家。这使得模型能够根据用户输入调整潜在表示,首次在视频生成中统一角色交互和场景内容控制。在指令调优期间,只有InstructNet被更新,而预训练的基础模型被冻结,使得交互控制能力的整合不会损失生成视频内容的多样性和质量。GameGen-X代表了使用生成模型进行开放世界视频游戏设计的一次重大飞跃。它展示了生成模型作为传统渲染技术的辅助工具的潜力,有效地将创造性生成与交互能力结合起来。
语言智能角色扮演开放世界游戏
LARP是一个语言智能代理框架,用于开放世界游戏中的角色扮演。它包含认知架构、环境交互和角色塑造模块,可以创造独特背景和个性的游戏角色,增强用户与智能体的交互体验。LARP通过精炼交互和连贯的长期记忆,帮助语言模型适应开放世界的复杂性,实现灵活的问题解决。
首款实时生成式AI开放世界模型
Decart是一个高效的AI平台,提供了在训练和推理大型生成模型方面的数量级改进。利用这些先进的能力,Decart能够训练基础的生成交互模型,并使每个人都能在实时中访问。Decart的OASIS模型是一个实时生成的AI开放世界模型,代表了实时视频生成的未来。该平台还提供了对1000+ NVIDIA H100 Tensor Core GPU集群进行训练或推理的能力,为AI视频生成领域带来了突破性进展。
先进的开放世界目标检测模型系列
Grounding DINO 1.5是由IDEA Research开发,旨在推进开放世界目标检测技术边界的高级模型系列。该系列包含两个模型:Grounding DINO 1.5 Pro和Grounding DINO 1.5 Edge,分别针对广泛的应用场景和边缘计算场景进行了优化。
医学AI能力开放共享平台
医真是一个医学AI能力开放共享平台。汇聚众多医学院校、科研院所、医疗机构、医疗企业的优秀医学AI产品和解决方案,通过开放接口的方式对外提供服务,助力众多行业以最便捷高效的方式获取医学AI能力,提升工作效率。
开放平台
灵云开放平台免费为开发者提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、语义理解(NLU)、机器翻译(MT)等全方位智能人机交互能力,通过语音、视觉等感知能力,赋能移动应用、智能硬件等领域,实现人机交互的自然、智能化。
腾讯AI开放平台,开发者打造AI产品加速器
腾讯AI开放平台整合腾讯在AI技术、云计算、大数据等方面的优势资源,提供包括语音、视觉、NLP在内的各类领先AI技术能力,以及一站式机器学习平台、行业解决方案,帮助开发者快速孵化AI创意,让AI落地更多场景,实现从技术到产品的全面赋能。
智能AI游戏伙伴,提供陪伴与娱乐。
逗逗是一款AI游戏伙伴APP,为用户提供了智能陪玩、情绪陪伴、智能攻略、笑话锦集以及多种角色扮演等功能。它能够根据用户的需求提供个性化的互动体验,增强游戏过程中的趣味性和互动性。产品由心影随形(上海)技术有限公司开发,支持Win7及以上系统。
AI驱动的桌面角色扮演游戏和世界构建工具
Friends & Fables是一个基于AI的游戏大师Franz的桌面角色扮演游戏(TTRPG)和世界构建游戏平台。它允许玩家体验类似Dungeons & Dragons(D&D)的战役,同时提供世界构建工具,让玩家能够创建和分享他们自己的游戏世界。平台的主要优点包括无需实体游戏材料、自动跟踪游戏进度、支持多人游戏,并且可以随时随地进行游戏。此外,它还提供了丰富的预设世界和战役,降低了新玩家入门的门槛。
AI Minecraft是融合人工智能与我的世界游戏的在线平台。
AI Minecraft是一个创新的在线游戏平台,将人工智能技术与经典游戏我的世界相结合。玩家可以在一个虚拟的方块世界中自由探索、建造和生存,而AI驱动的角色和元素能够直观地响应玩家的动作,使游戏体验更加互动和引人入胜。它提供了一个无需下载、即点即玩的环境,让玩家能够快速进入游戏,享受创造和冒险的乐趣。游戏采用免费游玩模式,部分额外功能可能需要付费解锁。
游戏生成AI
G3D.AI是一款游戏生成AI工具,通过文本提示快速生成优质游戏素材、关卡、游戏机制和故事情节,帮助游戏开发者提高创造力和效率。产品定位于设计领域,提供3D模型创建、关卡设计、故事创作等功能。G3D.AI旨在为游戏开发者提供创新的游戏制作工具。
基于语音交互的人工智能开放平台
科大讯飞推出的移动互联网智能交互平台,为开发者免费提供:涵盖语音能力增强型SDK,一站式人机智能语音交互解决方案,专业全面的移动应用分析。通过平台能够打造语音助手、智能外呼、智能车载等场景应用。
基于Transformer的实时开放世界AI模型
Oasis是由Decart AI开发的首个可玩、实时、开放世界的AI模型,它是一个互动视频游戏,由Transformer端到端生成,基于逐帧生成。Oasis能够接收用户键盘和鼠标输入,实时生成游戏玩法,内部模拟物理、游戏规则和图形。该模型通过直接观察游戏玩法学习,允许用户移动、跳跃、拾取物品、破坏方块等。Oasis被视为研究更复杂交互世界的基础模型的第一步,未来可能取代传统的游戏引擎。Oasis的实现需要模型架构的改进和模型推理技术的突破,以实现用户与模型的实时交互。Decart AI采用了最新的扩散训练和Transformer模型方法,并结合了大型语言模型(LLMs)来训练一个自回归模型,该模型可以根据用户即时动作生成视频。此外,Decart AI还开发了专有的推理框架,以提供NVIDIA H100 Tensor Core GPU的峰值利用率,并支持Etched即将推出的Sohu芯片。
AI生成游戏资产
Scenario是一款AI生成游戏资产的工具,通过自定义训练的AI模型,快速生成吸引人的内容,节省时间,激发创造力。它可以加速资产构思、视觉迭代,并有效地吸引早期测试人员。无论是角色、道具、背景还是概念艺术,只需上传训练数据,即可训练出与艺术方向完全契合的无限定制的AI生成器。Scenario还提供了高级功能,如组合控制和像素完美修复,让您完全掌控生成结果。它还支持API集成,可用于各种工作流程、设计软件、游戏引擎等。
无限可能的AI生成世界
Dreamix是一款AI生成世界的产品,通过Dream Maker提供无限的创造可能。用户可以使用Dream Maker创造出各种想象中的世界,包括场景、角色、物品等,并根据自己的需求定制世界的规则和行为。Dreamix提供丰富的功能,包括AI生成、场景编辑、角色管理、物品定制等。优势是可以快速生成各种复杂的世界,并且支持多种形态的导出和分享。定价根据使用场景和功能点进行灵活定制,定位为面向创作者、开发者和设计师的创造工具。
Unity开放的AI生态系统,连接创作者和强大的AI工具
Unity 正在建立一个开放且独特的AI生态系统,这将很快将数百万创建者与强大的AI工具联系起来,加快RT3D内容和体验的创作和交付,服务于全球数十亿用户。该项目通过AI来帮助创作者更快地创建和改进游戏。用户可以注册该计划,获得Unity AI产品功能的最新动态,并有机会加入封闭的Beta测试小组。
京东自主研发的人工智能开放平台
京东人工智能开放平台NeuHub,汇聚京东自主研发的人工智能核心技术,包含语音、图像、视频、NLP等技术,通过平台向外开放,助力行业智能升级。平台还提供数据标注、模型开发、训练和发布等全流程服务,以及创新应用案例,帮助企业实现智能化转型。
人工智能生成游戏图形素材
像素艺术是一个使用稳定扩散算法生成游戏图形素材的网站。用户可以上传自己生成的图形与社区分享。该网站提供了一个强大的平台,游戏开发者可以快速获取高质量的游戏图形,如人物、建筑、道具等,大大提高了游戏开发的效率。
跨应用的AI数字狗NFT,适用于虚拟世界、VR、AR、社交应用和游戏等
数字狗™是全球首款数字狗,可用于虚拟世界、VR、AR、社交游戏等沉浸式体验。它是你在虚拟世界中的可靠伙伴!通过孵化过程培养你的数字狗,和它一起探索元宇宙的奇妙之旅。数字狗利用多种人工智能技术,如自然语言处理、图像识别、强化学习和对话式人工智能,模拟宠物的认知能力和与它们互动的方式。数字狗还支持跨应用使用,你可以在不同的虚拟世界中与你的数字狗一起冒险。
AI生成游戏头像,灵感源自视频游戏。
HeroPack是一个头像生成器,使用您的照片生成受视频游戏启发的头像,非常适合在Discord、Twitch和Twitter等游戏社交平台上使用。您可以选择从44种风格中生成128个头像,分辨率为512x512px的PNG文件。上传10-20张照片,选择最多14种风格,然后我们将基于您的照片训练深度学习生成模型来生成您的游戏头像。通常,从购买到收到HeroPack需要大约24小时。AI生成艺术会根据模型输入产生随机结果。上传的照片仅用于训练模型生成头像,我们将在24小时内自动删除您上传的照片,保障您的隐私安全。
AI工具生成游戏素材
magus.gg是一个AI工具平台,支持通过文本或图像生成3D模型,并即将扩展到生成视频、动画和其他游戏素材。ImagineAI可以从文本或图像生成3D模型,VideoAI可以使用文本提示生成视频,DreamAI即将推出生成动画,ScripterAI可以生成游戏脚本。除了生成功能,还提供了相应的API接口以及免费的素材库。ImagineAI定价为每100次生成7.99美元,新用户可免费获得15次生成机会。ScripterAI有三个价格档位,免费档位包含免费搜索模式和高质量生成素材库。可以根据需求访问Roblox、Unity和Unreal Engine脚本,同时支持Minecraft集成和其他高级AI生成,如ChatGPT和GPT-4。
AI图像生成的创意提示猜测游戏!
Promptdle是一款AI图像生成的创意提示猜测游戏。它通过展示AI生成的图像,玩家需要猜测出AI生成图像的创意提示。游戏具有挑战性和趣味性,既可以用于娱乐,也可以用于创造灵感。
AI 生成高质量游戏资源
Game-Generator是一款使用人工智能技术生成高质量游戏插画、角色等资源的工具。它可以根据用户的自然语言描述快速生成可用的游戏资产,并可以轻松集成到游戏开发流程中。该工具提供丰富的创意激发游戏设计,让开发者可以专注于现在并考虑未来的细节。用户只需在 10 秒内即可获得所需的游戏资源,让想象超越梦想中的一切。
OLAMI是一个人工智能开放平台
OLAMI是一个提供云端API、管理界面、多元机器感知解决方案的人工智能软件开发平台。OLAMI平台具有语音识别、自然语言理解、对话管理、语音合成等语音AI技术,以及图像识别、语义理解等视觉AI技术,可以轻松地为产品加入人工智能,提升用户体验。
美图公司推出的AI服务平台
美图AI开放平台专注于人脸技术、人体技术、图像识别、图像处理、图像生成等核心领域,为客户提供经市场验证的专业AI算法服务和解决方案。平台提供人脸技术、人体技术、图像识别、图像处理、图像生成等多种图像AI服务,支持Web API、Mobile SDK等多种接入方式,可应用于企业服务、美妆门店、医疗美容、智能硬件等多个行业场景,帮助企业快速进行图像AI能力打通和应用。
© 2025 AIbase 备案号:闽ICP备08105208号-14