浏览量:167
最新流量情况
月访问量
37.23k
平均访问时长
00:03:20
每次访问页数
2.56
跳出率
46.00%
流量来源
直接访问
36.72%
自然搜索
51.83%
邮件
0.08%
外链引荐
8.70%
社交媒体
2.11%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
德国
14.80%
法国
26.37%
韩国
13.30%
美国
32.47%
越南
3.70%
Nerfstudio是一个模块化的神经辐射场开发框架
Nerfstudio是一个开源的神经辐射场(NeRF)开发框架,它提供了简单易用的API,支持模块化的NeRF构建和训练。Nerfstudio帮助用户更轻松地理解和探索NeRF技术,并提供了教程、文档和更多学习资源。欢迎用户贡献新的NeRF模型和数据集。Nerfstudio的主要功能包括模型训练、数据处理、可视化等。
通过Model Context Protocol服务器扩展语言模型的能力。
Smithery是一个基于Model Context Protocol的平台,允许用户通过连接各种服务器来扩展语言模型的功能。它为用户提供了一个灵活的工具集,能够根据需求动态增强语言模型的能力,从而更好地完成各种任务。该平台的核心优势在于其模块化和可扩展性,用户可以根据自己的需求选择合适的服务器进行集成。
SyncAnimation 是一种基于 NeRF 的音频驱动实时生成说话头像和上半身动作的技术框架。
SyncAnimation 是一种创新的音频驱动技术,能够实时生成高度逼真的说话头像和上半身动作。它通过结合音频与姿态、表情的同步技术,解决了传统方法在实时性和细节表现上的不足。该技术主要面向需要高质量实时动画生成的应用场景,如虚拟主播、在线教育、远程会议等,具有重要的应用价值。目前尚未明确其价格和具体市场定位。
Spell 是一个 AI 模型,可从图像生成 3D 世界,支持多种渲染技术。
Spell 是 Spline 推出的 AI 模型,能够从单张图像生成完整的 3D 场景。它基于扩散模型技术,通过结合真实数据和合成数据进行训练,能够在几分钟内生成具有多视图一致性的 3D 世界。该技术的主要优点是能够快速生成高质量的 3D 场景,并支持多种渲染技术如高斯绘制和神经辐射场等。Spell 的出现为 3D 设计领域带来了革命性的变化,使创作者能够更高效地生成和探索 3D 场景。目前,Spell 仍处于开发阶段,团队计划频繁更新模型以提升质量和一致性。
SUSE AI是为GenAI工作负载设计的安全可靠的企业级部署和运行平台。
SUSE AI是一个为企业级部署和运行任何生成性人工智能(GenAI)工作负载而设计的安全可靠的平台。它提供了零信任安全和可观测性,作为一个集成解决方案,SUSE AI是一个灵活且模块化的平台,提供了可扩展性。SUSE AI让您控制自己的AI解决方案,赋予选择和主权。SUSE AI的价值基于三个基础支柱:选择、安全和信任。这个结构让企业可以选择最适合它们的AI模型和使用方式。SUSE AI提供了工具,帮助企业满足合规要求,简化了复杂的监管环境。SUSE AI不仅是满足当前需求,更是为未来的AI投资提供保障。它是一个开放的企业AI基础设施平台,让您可以选择轻松集成新兴技术和模型。
移动优先、前线聚焦、模块化ERP系统
fieldmobi.ai是一个移动优先、前线聚焦、模块化的ERP系统,旨在帮助企业实现数字化转型。它通过提供灵活的模块化解决方案,使企业能够根据需求定制ERP功能,从而提高工作效率和数据准确性。产品背景信息显示,fieldmobi.ai致力于通过其技术平台,赋能前线工作人员,优化业务流程,降低成本,并提高决策效率。关于价格和定位,fieldmobi.ai提供了一个适合中小企业的解决方案,具体价格信息需要进一步查询。
快速生成个性化和富有表现力的3D会说话面部模型
MimicTalk是一种基于神经辐射场(NeRF)的个性化三维说话面部生成技术,它能够在几分钟内模仿特定身份的静态外观和动态说话风格。这项技术的主要优点包括高效率、高质量的视频生成以及对目标人物说话风格的精确模仿。MimicTalk通过一个通用的3D面部生成模型作为基础,并通过静态-动态混合适应流程来学习个性化的静态外观和面部动态,同时提出了一种上下文风格化的音频到运动(ICS-A2M)模型,以生成与目标人物说话风格相匹配的面部运动。MimicTalk的技术背景是基于深度学习和计算机视觉领域的最新进展,特别是在人脸合成和动画生成方面。目前,该技术是免费提供给研究和开发社区的。
模块化仿人机器人,用于强化学习训练
Agibot X1是由Agibot开发的模块化仿人机器人,具有高自由度,基于Agibot开源框架AimRT作为中间件,并使用强化学习进行运动控制。该项目是Agibot X1使用的强化学习训练代码,可以与Agibot X1提供的推理软件结合用于真实机器人和模拟步行调试,或导入其他机器人模型进行训练。
模块化仿人机器人,具有高自由度
Agibot X1是由Agibot开发的模块化仿人机器人,具有高自由度,基于Agibot开源框架AimRT作为中间件,并使用强化学习进行运动控制。该项目包括模型推理、平台驱动和软件仿真等多个功能模块。AimRT框架是一个用于机器人应用开发的开源框架,它提供了一套完整的工具和库,以支持机器人的感知、决策和行动。Agibot X1项目的重要性在于它为机器人研究和教育提供了一个高度可定制和可扩展的平台。
城市级NeRF实景三维大模型,沉浸式体验。
书生·天际LandMark是一个基于NeRF技术的实景三维大模型,它实现了100平方公里的4K高清训练,具备实时渲染和自由编辑的能力。这项技术代表了城市级三维建模和渲染的新高度,具有极高的训练和渲染效率,为城市规划、建筑设计和虚拟现实等领域提供了强大的工具。
打造有温度的数字人,注入灵魂。
awesome-digital-human-live2d 是一个开源项目,旨在创建具有交互性的数字人物模型。它支持Docker快速部署,集成了Dify服务,支持ASR、LLM、TTS、Agent等模块化扩展,并且可以控制Live2d人物模型。该项目通过模块化设计,简化了数字人的创建过程,使得开发者能够更专注于个性化和创新。
自进化的模块化自代理通用人工智能(AGI)
AgentK是一个自进化的模块化自代理通用人工智能(AGI)模型,由多个合作的代理组成,能够根据用户的需求构建新的代理来完成任务。它基于LangGraph和LangChain框架构建,具有自我测试和修复的能力,旨在成为最小化的代理和工具集合,以便自我引导并发展自身的智能。
智能代理互联框架,支持任务自动化与协作。
IoAI (Internet of Agents)是一个智能代理互联框架,旨在通过高度模块化的设计,实现不同智能代理之间的自动化协作。它允许开发者快速集成第三方智能代理,并通过统一的接口进行任务分配和执行。IoA的核心优势在于其灵活性和可扩展性,支持多种应用场景,包括但不限于协作论文写作、基准测试和开放指令数据集。
3D重光照技术,无需逆向渲染
IllumiNeRF是一种3D重光照技术,它通过使用一系列在未知光照条件下拍摄的物体图像,恢复3D表示,以便在目标照明下从新视角渲染。该技术避免了基于逆向渲染的传统方法,这些方法通常涉及通过可微分的蒙特卡洛渲染进行优化,这不仅脆弱而且计算成本高昂。IllumiNeRF采用更简单的方法,首先使用图像扩散模型对每个输入图像进行重光照,然后使用这些重光照图像重建Neural Radiance Field (NeRF),从而在目标照明下渲染新视图。这种方法在多个重光照基准测试中取得了出人意料的竞争性能和最先进的结果。
开源框架,用于构建模块化的生产级应用程序。
Cognita 是一个开源框架,用于组织 RAG(Retrieval Augmented Generation)代码库,并提供一个前端界面,以便在不同的 RAG 定制中进行实验。它提供了一种简单的方法来组织代码库,使得在本地测试变得容易,同时也能够部署到生产环境中。Cognita 使用 Langchain/Llamaindex 作为底层技术,并提供了一个组织结构,使得每个 RAG 组件都是模块化的、API 驱动的,并且易于扩展。
多视角草图引导的文本到 3D 生成
Sketch2NeRF 是一种多视角草图引导的文本到 3D 生成框架。它通过预训练的 2D 扩散模型(如 Stable Diffusion 和 ControlNet)来优化由神经辐射场(NeRF)表示的 3D 场景。该方法还提出了一种新颖的同步生成和重建方法,以有效优化 NeRF。通过收集的两种多视角草图数据集进行实验评估,证明了我们的方法能够在高保真度的文本提示下合成具有精细草图控制的一致的 3D 内容。广泛的结果表明,我们的方法在草图相似性和文本对齐方面实现了最先进的性能。
SIGNeRF - 快速、可控的NeRF场景编辑和场景集成对象生成
SIGNeRF是一种用于快速和可控的NeRF场景编辑以及场景集成对象生成的新方法。它引入了一种新的生成更新策略,确保在编辑图像时保持3D一致性,而无需进行迭代优化。SIGNeRF利用了ControlNet的深度条件图像扩散模型的优势,通过几个简单的步骤在单个前向传递中编辑现有的NeRF场景。它可以生成新的对象到现有的NeRF场景中,也可以编辑已存在的对象,从而实现对场景的精确控制。
大规模实景数据集,用于深度学习三维视觉研究
DL3DV-10K是一个包含超过10000个高质量视频的大规模实景数据集,每个视频都经过人工标注场景关键点和复杂程度,并提供相机姿态、NeRF估计深度、点云和3D网格等。该数据集可用于通用NeRF研究、场景一致性跟踪、视觉语言模型等计算机视觉研究。
© 2025 AIbase 备案号:闽ICP备08105208号-14