需求人群:
"目标受众为机器人研究人员、开发者和爱好者,特别是那些对强化学习在机器人控制中应用感兴趣的人。Agibot X1提供了一个模块化的平台,允许用户通过强化学习方法训练机器人执行各种任务,同时也支持自定义和扩展,适合进行研究和开发工作。"
使用场景示例:
研究人员使用Agibot X1进行机器人行走稳定性的研究
开发者利用Agibot X1的代码库为其他类型的机器人创建训练环境
教育工作者将Agibot X1作为教学工具,向学生展示强化学习在机器人控制中的应用
产品特色:
使用强化学习进行机器人运动控制
支持真实机器人和模拟环境的步行调试
可以导入到其他机器人模型进行训练
提供详细的安装和使用说明
支持使用Logitech F710游戏手柄进行控制
允许用户添加新环境和机器人模型
使用Mujoco进行sim2sim验证
使用教程:
1. 安装Python 3.8虚拟环境
2. 安装PyTorch 1.13和CUDA 11.7
3. 安装Numpy-1.23
4. 下载并安装Isaac Gym Preview 4
5. 克隆Agibot X1的代码库,并安装依赖
6. 使用训练脚本进行模型训练
7. 使用游戏手柄控制机器人进行模拟或真实世界的测试
8. 如有需要,添加新环境或机器人模型到项目中
浏览量:11
最新流量情况
月访问量
5.16m
平均访问时长
00:06:42
每次访问页数
5.81
跳出率
37.20%
流量来源
直接访问
52.27%
自然搜索
32.92%
邮件
0.05%
外链引荐
12.52%
社交媒体
2.15%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
11.99%
德国
3.63%
印度
9.20%
俄罗斯
5.25%
美国
19.02%
模块化仿人机器人,用于强化学习训练
Agibot X1是由Agibot开发的模块化仿人机器人,具有高自由度,基于Agibot开源框架AimRT作为中间件,并使用强化学习进行运动控制。该项目是Agibot X1使用的强化学习训练代码,可以与Agibot X1提供的推理软件结合用于真实机器人和模拟步行调试,或导入其他机器人模型进行训练。
模块化仿人机器人,具有高自由度
Agibot X1是由Agibot开发的模块化仿人机器人,具有高自由度,基于Agibot开源框架AimRT作为中间件,并使用强化学习进行运动控制。该项目包括模型推理、平台驱动和软件仿真等多个功能模块。AimRT框架是一个用于机器人应用开发的开源框架,它提供了一套完整的工具和库,以支持机器人的感知、决策和行动。Agibot X1项目的重要性在于它为机器人研究和教育提供了一个高度可定制和可扩展的平台。
全栈开源机器人
智元灵犀X1是一款开源人形机器人,具有29个关节和2个夹爪,支持扩展头部3自由度。它提供了详细的开发指南和开源代码,使开发者能够快速搭建并进行二次开发。该产品代表了智能机器人领域的先进技术,具有高度的灵活性和可扩展性,适用于教育、研究和商业开发等多种场景。
打造有温度的数字人,注入灵魂。
awesome-digital-human-live2d 是一个开源项目,旨在创建具有交互性的数字人物模型。它支持Docker快速部署,集成了Dify服务,支持ASR、LLM、TTS、Agent等模块化扩展,并且可以控制Live2d人物模型。该项目通过模块化设计,简化了数字人的创建过程,使得开发者能够更专注于个性化和创新。
开源视觉-语言-动作模型,推动机器人操作技术发展。
OpenVLA是一个具有7亿参数的开源视觉-语言-动作(VLA)模型,通过在Open X-Embodiment数据集上的970k机器人剧集进行预训练。该模型在通用机器人操作策略上设定了新的行业标准,支持开箱即用控制多个机器人,并且可以通过参数高效的微调快速适应新的机器人设置。OpenVLA的检查点和PyTorch训练流程完全开源,模型可以从HuggingFace下载并进行微调。
开源框架,用于构建模块化的生产级应用程序。
Cognita 是一个开源框架,用于组织 RAG(Retrieval Augmented Generation)代码库,并提供一个前端界面,以便在不同的 RAG 定制中进行实验。它提供了一种简单的方法来组织代码库,使得在本地测试变得容易,同时也能够部署到生产环境中。Cognita 使用 Langchain/Llamaindex 作为底层技术,并提供了一个组织结构,使得每个 RAG 组件都是模块化的、API 驱动的,并且易于扩展。
开源的MuZero实现,分布式AI框架
MuKoe是一个完全开源的MuZero实现,使用Ray作为分布式编排器在GKE上运行。它提供了Atari游戏的示例,并通过Google Next 2024的演讲提供了代码库的概览。MuKoe支持在CPU和TPU上运行,具有特定的硬件要求,适合需要大规模分布式计算资源的AI研究和开发。
SERL是一个高效的机器人强化学习软件套件
SERL是一个经过精心实现的代码库,包含了一个高效的离策略深度强化学习方法,以及计算奖励和重置环境的方法,一个高质量的广泛采用的机器人控制器,以及一些具有挑战性的示例任务。它为社区提供了一个资源,描述了它的设计选择,并呈现了实验结果。令人惊讶的是,我们发现我们的实现可以实现非常高效的学习,仅需25到50分钟的训练即可获得PCB装配、电缆布线和物体重定位等策略,改进了文献中报告的类似任务的最新结果。这些策略实现了完美或接近完美的成功率,即使在扰动下也具有极强的鲁棒性,并呈现出新兴的恢复和修正行为。我们希望这些有前途的结果和我们的高质量开源实现能为机器人社区提供一个工具,以促进机器人强化学习的进一步发展。
统一的开放命名实体和语音识别模型
WhisperNER是一个结合了自动语音识别(ASR)和命名实体识别(NER)的统一模型,具备零样本能力。该模型旨在作为ASR带NER的下游任务的强大基础模型,并可以在特定数据集上进行微调以提高性能。WhisperNER的重要性在于其能够同时处理语音识别和实体识别任务,提高了处理效率和准确性,尤其在多语言和跨领域的场景中具有显著优势。
为数据中心打造的高效AI推理平台
d-Matrix是一家专注于AI推理技术的公司,其旗舰产品Corsair™是为数据中心设计的AI推理平台,能够提供极高的推理速度和极低的延迟。d-Matrix通过硬件软件协同设计,优化了Generative AI推理性能,推动了AI技术在数据中心的应用,使得大规模AI推理变得更加高效和可持续。
释放超级推理能力,提升AIME & MATH基准测试性能。
DeepSeek-R1-Lite-Preview是一款专注于提升推理能力的AI模型,它在AIME和MATH基准测试中展现了出色的性能。该模型具备实时透明的思考过程,并且计划推出开源模型和API。DeepSeek-R1-Lite-Preview的推理能力随着思考长度的增加而稳步提升,显示出更好的性能。产品背景信息显示,DeepSeek-R1-Lite-Preview是DeepSeek公司推出的最新产品,旨在通过人工智能技术提升用户的工作效率和问题解决能力。目前,产品提供免费试用,具体的定价和定位信息尚未公布。
下一代Python笔记本
marimo是一个开源的Python反应式笔记本,它具有可复现性、对git友好、可以作为脚本执行,并且可以作为应用程序分享。它通过自动运行受影响的单元格来响应单元格的更改,消除了管理笔记本状态的繁琐工作。marimo的UI元素如数据框架GUI和图表,使得数据处理变得快速、未来感和直观。marimo笔记本以.py文件存储,可以与git版本控制一起使用,可以作为Python脚本运行,也可以导入符号到其他笔记本或Python文件中,并使用你喜欢的工具进行lint或格式化。所有这些都在现代的 AI 支持的编辑器中进行。
Qwen2.5-Coder系列的1.5B参数指令调优模型
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专为代码生成、代码推理和代码修复而设计。基于强大的Qwen2.5,通过增加训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。此模型是1.5B参数的指令调优版本,采用GGUF格式,具有因果语言模型、预训练和后训练阶段、transformers架构等特点。
移动优先、前线聚焦、模块化ERP系统
fieldmobi.ai是一个移动优先、前线聚焦、模块化的ERP系统,旨在帮助企业实现数字化转型。它通过提供灵活的模块化解决方案,使企业能够根据需求定制ERP功能,从而提高工作效率和数据准确性。产品背景信息显示,fieldmobi.ai致力于通过其技术平台,赋能前线工作人员,优化业务流程,降低成本,并提高决策效率。关于价格和定位,fieldmobi.ai提供了一个适合中小企业的解决方案,具体价格信息需要进一步查询。
开源的GenAI应用网关,快速构建个性化的AI应用
Arch是一个开源的网关,专为处理提示(prompts)而设计,它利用快速的大型语言模型(LLMs)来处理提示,并与后端系统无缝集成。Arch基于Envoy构建,支持任何应用程序语言,并提供快速部署和透明升级。它提供了包括流量管理、前端/边缘网关、监控和端到端追踪在内的多种功能,帮助开发者构建快速、健壮和个性化的GenAI应用。
AI模型部署和推理优化的专家
Neural Magic是一家专注于AI模型优化和部署的公司,提供领先的企业级推理解决方案,以最大化性能和提高硬件效率。公司的产品支持在GPU和CPU基础设施上运行领先的开源大型语言模型(LLMs),帮助企业在云、私有数据中心或边缘环境中安全、高效地部署AI模型。Neural Magic的产品背景信息强调了其在机器学习模型优化方面的专业知识,以及与科研机构合作开发的创新LLM压缩技术,如GPTQ和SparseGPT。产品价格和定位方面,Neural Magic提供了免费试用和付费服务,旨在帮助企业降低成本、提高效率,并保持数据隐私和安全。
免费 npm 库,用 Llama 3.2 Vision 进行 OCR,输出 markdown 文本
开源 npm 库,免费使用 Llama 3.2 Vision 进行 OCR,支持本地和远程图像,计划支持 PDF,受 Zerox 启发,有免费和付费接口
人脸匿名化技术,保留关键细节同时有效保护隐私。
face_anon_simple是一个人脸匿名化技术,旨在通过先进的算法在保护个人隐私的同时保留原始照片中的面部表情、头部姿势、眼神方向和背景元素。这项技术对于需要发布包含人脸的图片但又希望保护个人隐私的场合非常有用,比如在新闻报道、社交媒体和安全监控等领域。产品基于开源代码,允许用户自行部署和使用,具有很高的灵活性和应用价值。
Qwen2.5-Coder系列中的3B参数模型,专注于代码生成与理解。
Qwen2.5-Coder-3B是Qwen2.5-Coder系列中的一个大型语言模型,专注于代码生成、推理和修复。基于强大的Qwen2.5,该模型通过增加训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,实现了在代码生成、推理和修复方面的显著改进。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。此外,Qwen2.5-Coder-3B还为现实世界的应用提供了更全面的基础,如代码代理,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。
Qwen2.5-Coder系列中的7B参数代码生成模型
Qwen2.5-Coder-7B是基于Qwen2.5的大型语言模型,专注于代码生成、代码推理和代码修复。它在5.5万亿的训练令牌上进行了扩展,包括源代码、文本代码接地、合成数据等,是目前开源代码语言模型的最新进展。该模型不仅在编程能力上与GPT-4o相匹配,还保持了在数学和一般能力上的优势,并支持长达128K令牌的长上下文。
Qwen2.5-Coder系列中的14B参数代码生成模型
Qwen2.5-Coder-14B-Instruct是Qwen2.5-Coder系列中的一个大型语言模型,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该模型通过扩展训练令牌到5.5万亿,包括源代码、文本代码接地、合成数据等,成为当前开源代码LLM的最新技术。它不仅增强了编码能力,还保持了在数学和通用能力方面的优势,并支持长达128K令牌的长上下文。
开源代码生成大型语言模型
Qwen2.5-Coder是一系列专为代码生成设计的Qwen大型语言模型,包含0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B是目前最先进的开源代码生成大型语言模型,其编码能力与GPT-4o相匹配。它不仅增强了编码能力,还保持了在数学和通用能力方面的优势,并支持长达128K令牌的长上下文。
专为软件改进设计的开源大型语言模型。
Lingma SWE-GPT是一个开源的大型语言模型,专注于软件工程领域的任务,旨在提供智能化的开发支持。该模型基于Qwen系列基础模型,经过额外训练以增强其在复杂软件工程任务中的能力。它在软件工程智能代理的权威排行榜上表现出色,适合需要自动化软件改进的开发团队和研究人员。
开源AI开发者助手,提升开发效率。
OpenHands是由All Hands AI开发的开源AI软件工程师,旨在帮助开发者处理积压的工作,让他们能够专注于解决难题、创造性挑战和过度工程化他们的配置文件。该产品在SWE-bench验证问题集中解决了超过一半的问题,是首个得分超过50%的AI工程师。此外,来自十几个学术机构的顶级代码生成研究人员每天都在帮助改进它。OpenHands在GitHub上以MIT许可证开源,拥有35k星标和190+贡献者。它与AI安全专家如Invariant Labs合作,以平衡创新与安全。
人类中心语言模型和模拟器的领导者
Nous Research专注于开发以人为中心的语言模型和模拟器,致力于将AI系统与现实世界用户体验对齐。我们的主要研究领域包括模型架构、数据合成、微调和推理。我们优先开发开源、人类兼容的模型,挑战传统的封闭模型方法。
自托管的网页数据抓取工具
Scraperr是一个自托管的网页数据抓取工具,允许用户通过指定XPath来抓取网页上的元素。用户可以提交URL和相应的元素进行抓取,结果会以表格形式展示,并支持下载为Excel文件。该工具的主要优点包括用户友好的界面、灵活的XPath选择器、批量处理能力以及对AI技术的支持。Scraperr适用于需要从网页上提取大量数据的用户,无论是研究人员、开发者还是市场营销人员。
开源、自托管、AI驱动的应用构建器。
Srcbook是一个开源、自托管的AI驱动应用构建器,它允许用户快速构建和部署各种应用程序。产品背景信息显示,Srcbook旨在提供一个平台,让开发者和非技术用户都能够轻松地构建应用程序,从而提高生产力和创新能力。它支持多种应用场景,如项目管理工具、音乐发现页面、技术文档网站等。Srcbook的主要优点包括开源性、灵活性和易用性,用户可以根据自己的需求定制和扩展功能。
简单易用,释放AI的强大力量
5ire是一个以简洁和用户友好为核心的AI产品,旨在让即使是初学者也能轻松利用大型语言模型。它支持多种文档格式的解析和向量化,具备本地知识库、使用分析、提示库、书签和快速关键词搜索等功能。作为一个开源项目,5ire提供免费下载,并且提供了按需付费的大型语言模型API服务。
© 2024 AIbase 备案号:闽ICP备08105208号-14