需求人群:
["人机交互","机器人控制","自然语言理解"]
使用场景示例:
用户:“来,我们Selfie吧”,Alter3就会摆出Selfie的造型拍照
用户:“假装是一条蛇”,Alter3就会用身体在地上爬行
用户:“再把手举高一点”,Alter3就会在自拍时把手举更高
产品特色:
通过自然语言指令生成各种人类动作
43个关节自由度,可以自由运动
结合面部表情识别和生成
语言指令自动生成运动代码
语言反馈优化运动
浏览量:36
基于GPT-4的拟人机器人
Alter3是一个基于GPT-4的拟人机器人,能够通过自然语言指令生成各种人类动作,实现零次学习。它具有43个关节自由度,可以自由运动,同时结合面部表情识别和生成,实现复杂的交互。用户只需要提供语言指令,Alter3就可以自主调整代码,生成相应运动,无需人工迭代调整。还可以通过语言反馈来优化动作,形成运动记忆。这种结合语言理解和身体运动的系统,大大提升了人机交互的潜力。
家用智能人形机器人,学习照顾您的生活。
NEO是1X Technologies公司开发的一款家用智能人形机器人,它通过模拟学习,能够理解自然语言和物理空间,执行实际任务。NEO基于EVE机器人的现实世界经验,通过1X Studio的远程操作训练,能够智能地完成任务。NEO的主要优点包括安全性、智能性和可扩展性,旨在为家庭提供帮助,同时保持安全和高效。
开放式机器人整合框架,实现家居物品搬运。
OK-Robot是一个开放的模块化框架,实现了在任意家居环境下根据语言指令进行零样本物品搬运任务。该框架采用了模块化设计,使用3D VoxelMap进行开放词汇的导航,AnyGrasp和LangSam进行开放词汇的抓取,以及放置原语进行物品放置。框架不需要预先训练,可以实现语言指令的零样本泛化。
【精选推荐】ChatGPT侧边栏(国内直连),是一款基于的OpenAI公司ChatGPT3.5模型开发的聊天机器人,具有丰富的问题模版,方便快捷,提问精准。
ChatGPT永久免费中文版 GPT-4(国内免费直连)是一款基于OpenAI公司ChatGPT3.5模型开发的聊天机器人插件。它具有丰富的问题模版,方便快捷,提问精准。用户无需一次性大额购买,注册即可免费体验,还可以根据个人需求购买日卡、周卡、月卡。
ChatBotKit makes it easy for developers and non-developers alike to build chatbots that can communicate with users in natural language.
ChatBotKit是一个帮助开发者和非开发者构建聊天机器人的平台。它可以与用户进行自然语言交流,并提供丰富的功能和优势。ChatBotKit的定价简单明了,没有隐藏费用。它适用于各种使用场景,包括网站、Slack、Discord等。ChatBotKit还提供了数据安全、隐私保护、内容审核等功能,确保用户数据的安全性和隐私性。通过ChatBotKit,您可以快速部署聊天机器人,提升客户参与度,简化日常任务。
知识共享的对话式AI平台
Dokko是一个革命性的知识管理平台,它通过先进的AI和自然语言理解技术,提供直观的聊天机器人界面,无缝连接团队和客户,促进轻松沟通和知识交流。Dokko通过集中化、直观的系统整合分散的数据源,使用自然、会话式的文本,解决了组织中信息孤岛的问题。产品的主要优点包括易于集成、自动化数据组织和集成、实时性能监控和优化等。Dokko支持多种大型语言模型(LLMs),允许用户根据特定需求选择最佳的AI引擎,并定制响应以反映组织的独特特性。
Qwen Turbo 1M Demo是一个由Qwen提供的Hugging Face空间。
Qwen Turbo 1M Demo是一个基于Hugging Face平台的人工智能模型演示。这个模型代表了自然语言处理技术的最新进展,特别是在中文文本理解和生成方面。它的重要性在于能够提供高效、准确的语言模型,以支持各种语言相关的应用,如机器翻译、文本摘要、问答系统等。Qwen Turbo 1M Demo以其较小的模型尺寸和快速的处理速度而受到青睐,适合需要快速部署和高效运行的场合。目前,该模型是免费试用的,具体价格和定位可能需要进一步的商业洽谈。
124B参数的多模态大型语言模型
Pixtral-Large-Instruct-2411是由Mistral AI研发的124B参数的大型多模态模型,基于Mistral Large 2构建,展现出前沿级别的图像理解能力。该模型不仅能够理解文档、图表和自然图像,同时保持了Mistral Large 2在文本理解方面的领先地位。它在MathVista、DocVQA、VQAv2等数据集上达到了最先进的性能,是科研和商业应用的强大工具。
下一代语音AI,打造自然沟通的AI语音代理。
Ultravox.ai是一个先进的语音语言模型(SLM),直接处理语音,无需转换为文本,实现更自然、流畅的对话。它支持多语言,易于适应新语言或口音,确保与不同受众的顺畅沟通。产品背景信息显示,Ultravox.ai是一个开源模型,用户可以根据自己的需求进行定制和部署,价格为每分钟5美分。
3D网格生成与语言模型的统一
LLaMA-Mesh是一项将大型语言模型(LLMs)预训练在文本上扩展到生成3D网格的能力的技术。这项技术利用了LLMs中已经嵌入的空间知识,并实现了对话式3D生成和网格理解。LLaMA-Mesh的主要优势在于它能够将3D网格的顶点坐标和面定义表示为纯文本,允许与LLMs直接集成而无需扩展词汇表。该技术的主要优点包括能够从文本提示生成3D网格、按需产生交错的文本和3D网格输出,以及理解和解释3D网格。LLaMA-Mesh在保持强大的文本生成性能的同时,实现了与从头开始训练的模型相当的网格生成质量。
PlayDialog,打造流畅、富有情感的对话体验。
PlayDialog是Play.ai推出的一款端到端AI语音模型,它利用对话的历史背景来控制韵律、语调、情感和节奏,以提供更自然的声音,为匹配人类在现实生活情境中的说话方式树立了新标准。PlayDialog适合创建真实的对话体验,如旁白、声音配音、合成播客以及在商业环境中支持沉浸式和吸引人的一对一语音体验。PlayDialog beta在盲测中以2:1的比例超越了市场上的领先竞争模型,表达性作为偏好因素得分最高。
Qwen2.5-Coder系列中的0.5B参数代码生成模型
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,显著提升了编码能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,编码能力与GPT-4o相当。此外,Qwen2.5-Coder还为实际应用如代码代理提供了更全面的基础,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。
语鲸,智能语言处理平台
语鲸是一个专注于语言处理的平台,它利用先进的自然语言处理技术,为用户提供文本分析、翻译、校对等服务。产品背景信息显示,语鲸旨在帮助用户提高写作效率和质量,特别是在多语言环境中。语鲸的价格定位尚未明确,但考虑到其提供的服务,可能会有免费试用和付费版本。
一个实验性的文本到语音模型
OuteTTS是一个使用纯语言建模方法生成语音的实验性文本到语音模型。它的重要性在于能够通过先进的语言模型技术,将文本转换为自然听起来的语音,这对于语音合成、语音助手和自动配音等领域具有重要意义。该模型由OuteAI开发,提供了Hugging Face模型和GGUF模型的支持,并且可以通过接口进行语音克隆等高级功能。
交互式对话AI模型,提供问答和文本生成服务
ChatGPT是由OpenAI训练的对话生成模型,能够以对话形式与人互动,回答后续问题,承认错误,挑战错误的前提,并拒绝不适当的请求。OpenAI日前买下了http://chat.com域名,该域名已经指向了ChatGPT。ChatGPT它是InstructGPT的姊妹模型,后者被训练以遵循提示中的指令并提供详细的回答。ChatGPT代表了自然语言处理技术的最新进展,其重要性在于能够提供更加自然和人性化的交互体验。产品背景信息包括其在2022年11月30日的发布,以及在研究预览期间免费提供给用户使用。
手写笔记数字化模型,无需专业设备
InkSight是一个由Google Research开发的模型,旨在将手写笔记的照片转换成数字格式,精确还原书写笔迹,无需任何专业设备。这项技术的重要性在于它能够将传统的手写笔记转换为可编辑、可索引的数字形式,同时保留了手写的风格和感觉。InkSight通过学习“阅读”和“写作”来构建对书写的理解,使其能够在多种场景下,包括光线条件不佳、遮挡等情况下,都能良好地工作。这种技术的主要优点是它的通用性和对用户友好性,因为它不需要额外的硬件支持,降低了用户的入门门槛和成本。
利用LLM读取源代码并提供问题解答
askrepo是一个基于LLM(大型语言模型)的源代码阅读工具,它能够读取Git管理的文本文件内容,发送至Google Gemini API,并根据指定的提示提供问题的答案。该产品代表了自然语言处理和机器学习技术在代码分析领域的应用,其主要优点包括能够理解和解释代码的功能,帮助开发者快速理解新项目或复杂代码库。产品背景信息显示,askrepo适用于需要深入理解代码的场景,尤其是在代码审查和维护阶段。该产品是开源的,可以免费使用。
Meta 开发的子十亿参数语言模型,适用于设备端应用。
Meta 开发的自回归语言模型,采用优化架构,适合资源受限设备。优点多,如集成多种技术,支持零样本推理等,价格免费,面向自然语言处理研究人员和开发者。
O1复制之旅:战略进展报告第一部分
O1-Journey是由上海交通大学GAIR研究组发起的一个项目,旨在复制和重新想象OpenAI的O1模型的能力。该项目提出了“旅程学习”的新训练范式,并构建了首个成功整合搜索和学习在数学推理中的模型。这个模型通过试错、纠正、回溯和反思等过程,成为处理复杂推理任务的有效方法。
AI助手,提升编程效率与协作
OpenHands结合Daytona平台,提供了一个AI编程助手,能够同时处理多个任务,提高团队的生产力。它具备集成的工作空间,支持自然语言协作,并能适应企业需求。Daytona平台则提供了按需工作空间,支持AI代理的基础设施中间件,使得OpenHands能够在任何基础设施上无缝运行。
将通用人工智能带入物理世界
Physical Intelligence (π) 是一个由工程师、科学家、机器人学家和公司建设者组成的团队,致力于开发基础模型和学习算法,以驱动当今的机器人和未来的物理驱动设备。该团队旨在将通用人工智能技术应用于物理世界,推动机器人技术的发展和创新。
业界领先的开源大型混合专家模型
Tencent-Hunyuan-Large(混元大模型)是由腾讯推出的业界领先的开源大型混合专家(MoE)模型,拥有3890亿总参数和520亿激活参数。该模型在自然语言处理、计算机视觉和科学任务等领域取得了显著进展,特别是在处理长上下文输入和提升长上下文任务处理能力方面表现出色。混元大模型的开源,旨在激发更多研究者的创新灵感,共同推动AI技术的进步和应用。
机器人硬件平台,集成传感器和末端执行器。
Digit Plexus是一个机器人硬件平台,旨在为各种机器人手集成触觉传感器提供标准化的硬件-软件解决方案。该平台能够将基于视觉和基于皮肤的触觉传感器(如Digit、Digit 360和ReSkin)整合到控制板中,并通过单根电缆将所有数据编码传输到主机电脑。这种集成方式允许无缝的数据收集、控制和分析。产品背景信息显示,Digit Plexus与Wonik Robotics合作开发了基于该平台的下一代Allegro Hand,并且可以通过特定链接表达早期访问的兴趣。
多智能体任务规划与推理的基准测试
PARTNR是由Meta FAIR发布的一个大规模基准测试,包含100,000个自然语言任务,旨在研究多智能体推理和规划。PARTNR利用大型语言模型(LLMs)生成任务,并通过模拟循环来减少错误。它还支持与真实人类伙伴的AI代理评估,通过人类在环基础设施进行。PARTNR揭示了现有基于LLM的规划器在任务协调、跟踪和从错误中恢复方面的显著局限性,人类能解决93%的任务,而LLMs仅能解决30%。
高效优化的子十亿参数语言模型,专为设备端应用设计
MobileLLM-350M是由Meta开发的自回归语言模型,采用优化的Transformer架构,专为设备端应用设计,以满足资源受限的环境。该模型整合了SwiGLU激活函数、深层薄架构、嵌入共享和分组查询注意力等关键技术,实现了在零样本常识推理任务上的显著准确率提升。MobileLLM-350M在保持较小模型尺寸的同时,提供了与更大模型相媲美的性能,是设备端自然语言处理应用的理想选择。
开发者可使用的Grok系列基础模型API
xAI API提供了对Grok系列基础模型的程序化访问,支持文本和图像输入,具有128,000个token的上下文长度,并支持函数调用和系统提示。该API与OpenAI和Anthropic的API完全兼容,简化了迁移过程。产品背景信息显示,xAI正在进行公共Beta测试,直至2024年底,期间每位用户每月可获得25美元的免费API积分。
AI驱动的数据可视化工具
Data Formulator 是微软研究团队开发的一款AI驱动的数据可视化工具,它通过结合用户界面交互和自然语言输入,帮助用户快速创建丰富的数据可视化图表。该工具可以自动处理数据转换,使用户能够专注于图表设计。Data Formulator 支持通过Python安装并本地运行,也可以在GitHub Codespaces中快速启动。它代表了数据分析和可视化领域的技术进步,通过AI技术提高了数据可视化的效率和易用性。
AI驱动的网页浏览框架,专注于简洁性和可扩展性。
Stagehand是一个AI驱动的网页浏览框架,旨在简化和扩展网页自动化的可能性。它提供了三个简单的API(act、extract、observe),这些API构成了自然语言驱动的网络自动化的基础。Stagehand的目标是提供一个轻量级、可配置的框架,没有过于复杂的抽象概念,并且支持不同的模型和模型提供者。它不会为您订购披萨,但它将帮助您可靠地自动化网络。
© 2024 AIbase 备案号:闽ICP备08105208号-14