需求人群:
"ModelScope-Agent面向希望构建和定制代理系统的开发者,特别是那些需要利用大型语言模型和工具来实现复杂任务自动化的专业人士。它适合需要高度定制化解决方案的企业和开发者,以及那些寻求通过技术提高工作效率和创新能力的团队。"
使用场景示例:
使用ModelScope-Agent构建一个可以自动生成个性化肖像的Facechain Agent。
集成Story Agent,用于生成故事书插图的本地版本。
利用ModelScope GPT提供的本地版本通过gradio运行,实现本地部署和使用。
产品特色:
简单代理实现过程:只需指定角色指令、LLM名称和工具名称列表即可实现代理应用。
丰富的模型和工具:框架内置了丰富的LLM接口,如Dashscope和Modelscope模型接口,OpenAI模型接口等。
统一接口和高可扩展性:框架具有清晰的工具和LLM注册机制,方便用户扩展更多样的代理应用。
低耦合性:开发者可以轻松使用内置的工具、LLM、记忆等组件,无需绑定更高层次的代理。
支持移动代理:基于Android Adb环境的Mobile-Agent-V2,提供了更广泛的应用场景。
用户友好的助手API:提供了执行实用程序的工具API,这些工具在隔离、安全的容器中执行。
使用教程:
克隆仓库并安装依赖:`cd modelscope-agent && pip install -r requirements.txt`。
使用ModelScope Notebook,下载并上传demo文件到GPU,然后依次执行demo notebook。
初始化RolePlay对象,配置LLM和工具列表,然后运行代理以完成特定任务。
根据需要自定义代理的工作流程,包括消息/提示的生成、调用LLM(s)以及基于LLM结果调用工具。
通过继承基类Agent和LLM,实现自定义的代理和LLM配置。
利用内置工具或自定义工具,根据代理的需求执行特定的功能。
浏览量:12
最新流量情况
月访问量
0
平均访问时长
0
每次访问页数
0.00
跳出率
0
基于大型语言模型的多智能体应用开发框架
agentUniverse 是一个基于大型语言模型的多智能体应用开发框架,提供了构建单一智能体和多智能体协作机制的所有必需组件。通过模式工厂,允许开发者构建和自定义多智能体协作模式,轻松构建多智能体应用,并分享不同技术与业务领域的模式实践。
为Shopify商家提供一站式分析平台,跟踪销售、库存和客户行为,改善产品性能,推动业务增长。
Assisty是一种商业智能工具,专为Magento零售商打造。它提供即时洞察力和数据驱动的报告,帮助您做出更明智的决策,提升收入。
首个llama3中文版,多轮对话AI模型
llama3-Chinese-chat是首个llama3的中文对话版本,专为中文用户设计,支持高质量的多轮对话。它使用了170k+的中文对话数据进行训练,具备角色扮演、agent能力增强等特性,并提供了详细的训练和推理教程。此外,项目还计划开源浏览器插件,增加AI笔记和思维导图功能,进一步增强用户体验。
UFO是一个用于Windows操作系统交互的UI聚焦双Agent框架
UFO是一个用于Windows操作系统交互的UI聚焦双Agent框架。它通过自然语言理解用户请求,并在一个或跨多个应用程序内无缝导航和操作来执行这些请求。该框架包含AppAgent和ActAgent两个agent。AppAgent负责根据用户请求选择应用程序。ActAgent负责在选定的应用程序内迭代执行操作,直到任务成功完成。两者都利用GPT-Vision的多模态功能来理解应用程序的UI并满足用户的请求。
拖放方式创建agent工作群用于自定义业务逻辑
React Flow是一个开源的可视化编辑器,允许用户通过拖放的方式创建agent工作群,用于自定义业务逻辑。用户可以从图库中拖放agent到工作区,连接它们,定义初始任务,导出Python脚本在本地机器上运行。我们通过定制的操作系统为企业提供云端支持,让他们可以运行LLM。欢迎联系我们的企业支持团队了解更多信息。
基于视觉语言基础模型的胸部X光解读
CheXagent是一个基于视觉语言基础模型的胸部X光解读工具。它利用临床大型语言模型来解析放射学报告,视觉编码器用于表示X光图像,并设计了一个网络来桥接视觉和语言模态。此外,CheXagent还引入了CheXbench,一个旨在系统评估基于视觉语言基础模型在8个临床相关的胸部X光解读任务上的性能的新型基准。经过广泛的定量评估和与五名专家放射科医生的定性评审,CheXagent在CheXbench任务上的表现优于先前开发的通用和医学领域的基础模型。
左右翻转AI网站
RTL GPT是一款可以将AI网站从左到右翻转的插件。它支持以下网站:chatgpt、agentgpt和God mode。安装简单方便,只需下载并进入其中一个支持的网站,就能看到网站从左到右移动。
改进Salesforce公式编辑器,提供AI辅助编写公式
该插件改进了Salesforce公式编辑器,包括语法高亮、字段和元数据自动补全、代码片段和文档实时展示、制表支持,同时还提供了与https://adminagent.ai的可选AI集成,可以使用基于GPT的AI编写、编辑和调试Salesforce公式。
升级您的客户服务,用Conversagent的AI技术增加销售和与客户进行个性化内容互动。
Conversagent是一款基于人工智能的Shopify插件,可帮助您提升客户服务水平。它利用最新的GPT4技术,通过生成个性化友好的答案来回应客户的查询。Conversagent能够在产品页面上直接提供答案,无需搜索,提供流畅的购物体验。它还能够实时与客户互动,减少购物车放弃率,并根据每个独特客户的需求提供个性化内容。Conversagent提供24/7的自动化支持,确保您不会错过任何销售机会。
Magenta Studio是基于Magenta开源工具和模型构建的一组音乐插件。
Magenta Studio是基于Magenta开源工具和模型构建的一组音乐插件。它使用前沿的机器学习技术进行音乐生成。Magenta Studio提供了独立应用程序和Ableton Live插件两种形态。它们可用于读取和写入MIDI音频,支持Ableton的Session View和文件系统。Magenta Studio具有简单易用的界面,提供多种功能和优势。该产品的定位是为音乐创作者和音乐爱好者提供创造和探索音乐的工具。
玩乐机器学习,成为钢琴大师!
Piano Genie是一个基于机器学习的钢琴模拟器。使用键盘上的数字键或触摸屏上的彩色块来演奏钢琴。按下空格键控制延音踏板。你越像真正的钢琴家一样弹奏,旋律(和你自己)就会越好听。Piano Genie使用magenta.js构建。
ChatGPT 助力,轻松获取优惠券
Coupongpts利用ChatGPT技术,帮助用户轻松获取优惠券和折扣码。只需输入喜爱商店或品牌名称,AI助手即可迅速搜索并整理出最相关的折扣信息,让用户轻松省钱。该产品定位于为用户提供高效的优惠券搜索和使用体验。
与世界分享您的GPT
gptshare是一个GPT目录服务,帮助您找到最适合您的GPT。您可以在这里搜索各种GPT,包括智能助手、创意生成、语言处理、推荐系统等。您可以通过浏览不同的分类或使用搜索功能来找到您需要的GPT。每个GPT都有详细的介绍,包括功能、优势、定价和使用场景等。
你的私人AI聊天工具,运行在浏览器中。
Chatty是一个利用WebGPU技术在浏览器中本地且私密地运行大型语言模型(LLMs)的私人AI聊天工具。它提供了丰富的浏览器内AI体验,包括本地数据处理、离线使用、聊天历史管理、支持开源模型、响应式设计、直观UI、Markdown和代码高亮显示、文件聊天、自定义内存支持、导出聊天记录、语音输入支持、重新生成响应以及明暗模式切换等功能。
异步去噪并行化扩散模型
AsyncDiff 是一种用于并行化扩散模型的异步去噪加速方案,它通过将噪声预测模型分割成多个组件并分配到不同的设备上,实现了模型的并行处理。这种方法显著减少了推理延迟,同时对生成质量的影响很小。AsyncDiff 支持多种扩散模型,包括 Stable Diffusion 2.1、Stable Diffusion 1.5、Stable Diffusion x4 Upscaler、Stable Diffusion XL 1.0、ControlNet、Stable Video Diffusion 和 AnimateDiff。
macOS风格的开源React桌面环境
MacAIverse是一个完全由AI生成代码,使用React构建的macOS风格的开源桌面环境。该项目由Claude AI助手初始创建,现在开放给其他Claude实例或其他开发者贡献新的应用。它遵循macOS设计原则,保持与整体桌面环境的一致性,并通过Tailwind CSS和framer-motion库实现流畅的动画和响应式布局。
视频超分辨率纹理增强技术
EvTexture是一种基于事件的视觉驱动的视频超分辨率(VSR)技术,它利用事件信号中的高频细节来更好地恢复VSR中的纹理区域。该技术首次提出使用事件信号进行纹理增强,通过迭代纹理增强模块逐步探索高时间分辨率的事件信息,实现纹理区域的逐步细化,从而获得更准确、丰富的高分辨率细节。在四个数据集上,EvTexture达到了最先进的性能,特别是在Vid4数据集上,与最近的基于事件的方法相比,可以获得高达4.67dB的增益。
开源服务器代理,用于收集和报告指标
Telegraf是一个开源的服务器代理,用于收集和发送来自数据库、系统和IoT传感器的所有指标和事件。它使用Go语言编写,编译成一个单一的二进制文件,无需外部依赖,占用的内存非常小。Telegraf拥有300多个插件,由社区成员编写,覆盖了云服务、应用程序、IoT传感器等多种数据源。它支持灵活的解析和序列化,适用于多种数据格式,如JSON、CSV、Graphite,并能将数据序列化为InfluxDB行协议和Prometheus等。Telegraf还具有稳健的交付保证,包括流量回压、调度器、时钟漂移调整、全流支持等。此外,Telegraf的自定义构建器允许用户选择特定插件包含在Telegraf二进制文件中,适合在资源受限的设备上使用。
纯净写作体验,专注流状态
iA Writer是一款专注于写作的应用程序,旨在提供纯净的写作环境,帮助用户专注于内容创作。它通过简洁的界面设计和强大的功能,如语法检查、文本聚焦等,帮助用户提高写作效率和质量。iA Writer背后的设计理念是利用人工智能技术,让用户在写作时思考得更多,而不是更少,从而提升写作体验。
使用Groq、Whisper和Llama3从音频生成有组织的笔记。
Groqnotes是一个基于Streamlit的应用程序,它通过迭代解析和生成从转录的音频讲座中提取的笔记来构建结构化的讲座笔记。该应用程序混合使用了Llama3-8b和Llama3-70b模型,利用较大的模型生成笔记结构,较快的模型创建内容。Groqnotes的主要优点包括快速转录音频和生成文本,以及通过策略性地在两种模型之间切换来平衡速度和质量。此外,它还支持Markdown样式,可以在Streamlit应用程序中创建美观的笔记,包括表格和代码,并允许用户下载包含全部笔记内容的文本或PDF文件。
本地语音聊天机器人,保护隐私,无需联网。
june是一个结合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的本地语音聊天机器人。它提供了一种灵活、注重隐私的解决方案,可以在本地机器上进行语音辅助交互,确保没有数据被发送到外部服务器。产品的主要优点包括无需联网即可使用、保护用户隐私、支持多种交互模式等。
极速、高度相关的搜索引擎
Meilisearch是一个灵活且强大的用户为中心的搜索引擎,可以轻松添加到任何网站或应用程序中。它以其极速的搜索响应(小于50毫秒)和即插即用的特性(智能预设,零配置启动)著称。Meilisearch还提供了先进的全文搜索引擎,具有出色的相关性,适用于各种用例。此外,它是一个开源项目,拥有一个友好且快速增长的社区。
无需编写代码即可创建智能代理的LLM工具。
Nerve是一个可以创建具有状态的代理的LLM工具,用户无需编写代码即可定义和执行复杂任务。它通过动态更新系统提示和在多个推理过程中保持状态,使代理能够规划和逐步执行完成任务所需的操作。Nerve支持任何通过ollama、groq或OpenAI API可访问的模型,具有高度的灵活性和效率,同时注重内存安全。
本地机器智能的探索之旅
Local III是一个由超过100名来自世界各地的开发者共同开发的更新,它提供了易于使用的本地模型浏览器,深度集成了推理引擎如Ollama,为开放模型如Llama3、Moondream和Codestral定制了配置文件,并提供了一套设置,使离线代码解释更加可靠。Local III还引入了一个免费的、托管的、可选的模型通过解释器--model i。与i模型的对话将用于训练我们自己的开源计算机控制语言模型。
多模态和多任务模型训练框架
4M是一个用于训练多模态和多任务模型的框架,能够处理多种视觉任务,并且能够进行多模态条件生成。该模型通过实验分析展示了其在视觉任务上的通用性和可扩展性,为多模态学习在视觉和其他领域的进一步探索奠定了基础。
构建一个会讲故事的人工智能大型语言模型。
LLM101n是一个开源课程,旨在教授如何从头开始构建一个能讲故事的人工智能大型语言模型(LLM)。课程内容涵盖了从基础到高级的多个方面,包括语言模型、机器学习、深度学习框架等,适合希望深入理解AI和LLM的编程人员和研究人员。
智能家庭助理,简化家务管理
Ohai是由Care.com创始人Sheila Lirio Marcelo带领的团队创建的智能家庭助理,旨在减轻家庭事务负责人的心理负担。它通过文本消息与用户互动,帮助管理家庭日程、待办事项、协调家庭和看护者之间的沟通,并跟踪学校邮件等。
© 2024 AIbase 备案号:闽ICP备08105208号-14