需求人群:
"Proxy Lite 适合需要高效网页自动化解决方案的开发者、研究人员和企业用户。它可以帮助开发者快速构建自动化工具,提升工作效率;研究人员可以利用其开源特性进行模型改进和创新;企业用户则可以将其集成到现有系统中,优化业务流程。"
使用场景示例:
在 Allrecipes 网站上自动搜索并获取素食千层面食谱
在 Amazon 网站上自动完成商品搜索和筛选操作
在 Google Search 上自动执行复杂的搜索任务并提取相关信息
产品特色:
支持网页自动化任务,如搜索、导航和信息检索
三步响应机制:观察、思考和工具调用,提升任务执行的灵活性和成功率
开源权重,允许开发者自由使用和改进模型
低资源消耗,适合资源受限的环境
提供企业级浏览器控制框架,支持复杂的网页交互操作
支持多种主流网站的自动化操作,如 Allrecipes、Amazon、Google 等
提供详细的性能数据和任务成功案例,便于开发者参考和优化
支持社区贡献,鼓励开发者共享代码、构建应用和分享用例
使用教程:
1. 访问 GitHub 仓库(https://github.com/convergence-ai/proxy-lite)并下载模型。
2. 安装必要的依赖库,如 Python 环境和相关框架。
3. 配置浏览器控制框架,确保模型可以与目标网页进行交互。
4. 使用模型的三步响应机制(观察、思考、工具调用)编写自动化脚本。
5. 在目标网站上运行脚本,观察模型的自动化操作。
6. 根据需要调整模型参数或优化脚本,以提高任务的成功率。
7. 将模型集成到现有系统或开发新的自动化应用。
8. 参与社区贡献,分享改进代码或使用案例。
浏览量:258
最新流量情况
月访问量
723.15k
平均访问时长
00:02:58
每次访问页数
2.85
跳出率
47.36%
流量来源
直接访问
53.21%
自然搜索
31.84%
邮件
0.13%
外链引荐
7.37%
社交媒体
6.70%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
巴西
3.89%
英国
15.68%
印度
10.80%
意大利
3.62%
美国
18.77%
开源的网页自动化库,支持任何大型语言模型(LLM)
browser-use是一个开源的网页自动化库,允许大型语言模型(LLM)与网站进行交互,通过简单的接口实现复杂的网页操作。该技术的主要优点包括对多种语言模型的通用支持、交互元素自动检测、多标签页管理、XPath提取、视觉模型支持等。它解决了传统网页自动化中的一些痛点,如动态内容处理、长任务解决等。browser-use以其灵活性和易用性,为开发者提供了一个强大的工具,以构建更加智能和自动化的网页交互体验。
基于代理的自动化系统,专注于网页自动化。
Agent-E 是一个基于 AutoGen 代理框架的系统,旨在自动化用户计算机上的操作,目前专注于浏览器内的自动化。它通过自然语言与网页浏览器交互,执行填写表单、搜索和排序电商产品、定位网站内容、管理播放设置、执行网络搜索、管理项目管理平台任务等操作。Agent-E 正在成长中,已经能够处理多样化的任务,但最佳任务是用户自行发掘的。
Proxy Lite 是一款开源的 3B 参数视觉语言模型(VLM),专注于网页自动化任务。
Proxy Lite 是 Convergence AI 推出的一款开源模型,具有强大的网页自动化能力。它通过独特的三步响应机制(观察、思考、工具调用)实现高效的网页交互,显著提升了任务的成功率和效率。该模型在 WebVoyager 任务中表现出色,仅使用少量计算资源就能达到顶尖水平。其开源特性使得开发者和研究人员可以自由使用、改进和扩展,推动了开源社区在自动化领域的进步。
2分钟内实现网页抓取、监控和自动化
Browse AI是一款无需编码的工具,可以在2分钟内训练一个机器人来抓取任何网站的数据。您可以使用简单的点-and-click界面设置网页抓取自动化任务,将数据下载为电子表格或与Google表格同步,定时运行任务并监控数据变化。您还可以使用Zapier集成或REST API和Webhooks将数据流入任何其他软件,甚至可以将任何网站转化为API。Browse AI可帮助您节省大量时间和精力,提高工作效率。
浏览器插件,使用AI进行自动化网页浏览和操作
HARPA AI是一款基于GPT的自动化智能助手,可在浏览器上进行网页浏览和操作。它集成了GPT-3和GPT-4,支持智能搜索、网页摘要、翻译、写作等功能。此外,它还可以监控网页、自动刷新、提供价格降低和货物补货的提醒,并可将网站转化为API接口。HARPA AI拥有用户友好的设计,支持自定义命令和自动化,并且保护用户的隐私。
与顶级网站程序化交互,无需担心自动化脚本问题。
Web Action SDK 是由 Actionbase 提供的软件开发工具包,它允许开发者通过编程方式与互联网上的顶级网站进行交互,而无需编写易碎或复杂的自动化脚本。这使得开发者可以更加便捷地集成第三方服务到自己的应用程序中,提高开发效率,降低维护成本。
LaVague是一个大型动作模型框架,用于自动化浏览器交互
LaVague旨在通过将自然语言指令转换为无缝的浏览器交互来重新定义互联网浏览体验。它利用自然语言处理和Selenium集成,使用户或其他AI能够轻松表达网络工作流程并在浏览器上执行它们。
企业自动化平台
Moveworks 是一个基于世界上最先进的大型语言模型训练的生成式 AI 的企业自动化平台,能够自动化工作流程。它适用于各个部门,提供了自然语言的连接和沟通方式,帮助员工更高效地完成工作。
自动化代码审查、文档和补丁的开源工作流自动化框架。
Patched是一个开源的工作流自动化框架,专为开发团队设计,通过集成大型语言模型(LLMs)来自动化代码审查、文档生成、补丁生成等开发任务。它通过提供预设的patchflows或允许用户自定义patchflows来加速日常开发工作。Patched支持与现有的开发和安全解决方案集成,如Gitlab、GitHub、Jira等,使得开发人员能够构建复杂的多步骤工作流。Patched强调隐私优先,支持在用户自己的基础设施内部署,并使用自己的LLM API密钥。
通过结合ChatGPT自动化与代码,创建简单的自动化任务
Magic Loops是一种基于ChatGPT的自动化工具,可以连接数据、发送电子邮件、接收短信、爬取网站等功能。它能够帮助用户自动化生活中的各种任务,提高工作效率。Magic Loops的主要优点是可以与各种数据源和应用程序集成,轻松实现个性化的自动化需求。
自动化报告引擎
Instaphrase是一款自动化报告引擎,能够帮助用户自动完成作业和报告的研究、写作和格式化过程。它会从最新的文章、新闻和学术论文中寻找来源,并提供所有使用的参考文献。用户可以选择所需的语言和引用格式,并将报告下载为PDF文档。订阅费用为每月20美元,提供20个积分,额外积分可以购买。
开源视频编辑框架,支持自动化视频工作流。
Revideo是一个基于Motion Canvas的开源框架,用于程序化视频编辑。它允许开发者自动化复杂的视频工作流程,或在浏览器中构建完整的视频编辑器。Revideo支持使用Typescript创建视频模板,并能够即时预览和渲染为MP4格式的视频。它适用于大规模视频生成、A/B测试视频广告、构建网页内的视频编辑器或视频游戏等场景。
构建浏览器自动化,快人一步
Autotab是一个快速构建浏览器自动化的工具,可以用于各种实际任务。它基于Python语言,并提供了强大的自动化功能,包括网页操作、数据抓取、表单填写等。Autotab的优势在于简单易用、高效稳定,可以帮助用户节省大量的时间和精力。产品定价灵活,提供免费试用和按需付费的订阅模式。适用于个人用户和企业用户,可以应用于各种场景,如数据采集、自动化测试、网页监控等。
自动化广告管理
MisterCMO是一款AI广告自动化引擎,为广告主提供全天候的广告创建、管理和优化服务。通过无需编码的集成系统,快速连接到广告平台。自动化创建广告素材,并通过AI技术定位目标受众并生成多个广告变体。用户可根据需求定制自动化规则,或选择让MisterCMO AI实时管理广告。帮助用户轻松提升广告效果。
自动化数据录入
DocumentPro使用AI从文档和电子邮件中提取信息和表格,快速准确地完成数据录入。它可以处理各种标准的商业文档,无需任何设置,节省时间和精力。支持各类文档类型,包括发票、采购订单、收据、提货单、身份证等。通过智能OCR和GPT技术,DocumentPro能够自动提取数据字段和表格,并支持导出为Excel或JSON格式。无需培训即可使用,还可以处理自定义文档(即将推出)。
自动化研究与分析
Nuntium AI利用人工智能技术,通过综合公开可得的信息与私有数据库,生成长篇研究报告。传统上需要人工分析师数小时甚至数天完成的工作,现在只需点击一下按钮,完全自动化。具有优化的高效研究和分析能力,可节省时间和成本。
自动化网络工具,创建、运行和扩展网络自动化。
H是一个致力于网络自动化的产品,它允许用户创建、运行和扩展网络自动化任务。这项技术的重要性在于它能够提高工作效率,减少重复性劳动,让用户能够专注于更有创造性和战略性的任务。H的背景信息显示,它是一个API beta产品,目前正在招募用户参与测试。产品的主要优点包括提高效率、减少错误和节省时间。关于价格和定位,目前没有具体的信息,但用户可以加入等待名单以开始构建与H相关的项目。
智能Twitter自动化平台
TweetFox是一个智能Twitter自动化平台,提供AI生成推文、全文线索、兴趣相关推文等功能。它还提供深度分析和增长实验室,帮助用户了解什么对他们最有效。TweetFox适用于个人品牌建设、维护多个账户的用户等。
AI自动化代理机构
Leonardo Labs是位于加利福尼亚州并全球可用的顶级AI自动化代理机构。我们专注于构建AI克隆产品,帮助创业公司实现自动化。我们的AI克隆产品可以代替您进行管理工作,使您能够更专注于客户和业务的扩展。我们提供定制的AI代码开发、独特的个性化形象和声音、不断更新的知识库、固定月费、高质量的服务和灵活可扩展的解决方案。
基于AI的Python网络爬虫库,自动化提取网页信息。
ScrapeGraphAI是一个使用LLM(大型语言模型)和直接图逻辑来为网站、文档和XML文件创建抓取管道的Python网络爬虫库。用户只需指定想要提取的信息,库就会自动完成这项工作。该库的主要优点在于简化了网络数据抓取的过程,提高了数据提取的效率和准确性。它适用于数据探索和研究目的,但不应被滥用。
一个通过 AI 自动化网页任务、将网页转化为结构化数据并集成工具的产品。
rtrvr.ai 是一款强大的 AI 驱动的网页自动化工具,它能够帮助用户简化复杂的网页浏览和数据提取过程。通过自然语言命令,用户可以轻松地在网页上进行导航,无需手动点击和滚动。此外,它还能将网页内容转化为结构化数据,方便用户构建自定义数据管道。其功能调用特性允许用户直接在浏览器中与各种工具集成,执行任务。该产品在隐私和安全方面表现出色,采用有限权限和沙盒执行等设计,确保用户数据安全。目前,rtrvr.ai 的具体价格未明确,但从其功能和定位来看,它主要面向需要高效处理网页数据和自动化任务的用户。
个性化邮件和自动化跟进
Klenty是一款销售自动化工具,可以帮助销售团队发送个性化的邮件和自动化跟进。它可以大大减少繁琐的手动操作,让销售人员更专注于建立关系和闭环。Klenty提供邮件追踪、销售拓展和销售挖掘等功能,并提供灵活的定价方案,满足不同团队的需求。无论是中小企业还是大型企业,都可以使用Klenty来提升销售效率。
数据自动化平台
Avian是一款连接全球商业智能的数据自动化平台,通过Avian可以将数据连接到ChatGPT、Looker Studio和Google Sheets等工具上。Avian提供24/7客户服务,并提供14天免费试用,无需信用卡。
AI冷调用自动化
PitchBreeze是一款AI销售外展工具,可以自动发送个性化消息给潜在客户。它通过扫描数据信号如公司新闻和社交媒体来创建超个性化的消息,同时可以根据用户的理想客户资料和价值主张提供1,000个新的潜在客户名单。PitchBreeze提供简单的按需付费方案,每月联系最多1,000个潜在客户,用户可以上传自己的潜在客户名单或使用PitchBreeze提供的名单,并且提供超个性化的外展电子邮件。
自动化DevOps + 基础架构
AutoInfra是一个基于语言的基础架构工具,通过在Slack中发送消息来创建、修改和监控AWS。AutoInfra提供快速性能、精确控制、隐私保护、AI日志分析等功能,并始终在线监控您的基础架构。自动化的每日报告可以让您了解最近24小时内发生的一切,并帮助解决基础架构问题。AutoInfra可以加速您的功能发布时间表,同时具备安全性和可配置性。
© 2025 AIbase 备案号:闽ICP备08105208号-14