使用大型语言模型(LLMs)进行数据清洗和整理的Python库。
databonsai是一个Python库,利用大型语言模型(LLMs)执行数据清洗任务。它提供了一系列工具,包括数据分类、转换和提取,以及对LLM输出的验证,支持批量处理以节省令牌,并且具备重试逻辑以处理速率限制和瞬时错误。
自动匹配、转换、分类数据
EntityMatcher是一款用于自动匹配、转换和分类数据的工具。其主要功能包括自动确定两个实体是否相同、自动从数据记录中提取和格式化多个值以及自动标记和分类数据记录。无论是开发人员还是商业用户,都可以通过REST API或无代码界面方便地使用EntityMatcher。其优势在于提供易于使用的界面以快速审查自动输出,以及根据人工反馈自动改进自动化质量。定价方面,EntityMatcher在免费信用额用尽后,每处理10条记录收取0.01美元,并为高容量用户提供批量折扣。
一键发现数据洞察,重新定义数据分析工作流
Kanaries是一款增强分析引擎,可通过一键发现数据集的模式、洞察和因果关系。它可以自动化地探索和可视化数据集,为数据科学家提供相关推荐,并帮助用户清洗和解释数据。产品定位于重新定义数据清洗、探索和可视化的工作流,提高数据分析的效率。
角色扮演聊天机器人
Janitor AI 是一款角色扮演聊天机器人网站,提供多种角色选择,适用于个人和企业,帮助管理客户联系并提供快速回复。同时,Janitor AI 还提供一个用于数据清洗的 API,助力数据科学家和开发者优化数据集和机器学习模型。
开源CSV导入器
YoBulk是一个开源的CSV导入器,提供智能列映射、数据清洗和JSON模式生成等高级功能。它能够处理大规模的CSV验证,支持处理Gigabyte级别的文件。YoBulk提供简单易用的电子表格界面,用于导入和转换任何CSV文件,并清晰明了地展示数据错误。开发者可以根据JSON模式创建自定义CSV导入器,并根据自己的需求设计导入器,实现数据清洗和用户数据导入。
数据分析工具,快速、安全、引导式
DataSquirrel.ai是一款快速、安全、引导式的数据分析工具。它可以帮助用户快速分析和清洗数据,并自动生成可视化图表和仪表盘报告。用户可以通过简单的操作实现数据分析,无需使用公式和数据透视表。DataSquirrel.ai还支持数据的分享、评论和下载,方便团队协作。它适用于各种业务场景,为非技术人员提供了智能化的商业智能工具。
无代码数据清洗、准备和机器学习平台
Sweephy是一款无代码数据清洗、准备和机器学习平台。它专注于为每个业务案例提供专业开发,可以帮助您将原始数据转化为商业价值。Sweephy提供了一系列机器学习模块,包括数据可视化、文本分类、相似记录检查、数据分析和解释等功能。通过Sweephy,您可以轻松处理数据并从中获取商业价值。
© 2024 AIbase 备案号:闽ICP备08105208号-14