简介:

LLM的评估和单元测试框架

功能:

针对答案相关性、事实一致性、有毒性、偏见的测试

查看测试、实现和比较的Web UI

通过合成查询-答案自动评估

与LangChain等常见框架集成

合成查询生成

仪表板

需求人群:

["评估语言模型应用的不同方面","与CI/CD集成进行自动化测试","快速迭代改进语言模型"]

浏览量:376

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图