需求人群:
["评估语言模型应用的不同方面","与CI/CD集成进行自动化测试","快速迭代改进语言模型"]
使用场景示例:
使用简单的单元测试方式针对ChatGPT回答进行相关性、一致性测试
基于语言链的应用,通过DeepEval进行自动化测试
使用合成查询功能快速发现模型的问题
产品特色:
针对答案相关性、事实一致性、有毒性、偏见的测试
查看测试、实现和比较的Web UI
通过合成查询-答案自动评估
与LangChain等常见框架集成
合成查询生成
仪表板
浏览量:15
将LLM模型打包成一个可执行文件
llamafile是一个将LLM(大型语言模型)模型及其权重打包成一个自包含可执行文件的工具。它结合了llama.cpp和Cosmopolitan Libc,可以让复杂的LLM模型被压缩成一个llamafile,无需进行任何安装和配置就可以在大多数计算机上本地运行。主要优点是使开源的LLM模型更易于开发者和终端用户访问。
Mistral 7B是最佳7B模型
Mistral 7B是由Mistral AI免费提供给所有人使用的第一个大型语言模型。它适用于许多用例,具有优秀的自然编码能力和8k序列长度。该模型在所有基准测试中表现优于Llama 2.13B,并且在代码和推理基准测试中远远超过其他模型。Mistral 7B易于在任何云端和游戏GPU上部署。
AI驱动软件自动化开发解决方案
DevOpsGPT是一个AI驱动的软件自动化开发解决方案,它结合了大型语言模型和DevOps工具,可以将自然语言需求转换成可工作的软件。该解决方案大大提高了开发效率,缩短了开发周期,降低了沟通成本,提高了软件交付的质量。
医学大型语言模型套件
Meditron 是一套开源的医学大型语言模型(LLM)套件。它通过对一份经过综合筛选的医学语料库进行持续预训练,包括选定的 PubMed 论文和摘要、一份新的国际认可的医学指南数据集以及一个通用领域语料库,将 Llama-2 适应到医学领域。Meditron-70B 在相关数据上进行了微调,性能优于 Llama-2-70B、GPT-3.5 和 Flan-PaLM。
将数据转化为知识
Denser Chatbots可以利用您的个人网站或上传的文件创建聊天机器人。Denser采用先进技术处理您的数据,并使用大型语言模型从您的特定数据中提取见解来回答您的查询。使用Retrieval Augmented Generation (RAG)方法,Denser Chatbots能够生成基于您独有的知识库的答案,提供比标准大型语言模型更个性化和相关的响应。构建和部署Denser Chatbots非常简单,只需提供您的网站URL,即可开始构建和部署,无需任何编程技能。
无过滤的性格AI聊天
Janitor AI是一个基于自主开发的大型语言模型的聊天机器人。我们的使命是支持开放互联网的精神。Janitor AI支持NSFW内容,用户可以创建自己的AI性格,生成Hentai图像。Janitor AI提供付费套餐,详细定价请参考官网。Janitor AI的主要功能包括无过滤聊天、支持NSFW内容、创建AI性格、生成Hentai图像等。
3D世界中的全能代理人
LEO是一个基于大型语言模型的多模态、多任务全能代理人,能够在3D世界中感知、定位、推理、规划和执行任务。LEO通过两个阶段的训练实现:(i)3D视觉语言对齐和(ii)3D视觉语言动作指令调整。我们精心策划和生成了一个包含物体级和场景级多模态任务的大规模数据集,需要对3D世界进行深入的理解和交互。通过严格的实验,我们展示了LEO在3D字幕、问答、推理、导航和机器人操作等广泛任务中的出色表现。
AI辅助量子计算
Quantum Copilot是一个AI辅助量子计算工具,帮助量子计算爱好者和专业人士编写量子计算程序。它可以用简单的语言编写量子算法,绘制量子电路,将量子代码转换为各种编程语言和库之间的格式,并在量子模拟器或实际的量子硬件上运行量子程序。Quantum Copilot由最新的人工智能和大型语言模型驱动,能够理解复杂的问题并提供准确和有用的答案。
Generative AI 模型评估工具
Deepmark AI 是一款用于评估大型语言模型(LLM)的基准工具,可在自己的数据上对各种任务特定指标进行评估。它与 GPT-4、Anthropic、GPT-3.5 Turbo、Cohere、AI21 等领先的生成式 AI API 进行预集成。
现代客服团队的首选
Chatwoot是一款开源的AI客服平台,通过AI技术提升客户支持体验,提供自助服务工具、全球搜索接口、实时聊天SDK等功能,同时支持自托管部署,符合SOC 2 Type II标准,可无缝切换不同的大型语言模型。作为Intercom、Zendesk和Salesforce Service Cloud的替代品,Chatwoot提供共享收件箱、多渠道支持、自动化、聊天机器人等功能。
用AI生成吸引人的视频片段
CutLabs利用最新的AI和计算机视觉技术,帮助创作者将现有内容制作成有趣的视频片段,帮助他们在短时间内迅速走红。通过使用大型语言模型,我们的AI可以自动识别和剪辑长视频中的多个有趣片段。同时,我们还提供自定义样式的自动字幕和自动调整视频帧的功能,让视频更加吸引人。
可靠的 AI 内容生成工具
SEEKER 是一个可靠的检索增强生成(RAG)AI 聊天平台,可以从大型数据集中安全提取和分析信息,为个人和组织提供可靠的见解和优化。与 ChatGPT 和其他领先的大型语言模型(LLM)相比,SEEKER 具有更多的功能,并具有极高的透明度。
从长文本中合成无限可控角色动画
Story-to-Motion是一个全新的任务,它接受一个故事(顶部绿色区域)并生成与文本描述相符的动作和轨迹。该系统利用现代大型语言模型作为文本驱动的运动调度器,从长文本中提取一系列(文本、位置)对。它还开发了一个文本驱动的运动检索方案,结合了经典运动匹配和运动语义以及轨迹约束。此外,它设计了一个渐进式掩蔽变换器,以解决过渡动作中常见的问题,如不自然的姿势和滑步。该系统在轨迹跟随、时间动作组合和动作混合等三个不同子任务的评估中表现优异,胜过以往的动作合成方法。
语义增强数据成就是AI定制解决方案
Semiring是一个端到端的平台,能够通过少量样本数据生成高质量合成数据集,从而使开发者可以轻松创建高性能的机器学习模型。它提供了完整的ML模型构建流程,包括数据合成、模型训练、评估和部署。关键功能及优势包括:基于先进自然语言模型的高效数据合成;支持自定义域特定数据;无缝自动标注;多样化的预训练模型库;自动模型调优;一体化的云端训练服务;简易的API集成和高速推理等。相比于直接提示大型语言模型和自建方案,Semiring以其卓越的速度、成本效益和质量优势脱颖而出。
从人工智能反馈中获得内在动机
Motif 是一个基于 PyTorch 的项目,通过从 LLM(大型语言模型)的偏好中获取奖励函数,训练 AI 代理在 NetHack 上进行。它可以生成与人类行为直觉一致的行为,并且可以通过提示修改进行引导。
轻松的文本方式进行卡路里计数
MealByMeal 是一款无需应用程序的卡路里追踪工具,用户可以通过文本方式记录所吃食物和体重,同时提供每种食物的卡路里和宏量评估。使用 ChatGPT 和其他大型语言模型技术,能够为更多食物提供估算卡路里和宏量,准确度随提供信息的多少而提高。
开源ChatGPT插件,提升对话能力
OpenPlugin是一个开源项目,旨在通过普及ChatGPT和大型语言模型插件的使用,提供更强大的AI能力。该项目降低了使用ChatGPT插件的门槛,让更多人可以享受到插件带来的好处。OpenPlugin易于安装和使用,并且完全免费。
芯片设计领域自适应大型语言模型
ChipNeMo 是英伟达发布的一个探索将大型语言模型(LLMs)应用于工业芯片设计的项目。与直接使用现成的商业或开源 LLMs 不同,我们采用了定制的分词器、领域自适应的持续预训练、带有领域特定指令的监督微调(SFT)以及领域适应的检索模型等领域自适应技术。
基于LLM的企业智能工作助手
LLime是一个基于大型语言模型的企业智能工作助手,可以为企业的各个部门提供定制化的AI助手,提升工作效率。它提供简单易用的界面,支持根据企业数据进行模型微调,确保模型精准适配企业需求。主要功能包括代码探索、数据分析、内容策略等,可以帮助开发者、管理者和市场人员的工作决策。该产品采用订阅制,根据部门和员工人数定价。
Ai写作助手,支持论文、文案、策划等文字创作
笔灵AI写作是一个基于大型语言模型的智能写作工具。它可以帮助用户自动生成各类文本内容,比如工作总结、论文开题、文案创意等,大大提高写作效率。笔灵拥有强大的自然语言处理技术,可以准确理解用户需求,针对不同场景采用不同创作策略,保证生成内容的逻辑性和连贯性。同时,笔灵还具备文本风格转换等功能,用户可以指定需要哪种风格的文字。总体来说,笔灵AI写作是一个非常实用的写作新助手。
构建应用程序的LLM通过组合性
LangChain是一个帮助开发人员构建应用程序的库,通过组合性将大型语言模型(LLMs)与其他计算或知识源结合起来。它提供了各种应用场景的端到端示例,包括问题回答、聊天机器人和代理等。LangChain还提供了对LLMs的通用接口、链式调用、数据增强生成、记忆和评估等功能。定价信息请访问官方网站。
SALMONN: 语音音频语言音乐开放神经网络
SALMONN是由清华大学电子工程系和字节跳动开发的大型语言模型(LLM),支持语音、音频事件和音乐输入。与仅支持语音或音频事件输入的模型不同,SALMONN可以感知和理解各种音频输入,从而获得多语言语音识别和翻译以及音频-语音共推理等新兴能力。这可以被视为给予LLM“听觉”和认知听觉能力,使SALMONN成为通向具有听觉能力的人工通用智能的一步。
Flash-Decoding for long-context inference
Flash-Decoding是一种针对长上下文推理的技术,可以显著加速推理中的注意力机制,从而使生成速度提高8倍。该技术通过并行加载键和值,然后分别重新缩放和组合结果来维护正确的注意力输出,从而实现了更快的推理速度。Flash-Decoding适用于大型语言模型,可以处理长文档、长对话或整个代码库等长上下文。Flash-Decoding已经在FlashAttention包和xFormers中提供,可以自动选择Flash-Decoding或FlashAttention方法,也可以使用高效的Triton内核。
AI决策指南
《Generative AI: An Executive Guide》是一本关于生成式人工智能技术的权威指南,提供了应用大型语言模型(LLMs)在组织中创造价值的方法和案例研究。本指南适用于C级高管、负责AI战略的高级经理、私营、公共和第三部门组织、创业者、初创企业和成长团队、投资者、分析师和投资专业人士。
让LLM为您的代码审查
Lintrule是一个命令行工具,让大型语言模型为您的代码审查。它可以执行Lint工具无法发现的策略违规,找出您的测试无法捕获的错误,并且超越传统的审查过程,节省团队的时间。价格根据代码行数变动。
Docker推出的人工智能应用开发解决方案
Docker GenAI Stack是一个面向开发者的人工智能应用开发解决方案。它整合了各大领先的AI技术,只需几次点击就可以部署完整的AI应用栈,实现代码级的AI集成。GenAI Stack内置预配置的大型语言模型,提供Ollama管理,采用Neo4j作为默认数据库,可实现知识图谱和向量搜索。还配备了LangChain框架用于编排和调试,以及全面的技术支持和社区资源。GenAI Stack使AI应用开发变得简单高效,开发者可以快速构建实用的AI解决方案。
面向世界的多模式大型语言模型
Kosmos-2是一个多模态大型语言模型,可以将自然语言与图像、视频等多种形式的输入进行关联。它可以用于短语定位、指代表达理解、指代表达生成、图像描述和视觉问答等任务。Kosmos-2使用了GRIT数据集,该数据集包含了大量的图像-文本对,可以用于模型的训练和评估。Kosmos-2的优势在于它可以将自然语言与视觉信息进行关联,从而提高了模型的表现。
使用大型语言模型生成机器人模拟任务
GenSim利用大型语言模型生成大量的机器人模拟任务,支持目标导向生成和探索性生成两种模式,可用于多任务策略训练和任务级别泛化。使用GPT4扩展了现有基准测试10倍以上,支持超过100个任务,通过有监督微调和评估多个LLM,包括微调的GPT和Code Llama,生成机器人模拟任务的代码。最小的模拟到真实世界的适应后,预训练在GPT4生成的模拟任务上的多任务策略在真实世界中展现了更强的转移能力,超过基线25%。
© 2023 AIbase 备案号:闽ICP备2023012347号-1