需求人群:
"DBRX可应用于各种需要高质量语言模型的场景,如对话系统、问答系统、代码生成、数学推理等。企业还可以基于自身数据对DBRX进行定制,从而构建专属的AI应用。"
使用场景示例:
一家软件公司可以使用DBRX来提高其代码生成和自动化测试的质量。
一家教育机构可以利用DBRX构建高质量的在线问答和智能辅导系统。
一家金融公司可以基于自身数据对DBRX进行定制,以提高其风险评估和合规性分析的效率。
产品特色:
语言理解
编程
数学
逻辑推理
可定制
高效
开源
浏览量:444
最新流量情况
月访问量
467127.54k
平均访问时长
00:07:27
每次访问页数
6.62
跳出率
37.89%
流量来源
直接访问
51.41%
自然搜索
29.45%
邮件
0.92%
外链引荐
11.72%
社交媒体
6.47%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
美国
16.52%
中国
14.70%
印度
9.14%
日本
3.64%
德国
3.30%
快速训练和微调大型语言模型
Unsloth 是一个旨在提高大型语言模型(LLMs)训练和微调速度的平台。它通过手动推导所有计算密集型数学步骤并手写GPU内核,实现了无需硬件更改即可显著加快训练速度。Unsloth 支持多种GPU,包括NVIDIA、AMD和Intel,并提供开源版本供用户在Google Colab或Kaggle Notebooks上免费试用。它还提供了不同级别的定价方案,包括免费版、Pro版和企业版,以满足不同用户的需求。
高质量英文网页数据集
FineWeb数据集包含超过15万亿个经过清洗和去重的英文网页数据,来源于CommonCrawl。该数据集专为大型语言模型预训练设计,旨在推动开源模型的发展。数据集经过精心处理和筛选,以确保高质量,适用于各种自然语言处理任务。
Meta 新一代开源大型语言模型,性能卓越
Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。
开源的先进文本嵌入模型
Snowflake Arctic Embed是一系列基于Apache 2.0许可开源的文本嵌入模型,专为检索用例设计。这些模型在Massive Text Embedding Benchmark (MTEB)检索基准测试中提供了领先的检索性能,为组织在结合专有数据集与大型语言模型(LLMs)进行检索增强生成(RAG)或语义搜索服务时提供了新的优势。这些模型的尺寸从超小型(xs)到大型(l),具有不同的上下文窗口和参数数量,以满足不同企业的延迟、成本和检索性能需求。
以低成本实现高性能的大型语言模型
JetMoE-8B是一个开源的大型语言模型,通过使用公共数据集和优化的训练方法,以低于10万美元的成本实现了超越Meta AI LLaMA2-7B的性能。该模型在推理时仅激活22亿参数,大幅降低了计算成本,同时保持了优异的性能。
Octopus-V2-2B是一款在移动设备上运行的2B LLMs,性能优于GPT-4
Octopus-V2-2B是由斯坦福大学NexaAI开发的开源大型语言模型,具有20亿参数,专门为Android API的功能调用定制。它采用了独特的功能性标记策略,用于训练和推理阶段,使其达到与GPT-4相当的性能水平,并提高了推理速度。Octopus-V2-2B特别适合边缘计算设备,能够在设备上直接运行,支持广泛的应用场景。
使用大型语言模型进行逆向工程:反编译二进制代码
LLM4Decompile是一个开源项目,旨在创建并发布第一个专门用于反编译的LLM(大型语言模型),并通过构建首个专注于可重编译性和可执行性的反编译基准测试来评估其能力。该项目通过编译大量C代码样本到汇编代码,然后使用这些数据对DeepSeek-Coder模型进行微调,构建了评估基准Decompile-Eval。
一款开源大型语言模型,适用于中英文
MediaTek Research发布了名为MR Breeze-7B的新开源大型语言模型,拥有70亿参数,擅长处理中英文。相比先前的BLOOM-3B,MR Breeze-7B吸收了20倍的知识,使其能够精准处理传统中文语言的文化和语言细微差别。优化后,MR Breeze-7B在处理速度上胜过其他模型,为用户带来更流畅的体验。定价免费。
下一代开源和双语大型语言模型
Yi-9B是01.AI研发的下一代开源双语大型语言模型系列之一。训练数据量达3T,展现出强大的语言理解、常识推理、阅读理解等能力。在代码、数学、常识推理和阅读理解等方面表现卓越,是同尺寸开源模型中的佼佼者。适用于个人、学术和商业用途。
为团队协作设计的轻量级ChatGPT替代品
Joia是一个为团队协作设计的轻量级ChatGPT替代品,注重隐私保护且开源。它允许用户轻松地为组织中的每个人提供AI聊天访问权限,创建特定用途的聊天机器人并与团队共享。Joia直接与OpenAI等大型语言模型提供商通过API链接,只按实际使用的令牌付费,相比ChatGPT的定价计划可节省高达75%的订阅成本。
轻量级AI代理,基于开源模型的智能助手
AIlice是一个轻量级的AI代理,旨在创建一个类似于JARVIS的自包含人工智能助手。它通过构建一个以大型语言模型(LLM)为核心的“文本计算机”来实现这一目标。AIlice在主题研究、编码、系统管理、文献综述以及超越这些基本能力的复杂混合任务方面表现出色。AIlice利用GPT-4在日常生活中的任务中达到了近乎完美的性能,并正在利用最新的开源模型迈向实际应用。
新一代开源大型语言模型,性能卓越
Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。
集成音乐能力的开源LLM
ChatMusician是一个开源的大型语言模型(LLM),它通过持续的预训练和微调,集成了音乐能力。该模型基于文本兼容的音乐表示法(ABC记谱法),将音乐视为第二语言。ChatMusician能够在不依赖外部多模态神经结构或分词器的情况下,理解和生成音乐。
通过自然语言指令实现智能图像编辑的开源技术。
MGIE(多模态大语言模型引导的编辑)是一项由苹果开源的技术,利用多模态大型语言模型(MLLMs)生成图像编辑指令,通过端到端训练,捕捉视觉想象力并执行图像处理操作,使图像编辑更加智能、直观。
AIWaves是一个AI软件公司,提供AI产品和服务。
AIWaves是一个总部位于杭州的AI初创公司,专注于将大型语言模型应用于互联网场景。公司以「实现AGI,让人类生活变得更美好」作为长期使命,以成为「全球第一的AI内容平台」为愿景,致力于重新定义未来内容创作和消费范式。公司主要产品有:对话机器人波形Bot、AI写作助手蛙蛙故事、开源工具包Agents等。这些产品可广泛应用于电商、游戏、医疗、教育等领域,为用户提供更优质的内容和服务。
在您的设备上运行和交互完整功能的开源LLM
Sanctum是一个桌面客户端应用程序,让您能够在本地设备上运行和交互完整功能的开源大型语言模型。通过Sanctum,您可以保证数据加密、安全,并且永远不会离开您的设备。它提供易于设置的解决方案,让您能够在Mac上立即运行大型语言模型而无需复杂的安装。您可以随时切换不同的开源模型以找到最适合您需求的模型,并且可以在安全和完全私密的环境中与PDF文件进行聊天、提问和总结。
统一的语言模型评估框架
PromptBench是一个基于Pytorch的Python包,用于评估大型语言模型(LLM)。它为研究人员提供了用户友好的API,以便对LLM进行评估。主要功能包括:快速模型性能评估、提示工程、对抗提示评估以及动态评估等。优势是使用简单,可以快速上手评估已有数据集和模型,也可以轻松定制自己的数据集和模型。定位为LLM评估的统一开源库。
将LLM模型打包成一个可执行文件
llamafile是一个将LLM(大型语言模型)模型及其权重打包成一个自包含可执行文件的工具。它结合了llama.cpp和Cosmopolitan Libc,可以让复杂的LLM模型被压缩成一个llamafile,无需进行任何安装和配置就可以在大多数计算机上本地运行。主要优点是使开源的LLM模型更易于开发者和终端用户访问。
医学大型语言模型套件
Meditron 是一套开源的医学大型语言模型(LLM)套件。它通过对一份经过综合筛选的医学语料库进行持续预训练,包括选定的 PubMed 论文和摘要、一份新的国际认可的医学指南数据集以及一个通用领域语料库,将 Llama-2 适应到医学领域。Meditron-70B 在相关数据上进行了微调,性能优于 Llama-2-70B、GPT-3.5 和 Flan-PaLM。
现代客服团队的首选
Chatwoot是一款开源的AI客服平台,通过AI技术提升客户支持体验,提供自助服务工具、全球搜索接口、实时聊天SDK等功能,同时支持自托管部署,符合SOC 2 Type II标准,可无缝切换不同的大型语言模型。作为Intercom、Zendesk和Salesforce Service Cloud的替代品,Chatwoot提供共享收件箱、多渠道支持、自动化、聊天机器人等功能。
开源ChatGPT插件,提升对话能力
OpenPlugin是一个开源项目,旨在通过普及ChatGPT和大型语言模型插件的使用,提供更强大的AI能力。该项目降低了使用ChatGPT插件的门槛,让更多人可以享受到插件带来的好处。OpenPlugin易于安装和使用,并且完全免费。
芯片设计领域自适应大型语言模型
ChipNeMo 是英伟达发布的一个探索将大型语言模型(LLMs)应用于工业芯片设计的项目。与直接使用现成的商业或开源 LLMs 不同,我们采用了定制的分词器、领域自适应的持续预训练、带有领域特定指令的监督微调(SFT)以及领域适应的检索模型等领域自适应技术。
首个开源聊天GPT
OpenChatKit是一个开源项目,为各种应用提供了创建专用和通用聊天机器人的强大基础。它包括指导调优的大型语言模型、自定义调优模板、可扩展的检索系统、内容过滤模型等。OpenChatKit可以处理对话、问答、分类、提取、摘要等各种自然语言任务。它基于Together、LAION和Ontocord创建的OIG-43M数据集进行训练。
开源 AI 语言模型
Llama 2 是我们的下一代开源大型语言模型,提供免费的研究和商业使用。它具有强大的功能和性能,通过与外部合作伙伴和内部团队的测试,不断提升安全性和性能。Llama 2 支持广泛的使用场景,是解决难题和推动创新的理想选择。
安全、私密、企业级对话式AI平台
Cape Privacy是一个对话式AI平台,可直接部署到您的基础架构中。它具有CapeChat和Cape API功能,可提高终端用户和开发人员的生产力。Cape Privacy允许企业在其环境中安全、私密地利用大型语言模型(LLM)的能力。平台提供了大量的企业级数据连接器,以及用于自动化业务流程的AI机器人。此外,该产品提供全面的审计、报告和可观察性功能,以支持您的法律、风险和合规要求。
提供企业级大型语言模型和预测人工智能,帮助企业提升预测能力
Wand AI是一款基于企业级大型语言模型和预测人工智能的数据管理工具。通过使用Wand AI,您可以将数据转化为AI,大大提高业务的预测能力。Wand AI提供自助式、无代码、无麻烦的操作,专为业务用户打造。您只需专注于自己的业务需求,Wand平台为您提供所需的AI解决方案。无论是销售和营销、客户成功、人力资源、风险与合规、运营、采购等领域,Wand AI都能为您提供强大的功能和优势。请访问官方网站了解更多信息。
AI预算优化工具,比较和计算大型语言模型API的最新价格。
LLM Price Check是一个在线工具,它允许用户比较和计算不同大型语言模型(LLM)API的价格,这些API由领先的提供商如OpenAI、Anthropic、Google等提供。该工具可以帮助用户优化他们的AI预算,通过比较不同模型的价格和性能,用户可以做出更明智的选择。
探索不同的文本生成模型,通过草拟消息和微调响应来提升体验。
Workers AI LLM Playground是一个在线平台,允许用户通过草拟消息和微调响应来探索不同的文本生成模型。该平台由先进的人工智能技术驱动,旨在为开发者和研究人员提供一个实验和学习的环境,以更好地理解和利用大型语言模型(LLM)的能力。
© 2024 AIbase 备案号:闽ICP备2023012347号-1