Mistral-Nemo-Base-2407

简介:

12B参数的大型语言模型

功能:

支持多种语言和代码数据的文本生成

128k上下文窗口训练,提升文本理解和生成能力

预训练和指令版本,满足不同应用需求

Apache 2.0许可证发布,使用灵活

模型架构包括40层、5120维、128头维,优化模型性能

在多个基准测试中表现出色,如HellaSwag、Winogrande等

支持多种框架使用,如mistral_inference、transformers、NeMo

需求人群:

"Mistral-Nemo-Base-2407模型适合需要进行高质量文本生成的开发者和研究人员。其多语言和代码数据训练能力使其在多语言文本生成、代码生成等领域具有优势。同时,其预训练和指令版本的特性也使其在自然语言处理任务中具有广泛的应用前景。"

浏览量:38

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图