Zamba2-mini

国外精选

简介:

先进的小型语言模型,专为设备端应用设计。

功能:

在设备端环境中具有出色的推理效率和速度。

实现与2-3B参数规模的密集型变换器相当的质量。

共享变换器块允许更多的参数分配给Mamba2主干。

3万亿个令牌的预训练数据集,经过广泛过滤和去重。

具有独立的“退火”预训练阶段,以在100B高质量令牌上衰减学习率。

Mamba2块具有极高的吞吐量,是同等参数变换器块的4倍。

模型尺寸选择非常适合现代硬件上的并行化。

需求人群:

"Zamba2-mini的目标受众是寻求在设备端部署高级AI系统的研究人员、开发者和公司。它适合那些对内存容量有限制且对推理速度有高要求的环境,例如移动设备、嵌入式系统等。"

浏览量:25

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图