Nemotron-4-340B-Instruct

优质新品

简介:

NVIDIA的高级语言模型,优化于英文对话场景。

功能:

支持4096个token的上下文长度,适用于长文本处理。

经过SFT、DPO和RPO等对齐步骤,优化了对话和指令遵循能力。

能够生成高质量的合成数据,助力开发者构建自己的LLM。

使用了Grouped-Query Attention (GQA)和Rotary Position Embeddings (RoPE)技术。

支持NeMo Framework的定制工具,包括参数高效微调和模型对齐。

在多种评估基准上表现优异,如MT-Bench、IFEval、MMLU等。

需求人群:

"Nemotron-4-340B-Instruct模型面向需要构建或定制大型语言模型的开发者和企业。它特别适合于那些需要在英文对话、数学推理、编程指导等领域应用AI技术的用户。"

浏览量:31

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图