DeepSeek-V2-Chat

简介:

一款高效经济的语言模型,具有强大的专家混合特性。

功能:

具有236B总参数,激活每个token的21B参数

节省42.5%的训练成本,减少93.3%的KV缓存

最大生成吞吐量提升至5.76倍

在8.1万亿token的高质量语料库上进行预训练

通过SFT和RL进一步优化模型性能

在标准基准测试和开放式生成评估中表现优异

支持商业使用,提供API平台和本地运行指南

需求人群:

["适用于需要高效语言模型的企业和开发者","适合进行大规模文本生成和处理的任务","适用于需要优化成本同时追求高性能的场景","为用户提供了强大的文本生成和对话能力"]

浏览量:472

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图