简介:

构建和训练大型语言模型的综合框架

功能:

提供超过300T未过滤的CommonCrawl语料库

基于open_lm框架提供有效的预训练配方

提供超过50种评估方法来评估模型性能

支持从411M到7B参数模型的不同计算规模

允许研究人员实验不同的数据集构建策略

通过优化数据集设计提高模型性能

需求人群:

"DCLM 面向需要构建和训练大型语言模型的研究人员和开发者,特别是那些寻求通过优化数据集设计来提升模型性能的专业人士。它适用于需要处理大规模数据集并希望在不同计算规模上进行实验的场景。"

浏览量:14

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图