Qwen1.5-110B

中文精选

简介:

Qwen1.5系列首个千亿参数开源模型,多语言支持,高效Transformer解码器架构。

功能:

包含分组查询注意力(GQA),提升模型推理效率

支持32K tokens的上下文长度,适合处理长文本

多语言支持,包括英、中、法、西、德、俄、日、韩、越、阿等多种语言

在基础语言模型评估中与Meta-Llama3-70B相媲美

在Chat评估中表现出色,显著优于72B模型

支持在多个框架上使用,如transformers、llama.cpp等

性能提升主要来自于增加模型规模,而非预训练方法的大幅改变

需求人群:

["适合需要处理长文本和多语言的开发者和研究人员","适用于需要高效模型推理的商业应用场景","对于追求最新技术进展的AI社区成员,提供了一个强大的研究和实验平台","模型的多语言特性使其成为国际化应用开发的理想选择"]

浏览量:95

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图