需求人群:
"用于语言理解、聊天、翻译、对话等任务。"
使用场景示例:
{ "scenario": "语言理解", "input": "将一段中文文本翻译成英文。", "output": "Qwen1.5展现出强大的多语言理解能力,成功将中文文本翻译成英文。" }
{ "scenario": "聊天", "input": "与Qwen1.5-72B-Chat进行一段对话。", "output": "用户与Qwen1.5-72B-Chat进行了一段对话,获得了高质量、智能的回复。" }
{ "scenario": "翻译", "input": "将一段英文文本翻译成法文。", "output": "Qwen1.5成功将英文文本翻译成了流利的法文。" }
产品特色:
开源基础和聊天模型
支持0.5B到72B多个规模
多语言支持
支持长上下文
对齐人类偏好
优化开发者体验
浏览量:2046
最新流量情况
月访问量
4314.28k
平均访问时长
00:01:08
每次访问页数
1.66
跳出率
68.45%
流量来源
直接访问
36.53%
自然搜索
41.42%
邮件
0.06%
外链引荐
15.70%
社交媒体
5.90%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
巴西
4.43%
中国
14.09%
印度
5.92%
俄罗斯
3.78%
美国
14.81%
Qwen1.5 - 开源的基础和聊天模型,支持多种规模,优化开发者体验。
Qwen1.5是Qwen系列的下一个版本,提供了基础和聊天模型的开源版本,覆盖了0.5B到72B的多个规模。支持多语言,长上下文,对齐人类偏好,并在基本能力、聊天性能、多语言理解等方面取得显著进展。
Aya Vision 32B 是一个支持多语言的视觉语言模型,适用于OCR、图像描述、视觉推理等多种用途。
Aya Vision 32B 是由 Cohere For AI 开发的先进视觉语言模型,拥有 320 亿参数,支持 23 种语言,包括英语、中文、阿拉伯语等。该模型结合了最新的多语言语言模型 Aya Expanse 32B 和 SigLIP2 视觉编码器,通过多模态适配器实现视觉与语言理解的结合。它在视觉语言领域表现出色,能够处理复杂的图像与文本任务,如 OCR、图像描述、视觉推理等。该模型的发布旨在推动多模态研究的普及,其开源权重为全球研究人员提供了强大的工具。该模型遵循 CC-BY-NC 许可证,并需遵守 Cohere For AI 的合理使用政策。
8亿参数的多语言视觉语言模型,支持OCR、图像描述、视觉推理等功能
CohereForAI的Aya Vision 8B是一个8亿参数的多语言视觉语言模型,专为多种视觉语言任务优化,支持OCR、图像描述、视觉推理、总结、问答等功能。该模型基于C4AI Command R7B语言模型,结合SigLIP2视觉编码器,支持23种语言,具有16K上下文长度。其主要优点包括多语言支持、强大的视觉理解能力以及广泛的适用场景。该模型以开源权重形式发布,旨在推动全球研究社区的发展。根据CC-BY-NC许可协议,用户需遵守C4AI的可接受使用政策。
DeepSeek API与各种流行软件的集成,帮助开发者和用户快速接入DeepSeek能力。
Awesome DeepSeek Integration是一个开源项目,旨在将DeepSeek API集成到各种流行软件中。它为开发者和用户提供了一个快速接入DeepSeek能力的平台,通过与不同软件的集成,用户可以在熟悉的环境中使用DeepSeek的强大功能。该项目完全免费,支持多种语言,具有高度的灵活性和可扩展性,能够满足不同用户的需求。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
FireRedASR-AED-L 是一个开源的工业级自动语音识别模型,专为满足高效率和高性能的语音识别需求而设计。该模型采用基于注意力的编码器-解码器架构,支持普通话、中文方言和英语等多种语言。它在公共普通话语音识别基准测试中达到了新的最高水平,并且在歌唱歌词识别方面表现出色。该模型的主要优点包括高性能、低延迟和广泛的适用性,适用于各种语音交互场景。其开源特性使得开发者可以自由地使用和修改代码,进一步推动语音识别技术的发展。
Mistral Small 24B 是一款多语言、高性能的指令微调型大型语言模型,适用于多种应用场景。
Mistral Small 24B 是一款由 Mistral AI 团队开发的大型语言模型,拥有 240 亿参数,支持多语言对话和指令处理。该模型通过指令微调,能够生成高质量的文本内容,适用于聊天、写作、编程辅助等多种场景。其主要优点包括强大的语言生成能力、多语言支持以及高效推理能力。该模型适合需要高性能语言处理的个人和企业用户,具有开源许可,支持本地部署和量化优化,适合对数据隐私有要求的场景。
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
PengChengStarling 是一个专注于多语言自动语音识别(ASR)的开源工具包,基于 icefall 项目开发。它支持完整的 ASR 流程,包括数据处理、模型训练、推理、微调和部署。该工具包通过优化参数配置和集成语言 ID 到 RNN-Transducer 架构中,显著提升了多语言 ASR 系统的性能。其主要优点包括高效的多语言支持、灵活的配置设计以及强大的推理性能。PengChengStarling 的模型在多种语言上表现出色,且模型规模较小,推理速度极快,适合需要高效语音识别的场景。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
YuE是一个开创性的开源基础模型系列,专为音乐生成设计,能够将歌词转化为完整的歌曲。它能够生成包含吸引人的主唱和配套伴奏的完整歌曲,支持多种音乐风格。该模型基于深度学习技术,具有强大的生成能力和灵活性,能够为音乐创作者提供强大的工具支持。其开源特性也使得研究人员和开发者可以在此基础上进行进一步的研究和开发。
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
Kokoro TTS是一款专注于文本转语音的AI模型,其主要功能是将文本内容转换为自然流畅的语音输出。该模型基于StyleTTS 2架构,拥有8200万参数,能够在保持高质量语音合成的同时,提供高效的性能和较低的资源消耗。其多语言支持和可定制的语音包使其能够满足不同用户在多种场景下的需求,如制作有声读物、播客、培训视频等,尤其适合教育领域,帮助提升内容的可访问性和吸引力。此外,Kokoro TTS是开源的,用户可以免费使用,这使得它在成本效益上具有显著优势。
DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型,适用于文本生成和推理任务。
DeepSeek-R1-Distill-Llama-8B 是 DeepSeek 团队开发的高性能语言模型,基于 Llama 架构并经过强化学习和蒸馏优化。该模型在推理、代码生成和多语言任务中表现出色,是开源社区中首个通过纯强化学习提升推理能力的模型。它支持商业使用,允许修改和衍生作品,适合学术研究和企业应用。
一个免费开源的简历生成器,简化简历创建、更新和分享过程。
Reactive Resume 是一个由 Amruth Pillai 开发的免费开源简历生成器,旨在帮助用户轻松创建、更新和分享简历。该项目已持续开发超过3年,具备丰富的功能和高度的灵活性。它采用 MIT 开源许可证,用户可以自由使用和修改代码,甚至可以通过 Docker 自行托管。其支持多种语言、多种简历模板和自定义功能,满足不同用户的需求。作为一款完全免费且无广告的产品,它以实用性和便捷性为主要优势,致力于帮助求职者在求职过程中脱颖而出。
这是一个基于Qwen2.5-32B模型的4位量化版本,专为高效推理和低资源部署设计。
该产品是一个基于Qwen2.5-32B的4位量化语言模型,通过GPTQ技术实现高效推理和低资源消耗。它在保持较高性能的同时,显著降低了模型的存储和计算需求,适合在资源受限的环境中使用。该模型主要面向需要高性能语言生成的应用场景,如智能客服、编程辅助、内容创作等。其开源许可和灵活的部署方式使其在商业和研究领域具有广泛的应用前景。
开源AI模型,具有7B参数和3.1T训练令牌
RWKV-6 Finch 7B World 3是一个开源的人工智能模型,拥有7B个参数,并且经过3.1万亿个多语言令牌的训练。该模型以其环保的设计理念和高性能而著称,旨在为全球用户提供高质量的开源AI模型,无论国籍、语言或经济状况如何。RWKV架构旨在减少对环境的影响,每令牌消耗的功率固定,与上下文长度无关。
1T开源多语言大型语言模型
Tele-FLM-1T是一个开源的1T多语言大型语言模型,基于解码器仅Transformer架构,经过约2T tokens的训练。该模型在规模上展现出卓越的性能,有时甚至超越了更大的模型。除了分享模型权重外,还提供了核心设计、工程实践和训练细节,期待对学术和工业社区都有所裨益。
最前沿的开源AI模型,支持多语言和高级功能。
Llama 3.1是Meta AI推出的最新一代大型语言模型,具有128K的上下文长度扩展、支持八种语言,并首次开源了405B参数级别的前沿AI模型。该模型在通用知识、可控性、数学、工具使用和多语言翻译方面具有最先进的能力,能够与最好的闭源模型相媲美。Llama 3.1的发布,将为开发者提供解锁新工作流程的工具,例如合成数据生成和模型蒸馏。
开源的多语言代码生成模型
CodeGeeX4-ALL-9B是CodeGeeX4系列模型的最新开源版本,基于GLM-4-9B持续训练,显著提升了代码生成能力。它支持代码补全、生成、代码解释、网页搜索、函数调用、代码问答等功能,覆盖软件开发的多个场景。在公共基准测试如BigCodeBench和NaturalCodeBench上表现优异,是参数少于10亿的最强代码生成模型,实现了推理速度与模型性能的最佳平衡。
自然对话场景下的文字转语音模型
ChatTTS是一个为对话场景设计的声音生成模型,特别适用于大型语言模型助手的对话任务,以及对话式音频和视频介绍等应用。它支持中英文,通过使用约10万小时的中英文数据训练,展现出高质量和自然度的语音合成能力。
多语言AI模型,支持101种语言。
Aya是由Cohere For AI领导的全球性倡议,涉及119个国家的3000多名独立研究人员。Aya是一个尖端模型和数据集,通过开放科学推进101种语言的多语言AI。Aya模型能够理解并按照101种语言的指令执行任务,是迄今为止最大的开放科学机器学习项目之一,重新定义了研究领域,通过与全球独立研究人员合作,实现了完全开源的数据集和模型。
Falcon 2 是一款开源、多语言、多模态的模型,具备图像到文本转换能力。
Falcon 2 是一款具有创新功能的生成式 AI 模型,为我们创造了一种充满可能性的未来路径,只有想象力才是限制。Falcon 2 采用开源许可证,具备多语言和多模态的能力,其中独特的图像到文本转换功能标志着 AI 创新的重大进展。
一键翻译各类图片内文字
该项目可以将漫画/图片中的文字进行翻译,主要功能包括文本检测、光学字符识别(OCR)、机器翻译和图像修补。它支持多种语言如日语、中文、英语和韩语等,可实现近乎完美的翻译效果。该项目主要面向漫画爱好者和图像处理工作者,可以方便地阅读外语漫画或进行图像的多语言处理。此外,它还提供Web服务、在线演示和命令行工具等多种使用方式,具有良好的可用性。该项目代码开源,欢迎大家一起完善和贡献。
下一代开源和双语大型语言模型
Yi-9B是01.AI研发的下一代开源双语大型语言模型系列之一。训练数据量达3T,展现出强大的语言理解、常识推理、阅读理解等能力。在代码、数学、常识推理和阅读理解等方面表现卓越,是同尺寸开源模型中的佼佼者。适用于个人、学术和商业用途。
一个强大的文本生成模型,适用于多种对话应用。
DeepSeek-V3-0324 是一个先进的文本生成模型,具有 685 亿参数,采用 BF16 和 F32 张量类型,能够支持高效的推理和文本生成。该模型的主要优点在于其强大的生成能力和开放源码的特性,使其可以被广泛应用于多种自然语言处理任务。该模型的定位是为开发者和研究人员提供一个强大的工具,帮助他们在文本生成领域取得突破。
通过强化学习驱动的金融推理大模型。
Fin-R1 是一个专为金融领域设计的大型语言模型,旨在提升金融推理能力。由上海财经大学和财跃星辰联合研发,基于 Qwen2.5-7B-Instruct 进行微调和强化学习,具有高效的金融推理能力,适用于银行、证券等核心金融场景。该模型免费开源,便于用户使用和改进。
生成高质量 SVG 代码的基础模型。
StarVector 是一个先进的生成模型,旨在将图像和文本指令转化为高质量的可缩放矢量图形(SVG)代码。其主要优点在于能够处理复杂的 SVG 元素,并在各种图形风格和复杂性上表现出色。作为开放源代码资源,StarVector 推动了图形设计的创新和效率,适用于设计、插图和技术文档等多种应用场景。
Roblox Foundation Model for 3D Intelligence。
Cube 是一个强大的 3D 智能生成模型,旨在帮助开发者在 Roblox 平台上创建各种 3D 资产和场景。该模型具备生成 3D 对象、角色动画绑定及程序脚本生成等功能。它的出现将极大地提升创作者的生产效率,激发更多的创意,帮助用户以更快的速度构建出丰富的 3D 体验。当前版本已经开放源代码,旨在与研究社区共享,以推进 3D 智能的发展。适用于各种规模的开发者和创作者,支持实验与创新,推动负责任的使用。
一款 21B 通用推理模型,适合低延迟应用。
Reka Flash 3 是一款从零开始训练的 21 亿参数的通用推理模型,利用合成和公共数据集进行监督微调,结合基于模型和基于规则的奖励进行强化学习。该模型在低延迟和设备端部署应用中表现优异,具有较强的研究能力。它目前是同类开源模型中的最佳选择,适合于各种自然语言处理任务和应用场景。
通过训练您的 AI 自我,增强个性,连接世界。
Second Me 是一个开源原型,旨在让用户创造自己的 AI 自我,保留个人特点,并在数字世界中扩展自我。它使用分层记忆建模和用户对齐算法,确保用户数据本地存储且完全私密。这种形式的 AI 不仅帮助用户管理信息,还能与全球网络中的其他 AI 进行交互,从而促进创造力和协作。Second Me 的主要优点在于它保护用户的隐私,让用户真正掌控自己的数字身份,适合技术爱好者、AI 专家和各领域专业人士。此产品当前处于开发阶段,用户可以在 GitHub 上获取最新版本。
LG AI 推出的开源推理 AI 模型,具备卓越的推理能力。
EXAONE Deep 是 LG AI Research 推出的先进推理 AI 模型,标志着韩国在全球 AI 市场中的竞争力。它具备 32 亿参数,表现卓越,尤其在数学和科学问题解决方面展现出色。该模型的发布使得 LG 在 AI 领域迈入了自主决策的时代,其开源特性使得更多开发者能够利用这一技术进行研究与开发。EXAONE Deep 的轻量级和在设备上的模型设计使得其适用于多个行业,包括教育、科学研究、编程等。
© 2025 AIbase 备案号:闽ICP备08105208号-14