CogAgent-9B-20241220是基于视觉语言模型的GUI代理模型。
CogAgent-9B-20241220模型基于GLM-4V-9B双语开源VLM基础模型,通过数据收集和优化、多阶段训练以及策略改进,在GUI感知、推理预测准确性、动作空间完整性和任务泛化性方面取得了显著进步。该模型支持双语(中文和英文)交互,并能处理屏幕截图和语言输入。此版本已应用于ZhipuAI的GLM-PC产品中,旨在帮助研究人员和开发者推进基于视觉语言模型的GUI代理的研究和应用。
LG AI Research开发的双语文本生成模型
EXAONE-3.5-2.4B-Instruct-AWQ是由LG AI Research开发的一系列双语(英语和韩语)指令调优生成模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并且在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与近期发布的类似大小模型相比,在通用领域保持竞争力。该模型在部署到小型或资源受限设备上进行了优化,并且采用了AWQ量化技术,实现了4位群组权重量化(W4A16g128)。
LG AI Research开发的32B参数双语生成模型
EXAONE-3.5-32B-Instruct是由LG AI Research开发的一系列指令调优的双语(英语和韩语)生成模型,包含从2.4B到32B参数的不同模型。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出了最先进的性能,同时在与近期发布的类似大小模型相比时,在通用领域也保持了竞争力。
LG AI Research开发的多语言生成模型
EXAONE-3.5-7.8B-Instruct是由LG AI Research开发的一系列指令调优的双语(英语和韩语)生成模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与近期发布的类似大小模型相比,在通用领域保持竞争力。
LG AI Research开发的双语文本生成模型
EXAONE-3.5-2.4B-Instruct-GGUF是由LG AI Research开发的一系列双语(英语和韩语)指令调优的生成型模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与近期发布的类似大小模型相比,在通用领域保持竞争力。该模型的重要性在于其优化了在小型或资源受限设备上的部署,同时提供了强大的性能。
PDF 科学论文翻译与双语对比工具
基于 Python 开发,遵循 AGPL-3.0 开源许可证。可对 PDF 科学论文全文双语翻译,保留公式图表和目录结构,支持多种翻译服务。它支持多种翻译服务,如Google、DeepL、Ollama和OpenAI,使用户能够根据需要选择合适的翻译服务。该工具的主要优点在于它能够在翻译过程中完整保留PDF的排版,这对于学术研究和文档翻译尤为重要。
世界领先的数学开源大语言模型
Qwen2.5-Math是一系列专门针对数学问题设计的开源大语言模型,包括基础模型和指令微调模型,支持中英双语,能够通过思维链(CoT)和工具集成推理(TIR)方式解决数学问题。该模型在多个数学基准测试中表现优异,特别是在精确计算和算法操作方面。Qwen2.5-Math的开发背景是提升大语言模型在数学领域的应用能力,推动数学教育和研究的发展。
7.8亿参数的双语生成模型
EXAONE-3.0-7.8B-Instruct是LG AI Research开发的一款具有7.8亿参数的双语(英语和韩语)预训练生成模型。模型通过8T的精选token进行预训练,并经过监督式微调和直接偏好优化进行后训练,展现出与同类大小的开放模型相比极具竞争力的基准性能。
70亿参数的中英双语对话模型
Llama3.1-70B-Chinese-Chat 是基于 Meta-Llama-3.1-70B-Instruct 模型的指令调优语言模型,专为中英双语用户设计,具备角色扮演和工具使用等多样化能力。该模型通过 ORPO 算法进行微调,显著减少了中文问题用英文回答以及回答中中英文混合的问题,特别是在角色扮演、功能调用和数学能力方面有显著提升。
智能双语翻译,助力词汇记忆
Relingo是一款专注于提升用户英语词汇记忆能力的教育类APP。它通过在用户阅读和观看视频时自动高亮生词并提供翻译,帮助用户在感兴趣的内容中轻松积累单词。产品支持多种语言,包括中文、英文、日文等,覆盖了全文翻译、视频双语字幕、PDF阅读等多种场景,使用户在沉浸式翻译中提升语言能力。
AI驱动的沉浸式浏览器,提供双语对照浏览。
Starry 是一款由 AI 驱动的浏览器,致力于让用户轻松浏览外文网页,消除干扰元素,提供更流畅的浏览体验。它通过双语对照浏览功能,让用户无障碍地浏览互联网外文内容,并在浏览过程中以对照的方式学习外文。AI翻译能力贴近原文表达,摆脱传统机翻困扰。
基于潜在扩散模型的大规模文本到图像生成模型
Kolors是由快手Kolors团队开发的大规模文本到图像生成模型,基于潜在扩散模型,训练于数十亿文本-图像对。它在视觉质量、复杂语义准确性以及中英文文本渲染方面,均优于开源和闭源模型。Kolors支持中英文输入,尤其在理解及生成中文特定内容方面表现突出。
AI赋能心理咨询,提升咨询效率与质量。
Therapartners是一款专注于心理咨询领域的AI技术产品。它通过提供AI咨询转录、AI咨询总结、AI逐字稿分析和AI在线Partner等服务,帮助咨询师更高效、更精准地进行心理咨询工作。产品利用AI大模型技术,结合全球心理咨询行业知识库,为咨询师提供实时反馈和深度见解,同时支持中英双语,极大地提升了咨询整理效率,赋能咨询师专注于提供更高质量的心理咨询服务。
多分辨率扩散变换器,支持中英文理解
HunyuanDiT-v1.1是由腾讯Hunyuan团队开发的一款多分辨率扩散变换模型,它具备精细的中英文理解能力。该模型通过精心设计的变换器结构、文本编码器和位置编码,结合从头开始构建的完整数据管道,实现数据的迭代优化。HunyuanDiT-v1.1能够执行多轮多模态对话,根据上下文生成和细化图像。经过50多名专业人类评估员的全面评估,HunyuanDiT-v1.1在中文到图像生成方面与其他开源模型相比,达到了新的最先进水平。
一键双语阅读,AI助力语言障碍突破。
BiRead是一款基于AI技术的Chrome浏览器插件,它能够将任何网站内容转换成双语文本,使用户能够轻松阅读其他语言的内容。它支持100多种语言,通过Google Translate和AI技术提供高质量的翻译服务,帮助用户克服语言障碍,探索全球信息。
开源多模态预训练模型,具备中英双语对话能力。
GLM-4V-9B是智谱AI推出的新一代预训练模型,支持1120*1120高分辨率下的中英双语多轮对话,以及视觉理解能力。在多模态评测中,GLM-4V-9B展现出超越GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max和Claude 3 Opus的卓越性能。
双语开源数学推理大型语言模型。
InternLM-Math-Plus 是一个最新的双语(英文和中文)开源大型语言模型(LLM),专注于数学推理,具有解决、证明、验证和增强数学问题的能力。它在非正式数学推理(如思维链和代码解释)和正式数学推理(如LEAN 4翻译和证明)方面都有显著的性能提升。
© 2025 AIbase 备案号:闽ICP备08105208号-14