开源的手机端 GUI 智能代理,支持中英文应用操作。
AgentCPM-GUI 是一款开源的手机端大型语言模型(LLM)代理,专为操作中英文应用程序而设计,能够根据用户的屏幕截图自动执行任务。其主要优点在于高效的 GUI 元素理解、增强的推理能力以及对中文应用的精准支持。此技术的开发背景是为了提升移动设备上智能代理的用户体验,特别是在复杂任务处理方面。该产品定位于提高移动端的生产力,适用于各类用户。
Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型,支持中英文语音合成。
Llasa-1B 是一个由香港科技大学音频实验室开发的文本转语音模型。它基于 LLaMA 架构,通过结合 XCodec2 代码本中的语音标记,能够将文本转换为自然流畅的语音。该模型在 25 万小时的中英文语音数据上进行了训练,支持从纯文本生成语音,也可以利用给定的语音提示进行合成。其主要优点是能够生成高质量的多语言语音,适用于多种语音合成场景,如有声读物、语音助手等。该模型采用 CC BY-NC-ND 4.0 许可证,禁止商业用途。
Llasa-3B 是一个基于 LLaMA 的文本到语音合成模型,支持中英文语音生成。
Llasa-3B 是一个强大的文本到语音(TTS)模型,基于 LLaMA 架构开发,专注于中英文语音合成。该模型通过结合 XCodec2 的语音编码技术,能够将文本高效地转换为自然流畅的语音。其主要优点包括高质量的语音输出、支持多语言合成以及灵活的语音提示功能。该模型适用于需要语音合成的多种场景,如有声读物制作、语音助手开发等。其开源性质也使得开发者可以自由探索和扩展其功能。
医疗领域大型语言模型,用于高级医疗推理
HuatuoGPT-o1-7B是由FreedomIntelligence开发的医疗领域大型语言模型(LLM),专为高级医疗推理设计。该模型在提供最终回答之前,会生成复杂的思考过程,反映并完善其推理。HuatuoGPT-o1-7B支持中英文,能够处理复杂的医疗问题,并以'思考-回答'的格式输出结果,这对于提高医疗决策的透明度和可靠性至关重要。该模型基于Qwen2.5-7B,经过特殊训练以适应医疗领域的需求。
CogAgent-9B-20241220是基于视觉语言模型的GUI代理模型。
CogAgent-9B-20241220模型基于GLM-4V-9B双语开源VLM基础模型,通过数据收集和优化、多阶段训练以及策略改进,在GUI感知、推理预测准确性、动作空间完整性和任务泛化性方面取得了显著进步。该模型支持双语(中文和英文)交互,并能处理屏幕截图和语言输入。此版本已应用于ZhipuAI的GLM-PC产品中,旨在帮助研究人员和开发者推进基于视觉语言模型的GUI代理的研究和应用。
LG AI Research开发的双语文本生成模型
EXAONE-3.5-2.4B-Instruct-AWQ是由LG AI Research开发的一系列双语(英语和韩语)指令调优生成模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并且在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与近期发布的类似大小模型相比,在通用领域保持竞争力。该模型在部署到小型或资源受限设备上进行了优化,并且采用了AWQ量化技术,实现了4位群组权重量化(W4A16g128)。
LG AI Research开发的32B参数双语生成模型
EXAONE-3.5-32B-Instruct是由LG AI Research开发的一系列指令调优的双语(英语和韩语)生成模型,包含从2.4B到32B参数的不同模型。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出了最先进的性能,同时在与近期发布的类似大小模型相比时,在通用领域也保持了竞争力。
LG AI Research开发的多语言生成模型
EXAONE-3.5-7.8B-Instruct是由LG AI Research开发的一系列指令调优的双语(英语和韩语)生成模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与近期发布的类似大小模型相比,在通用领域保持竞争力。
LG AI Research开发的双语文本生成模型
EXAONE-3.5-2.4B-Instruct-GGUF是由LG AI Research开发的一系列双语(英语和韩语)指令调优的生成型模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与近期发布的类似大小模型相比,在通用领域保持竞争力。该模型的重要性在于其优化了在小型或资源受限设备上的部署,同时提供了强大的性能。
PDF 科学论文翻译与双语对比工具
基于 Python 开发,遵循 AGPL-3.0 开源许可证。可对 PDF 科学论文全文双语翻译,保留公式图表和目录结构,支持多种翻译服务。它支持多种翻译服务,如Google、DeepL、Ollama和OpenAI,使用户能够根据需要选择合适的翻译服务。该工具的主要优点在于它能够在翻译过程中完整保留PDF的排版,这对于学术研究和文档翻译尤为重要。
日常电脑可用的免费万字长文写作软件
爱享写作是一款基于最新AI大语言模型技术开发的桌面客户端软件,支持中英文写作,无需GPU显卡和配置复杂的Python环境。它能够在日常电脑上快速生成万字长文,具有生成速度快、安装使用简单、硬件要求低等特点。该软件的背景是利用人工智能技术提高写作效率,降低技术门槛,让更多人能够便捷地使用AI技术进行创作。爱享写作是免费软件,定位于日常写作和内容创作者,帮助他们快速产出高质量的文本内容。
端到端中英语音对话模型
GLM-4-Voice是由清华大学团队开发的端到端语音模型,能够直接理解和生成中英文语音,进行实时语音对话。它通过先进的语音识别和合成技术,实现了语音到文本再到语音的无缝转换,具备低延迟和高智商的对话能力。该模型在语音模态下的智商和合成表现力上进行了优化,适用于需要实时语音交互的场景。
世界领先的数学开源大语言模型
Qwen2.5-Math是一系列专门针对数学问题设计的开源大语言模型,包括基础模型和指令微调模型,支持中英双语,能够通过思维链(CoT)和工具集成推理(TIR)方式解决数学问题。该模型在多个数学基准测试中表现优异,特别是在精确计算和算法操作方面。Qwen2.5-Math的开发背景是提升大语言模型在数学领域的应用能力,推动数学教育和研究的发展。
7.8亿参数的双语生成模型
EXAONE-3.0-7.8B-Instruct是LG AI Research开发的一款具有7.8亿参数的双语(英语和韩语)预训练生成模型。模型通过8T的精选token进行预训练,并经过监督式微调和直接偏好优化进行后训练,展现出与同类大小的开放模型相比极具竞争力的基准性能。
一款专为中英文用户定制的指令式语言模型。
Llama3.1-8B-Chinese-Chat是一个基于Meta-Llama-3.1-8B-Instruct模型的指令式调优语言模型,专为中文和英文用户设计,具有角色扮演和工具使用等多种能力。该模型通过ORPO算法进行微调,显著减少了中文问题用英文回答和回答中中英文混合的问题,特别是在角色扮演、功能调用和数学能力方面有显著提升。
70亿参数的中英双语对话模型
Llama3.1-70B-Chinese-Chat 是基于 Meta-Llama-3.1-70B-Instruct 模型的指令调优语言模型,专为中英双语用户设计,具备角色扮演和工具使用等多样化能力。该模型通过 ORPO 算法进行微调,显著减少了中文问题用英文回答以及回答中中英文混合的问题,特别是在角色扮演、功能调用和数学能力方面有显著提升。
智能双语翻译,助力词汇记忆
Relingo是一款专注于提升用户英语词汇记忆能力的教育类APP。它通过在用户阅读和观看视频时自动高亮生词并提供翻译,帮助用户在感兴趣的内容中轻松积累单词。产品支持多种语言,包括中文、英文、日文等,覆盖了全文翻译、视频双语字幕、PDF阅读等多种场景,使用户在沉浸式翻译中提升语言能力。
© 2025 AIbase 备案号:闽ICP备08105208号-14