开源的手机端 GUI 智能代理,支持中英文应用操作。
AgentCPM-GUI 是一款开源的手机端大型语言模型(LLM)代理,专为操作中英文应用程序而设计,能够根据用户的屏幕截图自动执行任务。其主要优点在于高效的 GUI 元素理解、增强的推理能力以及对中文应用的精准支持。此技术的开发背景是为了提升移动设备上智能代理的用户体验,特别是在复杂任务处理方面。该产品定位于提高移动端的生产力,适用于各类用户。
Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型,支持中英文语音合成。
Llasa-1B 是一个由香港科技大学音频实验室开发的文本转语音模型。它基于 LLaMA 架构,通过结合 XCodec2 代码本中的语音标记,能够将文本转换为自然流畅的语音。该模型在 25 万小时的中英文语音数据上进行了训练,支持从纯文本生成语音,也可以利用给定的语音提示进行合成。其主要优点是能够生成高质量的多语言语音,适用于多种语音合成场景,如有声读物、语音助手等。该模型采用 CC BY-NC-ND 4.0 许可证,禁止商业用途。
Llasa-3B 是一个基于 LLaMA 的文本到语音合成模型,支持中英文语音生成。
Llasa-3B 是一个强大的文本到语音(TTS)模型,基于 LLaMA 架构开发,专注于中英文语音合成。该模型通过结合 XCodec2 的语音编码技术,能够将文本高效地转换为自然流畅的语音。其主要优点包括高质量的语音输出、支持多语言合成以及灵活的语音提示功能。该模型适用于需要语音合成的多种场景,如有声读物制作、语音助手开发等。其开源性质也使得开发者可以自由探索和扩展其功能。
医疗领域先进的大型语言模型
HuatuoGPT-o1-70B是由FreedomIntelligence开发的医疗领域大型语言模型(LLM),专为复杂的医疗推理设计。该模型在提供最终响应之前,会生成一个复杂的思考过程,反映并完善其推理。HuatuoGPT-o1-70B能够处理复杂的医疗问题,提供深思熟虑的答案,这对于提高医疗决策的质量和效率至关重要。该模型基于LLaMA-3.1-70B架构,支持英文,并且可以部署在多种工具上,如vllm或Sglang,或者直接进行推理。
医疗领域大型语言模型,用于高级医疗推理
HuatuoGPT-o1-7B是由FreedomIntelligence开发的医疗领域大型语言模型(LLM),专为高级医疗推理设计。该模型在提供最终回答之前,会生成复杂的思考过程,反映并完善其推理。HuatuoGPT-o1-7B支持中英文,能够处理复杂的医疗问题,并以'思考-回答'的格式输出结果,这对于提高医疗决策的透明度和可靠性至关重要。该模型基于Qwen2.5-7B,经过特殊训练以适应医疗领域的需求。
高性能的英文学术基准语言模型
OLMo 2 13B是由Allen Institute for AI (Ai2)开发的一款基于Transformer的自回归语言模型,专注于英文学术基准测试。该模型在训练过程中使用了高达5万亿个token,展现出与同等规模的全开放模型相媲美或更优的性能,并在英语学术基准上与Meta和Mistral的开放权重模型竞争。OLMo 2 13B的发布包括所有代码、检查点、日志和相关的训练细节,旨在推动语言模型的科学研究。
日常电脑可用的免费万字长文写作软件
爱享写作是一款基于最新AI大语言模型技术开发的桌面客户端软件,支持中英文写作,无需GPU显卡和配置复杂的Python环境。它能够在日常电脑上快速生成万字长文,具有生成速度快、安装使用简单、硬件要求低等特点。该软件的背景是利用人工智能技术提高写作效率,降低技术门槛,让更多人能够便捷地使用AI技术进行创作。爱享写作是免费软件,定位于日常写作和内容创作者,帮助他们快速产出高质量的文本内容。
端到端中英语音对话模型
GLM-4-Voice是由清华大学团队开发的端到端语音模型,能够直接理解和生成中英文语音,进行实时语音对话。它通过先进的语音识别和合成技术,实现了语音到文本再到语音的无缝转换,具备低延迟和高智商的对话能力。该模型在语音模态下的智商和合成表现力上进行了优化,适用于需要实时语音交互的场景。
AI英语写作助手,提升非母语者的写作水平。
Engram是一款专为非英语母语者设计的AI英语写作工具,提供语法检查、改写润色和翻译等功能。它通过学习非母语者的真实错误,提供自然听起来的写作建议。Engram的用户界面简洁,操作便捷,支持一键校对、改写和翻译,无需复制粘贴,减少干扰,提高写作效率。Engram的主要优点包括:提升写作水平,节省时间,不牺牲质量,用户友好,适用于不同风格的写作需求。
一款专为中英文用户定制的指令式语言模型。
Llama3.1-8B-Chinese-Chat是一个基于Meta-Llama-3.1-8B-Instruct模型的指令式调优语言模型,专为中文和英文用户设计,具有角色扮演和工具使用等多种能力。该模型通过ORPO算法进行微调,显著减少了中文问题用英文回答和回答中中英文混合的问题,特别是在角色扮演、功能调用和数学能力方面有显著提升。
基于潜在扩散模型的大规模文本到图像生成模型
Kolors是由快手Kolors团队开发的大规模文本到图像生成模型,基于潜在扩散模型,训练于数十亿文本-图像对。它在视觉质量、复杂语义准确性以及中英文文本渲染方面,均优于开源和闭源模型。Kolors支持中英文输入,尤其在理解及生成中文特定内容方面表现突出。
首个面向中英文用户的指令调优语言模型
Gemma-2-27B-Chinese-Chat是基于google/gemma-2-27b-it的首个指令调优语言模型,专为中英文用户设计,拥有角色扮演和工具使用等多种能力。该模型通过ORPO算法进行微调,显著提升了在中英文对话、角色扮演和数学计算等方面的性能。
基于19亿参数的对话生成模型
Index-1.9B-Chat是一个基于19亿参数的对话生成模型,它通过SFT和DPO对齐技术,结合RAG实现fewshots角色扮演定制,具有较高的对话趣味性和定制性。该模型在2.8T中英文为主的语料上预训练,并且在多个评测基准上表现领先。
多分辨率扩散变换器,支持中英文理解
HunyuanDiT-v1.1是由腾讯Hunyuan团队开发的一款多分辨率扩散变换模型,它具备精细的中英文理解能力。该模型通过精心设计的变换器结构、文本编码器和位置编码,结合从头开始构建的完整数据管道,实现数据的迭代优化。HunyuanDiT-v1.1能够执行多轮多模态对话,根据上下文生成和细化图像。经过50多名专业人类评估员的全面评估,HunyuanDiT-v1.1在中文到图像生成方面与其他开源模型相比,达到了新的最先进水平。
一款开源大型语言模型,适用于中英文
MediaTek Research发布了名为MR Breeze-7B的新开源大型语言模型,拥有70亿参数,擅长处理中英文。相比先前的BLOOM-3B,MR Breeze-7B吸收了20倍的知识,使其能够精准处理传统中文语言的文化和语言细微差别。优化后,MR Breeze-7B在处理速度上胜过其他模型,为用户带来更流畅的体验。定价免费。
英文写作助手,提供语法和拼写检查
Ginger是一款AI语法与拼写检查插件,能够帮助用户提升英文写作能力。它具有智能上下文语法和拼写检查、基于AI的同义词替换、句子重组等功能。无论是商务信函、学术文件还是社交写作,Ginger都能帮助用户改进写作并增加自信。Ginger还提供词典、翻译等功能,支持多个网站。
修复您的网页首页英文介绍,无需花费大量时间研究
Dittto是一个AI辅助工具,旨在帮助您优化网页首页英文介绍,提高转化率。它提供了网站定位审核、品牌声音推荐、AI生成英雄文案等功能,帮助您快速创建出令人满意的英文介绍。Dittto还提供了保存变体、A/B测试等功能,让您能够更好地管理和优化您的网页首页英文介绍。Dittto的AI模型经过训练,能够理解您公司的独特定位,并不断自我改进,使生成的文案更加精准。您可以免费试用Dittto,开始优化您的网页首页英文介绍。
© 2025 AIbase 备案号:闽ICP备08105208号-14