一站式大模型微调平台,支持多种主流模型。
LLaMA-Factory Online 是与明星开源项目 LLaMA-Factory 官方合作打造的在线大模型训练与微调服务平台。我们致力于为工程能力较为基础或希望为微调过程提效的用户群体,提供开箱即用、低代码、全链路功能覆盖的大模型训练与微调服务。
由中国电信人工智能研究院研发的语言模型。
星辰语义大模型 - TeleChat3 是一款由中国电信人工智能研究院开发的高性能大语言模型,专注于自然语言处理任务。该模型基于国产算力训练,具有强大的推理和微调能力,适合各类应用场景。产品致力于为开发者提供高效、灵活的 AI 解决方案,特别是在知识、创作、指令、代码等多个维度展示出色的性能。
与LLaMA-Factory官方合作,一站式低代码大模型微调平台,支持超百种模型。
LLaMA-Factory Online是与明星开源项目LLaMA Factory官方合作打造的在线大模型训练与微调服务平台。其底层提供高性能、高弹性GPU算力资源,定位为具有微调需求、编码与工程能力较为基础的用户群体,提供开箱即用、低代码、全链路功能覆盖的大模型训练与微调服务。该平台具有权威、系统的使用指南和精选的真实场景案例。价格方面,采用秒级计费,任务仅在运行态计费,不用不扣费,还设有高性能GPU限时超低价等优惠活动。其重要性在于降低了大模型微调的技术门槛和经济门槛,让更多用户能够参与到大模型的训练与微调中。
Dex将浏览器变为AI工作空间,了解任务与上下文,推动工作进展
Dex是一款Chrome扩展程序,由ThirdLayer公司开发。它把浏览器转变成智能工作空间,可跨多个应用和标签处理任务,能记住用户偏好和上下文,更好地辅助各项任务。该产品具有隐私性,用户可通过精细权限控制数据。它提供免费计划,还有专业版、商业版和企业版等高级版本,适用于知识工作者和专业人士。
Google DeepMind旗舰多模态AI,1M上下文,具备博士级推理与高级编码能力
Gemini 3 Pro是Google DeepMind基于Transformer架构构建的多模态基础模型。其重要性在于为各领域提供强大的AI支持,能处理多种类型的输入和输出。主要优点包括博士级推理能力、100万输入token的长上下文处理、多模态深度理解、智能编码和动态思维等。产品背景是Google为满足复杂任务需求而研发。价格方面,API输入2美元/100万token,输出12美元/100万token(≤200k token多模态价格不同),Google AI Plus月费19.99美元可获得应用和Workspace试用机会。定位是用于代理任务和“氛围编码”等复杂智能任务的高端模型。
Kat Dev是专为软件工程和编码任务打造的大语言模型,助力AI编码。
Kat Dev是快手Kwaipilot团队开发的AI代码智能解决方案,是专注于软件工程和编码任务的大语言模型家族。其重要性在于为开发者提供强大的代码生成、优化等能力,提升开发效率。主要优点包括高性能,如KAT Dev 72B Exp在SWE Bench基准测试中达到74.6分排名第一;采用先进的多阶段代理训练;支持多语言代码;模型开源,采用Apache 2.0许可证,方便社区使用和研究,开发者可免费访问。该产品定位为服务现代开发者和团队,推动AI驱动的软件开发。
Fogsight 是一款由大型语言模型驱动的动画引擎。
Fogsight 是一款创新的动画引擎,利用大型语言模型生成生动的动画。它不仅支持多种语言,还能根据用户的输入生成高水平的叙事动画,适用于教育、娱乐和创意领域。Fogsight 注重用户体验,允许通过简单的界面与 AI 进行交互,快速生成所需的动画内容。
面向大模型的智能解决方案平台,自动优化多任务。
PromptPilot 是一个智能解决方案平台,专注于大模型的优化和用户任务意图的实现。通过交互反馈,该平台能够自动优化多步骤、多模态和多场景的任务,为用户提供高效的智能解决方案,适合企业和个人用户提升工作效率和任务完成质量。
使用微信聊天记录微调大语言模型,实现高质量声音克隆。
WeClone 是一个基于微信聊天记录微调大语言模型的项目,主要用于实现高质量的声音克隆和数字分身。它结合了微信语音消息和 0.5B 大模型,允许用户通过聊天机器人与自己的数字分身互动。该技术在数字永生和声音克隆领域具有重要的应用价值,可以让用户在不在场的情况下继续与他人交流。此项目正在快速迭代中,适合对 AI 和语言模型感兴趣的用户,且目前处于免费的开发阶段。
Dream 7B 是最强大的开放扩散大语言模型。
Dream 7B 是由香港大学 NLP 组和华为诺亚方舟实验室联合推出的最新扩散大语言模型。它在文本生成领域展现了优异的性能,特别是在复杂推理、长期规划和上下文连贯性等方面。该模型采用了先进的训练方法,具有强大的计划能力和灵活的推理能力,为各类 AI 应用提供了更为强大的支持。
NotaGen 是一个用于符号音乐生成的模型,采用大语言模型训练范式,专注于生成高质量古典乐谱。
NotaGen 是一款创新的符号音乐生成模型,通过预训练、微调和强化学习三个阶段提升音乐生成质量。它利用大语言模型技术,能够生成高质量的古典乐谱,为音乐创作带来新的可能性。该模型的主要优点包括高效生成、风格多样和高质量输出。它适用于音乐创作、教育和研究等领域,具有广泛的应用前景。
Atom of Thoughts (AoT) 是一种用于提升大语言模型推理性能的框架。
Atom of Thoughts (AoT) 是一种新型推理框架,通过将解决方案表示为原子问题的组合,将推理过程转化为马尔可夫过程。该框架通过分解和收缩机制,显著提升了大语言模型在推理任务上的性能,同时减少了计算资源的浪费。AoT 不仅可以作为独立的推理方法,还可以作为现有测试时扩展方法的插件,灵活结合不同方法的优势。该框架开源且基于 Python 实现,适合研究人员和开发者在自然语言处理和大语言模型领域进行实验和应用。
基于大模型 RAG 知识库的知识图谱问答系统,支持多种大模型适配和本地部署。
语析Yuxi-Know 是一个基于大模型 RAG 知识库的知识图谱问答系统,采用 Llamaindex + VueJS + Flask + Neo4j 构建。它支持 OpenAI、国内主流大模型平台的模型调用以及本地 vllm 部署,能够实现知识库问答、知识图谱检索和联网检索等功能。该系统的主要优点是灵活适配多种模型、支持多种知识库格式以及强大的知识图谱集成能力。它适用于需要高效知识管理和智能问答的企业和研究机构,具有较高的技术先进性和实用性。
Spark-TTS 是一种基于大语言模型的高效单流解耦语音合成模型。
Spark-TTS 是一种基于大语言模型的高效文本到语音合成模型,具有单流解耦语音令牌的特性。它利用大语言模型的强大能力,直接从代码预测的音频进行重建,省略了额外的声学特征生成模型,从而提高了效率并降低了复杂性。该模型支持零样本文本到语音合成,能够跨语言和代码切换场景,非常适合需要高自然度和准确性的语音合成应用。它还支持虚拟语音创建,用户可以通过调整参数(如性别、音高和语速)来生成不同的语音。该模型的背景是为了解决传统语音合成系统中效率低下和复杂性高的问题,旨在为研究和生产提供高效、灵活且强大的解决方案。目前,该模型主要面向学术研究和合法应用,如个性化语音合成、辅助技术和语言研究等。
Level-Navi Agent是一个无需训练即可使用的框架,利用大语言模型进行深度查询理解和精准搜索。
Level-Navi Agent是一个开源的通用网络搜索代理框架,能够将复杂问题分解并逐步搜索互联网上的信息,直至回答用户问题。它通过提供Web24数据集,覆盖金融、游戏、体育、电影和事件等五大领域,为评估模型在搜索任务上的表现提供了基准。该框架支持零样本和少样本学习,为大语言模型在中文网络搜索代理领域的应用提供了重要参考。
用于多模态上下文中的检索增强生成的基准测试代码库。
M2RAG是一个用于多模态上下文中的检索增强生成的基准测试代码库。它通过多模态检索文档来回答问题,评估多模态大语言模型(MLLMs)在利用多模态上下文知识方面的能力。该模型在图像描述、多模态问答、事实验证和图像重排等任务上进行了评估,旨在提升模型在多模态上下文学习中的有效性。M2RAG为研究人员提供了一个标准化的测试平台,有助于推动多模态语言模型的发展。
TableGPT2-7B 是一款专注于表格数据处理的大语言模型,适用于数据分析和商业智能任务。
TableGPT2-7B 是由浙江大学开发的大规模解码器模型,专门用于处理数据密集型任务,尤其是表格数据的解读和分析。该模型基于 Qwen2.5 架构,通过持续预训练(CPT)和监督微调(SFT)优化,能够处理复杂的表格查询和商业智能(BI)应用。它支持中文查询,适合需要高效处理结构化数据的企业和研究机构。模型目前免费开源,未来可能会推出更专业的版本。
基于支付宝的生活场景,通过领先的大模型技术,为企业快速构建专业级智能体。
Tbox 是一款基于支付宝生活场景的大模型技术产品,旨在为企业快速构建专业级智能体,助力业务增长。它融合了蚂蚁百灵大模型、蚁天鉴、灵境数字人等先进技术,能够实现体验升级、智能决策等功能。Tbox 适用于多种行业,如民生、政务、出行、景区、医疗等,通过智能化服务提升用户体验和业务效率。其价格和具体定位因企业需求而异,为企业提供定制化的解决方案。
© 2026 AIbase 备案号:闽ICP备08105208号-14