处理长文本的大型语言模型
LongLLaMA 是一个大型语言模型,能够处理长篇文本。它基于 OpenLLaMA,并使用 Focused Transformer (FoT) 方法进行了微调。它能够处理长达 256k 标记甚至更多的文本。我们提供了一个较小的 3B 基础模型(未经过指令调整),并在 Hugging Face 上提供了支持更长上下文的推断代码。我们的模型权重可以作为现有实现中 LLaMA 的替代品(适用于最多 2048 个标记的短上下文)。此外,我们还提供了评估结果和与原始 OpenLLaMA 模型的比较。
全球最长上下文窗口大模型
Baichuan2-192K推出全球最长上下文窗口大模型Baichuan2-192K,一次可输入35万字超越Claude2。Baichuan2-192K不仅在上下文窗口长度上超越Claude2,在长窗口文本生成质量、长上下文理解以及长文本问答、摘要等方面的表现也全面领先Claude2。Baichuan2-192K通过算法和工程的极致优化,实现了窗口长度和模型性能之间的平衡,做到了窗口长度和模型性能的同步提升。Baichuan2-192K已经开放了API接口,提供给企业用户,并已经在法律、媒体、金融等行业落地应用。
多功能文本生成工具
文心大模型包含文本生成、文生图、智能对话等技能,可用于文化传媒、艺术创作、教育科研、金融保险、医疗健康等多个应用场景。该产品具有高效、智能、多样化等优势,定价灵活,适用于个人用户和企业用户。
多模态文档理解模型
DocLLM是一个提供多模态文档理解模型的平台,旨在处理企业文档中的文本和空间布局,并提供优于现有大型语言模型的性能。其模型采用轻量级扩展,避免昂贵的图像编码器,专注于边界框信息以纳入空间布局结构。通过分解经典Transformer中的注意机制,捕获文本和空间模态之间的交叉对齐。此外,设计了一个预训练目标,学习填充文本段落,以解决视觉文档中经常遇到的不规则布局和异质内容。该解决方案在14个任务的16个数据集中优于现有大型语言模型,并且对5个以前未见数据集具有良好的泛化能力。
大型世界模型,理解视频与语言
Large World Models是一个利用RingAttention技术训练的神经网络,专注于处理长视频和语言序列,以理解人类知识和多模态世界。它通过大规模数据集训练,实现了前所未有的上下文大小,并开源了一系列70亿参数的模型,能够处理超过100万标记的文本和视频。
中文在线发布全球首个万字创作大模型
中文逍遥大模型是中文在线研发的全球首个万字创作大模型,能根据用户输入的创作灵感,自动生成万字文章。它通过AI技术,实现一键生成文章内容、一张图写出一部小说等功能,大幅提高创作效率,释放内容生产力。适用于有写作基础的专业创作者和创作新手,可以实现从故事构思、情节安排到内容生成等全创作周期的智能辅助,让每一个人都能轻松实现创作梦想。
由中国电信推出的千亿参数大模型
星辰语义大模型是中国电信推出的千亿参数大模型,具备强大的生成和理解能力。通过缓解多轮幻觉、增强关键信息注意力、强化知识图谱和知识溯源能力,提升模型在推理和回答准确性方面的表现。支持长文本生成和理解、知识问答、逻辑推理、数学能力和代码能力等多项功能,适用于办公、生产协同、客服等场景。
扩展大语言模型的上下文窗口
LLM Maybe LongLM是一个面向开发者和研究人员的人工智能平台,提供各种模型、数据集和解决方案。其中,LLM Maybe LongLM是针对大语言模型长上下文处理的研究成果,通过自我扩展实现了对长上下文的处理能力。该方法无需训练,只需对原始模型进行少量代码修改即可扩展上下文窗口,为处理长文本提供了有效的解决方案。
超千亿参数的大语言模型
百川智能Baichuan 3是一款超千亿参数的大语言模型,在多个权威通用能力评测中展现出色,特别在中文任务上超越了GPT-4。它在自然语言处理、代码生成、医疗任务等领域表现优异,采用了多项创新技术手段提升模型能力,包括动态数据选择、重要度保持和异步CheckPoint存储等。训练过程中采用因果采样的动态训练数据选择方案,保证数据质量;引入了重要度保持的渐进式初始化方法,优化模型训练稳定性;并针对并行训练问题进行了一系列优化,性能提升超过30%。
腾讯混元大模型,中文创作能力
腾讯混元大模型是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。该模型持续训练终身学习,覆盖五大核心优势能力,包括多轮对话、内容创作、逻辑推理、知识增强和多模态(敬请期待)。丰富的应用场景,提供多样化服务,包括文档场景、会议场景、广告场景和营销场景等。
训练属于你的文本大模型,独立部署
Modihand是一个训练属于你的文本大模型的平台,无需专业知识,只需要准备好训练数据,即可训练出专属于你的文本大模型。内置市面上大多数的开源模型,支持多种微调训练方式,性价比高,独立可部署,推理 API 支持,提供更多问题解决支持。
基于组件扩展,打通实时信息与服务
华藏是小i机器人长期积累自主研发倾力打造的具备多种通用能力的基础模型,融合最新人工智能算法,基于海量数据、跨语种多任务训练、强化专业领域知识,形成了可控、可定制、可交付的通用大模型。
提供全面的MLLMs评估
该工具旨在通过对最新专有和开源MLLMs进行定性研究,从文本、代码、图像和视频四个模态的角度,评估其泛化能力、可信度和因果推理能力,以提高MLLMs的透明度。我们相信这些属性是定义MLLMs可靠性的几个代表性因素,支持各种下游应用。具体而言,我们评估了闭源的GPT-4和Gemini以及6个开源LLMs和MLLMs。总体上,我们评估了230个手动设计的案例,定性结果总结为12个分数(即4个模态乘以3个属性)。总共,我们揭示了14个实证发现,有助于了解专有和开源MLLMs的能力和局限性,以更可靠地支持多模态下游应用。
高效为大型语言模型提供服务
FP6-LLM是一种用于大型语言模型的全新支持方案,通过六位量化(FP6)有效地减小了模型大小,并在各种应用中始终保持模型质量。我们提出了TC-FPx,这是第一个完整的GPU内核设计方案,统一支持各种量化位宽的浮点权重。我们将TC-FPx内核集成到现有推理系统中,为量化的LLM推理提供了全新的端到端支持(称为FP6-LLM),实现了推理成本和模型质量之间更好的权衡。实验证明,FP6-LLM使得使用单个GPU进行LLaMA-70b推理成为可能,实现的规范化推理吞吐量比FP16基准高1.69倍至2.65倍。
自动化复杂文档处理
super.AI是一款智能文档处理产品,通过使用最新的人工智能模型,可以自动化处理复杂文档。它可以快速提取文档中的数据,并实现端到端的业务流程自动化。super.AI提供保证结果的智能文档处理服务,可以处理各种复杂文档,包括合同、发票、报告等。它的功能强大,优势在于高准确率和高效率的数据提取,以及可靠的业务流程自动化。super.AI的定价根据使用量和服务等级进行计费,具体详情可联系销售团队。它适用于各种场景,包括金融、法律、医疗等行业。
文本大模型能力及应用场景
MiniMax 开放平台是一个具备文本大模型能力的开放平台。它提供精确的信息提取能力,适用于会议纪要、摘要提取等总结说明场景。平台提供高质量的文本理解及语音合成能力,为用户提供一个客观且全面的内容总结。
支持虚拟人口语教练等
网易有道 “子曰” 教育大模型是一款面向教育领域的大型模型,提供多个应用,包括 LLM 翻译、虚拟人口语教练、AI 作文指导、语法精讲、AI Box 以及文档问答。它具有强大的语言理解和生成能力,能够个性化分析与指导学生,通过人类反馈塑造性格和语言习惯,实现引导式学习。同时,它还能提供全学科和跨学科知识答疑支持。该产品将推出有道 AI 学习机 X20、网易有道词典笔新品等硬件设备,并且手机端也可以使用口语教练功能。
© 2025 AIbase 备案号:闽ICP备08105208号-14