浏览量:192
训练属于你的文本大模型,独立部署
Modihand是一个训练属于你的文本大模型的平台,无需专业知识,只需要准备好训练数据,即可训练出专属于你的文本大模型。内置市面上大多数的开源模型,支持多种微调训练方式,性价比高,独立可部署,推理 API 支持,提供更多问题解决支持。
基于Linux环境快速部署开源大模型的教程
该项目是一个围绕开源大模型的全流程指导教程,包括环境配置、模型部署、高效微调等,简化开源大模型的使用和应用,让更多普通学习者能够使用开源大模型。项目面向对开源大模型感兴趣且想自主上手的学习者,提供详细的环境配置、模型部署和微调方法。
通过API获取高品质Yi系列大模型的开放平台
零一万物大模型开放平台是一个通过API调用获取高品质Yi系列大模型的平台。Yi系列模型基于零一万物的前沿科研成果和高品质数据训练而成,曾在多个权威榜单中获得SOTA表现。主要产品包括yi-34b-chat-0205、yi-34b-chat-200k和yi-vl-plus三种模型。yi-34b-chat-0205是一款优化版聊天模型,指令遵循能力提升近30%,回复延迟大幅降低,适用于聊天、问答、对话等场景。yi-34b-chat-200k支持200K超长上下文,可处理约20万到30万汉字内容,适用于文档理解、数据分析和跨领域知识应用。yi-vl-plus支持高分辨率图片输入,具备图像问答、图表理解、OCR等能力,适用于对复杂图像内容进行分析、识别和理解。该平台的API优势包括推理速度快、与OpenAI API完全兼容。定价方面,新注册用户可获赠60元试用额度,yi-34b-chat-0205单价为2.5元/百万token,yi-34b-chat-200k单价为12元/次,yi-vl-plus单价为6元/百万token。
国内领先的通用大模型
元象大模型 XChat 是一款国内领先的通用大模型产品。它自研高性能,从零训练,可以大幅降低开发门槛与推理成本,满足不同复杂度的多任务需求。该产品融合了意图理解、信息检索以及强化学习技术,结合有监督微调与人类意图对齐,在知识问答、文本创作领域表现突出。欲了解更多详情,请访问官网:[元象大模型 XChat](https://www.xverse.ai/)
字节跳动自研大模型,提供多模态能力
豆包大模型是字节跳动推出的自研大模型,通过内部50+业务场景实践验证,每日万亿级tokens大使用量持续打磨,提供多模态能力,以优质模型效果为企业打造丰富的业务体验。产品家族包括多种模型,如通用模型、视频生成、文生图、图生图、同声传译等,满足不同业务需求。
大模型重塑千行百业
盘古大模型是华为云推出的人工智能解决方案,通过 NLP 大模型、CV 大模型、多模态大模型、预测大模型和科学计算大模型等多个模型,实现对话问答、图像识别、多模态处理、预测分析和科学计算等多种功能。盘古大模型具有高效适配、高效标注和准确可控的特点,可广泛应用于各行各业。详情请访问官方网址。
汇总和比较全球主要AI模型提供商的价格信息
AIGCRank大语言模型API价格对比是一个专门汇总和比较全球主要AI模型提供商的价格信息的工具。它为用户提供最新的大语言模型(LLM)的价格数据,包括一些免费的AI大模型API。通过这个平台,用户可以轻松查找和比较OpenAI、Claude、Mixtral、Kimi、星火大模型、通义千问、文心一语、Llama 3、GPT-4、AWS和Google等国内外主要API提供商的最新价格,确保找到最适合自己项目的模型定价。
一款基于指令微调的大型语言模型
Mistral-7B-Instruct-v0.2 是一款基于 Mistral-7B-v0.2 模型进行指令微调的大型语言模型。它拥有 32k 的上下文窗口和 1e6 的 Rope Theta 值等特性。该模型可以根据给定的指令生成相应的文本输出,支持各种任务,如问答、写作、翻译等。通过指令微调,模型可以更好地理解和执行指令。虽然该模型目前还没有针对性的审核机制,但未来将继续优化,以支持更多场景的部署。
提供全面的人工智能大模型产业信息和创新价值研究。
大模型之家是一个专注于人工智能大模型产业的平台,提供行业报告、技术创新动态、专家评测和奖项荣誉等信息。它通过整合行业资源,推动人工智能技术的创新和应用,帮助企业和个人更好地理解和利用大模型技术。
由中国电信推出的千亿参数大模型
星辰语义大模型是中国电信推出的千亿参数大模型,具备强大的生成和理解能力。通过缓解多轮幻觉、增强关键信息注意力、强化知识图谱和知识溯源能力,提升模型在推理和回答准确性方面的表现。支持长文本生成和理解、知识问答、逻辑推理、数学能力和代码能力等多项功能,适用于办公、生产协同、客服等场景。
一款支持多模态功能的全功能大语言模型安卓应用。
MNN 大模型 Android App 是阿里巴巴开发的一款基于大语言模型(LLM)的安卓应用。它支持多种模态输入和输出,包括文本生成、图像识别、音频转录等。该应用通过优化推理性能,确保在移动设备上高效运行,同时保护用户数据隐私,所有处理均在本地完成。它支持多种领先的模型提供商,如 Qwen、Gemma、Llama 等,适用于多种场景。
腾讯混元大模型,中文创作能力
腾讯混元大模型是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。该模型持续训练终身学习,覆盖五大核心优势能力,包括多轮对话、内容创作、逻辑推理、知识增强和多模态(敬请期待)。丰富的应用场景,提供多样化服务,包括文档场景、会议场景、广告场景和营销场景等。
澜舟科技研发的孟子3-13B大模型,支持免费商用
澜舟科技研发的孟子3-13B大模型基于Llama架构,经过3T Tokens的数据集训练,具备强大的多语言处理和交互推理能力。支持免费商用,为ToB场景打造优质大模型。
几行代码接入大模型
智谱AI大模型开放平台是一个提供多种AI模型服务的平台,支持开发者和企业快速接入大模型API,构建变革性AI体验。平台提供GLM-4系列大模型,包括免费模型GLM-4-Flash、全自研最新版本GLM-4-Plus、支持200万上下文的GLM-4-Long等。此外,还提供多模态大模型,如视觉能力GLM-4V-Plus、文生图CogView-3-Plus、文生视频CogVideoX。平台面向开发者提供模型API、Alltools API、批处理API等服务,面向企业服务提供医疗健康、汽车、游戏娱乐、文旅、智能终端、智能制造、消费等行业解决方案。
深入分析TTFT、TPS等关键指标
该网站提供了国内常见模型提供商API服务的性能指标,包括TTFT(首token时延)、TPS(每秒输出token数)、总耗时、上下文长度以及输入输出价格等详细数据。它为开发者和企业提供了评估不同大模型性能的依据,帮助他们选择最适合自己需求的模型服务。
DMXAPI 是一个提供全球大模型API聚合服务的平台,支持超过300个大模型调用。
DMXAPI 是由 LangChain 中文网提供的大模型API聚合服务,旨在帮助开发者快速接入全球领先的大模型。通过集中采购和直接与模型原厂合作,DMXAPI 提供更具竞争力的价格和高效的服务。其支持的模型包括 GPT-4、Claude、LLaMA 等,覆盖自然语言处理、图像识别、生成式 AI 等多种应用场景。DMXAPI 的主要优点是安全、低价、高效,并提供 7×24 小时在线客服支持,确保用户在使用过程中无后顾之忧。
面向生成场景的可控大语言模型
孟子生成式大模型(孟子 GPT)是一个面向生成场景的可控大语言模型,能够通过多轮的方式帮助用户完成特定场景中的多种工作任务。它支持知识问答、多语言翻译、通用写作和金融场景任务等功能,具有更可控、更灵活、更个性、更专业的优势。具体定价和使用方式请咨询官方网站。
多功能智能大模型
讯飞星火认知大模型是科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。它具有语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力。该产品定位于为用户提供全面的语言理解与执行任务的解决方案。
轻量级代码库,用于高效微调Mistral模型。
mistral-finetune是一个轻量级的代码库,它基于LoRA训练范式,允许在冻结大部分权重的情况下,只训练1-2%的额外权重,以低秩矩阵微扰的形式进行微调。它被优化用于多GPU单节点训练设置,对于较小模型,例如7B模型,单个GPU就足够了。该代码库旨在提供简单、有指导意义的微调入口,特别是在数据格式化方面,并不旨在涵盖多种模型架构或硬件类型。
OFT可有效稳定微调文本到图像扩散模型
Controlling Text-to-Image Diffusion研究了如何有效引导或控制强大的文本到图像生成模型进行各种下游任务。提出了正交微调(OFT)方法,可以保持模型的生成能力。OFT可以保持神经元之间的超球面能量不变,防止模型坍塌。作者考虑了两种重要的微调任务:主体驱动生成和可控生成。结果表明,OFT方法在生成质量和收敛速度上优于现有方法。
支持虚拟人口语教练等
网易有道 “子曰” 教育大模型是一款面向教育领域的大型模型,提供多个应用,包括 LLM 翻译、虚拟人口语教练、AI 作文指导、语法精讲、AI Box 以及文档问答。它具有强大的语言理解和生成能力,能够个性化分析与指导学生,通过人类反馈塑造性格和语言习惯,实现引导式学习。同时,它还能提供全学科和跨学科知识答疑支持。该产品将推出有道 AI 学习机 X20、网易有道词典笔新品等硬件设备,并且手机端也可以使用口语教练功能。
统一大型模型 API调用方式
支持将 openai、claude、azure openai, gemini,kimi, 智谱 AI, 通义千问,讯飞星火 API 等模型服务方的调用转为 openai 方式调用。屏蔽不同大模型 API 的差异,统一用 openai api 标准格式使用大模型。提供多种大型模型支持,包括负载均衡、路由、配置管理等功能。
提供OpenAI和Claude模型支持的API服务。
API易是一个提供OpenAI和Claude模型支持的API服务平台,用户可以通过API接口调用这些模型进行各种AI任务。该平台具有稳定性高、价格优惠、无需代理即可使用等特点,适合需要AI模型支持的开发者和企业。
心理健康大模型,支持心理健康辅导链路。
EmoLLM是一个心理健康大模型,由LLM指令微调而来,旨在全面理解和促进个体、群体乃至整个社会的心理健康状态。它包含认知因素、情感因素、行为因素、社会环境、生理健康、心理韧性、预防和干预措施、评估和诊断工具等多个关键组成部分。EmoLLM通过微调配置,能够在心理咨询任务上提供支持,帮助用户更好地理解和应对心理问题。
专注长文本、多语言、垂直化
达观 “曹植” 大模型是专注于长文本、多语言、垂直化发展的国产大语言模型。具有自动化写作、翻译、专业性报告写作能力,支持多语言应用和垂直行业定制。可提供高质量文案撰写服务,广泛适用于各行业,是解决企业实际问题的智能工具。
Gemini Embedding 是一种先进的文本嵌入模型,通过 Gemini API 提供强大的语言理解能力。
Gemini Embedding 是 Google 推出的一种实验性文本嵌入模型,通过 Gemini API 提供服务。该模型在多语言文本嵌入基准测试(MTEB)中表现卓越,超越了之前的顶尖模型。它能够将文本转换为高维数值向量,捕捉语义和上下文信息,广泛应用于检索、分类、相似性检测等场景。Gemini Embedding 支持超过 100 种语言,具备 8K 输入标记长度和 3K 输出维度,同时引入了嵌套表示学习(MRL)技术,可灵活调整维度以满足存储需求。该模型目前处于实验阶段,未来将推出稳定版本。
文本大模型能力及应用场景
MiniMax 开放平台是一个具备文本大模型能力的开放平台。它提供精确的信息提取能力,适用于会议纪要、摘要提取等总结说明场景。平台提供高质量的文本理解及语音合成能力,为用户提供一个客观且全面的内容总结。
© 2025 AIbase 备案号:闽ICP备08105208号-14