需求人群:
"目标受众包括需要处理大量文本数据的研究人员和开发者,以及希望利用AI进行复杂对话和推理的企业和个人。"
使用场景示例:
研究人员使用模型进行数学问题解答
企业利用模型进行客户服务的自动化对话
开发者通过模型实现个性化的聊天机器人
产品特色:
支持1M超长上下文窗口,适合长文本任务处理
在数学推理方面具有同量级模型最优精度
工具调用能力升级,支持多轮调用完成复杂任务
支持从上百个网页搜集信息进行分析推理
通过LMDeploy和Transformers进行本地和流式生成推理
与vLLM兼容,可启动兼容OpenAI API的服务
使用教程:
1. 安装必要的库,如torch和transformers。
2. 使用AutoTokenizer和AutoModelForCausalLM从Hugging Face加载模型。
3. 设置模型精度为torch.float16以避免显存不足。
4. 通过chat或stream_chat接口与模型进行交互。
5. 使用LMDeploy进行1M超长上下文的本地批量推理。
6. 利用vLLM启动兼容OpenAI API的服务,进行更高级的模型部署。
浏览量:14
70亿参数的高性能对话模型
InternLM2.5-7B-Chat是一个开源的7亿参数的中文对话模型,专为实用场景设计,具有卓越的推理能力,在数学推理方面超越了Llama3和Gemma2-9B等模型。支持从上百个网页搜集信息进行分析推理,具有强大的工具调用能力,支持1M超长上下文窗口,适合进行长文本处理和复杂任务的智能体构建。
第二代多模态预训练对话模型
CogVLM2是由清华大学团队开发的第二代多模态预训练对话模型,它在多个基准测试中取得了显著的改进,支持8K内容长度和1344*1344的图像分辨率。CogVLM2系列模型提供了支持中文和英文的开源版本,能够与一些非开源模型相媲美的性能。
基于AI的虚拟人聊天应用,提供24小时聊天陪伴和生活服务。
小侃星球是由百度发布的一款基于AI开放域对话模型的虚拟人聊天应用。结合AI技术和社交元素,用户可以与虚拟人物进行对话聊天,享受陪伴,同时获得实用的生活服务,如哄睡和叫早服务。
基于7B参数的强大对话智能语言模型
360Zhinao是由奇虎360开源的一系列7B规模的智能语言模型,包括基础模型和三个不同长度上下文的对话模型。这些模型经过大规模中英文语料预训练,在自然语言理解、知识、数学、代码生成等多种任务上表现出色,并具有强大的长文本对话能力。模型可用于各种对话式应用的开发和部署。
先进的人工智能大模型系列
智源悟道3.0是智源研究院开发的先进人工智能大模型系列,包括AquilaChat对话模型、AquilaCode文本代码生成大模型以及多种视觉大模型。产品功能涵盖流畅的文本对话、多语言生成任务、文本代码生成、多模态和视觉处理等。其特点包括多样化、高性能、开源、多语言支持和可扩展性。适用于多种芯片架构和深度学习框架,主要面向科研和开发社区,开源免费。
快意大模型
「快意」大模型(KwaiYii)是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),包括预训练模型和对话模型。KwaiYii-13B-Base 预训练模型具备优异的通用技术底座能力,KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力。多个权威 Benchmark 结果表明 KwaiYii-13B 模型在各领域具备领先水平。
释放智能的无限可能
Predict Expert AI是一款能够生成和预测智能的人工智能产品。它能够生成各种类型的智能模型,包括对话模型、技术知识模型、名人模型等。通过与Predict Expert AI交互,用户可以与自己的数字副本对话,获取各种技术知识或与名人、动漫角色等交流。它还提供了AI模型的访问和管理功能,用户可以使用AI API,管理自己的AI领域和身份。
领先的AI评测基准,衡量和比较AI模型性能。
SuperCLUE是一个用于评估和比较大型语言模型性能的在线平台。它提供了多种任务和排行榜,旨在为AI研究者和开发者提供一个标准化的测试环境。SuperCLUE支持各种AI应用场景,包括数学推理、代码生成、超长文本处理等,能够帮助用户准确评估模型在不同任务上的表现和能力。
Google 一款轻量级、高效能的AI模型,专为大规模高频任务设计。
Gemini 1.5 Flash是Google DeepMind团队推出的最新AI模型,它通过'蒸馏'过程从更大的1.5 Pro模型中提炼出核心知识和技能,以更小、更高效的模型形式提供服务。该模型在多模态推理、长文本处理、聊天应用、图像和视频字幕生成、长文档和表格数据提取等方面表现出色。它的重要性在于为需要低延迟和低成本服务的应用提供了解决方案,同时保持了高质量的输出。
自主AI营销助手,全年无休创作博客和帖子。
Skott是一个AI驱动的社交媒体营销、博客和设计一体化工具,能够自主地生产数千篇博客和帖子,无需人工干预,全年365天持续运作。它基于Lyzr Agent Framework构建,提供企业级自动化服务,用户可以完全控制提示、LLMs、分析以及最重要的数据。Skott具备自我反思能力,能够持续改进内容,拥有长期记忆功能,保留用户偏好和指导方针。此外,Skott还提供24小时企业级支持,确保数据隐私,可在本地云上运行。
AI驱动的公共股票投资助手
Calypso是一个AI驱动的公共股票投资助手,结合了人工智能技术与公共金融数据,提供全方位的股票分析服务。它通过AI技术帮助用户在股票市场做出更明智的投资决策,提供实时的盈利预览、更新、AI聊天问答等功能,并通过GPT-4类模型训练,以提供更专业的投资建议。
服务公司的强大客户门户,由AI构建。
Hubflo是一个为服务公司设计的下一代平台,通过提供强大的客户门户来提升客户满意度和保留率,同时大幅减少客户邮件、电话和会议,加快项目交付速度。它专为创意和专业服务设计,包括数字代理、咨询、会计/金融服务、建筑和家居设计、律师事务所等。Hubflo提供文件共享、合同、消息、任务、计费等工具,并可集成任何其他服务。产品背景信息显示,Hubflo由AI驱动,具有自动化的入职流程、文件收集、电子签名、发票发送等功能,并且提供安全的客户消息和独特的电子邮件集成,以及16+原生集成和500+外部应用嵌入能力。
定制化大型语言模型的专业微调工具
Expert Specialized Fine-Tuning (ESFT) 是一种针对具有专家混合(MoE)架构的大型语言模型(LLMs)的高效定制化微调方法。它通过仅调整与任务相关的部分来优化模型性能,提高效率,同时减少资源和存储的使用。
7B参数的文本图像理解与合成模型
InternLM-XComposer2.5是一款专注于文本图像理解与合成应用的大型语言模型,具有7B参数的后端支持,能够处理长达96K的长文本上下文,适合需要广泛输入输出的复杂任务。
首个面向中英文用户的指令调优语言模型
Gemma-2-27B-Chinese-Chat是基于google/gemma-2-27b-it的首个指令调优语言模型,专为中英文用户设计,拥有角色扮演和工具使用等多种能力。该模型通过ORPO算法进行微调,显著提升了在中英文对话、角色扮演和数学计算等方面的性能。
多语种语音理解模型,提供高精度语音识别与情感识别。
SenseVoice是一个包含自动语音识别(ASR)、语音语言识别(LID)、语音情感识别(SER)和音频事件检测(AED)等多语音理解能力的语音基础模型。它专注于高精度多语种语音识别、语音情感识别和音频事件检测,支持超过50种语言,识别性能超越Whisper模型。模型采用非自回归端到端框架,推理延迟极低,是实时语音处理的理想选择。
开源的多语言代码生成模型
CodeGeeX4-ALL-9B是CodeGeeX4系列模型的最新开源版本,基于GLM-4-9B持续训练,显著提升了代码生成能力。它支持代码补全、生成、代码解释、网页搜索、函数调用、代码问答等功能,覆盖软件开发的多个场景。在公共基准测试如BigCodeBench和NaturalCodeBench上表现优异,是参数少于10亿的最强代码生成模型,实现了推理速度与模型性能的最佳平衡。
HTTP 402 状态代码的互联网原生付费墙
L402是一个开放协议,基于HTTP 402 Payment Required状态代码和闪电网络实现互联网原生的付费墙。它为API货币化和数字服务提供了即时、低成本的交易,通过微支付、按使用付费和细粒度访问控制模型,解锁了新的收入流。L402的开放协议鼓励创新和跨行业的广泛采用,促进了一个充满活力的应用和服务生态系统的发展。
AI驱动的可视化设计工具
creaition是一个利用先进AI技术,通过全视觉工作流程,让用户轻松创建令人惊叹的设计对象的平台。它提供了基础版Lite的免费试用,让用户体验无缝的设计创造过程。该平台通过训练定制的AI模型,融合品牌精髓,生成与现有产品组合无缝集成的无数新设计。
AI赋能的设计工具,快速生成定制化设计。
Venngage Muse是一个AI驱动的设计平台,提供多种设计模板和工具,帮助用户节省设计时间,提高工作效率。平台通过AI技术,自动生成和编辑设计,同时提供协作工具,支持团队成员共同完成设计项目。Venngage Muse的主要优点包括:直观的用户界面、AI辅助的文本编辑和设计建议、自动品牌化工具、AI生成图像描述和背景移除功能,以及符合Web内容无障碍指南的可访问性检查。
基于大型语言模型的智能代理研究
xLAM是一个由Salesforce AI Research团队开发的基于大型语言模型(Large Language Models, LLMs)的智能代理研究项目。它通过聚合来自不同环境的智能代理轨迹,标准化并统一这些轨迹到一致的格式,以创建一个优化的通用数据加载器,专门用于智能代理的训练。xLAM-v0.1-r是此模型系列的0.1版本,专为研究目的设计,与VLLM和FastChat平台兼容。
创建、动画化并部署情感智能角色
Rapport是一个提供创建、动画化并部署情感智能角色的平台,旨在通过虚拟交互个性(VIPs)丰富与受众的对话体验。它结合了最新的AI技术与面部动画技术,支持任何语言的准确唇形同步,并且可以创建逼真或风格化的角色。Rapport的背景信息包括其在游戏面部动画和中间件领域的行业知识,以及其在GTMF 2024年会上的参与。
打造大模型时代的产品能力,低成本开发智能体,实现商业闭环。
文心智能体平台 AgentBuilder 是基于文心大模型的智能体平台,支持开发者根据行业领域和应用场景,选择不同开发方式打造智能体。其主要优点包括低成本开发、流量分发路径支持,为用户提供完整的产品开发闭环。
一款多功能大型视觉语言模型
InternLM-XComposer-2.5是一款支持长上下文输入和输出的多功能大型视觉语言模型。它在各种文本图像理解和创作应用中表现出色,实现了与GPT-4V相当的水平,但仅使用了7B的LLM后端。该模型通过24K交错图像文本上下文进行训练,能够无缝扩展到96K长上下文,通过RoPE外推。这种长上下文能力使其在需要广泛输入和输出上下文的任务中表现突出。此外,它还支持超高分辨率理解、细粒度视频理解、多轮多图像对话、网页制作以及撰写高质量图文文章等功能。
高效渲染被遮挡的人体
OccFusion是一种创新的人体渲染技术,利用3D高斯散射和预训练的2D扩散模型,即使在人体部分被遮挡的情况下也能高效且高保真地渲染出完整的人体图像。这项技术通过三个阶段的流程:初始化、优化和细化,显著提高了在复杂环境下人体渲染的准确性和质量。
音频生成与自动字幕生成模型
GenAU是一个由Snap Research开发的音频生成模型,它通过AutoCap自动字幕生成模型和GenAu音频生成架构,显著提升了音频生成的质量。它在生成环境声音和效果方面具有挑战性,特别是在数据稀缺和字幕质量不足的情况下。GenAU模型能够生成高质量的音频,并且在音频合成领域具有很大的潜力。
高效的人像动画生成工具
LivePortrait是一个基于隐式关键点框架的人像动画生成模型,它通过使用单一源图像作为外观参考,并从驱动视频、音频、文本或生成中获取动作(如面部表情和头部姿势),来合成逼真的视频。该模型不仅在计算效率和可控性之间取得了有效平衡,而且通过扩展训练数据、采用混合图像-视频训练策略、升级网络架构以及设计更好的运动转换和优化目标,显著提高了生成质量和泛化能力。
© 2024 AIbase 备案号:闽ICP备08105208号-14