需求人群:
"适用于需要对语言模型进行扩展和增强的编程任务"
使用场景示例:
在代码生成和解释任务中,将PaLM2-S与特定于代码的模型进行增强
在低资源语言上训练的较小模型进行增强,结果绝对改善了高达13%的翻译任务
适用于需要对语言模型进行扩展和增强的编程任务
产品特色:
通过重用现有LLMs和少量额外参数和数据,在新任务上扩展LLMs的规模
保持现有模型权重不变,因此保留现有的能力
适用于不同的领域和设置
浏览量:12
最新流量情况
月访问量
22216.76k
平均访问时长
00:04:50
每次访问页数
5.52
跳出率
47.80%
流量来源
直接访问
46.24%
自然搜索
30.97%
邮件
0.78%
外链引荐
13.53%
社交媒体
8.45%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
15.26%
美国
13.36%
印度
6.45%
俄罗斯
3.91%
法国
3.77%
一个新的高效开源大型语言模型标准
DBRX是一个由Databricks的Mosaic研究团队构建的通用大型语言模型(LLM),在标准基准测试中表现优于所有现有开源模型。它采用Mixture-of-Experts (MoE)架构,使用362亿个参数,拥有出色的语言理解、编程、数学和逻辑推理能力。DBRX旨在推动高质量开源LLM的发展,并且便于企业根据自身数据对模型进行定制。Databricks为企业用户提供了交互式使用DBRX、利用其长上下文能力构建检索增强系统,并基于自身数据构建定制DBRX模型的能力。
开源代码助手,高效编程新选择
CodeQwen1.5是一个基于Qwen语言模型的代码专家模型,拥有7B参数,支持92种编程语言,最长支持64K的上下文输入。它具备代码生成、长序列建模、代码修改和SQL能力等,旨在提高开发人员的工作效率,简化软件开发流程。
新模型,多种型号,AI驱动合成数据训练
WizardLM-2是WizardLM推出的新一代大型语言模型,包含三种型号:8x22B、70B和7B。该产品采用AI驱动的合成数据训练系统,通过数据分析、加权抽样、渐进式学习和AI互校AI等方法,优化模型性能。它能够自动生成高品质的指令和响应,提供多样化的对话能力,适用于多种编程和开发场景。
领先的代码生成大语言模型
CodeGemma是谷歌公司推出的先进大语言模型,专注于生成代码、理解和追踪指令,旨在为全球开发人员提供高质量的代码辅助工具。包括20亿参数的基础模型,70亿参数的基础模型和用于指导追踪的70亿参数模型,针对代码开发场景进行优化和微调。在各种编程语言中表现卓越,具有超凡的逻辑和数学推理能力。
Keyframer是一个基于LLM的动画生成AI原型工具
Keyframer是一个由Apple研发的基于大语言模型的动画生成工具原型。它可以通过文本描述,自动为SVG图像添加动画效果并转换为CSS代码。用户无需编程经验,就可以简单上传图像、输入文本描述,Keyframer会自动生成代码。相比其他AI生成动画方案,Keyframer更简单易用。目前还处于原型阶段,公开可用性有待观察。
开源代码生成模型
Code Llama 70B是一个大型开源代码生成语言模型,可以从自然语言提示或现有代码片段生成多种编程语言的代码。它基于175亿参数的通用语言模型Llama 2,经过专门针对代码生成任务的微调,可以高效准确地生成Python、C++、Java等语言的代码。Code Llama 70B在人工评估基准测试中取得了67.8的高分,性能超过了以往的开源模型,可与专利模型媲美。它强大的代码生成能力可以提升编程效率,降低编码门槛,启发更多创新应用。
将数据转化为知识
Denser Chatbots可以利用您的个人网站或上传的文件创建聊天机器人。Denser采用先进技术处理您的数据,并使用大型语言模型从您的特定数据中提取见解来回答您的查询。使用Retrieval Augmented Generation (RAG)方法,Denser Chatbots能够生成基于您独有的知识库的答案,提供比标准大型语言模型更个性化和相关的响应。构建和部署Denser Chatbots非常简单,只需提供您的网站URL,即可开始构建和部署,无需任何编程技能。
AI辅助量子计算
Quantum Copilot是一个AI辅助量子计算工具,帮助量子计算爱好者和专业人士编写量子计算程序。它可以用简单的语言编写量子算法,绘制量子电路,将量子代码转换为各种编程语言和库之间的格式,并在量子模拟器或实际的量子硬件上运行量子程序。Quantum Copilot由最新的人工智能和大型语言模型驱动,能够理解复杂的问题并提供准确和有用的答案。
Unity Muse是基于大型语言模型的AI助手
Unity Muse是一个基于大型语言模型构建的AI助手,可以加速Unity游戏开发流程。它可以提供各种Unity相关资源和建议,帮助开发者提高工作效率。主要功能包括:代码自动补全、Debug提示、3D资源建议、代码优化等,涵盖游戏开发的多个方面。Muse使开发者可以更快地实现想法,同时保持高质量。它是Unity推出的重要新产品之一,属于生产力和编程类SaaS服务。
无代码平台,使用AI构建应用程序
Prisms是一个无代码平台,使用户能够利用大型语言模型如GPT3、DALL-E和Stable Diffusion等AI技术快速构建应用程序,无需编程经验。用户可以连接不同的数据源、组件,使用Prisms提供的预设模块进行拖拽组合,即可创建应用程序原型。随后可以直接在Prisms部署应用程序,或作为后端AI服务与自定义前端对接。该产品简化了应用开发流程,降低开发门槛,使更多人能够享受AI带来的便利。
先进的大型语言模型,用于编程
Code Llama 是一款先进的大型语言模型,可以通过文本提示生成代码。它是当前公开可用的语言模型中在编程任务上达到最佳性能的模型之一。Code Llama 可以帮助开发人员提高工作效率,降低编码门槛,并作为一个教育工具帮助编程学习者编写更健壮、更好文档化的软件。Code Llama 提供了多个版本,包括基础版、针对 Python 的专用版和针对自然语言指令的定制版。它支持多种流行的编程语言,如 Python、C++、Java 等。Code Llama 免费供研究和商业使用。
双千亿级大语言模型,智能问答、创作文本
「天工」是国内首个对标 ChatGPT 的双千亿级大语言模型,也是一个对话式 AI 助手。通过自然语言与用户进行问答交互,AI 生成能力可满足文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。支持 1 万字以上文本对话,实现 20 轮次以上用户交互,在学习、职场、生活等多类问答场景中都能实现较高的输出水平。
先进AI语言模型
Claude 2是由Anthropic AI开发的先进语言模型,提供广泛的数据处理能力,创意写作,编程任务和数据分析。它支持100K token limit,推理能力仅次于ChatGPT4。免费使用Claude 2 AI,享受与先进AI技术的无缝交互。
AI聊天助手,帮助用户生成各种文本内容
ChatGPT是一款AI聊天助手,使用人工智能技术,帮助用户生成各种文本内容。它可以用于写作、创作、提供建议和回答问题等场景。ChatGPT具有强大的语言模型和自然语言处理能力,可以理解用户输入并生成准确、流畅的回答。它还支持多种语言,并且可以自定义模型训练,以适应不同的应用需求。ChatGPT易于使用,无需编程知识,只需输入问题或指令,即可获得相关的文本输出。
提升大型语言模型解决数学问题的能力
ChatGLM-Math 是一个基于自我批评流程定制的数学问题解决模型,旨在提高大型语言模型(LLMs)在数学问题解决方面的能力。该模型通过训练一个通用的Math-Critique模型来提供反馈信号,并采用拒绝采样微调和直接偏好优化来增强LLM的数学问题解决能力。它在学术数据集和新创建的挑战性数据集MathUserEval上进行了实验,显示出在保持语言能力的同时,显著提升了数学问题解决能力。
一款私人且离线的AI个人知识管理桌面应用
Reor是一个AI驱动的桌面笔记应用,它通过自动链接相关笔记、回答笔记上的问题、提供语义搜索以及生成AI闪卡来增强个人的知识管理。所有数据本地存储,支持类似Obsidian的Markdown编辑器。Reor项目的核心假设是,思考工具的AI模型应默认在本地运行。它利用了Ollama、Transformers.js和LanceDB等技术,使得大型语言模型(LLM)和嵌入模型能够在本地运行。同时,也支持连接到OpenAI或兼容的API,如Oobabooga。
扩展LLaVA模型,集成Phi-3和LLaMA-3,提升视觉与语言模型的交互能力。
LLaVA++是一个开源项目,旨在通过集成Phi-3和LLaMA-3模型来扩展LLaVA模型的视觉能力。该项目由Mohamed bin Zayed University of AI (MBZUAI)的研究人员开发,通过结合最新的大型语言模型,增强了模型在遵循指令和学术任务导向数据集上的表现。
开源的先进文本嵌入模型
Snowflake Arctic Embed是一系列基于Apache 2.0许可开源的文本嵌入模型,专为检索用例设计。这些模型在Massive Text Embedding Benchmark (MTEB)检索基准测试中提供了领先的检索性能,为组织在结合专有数据集与大型语言模型(LLMs)进行检索增强生成(RAG)或语义搜索服务时提供了新的优势。这些模型的尺寸从超小型(xs)到大型(l),具有不同的上下文窗口和参数数量,以满足不同企业的延迟、成本和检索性能需求。
简化 LLM 提示管理和促进团队协作
Langtail 是一个旨在简化大型语言模型(LLM)提示管理的平台。通过Langtail,您可以增强团队协作、提高效率,并更深入地了解您的AI工作原理。尝试Langtail,以更具协作和洞察力的方式构建LLM应用。
用于NASA科学任务的基于RoBERTa的转换模型
nasa-smd-ibm-v0.1是一个基于RoBERTa的编码器转换模型,针对NASA科学任务进行了域适应优化。它在与NASA科学任务相关的科学期刊和文章上进行了微调训练,旨在增强自然语言技术,如信息检索和智能搜索等。该模型具有1.25亿个参数,使用掩码语言模型进行预训练。可用于命名实体识别、信息检索、句子转换、可扩展问答等任务,专门定位于NASA科学任务相关的科学用例。
助力安全团队以AI速度保护企业,加快响应
Microsoft Copilot for Security是业界首个生成式AI解决方案,帮助安全和IT专业人员发现别处忽视的问题、加快工作进展、增强团队专业知识。它通过微软每天处理的780多万亿安全信号训练,结合大型语言模型提供个性化洞见和后续指导。使用Copilot,您可以以AI的速度和规模保护业务,转变安全运营。该产品于2024年4月1日全球上市,提供按需付费定价,可与现有微软安全产品集成,为组织带来更大的可见性、控制力和治理能力。
打造连接全球创作者的AI社区平台
米塔是一个打造连接全球创作者的AI社区平台。它提供米文、米画等创作工具,用户只需输入文字提示,就可以通过AI技术生成小说大纲、文章、画作等创意内容。米塔具有写作辅助、图像生成、智能对话等功能,可以帮助用户提升创作效率,发掘更多创意灵感。米塔基于大规模预训练语言模型,通过模型微调和数据增强,实现了文本、图像的高质量生成。米塔致力于为创作者提供便捷的AI创作工具,构建包容开放的社区,让更多的用户体验到AI给创作带来的无限可能。
多模态语言模型预测网络
Honeybee是一个适用于多模态语言模型的局部性增强预测器。它能够提高多模态语言模型在不同下游任务上的性能,如自然语言推理、视觉问答等。Honeybee的优势在于引入了局部性感知机制,可以更好地建模输入样本之间的依赖关系,从而增强多模态语言模型的推理和问答能力。
提高LLM选择性预测能力的框架
ASPIRE是一个设计精良的框架,用于增强大型语言模型的选择性预测能力。它通过参数高效的微调训练LLM进行自我评估,使其能够针对生成的答案输出置信度分数。实验结果表明,ASPIRE在各种问答数据集上明显优于目前的选择性预测方法。
增强LLM推理能力的ReFT
ReFT是一种增强大型语言模型(LLMs)推理能力的简单而有效的方法。它首先通过监督微调(SFT)对模型进行预热,然后使用在线强化学习,具体来说是本文中的PPO算法,进一步微调模型。ReFT通过自动对给定问题进行大量推理路径的采样,并从真实答案中自然地得出奖励,从而显著优于SFT。ReFT的性能可能通过结合推理时策略(如多数投票和重新排名)进一步提升。需要注意的是,ReFT通过学习与SFT相同的训练问题而获得改进,而无需依赖额外或增强的训练问题。这表明ReFT具有更强的泛化能力。
高效极限扩展大语言模型
E^2-LLM是一种高效极限扩展的大语言模型方法,通过仅需一次训练过程和大幅降低的计算成本,实现了对长上下文任务的有效支持。该方法采用了RoPE位置嵌入,并引入了两种不同的增强方法,旨在使模型在推理时更具鲁棒性。在多个基准数据集上的综合实验结果证明了E^2-LLM在挑战性长上下文任务上的有效性。
内容一致的多场景视频生成
VideoDrafter 是一个内容一致的多场景视频生成框架。它利用大型语言模型(LLM)将输入提示转换为包含多场景脚本的综合脚本,脚本包括描述事件、前景 / 背景实体以及相机运动的提示。VideoDrafter 识别脚本中的共同实体,并要求 LLM 对每个实体进行详细描述。然后,将每个实体的描述输入到文本到图像模型中,以生成每个实体的参考图像。最后,通过考虑参考图像、事件描述和相机运动,通过扩散过程生成多场景视频,扩散模型将参考图像作为条件和对齐进行处理,以增强多场景视频的内容一致性。
语言智能角色扮演开放世界游戏
LARP是一个语言智能代理框架,用于开放世界游戏中的角色扮演。它包含认知架构、环境交互和角色塑造模块,可以创造独特背景和个性的游戏角色,增强用户与智能体的交互体验。LARP通过精炼交互和连贯的长期记忆,帮助语言模型适应开放世界的复杂性,实现灵活的问题解决。
© 2024 AIbase 备案号:闽ICP备2023012347号-1