浏览量:34
构建监督式大型语言模型的无代码平台
Supervised AI是一个无代码AI开发平台,利用OpenAI的GPT引擎,构建由您自己的数据支持的监督式大型语言模型。您可以使用我们的自定义模型和数据源,在高准确率和快速开发的环境下构建强大且可扩展的AI。同时,您还可以使用Supervised API将您的AI模型集成到任何地方。
为边缘设备提供无代码人工智能
Neuton TinyML 是一款无代码人工智能平台,可自动构建极小模型并嵌入到任何微控制器和传感器中。它基于专利神经网络框架,能够在保持准确性的同时实现极小的模型大小。
免费试用无代码人工智能!
Codenull.ai是一款无代码人工智能平台,让用户能够构建各种人工智能模型而无需编写一行代码。用户可以利用这些模型进行投资组合优化、智能投顾、推荐引擎、欺诈检测等多种应用。该平台支持用户准备数据、训练AI模型,并提供个性化定制模型。Codenull.ai还提供多种功能,包括推荐引擎、欺诈检测、客户获取成本预测等。用户还可以利用该平台进行销售收入预测、医疗分类、资产组合优化、智能投顾、物流成本预测等多种应用。Codenull.ai提供免费试用,注册即可获得6个月免费使用权。
简单、可组合的无代码人工智能
Gooey.AI是一个简单、可组合的无代码人工智能平台,帮助用户轻松运行最好的生成式人工智能模型。它提供一个统一的计费账户和可发现的工作流程。用户可以利用它进行文本生成、图像生成、视频生成等任务,无需编写任何代码。Gooey.AI的优势在于简化了人工智能模型的运行流程,让用户能够快速获得高质量的生成结果。平台的定价和定位信息请参考官方网站。
人工智能入门教程网站,提供全面的机器学习与深度学习知识。
该网站由作者从 2015 年开始学习机器学习和深度学习,整理并编写的一系列实战教程。涵盖监督学习、无监督学习、深度学习等多个领域,既有理论推导,又有代码实现,旨在帮助初学者全面掌握人工智能的基础知识和实践技能。网站拥有独立域名,内容持续更新,欢迎大家关注和学习。
推动人工智能安全治理,促进技术健康发展
《人工智能安全治理框架》1.0版是由全国网络安全标准化技术委员会发布的技术指南,旨在鼓励人工智能创新发展的同时,有效防范和化解人工智能安全风险。该框架提出了包容审慎、确保安全,风险导向、敏捷治理,技管结合、协同应对,开放合作、共治共享等原则。它结合人工智能技术特性,分析风险来源和表现形式,针对模型算法安全、数据安全和系统安全等内生安全风险,以及网络域、现实域、认知域、伦理域等应用安全风险,提出了相应的技术应对和综合防治措施。
基于大型语言模型的智能代理研究
xLAM是一个由Salesforce AI Research团队开发的基于大型语言模型(Large Language Models, LLMs)的智能代理研究项目。它通过聚合来自不同环境的智能代理轨迹,标准化并统一这些轨迹到一致的格式,以创建一个优化的通用数据加载器,专门用于智能代理的训练。xLAM-v0.1-r是此模型系列的0.1版本,专为研究目的设计,与VLLM和FastChat平台兼容。
提供企业级大型语言模型和预测人工智能,帮助企业提升预测能力
Wand AI是一款基于企业级大型语言模型和预测人工智能的数据管理工具。通过使用Wand AI,您可以将数据转化为AI,大大提高业务的预测能力。Wand AI提供自助式、无代码、无麻烦的操作,专为业务用户打造。您只需专注于自己的业务需求,Wand平台为您提供所需的AI解决方案。无论是销售和营销、客户成功、人力资源、风险与合规、运营、采购等领域,Wand AI都能为您提供强大的功能和优势。请访问官方网站了解更多信息。
先进的大型语言模型,用于编程
Code Llama 是一款先进的大型语言模型,可以通过文本提示生成代码。它是当前公开可用的语言模型中在编程任务上达到最佳性能的模型之一。Code Llama 可以帮助开发人员提高工作效率,降低编码门槛,并作为一个教育工具帮助编程学习者编写更健壮、更好文档化的软件。Code Llama 提供了多个版本,包括基础版、针对 Python 的专用版和针对自然语言指令的定制版。它支持多种流行的编程语言,如 Python、C++、Java 等。Code Llama 免费供研究和商业使用。
多语言大型语言模型
Llama 3.2是由Meta公司推出的多语言大型语言模型(LLMs),包含1B和3B两种规模的预训练和指令调优生成模型。这些模型在多种语言对话用例中进行了优化,包括代理检索和总结任务。Llama 3.2在许多行业基准测试中的表现优于许多现有的开源和封闭聊天模型。
Stability AI推出的Stable Code Instruct 3B,一款基于代码指令的大型语言模型
Stability AI宣布推出Stable Code Instruct 3B,这是一个大型的语言模型,专门设计用于理解和执行代码相关的指令。该模型的目的是帮助开发者更高效地编写、审查和优化代码,提高软件开发的生产力。
构建一个会讲故事的人工智能大型语言模型。
LLM101n是一个开源课程,旨在教授如何从头开始构建一个能讲故事的人工智能大型语言模型(LLM)。课程内容涵盖了从基础到高级的多个方面,包括语言模型、机器学习、深度学习框架等,适合希望深入理解AI和LLM的编程人员和研究人员。
vivo自主研发的智能语言理解模型
蓝心大模型是vivo自主研发的智能语言理解模型,具有70亿模型参数量,可以处理32K上下文长度。它基于260TB的多语言训练语料,拥有强大的语言理解能力,可以广泛应用于内容创作、知识问答、逻辑推理、代码生成等场景,持续为用户提供安全可靠的人机交互体验。该模型已通过严格的安全合规检测,输出结果安全合规。
京东自主研发的人工智能开放平台
京东人工智能开放平台NeuHub,汇聚京东自主研发的人工智能核心技术,包含语音、图像、视频、NLP等技术,通过平台向外开放,助力行业智能升级。平台还提供数据标注、模型开发、训练和发布等全流程服务,以及创新应用案例,帮助企业实现智能化转型。
人工智能领域的多轮对话处理专家
汉王天地大模型是汉王科技推出的一款专注于人工智能领域的大语言模型,拥有30年的行业积累。它能够实现多轮对话,高效处理任务,并深耕办公、教育、人文等多个垂直细分领域。该模型通过从人类反馈中进行强化学习,不断优化自身智能,提供包括智能校对、自动翻译、法律咨询、绘画生成、文案生成等在内的多样化服务,以赋能法律、人文、办公、教育、医养等行业,提升效率和创意。
大型语言模型,支持多语言和代码数据
Mistral-Nemo-Instruct-2407是由Mistral AI和NVIDIA联合训练的大型语言模型(LLM),是Mistral-Nemo-Base-2407的指导微调版本。该模型在多语言和代码数据上进行了训练,显著优于大小相似或更小的现有模型。其主要特点包括:支持多语言和代码数据训练、128k上下文窗口、可替代Mistral 7B。模型架构包括40层、5120维、128头维、1436隐藏维、32个头、8个kv头(GQA)、2^17词汇量(约128k)、旋转嵌入(theta=1M)。该模型在多种基准测试中表现出色,如HellaSwag(0-shot)、Winogrande(0-shot)、OpenBookQA(0-shot)等。
开源多模态大型语言模型系列
InternVL 2.5是基于InternVL 2.0的高级多模态大型语言模型系列,它在保持核心模型架构的同时,在训练和测试策略以及数据质量方面引入了显著的增强。该模型深入探讨了模型扩展与性能之间的关系,系统地探索了视觉编码器、语言模型、数据集大小和测试时配置的性能趋势。通过在包括多学科推理、文档理解、多图像/视频理解、现实世界理解、多模态幻觉检测、视觉定位、多语言能力和纯语言处理在内的广泛基准测试中进行的广泛评估,InternVL 2.5展现出了与GPT-4o和Claude-3.5-Sonnet等领先商业模型相媲美的竞争力。特别是,该模型是第一个在MMMU基准测试中超过70%的开源MLLM,通过链式思考(CoT)推理实现了3.7个百分点的提升,并展示了测试时扩展的强大潜力。
OLAMI是一个人工智能开放平台
OLAMI是一个提供云端API、管理界面、多元机器感知解决方案的人工智能软件开发平台。OLAMI平台具有语音识别、自然语言理解、对话管理、语音合成等语音AI技术,以及图像识别、语义理解等视觉AI技术,可以轻松地为产品加入人工智能,提升用户体验。
定制化大型语言模型的训练平台
Entry Point AI是一款训练大型语言模型的平台,可以快速高效地进行训练、管理和评估自定义模型,无需编写代码。它提供了跨平台的训练工具,可以比较模型性能、标注数据集、生成合成数据,并以速度和质量优于基于对话的模型。
私密且无审查的人工智能平台,提供文本、图像和代码生成等功能。
Venice 是一个以隐私保护为核心的人工智能平台,提供文本生成、图像生成和代码生成等多种功能。它强调用户数据的私密性,所有数据仅存储在用户设备上,不会上传至服务器。该平台利用领先的开源 AI 技术,提供无审查、无偏见的智能服务,旨在为用户提供一个自由探索创意和知识的环境。Venice 提供免费和付费两种账户选项,付费用户可享受更高分辨率的图像、无水印、无限制的提示次数等高级功能。
一个新的高效开源大型语言模型标准
DBRX是一个由Databricks的Mosaic研究团队构建的通用大型语言模型(LLM),在标准基准测试中表现优于所有现有开源模型。它采用Mixture-of-Experts (MoE)架构,使用362亿个参数,拥有出色的语言理解、编程、数学和逻辑推理能力。DBRX旨在推动高质量开源LLM的发展,并且便于企业根据自身数据对模型进行定制。Databricks为企业用户提供了交互式使用DBRX、利用其长上下文能力构建检索增强系统,并基于自身数据构建定制DBRX模型的能力。
先进的人工智能大模型系列
智源悟道3.0是智源研究院开发的先进人工智能大模型系列,包括AquilaChat对话模型、AquilaCode文本代码生成大模型以及多种视觉大模型。产品功能涵盖流畅的文本对话、多语言生成任务、文本代码生成、多模态和视觉处理等。其特点包括多样化、高性能、开源、多语言支持和可扩展性。适用于多种芯片架构和深度学习框架,主要面向科研和开发社区,开源免费。
无代码应用开发平台
NeoApps.AI是一款革命性的SAAS平台,利用人工智能简化和优化应用开发过程。它使用AI驱动的聊天机器人帮助用户定义清晰的需求,并自动生成代码、构建数据库、生成API和设计用户界面,从而快速、高效地开发和部署定制的应用程序。它适用于各种行业,提供了针对医疗保健、教育、电子商务、金融等不同行业需求的模块,具备可定制和可扩展的特性。
先进的代码优化和编译器推理的大型语言模型。
LLM Compiler-7b是Meta开发的一款专注于代码优化和编译器推理的大型语言模型。它基于Code Llama模型,通过深度学习优化代码,支持编译器中间表示、汇编语言和优化的理解。此模型在减少代码大小和从汇编到编译器中间表示的反编译方面展现出卓越的性能,是编译器研究人员和工程师的有力工具。
通过加权平均奖励模型提高大型语言模型的效率和可靠性。
WARM是一种通过加权平均奖励模型(WARM)来对齐大型语言模型(LLMs)与人类偏好的解决方案。首先,WARM对多个奖励模型进行微调,然后在权重空间中对它们进行平均。通过加权平均,WARM相对于传统的预测集成方法提高了效率,同时改善了在分布转移和偏好不一致性下的可靠性。我们的实验表明,WARM在摘要任务上的表现优于传统方法,使用最佳N和RL方法,WARM提高了LLM预测的整体质量和对齐性。
前沿级多模态大型语言模型,实现视觉-语言任务的先进性能。
NVLM 1.0是一系列前沿级的多模态大型语言模型(LLMs),在视觉-语言任务上取得了与领先专有模型和开放访问模型相媲美的先进成果。值得注意的是,NVLM 1.0在多模态训练后,其文本性能甚至超过了其LLM主干模型。我们为社区开源了模型权重和代码。
使用大型语言模型进行逆向工程:反编译二进制代码
LLM4Decompile是一个开源项目,旨在创建并发布第一个专门用于反编译的LLM(大型语言模型),并通过构建首个专注于可重编译性和可执行性的反编译基准测试来评估其能力。该项目通过编译大量C代码样本到汇编代码,然后使用这些数据对DeepSeek-Coder模型进行微调,构建了评估基准Decompile-Eval。
Seed-Coder 是一个开源的 8B 代码大型语言模型系列。
Seed-Coder 是字节跳动 Seed 团队推出的开源代码大型语言模型系列,包含基础、指令和推理模型,旨在通过最小的人力投入,自主管理代码训练数据,从而显著提升编程能力。该模型在同类开源模型中表现优越,适合于各种编码任务,定位于推动开源 LLM 生态的发展,适用于研究和工业界。
© 2025 AIbase 备案号:闽ICP备08105208号-14