需求人群:
"适用于需要进行时间序列预测的研究人员和开发者,如金融市场分析、销售预测、资源规划等领域。"
使用场景示例:
金融分析师使用Chronos模型预测股票价格走势
零售商利用Chronos进行销售预测以优化库存管理
能源公司通过Chronos模型预测电力需求,以实现更有效的资源分配
产品特色:
时间序列转换为标记序列
使用交叉熵损失训练语言模型
通过采样获得概率性预测
浏览量:60
最新流量情况
月访问量
467127.54k
平均访问时长
00:07:27
每次访问页数
6.62
跳出率
37.89%
流量来源
直接访问
51.41%
自然搜索
29.45%
邮件
0.92%
外链引荐
11.72%
社交媒体
6.47%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
美国
16.52%
中国
14.70%
印度
9.14%
日本
3.64%
德国
3.30%
时序预测的解码器基础模型
TimesFM是一款基于大型时序数据集预训练的解码器基础模型,具有200亿参数。相较于大型语言模型,虽然规模较小,但在不同领域和时间粒度的多个未见数据集上,其零-shot性能接近最先进的监督方法。TimesFM无需额外训练即可提供出色的未见时间序列预测。
AI without Code. No new Technology. No new Skills.
Manas是一款AI产品,可以帮助用户自动化和加速获取和理解客户数据。通过使用Manas,用户可以增加收入、降低成本和自动化流程。Manas提供了多种功能,如销售推荐、价格预测、产品评级改进、情感分析、实时网站和事件警报、客户保留预测、营销组合优化、支持票务分类、资产监控、财务信号与警报、文本分类、自动化非结构化数据处理、时间序列预测、成本优化、在线商店图片标记等。Manas不需要编码,不需要新技术,也不需要新技能。
Visual Autoregressive Modeling: 新的视觉生成范式
VAR是一种新的视觉自回归建模方法,能够超越扩散模型,实现更高效的图像生成。它建立了视觉生成的幂律scaling laws,并具备零shots的泛化能力。VAR提供了一系列不同规模的预训练模型,供用户探索和使用。
用于视觉合成的统一3D Transformer流水线
NUWA是由微软开发的一系列研究项目,包括NUWA、NUWA-Infinity、NUWA-LIP、Learning 3D Photography Videos和NUWA-XL。这些项目涉及视觉合成的预训练模型,能够生成或操纵视觉数据,如图像和视频,以执行多种视觉合成任务。
无需相机校准信息的密集立体3D重建
DUSt3R是一种新颖的密集和无约束立体3D重建方法,适用于任意图像集合。它不需要事先了解相机校准或视点姿态信息,通过将成对重建问题视为点图的回归,放宽了传统投影相机模型的严格约束。DUSt3R提供了一种统一的单目和双目重建方法,并在多图像情况下提出了一种简单有效的全局对齐策略。基于标准的Transformer编码器和解码器构建网络架构,利用强大的预训练模型。DUSt3R直接提供场景的3D模型和深度信息,并且可以从中恢复像素匹配、相对和绝对相机信息。
强大的中文语言模型
Beagle14-7B 是一个强大的中文语言模型,可以用于各种自然语言处理任务。它基于多个预训练模型进行了合并,包含丰富的语言知识和表达能力。Beagle14-7B 具有高效的文本生成能力和准确的语义理解能力,可以广泛应用于聊天机器人、文本生成、摘要提取等任务。Beagle14-7B 的定价信息请访问官方网址了解详情。
无需视频制作经验,通过简单操作即可生成精细控制的视频
DragNUWA是一款视频生成工具,能够通过直接操作背景或图像,将动作转化为摄像机运动或目标物体运动,生成对应的视频。DragNUWA 1.5基于稳定视频扩散技术,可根据特定路径使图像动起来。DragNUWA 1.0利用文字、图像和轨迹作为三个重要的控制因素,从语义、空间和时间上促进高度可控的视频生成。用户可通过git克隆仓库、下载预训练模型,并在桌面端进行图像拖拽生成动画。
高效多模态大型语言模型
TinyGPT-V 是一种高效的多模态大型语言模型,通过使用小型骨干网络来实现。它具有强大的语言理解和生成能力,适用于各种自然语言处理任务。TinyGPT-V 采用 Phi-2 作为预训练模型,具备出色的性能和效率。
VCoder是一款视觉感知模型,可提高多模态大型语言模型在对象级视觉任务上的性能。
VCoder是一个适配器,可通过辅助感知模式作为控制输入来提高多模态大型语言模型在对象级视觉任务上的性能。VCoder LLaVA是基于LLaVA-1.5构建的。VCoder不微调LLaVA-1.5的参数,因此在通用的问答基准测试中的性能与LLaVA-1.5相同。VCoder在COST数据集上进行了基准测试,在语义、实例和全景分割任务上都取得了不错的性能。作者还发布了模型的检测结果和预训练模型。
3D人物生成模型
En3D是一个提供先进自然语言处理模型的平台。他们提供了各种各样的模型和数据集,以帮助开发者构建和部署自然语言处理应用。En3D平台的优势在于提供了大量预训练模型和方便的部署工具,使得开发者能够快速、高效地构建自然语言处理应用。
探索创新的GPTs,改善您的日常生活和工作。
GPTs Gallery是一个展示创新GPT(生成式预训练模型)的平台。通过解锁AI的力量,您可以做出更好的决策,提升创造力,为日常生活增添一些乐趣。订阅GPTs Gallery,迎接更明亮、更智能的未来!
统一文本到文本转换器
Google T5 是一个统一的文本到文本转换器,通过在大型文本语料库上进行预训练,可以实现在多个 NLP 任务上取得最先进的结果。它提供了加载、预处理、混合和评估数据集的代码,并且可以用于对已发布的预训练模型进行微调。
借助 AutoML Vision 从图像中发掘有价值的信息、利用预训练的 Vision API 模型,或使用 Vertex AI Vision 创建计算机视觉应用
Vision AI 提供了三种计算机视觉产品,包括 Vertex AI Vision、自定义机器学习模型和 Vision API。您可以使用这些产品从图像中提取有价值的信息,进行图像分类和搜索,并创建各种计算机视觉应用。Vision AI 提供简单易用的界面和功能强大的预训练模型,满足不同用户需求。
用于 Node.js 应用的开源 AI,速度提升最多 67 倍。
EnergeticAI 是针对无服务器环境优化的 TensorFlow.js,具有快速冷启动、小模块大小和预训练模型。它提供预训练的嵌入以用于推荐等功能。用户可以通过 npm 安装,具有商业友好的许可。EnergeticAI 最大化冷启动性能,同时最小化模块大小。
模型和数据集的集合
Distil-Whisper是一个提供模型和数据集的平台,用户可以在该平台上访问各种预训练模型和数据集,并进行相关的应用和研究。该平台提供了丰富的模型和数据集资源,帮助用户快速开展自然语言处理和机器学习相关工作。
语义增强数据成就是AI定制解决方案
Semiring是一个端到端的平台,能够通过少量样本数据生成高质量合成数据集,从而使开发者可以轻松创建高性能的机器学习模型。它提供了完整的ML模型构建流程,包括数据合成、模型训练、评估和部署。关键功能及优势包括:基于先进自然语言模型的高效数据合成;支持自定义域特定数据;无缝自动标注;多样化的预训练模型库;自动模型调优;一体化的云端训练服务;简易的API集成和高速推理等。相比于直接提示大型语言模型和自建方案,Semiring以其卓越的速度、成本效益和质量优势脱颖而出。
一款用于训练PyTorch计算机视觉模型的开源库。
YOLO-NAS Pose是一款免费的、开源的库,用于训练基于PyTorch的计算机视觉模型。它提供了训练脚本和快速简单复制模型结果的示例。内置SOTA模型,可以轻松加载和微调生产就绪的预训练模型,包括最佳实践和验证的超参数,以实现最佳的准确性。可以缩短训练生命周期,消除不确定性。提供分类、检测、分割等不同任务的模型,可以轻松集成到代码库中。
技术全球领跑
Yi是一款全球领先的预训练模型,在多项评测中取得了SOTA国际最佳性能指标表现。它具有轻巧的模型尺寸,超越了大尺寸开源模型,更加友好于开发者社群。零一万物适合个人及研究用途,并且已具备大模型涌现能力,适用于多元场景,满足开源社区的刚性需求。Yi开源模型对学术研究完全开放,并且同步开放免费商用申请。
基于自然语言查询的开放领域音频源分离模型
AudioSep是一种基于自然语言查询的开放领域音频源分离模型。它由文本编码器和分离模型两个关键组件组成。我们在大规模多模态数据集上训练AudioSep,并在许多任务上广泛评估其能力,包括音频事件分离、乐器分离和语音增强。AudioSep表现出强大的分离性能和令人印象深刻的零样本泛化能力,使用音频标题或文本标签作为查询,大大优于以前的音频查询和语言查询声音分离模型。为了保证本工作的可重复性,我们将发布源代码、评估基准和预训练模型。
稳定签名:将水印根植于潜在扩散模型中
Stable Signature是一种将水印嵌入图像中的方法,它使用潜在扩散模型(LDM)来提取和嵌入水印。该方法具有高度的稳定性和鲁棒性,可以在多种攻击下保持水印的可读性。Stable Signature提供了预训练模型和代码实现,用户可以使用它来嵌入和提取水印。
Stable Diffusion XL AI, 开源的 AI 图片生成器
稳定扩散 AI 是一种开源的深度学习文本到图像生成模型,由 CompVis 团队与 Runway ML 联合开发,并获得 Stability AI 的运算支持。它可以根据文本描述生成高质量图片,也可以进行图像补全、外推以及文本指导下的图像到图像转换。稳定扩散 AI 开源了其代码、预训练模型和许可证,允许用户在单个 GPU 上运行。这使其成为第一个可以在用户本地设备上运行的开源深度文本到图像模型。
开源跨平台的机器学习框架,能够轻松地在不同设备上构建机器学习应用
MediaPipe是一个由Google开发的开源跨平台机器学习框架,它能够帮助开发者通过简单的API轻松地在不同设备(手机、平板、浏览器、IoT设备等)上构建复杂的机器学习模型和应用。MediaPipe支持多种编程语言,内置了人脸识别、手势识别、目标追踪等多种预训练模型,开发者可以快速集成这些模型来开发智能应用。MediaPipe还支持模型压缩和量化技术,可以将模型大小缩小10倍以上,这对于在移动端部署机器学习模型非常有利。总体来说,MediaPipe是一个非常易用和高效的机器学习开发框架。
提供模型探索体验、推理、训练、部署和应用服务
魔搭社区是一个人工智能模型的开发者社区。它汇聚各领域最先进的机器学习模型,为用户提供模型探索、定制、训练、部署和应用的一站式服务。用户可以便捷地搜索感兴趣的模型,快速上手使用。同时,社区还开源了众多预训练模型,开发者可以基于这些模型进行二次开发。魔搭社区致力于降低AI开发门槛,帮助开发者更便捷地获取、使用AI能力。
快意大模型
「快意」大模型(KwaiYii)是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),包括预训练模型和对话模型。KwaiYii-13B-Base 预训练模型具备优异的通用技术底座能力,KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力。多个权威 Benchmark 结果表明 KwaiYii-13B 模型在各领域具备领先水平。
AI图像和视频生成工具
Bria是一款AI图像和视频生成工具,提供完整的API套件和预训练模型,帮助用户自动化和扩展图像和视频的创作过程。通过Bria,用户可以使用AI生成定制的图像和视频,扩展图像尺寸,定制背景,删除或替换对象,修改演讲者形象,将品牌标识嵌入图像等。Bria具有高性能和高质量的生成能力,确保生成的内容符合版权和隐私规定。Bria还采用负责任的AI技术,维护公平性,避免偏见,保证产品的道德和公正性。Bria支持多种使用场景和行业,适用于生产力,设计,商业,教育等领域。
在数据库环境中通过单一接口应用OpenAI GPT和Hugging Face等NLP模型对文本数据进行处理
NLP数据库是一款在数据库环境中应用自然语言处理模型的工具。它能够通过简单的SQL命令对文本数据进行分类、标注、摘要、翻译等操作。通过使用OpenAI GPT和Hugging Face等先进的预训练模型,可以将非结构化的数据转化为有价值的见解。同时,NLP数据库能够在数据层面直接生成预测和推理结果,并提供了灵活易用的接口,减少了开发复杂性和部署的工作量。用户可以根据自己的需求,将NLP模型与数据层无缝集成,构建多层次的人工智能解决方案。
© 2024 AIbase 备案号:闽ICP备2023012347号-1