浏览量:127
最新流量情况
月访问量
4.67m
平均访问时长
00:07:27
每次访问页数
6.62
跳出率
37.89%
流量来源
直接访问
51.41%
自然搜索
29.45%
邮件
0.92%
外链引荐
11.72%
社交媒体
6.47%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
美国
16.52%
中国
14.70%
印度
9.14%
日本
3.64%
德国
3.30%
无需编码,自动训练、评估和部署先进的机器学习模型。
AutoTrain是Hugging Face生态系统中的一个自动化机器学习(AutoML)工具,它允许用户通过上传数据来训练定制的机器学习模型,而无需编写代码。该工具自动寻找最适合数据的模型,并快速部署。它支持多种机器学习任务,包括文本分类、图像分类、问答、翻译等,并且支持所有Hugging Face Hub上的语言。用户的数据在服务器上保持私密,并通过加密保护数据传输。根据用户选择的硬件,按分钟计费。
一款由Gradient AI团队开发的高性能文本生成模型。
Llama-3 8B Instruct 262k是一款由Gradient AI团队开发的文本生成模型,它扩展了LLama-3 8B的上下文长度至超过160K,展示了SOTA(State of the Art)大型语言模型在学习长文本操作时的潜力。该模型通过适当的调整RoPE theta参数,并结合NTK-aware插值和数据驱动的优化技术,实现了在长文本上的高效学习。此外,它还基于EasyContext Blockwise RingAttention库构建,以支持在高性能硬件上的可扩展和高效训练。
快速训练和微调大型语言模型
Unsloth 是一个旨在提高大型语言模型(LLMs)训练和微调速度的平台。它通过手动推导所有计算密集型数学步骤并手写GPU内核,实现了无需硬件更改即可显著加快训练速度。Unsloth 支持多种GPU,包括NVIDIA、AMD和Intel,并提供开源版本供用户在Google Colab或Kaggle Notebooks上免费试用。它还提供了不同级别的定价方案,包括免费版、Pro版和企业版,以满足不同用户的需求。
开源的MuZero实现,分布式AI框架
MuKoe是一个完全开源的MuZero实现,使用Ray作为分布式编排器在GKE上运行。它提供了Atari游戏的示例,并通过Google Next 2024的演讲提供了代码库的概览。MuKoe支持在CPU和TPU上运行,具有特定的硬件要求,适合需要大规模分布式计算资源的AI研究和开发。
自托管的开源OpenAI替代品,支持文本、音频、图像生成
LocalAI 是一个自托管的开源 OpenAI 替代品,可在消费级硬件上运行,支持本地或本地部署的文本、音频、图像生成。它提供了 GPT 等模型的文本生成功能,同时支持文本转语音、图像生成等多种功能。由于其开源自托管的特性,用户可以自由定制和部署,不受云端 API 限制,适合对数据隐私和安全性有要求的用户。LocalAI 的定位是为那些寻求自主控制、不依赖于第三方服务的个人用户或组织提供强大的 AI 生成能力。
Meta 新一代开源大型语言模型,性能卓越
Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。
一个基于稀疏专家模型的大型语言模型
Mixtral-8x22B是一个预训练的生成式稀疏专家语言模型。它由Mistral AI团队开发,旨在推进人工智能的开放发展。该模型具有141B个参数,支持多种优化部署方式,如半精度、量化等,以满足不同的硬件和应用场景需求。Mixtral-8x22B可以用于文本生成、问答、翻译等自然语言处理任务。
Meta自研的下一代AI训练和推理加速芯片
Meta Training and Inference Accelerator (MTIA)是Meta自研的下一代AI加速芯片。相比上一代产品, MTIA v2在计算能力和内存带宽上均有大幅提升, 可以更高效地支撑Meta的排序和推荐模型应用。这是Meta持续投资自研硬件基础设施的重要成果,将为Meta的AI产品和服务带来新的能力。
EasyContext演示了如何利用现有技术组合,来训练700K和1M上下文的语言模型。
EasyContext是一个开源项目,旨在通过结合多种技术手段,实现使用普通硬件训练语言模型的上下文长度达到100万词元。主要采用的技术包括序列并行、Deepspeed zero3离载、Flash注意力以及激活checkpoint等。该项目不提出新的创新点,而是展示如何组合现有的技术手段来实现这一目标。已成功训练出Llama-2-7B和Llama-2-13B两个模型,分别在8块A100和16块A100上实现了700K和1M词元的上下文长度。
在线人脸交换模型,可通过API运行
这是一个在线人脸交换模型,可以通过API的方式运行。用户只需上传目标图像和待交换图像,模型就可以自动完成人脸的交换。该模型由DeepFashion.us维护,预测时间通常在4秒以内,运行在Nvidia A40 GPU硬件上。产品免费使用,具有易用性强、结果逼真等优势。适用于时尚、创意等领域的人脸编辑需求。
专业的AI数字人平台,定制数字人专属IP,创造无限商业价值
怪兽智能全息舱是一个专业的AI数字人平台,致力于通过融合唤醒、语音识别、自然语音理解、虚拟人合成等AI核心技术,为用户提供多模态互动、业务办理、问题咨询、资讯播放、服务导览等服务。该平台提供智能硬件,包括业内领先的智能全息屏,以及虚拟人制作服务,帮助用户快速构建虚拟人应用产品。此外,怪兽智能全息舱还提供用户行为分析和AI多模态交互功能,以提升用户体验。该平台广泛应用于零售、文旅景区、服务型机构、政府和事业单位等场景。
革命性的AI数字签名屏,提升商店和展会参与度。
AI Desk系列是一款集成了人工智能技术的大屏显示设备,尺寸最大可达55英寸,专为提升商店和展会的参与度而设计。它融合了室内设计和AI技术,为用户带来无限可能的多元化互动体验和生成式AI功能。这款创新产品通过学习和复制品牌特有的室内设计风格,实现快速定制设计,提高了效率和个性化程度,彻底重新定义了行业。AI Desk A1是世界上首款也是唯一的AI原生硬件。
英特尔神经处理单元加速库
Intel NPU Acceleration Library是英特尔为神经处理单元(NPU)开发的加速库,旨在提高深度学习和机器学习应用的性能。该库提供了针对英特尔硬件优化的算法和工具,支持多种深度学习框架,能够显著提升模型的推理速度和效率。
新一代开源大型语言模型,性能卓越
Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。
Windows 11 AI超级分辨率功能
DirectSR是微软为Windows 11提供的一项AI超级分辨率功能,旨在帮助游戏开发者更轻松地在所有Windows设备上扩展超分辨率支持。该技术利用GPU硬件和并行化工作负载,提升游戏的视觉效果和性能。
高通AI模型优化与验证平台
Qualcomm AI Hub提供由高通优化和验证的AI模型,支持多种设备和平台。所有模型都针对高通AI引擎的硬件加速进行了优化,利用CPU、GPU和NPU的所有计算核心。
谷歌推出的开源预训练语言模型
Gemma-2b是谷歌推出的开源预训练语言模型系列,提供了多个不同规模的变体。它可以生成高质量的文本,广泛应用于问答、摘要、推理等领域。相比其他同类模型,它模型规模较小,可以部署在不同的硬件环境中。Gemma系列追求安全、高效的人工智能技术,使更多研究者和开发者可以接触前沿的语言模型技术。
Graph Neural Network (GNN)库,为苹果芯片量身打造
mlx-graphs是一个专为苹果芯片设计的图神经网络(GNN)库。它利用苹果硬件的优势,如统一内存架构,实现了在Mac设备上的高效GNN训练和推理。主要优点有:1)利用GPU并行计算,在大数据集上实现高速GNN运算;2)利用统一内存,支持在GPU上直接处理大规模图数据;3)无需设备间数据传输,简化开发流程。用户可以便捷地在Mac设备上处理大规模图问题,实现高性能GNN模型训练。
YOLOv8目标检测跟踪模型
YOLOv8是YOLO系列目标检测模型的最新版本,能够在图像或视频中准确快速地识别和定位多个对象,并实时跟踪它们的移动。相比之前版本,YOLOv8在检测速度和精确度上都有很大提升,同时支持多种额外的计算机视觉任务,如实例分割、姿态估计等。YOLOv8可通过多种格式部署在不同硬件平台上,提供一站式的端到端目标检测解决方案。
Stability AI推出高效低阈值文生图AI模型
Stable Cascade是一个基于Würstchen架构的文本到图像生成模型,相比其他模型使用更小的潜在空间进行训练和推理,因此在训练和推理速度上都有显著提升。该模型可以在消费级硬件上运行,降低了使用门槛。Stable Cascade在人类评估中表现突出,无论是在提示对齐还是图像质量上都超过了其他模型。总体而言,这是一个高效、易用、性能强劲的文生图AI模型。
创建企业级嵌入向量,一键生成
Cleora PRO是一款帮助数据科学团队在没有昂贵硬件的情况下创建高质量的客户和产品嵌入向量的工具。它可以将实体(例如客户、产品、店铺、账户等)通过嵌入向量表示,类似于文本中的Word2Vec或BERT,或者图像中的CLIP。Cleora的嵌入向量是行为型的,通过实体的行为历史来表示,这些历史以大型图的形式存在。使用Cleora PRO,您可以构建推荐系统、客户细分、倾向预测、生命周期价值建模、流失预测等企业模型。
机器学习加速 API
DirectML 是Windows上的机器学习平台API,为硬件供应商提供了一个通用的抽象层来暴露他们的机器学习加速器。它可以与任何兼容DirectX 12的设备一起使用,包括GPU和NPU。通过减少编写机器学习代码的成本,DirectML使得AI功能集成更加容易。
1.6亿参数稳定语言模型
Stable LM 2 1.6B是一个1.6亿参数的小型多语言稳定语言模型,支持英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语。该模型体积小、速度快,降低了硬件门槛,让更多开发者参与生成式AI生态系统。我们不仅发布预训练及调参版本,还首次发布预训练冷却前的最后检查点,包括优化器状态,以帮助开发者顺利进行微调和实验。
基于盘古研发大模型的智能开发助手
CodeArts Snap是华为云自研的基于盘古研发大模型的智能开发助手。它通过强大的软硬件算力底座、深厚的软件分析与安全可信基座、以及坚实的研发数据积淀,为开发者提供代码生成、知识问答、代码检查等多种智能化研发服务,大幅提高软件研发效率,释放研发生产力。
Curio通过交互硬件产品促进孩子创造力发展
Curio是一个充满魔力的玩具工坊,能让玩具产生互动并获得生命。我们致力于通过寓教于乐的交互式硬件产品来增强孩子的想象力和创造力。主要产品包括Gabbo机器人、Grem导师和Grok火箭,它们能与孩子语音交互,回答问题,讲故事,唱歌等。我们非常注重 Privacy和安全。
AI辅助量子计算
Quantum Copilot是一个AI辅助量子计算工具,帮助量子计算爱好者和专业人士编写量子计算程序。它可以用简单的语言编写量子算法,绘制量子电路,将量子代码转换为各种编程语言和库之间的格式,并在量子模拟器或实际的量子硬件上运行量子程序。Quantum Copilot由最新的人工智能和大型语言模型驱动,能够理解复杂的问题并提供准确和有用的答案。
© 2024 AIbase 备案号:闽ICP备2023012347号-1