需求人群:
"目标受众为需要进行AI工作负载处理、数据流管理、目标检测、语音和推荐处理的企业和研究机构。SiFive Intelligence XM系列的高效能和高扩展性使其成为这些应用的理想选择。"
使用场景示例:
用于处理大规模AI模型训练和推理任务。
在数据中心中进行高效的数据流管理和分析。
在边缘计算设备中实现实时目标检测和语音处理。
产品特色:
SiFive Matrix Engine:采用Fat Outer Product设计,与4个X-Cores紧密集成,深度融合向量单元。
4个X-Cores每个簇:每个具有双向量单元,执行所有其他层,例如激活函数,新增指数加速指令。
新的矩阵指令:由标量单元获取,源数据来自向量寄存器,目标为每个矩阵累加器。
1个簇=16 TOPS (INT8), 8 TFLOPS (BF16) 每个GHz。
每个XM系列簇提供1TB/s的持续带宽。
XM簇通过两种方式连接到内存:CHI端口用于一致性内存访问,高带宽端口连接到SRAM以存储模型数据。
主机CPU可以是RISC-V、x86或Arm(或不出现)。
系统可以通过CHI跨多个芯片扩展。
使用教程:
1. 访问SiFive官网并下载SiFive Kernel Library。
2. 根据项目需求选择合适的XM系列配置。
3. 集成XM系列到现有的硬件或软件架构中。
4. 使用开源库加速开发过程。
5. 进行系统测试,确保性能满足预期。
6. 根据需要扩展系统,以适应更大规模的计算需求。
浏览量:52
最新流量情况
月访问量
36.30k
平均访问时长
00:00:35
每次访问页数
1.99
跳出率
41.38%
流量来源
直接访问
39.41%
自然搜索
49.35%
邮件
0.09%
外链引荐
7.80%
社交媒体
2.70%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
印度
11.04%
韩国
8.86%
俄罗斯
5.38%
美国
15.66%
高效能AI计算引擎,集成多种计算单元,提供高内存带宽。
SiFive Intelligence XM系列是SiFive推出的高效能AI计算引擎,通过集成标量、向量和矩阵引擎,为计算密集型应用提供极高的性能功耗比。该系列继续SiFive的传统,提供高效的内存带宽,并通过开源SiFive Kernel Library来加速开发时间。
SAP HANA Cloud是一种基于内存的数据库即服务(DBaaS)
SAP HANA Cloud是一种用于现代应用和分析的单一数据库即服务(DBaaS)基础。它提供了高性能、可扩展的内存数据库解决方案,可帮助企业实现实时分析、数据驱动的决策和创新。SAP HANA Cloud具有灵活的定价模型,可根据用户的需求进行灵活调整。
开源计算机视觉库
OpenCV是一个跨平台的开源计算机视觉和机器学习软件库,它提供了一系列编程功能,包括但不限于图像处理、视频分析、特征检测、机器学习等。该库广泛应用于学术研究和商业项目中,因其强大的功能和灵活性而受到开发者的青睐。
一种可扩展的内存层实现,用于在不增加计算量的情况下扩展模型参数.
Memory Layers at Scale 是一种创新的内存层实现方式,通过可训练的键值查找机制,在不增加浮点运算次数的情况下为模型增加额外的参数。这种方法在大规模语言模型中尤为重要,因为它能够在保持计算效率的同时,显著提升模型的存储和检索能力。该技术的主要优点包括高效扩展模型容量、降低计算资源消耗以及提高模型的灵活性和可扩展性。该项目由 Meta Lingua 团队开发,适用于需要处理大规模数据和复杂模型的场景。
快速且内存高效的精确注意力机制
FlexHeadFA 是一个基于 FlashAttention 的改进模型,专注于提供快速且内存高效的精确注意力机制。它支持灵活的头维度配置,能够显著提升大语言模型的性能和效率。该模型的主要优点包括高效利用 GPU 资源、支持多种头维度配置以及与 FlashAttention-2 和 FlashAttention-3 兼容。它适用于需要高效计算和内存优化的深度学习场景,尤其在处理长序列数据时表现出色。
基于LLM大模型的开源AI知识库构建平台
FastGPT是一个开源的AI知识库构建平台,提供数据处理、模型调用、RAG检索、可视化AI工作流编排等能力,帮助用户轻松构建复杂的AI应用。它支持特定领域AI客服的构建,自动化数据预处理,工作流编排,以及强大的API集成。FastGPT的优势在于其开源性、独特的QA结构、可视化工作流、无限扩展性、便于调试,并支持多种模型。
教会LLMs管理自己的内存
MemGPT是一个增强了分层内存系统和一组函数的固定上下文LLM处理器,使其能够管理自己的内存。主要上下文是(固定长度的)LLM输入。MemGPT在每个处理周期解析LLM文本输出,并在执行函数调用时控制或返回控制,用于在主上下文和外部上下文之间移动数据。当LLM生成函数调用时,它可以请求立即返回执行以链接函数。在yield的情况下,LLM将不会再次运行,直到下一个外部事件触发(例如用户消息或计划中断)。
一站式AI知识库搭建系统,轻松创建企业知识库大模型、智能客服、智能问答
怪兽智能AI知识库是一款企业知识库大模型+智能AI问答机器人的一站式搭建系统。支持零代码搭建企业知识库平台,团队多人协同与权限管理,支持智能回复和第三方集成,可以轻松地集成在网站、小程序、公众号、电商平台等应用中,为企业提供智能客服和知识问答服务。
一款 AI 大模型驱动的开源知识库搭建系统。
PandaWiki 是一款基于 AI 大模型的开源知识库搭建系统,旨在帮助用户快速构建智能化的产品文档和技术文档。它的主要优势在于能够通过 AI 技术提供智能创作、问答和搜索能力,极大提升了文档管理和用户体验。适合希望利用 AI 提升工作效率的团队和企业。
基于Linux环境快速部署开源大模型的教程
该项目是一个围绕开源大模型的全流程指导教程,包括环境配置、模型部署、高效微调等,简化开源大模型的使用和应用,让更多普通学习者能够使用开源大模型。项目面向对开源大模型感兴趣且想自主上手的学习者,提供详细的环境配置、模型部署和微调方法。
一款用于训练PyTorch计算机视觉模型的开源库。
YOLO-NAS Pose是一款免费的、开源的库,用于训练基于PyTorch的计算机视觉模型。它提供了训练脚本和快速简单复制模型结果的示例。内置SOTA模型,可以轻松加载和微调生产就绪的预训练模型,包括最佳实践和验证的超参数,以实现最佳的准确性。可以缩短训练生命周期,消除不确定性。提供分类、检测、分割等不同任务的模型,可以轻松集成到代码库中。
NeoBase 是一款开源的 AI 数据库助手,让你用自然语言与数据库交互。
NeoBase 是一款创新的 AI 数据库助手,通过自然语言处理技术让用户能够以对话的方式与数据库进行交互。它支持多种主流数据库,如 PostgreSQL、MySQL、MongoDB 等,并且可以与 OpenAI、Google Gemini 等 LLM 客户端集成。其主要优点是简化了数据库管理流程,降低了技术门槛,使非技术用户也能轻松管理和查询数据。NeoBase 采用开源模式,用户可以根据自身需求进行定制和部署,确保数据安全性和隐私性。它主要面向需要高效管理和分析数据的企业和开发者,旨在提高数据库操作的效率和便捷性。
专为 AI 设计的 GPU 云平台,提供高性能基础设施和全天候支持。
CoreWeave GPU 云计算是一个专为人工智能工作负载打造的云平台,提供灵活且高效的 GPU 集群,能够满足企业在大规模计算和存储方面的需求。它的主要优势包括极高的性能、可靠性和可扩展性,适合各种 AI 应用场景。通过 CoreWeave,用户能够显著降低云成本,同时提升服务响应速度,是 AI 创新的理想选择。
开源AI模型,可微调、蒸馏、部署。
Llama 3.2是一系列大型语言模型(LLMs),预训练和微调在1B和3B大小的多语言文本模型,以及11B和90B大小的文本和图像输入输出文本的模型。这些模型可以用于开发高性能和高效率的应用。Llama 3.2的模型可以在移动设备和边缘设备上运行,支持多种编程语言,并且可以通过Llama Stack构建代理应用程序。
Gen AI Toolbox for Databases 是一个开源服务器,用于简化与数据库交互的 Gen AI 工具的开发。
Gen AI Toolbox for Databases 是一个开源工具,旨在帮助开发者更轻松、快速且安全地构建与数据库交互的生成式 AI 工具。它通过处理连接池、身份验证等复杂性,简化了工具的开发和部署过程。该工具支持多种数据库,包括 AlloyDB、Cloud SQL、MySQL、PostgreSQL 等,并提供端到端的可观测性支持,如 OpenTelemetry 集成。它适用于需要高效开发和安全访问数据库的应用场景,目前是免费开源的。
一站式AI数字人系统,支持视频合成、声音合成、声音克隆。
AIGCPanel是一个简单易用的一站式AI数字人系统,小白也可使用。支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。产品背景信息显示,AIGCPanel旨在通过集成多种AI功能,提升数字人素材管理的效率,降低技术门槛,使非专业人士也能轻松管理和使用AI数字人。产品基于AGPL-3.0开源,完全免费,可以直接使用。
Jax 库,计算机视觉研究及更多
Scenic 是一个专注于基于注意力模型的计算机视觉研究的代码库,提供优化训练和评估循环、基线模型等功能,适用于图像、视频、音频等多模态数据。提供 SOTA 模型和基线,支持快速原型设计,价格免费。
Stability AI 生成模型是一个开源的生成模型库。
Stability AI 生成模型是一个开源的生成模型库,提供了各种生成模型的训练、推理和应用功能。该库支持各种生成模型的训练,包括基于 PyTorch Lightning 的训练,提供了丰富的配置选项和模块化的设计。用户可以使用该库进行生成模型的训练,并通过提供的模型进行推理和应用。该库还提供了示例训练配置和数据处理的功能,方便用户进行快速上手和定制。
AI资源的提示库
Prompt Library是一个AI资源的提示库,包含教师辅助工具、学生练习提示和其他用途的提示,供用户在不同场景下使用。用户可以根据需要选择不同类型的提示,帮助AI生成相关内容。
FlagCX是一个跨芯片通信库。
FlagCX是由北京人工智能研究院(BAAI)支持开发的可扩展和自适应的跨芯片通信库。它是FlagAI-Open开源计划的一部分,旨在促进AI技术的开源生态系统。FlagCX利用原生集体通信库,全面支持不同平台上的单芯片通信。支持的通信后端包括NCCL、IXCCL和CNCL。
视频驱动的 AI 内存库,通过语义搜索快速存储文本。
Memvid 是一种革命性的 AI 内存管理解决方案,通过将文本数据编码为视频,实现对数百万个文本块的快速语义搜索。它相比传统的向量数据库更加高效,存储占用小,能在没有数据库的情况下快速访问信息。该产品的价格为免费,并定位于提升知识管理和信息检索的效率。
用于体育分析的计算机视觉工具集
roboflow/sports 是一个开源的计算机视觉工具集,专注于体育领域的应用。它利用先进的图像处理技术,如目标检测、图像分割、关键点检测等,来解决体育分析中的挑战。这个工具集由Roboflow开发,旨在推动计算机视觉技术在体育领域的应用,并通过社区贡献不断优化。
知识库转AI聊天,让客户满意
Fini AI是一个强大的自助式、24/7互动聊天工具,通过训练知识库与知识库链接,帮助您更好地与用户交流并留住更多用户。不需要集成,只需添加知识库链接,即可获得互动问答聊天。为客户的所有问题提供24/7即时答案,提供一个让客户满意的神奇体验。
AI辅助量子计算
Quantum Copilot是一个AI辅助量子计算工具,帮助量子计算爱好者和专业人士编写量子计算程序。它可以用简单的语言编写量子算法,绘制量子电路,将量子代码转换为各种编程语言和库之间的格式,并在量子模拟器或实际的量子硬件上运行量子程序。Quantum Copilot由最新的人工智能和大型语言模型驱动,能够理解复杂的问题并提供准确和有用的答案。
高效开源的视觉语言模型
SmolVLM是一个小型但功能强大的视觉语言模型(VLM),拥有2B参数,以其较小的内存占用和高效性能在同类模型中处于领先地位。SmolVLM完全开源,包括所有模型检查点、VLM数据集、训练配方和工具均在Apache 2.0许可下发布。该模型适合在浏览器或边缘设备上进行本地部署,降低推理成本,并允许用户自定义。
免费开源AI模型推理服务
Tost AI是一个免费、非盈利、开源的服务,它为最新的AI论文提供推理服务,使用非盈利GPU集群。Tost AI不存储任何推理数据,所有数据在12小时内过期。此外,Tost AI提供将数据发送到Discord频道的选项。每个账户每天提供100个免费钱包余额,如果希望每天获得1100个钱包余额,可以订阅GitHub赞助者或Patreon。Tost AI将演示的所有利润都发送给论文的第一作者,其预算由公司和个人赞助者支持。
© 2025 AIbase 备案号:闽ICP备08105208号-14