需求人群:
"目标受众为需要进行AI工作负载处理、数据流管理、目标检测、语音和推荐处理的企业和研究机构。SiFive Intelligence XM系列的高效能和高扩展性使其成为这些应用的理想选择。"
使用场景示例:
用于处理大规模AI模型训练和推理任务。
在数据中心中进行高效的数据流管理和分析。
在边缘计算设备中实现实时目标检测和语音处理。
产品特色:
SiFive Matrix Engine:采用Fat Outer Product设计,与4个X-Cores紧密集成,深度融合向量单元。
4个X-Cores每个簇:每个具有双向量单元,执行所有其他层,例如激活函数,新增指数加速指令。
新的矩阵指令:由标量单元获取,源数据来自向量寄存器,目标为每个矩阵累加器。
1个簇=16 TOPS (INT8), 8 TFLOPS (BF16) 每个GHz。
每个XM系列簇提供1TB/s的持续带宽。
XM簇通过两种方式连接到内存:CHI端口用于一致性内存访问,高带宽端口连接到SRAM以存储模型数据。
主机CPU可以是RISC-V、x86或Arm(或不出现)。
系统可以通过CHI跨多个芯片扩展。
使用教程:
1. 访问SiFive官网并下载SiFive Kernel Library。
2. 根据项目需求选择合适的XM系列配置。
3. 集成XM系列到现有的硬件或软件架构中。
4. 使用开源库加速开发过程。
5. 进行系统测试,确保性能满足预期。
6. 根据需要扩展系统,以适应更大规模的计算需求。
浏览量:54
最新流量情况
月访问量
55.31k
平均访问时长
00:01:01
每次访问页数
1.82
跳出率
43.40%
流量来源
直接访问
39.95%
自然搜索
46.48%
邮件
0.08%
外链引荐
8.38%
社交媒体
4.16%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
印度
5.00%
韩国
8.09%
美国
36.79%
越南
5.10%
高效能AI计算引擎,集成多种计算单元,提供高内存带宽。
SiFive Intelligence XM系列是SiFive推出的高效能AI计算引擎,通过集成标量、向量和矩阵引擎,为计算密集型应用提供极高的性能功耗比。该系列继续SiFive的传统,提供高效的内存带宽,并通过开源SiFive Kernel Library来加速开发时间。
SAP HANA Cloud是一种基于内存的数据库即服务(DBaaS)
SAP HANA Cloud是一种用于现代应用和分析的单一数据库即服务(DBaaS)基础。它提供了高性能、可扩展的内存数据库解决方案,可帮助企业实现实时分析、数据驱动的决策和创新。SAP HANA Cloud具有灵活的定价模型,可根据用户的需求进行灵活调整。
开源计算机视觉库
OpenCV是一个跨平台的开源计算机视觉和机器学习软件库,它提供了一系列编程功能,包括但不限于图像处理、视频分析、特征检测、机器学习等。该库广泛应用于学术研究和商业项目中,因其强大的功能和灵活性而受到开发者的青睐。
一种可扩展的内存层实现,用于在不增加计算量的情况下扩展模型参数.
Memory Layers at Scale 是一种创新的内存层实现方式,通过可训练的键值查找机制,在不增加浮点运算次数的情况下为模型增加额外的参数。这种方法在大规模语言模型中尤为重要,因为它能够在保持计算效率的同时,显著提升模型的存储和检索能力。该技术的主要优点包括高效扩展模型容量、降低计算资源消耗以及提高模型的灵活性和可扩展性。该项目由 Meta Lingua 团队开发,适用于需要处理大规模数据和复杂模型的场景。
快速且内存高效的精确注意力机制
FlexHeadFA 是一个基于 FlashAttention 的改进模型,专注于提供快速且内存高效的精确注意力机制。它支持灵活的头维度配置,能够显著提升大语言模型的性能和效率。该模型的主要优点包括高效利用 GPU 资源、支持多种头维度配置以及与 FlashAttention-2 和 FlashAttention-3 兼容。它适用于需要高效计算和内存优化的深度学习场景,尤其在处理长序列数据时表现出色。
基于LLM大模型的开源AI知识库构建平台
FastGPT是一个开源的AI知识库构建平台,提供数据处理、模型调用、RAG检索、可视化AI工作流编排等能力,帮助用户轻松构建复杂的AI应用。它支持特定领域AI客服的构建,自动化数据预处理,工作流编排,以及强大的API集成。FastGPT的优势在于其开源性、独特的QA结构、可视化工作流、无限扩展性、便于调试,并支持多种模型。
一款 AI 大模型驱动的开源知识库搭建系统。
PandaWiki 是一款基于 AI 大模型的开源知识库搭建系统,旨在帮助用户快速构建智能化的产品文档和技术文档。它的主要优势在于能够通过 AI 技术提供智能创作、问答和搜索能力,极大提升了文档管理和用户体验。适合希望利用 AI 提升工作效率的团队和企业。
教会LLMs管理自己的内存
MemGPT是一个增强了分层内存系统和一组函数的固定上下文LLM处理器,使其能够管理自己的内存。主要上下文是(固定长度的)LLM输入。MemGPT在每个处理周期解析LLM文本输出,并在执行函数调用时控制或返回控制,用于在主上下文和外部上下文之间移动数据。当LLM生成函数调用时,它可以请求立即返回执行以链接函数。在yield的情况下,LLM将不会再次运行,直到下一个外部事件触发(例如用户消息或计划中断)。
一站式AI知识库搭建系统,轻松创建企业知识库大模型、智能客服、智能问答
怪兽智能AI知识库是一款企业知识库大模型+智能AI问答机器人的一站式搭建系统。支持零代码搭建企业知识库平台,团队多人协同与权限管理,支持智能回复和第三方集成,可以轻松地集成在网站、小程序、公众号、电商平台等应用中,为企业提供智能客服和知识问答服务。
一款用于训练PyTorch计算机视觉模型的开源库。
YOLO-NAS Pose是一款免费的、开源的库,用于训练基于PyTorch的计算机视觉模型。它提供了训练脚本和快速简单复制模型结果的示例。内置SOTA模型,可以轻松加载和微调生产就绪的预训练模型,包括最佳实践和验证的超参数,以实现最佳的准确性。可以缩短训练生命周期,消除不确定性。提供分类、检测、分割等不同任务的模型,可以轻松集成到代码库中。
基于Linux环境快速部署开源大模型的教程
该项目是一个围绕开源大模型的全流程指导教程,包括环境配置、模型部署、高效微调等,简化开源大模型的使用和应用,让更多普通学习者能够使用开源大模型。项目面向对开源大模型感兴趣且想自主上手的学习者,提供详细的环境配置、模型部署和微调方法。
NeoBase 是一款开源的 AI 数据库助手,让你用自然语言与数据库交互。
NeoBase 是一款创新的 AI 数据库助手,通过自然语言处理技术让用户能够以对话的方式与数据库进行交互。它支持多种主流数据库,如 PostgreSQL、MySQL、MongoDB 等,并且可以与 OpenAI、Google Gemini 等 LLM 客户端集成。其主要优点是简化了数据库管理流程,降低了技术门槛,使非技术用户也能轻松管理和查询数据。NeoBase 采用开源模式,用户可以根据自身需求进行定制和部署,确保数据安全性和隐私性。它主要面向需要高效管理和分析数据的企业和开发者,旨在提高数据库操作的效率和便捷性。
Gen AI Toolbox for Databases 是一个开源服务器,用于简化与数据库交互的 Gen AI 工具的开发。
Gen AI Toolbox for Databases 是一个开源工具,旨在帮助开发者更轻松、快速且安全地构建与数据库交互的生成式 AI 工具。它通过处理连接池、身份验证等复杂性,简化了工具的开发和部署过程。该工具支持多种数据库,包括 AlloyDB、Cloud SQL、MySQL、PostgreSQL 等,并提供端到端的可观测性支持,如 OpenTelemetry 集成。它适用于需要高效开发和安全访问数据库的应用场景,目前是免费开源的。
专为 AI 设计的 GPU 云平台,提供高性能基础设施和全天候支持。
CoreWeave GPU 云计算是一个专为人工智能工作负载打造的云平台,提供灵活且高效的 GPU 集群,能够满足企业在大规模计算和存储方面的需求。它的主要优势包括极高的性能、可靠性和可扩展性,适合各种 AI 应用场景。通过 CoreWeave,用户能够显著降低云成本,同时提升服务响应速度,是 AI 创新的理想选择。
开源AI模型,可微调、蒸馏、部署。
Llama 3.2是一系列大型语言模型(LLMs),预训练和微调在1B和3B大小的多语言文本模型,以及11B和90B大小的文本和图像输入输出文本的模型。这些模型可以用于开发高性能和高效率的应用。Llama 3.2的模型可以在移动设备和边缘设备上运行,支持多种编程语言,并且可以通过Llama Stack构建代理应用程序。
一站式AI数字人系统,支持视频合成、声音合成、声音克隆。
AIGCPanel是一个简单易用的一站式AI数字人系统,小白也可使用。支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。产品背景信息显示,AIGCPanel旨在通过集成多种AI功能,提升数字人素材管理的效率,降低技术门槛,使非专业人士也能轻松管理和使用AI数字人。产品基于AGPL-3.0开源,完全免费,可以直接使用。
Jax 库,计算机视觉研究及更多
Scenic 是一个专注于基于注意力模型的计算机视觉研究的代码库,提供优化训练和评估循环、基线模型等功能,适用于图像、视频、音频等多模态数据。提供 SOTA 模型和基线,支持快速原型设计,价格免费。
Stability AI 生成模型是一个开源的生成模型库。
Stability AI 生成模型是一个开源的生成模型库,提供了各种生成模型的训练、推理和应用功能。该库支持各种生成模型的训练,包括基于 PyTorch Lightning 的训练,提供了丰富的配置选项和模块化的设计。用户可以使用该库进行生成模型的训练,并通过提供的模型进行推理和应用。该库还提供了示例训练配置和数据处理的功能,方便用户进行快速上手和定制。
AI资源的提示库
Prompt Library是一个AI资源的提示库,包含教师辅助工具、学生练习提示和其他用途的提示,供用户在不同场景下使用。用户可以根据需要选择不同类型的提示,帮助AI生成相关内容。
FlagCX是一个跨芯片通信库。
FlagCX是由北京人工智能研究院(BAAI)支持开发的可扩展和自适应的跨芯片通信库。它是FlagAI-Open开源计划的一部分,旨在促进AI技术的开源生态系统。FlagCX利用原生集体通信库,全面支持不同平台上的单芯片通信。支持的通信后端包括NCCL、IXCCL和CNCL。
视频驱动的 AI 内存库,通过语义搜索快速存储文本。
Memvid 是一种革命性的 AI 内存管理解决方案,通过将文本数据编码为视频,实现对数百万个文本块的快速语义搜索。它相比传统的向量数据库更加高效,存储占用小,能在没有数据库的情况下快速访问信息。该产品的价格为免费,并定位于提升知识管理和信息检索的效率。
用于体育分析的计算机视觉工具集
roboflow/sports 是一个开源的计算机视觉工具集,专注于体育领域的应用。它利用先进的图像处理技术,如目标检测、图像分割、关键点检测等,来解决体育分析中的挑战。这个工具集由Roboflow开发,旨在推动计算机视觉技术在体育领域的应用,并通过社区贡献不断优化。
知识库转AI聊天,让客户满意
Fini AI是一个强大的自助式、24/7互动聊天工具,通过训练知识库与知识库链接,帮助您更好地与用户交流并留住更多用户。不需要集成,只需添加知识库链接,即可获得互动问答聊天。为客户的所有问题提供24/7即时答案,提供一个让客户满意的神奇体验。
AI辅助量子计算
Quantum Copilot是一个AI辅助量子计算工具,帮助量子计算爱好者和专业人士编写量子计算程序。它可以用简单的语言编写量子算法,绘制量子电路,将量子代码转换为各种编程语言和库之间的格式,并在量子模拟器或实际的量子硬件上运行量子程序。Quantum Copilot由最新的人工智能和大型语言模型驱动,能够理解复杂的问题并提供准确和有用的答案。
高效开源的视觉语言模型
SmolVLM是一个小型但功能强大的视觉语言模型(VLM),拥有2B参数,以其较小的内存占用和高效性能在同类模型中处于领先地位。SmolVLM完全开源,包括所有模型检查点、VLM数据集、训练配方和工具均在Apache 2.0许可下发布。该模型适合在浏览器或边缘设备上进行本地部署,降低推理成本,并允许用户自定义。
免费开源AI模型推理服务
Tost AI是一个免费、非盈利、开源的服务,它为最新的AI论文提供推理服务,使用非盈利GPU集群。Tost AI不存储任何推理数据,所有数据在12小时内过期。此外,Tost AI提供将数据发送到Discord频道的选项。每个账户每天提供100个免费钱包余额,如果希望每天获得1100个钱包余额,可以订阅GitHub赞助者或Patreon。Tost AI将演示的所有利润都发送给论文的第一作者,其预算由公司和个人赞助者支持。
© 2025 AIbase 备案号:闽ICP备08105208号-14