需求人群:
"FlagPerf的目标受众为AI硬件厂商、研究人员和开发者,他们需要一个公正、全面的平台来评估和比较不同AI硬件的性能。该平台提供的多维度评测和开源特性,使其成为AI领域技术评估的重要工具。"
使用场景示例:
NVIDIA使用FlagPerf测试其A100芯片的性能。
百度PaddlePaddle团队利用FlagPerf集成Llama模型进行性能评估。
华为昇思MindSpore团队通过FlagPerf测试框架性能。
产品特色:
构建多维度评测指标体系,包含性能指标、资源使用指标及生态适配能力指标。
支持多样例场景及任务,覆盖计算机视觉、自然语言处理等领域的30余个经典模型。
支持多训练框架及推理引擎,如PyTorch、TensorFlow,并与PaddlePaddle、MindSpore等国产框架合作。
支持多测试环境,综合考察单卡、单机、多机性能。
严格审核参评代码,确保测试过程公正、结果公平。
开源所有测试代码,确保测试过程、数据可复现。
使用教程:
1. 安装docker和python环境。
2. 确保硬件驱动、网络、硬件虚拟化等服务器基础配置齐全。
3. 下载FlagPerf项目代码并部署到服务器。
4. 修改机器配置文件,包括硬件配置和测试环境设置。
5. 启动测试,根据需要选择基础规格评测、算子评测、训练评测或推理评测。
6. 查看测试结果和日志,分析AI硬件的性能表现。
浏览量:88
最新流量情况
月访问量
5.21m
平均访问时长
00:06:29
每次访问页数
6.12
跳出率
35.96%
流量来源
直接访问
52.10%
自然搜索
32.78%
邮件
0.05%
外链引荐
12.82%
社交媒体
2.16%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
13.96%
德国
3.65%
印度
9.02%
俄罗斯
4.03%
美国
19.10%
开源AI芯片性能基准测试平台
FlagPerf是由智源研究院联合AI硬件厂商共建的一体化AI硬件评测引擎,旨在建立以产业实践为导向的指标体系,评测AI硬件在软件栈组合(模型+框架+编译器)下的实际能力。该平台支持多维度评测指标体系,覆盖大模型训练推理场景,并支持多训练框架及推理引擎,连接AI硬件与软件生态。
FoloUp 是一个用于招聘的 AI 驱动语音面试平台。
FoloUp 是一款专注于招聘流程的 AI 驱动语音面试平台。它通过智能生成面试问题、实时语音交互和深度分析候选人回答,帮助企业高效筛选和评估候选人。该平台利用先进的 AI 技术,确保面试过程的自然流畅,并提供详细的候选人表现报告。FoloUp 旨在通过技术提升招聘效率,降低人力成本,同时为候选人提供更公平的面试体验。目前,该平台以开源形式提供,支持自定义部署和使用。
大规模机器人学习数据集,推动多用途机器人策略发展。
AGIBOT WORLD是一个专为推进多用途机器人策略而设计的大规模机器人学习数据集。它包括基础模型、基准测试和一个生态系统,旨在为学术界和工业界提供高质量的机器人数据,为具身AI铺平道路。该数据集包含100多台机器人的100万条以上轨迹,覆盖100多个真实世界场景,涉及精细操控、工具使用和多机器人协作等任务。它采用尖端的多模态硬件,包括视觉触觉传感器、耐用的6自由度灵巧手和具有全身控制的移动双臂机器人,支持模仿学习、多智能体协作等研究。AGIBOT WORLD的目标是改变大规模机器人学习,推进可扩展的机器人系统生产,是一个开源平台,邀请研究人员和实践者共同塑造具身AI的未来。
专业用户的性能测试基准套件
Procyon是由UL Solutions开发的一套性能测试基准工具,专为工业、企业、政府、零售和媒体的专业用户设计。Procyon套件中的每个基准测试都提供了一致且熟悉的体验,并共享一套共同的设计和功能。灵活的许可模式意味着用户可以根据自己的需求选择适合的单个基准测试。Procyon基准测试套件很快将提供一系列针对专业用户的基准测试和性能测试,每个基准测试都针对特定用例设计,并尽可能使用真实应用。UL Solutions与行业合作伙伴紧密合作,确保每个Procyon基准测试准确、相关且公正。
AMD开源平台,提升AI、ML和HPC工作负载性能
AMD ROCm™ 6.3是AMD开源平台的一个重要里程碑,引入了先进的工具和优化,以提升在AMD Instinct GPU加速器上的AI、机器学习(ML)和高性能计算(HPC)工作负载。ROCm 6.3旨在增强从创新AI初创企业到HPC驱动行业的广泛客户的开发人员生产力。
快速AI推理,为开源模型提供即时智能。
Groq是一家提供高性能AI芯片和云服务的公司,专注于为AI模型提供超低延迟的推理服务。其产品GroqCloud™自2024年2月推出以来,已经有超过467,000名开发者使用。Groq的AI芯片技术由Meta的首席AI科学家Yann LeCun提供技术支持,并且获得了BlackRock领投的6.4亿美元融资,公司估值达到28亿美元。Groq的技术优势在于其能够无缝地从其他提供商迁移到Groq,仅需更改三行代码,并且与OpenAI的端点兼容。Groq的AI芯片旨在挑战Nvidia在AI芯片市场的领导地位,为开发者和企业提供更快、更高效的AI推理解决方案。
世界上最快的AI芯片,拥有惊人的4万亿晶体管
Cerebras Systems宣布推出其第三代5纳米晶圆级引擎(WSE-3),这是一款专为训练业界最大AI模型而设计的芯片。WSE-3的性能是前代产品WSE-2的两倍,同时保持相同的功耗和价格。该芯片基于5纳米工艺,拥有4万亿晶体管,通过900,000个为AI优化的计算核心,提供125 petaflops的峰值AI性能。
© 2025 AIbase 备案号:闽ICP备08105208号-14