提供AI边缘处理器,专为实现高性能深度学习应用而设计。
Hailo AI on the Edge Processors提供AI加速器和视觉处理器,支持边缘设备解决方案,旨在实现新时代的AI边缘处理和视频增强。产品定位于提供高性能深度学习应用,同时支持感知和视频增强。
智能文档管理和安全云存储,让您轻松访问、分享和保护数字文档。
Docaroo是一款智能文档管理工具,通过AI技术帮助用户组织、访问和保护数字文档。其安全云存储和智能提醒功能让用户更轻松地管理重要文件。
一个虚拟计算机助手,可以执行,如搜索或创建图像。
Computer Agent 是一款能够帮助用户自动化各种计算机任务的工具。它能够处理从网络搜索到图像生成等多种功能,极大提高工作效率。此产品适合希望节省时间和精力的用户,尤其是在需要频繁执行重复性任务的场合。该应用是免费的,提供了简单直观的操作界面,适合各类用户使用。
强大的网页抓取能力,支持多种客户端。
Firecrawl MCP Server 是一款集成了强大网页抓取功能的插件,支持多种 LLM 客户端如 Cursor 和 Claude。它能高效地抓取、搜索和提取网页内容,并提供自动重试及流量限制等功能,适合开发者和研究人员使用。该产品具有高度的灵活性与可扩展性,可用于批量抓取和深度研究。
用于理解任意视频中的相机运动的工具。
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。它的主要优点在于利用生成性视觉语言模型进行相机运动的原理分类和视频文本检索。通过与传统的结构从运动 (SfM) 和实时定位与*构建 (SLAM) 方法进行比较,该模型在捕捉场景语义方面显示出了显著的优势。该模型已开源,适合研究人员和开发者使用,且后续将推出更多改进版本。
一个基于深度学习的图像和视频描述模型。
Describe Anything 模型(DAM)能够处理图像或视频的特定区域,并生成详细描述。它的主要优点在于可以通过简单的标记(点、框、涂鸦或掩码)来生成高质量的本地化描述,极大地提升了计算机视觉领域的图像理解能力。该模型由 NVIDIA 和多所大学联合开发,适合用于研究、开发和实际应用中。
白板应用,作为在线 IDE,便于绘图和编码。
pad.ws 是一个白板应用程序,它将绘图和编码环境结合在一起。用户可以在浏览器中绘制、构思并与团队协作,支持直接访问终端和 VS Code。适用于任何设备,具有无缝工作流,是开发者和设计师理想的工具。该项目处于早期开发阶段,目前提供免费的 Ubuntu 开发环境,且无需复杂设置。
通过生成推理扩大过程奖励模型的测试时间计算。
GenPRM 是一种新兴的过程奖励模型(PRM),通过生成推理来提高在测试时的计算效率。这项技术能够在处理复杂任务时提供更准确的奖励评估,适用于多种机器学习和人工智能领域的应用。其主要优点是能够在资源有限的情况下优化模型性能,并在实际应用中降低计算成本。
HiPixel 是一款用于 AI 驱动的图像超分辨处理的 macOS 桌面客户端应用。
HiPixel 是一款原生 macOS 应用程序,专为图像超分辨率处理而设计。它利用 Upscayl 的 AI 模型,提供高质量图像放大功能,且通过 GPU 加速实现快速处理,适合需要图像处理的设计师和摄影师。该产品在 macOS 平台上运行流畅,支持多种图像格式,并提供便捷的文件夹监控功能。HiPixel 的定位为高效的图像处理工具,旨在提高用户的工作效率。
全新多模态推理模型,支持图文输入、文字输出,具备高精度图像感知与复杂推理能力。
Step-R1-V-Mini是阶跃星辰推出的全新多模态推理模型,支持图文输入和文字输出,具备良好的指令遵循和通用能力。该模型在多模态协同场景下的推理表现上进行了技术优化,采用了多模态联合强化学习和充分利用多模态合成数据的训练方法,有效提升了模型在图像空间的复杂链路处理能力。Step-R1-V-Mini在多个公开榜单中表现亮眼,特别是在MathVision视觉推理榜单上位列国内第一,展现了其在视觉推理、数学逻辑和代码等方面的优异表现。该模型已正式上线阶跃AI网页端,并在阶跃星辰开放平台提供API接口,供开发者和研究人员体验和使用。
为 Diffusion Transformer 提供高效灵活的控制框架。
EasyControl 是一个为 Diffusion Transformer(扩散变换器)提供高效灵活控制的框架,旨在解决当前 DiT 生态系统中存在的效率瓶颈和模型适应性不足等问题。其主要优点包括:支持多种条件组合、提高生成灵活性和推理效率。该产品是基于最新研究成果开发的,适合在图像生成、风格转换等领域使用。
Baklib 是一款企业级数字内容体验云平台。
Baklib 是一款 All in Content 的企业级云平台,帮助企业一站式管理数字内容,实现多场景的数字体验。它采用独特的三层架构,将资源库、知识库和应用库无缝连接,显著提升企业的数字化效率和用户体验。Baklib 致力于为企业提供 AI Ready 的知识库建设,确保所有数字内容可视、可管、可用。适合希望提升数字资产管理和客户体验的企业。价格方案灵活,支持免费试用。
RF-DETR 是由 Roboflow 开发的实时目标检测模型。
RF-DETR 是一个基于变压器的实时目标检测模型,旨在为边缘设备提供高精度和实时性能。它在 Microsoft COCO 基准测试中超过了 60 AP,具有竞争力的性能和快速的推理速度,适合各种实际应用场景。RF-DETR 旨在解决现实世界中的物体检测问题,适用于需要高效且准确检测的行业,如安防、自动驾驶和智能监控等。
SpatialLM 是一个用于空间理解的大语言模型。
SpatialLM 是一个专为处理 3D 点云数据设计的大型语言模型,能够生成结构化的 3D 场景理解输出,包括建筑元素和对象的语义类别。它能够从单目视频序列、RGBD 图像和 LiDAR 传感器等多种来源处理点云数据,无需专用设备。SpatialLM 在自主导航和复杂 3D 场景分析任务中具有重要应用价值,显著提升空间推理能力。
一种无混叠的任意尺度超分辨率方法。
Thera 是一种先进的超分辨率技术,能够在不同尺度下生成高质量图像。其主要优点在于内置物理观察模型,有效避免了混叠现象。该技术由 ETH Zurich 的研究团队开发,适用于图像增强和计算机视觉领域,尤其在遥感和摄影测量中具有广泛应用。
通过拍照轻松追踪卡路里。
Cal AI 是一款利用先进的人工智能技术,通过拍照快速计算食物的卡路里和营养成分的应用程序。它结合深度传感器和多模态 AI 模型,为用户提供准确的饮食跟踪。适合关注健康饮食和卡路里管理的用户,Cal AI 的使用非常简单,帮助用户轻松获取食物信息,并提高饮食意识。
© 2025 AIbase 备案号:闽ICP备08105208号-14