提供AI边缘处理器,专为实现高性能深度学习应用而设计。
Hailo AI on the Edge Processors提供AI加速器和视觉处理器,支持边缘设备解决方案,旨在实现新时代的AI边缘处理和视频增强。产品定位于提供高性能深度学习应用,同时支持感知和视频增强。
一个基于 AI 的电影制作工具,助力创作。
Flow 是一个为创作者打造的 AI 电影制作工具,利用 Google DeepMind 的先进模型,用户可以轻松创建出色的电影片段、场景和故事。该工具提供了无缝的创作体验,支持用户自定义资产,或在 Flow 中生成内容。定价上,Google AI Pro 和 Google AI Ultra 两个计划提供不同的功能,适合不同需求的用户。
一个虚拟计算机助手,可以执行,如搜索或创建图像。
Computer Agent 是一款能够帮助用户自动化各种计算机任务的工具。它能够处理从网络搜索到图像生成等多种功能,极大提高工作效率。此产品适合希望节省时间和精力的用户,尤其是在需要频繁执行重复性任务的场合。该应用是免费的,提供了简单直观的操作界面,适合各类用户使用。
AI Frame是一个针对Framer的AI网站构建工具和内容生成器,帮助您自动化繁琐的工作,让您设计更智能更快速,专注于创意过程。
AI Frame是一个AI网站构建工具和内容生成器,旨在帮助用户自动化繁琐的工作,提高设计效率。其主要优点包括智能化设计、快速生成响应式网页、定制化文字生成等功能。AI Frame背景信息丰富,价格合理,定位于为设计师和创意人士提供优质的工具。
用于理解任意视频中的相机运动的工具。
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。它的主要优点在于利用生成性视觉语言模型进行相机运动的原理分类和视频文本检索。通过与传统的结构从运动 (SfM) 和实时定位与*构建 (SLAM) 方法进行比较,该模型在捕捉场景语义方面显示出了显著的优势。该模型已开源,适合研究人员和开发者使用,且后续将推出更多改进版本。
Revyme是一款强大的网站构建工具,旨在为那些希望在不编写代码的情况下打造视觉令人惊叹、富有动画的网站的创作者提供支持。
Revyme是一个让创作者能够轻松创建视觉效果丰富的动画网站的工具。其灵活性和丰富的元素库使用户能够在不需要编写代码的情况下定制网站。Revyme的主要优点包括丰富的动画效果、响应式设计、定制化程度高。
AI技术生成实时跟进的对话式调查
Duonut AI通过AI技术生成实时跟进的对话式调查,利用人工智能代理进行和总结数百次对话,适用于概念测试、客户反馈和市场研究。产品背景信息详尽,价格合理定位适用于企业和个人用户。
一个基于深度学习的图像和视频描述模型。
Describe Anything 模型(DAM)能够处理图像或视频的特定区域,并生成详细描述。它的主要优点在于可以通过简单的标记(点、框、涂鸦或掩码)来生成高质量的本地化描述,极大地提升了计算机视觉领域的图像理解能力。该模型由 NVIDIA 和多所大学联合开发,适合用于研究、开发和实际应用中。
通过生成推理扩大过程奖励模型的测试时间计算。
GenPRM 是一种新兴的过程奖励模型(PRM),通过生成推理来提高在测试时的计算效率。这项技术能够在处理复杂任务时提供更准确的奖励评估,适用于多种机器学习和人工智能领域的应用。其主要优点是能够在资源有限的情况下优化模型性能,并在实际应用中降低计算成本。
全新多模态推理模型,支持图文输入、文字输出,具备高精度图像感知与复杂推理能力。
Step-R1-V-Mini是阶跃星辰推出的全新多模态推理模型,支持图文输入和文字输出,具备良好的指令遵循和通用能力。该模型在多模态协同场景下的推理表现上进行了技术优化,采用了多模态联合强化学习和充分利用多模态合成数据的训练方法,有效提升了模型在图像空间的复杂链路处理能力。Step-R1-V-Mini在多个公开榜单中表现亮眼,特别是在MathVision视觉推理榜单上位列国内第一,展现了其在视觉推理、数学逻辑和代码等方面的优异表现。该模型已正式上线阶跃AI网页端,并在阶跃星辰开放平台提供API接口,供开发者和研究人员体验和使用。
为 Diffusion Transformer 提供高效灵活的控制框架。
EasyControl 是一个为 Diffusion Transformer(扩散变换器)提供高效灵活控制的框架,旨在解决当前 DiT 生态系统中存在的效率瓶颈和模型适应性不足等问题。其主要优点包括:支持多种条件组合、提高生成灵活性和推理效率。该产品是基于最新研究成果开发的,适合在图像生成、风格转换等领域使用。
RF-DETR 是由 Roboflow 开发的实时目标检测模型。
RF-DETR 是一个基于变压器的实时目标检测模型,旨在为边缘设备提供高精度和实时性能。它在 Microsoft COCO 基准测试中超过了 60 AP,具有竞争力的性能和快速的推理速度,适合各种实际应用场景。RF-DETR 旨在解决现实世界中的物体检测问题,适用于需要高效且准确检测的行业,如安防、自动驾驶和智能监控等。
Roblox Foundation Model for 3D Intelligence。
Cube 是一个强大的 3D 智能生成模型,旨在帮助开发者在 Roblox 平台上创建各种 3D 资产和场景。该模型具备生成 3D 对象、角色动画绑定及程序脚本生成等功能。它的出现将极大地提升创作者的生产效率,激发更多的创意,帮助用户以更快的速度构建出丰富的 3D 体验。当前版本已经开放源代码,旨在与研究社区共享,以推进 3D 智能的发展。适用于各种规模的开发者和创作者,支持实验与创新,推动负责任的使用。
一种无混叠的任意尺度超分辨率方法。
Thera 是一种先进的超分辨率技术,能够在不同尺度下生成高质量图像。其主要优点在于内置物理观察模型,有效避免了混叠现象。该技术由 ETH Zurich 的研究团队开发,适用于图像增强和计算机视觉领域,尤其在遥感和摄影测量中具有广泛应用。
通过拍照轻松追踪卡路里。
Cal AI 是一款利用先进的人工智能技术,通过拍照快速计算食物的卡路里和营养成分的应用程序。它结合深度传感器和多模态 AI 模型,为用户提供准确的饮食跟踪。适合关注健康饮食和卡路里管理的用户,Cal AI 的使用非常简单,帮助用户轻松获取食物信息,并提高饮食意识。
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
CSM 是一个由 Sesame 开发的对话式语音生成模型,它能够根据文本和音频输入生成高质量的语音。该模型基于 Llama 架构,并使用 Mimi 音频编码器。它主要用于语音合成和交互式语音应用,例如语音助手和教育工具。CSM 的主要优点是能够生成自然流畅的语音,并且可以通过上下文信息优化语音输出。该模型目前是开源的,适用于研究和教育目的。
WoolyAI 是一种通过解耦 CUDA 执行与 GPU 来实现无限制 AI 基础设施管理的技术。
WoolyAI 是一种创新的 AI 基础设施管理技术,通过其核心产品 WoolyStack,实现了将 CUDA 执行从 GPU 解耦,从而打破了传统 GPU 资源管理的限制。该技术允许用户在 CPU 基础设施上运行 Pytorch 应用,并通过 Wooly 运行时库将计算任务动态分配到远程 GPU 资源。这种架构不仅提高了资源利用率,还降低了成本,并增强了隐私和安全性。其主要面向需要高效 GPU 资源管理的企业和开发者,尤其是在云计算和 AI 开发场景中。
© 2025 AIbase 备案号:闽ICP备08105208号-14