快速、准确、免费的AI文本摘要工具。
AI 文本摘要工具利用人工智能技术快速提取文本关键信息,节省阅读时间。其主要优点包括准确性高、速度快、支持多语言。背景信息包括公司成立时间、团队背景及技术优势。定位于提高工作效率和学习效率的生产力工具。
将任何内容转化为AI记忆,构建您的第二大脑。
SigmaNote是一款AI记忆工具,能将各种文件、链接转化为可编辑的AI笔记,帮助用户随时随地搜索、交流和组织信息。其AI技术提供快速转换、智能编辑和便捷聊天功能,提高工作效率。
DiffRhythm 是一个基于扩散模型技术的 AI 音乐生成平台,可快速将歌词转化为专业音乐作品。
DiffRhythm 是一款革命性的 AI 音乐生成工具,采用先进的潜在扩散模型技术,能够快速生成包含人声和伴奏的完整歌曲。它通过简洁的输入要求和高效的非自回归结构,极大地简化了音乐创作流程,使创作者能够在短时间内探索多种音乐风格和创意。该平台支持多语言歌词输入,特别适合音乐创作者、艺术家和教育工作者,帮助他们在艺术创作、教育和娱乐领域实现高效音乐生成。
DiffRhythm 是一种基于潜在扩散模型的端到端全曲生成技术,可在短时间内生成包含人声和伴奏的完整歌曲。
DiffRhythm 是一种创新的音乐生成模型,利用潜在扩散技术实现了快速且高质量的全曲生成。该技术突破了传统音乐生成方法的限制,无需复杂的多阶段架构和繁琐的数据准备,仅需歌词和风格提示即可在短时间内生成长达 4 分 45 秒的完整歌曲。其非自回归结构确保了快速的推理速度,极大地提升了音乐创作的效率和可扩展性。该模型由西北工业大学音频、语音和语言处理小组(ASLP@NPU)和香港中文大学(深圳)大数据研究院共同开发,旨在为音乐创作提供一种简单、高效且富有创造力的解决方案。
致力于通过自然语音技术,打造个人语音伴侣和全天候可穿戴轻量级眼镜设备。
Sesame 是一个专注于语音技术的跨学科产品和研究团队,旨在通过自然语音交互,让用户与计算机的交互更加自然和高效。其主要产品包括个人语音伴侣和轻量级可穿戴眼镜设备,旨在实现计算机的拟人化,帮助用户更好地组织信息、提升效率。产品的主要优点是语音交互的自然性和设备的便携性,适合日常使用。目前,Sesame 正在积极招聘,致力于推动语音技术的创新。
在Mac上与多个AI模型聊天,支持屏幕共享和多模型合成。
Chorus是一款面向桌面的AI聊天工具,支持多种先进AI模型的集成和交互。它通过强大的合成技术将不同AI模型的响应整合为单一输出,极大地提升了用户体验。Chorus的主要优点包括高性能、多模型支持和本地化运行,使其成为个人计算和生产力提升的重要工具。产品目前主要面向技术爱好者和专业人士,提供高效、灵活的AI交互体验。其定价策略尚未明确,但已提供0.5.36版本的更新。
Raycast 推出 AI Extensions,通过自然语言命令与电脑上的应用程序对话并执行任务。
Raycast AI Extensions 是一款面向桌面用户的生产力工具,通过自然语言交互技术,用户可以无需打开应用程序即可完成任务。它支持多种 AI 模型,能够与操作系统无缝集成,并提供个性化定制功能。该产品主要面向需要高效完成任务的专业人士,如开发者、项目经理等,目前处于 beta 版,仅面向 Pro 用户开放。
Lora 是一个为移动设备优化的本地语言模型,支持 iOS 和 Android 平台。
Lora 是一款为移动设备优化的本地语言模型,通过其 SDK 可以快速集成到移动应用中。它支持 iOS 和 Android 平台,性能与 GPT-4o-mini 相当,拥有 1.5GB 大小和 24 亿参数,专为实时移动推理进行了优化。Lora 的主要优点包括低能耗、轻量化和快速响应,相比其他模型,它在能耗、体积和速度上都有显著优势。Lora 由 PeekabooLabs 提供,主要面向开发者和企业客户,帮助他们快速将先进的语言模型能力集成到移动应用中,提升用户体验和应用竞争力。
Ai2 OLMoE 是一款可在 iOS 设备上运行的开源语言模型应用
OLMoE 是由 Ai2 开发的开源语言模型应用,旨在为研究人员和开发者提供一个完全开放的工具包,用于在设备上进行人工智能实验。该应用支持在 iPhone 和 iPad 上离线运行,确保用户数据完全私密。它基于高效的 OLMoE 模型构建,通过优化和量化,使其在移动设备上运行时保持高性能。该应用的开源特性使其成为研究和开发新一代设备端人工智能应用的重要基础。
On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。
On-device Sora 是一个开源项目,旨在通过线性比例跳跃(LPL)、时间维度标记合并(TDTM)和动态加载并发推理(CI-DL)等技术,实现在移动设备(如 iPhone 15 Pro)上高效的视频生成。该项目基于 Open-Sora 模型开发,能够根据文本输入生成高质量视频。其主要优点包括高效性、低功耗和对移动设备的优化。该技术适用于需要在移动设备上快速生成视频内容的场景,如短视频创作、广告制作等。项目目前开源,用户可以免费使用。
MNN 是阿里巴巴开源的轻量级高性能推理引擎,支持多种主流模型格式。
MNN 是阿里巴巴淘系技术开源的深度学习推理引擎,支持 TensorFlow、Caffe、ONNX 等主流模型格式,兼容 CNN、RNN、GAN 等常用网络。它通过极致优化算子性能,全面支持 CPU、GPU、NPU,充分发挥设备算力,广泛应用于阿里巴巴 70+ 场景下的 AI 应用。MNN 以高性能、易用性和通用性著称,旨在降低 AI 部署门槛,推动端智能的发展。
一个用于智能设备等的多模态原生代理框架。
OmAgent是一个多模态原生代理框架,用于智能设备等。它采用分治算法高效解决复杂任务,能预处理长视频并以类似人类的精度进行问答,还能基于用户请求和可选天气条件提供个性化服装建议等。目前官网未明确显示价格,但从功能来看,主要面向需要高效任务处理和智能交互的用户群体,如开发者、企业等。
桌面端 AI 英语词源词典,内置四六级、托福词汇表的单词信息。
SSShooter/en-etymology-dict 是一款桌面端 AI 英语词源词典,旨在帮助用户更好地理解和记忆英语单词。产品通过 AI 技术生成单词的词源、使用场景、同义词、反义词、形似词和派生词等信息,为用户提供全面的单词学习体验。该产品适合英语学习者,尤其是需要备考四六级、托福等英语考试的学生。产品目前是免费的,定位为教育领域的辅助学习工具。
J1 Assistant 是一款创新的智能助手,支持多种设备和独特交互方式.
罗永浩旗下 AI 初创项目 Jarvis 现已悄悄在海外上线,目前其官网展示了一款名为 J1 Assistant 的聚合类 AI 助理软件,暂时仅拥有安卓版本。J1 Assistant 是由 Matter Innovation Inc. 开发的智能助手应用,旨在提高用户的生产力和生活效率。它支持多种设备,包括 Samsung Galaxy 和 Pixel 系列手机。J1 Assistant 的核心功能包括 Notes 和 To Do,用户可以通过这些功能创建运动指南、健康饮食计划和学习计划等。此外,J1 Assistant 引入了独特的 Ripple Touch 交互方式,为用户提供更加直观和便捷的操作体验。该应用的背景信息显示,它是由 Matter Innovation Inc. 在 2025 年推出的,旨在通过技术创新提升用户的生活质量。目前,J1 Assistant 的定价策略尚未明确,但其目标是为广泛的用户提供高效、便捷的智能助手服务.
开源的端到端自动驾驶多模态模型
OpenEMMA是一个开源项目,复现了Waymo的EMMA模型,提供了一个端到端框架用于自动驾驶车辆的运动规划。该模型利用预训练的视觉语言模型(VLMs)如GPT-4和LLaVA,整合文本和前视摄像头输入,实现对未来自身路径点的精确预测,并提供决策理由。OpenEMMA的目标是为研究人员和开发者提供易于获取的工具,以推进自动驾驶研究和应用。
企业级设备上的智能AI
Nexa AI提供企业级的设备上的智能AI解决方案,包括Tiny Multimodal Models和Seamless Edge Deployment解决方案,旨在构建私密、成本效益高且可靠的设备上AI。产品背景强调了在没有互联网连接的情况下也能提供可靠的能力,适用于各种挑战性环境,如偏远地区、油和气矿场、互联网受限的工作场所、极端位置等。Nexa AI的产品定位是为企业提供定制化的设备上模型和本地部署解决方案,以增强控制和速度,无论是在本地还是在任何设备上。
端侧全模态理解模型,软硬协同释放无穹端侧智能
Infini-Megrez是一个由无问芯穹研发的端侧全模态理解模型,它基于Megrez-3B-Instruct扩展,具备图片、文本、音频三种模态数据的理解分析能力,并在图像理解、语言理解和语音理解三个方面均取得最优精度。该模型通过软硬协同优化,确保了各结构参数与主流硬件高度适配,推理速度领先同精度模型最大300%。它简单易用,采用最原始的LLaMA结构,开发者无需任何修改便可将模型部署于各种平台,最小化二次开发复杂度。此外,Infini-Megrez还提供了完整的WebSearch方案,使模型可以自动决策搜索调用时机,在搜索和对话中自动切换,并提供更好的总结效果。
© 2025 AIbase 备案号:闽ICP备08105208号-14