需求人群:
"目标受众包括需要实时翻译和音频管理的用户,如商务人士、学生、教师和内容创作者。AI Hear适合他们因为它提供了一个不依赖网络的本地解决方案,保护隐私的同时,也提供了高性价比的实时翻译服务。"
使用场景示例:
在没有网络的教室中,使用AI Hear进行课程录音和实时翻译。
在户外直播时,使用AI Hear进行语音转文字和翻译,以便不同语言的观众理解。
在国际会议中,使用AI Hear记录会议内容并实时翻译,提高会议效率。
产品特色:
录音:软件内选择系统声音、麦克风或指定软件,如腾讯会议、浏览器、播放器。
语音识别:基于OpenAI Whisper模型的语音转文字功能。
翻译:软件内自由切换引擎,支持Ollama,OpenAI等开放接口格式。
保存:完成录制后自动保存音频、原本、译文、时间轴。
导出:支持SRT,TXT,VTT格式导出。
硬件要求:macOS系统,M1及以上系列芯片,即将支持Windows系统。
使用教程:
1. 下载并安装AI Hear软件。
2. 启动软件,根据需要选择录音源,如系统声音、麦克风或指定软件。
3. 选择语音识别和翻译引擎,如OpenAI Whisper模型。
4. 开始录音,软件将自动进行语音识别和翻译。
5. 完成录音后,软件会自动保存音频、原本、译文和时间轴。
6. 如有需要,可以将录制的内容导出为SRT、TXT或VTT格式。
7. 根据使用反馈,定期更新软件以获取最新的功能和优化。
浏览量:128
一款在您电脑本地运行的私有软件,提供多语种实时翻译。
AI Hear是一款在电脑本地运行的私有软件,它通过一键开启多语种实时翻译功能,帮助用户管理音频、译文和时间轴。产品不收集数据,保护用户隐私。它适用于多种场景,如线上会议、网课播客、游戏直播等,并且完全本地运行,相比市面上的实时翻译产品更具性价比。
一款简单易用的无限录音转文字APP,支持中英双语实时翻译。
inFin:Infinite AI Voice Notes 是一款专为提高工作效率而设计的语音笔记应用。它利用先进的人工智能技术,将录音实时转换为文字,并支持中英文的无限实时翻译。该产品的主要优点在于其简洁的用户界面和强大的功能,能够在各种场景下为用户提供便捷的记录和翻译服务。产品背景信息显示,它是由昱晗马开发,旨在为用户提供一个简单但卓越的语音记录解决方案。该应用是免费的,适合需要高效记录和翻译的用户。
AI驱动的打字机,将语音转换为100多种语言的文字。
Dial8是一款AI驱动的语音转文字软件,专为Mac用户设计。它支持100多种语言的语音转文字,并优化了本地处理,确保用户数据的隐私性。Dial8的本地处理方式意味着用户的语音数据完全在用户自己的Mac上处理,不会离开用户的计算机,从而保证了隐私和安全性。Dial8以其快速的转录速度、低资源消耗、离线工作能力和深度操作系统集成等特点,为用户提供了无缝的语音到文本的转换体验。
一个提供历史记录保存和对话延续功能的智能问答平台。
Rabbithole是一个智能问答平台,用户可以登录后保存自己的提问和对话历史,随时回顾和继续之前的讨论。它强调对话的连续性和个性化体验,适合需要长期知识积累和深度交流的用户。从技术角度看,它可能利用了自然语言处理和人工智能技术来实现智能问答,其主要优点是方便用户管理和回顾信息,提升知识获取的效率。
快速轻松地从视频中训练高质量的LoRA模型
One Shot LoRA 是一个专注于从视频中快速训练 LoRA 模型的在线平台。它利用先进的机器学习技术,能够将视频内容高效转化为 LoRA 模型,为用户提供快速、便捷的模型生成服务。该产品的主要优点是操作简单、无需登录且隐私安全。它无需用户上传私人数据,也不存储或收集任何用户信息,确保用户数据的私密性和安全性。该产品主要面向需要快速生成 LoRA 模型的用户,如设计师、开发者等,帮助他们快速获取所需的模型资源,提升工作效率。
使用AI技术,将旅行照片转化为个性化世界Map,分享你的冒险经历。
BeenThere是一款基于AI技术的旅行照片追踪应用。它通过智能图像识别,帮助用户将旅行中拍摄的照片自动标记到世界Map上,生成个性化的旅行故事。该应用强调隐私保护,不追踪用户位置或个人数据,仅通过照片内容进行识别。其主要优点包括操作简单、社区互动性强,适合喜欢旅行和记录生活的人群。目前,该应用在App Store和Google Play上均可下载,具体价格未在页面中明确说明。
隐私优先的AI会议助手,自动记录会议笔记,提升会议效率。
Meetily是一款专注于提升会议效率的AI工具,通过实时音频捕捉和转录,自动生成会议总结和行动项。其核心优势在于隐私保护,所有处理均在本地完成,确保数据安全。此外,它采用开源AI模型,成本效益高,适合对隐私和成本敏感的企业或个人使用。Meetily提供多种部署方式,包括免费的自托管版本和付费的专业版,满足不同用户的需求。
Ai2 OLMoE 是一款可在 iOS 设备上运行的开源语言模型应用
OLMoE 是由 Ai2 开发的开源语言模型应用,旨在为研究人员和开发者提供一个完全开放的工具包,用于在设备上进行人工智能实验。该应用支持在 iPhone 和 iPad 上离线运行,确保用户数据完全私密。它基于高效的 OLMoE 模型构建,通过优化和量化,使其在移动设备上运行时保持高性能。该应用的开源特性使其成为研究和开发新一代设备端人工智能应用的重要基础。
Xyne 是一款开源的、以 AI 为先的搜索与答案引擎,专为工作场景设计。
Xyne 是一款面向工作场景的 AI 驱动的搜索与答案引擎。它能够整合企业内部的各种应用数据,提供精准的信息检索和答案生成服务。Xyne 的核心技术包括语义图谱和基于上下文的检索增强(RAG),能够理解知识、人员、沟通和项目之间的关系,从而提供更全面的搜索结果。其主要优点包括开源、隐私保护、灵活部署(本地、云端或设备端)以及与现有权限体系的无缝兼容。Xyne 定位为一个隐私优先、开源的工作 AI 平台,适合需要高效信息检索和知识管理的企业和团队。
将PDF转换为音频内容,打造个性化的AI有声读物。
NVIDIA的PDF to Podcast Blueprint是一种基于生成式AI的应用程序,能够将PDF文档(如培训资料、技术研究或文档)转换为个性化的音频内容。该技术利用大型语言模型(LLMs)、文本到语音(TTS)技术以及NVIDIA NIM微服务,将PDF数据转换为引人入胜的音频内容,帮助用户在移动中学习,同时解决信息过载的问题。该解决方案完全基于NVIDIA的云基础设施运行,无需本地GPU硬件,确保隐私合规性,并可根据用户需求定制品牌、分析、实时翻译或数字人界面等功能。
Shell Sage 是一款智能终端助手,让命令行操作更直观、更安全。
Shell Sage 是一款面向开发人员和命令行用户的智能终端助手。它通过 AI 技术帮助用户更安全、更高效地执行命令行操作。该产品支持本地和云模式,用户可以根据需求选择隐私优先的本地处理或性能更优的云服务。其主要优点包括隐私保护、智能错误诊断和自然语言命令支持。Shell Sage 旨在提升开发人员的工作效率,同时降低命令行操作的风险。
本地运行的AI模型训练与部署工具,支持个性化训练和多平台使用。
Kolosal AI 是一款用于本地设备训练和运行大型语言模型(LLMs)的工具。它通过简化模型训练、优化和部署流程,使用户能够在本地设备上高效地使用 AI 技术。该工具支持多种硬件平台,提供快速的推理速度和灵活的定制能力,适合从个人开发者到大型企业的广泛应用场景。其开源特性也使得用户可以根据自身需求进行二次开发。
Hibiki 是一款用于流式语音翻译(即同声传译)的模型,能够实时逐块生成正确翻译。
Hibiki 是一款专注于流式语音翻译的先进模型。它通过实时积累足够的上下文信息来逐块生成正确的翻译,支持语音和文本翻译,并可进行声音转换。该模型基于多流架构,能够同时处理源语音和目标语音,生成连续的音频流和时间戳文本翻译。其主要优点包括高保真语音转换、低延迟实时翻译以及对复杂推理策略的兼容性。Hibiki 目前支持法语到英语的翻译,适合需要高效实时翻译的场景,如国际会议、多语言直播等。模型开源免费,适合开发者和研究人员使用。
一个用于在网站上提问的Chrome扩展程序,支持本地运行和向量存储。
Site RAG 是一款 Chrome 扩展程序,旨在通过自然语言处理技术帮助用户在浏览网页时快速获取问题答案。它支持将当前页面内容作为上下文进行查询,还能将整个网站内容索引到向量数据库中,以便后续进行检索增强生成(RAG)。该产品完全在本地浏览器运行,确保用户数据安全,同时支持连接本地运行的 Ollama 实例进行推理。它主要面向需要快速从网页内容中提取信息的用户,如开发者、研究人员和学生。目前该产品免费提供,适合希望在浏览网页时获得即时帮助的用户。
一款支持本地AI运行及通过OpenRouter连接多种AI模型的移动应用。
Apollo AI是专注隐私保护与本地运行的聊天应用,可本地运行小语言模型或连OpenRouter,保护隐私,售价5.99美元,定位高端隐私工具。
Llamao 是一款注重隐私的离线版 ChatGPT 替代品,可在移动设备上使用。
Llamao 是一款基于开源 LLM 模型的离线 AI 助手,专注于保护用户隐私。它运行在本地设备上,无需联网即可使用,适合对隐私和数据安全有较高要求的用户。其主要优点是完全离线、数据不外泄、且提供智能写作、问题解决等多功能支持。产品目前提供免费基础版本,高级功能可付费解锁。
通过一分钟视频日记记录生活,借助AI分析情绪,实现自我提升。
Your Daily Minute 是一款专注于个人成长和情绪管理的应用程序。它利用AI技术分析用户每日记录的一分钟视频日记,帮助用户深入了解自己的情绪模式和行为习惯。该产品通过安全、私密的方式存储用户数据,确保用户信息的保密性。其主要优点包括便捷性、隐私保护以及强大的AI分析功能,能够为用户提供有价值的自我洞察。该产品目前主要面向希望通过日常记录实现自我提升的用户,价格和具体定位尚未明确。
结合DeepSeek R1推理能力和Claude创造力及代码生成能力的统一API和聊天界面。
DeepClaude是一个强大的AI工具,旨在将DeepSeek R1的推理能力与Claude的创造力和代码生成能力相结合,通过统一的API和聊天界面提供服务。它利用高性能的流式API(用Rust编写)实现即时响应,同时支持端到端加密和本地API密钥管理,确保用户数据的隐私和安全。该产品是完全开源的,用户可以自由贡献、修改和部署。其主要优点包括零延迟响应、高度可配置性以及支持用户自带密钥(BYOK),为开发者提供了极大的灵活性和控制权。DeepClaude主要面向需要高效代码生成和AI推理能力的开发者和企业,目前处于免费试用阶段,未来可能会根据使用量收费。
Enki是一款帮助用户快速保存和管理链接、笔记的在线应用。
Enki是一款专为互联网时代设计的生产力工具,旨在帮助用户高效地管理数字生活中的各种信息。它通过简单易用的界面和强大的AI技术,让用户能够快速保存网页链接、笔记等内容,并通过智能分类和搜索功能轻松找到所需信息。Enki的主要优点在于其极简的操作流程和强大的隐私保护功能,用户无需进行繁琐的标签分类或文件夹管理,即可实现信息的快速保存和检索。该产品定位为一款个人知识管理助手,适合那些在信息洪流中需要快速整理和回顾重要信息的用户。目前,Enki已推出iOS版本,未来还计划推出Android版本,以满足更多用户的需求。
将问题和表单转化为个性化聊天AI,获取即时见解并生成病毒式内容
Yapz 是一个基于人工智能的平台,能够将问题和表单转化为个性化的聊天AI。其核心功能是通过与用户的互动,快速获取信息并将其转化为有价值的见解和内容。该技术的重要性在于,它能够帮助企业或个人以更高效的方式收集和分析数据,同时通过生成病毒式内容来扩大影响力。Yapz 由 datarockets 和 collabs 共同打造,致力于保护用户隐私。目前尚不清楚其具体价格和定位,但从其功能来看,可能主要面向需要高效收集信息和内容创作的用户群体。
防止GPT降智的浏览器插件,通过伪装访问行为提升ChatGPT的使用体验。
GPT-foolproof是一款针对ChatGPT的浏览器插件,旨在防止OpenAI对ChatGPT输出能力的限制。它通过浏览器指纹混淆、设备特征模拟和隐私保护增强等技术手段,伪装用户访问行为,从而避免被OpenAI检测为受限账号或污染IP。该插件的主要优点是能够提升用户在Web端使用ChatGPT时的体验,避免因账号或IP问题导致的降智现象。它适用于需要频繁使用ChatGPT进行高效沟通和内容创作的用户,尤其是那些对AI输出质量要求较高的群体。
Ash 是一款提供 24/7 支持的个性化 AI 心理咨询助手,助力你成为更好的自己。
Ash AI Counselor 是一款专注于心理健康和自我提升的 AI 辅导工具。它通过结合心理学和心理健康领域的前沿研究成果,为用户提供即时的知识支持和行为改变策略。其主要优点包括隐私优先、无偏见的陪伴以及多会话记忆功能,能够帮助用户应对日常生活中的压力、人际关系挑战等。该产品以 APP 的形式呈现,旨在通过便捷的移动设备使用体验,让用户随时随地获得心理支持。其定位是为用户提供一个安全、私密且高效的自我提升平台,帮助用户在个人成长的道路上迈出重要一步。目前未明确提及价格,但根据其功能和定位推测,可能会采用付费或免费试用的模式。
与先进AI学习60种外语,跨越语言边界,提升口语能力。
TalkAI练口语是一款先进的口语学习工具,通过AI技术为用户提供一对一的口语陪聊服务,支持超过60种语言。其重要性在于帮助用户突破语言障碍,提升口语水平,无论是初学者还是希望提升口语能力的学习者都能从中受益。该产品由深圳市惊叹科技有限公司开发,于2021年12月03日成立,注册地位于深圳市宝安区。其服务对象广泛,包括学校、企业和个人用户,致力于通过技术创新推动语言学习的普及和发展。目前暂无明确公开的价格信息,但根据其功能和服务范围,推测其可能采用付费模式或提供部分免费试用服务。
秒画趣拍是一款创新型的AI数字分身制作软件,让用户轻松生成专业级别的写真。
秒画趣拍是一款专为年轻人设计的AI写真社区应用。它通过先进的AI技术,让用户能够快速生成高质量的写真照片,满足用户在不同场景下的拍摄需求。该应用的核心优势在于其高效生成能力和隐私保护措施,同时提供多样化的模板和简洁友好的用户界面。秒画趣拍以免费的形式推出,旨在为用户提供一种全新的数字创作体验。
一款支持多语言的智能会议笔记助手,可自动转录、总结并支持多种工具集成。
Spellar是一款基于人工智能的会议笔记助手,支持100多种语言的语音转录和自动总结。它通过智能语音识别和自然语言处理技术,帮助用户在会议、讲座或任何需要记录的场景中高效捕捉关键信息。其主要优点包括无缝的多平台支持、高精度的语音识别和总结能力,以及强大的隐私保护功能。该产品定位为专业人士、学生和远程团队提供高效、便捷的会议记录解决方案,支持免费下载并提供多种付费订阅选项。
OpenLIT是用于GenAI和LLM应用可观察性的开源平台。
OpenLIT是一个开源的AI工程平台,专注于生成式AI和大型语言模型(LLM)应用的可观察性。它通过提供代码透明度、隐私保护、性能可视化等功能,帮助开发者简化AI开发流程,提高开发效率和应用性能。作为开源项目,用户可以自由查看代码或自行托管,确保数据安全和隐私。其主要优点包括易于集成、支持OpenTelemetry原生集成、提供细粒度的使用洞察等。OpenLIT面向AI开发者、数据科学家和企业,旨在帮助他们更好地构建、优化和管理AI应用。目前未明确具体价格,但从开源特性来看,可能对基础功能提供免费使用。
世界首个免费无限制AI图像生成器,由Flux.1-Dev模型支持,无需登录,无限生成。
Raphael是一款强大的AI图像生成工具,其核心是先进的Flux.1-Dev模型。该产品完全免费,无需用户注册或登录,即可无限生成高质量的AI图像。它不仅为创作者提供了强大的图像生成能力,还通过零数据保留政策保护用户隐私。其定位是成为全球最大的免费AI图像生成器,适用于各种需要图像生成的场景,如艺术创作、营销设计、游戏开发等。
在口袋里拥有十亿参数,与私有本地大型语言模型聊天。
fullmoon是一款由Mainframe开发的本地智能应用,允许用户在本地设备上与大型语言模型进行聊天。它支持完全离线操作,优化了Apple硅芯片的模型运行,提供了个性化的主题、字体和系统提示调整功能。作为一款免费、开源且注重隐私的应用,它为用户提供了一种简单、安全的方式来利用强大的语言模型进行交流和创作。
© 2025 AIbase 备案号:闽ICP备08105208号-14