需求人群:
"目标受众为需要隐私保护和数据控制的用户,特别是那些对个人电脑屏幕记录敏感信息有较高要求的用户。Pensieve适合他们因为它提供了一个开源的解决方案,允许用户完全控制自己的数据存储和处理,避免了数据泄露的风险。"
使用场景示例:
用户A使用Pensieve记录日常工作中的屏幕操作,以便快速检索历史记录。
用户B利用Pensieve的向量搜索功能,快速找到包含特定项目信息的截图。
用户C通过Pensieve与Ollama的集成,实现了对无文本图片的高效视觉搜索。
产品特色:
🚀 简单安装:通过pip安装依赖即可开始使用
🔒 完整的数据控制:所有数据本地存储,支持完全本地操作和自管理数据处理
🔍 支持全文和向量搜索
🤖 与Ollama集成,使用它作为Pensieve的机器学习引擎
🌐 兼容任何OpenAI API模型(例如OpenAI、Azure OpenAI、vLLM等)
💻 支持Mac和Windows(Linux支持正在开发中)
🔌 通过插件扩展功能
使用教程:
1. 安装Pensieve:在终端运行`pip install memos`命令。
2. 初始化:运行`memos init`命令来初始化Pensieve配置文件和sqlite数据库。
3. 启动服务:运行`memos enable`和`memos start`命令开始记录所有屏幕并启动Web服务。
4. 访问Web界面:在浏览器中访问`http://localhost:8839`。
5. Mac权限问题:在Mac上,Pensieve需要屏幕录制权限,请在程序启动时允许屏幕录制权限。
6. 使用合适的嵌入模型:根据用户的主要语言选择并配置合适的嵌入模型。
7. 重启Memos服务:在配置更改后,运行`memos stop`和`memos start`命令来重启服务。
8. 重建索引:如果更换嵌入模型,需要运行`memos reindex --force`命令来重建索引。
浏览量:15
最新流量情况
月访问量
4.91m
平均访问时长
00:06:18
每次访问页数
5.57
跳出率
37.92%
流量来源
直接访问
51.73%
自然搜索
32.88%
邮件
0.04%
外链引荐
13.01%
社交媒体
2.27%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
13.81%
德国
3.69%
印度
9.16%
俄罗斯
4.47%
美国
18.04%
一个完全由你掌控数据的「被动记录」项目。
Pensieve是一个隐私保护的被动记录项目,它可以自动记录屏幕内容,构建智能索引,并提供便捷的网页界面来检索历史记录。这个项目受到了Rewind和Windows Recall的启发,但与它们不同,Pensieve允许用户完全控制自己的数据,避免了数据传输到不受信任的数据中心。Pensieve的主要优点包括简单安装、完整的数据控制、全文和向量搜索支持、与Ollama集成、兼容任何OpenAI API模型、支持Mac和Windows(Linux支持正在开发中)以及通过插件扩展功能。
保护隐私的音频深度检测
SafeEar是一个创新的音频深度检测框架,它能够在不依赖于语音内容的情况下检测深度音频。这个框架通过设计一个神经音频编解码器,将语义和声学信息从音频样本中分离出来,仅使用声学信息(如韵律和音色)进行深度检测,从而保护了语音内容的隐私。SafeEar通过在真实世界中增强编解码器来提高检测器的能力,使其能够识别各种深度音频。该框架在四个基准数据集上的广泛实验表明,SafeEar在检测各种深度技术方面非常有效,其等错误率(EER)低至2.02%。同时,它还能保护五种语言的语音内容不被机器和人类听觉分析破译,通过我们的用户研究和单词错误率(WER)均高于93.93%来证明。此外,SafeEar还构建了一个用于反深度和反内容恢复评估的基准,为未来在音频隐私保护和深度检测领域的研究提供了基础。
准确、私密且可配置的文档检索LLM
AnyParser Playground 是一个基于网页的解决方案,旨在帮助用户从PDF和图像文件中提取信息。它通过使用机器学习技术,能够处理文件的前10页,为用户提供数据的全面洞察。该平台不存储用户数据,保证了数据的隐私和安全性。
一款用于离线语音转录的GUI工具
aTrain是由格拉茨大学商业分析与数据科学中心的研究人员开发,并由格拉茨知识中心的研究人员测试的一款离线语音转录工具。它利用最新的机器学习模型,无需上传任何数据即可自动转录语音录音。aTrain在《行为与实验金融学杂志》上发表的论文中被介绍,如果用于研究,请引用该论文。它支持Windows 10和11系统,用户可以通过Microsoft应用商店或BANDAS中心网站下载安装。对于Linux系统,提供了Wiki上的安装指南。aTrain的主要优点包括无需上传数据的隐私保护、高质量的转录质量、以及在本地计算机上的快速处理速度。
一站式RAG搜索SDK
Korvus是一个基于Postgres构建的搜索SDK,它将整个RAG(检索增强生成)流程统一到单一的数据库查询中。它提供了高性能、可定制的搜索能力,同时最小化了基础设施的考虑。Korvus利用PostgresML的pgml扩展和pgvector扩展,将RAG流程压缩在Postgres内部。它支持多语言SDK,包括Python、JavaScript、Rust和C,允许开发者无缝集成到现有的技术栈中。
开源向量数据库,适用于开发者构建通用AI应用。
Milvus是一个为开发者设计的开源向量数据库,专门用于大规模高维向量的相似性搜索。它支持pip安装,可以与流行的AI开发工具一起使用,并且能够扩展到数十亿个向量。Milvus以其高效的向量相似性搜索能力,帮助开发者构建强大且可扩展的图像检索系统,无论是管理个人照片库还是开发商业图像搜索应用程序,Milvus都提供了一个强大的基础,帮助开发者发掘图像集合中的潜在价值。
RecurseChat是一款可以与本地AI聊天的个人AI应用程序,支持离线和私密聊天。
RecurseChat是一款离线、私密的个人AI聊天应用程序,它代表了使用本地AI进行聊天的功能和技术。其主要优点包括:离线聊天、保护隐私、无需配置、支持PDF和markdown格式的聊天、全文搜索等功能。RecurseChat的定位是提供简单易用、功能强大的本地AI聊天工具。
一款支持多语言的智能会议笔记助手,可自动转录、总结并支持多种工具集成。
Spellar是一款基于人工智能的会议笔记助手,支持100多种语言的语音转录和自动总结。它通过智能语音识别和自然语言处理技术,帮助用户在会议、讲座或任何需要记录的场景中高效捕捉关键信息。其主要优点包括无缝的多平台支持、高精度的语音识别和总结能力,以及强大的隐私保护功能。该产品定位为专业人士、学生和远程团队提供高效、便捷的会议记录解决方案,支持免费下载并提供多种付费订阅选项。
在线学习Python、AI、大模型、AI写作绘画课程,零基础轻松入门。
Mo是一个专注于 AI 技术学习和应用的平台,旨在为用户提供从基础到高级的系统学习资源,帮助各类学习者掌握 AI 技能,并将其应用于实际项目中。无论你是大学生、职场新人,还是想提升自己技能的行业专家,Mo都能为你提供量身定制的课程、实战项目和工具,带你深入理解和应用人工智能。
OpenLIT是用于GenAI和LLM应用可观察性的开源平台。
OpenLIT是一个开源的AI工程平台,专注于生成式AI和大型语言模型(LLM)应用的可观察性。它通过提供代码透明度、隐私保护、性能可视化等功能,帮助开发者简化AI开发流程,提高开发效率和应用性能。作为开源项目,用户可以自由查看代码或自行托管,确保数据安全和隐私。其主要优点包括易于集成、支持OpenTelemetry原生集成、提供细粒度的使用洞察等。OpenLIT面向AI开发者、数据科学家和企业,旨在帮助他们更好地构建、优化和管理AI应用。目前未明确具体价格,但从开源特性来看,可能对基础功能提供免费使用。
世界首个免费无限制AI图像生成器,由Flux.1-Dev模型支持,无需登录,无限生成。
Raphael是一款强大的AI图像生成工具,其核心是先进的Flux.1-Dev模型。该产品完全免费,无需用户注册或登录,即可无限生成高质量的AI图像。它不仅为创作者提供了强大的图像生成能力,还通过零数据保留政策保护用户隐私。其定位是成为全球最大的免费AI图像生成器,适用于各种需要图像生成的场景,如艺术创作、营销设计、游戏开发等。
在口袋里拥有十亿参数,与私有本地大型语言模型聊天。
fullmoon是一款由Mainframe开发的本地智能应用,允许用户在本地设备上与大型语言模型进行聊天。它支持完全离线操作,优化了Apple硅芯片的模型运行,提供了个性化的主题、字体和系统提示调整功能。作为一款免费、开源且注重隐私的应用,它为用户提供了一种简单、安全的方式来利用强大的语言模型进行交流和创作。
一个AI驱动的数据科学团队,帮助用户更快地完成常见数据科学任务。
该产品是一个AI驱动的数据科学团队模型,旨在帮助用户以更快的速度完成数据科学任务。它通过一系列专业的数据科学代理(Agents),如数据清洗、特征工程、建模等,来自动化和加速数据科学工作流程。该产品的主要优点是能够显著提高数据科学工作的效率,减少人工干预,适用于需要快速处理和分析大量数据的企业和研究机构。产品目前处于Beta阶段,正在积极开发中,可能会有突破性变化。它采用MIT许可证,用户可以在GitHub上免费使用和贡献代码。
由xAI开发的AI助手,可生成高质量图像,提供实时信息,对话风趣。
Grok是由xAI开发的AI助手,旨在提供真实、有用且富有好奇心的交互体验。它能够回答各种问题、生成引人注目的图像,并通过上传图片帮助用户更深入地了解世界。Grok强调隐私保护,所有数据交互都以用户隐私为重,确保安全体验。它集成了X平台的数据,专注于实时信息,是寻求AI助手用户的理想选择。该应用免费提供给用户,适合需要高效获取信息和创意灵感的人群。
由Google Research开发的预训练时间序列预测模型。
TimesFM是一个由Google Research开发的预训练时间序列预测模型,用于时间序列预测任务。该模型在多个数据集上进行了预训练,能够处理不同频率和长度的时间序列数据。其主要优点包括高性能、可扩展性强以及易于使用。该模型适用于需要准确预测时间序列数据的各种应用场景,如金融、气象、能源等领域。该模型在Hugging Face平台上免费提供,用户可以方便地下载和使用。
一款简单易用的无限录音转文字APP,支持中英双语实时翻译。
inFin:Infinite AI Voice Notes 是一款专为提高工作效率而设计的语音笔记应用。它利用先进的人工智能技术,将录音实时转换为文字,并支持中英文的无限实时翻译。该产品的主要优点在于其简洁的用户界面和强大的功能,能够在各种场景下为用户提供便捷的记录和翻译服务。产品背景信息显示,它是由昱晗马开发,旨在为用户提供一个简单但卓越的语音记录解决方案。该应用是免费的,适合需要高效记录和翻译的用户。
你的笔记 + 日程 + 待办清单 + 任务 with AI
Liubai 是一款结合了笔记、日程、待办清单和任务管理的生产力工具,它通过集成 AI 功能,为用户提供更加智能化的工作和生活管理体验。Liubai 的主要优点在于其原子化附着功能,可以将文本、图片、多级标签、状态和文件等元素进行灵活组合,满足用户在不同场景下的需求。此外,Liubai 还支持云端同步和响应式设计,可以在不同设备上无缝使用。Liubai 的定位是为追求高效和智能化管理的用户提供一个全面的解决方案,帮助他们更好地组织和规划工作与生活。
一种用于检测机器修订文本的先进方法,通过模仿机器风格来提高检测准确性。
Imitate Before Detect 是一种创新的文本检测技术,旨在提高对机器修订文本的检测能力。该技术通过模仿大型语言模型(LLM)的风格偏好,能够更准确地识别出经过机器修订的文本。其核心优势在于能够有效区分机器生成和人类写作的细微差别,从而在文本检测领域具有重要的应用价值。该技术的背景信息显示,它能够显著提高检测的准确性,并且在处理开源LLM修订文本时,AUC值提升了13%,在检测GPT-3.5和GPT-4o修订文本时分别提升了5%和19%。其定位是为研究人员和开发者提供一种高效的文本检测工具。
一个开源AI模型微调与变现平台,助力AI初创企业、机器学习工程师和研究人员。
Bakery是一个专注于开源AI模型的微调与变现的在线平台,为AI初创企业、机器学习工程师和研究人员提供了一个便捷的工具,使他们能够轻松地对AI模型进行微调,并在市场中进行变现。该平台的主要优点在于其简单易用的界面和强大的功能,用户可以快速创建或上传数据集,微调模型设置,并在市场中进行变现。Bakery的背景信息表明,它旨在推动开源AI技术的发展,并为开发者提供更多的商业机会。虽然具体的定价信息未在页面中明确展示,但其定位是为AI领域的专业人士提供一个高效的工具。
一个用于多模型嵌入的图形库,支持多种模型和数据类型的可视化
vectrix-graphs 是一个强大的图形库,专注于多模型嵌入的可视化。它支持多种机器学习模型和数据类型,能够将复杂的数据结构以直观的图形形式展现出来。该库的主要优点在于其灵活性和扩展性,可以轻松集成到现有的数据科学工作流程中。vectrix-ai 团队开发了这个库,旨在帮助研究人员和开发者更好地理解和分析模型的嵌入结果。作为一个开源项目,它在 GitHub 上提供免费使用,适合各种规模的项目和团队。
Sonus-1:开启大型语言模型(LLMs)的新时代
Sonus-1是Sonus AI推出的一系列大型语言模型(LLMs),旨在推动人工智能的边界。这些模型以其高性能和多应用场景的多功能性而设计,包括Sonus-1 Mini、Sonus-1 Air、Sonus-1 Pro和Sonus-1 Pro (w/ Reasoning)等不同版本,以满足不同需求。Sonus-1 Pro (w/ Reasoning)在多个基准测试中表现突出,特别是在推理和数学问题上,展现了其超越其他专有模型的能力。Sonus AI致力于开发高性能、可负担、可靠且注重隐私的大型语言模型。
从自然语言提示创建B-Rep CAD文件和网格
Text-to-CAD UI是一个利用自然语言提示生成B-Rep CAD文件和网格的平台。它通过ML-ephant API,由Zoo提供支持,能够将用户的自然语言描述直接转化为精确的CAD模型。这项技术的重要性在于它极大地简化了设计过程,使得非专业人士也能轻松创建复杂的CAD模型,从而推动了设计的民主化和创新。产品背景信息显示,它是由Zoo开发的,旨在通过机器学习技术提升设计效率。关于价格和定位,用户需要登录后才能获取更多信息。
现代硬件设计的CAD软件
Zoo提供了一个现代的硬件设计工具包,包括GPU驱动引擎、按需付费、远程流媒体和开放API兼容等特点,旨在提高硬件设计效率和降低成本。它允许用户创建前所未有的新设计工具,无论是个人爱好者、初创企业还是大型企业,Zoo的安全基础设施都能加速项目和工具的发展。
高效的文本到音频生成模型
TangoFlux是一个高效的文本到音频(TTA)生成模型,拥有515M参数,能够在单个A40 GPU上仅用3.7秒生成长达30秒的44.1kHz音频。该模型通过提出CLAP-Ranked Preference Optimization (CRPO)框架,解决了TTA模型对齐的挑战,通过迭代生成和优化偏好数据来增强TTA对齐。TangoFlux在客观和主观基准测试中均实现了最先进的性能,并且所有代码和模型均开源,以支持TTA生成的进一步研究。
AI助手,快速总结网页内容,保护隐私
Orbit by Mozilla 是一款由Mozilla提供的Firefox插件,利用人工智能技术帮助用户快速总结网页内容,包括电子邮件、文档、文章和视频,同时强调保护用户隐私。Orbit插件的主要优点在于它不需要用户创建账户,不会存储或共享用户的个人信息,也不会保存用户访问的页面内容或生成的摘要。Orbit通过使用Mistral LLM(Mistral 7B)模型,为用户提供了一个无需牺牲隐私即可快速获取信息的工具。
多模态大型语言模型,展示卓越的整体性能。
InternVL2.5-MPO是一个先进的多模态大型语言模型系列,它基于InternVL2.5和混合偏好优化构建。该模型整合了新增量预训练的InternViT与各种预训练的大型语言模型,包括InternLM 2.5和Qwen 2.5,使用随机初始化的MLP投影器。InternVL2.5-MPO在新版本中保留了与InternVL 2.5及其前身相同的模型架构,遵循“ViT-MLP-LLM”范式。该模型支持多图像和视频数据,通过混合偏好优化(MPO)进一步提升模型性能,使其在多模态任务中表现更优。
70B参数的文本生成模型
Llama-3.1-70B-Instruct-AWQ-INT4是一个由Hugging Face托管的大型语言模型,专注于文本生成任务。该模型拥有70B个参数,能够理解和生成自然语言文本,适用于多种文本相关的应用场景,如内容创作、自动回复等。它基于深度学习技术,通过大量的数据训练,能够捕捉语言的复杂性和多样性。模型的主要优点包括高参数量带来的强大表达能力,以及针对特定任务的优化,使其在文本生成领域具有较高的效率和准确性。
高质量合成数据生成与结构化数据提取工具
Bespoke Curator是一个开源项目,提供了一个基于Python的丰富库,用于生成和策展合成数据。它具备高性能优化、智能缓存和故障恢复功能,并且可以与HuggingFace Dataset对象直接协作。Bespoke Curator的主要优点包括其程序性和结构化输出能力,能够设计复杂的数据生成管道,以及通过内置的Curator Viewer实时检查和优化数据生成策略。
© 2025 AIbase 备案号:闽ICP备08105208号-14