需求人群:
"用户可以将 LocalAI 部署到本地服务器或个人计算机上,以生成文本、音频和图像,支持个性化定制和自主控制的 AI 生成需求。"
使用场景示例:
用 LocalAI 生成文本描述图像
将音频转换为文本以进行语音识别
使用 LocalAI 生成艺术风格的图像
产品特色:
文本生成
文本转语音
图像生成
浏览量:37
最新流量情况
月访问量
4.67m
平均访问时长
00:07:27
每次访问页数
6.62
跳出率
37.89%
流量来源
直接访问
51.41%
自然搜索
29.45%
邮件
0.92%
外链引荐
11.72%
社交媒体
6.47%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
美国
16.52%
中国
14.70%
印度
9.14%
日本
3.64%
德国
3.30%
基于先进 AI 模型的图像修复工具。
IOPaint 是一个免费、开源且完全可自托管的修复 / 填充工具,使用最先进的 AI 模型。它可以帮助用户删除图像中的不需要的对象、修复瑕疵、添加新对象、扩大图像等。
无需站点地图,一键抓取网站所有子页面
FireCrawl 是一款由 Mendable.ai 开发的开源项目,它能够无需站点地图即可抓取任何网站的所有可访问子页面,并将这些内容转换为干净、格式化的Markdown文档。它特别适合数据科学家、机器学习工程师、内容创作者和市场分析师使用,以从网站内容中提取有价值的信息。FireCrawl 能够处理使用JavaScript动态渲染的内容,提供API服务,支持自托管,并与多种开发者工具和框架集成。
一键式无服务器RAG平台
SciPhi是一个开源的端到端RAG平台,使构建、部署和优化系统变得简单。它提供直观的框架和抽象,可与LangChain等解决方案相比较。通过SciPhi,您可以轻松启动和扩展最好的RAG系统,并选择各种托管和远程提供商以满足您的需求。无论是自托管还是云部署选项都可用。
开源自然语言生成模型
OLMo是一个开源的自然语言生成模型,由Allen AI研究所开发,基于Transformer架构,可用于生成高质量的英文文本。它具有生成长度可达4096个token的长文本的能力。OLMo-7B是目前公开的参数量最大的开源英文语言模型之一,拥有69亿参数,在多个英文NLP任务上的表现优于同类模型。它可用于文本生成、任务导向的微调等多种自然语言处理任务。
模拟OpenAI Sora API的开源项目
FakeSoraAPI是一个开源项目,它模拟了尚未发布的OpenAI Sora API,允许开发者提前准备和测试他们的应用程序。这个API用于从文本生成视频,帮助开发者在Sora API正式发布前进行开发和测试。
Lepton是一个开源的语言模型搜索平台
Lepton是一个开源的自然语言处理平台,提供语言理解、生成和推理能力。它采用Transformer模型架构,能够进行多轮对话、问答、文本生成等任务。Lepton具有高效、可扩展的特点,可以在多个领域部署使用。
支持GeminiPro Vision / Cloudflare Workers AI / ChatGPT的融合Web平台
cloudflare-ai-web是一个开源的基于Cloudflare Workers AI和ChatGPT的AI Web应用平台。它支持GeminiPro Vision图片生成,提供强大的文本生成、翻译能力,可以快速构建生成图片、文字的AI平台。具有全球CDN加速,使用简单,部署方便等优点。
开源的中英双语预训练语言模型
LingoWhale-8B是一个开源的大规模中英双语预训练语言模型,具有强大的自然语言理解和生成能力。它通过在海量高质量中英文数据上进行预训练,可以完成长文本的理解和多轮交互。该模型采用Transformer架构,参数量达80亿。它在多个中文和英文公开基准测试上都取得了领先的效果。LingoWhale-8B完全开放给学术研究使用,个人开发者可以免费用于商业用途。该模型可以广泛应用于聊天机器人、知识问答、文本生成等领域。
开源自托管的聊天GPT替代品
Jan是一款开源、自托管的聊天GPT替代品,可以100%离线在您的计算机上运行。Jan提供可定制的AI助手、全局热键和内联AI等功能,可以提高您的生产力。Jan支持在本地主机上提供OpenAI等价API服务器,可以与兼容的应用程序一起使用。Jan的对话、偏好和模型使用等数据都保留在您的计算机上,安全、可导出,并可随时删除。
现代客服团队的首选
Chatwoot是一款开源的AI客服平台,通过AI技术提升客户支持体验,提供自助服务工具、全球搜索接口、实时聊天SDK等功能,同时支持自托管部署,符合SOC 2 Type II标准,可无缝切换不同的大型语言模型。作为Intercom、Zendesk和Salesforce Service Cloud的替代品,Chatwoot提供共享收件箱、多渠道支持、自动化、聊天机器人等功能。
PaLI-3 视觉语言模型:更小、更快、更强
Pali3是一种视觉语言模型,通过对图像进行编码并与查询一起传递给编码器-解码器Transformer来生成所需的答案。该模型经过多个阶段的训练,包括单模态预训练、多模态训练、分辨率增加和任务专业化。Pali3的主要功能包括图像编码、文本编码、文本生成等。该模型适用于图像分类、图像字幕、视觉问答等任务。Pali3的优势在于模型结构简单、训练效果好、速度快。该产品定价为免费开源。
简化LLM完成和嵌入调用的开源库
LiteLLM是一个开源库,旨在简化LLM完成和嵌入调用。它集成了Azure、Anthropic、OpenAI、Cohere和Replicate等多个平台的API,让你可以使用一个函数轻松调用它们。LiteLLM提供了方便的接口和一致的输出格式,使得使用LLM模型变得更加简单。它可以用于各种场景,如自然语言处理、文本生成、对话系统等。
开源 13B 大规模语言模型
百川 - 13B 是由百川智能开发的开源可商用的大规模语言模型,参数量达到 130 亿,训练数据量达到 1.4 万亿 tokens。该模型支持中英双语,具有高质量的预测和对话能力。模型支持量化部署和 CPU 推理,并在多个基准测试中取得优秀结果。可以广泛应用于自然语言处理领域的任务,如问答系统、对话系统、文本生成等。
开源基础模型,用于代码智能任务,支持116种编程语言。
Granite Code Models 是 IBM 开发的一系列开源基础模型,专为代码生成任务设计,如修复错误、解释代码、文档化代码等。这些模型在多种编程语言上进行了训练,并在不同的代码相关任务上达到了最先进的性能。主要优点包括全面的性能、企业级的信任度以及遵循 IBM 的 AI 伦理原则进行训练。
Prompto是一个开源的网络应用程序,旨在使与LLM的交互简单高效。
Prompto是一个开源的网页应用程序,旨在使与大型语言模型(LLMs)的交互简单高效。它可以轻松切换不同的LLMs,通过调整温度设置来调整LLM的创造力和风险水平,提供聊天机器人界面和笔记本界面,可以创建常用提示的模板,并且在浏览器中运行,确保流畅响应的体验。所有设置和聊天记录仅存储在浏览器的本地存储中,保护用户隐私。
基于2千亿MoE模型的领先AI技术,提供超低价格和越级场景体验。
DeepSeek-V2是一款基于2千亿参数量的MoE(Mixture of Experts)模型的AI技术产品,它在对话官网和API上全面上线,提供领先性能和超低价格。该产品在中文综合能力(AlignBench)和英文综合能力(MT-Bench)的评测中表现出色,与GPT-4-Turbo等闭源模型处于同一梯队。DeepSeek-V2支持128K上下文的开源模型,而对话官网/API支持32K上下文。产品的主要优点包括即刻接入、能力卓越、价格低廉,并且兼容OpenAI API接口,提供丝滑的体验。
为真实世界机器人提供最先进的机器学习模型、数据集和工具。
LeRobot 是一个旨在降低进入机器人领域的门槛,让每个人都能贡献并从共享数据集和预训练模型中受益的开源项目。它包含了在真实世界中经过验证的最先进的方法,特别关注模仿学习和强化学习。LeRobot 提供了一组预训练模型、带有人类收集演示的数据集和模拟环境,以便用户无需组装机器人即可开始。未来几周内,计划增加对最实惠和最有能力的真实世界机器人的支持。
快速集成生产就绪的AI助手,提升产品智能。
CopilotKit是一个旨在简化AI助手集成过程的开源工具。它允许开发者快速创建能够理解上下文、执行动作并从任何数据源获取知识的智能助手。产品的主要优点包括提高生产效率、增强用户参与度,以及通过自动化和智能化提升用户体验。CopilotKit的背景是响应市场对高效、智能工具的需求,定位于帮助开发者快速实现AI技术的商业化应用。
用于评估其他语言模型的开源工具集
Prometheus-Eval 是一个用于评估大型语言模型(LLM)在生成任务中表现的开源工具集。它提供了一个简单的接口,使用 Prometheus 模型来评估指令和响应对。Prometheus 2 模型支持直接评估(绝对评分)和成对排名(相对评分),能够模拟人类判断和专有的基于语言模型的评估,解决了公平性、可控性和可负担性的问题。
致力于收录开源社区的phi3训练变体版本,整理训练、推理、部署教程。
phi3-Chinese是一个公共的GitHub仓库,专注于收集和整理开源社区中关于phi3模型的各种训练变体版本。它不仅提供了不同版本的phi3模型下载链接,还包含了训练、推理、部署的相关教程,旨在帮助开发者更好地理解和使用phi3模型。
StoryDiffusion 能够通过生成一致的图像和视频来创造魔法故事。
StoryDiffusion 是一个开源的图像和视频生成模型,它通过一致自注意力机制和运动预测器,能够生成连贯的长序列图像和视频。这个模型的主要优点在于它能够生成具有角色一致性的图像,并且可以扩展到视频生成,为用户提供了一个创造长视频的新方法。该模型对AI驱动的图像和视频生成领域有积极的影响,并且鼓励用户负责任地使用该工具。
一款开源的浏览器扩展,利用AI生成吸引人的社交媒体回复,促进社交增长。
ollama-reply是一个开源的浏览器扩展,它利用Ollama Llama3模型的强大功能来生成吸引人的社交媒体回复,旨在促进用户的社交增长。这个工具被设计为MagicReply的免费和开源替代品。它不仅免费使用,而且高度可定制,可以适应任何Ollama模型,并根据用户的需求调整回复内容。
开源的多功能AI平台,专注于提升用户体验和生产力。
Omniplex是一个开源的AI平台,它致力于通过建立核心功能和基本特性来提升用户体验。该平台正在积极开发中,专注于实现最佳实践、优化代码库,并引入新特性。Omniplex使用TypeScript作为编程语言,React作为前端框架,Next.js作为Web框架,并结合了Firebase、Vercel AI SDK等技术栈。
AI代码查找器,快速找到AI论文的代码实现
AI Code Finder是一个免费的浏览器插件,可以快速找到任何AI研究论文的代码实现。它能够自动在Google、ArXiv、学术搜索引擎、论坛等网站上找到与论文相关的代码链接,并提供CODE按钮供用户点击跳转到开源代码实现。用户还可以创建提醒以获取最新的代码实现、作者的最新工作和最新进展。此插件适用于从事人工智能、数据科学、计算机视觉、语音识别、深度学习和大型语言模型等领域的工程师、研究人员、开发人员和技术领导者。
开源框架,用于构建模块化的生产级应用程序。
Cognita 是一个开源框架,用于组织 RAG(Retrieval Augmented Generation)代码库,并提供一个前端界面,以便在不同的 RAG 定制中进行实验。它提供了一种简单的方法来组织代码库,使得在本地测试变得容易,同时也能够部署到生产环境中。Cognita 使用 Langchain/Llamaindex 作为底层技术,并提供了一个组织结构,使得每个 RAG 组件都是模块化的、API 驱动的,并且易于扩展。
下一代本地优先的大型语言模型(LLMs)
anime.gf 是由 moecorp 发起的下一代本地优先的大型语言模型(LLMs),目前正处于积极开发阶段。它代表了一种新兴的本地化和开源的人工智能技术,旨在提供更高效、更个性化的用户体验。
开源代码库,为HuggingChat应用提供动力
chat-ui是一个开源的聊天界面,使用开源模型如OpenAssistant或Llama。它是一个SvelteKit应用程序,为hf.co/chat上的HuggingChat应用提供支持。该产品允许用户通过自定义配置来运行和部署自己的Chat UI实例,支持多种语言模型和功能,如Web搜索、自定义模型等。
© 2024 AIbase 备案号:闽ICP备2023012347号-1