浏览量:86
最新流量情况
月访问量
14.53k
平均访问时长
00:06:06
每次访问页数
4.75
跳出率
46.50%
流量来源
直接访问
42.53%
自然搜索
12.34%
邮件
0
外链引荐
45.13%
社交媒体
0
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
62.50%
美国
14.62%
日本
2.98%
TinyLlama项目旨在在3万亿令牌上预训练一个1.1B Llama模型。通过一些适当的优化,我们可以在“仅”90天内使用16个A100-40G GPU完成。训练已于2023-09-01开始。
TinyLlama项目旨在在3万亿令牌上预训练一个1.1B Llama模型。通过一些适当的优化,我们可以在“仅”90天内使用16个A100-40G GPU完成。训练已于2023-09-01开始。我们采用了与Llama 2完全相同的架构和分词器。这意味着TinyLlama可以在许多建立在Llama基础上的开源项目中使用。此外,TinyLlama只有1.1B个参数,紧凑性使其能够满足许多对计算和内存占用有限的应用需求。
免费AI学习实训社区
百度飞桨AI Studio是一个面向人工智能开发者的开放学习社区。它集开放数据、开源算法、免费算力三位一体,为开发者提供高效的AI学习环境、丰富的在线课程和实训项目,还有高质量的AI比赛挑战,助力开发者快速掌握最新的AI技术。通过AI Studio,可以便捷地完成AI模型的学习、训练、部署全流程,与广大开发者共同构建活跃的AI创新与交流社区。
第一个ChatGPT的开源替代品。
Uncensored Chat是第一个开源的ChatGPT替代品,它采用了人工智能技术,具有自动生成对话的能力。它的主要优点是开源、可定制、免费使用,并且能够为用户提供智能对话服务。
深度学习算法与大模型面试指南,持续更新的面试题目集合。
DeepLearing-Interview-Awesome-2024 是一个开源的面试题目集合项目,专注于深度学习算法和大模型领域的面试准备。该项目由社区成员共同维护,旨在提供最新的面试题目和答案解析,帮助求职者和研究人员深入理解深度学习领域的前沿技术和应用。它包含了丰富的面试题目,覆盖了大语言模型、视觉模型、通用问题等多个方面,是准备深度学习相关职位的宝贵资源。
使用API调用suno.ai的音乐生成AI,并轻松集成到GPT等代理中。
suno-api是一个开源项目,旨在通过API调用suno.ai的音乐生成AI,允许用户轻松地将音乐生成功能集成到各种AI代理中,如GPT。该项目具有开放源代码许可证,便于自由集成和修改,支持自定义模式,允许用户设置歌词、音乐风格、标题等,并且可以一键部署到Vercel。
一个开源的IDE扩展,旨在提升AI软件开发系统的模块化和可进化性。
Continue是一个专为软件开发者设计的开源IDE扩展,它通过提供自动化和智能化的工具来加速AI软件的开发流程。它允许开发者在构建软件时保持流畅的工作状态,通过插件和系统整合,轻松开始并加速开发过程。Continue支持多种编程语言的代码自动完成,提供代码段的重写功能,并允许通过自然语言指令来优化代码。它还支持与多种AI模型和开发环境的整合,使得开发者能够构建一个随着新功能出现而进化的软件系统。
Cohere Toolkit是一套开源的AI应用程序开发工具包,旨在加速开发并部署到云平台。
Cohere Toolkit是一个开源的AI应用程序开发工具包,它提供了一套生产就绪的应用程序,可以在云服务提供商上部署。这些应用程序可以访问Cohere的Command、Embed和Rerank模型,并且可以连接到企业数据和特定团队,以提高生产力。该工具包包含用于构建独特应用程序并可扩展部署的组件。
高效的企业级人工智能模型,低成本实现高质量定制模型。
Snowflake Arctic 是一款专为企业级人工智能任务设计的大规模语言模型(LLM),它在 SQL 生成、编码以及指令遵循等基准测试中表现出色,即使与计算预算更高的开源模型相比也毫不逊色。Arctic 通过其高效的训练和推理,为 Snowflake 客户以及广大 AI 社区提供了一种成本效益极高的定制模型创建方式。此外,Arctic 采用 Apache 2.0 许可,提供无门槛的权重和代码访问,并通过开源数据配方和研究洞察,进一步推动了社区的开放性和成本效益。
OpenELM是一套高效的语言模型家族,具备开源训练和推理框架。
OpenELM是由苹果公司开发的语言模型家族,旨在为开源研究社区提供先进的语言模型。这些模型基于公开可用的数据集训练,不提供任何安全保证,可能产生不准确、有害、有偏见或令人反感的输出。因此,用户和开发者需要进行彻底的安全测试,并实施适当的过滤机制。
基于先进 AI 模型的图像修复工具。
IOPaint 是一个免费、开源且完全可自托管的修复 / 填充工具,使用最先进的 AI 模型。它可以帮助用户删除图像中的不需要的对象、修复瑕疵、添加新对象、扩大图像等。
Phi-3 Mini-128K-Instruct ONNX优化模型促进推理加速
Phi-3 Mini是一个轻量级的顶尖开源模型,建立在Phi-2使用的合成数据和过滤网站之上,专注于高质量的推理密集型数据。这个模型属于Phi-3系列,mini版本有两个变体支持4K和128K上下文长度。该模型经过了严格的增强过程,包括监督式微调和直接偏好优化,以确保精准遵循指令和强大的安全措施。这些经过ONNX优化的Phi-3 Mini模型可在CPU、GPU和移动设备上高效运行。微软还推出了ONNX Runtime Generate() API,简化了Phi-3的使用。
Applio是一个开源生态系统,提供先进的AI语音克隆技术。
Applio是一个开源生态系统,主要提供先进的AI语音克隆技术。它的主要优点是创新性、开放源代码和先进的AI语音克隆技术。Applio的背景信息是作为一个开源生态系统,它致力于推动人工智能语音克隆技术的创新。目前还没有公开的定价信息。
快速训练和微调大型语言模型
Unsloth 是一个旨在提高大型语言模型(LLMs)训练和微调速度的平台。它通过手动推导所有计算密集型数学步骤并手写GPU内核,实现了无需硬件更改即可显著加快训练速度。Unsloth 支持多种GPU,包括NVIDIA、AMD和Intel,并提供开源版本供用户在Google Colab或Kaggle Notebooks上免费试用。它还提供了不同级别的定价方案,包括免费版、Pro版和企业版,以满足不同用户的需求。
开源AI软件工程师
Devika AI是一个开源的AI软件工程师,可以理解高级人类指令,将其分解为步骤,研究相关信息并生成相应代码。它使用Claude 3、GPT 4、GPT 3.5和Local LLMs via Ollama。
高质量英文网页数据集
FineWeb数据集包含超过15万亿个经过清洗和去重的英文网页数据,来源于CommonCrawl。该数据集专为大型语言模型预训练设计,旨在推动开源模型的发展。数据集经过精心处理和筛选,以确保高质量,适用于各种自然语言处理任务。
首个llama3中文版,多轮对话AI模型
llama3-Chinese-chat是首个llama3的中文对话版本,专为中文用户设计,支持高质量的多轮对话。它使用了170k+的中文对话数据进行训练,具备角色扮演、agent能力增强等特性,并提供了详细的训练和推理教程。此外,项目还计划开源浏览器插件,增加AI笔记和思维导图功能,进一步增强用户体验。
开源的MuZero实现,分布式AI框架
MuKoe是一个完全开源的MuZero实现,使用Ray作为分布式编排器在GKE上运行。它提供了Atari游戏的示例,并通过Google Next 2024的演讲提供了代码库的概览。MuKoe支持在CPU和TPU上运行,具有特定的硬件要求,适合需要大规模分布式计算资源的AI研究和开发。
自托管的开源OpenAI替代品,支持文本、音频、图像生成
LocalAI 是一个自托管的开源 OpenAI 替代品,可在消费级硬件上运行,支持本地或本地部署的文本、音频、图像生成。它提供了 GPT 等模型的文本生成功能,同时支持文本转语音、图像生成等多种功能。由于其开源自托管的特性,用户可以自由定制和部署,不受云端 API 限制,适合对数据隐私和安全性有要求的用户。LocalAI 的定位是为那些寻求自主控制、不依赖于第三方服务的个人用户或组织提供强大的 AI 生成能力。
Meta 新一代开源大型语言模型,性能卓越
Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。
开源的先进文本嵌入模型
Snowflake Arctic Embed是一系列基于Apache 2.0许可开源的文本嵌入模型,专为检索用例设计。这些模型在Massive Text Embedding Benchmark (MTEB)检索基准测试中提供了领先的检索性能,为组织在结合专有数据集与大型语言模型(LLMs)进行检索增强生成(RAG)或语义搜索服务时提供了新的优势。这些模型的尺寸从超小型(xs)到大型(l),具有不同的上下文窗口和参数数量,以满足不同企业的延迟、成本和检索性能需求。
无需站点地图,一键抓取网站所有子页面
FireCrawl 是一款由 Mendable.ai 开发的开源项目,它能够无需站点地图即可抓取任何网站的所有可访问子页面,并将这些内容转换为干净、格式化的Markdown文档。它特别适合数据科学家、机器学习工程师、内容创作者和市场分析师使用,以从网站内容中提取有价值的信息。FireCrawl 能够处理使用JavaScript动态渲染的内容,提供API服务,支持自托管,并与多种开发者工具和框架集成。
分析Transformer语言模型的内部工作机制
LLM Transparency Tool(LLM-TT)是一个开源的交互式工具包,用于分析基于Transformer的语言模型的内部工作机制。它允许用户选择模型、添加提示并运行推理,通过可视化的方式展示模型的注意力流动和信息传递路径。该工具旨在提高模型的透明度,帮助研究人员和开发者更好地理解和改进语言模型。
以低成本实现高性能的大型语言模型
JetMoE-8B是一个开源的大型语言模型,通过使用公共数据集和优化的训练方法,以低于10万美元的成本实现了超越Meta AI LLaMA2-7B的性能。该模型在推理时仅激活22亿参数,大幅降低了计算成本,同时保持了优异的性能。
在视频中快速搜索特定单词或短语
CTRL-F-VIDEO 是一个开源项目,通过Chrome扩展实现在YouTube视频中搜索特定单词或短语的功能。它利用OpenAI的Whisper模型将音频转换为文本,并在视频时间条上标记出匹配词汇的位置,帮助用户节省查找信息的时间。
一个通用的多模态模型,可用于问答、图像描述等任务
HuggingFaceM4/idefics-80b-instruct是一个开源的多模态模型,它可以接受图像和文本的输入,输出相关的文本内容。该模型在视觉问答、图像描述等任务上表现出色,是一个通用的智能助手模型。它由Hugging Face团队开发,基于开放数据集训练,提供免费使用。
基于SDXL的ControlNet Tile模型,适用于Stable Diffusion SDXL ControlNet的高分辨率图像修复。
这是一个基于SDXL的ControlNet Tile模型,使用Hugging Face Diffusers训练集,适用于Stable Diffusion SDXL ControlNet。它最初是为我自己的逼真模型训练,用于终极放大过程以提高图像细节。使用合适的工作流程,它可以为高细节、高分辨率的图像修复提供良好的结果。由于大多数开源没有SDXL Tile模型,我决定分享这个模型。该模型支持高分辨率修复、风格迁移和图像修复等功能,可以为你提供高质量的图像处理体验。
© 2024 AIbase 备案号:闽ICP备2023012347号-1