需求人群:
["对象分割","图像分割","视频分割","少样本学习","多任务学习"]
使用场景示例:
使用UniRef进行交互式图像分割
使用UniRef进行视频对象跟踪和分割
将UniRef作为插件加入基础模型中进行语义分割
产品特色:
支持多种对象分割任务:RIS、FSS、RVOS和VOS
UniFusion模块高效注入参考信息
可以作为基础模型的插件使用
提供预训练模型
开源代码
浏览量:16
最新流量情况
月访问量
4.67m
平均访问时长
00:07:27
每次访问页数
6.62
跳出率
37.89%
流量来源
直接访问
51.41%
自然搜索
29.45%
邮件
0.92%
外链引荐
11.72%
社交媒体
6.47%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
美国
16.52%
中国
14.70%
印度
9.14%
日本
3.64%
德国
3.30%
深度学习工具链,用于生成你的数字孪生体。
FaceChain是一个深度学习工具链,由ModelScope提供支持,能够通过至少1张肖像照片生成你的数字孪生体,并在不同设置中生成个人肖像(支持多种风格)。用户可以通过FaceChain的Python脚本、熟悉的Gradio界面或sd webui来训练数字孪生模型并生成照片。FaceChain的主要优点包括其生成个性化肖像的能力,支持多种风格,以及易于使用的界面。
开源分布式深度学习工具
The Microsoft Cognitive Toolkit(CNTK)是一个开源的商业级分布式深度学习工具。它通过有向图描述神经网络的计算步骤,支持常见的模型类型,并实现了自动微分和并行计算。CNTK支持64位Linux和Windows操作系统,可以作为Python、C或C++程序的库使用,也可以通过其自身的模型描述语言BrainScript作为独立的机器学习工具使用。
AI代码查找器,快速找到AI论文的代码实现
AI Code Finder是一个免费的浏览器插件,可以快速找到任何AI研究论文的代码实现。它能够自动在Google、ArXiv、学术搜索引擎、论坛等网站上找到与论文相关的代码链接,并提供CODE按钮供用户点击跳转到开源代码实现。用户还可以创建提醒以获取最新的代码实现、作者的最新工作和最新进展。此插件适用于从事人工智能、数据科学、计算机视觉、语音识别、深度学习和大型语言模型等领域的工程师、研究人员、开发人员和技术领导者。
鹿班是一款智能设计工具,可快速生成商品主图等。
鹿班是一款基于人工智能技术的智能设计工具,可根据商品图片和设计模板自动生成商品主图、钻展图、旺铺海报等营销图片。它利用计算机视觉和深度学习技术,能快速理解图像内容并生成设计作品。鹿班大大提高了设计效率,满足电商营销设计图制作的高强度需求,同时生成的设计作品质量也有保证。鹿班同时支持在线协作,企业客户可以上传自有设计模板,供分布式团队远程协作使用。这款工具主要面向电商、品牌营销等领域,提供便捷高效的设计即服务能力。
华为开源自研AI框架
华为开源自研AI框架MindSpore。自动微分、并行加持,一次训练,可多场景部署。支持端边云全场景的深度学习训练推理框架,主要应用于计算机视觉、自然语言处理等AI领域,面向数据科学家、算法工程师等人群。主要具备基于源码转换的通用自动微分、自动实现分布式并行训练、数据处理、以及图执行引擎等功能特性。借助自动微分,轻松训练神经网络。框架开源,华为培育AI开发生态。
基于视频的3D场景重建
VisFusion是一个利用视频数据进行在线3D场景重建的技术,它能够实时地从视频中提取和重建出三维环境。这项技术结合了计算机视觉和深度学习,为用户提供了一个强大的工具,用于创建精确的三维模型。
探索YouTube上最新的机器学习/人工智能课程
ML-YouTube-Courses是一个开源项目,致力于整理和索引YouTube上最新的、最好的机器学习课程。项目包含各种主题的课程,如机器学习、深度学习、自然语言处理、计算机视觉等,涵盖基础知识和前沿技术。该项目帮助开发者和学习者高效地发现优质的在线教程。
企业AI SaaS平台
ALFI是一款由人工智能驱动的企业SaaS平台,采用计算机视觉、机器学习、深度学习和边缘计算技术。它提供了广告定向、实时观众分析和个性化内容交付等功能。ALFI的独特网络将人工智能屏幕安装在Uber和Lyft等共乘服务中,实现数字户外广告的精准定向和个性化交付。它通过计算机视觉技术实时匹配受众与相关广告,并在符合隐私规范的过程中进行内容投放。ALFI的目标是为品牌提供更精准的广告投放,为企业提供实时观众分析和定制化内容交付。
用面部数据分析并连接用户的完美匹配
SciMatch是一款独特的面部匹配约会应用程序。我们利用强大的深度学习计算机视觉算法开发了这款真正的独角兽约会应用程序。我们的应用程序能够准确读取每个用户的面部数据,分析其个性特点,并将其与他们的完美匹配连接起来。SciMatch不仅仅是一个简单的比较两张脸的应用程序,它还能识别您的独特之处,利用面部数据展示您与其他用户的兼容性。
自动微分、并行加持,一次训练,可多场景部署
昇思MindSpore 是华为开源自研的 AI 框架,支持端边云全场景的深度学习训练推理,应用于计算机视觉、自然语言处理等 AI 领域。具备基于源码转换的通用自动微分、自动实现分布式并行训练、数据处理和图执行引擎等功能。框架开源,适用于数据科学家和算法工程师。
统一高效的RAG检索微调和推理框架
RAG-Retrieval是一个全链路的RAG检索微调和推理框架,支持多种RAG Reranker模型的推理,包括向量模型、迟交互式模型和交互式模型。它提供了一个轻量级的Python库,使得用户能够以统一的方式调用不同的RAG排序模型,简化了排序模型的使用和部署。
一个实验性的UI,用于将文本转换为知识图谱。
prettygraph是一个基于Python的Web应用程序,由@yoheinakajima开发,展示了一种新的UI模式,用于将文本输入动态地转换为知识图谱。该项目是一个快速原型,旨在提供一种简单的UI想法,通过实时更新UI中的文本高亮来生成知识图谱。
使用ollama Python客户端与ComfyUI工作流集成的大型语言模型(LLM)
ComfyUI Ollama是为ComfyUI工作流设计的自定义节点,它使用ollama Python客户端,允许用户轻松地将大型语言模型(LLM)集成到他们的工作流程中,或者仅仅是进行GPT实验。这个插件的主要优点在于它提供了与Ollama服务器交互的能力,使得用户可以执行图像查询、通过给定的提示查询LLM,以及使用精细调整参数进行LLM查询,同时保持生成链的上下文。
基于AI的Python网络爬虫库,自动化提取网页信息。
ScrapeGraphAI是一个使用LLM(大型语言模型)和直接图逻辑来为网站、文档和XML文件创建抓取管道的Python网络爬虫库。用户只需指定想要提取的信息,库就会自动完成这项工作。该库的主要优点在于简化了网络数据抓取的过程,提高了数据提取的效率和准确性。它适用于数据探索和研究目的,但不应被滥用。
使用大型语言模型(LLMs)进行数据清洗和整理的Python库。
databonsai是一个Python库,利用大型语言模型(LLMs)执行数据清洗任务。它提供了一系列工具,包括数据分类、转换和提取,以及对LLM输出的验证,支持批量处理以节省令牌,并且具备重试逻辑以处理速率限制和瞬时错误。
通过自然语言生成SQL查询,简化数据库交互。
Vanna是一个使用Retrieval-Augmented Generation (RAG) 技术的开源Python框架,用于SQL生成和相关功能。它通过训练RAG模型,将自然语言问题转换为SQL查询,从而允许用户以提问的形式与数据库进行交互。Vanna的主要优点包括高准确度、安全性、私有性、自学习能力,并且支持任何SQL数据库。
一个非官方的Suno AI客户端,支持音乐生成和获取音乐信息。
Suno API是一个基于Python和Streamlit的非官方Suno AI客户端,目前支持音乐生成和获取音乐信息等功能。它具有内置的维护和激活功能,无需担心令牌过期问题。用户可以设置多个账户信息以供保存和使用。此外,它还支持多语言,如中文、英文、韩语、日语等。
自动生成Python、Java、TypeScript、JavaScript、Kotlin的人工智能文档/注释,支持GitHub、GitLab、Bitbucket。
Snorkell.ai是一个自动化生成文档的工具,它可以在每次合并拉取请求时自动生成和更新GitHub项目的文档,确保文档始终与代码库保持一致。它支持Python、Java、TypeScript、JavaScript和Kotlin等编程语言,生成人类可读且易理解的文档。
SpleeterGUI 是一款音乐源分离桌面应用程序。
SpleeterGUI 是一个音乐源分离的桌面应用程序,用户无需安装 Python 或 Spleeter,该应用程序内含预装 Python 版本和 Spleeter。通过分离音轨,用户可以从音乐中提取出不同的声音源,提供了更灵活的音频处理能力。
通过AI和动手实验学习编程
LabEx是一个结合AI技术和动手实验室的教育平台,专注于提供Linux、Python、Docker、Kubernetes、机器学习等技术的实战学习体验。通过互动式的学习环境和结构化的技能树,用户可以逐步掌握技术技能,并在完成技能树后参与真实世界项目,巩固所学知识。LabEx还拥有AI助手Labby,为用户提供实时的编程帮助和答疑。此外,LabEx承诺每完成一个技能树,就会种植一棵真实的树,让学习之旅也能为地球做出贡献。
基于 LLM 大语言模型的知识库问答系统。
MaxKB 是一款基于 LLM 大语言模型的知识库问答系统,旨在成为企业的最强大脑。支持文档上传、自动爬取在线文档,智能问答交互体验好。支持快速嵌入到第三方业务系统。技术栈包括 Vue.js、Python/Django、Langchain、PostgreSQL/pgvector。
基于 Python 和 FastAPI 的非官方 Suno API。
SunoAPI 是一个基于 Python 和 FastAPI 的非官方 Suno API。它支持生成歌曲、歌词等功能,并带有内置的令牌维护和保持活跃功能,让您无需担心令牌过期。SunoAPI 采用全异步设计,运行速度快,适合后续扩展。用户可以轻松使用 API 生成各种音乐内容。
在线学习数据科学和 AI
DataCamp 是一个在线学习平台,提供数据科学、AI 及相关领域的课程。它提供动手实践的学习体验,包括交互式练习和短视频,涵盖了广泛的话题,包括 Python、R、SQL、ChatGPT、Power BI 等。DataCamp 还提供数据科学职业发展的认证和资源。
Gemini API的指南和示例集合
Gemini API Cookbook是一个包含Gemini API使用指南和示例的集合,旨在帮助开发者快速上手并使用Gemini API。这些示例大多数是用Python编写的Colab Notebooks,可以直接在Google Colab中打开或下载到本地环境中运行。
展示使用Claude的有趣和有效方法的集合
Anthropic Cookbook提供代码和指南,旨在帮助开发者使用Claude构建项目,提供可复制的代码片段,易于集成到您自己的项目中。这些示例主要用Python编写,但概念可以适应任何支持与Anthropic API交互的编程语言。
生成合成数据,训练和对齐模型的工具
DataDreamer是一个强大的开源Python库,用于提示、生成合成数据和训练工作流。它旨在简单易用,极其高效,且具有研究级质量。DataDreamer支持创建提示工作流、生成合成数据集、对齐模型、微调模型、指令调优模型和模型蒸馏。它具有简单、研究级、高效、可复现的特点,并简化了数据集和模型的共享。
Layer Diffusion自定义节点实现
ComfyUI-layerdiffusion是一个GitHub项目,提供了Layer Diffusion模型的自定义节点实现。该项目允许用户通过Python依赖安装,并且目前仅支持SDXL模型。项目的目标是为ComfyUI用户提供Layer Diffusion模型的便捷集成。
将数据和AI算法快速转化为生产就绪的Web应用
Taipy是一个开源的Python库,用于简化端到端应用开发,提供假设分析、智能管道执行、内置调度和部署工具。它允许数据科学家和机器学习工程师构建全栈应用,无需学习新的语言或全栈框架,专注于数据和AI算法,同时简化开发和部署的复杂性。
© 2024 AIbase 备案号:闽ICP备2023012347号-1