需求人群:
"目标受众为AI研究人员和数字病理学领域的学者,他们需要一个强大的模型来分析和理解大量的病理学数据,以推动医学研究和诊断技术的发展。"
使用场景示例:
研究人员使用Prov-GigaPath模型分析病理学数据,发表在Nature期刊上。
医学院校利用该模型进行教学和研究,提高学生对数字病理学的理解。
医院研究人员使用该模型进行病理幻灯片的自动化分析,加快研究进程。
产品特色:
支持在NVIDIA A100 Tensor Core GPU机器上运行。
提供预训练模型和代码的下载。
能够访问HuggingFace Hub上的Prov-GigaPath模型。
包含tile encoder和slide encoder,分别用于提取局部模式和输出幻灯片级别表示。
提供详细的演示笔记本,展示如何运行预训练模型。
提供PCam和PANDA数据集的预提取嵌入,方便进行微调实验。
提供样本数据下载链接,用于进一步的研究和分析。
使用教程:
下载并安装所需的CUDA工具包和Python环境。
从GitHub仓库下载Prov-GigaPath模型和代码。
访问HuggingFace Hub并同意相关条款,获取模型访问权限。
按照提供的指南设置环境变量,以避免访问错误。
运行提供的演示笔记本,了解模型的基本使用方法。
使用tile encoder和slide encoder进行数据的提取和编码。
根据需要对模型进行微调,以适应特定的研究目的。
下载并使用提供的样本数据进行进一步的分析和研究。
浏览量:13
最新流量情况
月访问量
4.58m
平均访问时长
00:07:29
每次访问页数
6.65
跳出率
37.90%
流量来源
直接访问
51.57%
自然搜索
29.65%
邮件
0.89%
外链引荐
11.44%
社交媒体
6.43%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
美国
16.83%
中国
14.47%
印度
9.23%
日本
3.69%
德国
3.38%
编码器自由的视觉-语言模型,高效且数据驱动。
EVE是一个编码器自由的视觉-语言模型,由大连理工大学、北京人工智能研究院和北京大学的研究人员共同开发。它在不同图像宽高比下展现出卓越的能力,性能超越了Fuyu-8B,并且接近模块化编码器基础的LVLMs。EVE在数据效率、训练效率方面表现突出,使用33M公开数据进行预训练,并利用665K LLaVA SFT数据为EVE-7B模型训练,以及额外的1.2M SFT数据为EVE-7B (HD)模型训练。EVE的开发采用了高效、透明、实用的策略,为跨模态的纯解码器架构开辟了新途径。
创新的AI基础模型,提供卓越的提示遵循能力。
Leonardo Phoenix是Leonardo AI平台推出的一款基础模型,它在提示遵循、图像生成清晰度和AI研究方面取得了突破性进展。该模型通过架构创新,提供了更高质量的图像生成,特别是在人像、横幅、海报和标志的文本生成方面表现出色。此外,它还增强了创造性控制,允许用户通过提示增强和AI提示编辑来轻松获取和快速修改生成内容。尽管目前一些功能如图像引导、元素和照片写实尚未集成,但预计将在不久的将来加入。
领先的AI评测基准,衡量和比较AI模型性能。
SuperCLUE是一个用于评估和比较大型语言模型性能的在线平台。它提供了多种任务和排行榜,旨在为AI研究者和开发者提供一个标准化的测试环境。SuperCLUE支持各种AI应用场景,包括数学推理、代码生成、超长文本处理等,能够帮助用户准确评估模型在不同任务上的表现和能力。
大型语言模型的详细列表和信息
Models Table 提供了一个包含300多个大型语言模型的列表,这些模型被所有主要的AI实验室使用,包括Amazon Olympus, OpenAI GPT-5, OpenAI GPT-6等。该列表展示了大型语言模型的发展趋势和多样性,对于AI研究者和开发者来说是一个宝贵的资源。
技术设计的首个副驾驶,通过AI加速设计文档和图表的创建与迭代。
Eraser AI 是一款专为技术设计打造的AI工具,它能够帮助用户快速创建和迭代设计文档和图表。它通过自然语言提示生成图表代码,支持云架构图、数据库图等的快速创建。Eraser AI 提供完全可编辑的输出,支持多人实时协作,并且与开发者常用的工具如GitHub和VS Code有良好的集成。此外,它还提供了一个免费的沙盒环境DiagramGPT,允许用户无需账号即可生成图表。Eraser AI 强调数据隐私,不会使用用户数据进行模型训练,适合现代开发者使用。
AI代码查找器,快速找到AI论文的代码实现
AI Code Finder是一个免费的浏览器插件,可以快速找到任何AI研究论文的代码实现。它能够自动在Google、ArXiv、学术搜索引擎、论坛等网站上找到与论文相关的代码链接,并提供CODE按钮供用户点击跳转到开源代码实现。用户还可以创建提醒以获取最新的代码实现、作者的最新工作和最新进展。此插件适用于从事人工智能、数据科学、计算机视觉、语音识别、深度学习和大型语言模型等领域的工程师、研究人员、开发人员和技术领导者。
用于构建理解和模拟人类语音表情的声控人工智能接口。
Hume AI的同理心语音接口(EVI)是一种由同理心大型语言模型(eLLM)驱动的API,可以理解和模拟语音音调、词语重音等,从而优化人机交互。它基于10多年的研究成果、数百万专利数据点和30多篇发表在顶尖期刊的论文。EVI旨在为任何应用程序提供更自然、富有同情心的语音界面,让人与AI的互动更加人性化。该技术可广泛应用于销售/会议分析、健康与保健、AI研究服务、社交网络等领域。
提升团队效率的AI研究助手
Enterprise Pro是一款旨在提高团队工作效率的AI研究助手。它通过提供快速、更新及时且可靠的答案,帮助员工解决复杂问题,无需点击不同链接、比较答案或不断搜索信息。产品具备数据隐私保护、增强安全、用户管理、SOC2认证、数据保留、单点登录等安全特性,同时提供无限次Pro搜索、顶尖AI模型选择、文件上传、搜索可视化等功能,以加速团队在各个领域的专业知识积累。
国产AI 绘画生成工具平台
触手 AI 绘画专业版是一款面向插画师、漫画师、设计师等专业用户的国产 AI 绘图平台。支持文生成图、图生成图、参考生成图、AI 模型训练等功能,用户可在基础风格模型上使用叠加模型,也可以收藏各类画风、IP、场景、人物、设计类模型。产品定位于提升专业用户的绘画效率和创作品质。
开源的MuZero实现,分布式AI框架
MuKoe是一个完全开源的MuZero实现,使用Ray作为分布式编排器在GKE上运行。它提供了Atari游戏的示例,并通过Google Next 2024的演讲提供了代码库的概览。MuKoe支持在CPU和TPU上运行,具有特定的硬件要求,适合需要大规模分布式计算资源的AI研究和开发。
面向AI开发者的GPU云平台,高性价比,极致体验,计费灵活
GpuMall智算云是一个面向AI开发者的GPU云平台,提供高性价比的计算资源,灵活的计费方式,以及弹性的调度能力,可以满足AI开发者的各种需求。用户可以在这里快速租用GPU资源进行AI模型训练和推理,并且可以根据实际使用情况灵活调整资源配置,达到最佳性价比。平台还提供了丰富的使用文档和在线客服支持,让用户使用起来更加便捷。
基于Pile数据集训练的T5模型
Pile-T5是EleutherAI推出的一款自然语言处理模型,它在原有的T5模型基础上,采用了Pile数据集和LLAMA分词器进行训练,以改善对代码任务的理解能力。该模型经过了2万亿个token的训练,是原T5模型训练量的两倍。Pile-T5在多项下游任务中表现出色,尤其是在代码相关任务上。此外,EleutherAI还提供了中间检查点,以便研究人员研究模型随时间的演变。
基于SDXL的ControlNet Tile模型,适用于Stable Diffusion SDXL ControlNet的高分辨率图像修复。
这是一个基于SDXL的ControlNet Tile模型,使用Hugging Face Diffusers训练集,适用于Stable Diffusion SDXL ControlNet。它最初是为我自己的逼真模型训练,用于终极放大过程以提高图像细节。使用合适的工作流程,它可以为高细节、高分辨率的图像修复提供良好的结果。由于大多数开源没有SDXL Tile模型,我决定分享这个模型。该模型支持高分辨率修复、风格迁移和图像修复等功能,可以为你提供高质量的图像处理体验。
生成式室内设计训练框架
StableDesign项目旨在为生成式室内设计提供数据集和训练方法。用户上传空房间图片和文字提示,生成装修效果图。通过爱彼迎数据下载、特征提取和ControlNet模型训练,结合图像处理和自然语言处理技术,提供新思路和方法。
使用 LCM-Lookahead 技术的文本到图像个性化模型
LCM-Lookahead for Encoder-based Text-to-Image Personalization 是一种使用 LCM-Lookahead 技术的文本到图像个性化模型,它可以通过在模型训练和分类器指导中传播图像空间损失来实现更好的身份保真度,同时保留布局多样性和提示对齐。
一款可以将图像转化为不适合进行机器学习模型训练的"毒药"样本的工具
Nightshade是一款用于保护版权的工具。它可以将图像转化为不适合进行机器学习模型训练的"毒药"样本,从而避免内容被无授权使用。Nightshade不依赖于训练者的善意,而是增加了训练未经授权数据的成本,促使训练者选择从创作者处获得授权。相比于水印等传统方法,Nightshade更加鲁棒,能抵抗各种图像处理,同时对原图的视觉效果影响较小。Nightshade目前作为独立工具提供,未来将与Glaze工具整合发布。
基于生成式头像的AI创作平台
DigenAI是一家应用型AI研究公司,致力于革新视频创作方式。它为全球用户提供将想象转化为现实的入口。DigenAI提供基于生成式头像的视频创作功能,简化创作流程并生成出色视频作品。目前正处于公测阶段,欢迎用户加入体验。
大规模MoE语言模型,性能媲美七十亿参数模型
Qwen1.5-MoE-A2.7B是一款大规模的MoE(Mixture of Experts)语言模型,仅有27亿个激活参数,但性能可与70亿参数模型相媲美。相比传统大模型,该模型训练成本降低75%,推理速度提高1.74倍。它采用特别的MoE架构设计,包括细粒度专家、新的初始化方法和路由机制等,大幅提升了模型效率。该模型可用于自然语言处理、代码生成等多种任务。
上传数据,获取机器学习模型
Automated Machine Learning as a Service是一个提供自动化机器学习服务的网站。用户可以通过上传数据来获取他们的机器学习模型,该平台为用户提供了便捷的机器学习模型开发和部署流程。该平台还提供了丰富的功能和优势,包括简单易用的界面、自动化的模型训练和优化、灵活的定价策略等。用户可以根据自己的需求选择适合的定价方案,并在不同的场景中应用该机器学习模型。该产品的定位是为广大用户提供高效、便捷、灵活的机器学习解决方案。
HyperGAI推出的创新多模态LLM框架,旨在理解和处理文本、图像、视频等多种输入模态
HPT(Hyper-Pretrained Transformers)是HyperGAI研究团队推出的新型多模态大型语言模型框架,它能够高效且可扩展地训练大型多模态基础模型,理解包括文本、图像、视频等多种输入模态。HPT框架可以从头开始训练,也可以通过现有的预训练视觉编码器和/或大型语言模型进行高效适配。
Llama模型、技术和爱好者的家园
Llama Family是一个开源平台,致力于构建开放的Llama模型生态,包含多种大模型和代码模型。具有丰富的功能和优势,提供各种算力获取和模型训练合作方式。价格根据合作方式而定,包括免费和付费选项。主要功能包括模型训练、算力获取、开源生态共建等。适用于各种技术爱好者和开发者。
awesome-prompts是一个GitHub仓库,收集了各种有用的AI模型提示(prompts)
awesome-prompts仓库由ai-boost组织维护,旨在为AI研究人员和开发者提供一个丰富的资源库,其中包含了多种语言模型的提示样本,可以帮助用户更好地与AI模型交互。
语义空间理论是一种数据驱动的方法,用于理解人类情感的全谱
语义空间理论(SST)是Hume AI研究的基础,它使用计算方法和数据驱动的方法来映射人类情感的全谱。SST通过自然数据和先进的统计方法,将情感视为高维语义空间,并揭示了情感的复杂性和细微差别。
开源自然语言生成模型
OLMo是一个开源的自然语言生成模型,由Allen AI研究所开发,基于Transformer架构,可用于生成高质量的英文文本。它具有生成长度可达4096个token的长文本的能力。OLMo-7B是目前公开的参数量最大的开源英文语言模型之一,拥有69亿参数,在多个英文NLP任务上的表现优于同类模型。它可用于文本生成、任务导向的微调等多种自然语言处理任务。
Graph Neural Network (GNN)库,为苹果芯片量身打造
mlx-graphs是一个专为苹果芯片设计的图神经网络(GNN)库。它利用苹果硬件的优势,如统一内存架构,实现了在Mac设备上的高效GNN训练和推理。主要优点有:1)利用GPU并行计算,在大数据集上实现高速GNN运算;2)利用统一内存,支持在GPU上直接处理大规模图数据;3)无需设备间数据传输,简化开发流程。用户可以便捷地在Mac设备上处理大规模图问题,实现高性能GNN模型训练。
SVD 1.1 Image-to-Video 模型生成短视频
Stable Video Diffusion (SVD) 1.1 Image-to-Video 是一个扩散模型,通过将静止图像作为条件帧,生成相应的视频。该模型是一个潜在扩散模型,经过训练,能够从图像生成短视频片段。在分辨率为 1024x576 的情况下,该模型训练生成 25 帧视频,其训练基于相同大小的上下文帧,并从 SVD Image-to-Video [25 frames] 进行了微调。微调时,固定了6FPS和Motion Bucket Id 127的条件,以提高输出的一致性,而无需调整超参数。
超千亿参数的大语言模型
百川智能Baichuan 3是一款超千亿参数的大语言模型,在多个权威通用能力评测中展现出色,特别在中文任务上超越了GPT-4。它在自然语言处理、代码生成、医疗任务等领域表现优异,采用了多项创新技术手段提升模型能力,包括动态数据选择、重要度保持和异步CheckPoint存储等。训练过程中采用因果采样的动态训练数据选择方案,保证数据质量;引入了重要度保持的渐进式初始化方法,优化模型训练稳定性;并针对并行训练问题进行了一系列优化,性能提升超过30%。
© 2024 AIbase 备案号:闽ICP备08105208号-14