简介:

基于llama3 8B的SOTA视觉模型

功能:

使用Huggingface提供的模型权重进行快速本地推理

结合siglip-so400m模型进行视觉识别

Llama3 8B模型用于多模态图像-文本输入和文本生成

在预训练过程中冻结除投影层外的所有权重

在微调过程中更新Llama3 8B模型权重,同时冻结siglip-so400m模型和投影层

生成合成多模态数据以增强多模态文本生成能力

需求人群:

"目标受众为需要进行图像识别和文本生成的研究人员和开发者。他们可以利用llama3v模型进行图像特征提取和文本生成,从而在图像理解和多模态数据处理方面取得更好的效果。"

浏览量:72

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图