Phi-3-vision-128k-instruct

优质新品

简介:

微软轻量级、先进的多模态模型,专注于文本和视觉的高质量推理密集数据。

功能:

4.2B参数,包含图像编码器、连接器、投影器和Phi-3 Mini语言模型。

支持文本和图像输入,最适合使用聊天格式的提示。

上下文长度为128K tokens。

使用512 H100-80G GPU进行训练,训练时间为1.5天。

训练数据包含5000亿视觉和文本token。

输出为针对输入生成的文本。

模型训练日期为2024年2月至4月。

模型为静态模型,训练截止日期为2024年3月15日。

需求人群:

"该模型面向广泛的商业和研究用途,特别是在需要视觉和文本输入能力的通用AI系统和应用程序中,适用于内存/计算受限环境、延迟受限场景、通用图像理解、OCR、图表和表格理解等。"

浏览量:124

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图