AlphaMaze-v0.2-1.5B

简介:

一种通过文本迷宫解决任务来增强大型语言模型视觉推理能力的创新方法

功能:

通过文本描述的迷宫任务训练模型的视觉推理能力

支持多种训练方法,包括监督式微调(SFT)和基于奖励的策略优化(GRPO)

提供开源模型和数据集,便于研究和复现

支持本地运行,方便开发者进行定制化开发

能够处理复杂的迷宫结构并规划最优路径

支持多种硬件配置,适应不同的计算需求

通过文本生成的方式输出迷宫解决方案,无需图像生成

需求人群:

"该产品适合研究人员和开发者,特别是那些专注于语言模型的视觉推理能力提升和空间理解能力研究的团队。它也适用于教育领域,用于教学和实验,帮助学生理解语言模型在复杂任务中的应用。"

浏览量:21

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图