需求人群:
"Husky-v1适用于需要处理复杂数据推理和分析的研究人员和开发者,特别是在人工智能、机器学习和数据科学领域。它可以帮助用户自动化推理过程,提高数据分析的效率和准确性。"
使用场景示例:
用于学术研究,分析大量数据集以提取有用信息
在企业中,辅助数据科学家进行复杂的数据分析和预测
作为教育工具,帮助学生理解复杂的数据推理过程
产品特色:
解决复杂多步推理任务
使用工具使用、代码生成器、查询生成器和数学推理器等专家模型
支持CUDA 11.8,需要下载相应的模型文件
通过优化的推理过程并行运行所有专家模型
推理结果以JSON文件形式存储
提供评估脚本进行模型性能评估
使用教程:
1. 访问Husky-v1的GitHub页面并克隆或下载代码
2. 根据README文档安装所需的依赖包
3. 访问HuggingFace集合下载与Husky-v1相关联的模型文件
4. 修改脚本中的MODEL_ID和DATASET_NAME属性以适应具体的任务
5. 并行运行Husky的五个专家模型进行推理
6. 使用提供的评估脚本对模型的推理结果进行评估
7. 分析推理结果,根据需要调整模型参数以优化性能
浏览量:37
最新流量情况
月访问量
4.75m
平均访问时长
00:06:34
每次访问页数
6.10
跳出率
36.20%
流量来源
直接访问
52.19%
自然搜索
32.64%
邮件
0.04%
外链引荐
12.93%
社交媒体
2.02%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
14.32%
德国
3.68%
印度
9.04%
俄罗斯
3.92%
美国
19.25%
开源语言代理,解决复杂多步推理任务。
Husky-v1是一个开源的语言代理模型,专注于解决包含数值、表格和基于知识的复杂多步推理任务。它使用工具使用、代码生成器、查询生成器和数学推理器等专家模型来执行推理。此模型支持CUDA 11.8,需要下载相应的模型文件,并可以通过优化的推理过程并行运行所有专家模型。
1000+案例研究,获取增长策略,扩大SAAS规模
WithMba是一款基于人工智能的增长策略工具,提供1000+案例研究,帮助SAAS企业制定增长策略。其优势在于通过数据分析和机器学习,为企业提供个性化的增长策略,帮助企业提高销售转化率、提高用户留存率、提高用户回复率等。WithMba的定价根据企业规模和需求而定,定位于中高端市场。
您的全能保险管理解决方案
Peslac是一款全能保险管理平台,提供简化的用户注册流程、实时验证和智能欺诈检测,为您打造无缝的保险体验。利用人工智能和机器学习技术,Peslac能够进行综合风险评估和欺诈检测,提供个性化的保险解决方案。通过数据相关性分析和数据交换,Peslac能够提供无缝的保单管理和理赔处理。无论您是保险公司还是个人用户,Peslac都能够为您提供高效、安全和个性化的保险解决方案。
用人工智能创造令人惊叹的体验
Adobe Sensei是一款基于人工智能和机器学习的产品,帮助用户设计和交付完美的客户体验,提供数据分析、个性化营销、创意设计、广告优化和文档处理等功能,以实现更好的业务结果。Adobe Sensei可以帮助用户轻松创建、做出明智决策和针对性营销,提高生产力和效率。"
无代码AI构建器,AI不是魔法,而是ModularMind。
ModularMind是一款无代码AI构建器,提供强大的人工智能功能,包括自然语言处理、图像识别、机器学习等。它能够帮助用户快速构建AI模型,无需编码。ModularMind还提供灵活的定价方案,适用于个人用户和企业用户。它定位于帮助用户解决AI开发难题,提高工作效率。
一个开源文本转语音系统,致力于实现人类语音的自然化。
Orpheus TTS 是一个基于 Llama-3b 模型的开源文本转语音系统,旨在提供更加自然的人类语音合成。它具备较强的语音克隆能力和情感表达能力,适合各种实时应用场景。该产品是免费的,旨在为开发者和研究者提供便捷的语音合成工具。
提供超逼真的交互式虚拟形象,用于变革数字互动体验。
Beyond Presence 是一家专注于利用数字孪生技术打造类人对话体验的公司。其核心产品是交互式虚拟形象(Conversational Avatars),能够实现高度逼真的实时对话。这种技术通过模拟人类的外貌、语音和行为,为企业提供了一种全新的客户服务、销售和培训解决方案。它不仅能够降低人力成本,还能实现 24/7 的不间断服务,提升客户满意度和忠诚度。此外,该产品支持多种语言,能够满足全球不同地区用户的需求。Beyond Presence 的产品定位是为企业提供高效、个性化且具有创新性的数字交互工具,其价格策略灵活,包括免费试用、个人、专业、商业和企业等多种套餐,以满足不同规模和需求的客户。
Quadratic 是一款利用 AI 技术帮助用户分析数据的产品。
Quadratic AI 是一款专注于数据处理与分析的生产力工具。它通过先进的 AI 技术,帮助用户快速理解、分析和可视化数据,从而提高工作效率和决策质量。该产品适用于需要处理大量数据的企业和个人,能够显著提升数据分析的速度和准确性。其背景是随着数据量的爆发式增长,传统数据分析方法已难以满足需求,AI 技术的引入为数据处理带来了新的突破。Quadratic AI 定位为高端数据分析工具,价格可能相对较高,但其强大的功能和高效的分析能力使其物有所值。
Luukilu 是一款用于性能营销的人工智能代理工具,帮助优化社交媒体广告效果。
Luukilu 是一款专注于性能营销的人工智能工具,旨在帮助广告主优化社交媒体广告效果。通过分析广告创意疲劳度和机会点,Luukilu 提供实时警报和洞察,助力广告主提升广告效率和投资回报率。该工具主要面向数字营销人员和广告团队,提供自动化分析和优化建议,减少手动分析工作量,同时确保广告预算精准投放到高绩效广告上。Luukilu 的核心优势在于其强大的 AI 分析能力、节省时间、提升 ROI 和简化决策流程。目前,Luukilu 提供每月 19 美元的订阅服务,用户可免费试用 7 天。
Deep Review by SciSpace 是一款专注于科学文献深度分析的人工智能工具,助力科研人员高效完成文献综述。
Deep Review by SciSpace 是一款面向科研人员和学者的深度文献综述工具。它利用人工智能技术,帮助用户快速完成系统性文献综述,确保不遗漏重要论文。该工具支持多种功能,如文献搜索、深度分析、数据提取等,旨在提高科研效率。其定位为科研人员的智能助手,价格可能需要通过官网进一步确认。
基于 Gemini 的 Colab 数据科学助手,可自动生成完整的 Colab 笔记本代码。
Data Science Agent in Colab 是 Google 推出的一款基于 Gemini 的智能工具,旨在简化数据科学工作流程。它通过自然语言描述自动生成完整的 Colab 笔记本代码,涵盖数据导入、分析和可视化等任务。该工具的主要优点是节省时间、提高效率,并且生成的代码可修改和共享。它面向数据科学家、研究人员和开发者,尤其是那些希望快速从数据中获取洞察的用户。目前该工具免费提供给符合条件的用户。
SEO AI Agent 是一款能够快速创建和执行 SEO 策略的人工智能工具。
SEO AI Agent 是由 Writesonic 推出的一款先进的人工智能 SEO 工具。它通过实时数据和搜索引擎结果页(SERP)分析,提供智能化的 SEO 策略和优化建议。该工具结合了 Ahrefs 和 Google Analytics 等数据源,能够快速识别竞争对手的策略并提供针对性的优化方案。其主要优点包括高效的数据处理能力、实时的市场洞察以及用户友好的操作界面。产品定位为中小企业和营销团队提供低成本、高效率的 SEO 解决方案,价格为每月 99 美元,远低于传统 SEO 机构的费用。
一个专注于超大规模系统设计和优化的工具,提供高效解决方案。
The Ultra-Scale Playbook 是一个基于 Hugging Face Spaces 提供的模型工具,专注于超大规模系统的优化和设计。它利用先进的技术框架,帮助开发者和企业高效地构建和管理大规模系统。该工具的主要优点包括高度的可扩展性、优化的性能和易于集成的特性。它适用于需要处理复杂数据和大规模计算任务的场景,如人工智能、机器学习和大数据处理。产品目前以开源的形式提供,适合各种规模的企业和开发者使用。
提供全球基础金融数据,快速整合到模型中,助力现代金融分析师高效工作。
Finbar是一个专注于提供全球基础金融数据的平台。它通过先进的OCR、机器学习和自然语言处理技术,能够快速从海量金融文档中提取结构化数据,并在数据发布后几秒内提供给用户。其主要优点是数据更新速度快、自动化程度高,能够显著减少人工处理数据的时间和成本。该产品主要面向金融机构和分析师,帮助他们快速获取和分析数据,提升工作效率。目前尚不清楚其具体价格和定位,但已获得多家顶级对冲基金的使用。
一个AI驱动的数据科学团队,帮助用户更快地完成常见数据科学任务。
该产品是一个AI驱动的数据科学团队模型,旨在帮助用户以更快的速度完成数据科学任务。它通过一系列专业的数据科学代理(Agents),如数据清洗、特征工程、建模等,来自动化和加速数据科学工作流程。该产品的主要优点是能够显著提高数据科学工作的效率,减少人工干预,适用于需要快速处理和分析大量数据的企业和研究机构。产品目前处于Beta阶段,正在积极开发中,可能会有突破性变化。它采用MIT许可证,用户可以在GitHub上免费使用和贡献代码。
Sonus-1:开启大型语言模型(LLMs)的新时代
Sonus-1是Sonus AI推出的一系列大型语言模型(LLMs),旨在推动人工智能的边界。这些模型以其高性能和多应用场景的多功能性而设计,包括Sonus-1 Mini、Sonus-1 Air、Sonus-1 Pro和Sonus-1 Pro (w/ Reasoning)等不同版本,以满足不同需求。Sonus-1 Pro (w/ Reasoning)在多个基准测试中表现突出,特别是在推理和数学问题上,展现了其超越其他专有模型的能力。Sonus AI致力于开发高性能、可负担、可靠且注重隐私的大型语言模型。
利用LlamaIndex和IBM's Docling实现的RAG技术
RAG over excel sheets是一个结合了LlamaIndex和IBM's Docling技术的人工智能项目,专注于在Excel表格上实现检索式问答(RAG)。该项目不仅可以应用于Excel,还可以扩展到PPTs和其他复杂的文档。它通过提供高效的信息检索和处理能力,极大地提高了数据分析和文档管理的效率。
多模态大型语言模型,优化图像与文本交互能力
InternVL2_5-4B-MPO-AWQ是一个多模态大型语言模型(MLLM),专注于提升模型在图像和文本交互任务中的表现。该模型基于InternVL2.5系列,并通过混合偏好优化(MPO)进一步提升性能。它能够处理包括单图像和多图像、视频数据在内的多种输入,适用于需要图像和文本交互理解的复杂任务。InternVL2_5-4B-MPO-AWQ以其卓越的多模态能力,为图像-文本到文本的任务提供了一个强大的解决方案。
多模态大型语言模型,提升文本、图像和视频数据处理能力。
Valley是由字节跳动开发的多模态大型模型(MLLM),旨在处理涉及文本、图像和视频数据的多种任务。该模型在内部电子商务和短视频基准测试中取得了最佳结果,远超过其他开源模型,并在OpenCompass多模态模型评估排行榜上展现了出色的性能,平均得分67.40,位列已知开源MLLMs(<10B)中的前两名。
商业领域基础模型与代理
shoonya是一个专注于现代商业领域的基础模型与代理,提供多语言支持、本地化服务和针对特定商业垂直领域的优化。它通过为电子商务用例特别调整的基础模型,支持多种语言和本地上下文,以推动下一代零售业务的发展。shoonya的技术背景是基于人工智能和机器学习,旨在理解和优化区域商业模式、术语和偏好,为用户提供更加个性化和高效的购物体验。
开源图像到视频生成模型
Ruyi-Mini-7B是由CreateAI团队开发的开源图像到视频生成模型,具有约71亿参数,能够从输入图像生成360p到720p分辨率的视频帧,最长5秒。模型支持不同宽高比,并增强了运动和相机控制功能,提供更大的灵活性和创造力。该模型在Apache 2.0许可下发布,意味着用户可以自由使用和修改。
Astris AI是洛克希德·马丁公司推出的专注于安全的人工智能解决方案。
Astris AI是洛克希德·马丁公司成立的子公司,旨在推动美国国防工业基地和商业行业领域中对高保证要求的人工智能解决方案的采用。Astris AI通过提供洛克希德·马丁公司在人工智能和机器学习领域的领先技术和专业团队,帮助客户开发和部署安全、弹性和可扩展的AI解决方案。Astris AI的成立体现了洛克希德·马丁公司在推进21世纪安全、加强国防工业基础和国家安全方面的承诺,同时也展示了其在整合商业技术以帮助客户应对日益增长的威胁环境方面的领导力。
让人工智能触手可及
Recursal AI致力于使人工智能技术对所有人开放,无论语言或国家。他们的产品包括featherless.ai、RWKV和recursal cloud。featherless.ai提供即时且无需服务器的Hugging Face模型推理服务;RWKV是一个下一代基础模型,支持100多种语言,推理成本降低100倍;recursal cloud则让用户能够轻松地微调和部署RWKV模型。这些产品和技术的主要优点在于它们能够降低AI技术的门槛,提高效率,并支持多语言,这对于全球化背景下的企业和开发者来说至关重要。
大型多模态模型中视频理解的探索
Apollo是一个专注于视频理解的先进大型多模态模型家族。它通过系统性地探索视频-LMMs的设计空间,揭示了驱动性能的关键因素,提供了优化模型性能的实用见解。Apollo通过发现'Scaling Consistency',使得在较小模型和数据集上的设计决策能够可靠地转移到更大的模型上,大幅降低计算成本。Apollo的主要优点包括高效的设计决策、优化的训练计划和数据混合,以及一个新型的基准测试ApolloBench,用于高效评估。
高效、多语种的语音合成模型
CosyVoice语音生成大模型2.0-0.5B是一个高性能的语音合成模型,支持零样本、跨语言的语音合成,能够根据文本内容直接生成相应的语音输出。该模型由通义实验室提供,具有强大的语音合成能力和广泛的应用场景,包括但不限于智能助手、有声读物、虚拟主播等。模型的重要性在于其能够提供自然、流畅的语音输出,极大地丰富了人机交互的体验。
快速因果视频生成器,实现即时视频生成。
CausVid是一个先进的视频生成模型,它通过将预训练的双向扩散变换器适配为因果变换器,实现了即时视频帧的生成。这一技术的重要性在于它能够显著减少视频生成的延迟,使得视频生成能够以交互式帧率(9.4FPS)在单个GPU上进行流式生成。CausVid模型支持从文本到视频的生成,以及零样本图像到视频的生成,展现了视频生成技术的新高度。
开源多模态大型语言模型系列
InternVL 2.5是基于InternVL 2.0的高级多模态大型语言模型系列,它在保持核心模型架构的同时,在训练和测试策略以及数据质量方面引入了显著的增强。该模型深入探讨了模型扩展与性能之间的关系,系统地探索了视觉编码器、语言模型、数据集大小和测试时配置的性能趋势。通过在包括多学科推理、文档理解、多图像/视频理解、现实世界理解、多模态幻觉检测、视觉定位、多语言能力和纯语言处理在内的广泛基准测试中进行的广泛评估,InternVL 2.5展现出了与GPT-4o和Claude-3.5-Sonnet等领先商业模型相媲美的竞争力。特别是,该模型是第一个在MMMU基准测试中超过70%的开源MLLM,通过链式思考(CoT)推理实现了3.7个百分点的提升,并展示了测试时扩展的强大潜力。
大型语言模型,用于文本生成和分类
OLMo-2-1124-7B-RM是由Hugging Face和Allen AI共同开发的一个大型语言模型,专注于文本生成和分类任务。该模型基于7B参数的规模构建,旨在处理多样化的语言任务,包括聊天、数学问题解答、文本分类等。它是基于Tülu 3数据集和偏好数据集训练的奖励模型,用于初始化RLVR训练中的价值模型。OLMo系列模型的发布,旨在推动语言模型的科学研究,通过开放代码、检查点、日志和相关的训练细节,促进了模型的透明度和可访问性。
© 2025 AIbase 备案号:闽ICP备08105208号-14