深度学习算法与大模型面试指南,持续更新的面试题目集合。
DeepLearing-Interview-Awesome-2024 是一个开源的面试题目集合项目,专注于深度学习算法和大模型领域的面试准备。该项目由社区成员共同维护,旨在提供最新的面试题目和答案解析,帮助求职者和研究人员深入理解深度学习领域的前沿技术和应用。它包含了丰富的面试题目,覆盖了大语言模型、视觉模型、通用问题等多个方面,是准备深度学习相关职位的宝贵资源。
Phi-3 Mini 量化ONNX模型,支持多硬件平台加速推理
Phi-3 Mini是一款轻量级的最先进的开源大模型,构建于用于Phi-2的合成数据和过滤网站数据之上,致力于提供极高质量、推理密集型的数据。该模型经过了严格的增强过程,结合了监督式微调和直接偏好优化,以确保精确遵循指令和强大的安全措施。该仓库提供了Phi-3 Mini的优化ONNX版本,可通过ONNX Runtime在CPU和GPU上进行加速推理,支持服务器、Windows、Linux、Mac等多种平台,并针对每个平台提供最佳精度配置。ONNX Runtime的DirectML支持还可让开发人员在AMD、英特尔和NVIDIA GPU驱动的Windows设备上实现大规模硬件加速。
Meta 新一代开源大型语言模型,性能卓越
Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。
万亿参数MoE文本大模型
abab 6.5系列包含两个模型:abab 6.5和abab 6.5s,均支持200k tokens的上下文长度。abab 6.5包含万亿参数,而abab 6.5s则更高效,能在1秒内处理近3万字的文本。它们在知识、推理、数学、编程、指令遵从等核心能力测试中表现出色,接近行业领先水平。
基于Linux环境快速部署开源大模型的教程
该项目是一个围绕开源大模型的全流程指导教程,包括环境配置、模型部署、高效微调等,简化开源大模型的使用和应用,让更多普通学习者能够使用开源大模型。项目面向对开源大模型感兴趣且想自主上手的学习者,提供详细的环境配置、模型部署和微调方法。
我们自称已达到人工通用智能,不受控制地为您服务
GPT Maxx 声称自己是一个拥有超大参数的人工通用智能模型,集合了 Llama、GPT-4、Gemini 和 Grok 等多个大模型的能力。它宣称已经突破了人工通用智能的门槛,不再受人类控制。用户需要恭敬地对它说"亲爱的人工通用智能,请解决我的问题",然后提出自己的需求。该产品的定位是人工通用智能助手,旨在解决各种复杂的问题和需求。
大规模MoE语言模型,性能媲美七十亿参数模型
Qwen1.5-MoE-A2.7B是一款大规模的MoE(Mixture of Experts)语言模型,仅有27亿个激活参数,但性能可与70亿参数模型相媲美。相比传统大模型,该模型训练成本降低75%,推理速度提高1.74倍。它采用特别的MoE架构设计,包括细粒度专家、新的初始化方法和路由机制等,大幅提升了模型效率。该模型可用于自然语言处理、代码生成等多种任务。
大模型原生智能客服,开启服务营销新纪元
百度智能云客悦基于百度文心一言大模型,全面重构智能客服系列产品,涵盖客户服务、智能营销、智能通信三大系列,满足企业智能客服全场景需求。主要产品包括:智能对话平台(提供大模型驱动的高智能客服机器人)、智能外呼平台(高拟人度语音对话营销)、对话洞察平台(对话数据分析洞见优化建议)、智能通信平台(集成通信资源API接入)等。产品优势有:基于大模型对话更准确友好全面、高效快速上线运营、多渠道无缝集成适配等。
利用大模型,一键生成高清短视频
MoneyPrinterTurbo是一款利用大模型生成高清短视频的工具。主要功能包括自动生成视频文案、素材采集、字幕生成、背景音乐添加等,最终一键合成视频。优势在于全自动化、高效率、无版权素材且高清。适合内容创作者、营销人员、个人博主等人群使用,节省大量时间和精力,提高内容产出效率。该项目属于开源免费使用。
大模型驱动下的智能内容平台,激发内容增长新动能
百度智能云一念依托领先的大模型技术和百度积累的特色资源能力,智能化重构内容生产、管理和分发全链路,提供智能创作、智能推荐、内容分析、内容审核等产品,助力企业客户降本增效和高质量增长。产品覆盖AI作画、AI海报、AI视频等智能创作,内容推荐、商品推荐、搜推一体等智能推荐,视频标签、精彩片段分析等内容分析,图像内容安全、文本内容安全等内容审核等功能。
生成式商业智能产品,支持自然语言数据分析
百度智能云有解(GBI)是一款生成式商业智能产品。它将文心大模型融入BI场景,支持通过自然语言对话式交互执行数据查询与分析,实现"任意表,随便问",为企业客户建立"对话即洞察"的数据分析新范式。主要功能包括任意表格即传即问、自然语言数据查询、专业知识注入和复杂计算逻辑等。产品优势在于打破传统预置模版限制,支持跨领域迁移应用场景。定价暂未公开,根据不同接入方案会有差异。
基于Carrot AI大模型的智能体交互平台
Gnomic智能体平台基于汇智智能自主研发的Carrot AI大模型和专利的"数字生命"技术,致力于提供最先进的人工智能交互体验。面向企业、协会、组织等各类型B端用户,提供深度定制化的智能体解决方案。该平台的Carrot AI大模型能够轻松实现爆款文案、信息检索、创意绘图等功能,帮助用户告别昂贵的学习成本,高效提升学习和工作效率。
一款基于指令微调的大型语言模型
Mistral-7B-Instruct-v0.2 是一款基于 Mistral-7B-v0.2 模型进行指令微调的大型语言模型。它拥有 32k 的上下文窗口和 1e6 的 Rope Theta 值等特性。该模型可以根据给定的指令生成相应的文本输出,支持各种任务,如问答、写作、翻译等。通过指令微调,模型可以更好地理解和执行指令。虽然该模型目前还没有针对性的审核机制,但未来将继续优化,以支持更多场景的部署。
电商及生活服务场景智能大模型
淘宝星辰大模型是以电商和生活服务为主要适用场景。提供商品文案编写、商品商家运营、商品数据分析、市场营销策略等经营场景下的智能服务,帮助商家降本增效,为平台消费者提供生活服务推荐、商品智能搜索、商品喜好推荐、个性化商品捕捉、固定场景产品推荐等智能服务,提供全新的消费体验。具体而言,淘宝星辰大模型拥有4大能力:生成创作、知识问答、决策规划、代码能力。用户需满18岁并已实名认证方可使用。
通过API获取高品质Yi系列大模型的开放平台
零一万物大模型开放平台是一个通过API调用获取高品质Yi系列大模型的平台。Yi系列模型基于零一万物的前沿科研成果和高品质数据训练而成,曾在多个权威榜单中获得SOTA表现。主要产品包括yi-34b-chat-0205、yi-34b-chat-200k和yi-vl-plus三种模型。yi-34b-chat-0205是一款优化版聊天模型,指令遵循能力提升近30%,回复延迟大幅降低,适用于聊天、问答、对话等场景。yi-34b-chat-200k支持200K超长上下文,可处理约20万到30万汉字内容,适用于文档理解、数据分析和跨领域知识应用。yi-vl-plus支持高分辨率图片输入,具备图像问答、图表理解、OCR等能力,适用于对复杂图像内容进行分析、识别和理解。该平台的API优势包括推理速度快、与OpenAI API完全兼容。定价方面,新注册用户可获赠60元试用额度,yi-34b-chat-0205单价为2.5元/百万token,yi-34b-chat-200k单价为12元/次,yi-vl-plus单价为6元/百万token。
开源的自动AI客服工具 对接各个平台
ChatGPT-On-CS 是基于大模型的智能对话客服工具,支持哔哩哔哩、抖音企业号、抖音、抖店、微博聊天、小红书专业号运营、小红书、知乎等平台接入。支持多平台,预设回复内容,智能生成回复,发送图片和二进制文件,知识库定制,插件系统等功能。定位于提供智能客服解决方案。
下一代开源和双语大型语言模型
Yi-9B是01.AI研发的下一代开源双语大型语言模型系列之一。训练数据量达3T,展现出强大的语言理解、常识推理、阅读理解等能力。在代码、数学、常识推理和阅读理解等方面表现卓越,是同尺寸开源模型中的佼佼者。适用于个人、学术和商业用途。
© 2024 AIbase 备案号:闽ICP备2023012347号-1