需求人群:
"目标受众为技术IC(包括工程师和数据科学家),他们需要在构建AI产品时获得指导和改进。课程内容的实用性和专家的深入讲解使他们能够更好地理解和应用LLMs技术。"
使用场景示例:
Sanyam Bhutani, Meta的合伙人工程师,认为该课程扩展了LLMs的应用知识,教学内容无冗余。
Laurian,全栈计算语言学家,认为课程传奇,社区活跃,课程内容多次学习仍有新发现。
Andre,CTO,称赞课程提供了LLMs的深入见解,讲师提供优秀讲座和建议,课程内容丰富实用。
产品特色:
课程包含超过40小时的内容,涵盖评估、RAG、微调、构建应用程序和提示工程等主题。
课程内容组织有序,按主题区域划分,帮助学习者快速浏览并跳过不相关内容。
提供章节摘要、笔记、幻灯片和资源,帮助学习者专注于最相关的内容并深入学习。
课程是调查性质的,重点在于介绍主题而非深入代码,建议将所学应用于个人项目中。
课程免费开放给所有人,适合有一定LLMs经验并需要指导的技术IC。
课程还提供学生反馈和评价,展示了课程的实际效果和影响力。
课程网站提供订阅更新,允许用户获取最新见解和内容。
使用教程:
访问课程网站 https://hamel.dev/blog/posts/course/。
浏览课程内容,选择感兴趣的主题区域。
查看章节摘要,快速了解每个讲座的主题。
阅读笔记、查看幻灯片和资源,深入了解相关内容。
将所学内容应用到个人项目中,巩固理解。
考虑订阅课程更新,获取最新见解和内容。
浏览量:41
最新流量情况
月访问量
31.95k
平均访问时长
00:00:54
每次访问页数
1.97
跳出率
43.97%
流量来源
直接访问
46.35%
自然搜索
33.17%
邮件
0.09%
外链引荐
11.17%
社交媒体
8.50%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
加拿大
5.31%
德国
4.84%
英国
5.81%
印度
14.98%
美国
40.32%
由实践者主导的LLMs公开课
Mastering LLMs 是一个由25多位行业资深人士主讲的免费课程,涵盖了评估、检索增强生成(RAG)、微调等主题。课程内容由信息检索、机器学习、推荐系统、MLOps和数据科学等领域的专家提供,旨在将这些领域的先前技术应用于LLMs,为用户提供有意义的优势。课程面向需要指导如何改进AI产品的技术IC(包括工程师和数据科学家)。
AI研究资源导航网站,提供AI研究资源、文档和实践案例
DeepResearch123是一个AI研究资源导航平台,旨在为研究人员、开发者和爱好者提供丰富的AI研究资源、文档和实践案例。该平台涵盖了机器学习、深度学习和人工智能等多个领域的最新研究成果,帮助用户快速了解和掌握相关知识。其主要优点是资源丰富、分类清晰,便于用户查找和学习。该平台面向对AI研究感兴趣的各类人群,无论是初学者还是专业人士都能从中受益。目前平台免费开放,用户无需付费即可使用所有功能。
大规模多语言文本数据集
allenai/tulu-3-sft-olmo-2-mixture是一个大规模的多语言数据集,包含了用于训练和微调语言模型的多样化文本样本。该数据集的重要性在于它为研究人员和开发者提供了丰富的语言资源,以改进和优化多语言AI模型的性能。产品背景信息包括其由多个来源的数据混合而成,适用于教育和研究领域,且遵循特定的许可协议。
视频生成模型Sora的存档库
SoraVids是一个基于Hugging Face平台的视频生成模型Sora的存档库。它包含了87个视频和83个对应的提示,这些视频和提示在OpenAI撤销API密钥前被公开展示。这些视频均为MIME类型video/mp4,帧率为30 FPS。SoraVids的背景是OpenAI的视频生成技术,它允许用户通过文本提示生成视频内容。这个存档库的重要性在于它保存了在API密钥被撤销前生成的视频,为研究和教育提供了宝贵的资源。
先进的文本生成模型,支持多样化任务
Llama-3.1-Tulu-3-8B-DPO是Tülu3模型家族中的一员,专注于指令遵循,提供完全开源的数据、代码和配方,旨在作为现代后训练技术的全面指南。该模型专为聊天以外的多样化任务设计,如MATH、GSM8K和IFEval,以达到最先进的性能。模型主要优点包括开源数据和代码、支持多种任务、以及优秀的性能。产品背景信息显示,该模型由Allen AI研究所开发,遵循Llama 3.1社区许可协议,适用于研究和教育用途。
开源的PDF到Podcast工作流构建工具
NotebookLlama是一个开源项目,旨在通过一系列教程和笔记本指导用户构建从PDF到Podcast的工作流。该项目涵盖了从文本预处理到使用文本到语音模型的整个流程,适合对大型语言模型(LLMs)、提示和音频模型零知识的用户。NotebookLlama的主要优点包括易用性、教育性和实验性,它不仅提供了一个参考实现,还鼓励用户通过实验不同的模型和提示来优化结果。
一站式数据处理系统,为大型语言模型提供高质量数据。
Data-Juicer 是一个一站式的多模态数据处理系统,旨在为大型语言模型(LLMs)提供更高质量、更丰富、更易消化的数据。它提供了一个系统化和可复用的数据处理库,支持数据与模型的协同开发,通过沙盒实验室实现快速迭代,并提供基于数据和模型的反馈循环、可视化和多维度自动评估等功能,帮助用户更好地理解和改进他们的数据和模型。Data-Juicer 正在积极更新和维护,定期增强和添加更多功能、数据配方和数据集。
深度学习领域的经典教材中文翻译
《深度学习》是一本由Simon J.D. Prince所著的深度学习领域的经典教材,MIT Press于2023年12月5日出版。本书涵盖了深度学习领域的许多关键概念,适合初学者和有经验的开发者阅读。本仓库提供了该书的中文翻译,翻译基于原书的最新版本,使用ChatGPT进行机翻并进行人工审核,确保翻译的准确性。
深入理解深度学习的原理与应用
《Understanding Deep Learning》是一本深入探讨深度学习原理和应用的书籍。它提供了丰富的数学背景知识、监督学习、神经网络的构建与训练等深度学习领域的全面内容。书中提供的Python笔记本练习帮助读者通过实践来加深理解。此外,还有为教师提供的资源,包括图像、幻灯片和教辅材料。
首个多语种手语生成模型,优化手语翻译与教学。
SignLLM是首个多语种手语生成模型,它基于公共手语数据构建,包括美国手语(ASL)和其他七种手语。该模型能够从文本或提示生成手语手势,并通过强化学习加速训练过程,提高数据采样质量。SignLLM在八种手语的生产任务上都达到了最先进的性能。
Hugging Face官方课程,提供有关使用Hugging Face产品的教程和资源
Hugging Face Course是一个由Hugging Face官方提供的教育资源,旨在帮助用户学习和掌握Hugging Face平台的各种工具和API。
探索YouTube上最新的机器学习/人工智能课程
ML-YouTube-Courses是一个开源项目,致力于整理和索引YouTube上最新的、最好的机器学习课程。项目包含各种主题的课程,如机器学习、深度学习、自然语言处理、计算机视觉等,涵盖基础知识和前沿技术。该项目帮助开发者和学习者高效地发现优质的在线教程。
一款为 AI/ML 模型监控和管理而设计的工具。
Arthur Engine 是一个旨在监控和治理 AI/ML 工作负载的工具,利用流行的开源技术和框架。该产品的企业版提供更好的性能和额外功能,如自定义的企业级防护机制和指标,旨在最大化 AI 对组织的潜力。它能够有效评估和优化模型,确保数据安全与合规。
通过知识与技能帮助教育者有效利用人工智能。
OpenAI Academy 致力于为教育者提供人工智能的知识与技能,帮助他们在教学中有效整合 AI 技术。通过针对 K-12 教育者的工作坊,OpenAI Academy 强调了生成性 AI 模型(如 ChatGPT)的构造和转型潜力,以及它们在课堂上的实际应用。这一平台旨在帮助教育者面对 AI 带来的机遇与挑战,培养他们在不断发展的数字环境中,为学生提供必要的安全性、技能和自主权。此项目是免费的,旨在为教育者和学生创造一个更美好的未来。
一款帮助科研人员发现学术论文的强大工具。
Ai2 PaperFinder 是一个致力于帮助科研人员快速找到所需文献的在线工具。该平台汇聚了超过 800 万篇全文论文及 1.08 亿篇摘要,具备强大的文献检索和合成功能。通过简单的关键词搜索,用户可以迅速获取相关研究,极大地提高了科研效率。该产品的背景源于对科研文献的迫切需求,定价为免费,适合各类科研人员使用。
一款先进的视觉推理模型,能分析图片和视频内容。
QVQ-Max 是 Qwen 团队推出的视觉推理模型,能够理解和分析图像及视频内容,提供解决方案。它不仅限于文本输入,更能够处理复杂的视觉信息。适合需要多模态信息处理的用户,如教育、工作和生活场景。该产品是基于深度学习和计算机视觉技术开发,适用于学生、职场人士和创意工作者。此版本为首发,后续将持续优化。
将文本转换为自然的语音,拥有 1000 多种逼真的 AI 声音。
这是一个强大的文本转语音生成器,拥有超过 1000 种高质量的 AI 语音。适合各种使用场景,如播客、教育和商业内容创作。用户可以利用该平台生成清晰、自然的语音内容,支持语音克隆和音频视频编辑,价格合理,每月仅需 39.99 美元,适合个人和企业使用。
一个强大的文本生成模型,适用于多种对话应用。
DeepSeek-V3-0324 是一个先进的文本生成模型,具有 685 亿参数,采用 BF16 和 F32 张量类型,能够支持高效的推理和文本生成。该模型的主要优点在于其强大的生成能力和开放源码的特性,使其可以被广泛应用于多种自然语言处理任务。该模型的定位是为开发者和研究人员提供一个强大的工具,帮助他们在文本生成领域取得突破。
RF-DETR 是由 Roboflow 开发的实时目标检测模型。
RF-DETR 是一个基于变压器的实时目标检测模型,旨在为边缘设备提供高精度和实时性能。它在 Microsoft COCO 基准测试中超过了 60 AP,具有竞争力的性能和快速的推理速度,适合各种实际应用场景。RF-DETR 旨在解决现实世界中的物体检测问题,适用于需要高效且准确检测的行业,如安防、自动驾驶和智能监控等。
高保真可动画 3D 人类重建模型,快速生成动画角色。
LHM(大规模可动画人类重建模型)利用多模态变压器架构进行高保真 3D 头像重建,支持从单张图像生成可动画的 3D 人类形象。该模型能够详细保留服装几何和纹理,尤其是在面部身份和细节恢复方面表现优异,适合对 3D 重建精度有较高要求的应用场景。
业界首个超大规模混合 Mamba 推理模型,强推理能力。
混元T1 是腾讯推出的超大规模推理模型,基于强化学习技术,通过大量后训练显著提升推理能力。它在长文处理和上下文捕捉上表现突出,同时优化了计算资源的消耗,具备高效的推理能力。适用于各类推理任务,尤其在数学、逻辑推理等领域表现优异。该产品以深度学习为基础,结合实际反馈不断优化,适合科研、教育等多个领域的应用。
Pruna 是一个模型优化框架,帮助开发者快速高效交付模型。
Pruna 是一个为开发者设计的模型优化框架,通过一系列压缩算法,如量化、修剪和编译等技术,使得机器学习模型在推理时更快、体积更小且计算成本更低。产品适用于多种模型类型,包括 LLMs、视觉转换器等,且支持 Linux、MacOS 和 Windows 等多个平台。Pruna 还提供了企业版 Pruna Pro,解锁更多高级优化功能和优先支持,助力用户在实际应用中提高效率。
SpatialLM 是一个用于空间理解的大语言模型。
SpatialLM 是一个专为处理 3D 点云数据设计的大型语言模型,能够生成结构化的 3D 场景理解输出,包括建筑元素和对象的语义类别。它能够从单目视频序列、RGBD 图像和 LiDAR 传感器等多种来源处理点云数据,无需专用设备。SpatialLM 在自主导航和复杂 3D 场景分析任务中具有重要应用价值,显著提升空间推理能力。
LG AI 推出的开源推理 AI 模型,具备卓越的推理能力。
EXAONE Deep 是 LG AI Research 推出的先进推理 AI 模型,标志着韩国在全球 AI 市场中的竞争力。它具备 32 亿参数,表现卓越,尤其在数学和科学问题解决方面展现出色。该模型的发布使得 LG 在 AI 领域迈入了自主决策的时代,其开源特性使得更多开发者能够利用这一技术进行研究与开发。EXAONE Deep 的轻量级和在设备上的模型设计使得其适用于多个行业,包括教育、科学研究、编程等。
一个开源文本转语音系统,致力于实现人类语音的自然化。
Orpheus TTS 是一个基于 Llama-3b 模型的开源文本转语音系统,旨在提供更加自然的人类语音合成。它具备较强的语音克隆能力和情感表达能力,适合各种实时应用场景。该产品是免费的,旨在为开发者和研究者提供便捷的语音合成工具。
集无限画布、AIGC、项目看板、音视频会议等功能于一体的可视化在线协作空间
英飞·思想家是一个AIGC赋能的可视化在线协作空间,旨在通过无限画布、音视频会议、思维导图等功能,为企业和团队提供高效协作的数字平台。它支持实时和异步协作,适用于多种场景,如项目管理、头脑风暴、培训等。产品定位为提升团队协作效率,促进知识共享和创新。目前提供个人免费使用和团队免费试用,具体定价需查看官网。
一款开源的14B参数量的数学模型,通过强化学习训练,性能卓越。
Light-R1-14B-DS 是由北京奇虎科技有限公司开发的开源数学模型。该模型基于 DeepSeek-R1-Distill-Qwen-14B 进行强化学习训练,在 AIME24 和 AIME25 数学竞赛基准测试中分别达到了 74.0 和 60.2 的高分,超越了许多 32B 参数量的模型。它在轻量级预算下成功实现了对已经长链推理微调模型的强化学习尝试,为开源社区提供了一个强大的数学模型工具。该模型的开源有助于推动自然语言处理在教育领域的应用,特别是数学问题解决方面,为研究人员和开发者提供了宝贵的研究基础和实践工具。
一款用于检测文本是否由人工智能生成并可将AI文本改写为人类风格的工具。
该产品通过先进的技术检测文本是否由人工智能生成,同时提供文本改写功能,使AI生成的文本具有人类写作的自然风格。它对维护内容的原创性和真实性具有重要意义,尤其在学术、教育、内容创作等领域。产品完全免费,无需注册,支持多语言,适合广泛用户。
© 2025 AIbase 备案号:闽ICP备08105208号-14