秒聽錄音:AI會議助理,會議後自動生成逐字稿、記錄等,解決會議難題。
秒聽錄音是一款AI會議助理,由Gemini 3 Pro、Qwen Max、ChatGPT 5等大模型驅動。它通過AI語音即時辨識技術並結合AI大模型,在會議結束後自動生成多種會議相關文件,能夠解決會議後工作推進緩慢、會議追溯困難等難題。價格為0 TWD,定位於幫助企業和專業人士提高會議效率,減少會議後整理時間。
让智能体行动快10倍,节省100倍令牌,提供DOM结构和行动指南
Actionbook是一款能够为大语言模型(LLMs)提供最新DOM结构和行动指南的工具。它的重要性在于解决了智能体在操作网站时的诸多难题,例如传统方法难以处理动态页面、复杂DOM树和流式内容等问题。其主要优点包括:使智能体行动速度提升10倍,节省100倍的令牌使用量;提供精确的DOM定位,避免猜测;具有普遍兼容性,能与任何大语言模型、智能体框架和浏览器自动化工具配合使用。该产品由Cue Labs Inc开发,目前提供免费使用版本。其定位是帮助开发者和自动化操作人员更高效地让智能体操作各类网站。
一站式大模型微调平台,支持多种主流模型。
LLaMA-Factory Online 是与明星开源项目 LLaMA-Factory 官方合作打造的在线大模型训练与微调服务平台。我们致力于为工程能力较为基础或希望为微调过程提效的用户群体,提供开箱即用、低代码、全链路功能覆盖的大模型训练与微调服务。
由中国电信人工智能研究院研发的语言模型。
星辰语义大模型 - TeleChat3 是一款由中国电信人工智能研究院开发的高性能大语言模型,专注于自然语言处理任务。该模型基于国产算力训练,具有强大的推理和微调能力,适合各类应用场景。产品致力于为开发者提供高效、灵活的 AI 解决方案,特别是在知识、创作、指令、代码等多个维度展示出色的性能。
与LLaMA-Factory官方合作,一站式低代码大模型微调平台,支持超百种模型。
LLaMA-Factory Online是与明星开源项目LLaMA Factory官方合作打造的在线大模型训练与微调服务平台。其底层提供高性能、高弹性GPU算力资源,定位为具有微调需求、编码与工程能力较为基础的用户群体,提供开箱即用、低代码、全链路功能覆盖的大模型训练与微调服务。该平台具有权威、系统的使用指南和精选的真实场景案例。价格方面,采用秒级计费,任务仅在运行态计费,不用不扣费,还设有高性能GPU限时超低价等优惠活动。其重要性在于降低了大模型微调的技术门槛和经济门槛,让更多用户能够参与到大模型的训练与微调中。
基于Nano Banana Pro引擎的免费AI图像生成器,支持秒级出图与高清放大。
Nano Imagine 是一款领先的在线 AI 图像生成工具,搭载了先进的 Nano Banana Pro 推理引擎。该产品背景定位于高性能与易用性的结合,强调“思考后创作”的逻辑,能够精准理解物理规律、光影关系和空间结构。其核心优势在于极快的生成速度(约10秒)、行业领先的文字渲染准确性以及原生 2K/4K 高清放大功能。该产品旨在打破创意障碍,为用户提供工作室级别的视觉效果,且目前提供免费使用额度,具有极高的性价比和市场竞争力。
Dex将浏览器变为AI工作空间,了解任务与上下文,推动工作进展
Dex是一款Chrome扩展程序,由ThirdLayer公司开发。它把浏览器转变成智能工作空间,可跨多个应用和标签处理任务,能记住用户偏好和上下文,更好地辅助各项任务。该产品具有隐私性,用户可通过精细权限控制数据。它提供免费计划,还有专业版、商业版和企业版等高级版本,适用于知识工作者和专业人士。
Uniqode免费二维码生成器,可生成URL、PDF等二维码,支持自定义。
该产品是Uniqode推出的免费二维码生成器,允许用户为URL、PDF等内容创建二维码。其重要性在于方便快捷地将各种信息转化为二维码形式,便于分享和传播。主要优点包括免费使用、可自定义二维码的外观,如添加logo、改变颜色和框架等。产品背景是为满足用户对多样化、个性化二维码的需求。价格方面,完全免费。定位是为普通用户、企业等提供简单易用的二维码生成解决方案。
Google DeepMind旗舰多模态AI,1M上下文,具备博士级推理与高级编码能力
Gemini 3 Pro是Google DeepMind基于Transformer架构构建的多模态基础模型。其重要性在于为各领域提供强大的AI支持,能处理多种类型的输入和输出。主要优点包括博士级推理能力、100万输入token的长上下文处理、多模态深度理解、智能编码和动态思维等。产品背景是Google为满足复杂任务需求而研发。价格方面,API输入2美元/100万token,输出12美元/100万token(≤200k token多模态价格不同),Google AI Plus月费19.99美元可获得应用和Workspace试用机会。定位是用于代理任务和“氛围编码”等复杂智能任务的高端模型。
Kat Dev是专为软件工程和编码任务打造的大语言模型,助力AI编码。
Kat Dev是快手Kwaipilot团队开发的AI代码智能解决方案,是专注于软件工程和编码任务的大语言模型家族。其重要性在于为开发者提供强大的代码生成、优化等能力,提升开发效率。主要优点包括高性能,如KAT Dev 72B Exp在SWE Bench基准测试中达到74.6分排名第一;采用先进的多阶段代理训练;支持多语言代码;模型开源,采用Apache 2.0许可证,方便社区使用和研究,开发者可免费访问。该产品定位为服务现代开发者和团队,推动AI驱动的软件开发。
Fogsight 是一款由大型语言模型驱动的动画引擎。
Fogsight 是一款创新的动画引擎,利用大型语言模型生成生动的动画。它不仅支持多种语言,还能根据用户的输入生成高水平的叙事动画,适用于教育、娱乐和创意领域。Fogsight 注重用户体验,允许通过简单的界面与 AI 进行交互,快速生成所需的动画内容。
面向大模型的智能解决方案平台,自动优化多任务。
PromptPilot 是一个智能解决方案平台,专注于大模型的优化和用户任务意图的实现。通过交互反馈,该平台能够自动优化多步骤、多模态和多场景的任务,为用户提供高效的智能解决方案,适合企业和个人用户提升工作效率和任务完成质量。
B站开源的SOTA动画视频生成模型,支持多种二次元风格视频一键生成。
Index-AniSora是由B站开源的顶尖动画视频生成模型,基于AniSora技术实现,支持多种二次元风格视频镜头的一键生成,如番剧、国创、漫改动画、VTuber、动画PV和鬼畜动画等。该模型通过强化学习技术框架全面提升动画内容的生产效率与质量,其技术原理已被IJCAI2025接收。Index-AniSora的开源为动画视频生成领域带来了新的技术突破,为开发者和创作者提供了强大的工具,推动二次元内容创作的进一步发展。
使用微信聊天记录微调大语言模型,实现高质量声音克隆。
WeClone 是一个基于微信聊天记录微调大语言模型的项目,主要用于实现高质量的声音克隆和数字分身。它结合了微信语音消息和 0.5B 大模型,允许用户通过聊天机器人与自己的数字分身互动。该技术在数字永生和声音克隆领域具有重要的应用价值,可以让用户在不在场的情况下继续与他人交流。此项目正在快速迭代中,适合对 AI 和语言模型感兴趣的用户,且目前处于免费的开发阶段。
Dream 7B 是最强大的开放扩散大语言模型。
Dream 7B 是由香港大学 NLP 组和华为诺亚方舟实验室联合推出的最新扩散大语言模型。它在文本生成领域展现了优异的性能,特别是在复杂推理、长期规划和上下文连贯性等方面。该模型采用了先进的训练方法,具有强大的计划能力和灵活的推理能力,为各类 AI 应用提供了更为强大的支持。
NotaGen 是一个用于符号音乐生成的模型,采用大语言模型训练范式,专注于生成高质量古典乐谱。
NotaGen 是一款创新的符号音乐生成模型,通过预训练、微调和强化学习三个阶段提升音乐生成质量。它利用大语言模型技术,能够生成高质量的古典乐谱,为音乐创作带来新的可能性。该模型的主要优点包括高效生成、风格多样和高质量输出。它适用于音乐创作、教育和研究等领域,具有广泛的应用前景。
Atom of Thoughts (AoT) 是一种用于提升大语言模型推理性能的框架。
Atom of Thoughts (AoT) 是一种新型推理框架,通过将解决方案表示为原子问题的组合,将推理过程转化为马尔可夫过程。该框架通过分解和收缩机制,显著提升了大语言模型在推理任务上的性能,同时减少了计算资源的浪费。AoT 不仅可以作为独立的推理方法,还可以作为现有测试时扩展方法的插件,灵活结合不同方法的优势。该框架开源且基于 Python 实现,适合研究人员和开发者在自然语言处理和大语言模型领域进行实验和应用。
© 2026 AIbase 备案号:闽ICP备08105208号-14