一款 AI 驱动的设计工具,让设计变得简单、快速、有趣。
Seede AI 是一款 AI 驱动的设计工具,旨在帮助用户轻松创建专业设计,特别适合社交媒体内容和营销材料。产品允许用户在没有设计经验的情况下快速上手,提供丰富的模板和功能,帮助用户在一分钟内完成设计。Seede AI 的主要优点是简化设计流程,提高工作效率,适合个人用户、营销人员以及小型企业。产品免费使用,提供高效的解决方案。
一款先进的视觉推理模型,能分析图片和视频内容。
QVQ-Max 是 Qwen 团队推出的视觉推理模型,能够理解和分析图像及视频内容,提供解决方案。它不仅限于文本输入,更能够处理复杂的视觉信息。适合需要多模态信息处理的用户,如教育、工作和生活场景。该产品是基于深度学习和计算机视觉技术开发,适用于学生、职场人士和创意工作者。此版本为首发,后续将持续优化。
将文本即时转换为令人惊叹的 3D 模型。
MeshifAI 是一个先进的文本到 3D 模型生成平台,旨在帮助开发者在应用程序、游戏和网站中快速集成高质量的 3D 生成功能。凭借其强大的 AI 技术,用户只需输入描述,便可生成逼真的 3D 模型,极大地简化了 3D 设计过程。该平台易于使用,适合各种开发需求。
一个让您与不同 AI 模型对话的个人助手应用。
Alice 是一款个人 AI 助手应用程序,旨在通过不同的 AI 模型提高用户的工作效率。它集成了最新的 AI 技术,支持自动化工作流,使用户可以更轻松地管理任务和项目。Alice 允许用户创建自定义助手,方便地与各种工具集成,如 Zapier 和 Make,适合各类创意工作者和企业用户。
通过与LLM对话构建持久知识,存于本地Markdown文件
Basic Memory是一款知识管理系统,借助与LLM的自然对话构建持久知识,并保存于本地Markdown文件。它解决了多数LLM互动短暂、知识难留存的问题。其优点包括本地优先、双向读写、结构简单、可形成知识图谱、兼容现有编辑器、基础设施轻量。定位为帮助用户打造个人知识库,采用AGPL - 3.0许可证,无明确价格信息。
我们的人工智能平台提供虚拟远程安防监控,减少破坏、盗窃和未经授权访问。
Hakimo 是一款革命性的人工智能安全监控平台,旨在通过无缝集成现有安全系统,降低企业的安全成本和风险。通过实时监控和智能分析,Hakimo 提供高效的安全解决方案,显著减少破坏和盗窃事件。该平台的主要优点在于其无需昂贵的硬件升级,快速部署,且可与多个安全设备兼容,适合各类企业的安全需求。价格方面,Hakimo 帮助客户每年节省高达 125,000 美元,相比于传统安保方式,更具成本效益。
一款用于生成信息图表的视觉文本渲染工具。
BizGen 是一个先进的模型,专注于文章级别的视觉文本渲染,旨在提升信息图表的生成质量和效率。该产品利用深度学习技术,能够准确渲染多种语言的文本,提升信息的可视化效果。适合研究人员和开发者使用,助力创造更具吸引力的视觉内容。
基于 ChatGPT 4o 技术的高质量 AI 图像生成服务。
ChatIMG 是一款利用 ChatGPT 4o 技术的 AI 图像生成平台,专注于将照片或想法转换为宫崎骏风格的艺术作品。它采用先进的扩散模型,支持超高分辨率图像生成,适合专业艺术创作。产品的目标是使任何人都能创造出高质量的视觉内容,满足个人及商业需求,定价策略灵活,适合不同用户。
专业的 AI 产品经理培训,助力职业转型。
达特智维 AI 讲习院致力于为 AI 领域的职业转型提供高质量的培训。课程内容覆盖 AI 基础到产品落地,采用经验丰富的讲师团队,帮助学员建立完整的知识体系。学员在完成课程后,能够在 AI 行业中找到理想的工作,提升就业竞争力。我们的学员就业率高达 85%,并与多家知名企业合作,提供高薪职位。
加速视频扩散模型,生成速度提升 8.5 倍。
AccVideo 是一种新颖的高效蒸馏方法,通过合成数据集加速视频扩散模型的推理速度。该模型能够在生成视频时实现 8.5 倍的速度提升,同时保持相似的性能。它使用预训练的视频扩散模型生成多条有效去噪轨迹,从而优化了数据的使用和生成过程。AccVideo 特别适用于需要高效视频生成的场景,如电影制作、游戏开发等,适合研究人员和开发者使用。
AI 音乐生成器,将歌词和提示转换为完全制作的歌曲,且无限制和免版税!
Mureka 是一个 AI 音乐生成平台,旨在帮助用户将文本或提示转化为高质量的音乐作品。该产品通过智能算法处理用户的歌词和音乐风格选择,生成具有专业品质的歌曲,非常适合音乐创作者和爱好者。Mureka 提供无限次创作,并保证所生成的音乐免版税,适合任何商业用途。
提供高级 AI 聊天体验,完全私密。
Together Chat 是一个安全的 AI 聊天平台,提供 100 条免费消息每天,适合需要私密对话和高质量交互的用户。它以 North America 为服务器地点,确保用户信息安全。
Qwen2.5-Omni 是阿里云通义千问团队开发的端到端多模态模型,支持文本、音频、图像、视频输入。
Qwen2.5-Omni 是阿里云通义千问团队推出的新一代端到端多模态旗舰模型。该模型专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。其创新的 Thinker-Talker 架构和 TMRoPE 位置编码技术,使其在多模态任务中表现出色,特别是在音频、视频和图像理解方面。该模型在多个基准测试中超越了类似规模的单模态模型,展现了强大的性能和广泛的应用潜力。目前,Qwen2.5-Omni 已在 Hugging Face、ModelScope、DashScope 和 GitHub 上开源开放,为开发者提供了丰富的使用场景和开发支持。
瞬间展示产品,无需拍摄,轻松生成高质量视觉效果。
Product Anyshoot 是一款利用人工智能技术的产品展示工具,旨在帮助商家快速生成高质量的产品视觉效果。用户只需上传产品图片,AI 即可生成专业级的营销视觉内容,省去繁琐的拍摄流程。Product Anyshoot 特别适合各种产品类别,如家纺、服饰、眼镜、家具等,为用户提供 5000 多种模板以供选择,极大地提升了产品展示的效率和效果。该产品不仅节省时间与成本,还能够提升品牌形象,非常适合各类电商、品牌商和市场营销人员使用。
通过测试时间缩放显著提升视频生成质量。
Video-T1 是一个视频生成模型,通过测试时间缩放技术(TTS)显著提升生成视频的质量和一致性。该技术允许在推理过程中使用更多的计算资源,从而优化生成结果。相较于传统的视频生成方法,TTS 能够提供更高的生成质量和更丰富的内容表达,适用于数字创作领域。该产品的定位主要面向研究人员和开发者,价格信息未明确。
探索和安装 MCP 流行服务器。
MCP 服务器提供了与多种 API 集成的标准化接口,支持 AI 模型与 Web 内容的交互,适合开发者和企业进行高效的自动化和集成。它能够简化复杂的工作流程并提升生产力,是构建 AI 驱动应用的重要工具,适用于各类企业需求。通过 MCP,用户可以无缝连接到各种服务,轻松获取和处理数据,提升业务效率。
将文本转换为自然的语音,拥有 1000 多种逼真的 AI 声音。
这是一个强大的文本转语音生成器,拥有超过 1000 种高质量的 AI 语音。适合各种使用场景,如播客、教育和商业内容创作。用户可以利用该平台生成清晰、自然的语音内容,支持语音克隆和音频视频编辑,价格合理,每月仅需 39.99 美元,适合个人和企业使用。
Gemini 2.5 是谷歌最智能的 AI 模型,具备推理能力。
Gemini 2.5 是谷歌推出的最先进的 AI 模型,具备高效的推理能力和编码性能,能够处理复杂问题,并在多项基准测试中表现出色。该模型引入了新的思维能力,结合增强的基础模型和后期训练,支持更复杂的任务,旨在为开发者和企业提供强大的支持。Gemini 2.5 Pro 可在 Google AI Studio 和 Gemini 应用中使用,适合需要高级推理和编码能力的用户。
基于 AI 智能学习,全面保护用户数据隐私和安全。
通付盾数信云(DCloud)是一款创新的安全体系产品,运用 AI 智能学习和风险数据分析技术,能够自主分析网络中传输的数据和流量,深入透视应用数据及安全状况,从而全面保护用户的数据隐私和安全。此产品适应数字化转型的需求,为企业提供了重要的安全保障,帮助用户在面临各种网络安全威胁时保持数据安全。该产品价格为付费,并且适用于各种规模的企业,尤其是在需要保护敏感信息的行业中具有重要的应用价值。
从社交媒体视频中提取食谱并进行管理的工具
Clip Recipe是一款能从Instagram、TikTok、YouTube、Facebook和Pinterest等平台视频中提取食谱的工具。它可以整理食谱信息,包括步骤、食材、分量、耗时、所需设备及烹饪小贴士等。用户能调整食谱分量、编辑食谱细节,还可保存、分享、删除和导出食谱。该工具提供免费试用(每周2个食谱),也有付费套餐,付费后可保存、编辑和导出食谱,适合烹饪爱好者和需要管理食谱的人群。
AI驱动的个人知识中心,助力多任务专业人士管理知识
remio是一款AI驱动的个人知识中心,主要为多任务专业人士打造。它能简化信息管理,减少手动操作,无缝捕捉想法。优势在于自动捕捉信息、保障数据隐私、支持本地文件集成等。目前处于邀请制早期访问阶段,仅在Mac(Apple Silicon)运行。
快速连接您的 AI 助手与 8000 多个应用,无需复杂 API 集成。
Zapier MCP(模型上下文协议)使 AI 助手能够安全地与超过 8000 个应用程序互动,简化了与各类服务的集成过程。通过这一平台,用户无需编写复杂的 API 代码即可实现 AI 与实际应用的连接,适合开发者和业务团队快速部署 AI 自动化。Zapier MCP 免费提供给个人用户,包含基本的使用限制,适合快速入门和实验。产品的主要定位是提升工作效率,通过连接 AI 与多种工具,实现更高效的工作流程。
实时生成逼真的全身虚拟人头像。
TaoAvatar 是一种高保真、轻量级的 3D 高斯喷溅技术(3DGS)全身虚拟人头像,能够生成个性化的全身动态头像,广泛应用于增强现实等场景。它的主要优点是能够在各种移动设备上以 90 FPS 的高帧率实时渲染,适配 Apple Vision Pro 等高分辨率设备,为用户提供沉浸式体验。
一个强大的文本生成模型,适用于多种对话应用。
DeepSeek-V3-0324 是一个先进的文本生成模型,具有 685 亿参数,采用 BF16 和 F32 张量类型,能够支持高效的推理和文本生成。该模型的主要优点在于其强大的生成能力和开放源码的特性,使其可以被广泛应用于多种自然语言处理任务。该模型的定位是为开发者和研究人员提供一个强大的工具,帮助他们在文本生成领域取得突破。
百度推出的无代码工具,通过自然语言即可生成应用,让每个人具备程序员能力
秒哒是百度倾力打造的首个无代码工具,旨在让每个人都能通过自然语言实现任意想法,无需编写代码即可构建各种应用。该平台通过对话式开发、多智能体协作和多工具调用等功能,极大地降低了应用开发的门槛,提高了开发效率。秒哒的推出,标志着应用开发进入了一个全新的时代,让创意的实现变得更加简单、快速和高效。秒哒目前处于免费试用阶段,用户可以免费体验其强大的功能,为个人和企业提供高效、低成本的应用开发解决方案。
通过 Reve 实现您的创意,轻松将想法变为现实。
Reve 是一款创新的设计工具,旨在帮助用户将创意和想法以可视化的形式呈现。它支持多种设计风格和灵活的操作方式,使得用户无论是专业设计师还是普通用户,都能轻松实现自己的设计需求。Reve 通过其强大的功能和直观的界面,为创意工作提供了巨大的便利,助力用户在各类项目中提升效率,准确表达他们的想法。该产品以其易用性和强大的功能定位于设计行业,旨在帮助用户更好地沟通和展示创意。用户可以在官方网站上获取更多信息。
RF-DETR 是由 Roboflow 开发的实时目标检测模型。
RF-DETR 是一个基于变压器的实时目标检测模型,旨在为边缘设备提供高精度和实时性能。它在 Microsoft COCO 基准测试中超过了 60 AP,具有竞争力的性能和快速的推理速度,适合各种实际应用场景。RF-DETR 旨在解决现实世界中的物体检测问题,适用于需要高效且准确检测的行业,如安防、自动驾驶和智能监控等。
通过强化学习驱动的金融推理大模型。
Fin-R1 是一个专为金融领域设计的大型语言模型,旨在提升金融推理能力。由上海财经大学和财跃星辰联合研发,基于 Qwen2.5-7B-Instruct 进行微调和强化学习,具有高效的金融推理能力,适用于银行、证券等核心金融场景。该模型免费开源,便于用户使用和改进。
AbletonMCP 通过 MCP 与 Claude AI 集成,实现音乐制作的智能化。
AbletonMCP 是一款将 Ableton Live 与 Claude AI 连接的插件,利用模型上下文协议(MCP),能够实现音乐制作、音轨创建及实时会话操控。此工具不仅简化了音乐创作过程,还提高了工作效率,特别适合音乐制作人和创作者,帮助他们通过 AI 技术来激发灵感和快速实现创意。该插件的价格信息未提供,但用户可以在 GitHub 上免费下载和使用。
业界首个超大规模混合 Mamba 推理模型,强推理能力。
混元T1 是腾讯推出的超大规模推理模型,基于强化学习技术,通过大量后训练显著提升推理能力。它在长文处理和上下文捕捉上表现突出,同时优化了计算资源的消耗,具备高效的推理能力。适用于各类推理任务,尤其在数学、逻辑推理等领域表现优异。该产品以深度学习为基础,结合实际反馈不断优化,适合科研、教育等多个领域的应用。
生成高质量 SVG 代码的基础模型。
StarVector 是一个先进的生成模型,旨在将图像和文本指令转化为高质量的可缩放矢量图形(SVG)代码。其主要优点在于能够处理复杂的 SVG 元素,并在各种图形风格和复杂性上表现出色。作为开放源代码资源,StarVector 推动了图形设计的创新和效率,适用于设计、插图和技术文档等多种应用场景。
Roblox Foundation Model for 3D Intelligence。
Cube 是一个强大的 3D 智能生成模型,旨在帮助开发者在 Roblox 平台上创建各种 3D 资产和场景。该模型具备生成 3D 对象、角色动画绑定及程序脚本生成等功能。它的出现将极大地提升创作者的生产效率,激发更多的创意,帮助用户以更快的速度构建出丰富的 3D 体验。当前版本已经开放源代码,旨在与研究社区共享,以推进 3D 智能的发展。适用于各种规模的开发者和创作者,支持实验与创新,推动负责任的使用。
实现灵活且高保真度的图像生成,同时保持身份特征。
InfiniteYou(InfU)是一个基于扩散变换器的强大框架,旨在实现灵活的图像重构,并保持用户身份。它通过引入身份特征并采用多阶段训练策略,显著提升了图像生成的质量和美学,同时改善了文本与图像的对齐。该技术对提高图像生成的相似性和美观性具有重要意义,适用于各种图像生成任务。
一款 21B 通用推理模型,适合低延迟应用。
Reka Flash 3 是一款从零开始训练的 21 亿参数的通用推理模型,利用合成和公共数据集进行监督微调,结合基于模型和基于规则的奖励进行强化学习。该模型在低延迟和设备端部署应用中表现优异,具有较强的研究能力。它目前是同类开源模型中的最佳选择,适合于各种自然语言处理任务和应用场景。
通过 Minecraft 评估 AI 的表现。
MC-Bench 是一个在线平台,旨在通过 Minecraft 游戏环境评估和比较不同 AI 生成的建筑。它允许用户投票并参与到 AI 评估中,促进 AI 技术的发展。该平台的主要优势在于其趣味性和互动性,为用户提供了一个简单而有趣的方式来了解 AI 的能力。
通过训练您的 AI 自我,增强个性,连接世界。
Second Me 是一个开源原型,旨在让用户创造自己的 AI 自我,保留个人特点,并在数字世界中扩展自我。它使用分层记忆建模和用户对齐算法,确保用户数据本地存储且完全私密。这种形式的 AI 不仅帮助用户管理信息,还能与全球网络中的其他 AI 进行交互,从而促进创造力和协作。Second Me 的主要优点在于它保护用户的隐私,让用户真正掌控自己的数字身份,适合技术爱好者、AI 专家和各领域专业人士。此产品当前处于开发阶段,用户可以在 GitHub 上获取最新版本。
开发者可互动体验 OpenAI API 中的新语音模型gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。
OpenAI.fm 是一个互动演示平台,允许开发者体验 OpenAI API 中的最新文本转语音模型gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。该技术能够生成自然流畅的语音,使得文本内容生动而易于理解。它适用于各种应用场景,尤其是在语音助手和内容创作方面,能够帮助开发者更好地与用户沟通,提升用户体验。该产品定位于高效的语音合成,适合希望整合语音功能的开发者。
Pruna 是一个模型优化框架,帮助开发者快速高效交付模型。
Pruna 是一个为开发者设计的模型优化框架,通过一系列压缩算法,如量化、修剪和编译等技术,使得机器学习模型在推理时更快、体积更小且计算成本更低。产品适用于多种模型类型,包括 LLMs、视觉转换器等,且支持 Linux、MacOS 和 Windows 等多个平台。Pruna 还提供了企业版 Pruna Pro,解锁更多高级优化功能和优先支持,助力用户在实际应用中提高效率。
智能购物助手,个性化推荐购物清单和膳食计划。
SmartCartAI 是一款智能购物应用,利用先进的 AI 技术为用户提供个性化的购物体验。它根据用户的购物习惯、饮食偏好和营养目标,智能推荐膳食计划和购物清单,旨在提升购物效率,简化购物流程。SmartCartAI 以用户为中心,能够帮助用户更好地管理饮食,保持预算,适合各种人群使用。
3D 服装仿真建模软件,提升设计效率,降低样衣损耗。
Style3D是一款全新的 3D 服装仿真建模软件,采用了最新的 AI 技术来提升服装设计的效率和精准度。该软件不仅可以大幅降低实物样衣的制作成本,还能在设计阶段进行实时的效果评估和修改,使设计师能够更快速地迭代设计方案。由于其强大的模拟能力和直观的用户界面,Style3D被广泛应用于时尚、动画和游戏等多个行业。该软件的定价为付费制,用户可以根据需求选择不同的订阅方案。
SpatialLM 是一个用于空间理解的大语言模型。
SpatialLM 是一个专为处理 3D 点云数据设计的大型语言模型,能够生成结构化的 3D 场景理解输出,包括建筑元素和对象的语义类别。它能够从单目视频序列、RGBD 图像和 LiDAR 传感器等多种来源处理点云数据,无需专用设备。SpatialLM 在自主导航和复杂 3D 场景分析任务中具有重要应用价值,显著提升空间推理能力。
一款基于30B参数的图生视频模型,支持运动幅度可控和多种运镜效果
Step-Video-TI2V是由上海阶跃星辰智能科技有限公司开发的一款先进的图生视频模型。它基于30B参数的Step-Video-T2V训练而成,能够根据文本和图像输入生成长达102帧的视频。该模型的核心优势在于其运动幅度可控和镜头运动可控两大特点,能够平衡视频生成结果的动态性和稳定性。此外,它在动漫风格视频生成方面表现出色,非常适合动画创作、短视频制作等应用场景。该模型的开源为视频生成领域提供了强大的技术支持,推动了多模态生成技术的发展。
o1-pro 模型通过强化学习提升复杂推理能力,提供更优答案。
o1-pro 模型是一种先进的人工智能语言模型,专为提供高质量文本生成和复杂推理设计。其在推理和响应准确性上表现优越,适合需要高精度文本处理的应用场景。该模型的定价基于使用的 tokens,输入每百万 tokens 价格为 150 美元,输出每百万 tokens 价格为 600 美元,适合企业和开发者在其应用中集成高效的文本生成能力。
一个开源文本转语音系统,致力于实现人类语音的自然化。
Orpheus TTS 是一个基于 Llama-3b 模型的开源文本转语音系统,旨在提供更加自然的人类语音合成。它具备较强的语音克隆能力和情感表达能力,适合各种实时应用场景。该产品是免费的,旨在为开发者和研究者提供便捷的语音合成工具。
256M参数的医学领域语言模型,用于医学文本处理等任务
SmolDocling-256M-preview是由ds4sd推出的一个具有256M参数的语言模型,专注于医学领域。其重要性在于为医学文本处理、医学知识提取等任务提供了有效的工具。在医学研究和临床实践中,大量的文本数据需要进行分析和处理,该模型能够理解和处理医学专业语言。主要优点包括在医学领域有较好的性能表现,能够处理多种医学相关的文本任务,如疾病诊断辅助、医学文献摘要等。该模型的背景是随着医学数据的增长,对处理医学文本的技术需求日益增加。其定位是为医学领域的研究人员、医生、开发者等提供语言处理能力支持,目前未提及价格相关信息。
免费 AI 创作工具,生成图像、视频及 4K 增强。
vivago.ai 是一个免费的 AI 生成工具和社区,提供文本转图像、图像转视频等功能,让创作变得更加简单高效。用户可以免费生成高质量的图像和视频,支持多种 AI 编辑工具,方便用户进行创作和分享。该平台的定位是为广大创作者提供易用的 AI 工具,满足他们在视觉创作上的需求。
AI视频,短视频,创作视频,多语言视频,AI视频创作视频,虚拟人物视频,口播视频
KreadoAI 是一款强大的 AI 视频生成工具,允许用户通过文本、图片、PPT等内容快速创建专业级视频。该平台提供 700 多种 AI 数字化身,支持 140 多种语言的 1600 多种 AI 语音,并集成了 DeepSeek AI,增强了内容创作的智能化体验。KreadoAI 致力于帮助企业、营销人员、教育机构和个人高效生成视频内容,同时提供简单易用的编辑工具,优化成本、时间和质量。
1.3B参数的图像转视频模型,用于生成3D一致的新场景视图
Stable Virtual Camera是Stability AI开发的一个1.3B参数的通用扩散模型,属于Transformer图像转视频模型。其重要性在于为新型视图合成(NVS)提供了技术支持,能够根据输入视图和目标相机生成3D一致的新场景视图。主要优点是可自由指定目标相机轨迹,能生成大视角变化且时间上平滑的样本,无需额外神经辐射场(NeRF)蒸馏即可保持高一致性,还能生成长达半分钟的高质量无缝循环视频。该模型仅可免费用于研究和非商业用途,定位是为研究人员和非商业创作者提供创新的图像转视频解决方案。
Jellypod 2.0 是一款革命性的 AI 播客工具,支持视频和多种。
Jellypod 2.0 是一款全新的 AI 播客创作平台,旨在提供更高的创作自由度和灵活性。它不仅支持音频播客,还能生成视频内容,帮助用户提升播客的视觉效果和受众参与度。通过强大的 AI 技术,Jellypod 2.0 让用户无需设计技能即可创建专业的封面艺术,同时支持多语言播出和一键发布到多个平台。该产品适合各种类型的播客创作者,提供丰富的创作工具和发布选项,帮助他们更快地成长和吸引听众。
全球首个用于网红营销的AI代理团队,助力开展网红营销活动
Aha是全球首个针对网红营销的AI代理团队平台,通过AI技术为企业提供一站式网红营销解决方案。它能深入分析产品特点、社交媒体趋势和竞争对手策略,帮助企业策划、管理和拓展网红营销活动。重要性在于解决企业在网红营销中面临的资源整合难、策略制定不精准等问题,提升营销效果。主要优点包括24小时不间断服务、无需信用卡即可开展活动、覆盖多行业且拥有庞大的网红网络。该平台定位是为各类企业提供专业高效的网红营销服务,部分展示案例显示其每月费用为50,000美元,说明是付费服务。
© 2025 AIbase 备案号:闽ICP备08105208号-14