Seedance 2.0可通过多镜头连贯、原生音频同步和物理感知运动创建电影级AI视频。
Seedance 2.0是一款AI视频生成器,允许用户从文本或图像开始,在几分钟内生成制作就绪的电影级视频。其核心优势在于多镜头连贯性、原生音频同步和物理感知运动,可提升视频制作的速度和质量。该产品提供多种定价方案,包括入门版、标准版和高级版,适合不同使用频率和需求的用户。对于创作者和团队而言,它能确保故事的连贯性和速度,支持快速迭代,并控制制作成本。
Kling 3.0将想法转化为电影,支持文本图像转1080p视频,可免费试用。
Kling 3.0 AI视频生成器是一款能够将文本和图像转化为1080p视频的工具。它为用户提供导演级别的控制能力,可让用户精准地掌控视频的创作过程。其原生音频同步技术确保了视频和音频的完美契合,而物理感知运动功能则为视频增添了更真实的动态效果。这款产品适合有视频创作需求的个人和团队,帮助他们高效地将创意转化为高质量的视频作品。目前产品提供免费试用机会,具体付费价格未提及。
Kling 3.0免费AI视频生成器,支持文本、图像转视频,有先进运动控制。
Kling 3.0是快手推出的免费AI视频生成平台。它具备先进的运动控制、文本转视频和图像转视频能力,相比之前版本,输出更逼真、连贯性更好、时长更长。平台定位为满足内容创作者和营销人员的视频制作需求,无需信用卡或订阅即可免费使用,为用户提供了便捷、高效且优质的视频制作解决方案。
2026 年领先 AI 生成器,支持原生 4K、音频和 Canvas Agent,创电影级视频。
Kling 3.0 是 2026 年推出的 AI 视频生成器,重新定义了 AI 叙事创建。它支持原生 4K 输出,画面精度高,适配大银幕,超越行业标准。其具备信息丰富的 Canvas Agent,可实现多角度扩展,自动化电影制作流程。高级运动控制能精确掌控表情、手势与口型同步,零技术门槛。原生音频集成可同时生成画面、语音和音效,一键生成完整沉浸式场景。图像系列模式确保跨帧一致性和视觉细节,Video O1 模型支持 720p、首尾帧生成及更长视频时长。该产品提供每日免费额度体验高级功能,4K 生成与商业用途可使用高级订阅,定位为专业视频创作者和商业项目的强大工具。
Malloy的AI运动设计师,无需技能,输入提示即可创建专业动画。
Malloy - AI Motion Designer是一款基于人工智能的运动设计工具,其重要性在于降低了动画制作的门槛,让没有After Effects或动画技能的用户也能轻松创建专业的动画。主要优点包括操作简单,只需输入提示词就能生成动画;节省时间和成本,无需专业的动画制作软件和技能。产品背景信息未提及,价格信息也未提及,定位是为广大非专业动画制作人员提供便捷的动画制作解决方案。
AI驱动的产品采用与用户引导平台,加速用户激活、提升参与度和留存率。
Userflow是一款AI驱动的产品采用与用户引导平台,为产品创建操作引导、清单和应用内支持。主要优点在于能够加速用户的激活、提升参与度和留存率,通过AI技术实现快速构建应用内体验。该产品适用于以客户为中心的团队,助力产品增长。产品提供免费试用,之后的定价详情可在官网咨询。
结合古老八卦风水智慧与前沿AI技术,优化家居风水布局
该产品将古老的东方八卦风水智慧与前沿的AI技术相结合,利用Gemini 3.0和Nano Banana Pro(Nano Banana 2)AI模型,为用户提供专业的卧室风水AI分析服务。其重要性在于帮助用户优化卧室风水布局,改善居住环境的气场和能量流动。产品的主要优点包括能够精准识别风水问题、提供个性化的风水调整建议、操作简单便捷等。背景信息方面,它融合了传统风水文化和现代科技,旨在为人们提供更科学、更智能的风水解决方案。关于价格,页面未提及,定位是为追求高品质居住环境、关注风水文化的用户提供服务。
免费在线试用,利用OpenAI Sora 2从文本生专业级视频,无需邀请码。
Sora2Video是基于OpenAI革命性的Sora 2模型构建的免费在线AI视频生成平台,无需邀请码即可即时访问。该平台定位为世界级的AI视频生成工具,旨在让用户从简单文本提示生成具有物理精确运动、同步音频和电影级品质的专业视频。其优势在于能模拟真实世界物理法则,实现物体自然互动和真实动作,同时生成完美匹配的对话、环境音效和背景音频。价格方面,提供免费试用,各套餐包含慷慨积分配额,也可购买额外积分。
Lucy Edit AI:先进文本引导视频编辑,保留动作,免费在线试用。
Lucy Edit AI是一款具有创新性的AI视频编辑工具,其独特之处在于先进的文本引导视频编辑技术。它能够理解自然语言指令,在精确编辑视频的同时完美保留视频的动作和构图。相较于传统AI视频编辑工具,Lucy Edit AI在编辑过程中不会破坏原视频的时间节奏、相机运动和角色动作。该产品定位为满足专业和业余视频创作者的需求,让他们无需复杂的技术知识,仅通过简单的文本提示即可完成高质量的视频编辑。目前产品提供免费试用机会,试用有一定的信用额度,如编辑一次视频需要10个信用点,用户可根据自身需求进行后续付费使用。
首款文本引导视频编辑基础模型,用文本指令轻松变换视频内容。
Lucy Edit AI是首款用于文本引导视频编辑的基础模型,由DecartAI推出并开源。其重要性在于革新了视频创作模式,让创作者无需复杂操作,仅通过文本指令就能实现视频编辑。主要优点包括闪电般的处理速度、行业领先的精度、无限的视频创作潜力、简单直观的操作界面,且受到全球内容创作者的信赖。该产品免费使用,定位是帮助用户高效、便捷地完成专业视频编辑。
音频驱动全身视频配音平台,支持稀疏帧控制和长序列图像到视频生成。
InfiniteTalk AI是一种先进的音频驱动视频生成模型,能够实现唇部同步和全身动画,超越传统配音。其主要优点包括稀疏帧控制、长序列图像到视频转换以及保留身份和镜头运动等功能。
用于理解任意视频中的相机运动的工具。
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。它的主要优点在于利用生成性视觉语言模型进行相机运动的原理分类和视频文本检索。通过与传统的结构从运动 (SfM) 和实时定位与*构建 (SLAM) 方法进行比较,该模型在捕捉场景语义方面显示出了显著的优势。该模型已开源,适合研究人员和开发者使用,且后续将推出更多改进版本。
Orango AI 是一款通过 AI 智能引导用户完成产品操作的工具,提升用户激活率。
Orango AI 是一款专注于提升用户激活率和降低用户流失率的产品。它通过 AI 技术引导用户完成复杂的操作流程,帮助用户快速熟悉产品功能。该产品适用于各种 SaaS 平台,能够显著减少客户支持负担,并通过智能推荐提升用户体验。其主要优势包括高度自动化、易于集成以及强大的用户行为分析能力。Orango AI 提供多种定价方案,满足从初创企业到大型企业的不同需求。
一个开源SDK,用于在应用中添加视频故事和引导页,提升用户参与度。
StorySDK是一个开源SDK,专为网站和移动应用设计,用于嵌入视频故事和引导页。它通过提供简单易用的编辑器和强大的功能,帮助开发者和内容创作者快速创建和分享吸引人的故事内容。其主要优点包括免费试用、无需信用卡、易于集成,以及提供丰富的交互功能和分析工具。该产品旨在通过视频故事的形式提升用户体验和参与度,适用于各种需要用户引导和内容展示的场景。
VideoJAM 是一种用于增强视频生成模型运动连贯性的框架。
VideoJAM 是一种创新的视频生成框架,旨在通过联合外观 - 运动表示来提升视频生成模型的运动连贯性和视觉质量。该技术通过引入内指导机制(Inner-Guidance),利用模型自身预测的运动信号动态引导视频生成,从而在生成复杂运动类型时表现出色。VideoJAM 的主要优点是能够显著提高视频生成的连贯性,同时保持高质量的视觉效果,且无需对训练数据或模型架构进行大规模修改,即可应用于任何视频生成模型。该技术在视频生成领域具有重要的应用前景,尤其是在需要高度运动连贯性的场景中。
一种用于控制视频扩散模型运动模式的高效方法,支持运动模式的自定义和迁移。
Go with the Flow 是一种创新的视频生成技术,通过使用扭曲噪声代替传统的高斯噪声,实现了对视频扩散模型运动模式的高效控制。该技术无需对原始模型架构进行修改,即可在不增加计算成本的情况下,实现对视频中物体和相机运动的精确控制。其主要优点包括高效性、灵活性和可扩展性,能够广泛应用于图像到视频生成、文本到视频生成等多种场景。该技术由 Netflix Eyeline Studios 等机构的研究人员开发,具有较高的学术价值和商业应用潜力,目前开源免费提供给公众使用。
Spell 是一个 AI 模型,可从图像生成 3D 世界,支持多种渲染技术。
Spell 是 Spline 推出的 AI 模型,能够从单张图像生成完整的 3D 场景。它基于扩散模型技术,通过结合真实数据和合成数据进行训练,能够在几分钟内生成具有多视图一致性的 3D 世界。该技术的主要优点是能够快速生成高质量的 3D 场景,并支持多种渲染技术如高斯绘制和神经辐射场等。Spell 的出现为 3D 设计领域带来了革命性的变化,使创作者能够更高效地生成和探索 3D 场景。目前,Spell 仍处于开发阶段,团队计划频繁更新模型以提升质量和一致性。
从日常动态视频中快速、准确地估计相机和密集结构
MegaSaM是一个系统,它允许从动态场景的单目视频中准确、快速、稳健地估计相机参数和深度图。该系统突破了传统结构从运动和单目SLAM技术的局限,这些技术通常假设输入视频主要包含静态场景和大量视差。MegaSaM通过深度视觉SLAM框架的精心修改,能够扩展到真实世界中复杂动态场景的视频,包括具有未知视场和不受限制相机路径的视频。该技术在合成和真实视频上的广泛实验表明,与先前和并行工作相比,MegaSaM在相机姿态和深度估计方面更为准确和稳健,运行时间更快或相当。
一种用于控制人类图像动画的方法
DisPose是一种用于控制人类图像动画的方法,它通过运动场引导和关键点对应来提高视频生成的质量。这项技术能够从参考图像和驱动视频中生成视频,同时保持运动对齐和身份信息的一致性。DisPose通过从稀疏的运动场和参考图像生成密集的运动场,提供区域级别的密集引导,同时保持稀疏姿态控制的泛化能力。此外,它还从参考图像中提取与姿态关键点对应的扩散特征,并将这些点特征转移到目标姿态,以提供独特的身份信息。DisPose的主要优点包括无需额外的密集输入即可提取更通用和有效的控制信号,以及通过即插即用的混合ControlNet提高生成视频的质量和一致性,而无需冻结现有模型参数。
© 2026 AIbase 备案号:闽ICP备08105208号-14