<img src="/_static/img/Frame@2x.eddfa3e.png" alt="AIbase - 智能匹配最适合您的AI产品和网站" class="logo"> 产品库

LTX-Video是由Lightricks开发的首个基于DiT的视频生成模型，能够实时生成高质量的视频内容。该模型以24 FPS的速度生成768x512分辨率的视频，速度超过观看速度。模型经过大规模多样化视频数据集的训练，能够生成高分辨率且内容真实多样的视频。LTX-Video支持文本到视频(text-to-video)以及图像+文本到视频(image+text-to-video)的应用场景。

需求人群：

"目标受众为视频内容创作者、特效师、游戏开发者等需要生成或处理视频内容的专业人群。LTX-Video以其高质量的视频生成能力和实时性，特别适合需要快速生成视频素材的专业人士，如在电影制作、广告设计、游戏开发等领域的应用。"

使用场景示例：

电影制作中，使用LTX-Video快速生成背景视频素材。

广告设计中，根据广告文案生成对应的视频内容。

游戏开发中，生成游戏中的动态背景或剧情动画。

产品特色：

• 实时视频生成：模型能够以超过观看速度的24 FPS生成视频。

• 高分辨率输出：生成的视频分辨率为768x512，保证视频质量。

• 多样化内容生成：训练于大规模多样化视频数据集，能够生成内容丰富的视频。

• 双模式应用：支持文本到视频和图像+文本到视频的生成。

• 英文提示支持：模型接受英文提示，生成相应的视频内容。

• 在线演示：通过Hugging Face平台可以直接访问模型的在线演示。

• 本地部署：提供详细的安装和推理代码，支持用户在本地环境部署和使用模型。

使用教程：

1. 访问Hugging Face平台的LTX-Video页面，了解模型详情。

2. 根据页面提供的链接，访问GitHub获取模型代码库。

3. 按照代码库中的指南，安装必要的环境和依赖。

4. 下载模型权重文件，并按照指南放置到指定目录。

5. 使用提供的inference.py脚本进行视频生成，输入相应的提示和参数。

6. 根据需要，调整生成视频的分辨率、帧数等参数，以满足特定需求。

7. 运行脚本，模型将根据输入的提示生成视频。

8. 检查生成的视频内容，确保其符合预期效果。

浏览量：134

打开站点

网站流量情况

动手实战人工智能 AI By Doing

人工智能入门教程网站，提供全面的机器学习与深度学习知识。

该网站由作者从 2015 年开始学习机器学习和深度学习,整理并编写的一系列实战教程。涵盖监督学习、无监督学习、深度学习等多个领域,既有理论推导,又有代码实现,旨在帮助初学者全面掌握人工智能的基础知识和实践技能。网站拥有独立域名,内容持续更新,欢迎大家关注和学习。

机器学习深度学习

Freepik AI 视频生成器

Freepik AI 视频生成器，基于人工智能技术快速生成高质量视频内容。

Freepik AI 视频生成器是一款基于人工智能技术的在线工具，能够根据用户输入的初始图像或描述快速生成视频。该技术利用先进的 AI 算法，实现视频内容的自动化生成，极大地提高了视频创作的效率。产品定位为创意设计人员和视频制作者提供快速、高效的视频生成解决方案，帮助用户节省时间和精力。目前该工具处于 Beta 测试阶段，用户可以免费试用其功能。

Udacity人工智能学院

提供AI和机器学习课程

Udacity人工智能学院提供包括深度学习、计算机视觉、自然语言处理和AI产品管理在内的AI培训和机器学习课程。这些课程旨在帮助学生掌握人工智能领域的最新技术，为未来的职业生涯打下坚实的基础。

国外精选

清影 AI 视频生成服务

基于 AI 技术生成视频内容的智能服务。

清影 AI 视频生成服务是一个创新的人工智能平台，旨在通过智能算法生成高质量的视频内容。该服务适合各种行业用户，能够快速便捷地生成富有创意的视觉内容。无论是商业广告、教育课程还是娱乐视频，清影 AI 都能提供优质的解决方案。该产品依托于先进的 GLM 大模型，确保生成内容的准确性与丰富性，同时满足用户个性化需求。提供免费试用，鼓励用户探索 AI 视频创作的无限可能。

AI视频生成内容创作

D-ID Creative Reality

人工智能视频生成APP,支持上传单张图片生成说话视频

D-ID APP利用人工智能技术,可以通过上传单张图片生成说话的视频。支持上传自己的语音,对上传图片中的人物进行 Lip Sync。视频效果逼真,提供了三种版本:Lite 免费版本,Pro 每月$29,Advanced 每月$195.99。APP 在图像处理和视频生成方面做得很出色。

国外精选

CausVid

快速因果视频生成器，实现即时视频生成。

CausVid是一个先进的视频生成模型，它通过将预训练的双向扩散变换器适配为因果变换器，实现了即时视频帧的生成。这一技术的重要性在于它能够显著减少视频生成的延迟，使得视频生成能够以交互式帧率（9.4FPS）在单个GPU上进行流式生成。CausVid模型支持从文本到视频的生成，以及零样本图像到视频的生成，展现了视频生成技术的新高度。

《人工智能安全治理框架》1.0版是由全国网络安全标准化技术委员会发布的技术指南，旨在鼓励人工智能创新发展的同时，有效防范和化解人工智能安全风险。该框架提出了包容审慎、确保安全，风险导向、敏捷治理，技管结合、协同应对，开放合作、共治共享等原则。它结合人工智能技术特性，分析风险来源和表现形式，针对模型算法安全、数据安全和系统安全等内生安全风险，以及网络域、现实域、认知域、伦理域等应用安全风险，提出了相应的技术应对和综合防治措施。

人工智能安全治理

Adobe Firefly生成视频

使用简单的提示和图像生成视频片段。

Adobe Firefly 是一款基于人工智能技术的视频生成工具。它能够根据用户提供的简单提示或图像快速生成高质量的视频片段。该技术利用先进的 AI 算法，通过对大量视频数据的学习和分析，实现自动化的视频创作。其主要优点包括操作简单、生成速度快、视频质量高。Adobe Firefly 面向创意工作者、视频制作者以及需要快速生成视频内容的用户，提供高效、便捷的视频创作解决方案。目前该产品处于 Beta 测试阶段，用户可以免费使用，未来可能会根据市场需求和产品发展进行定价和定位。

国外精选

Luma AI视频生成器

创新的AI视频生成器，快速实现创意视频。

Luma AI的Dream Machine是一款AI视频生成器，它利用先进的AI技术，将用户的想法转化为高质量、逼真的视频。它支持从文字描述或图片开始生成视频，具有高度的可扩展性、快速生成能力和实时访问功能。产品界面用户友好，适合专业人士和创意爱好者使用。Luma AI的Dream Machine不断更新，以保持技术领先，为用户提供持续改进的视频生成体验。

AI视频生成高质量输出

genmoai

开源视频生成模型

genmoai/models 是一个开源的视频生成模型，代表了视频生成技术的最新进展。该模型名为 Mochi 1，是一个基于 Asymmetric Diffusion Transformer (AsymmDiT) 架构的10亿参数扩散模型，从零开始训练，是迄今为止公开发布的最大的视频生成模型。它具有高保真运动和强提示遵循性，显著缩小了封闭和开放视频生成系统之间的差距。该模型在 Apache 2.0 许可下发布，用户可以在 Genmo 的 playground 上免费试用此模型。

VideoTetris

文本到视频生成的创新框架

VideoTetris是一个新颖的框架，它实现了文本到视频的生成，特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术，精确地遵循复杂的文本语义，并通过操作和组合去噪网络的空间和时间注意力图来实现。此外，它还引入了一种新的参考帧注意力机制，以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。

优质新品

文本到视频视频生成

Movie Gen Bench

视频生成评估基准测试

Movie Gen Bench是由Facebook Research发布的视频生成评估基准测试，旨在为未来在视频生成领域的研究提供公平且易于比较的标准。该基准测试包括Movie Gen Video Bench和Movie Gen Audio Bench两个部分，分别针对视频内容生成和音频生成进行评估。Movie Gen Bench的发布，对于推动视频生成技术的发展和评估具有重要意义，它能够帮助研究人员和开发者更好地理解和改进视频生成模型的性能。

视频生成评估基准

Sora视频生成器

通过文本生成高质量AI视频

Sora视频生成器是一个可以通过文本生成高质量AI视频的在线网站。用户只需要输入想要生成视频的文本描述,它就可以使用OpenAI的Sora AI模型,转换成逼真的视频。网站还提供了丰富的视频样例,详细的使用指南和定价方案等。

AI 视频生成

Ruyi-Mini-7B

开源图像到视频生成模型

Ruyi-Mini-7B是由CreateAI团队开发的开源图像到视频生成模型，具有约71亿参数，能够从输入图像生成360p到720p分辨率的视频帧，最长5秒。模型支持不同宽高比，并增强了运动和相机控制功能，提供更大的灵活性和创造力。该模型在Apache 2.0许可下发布，意味着用户可以自由使用和修改。

图像到视频视频生成

SoraVids

视频生成模型Sora的存档库

SoraVids是一个基于Hugging Face平台的视频生成模型Sora的存档库。它包含了87个视频和83个对应的提示，这些视频和提示在OpenAI撤销API密钥前被公开展示。这些视频均为MIME类型video/mp4，帧率为30 FPS。SoraVids的背景是OpenAI的视频生成技术，它允许用户通过文本提示生成视频内容。这个存档库的重要性在于它保存了在API密钥被撤销前生成的视频，为研究和教育提供了宝贵的资源。

视频生成机器学习

Open-Sora

开源视频生成项目,助力高效视频制作

Open-Sora是一个开源项目,旨在高效生成高质量视频,并将模型、工具和内容开放给所有人使用。通过拥抱开源原则,Open-Sora不仅民主化了获取先进视频生成技术的途径,还提供了一个简化了视频制作复杂性的流畅、用户友好的平台。我们的目标是通过Open-Sora来激发创新、创意和内容创作的包容性。该项目目前处于早期阶段,正在积极开发中。Open-Sora支持完整的视频数据预处理、加速训练、推理等流程。提供的权重可在只经过3天训练后生成2秒512x512分辨率的视频。Open-Sora还通过改进训练策略实现了46%的成本降低。

视频

HunyuanVideo

腾讯开源的大型视频生成模型训练框架

HunyuanVideo是腾讯开源的一个系统性框架，用于训练大型视频生成模型。该框架通过采用数据策划、图像-视频联合模型训练和高效的基础设施等关键技术，成功训练了一个超过130亿参数的视频生成模型，是所有开源模型中最大的。HunyuanVideo在视觉质量、运动多样性、文本-视频对齐和生成稳定性方面表现出色，超越了包括Runway Gen-3、Luma 1.6在内的多个行业领先模型。通过开源代码和模型权重，HunyuanVideo旨在缩小闭源和开源视频生成模型之间的差距，推动视频生成生态系统的活跃发展。

AI视频生成神器

利用AI技术快速生成视频内容

AI视频生成神器是一款利用人工智能技术，将图片或文字转换成视频内容的在线工具。它通过深度学习算法，能够理解图片和文字的含义，自动生成具有吸引力的视频内容。这种技术的应用，极大地降低了视频制作的成本和门槛，使得普通用户也能轻松制作出专业级别的视频。产品背景信息显示，随着社交媒体和视频平台的兴起，用户对视频内容的需求日益增长，而传统的视频制作方式成本高、耗时长，难以满足快速变化的市场需求。AI视频生成神器的出现，正好填补了这一市场空白，为用户提供了一种快速、低成本的视频制作解决方案。目前，该产品提供免费试用，具体价格需要在网站上查询。

AI 视频制作

Sora AI Video Generator

用人工智能生成音频和视频

Sora AI Video Generator是一个使用人工智能技术生成视频的在线平台。用户只需要输入文本描述,它就可以自动生成高质量的视频动画。该平台提供强大的创意工具,使用户无需专业技术就可以创作出精美的视频内容。关键功能包括:支持多种视觉风格选择,视频分辨率高达4K,支持添加背景音乐和文字,一键生成高质量视频等。适用于视频创作者、广告公司、游戏开发者等创意行业,以及个人用户的视频内容生产。

视频生成动画制作

LTX-Video

基于DiT的视频生成模型，实时生成高质量视频。

LTX-Video是由Lightricks开发的首个基于DiT的视频生成模型，能够实时生成高质量的视频内容。该模型以24 FPS的速度生成768x512分辨率的视频，速度超过观看速度。模型经过大规模多样化视频数据集的训练，能够生成高分辨率且内容真实多样的视频。LTX-Video支持文本到视频(text-to-video)以及图像+文本到视频(image+text-to-video)的应用场景。

京东人工智能开放平台

京东自主研发的人工智能开放平台

京东人工智能开放平台NeuHub,汇聚京东自主研发的人工智能核心技术,包含语音、图像、视频、NLP等技术,通过平台向外开放,助力行业智能升级。平台还提供数据标注、模型开发、训练和发布等全流程服务,以及创新应用案例,帮助企业实现智能化转型。

中文精选

图像识别开发编程

Vchitect 2.0

由上海人工智能实验室开发的先进视频生成模型

Vchitect 2.0（筑梦2.0）是一款由上海人工智能实验室开发的高级视频生成模型，旨在赋予视频创作新的动力。它支持20秒视频生成，灵活的宽高比，生成空间时间增强，以及长视频评估。Vchitect 2.0通过其先进的技术，能够将静态图像转换为5-10秒的视频，使用户能够轻松地将照片或设计转换为引人入胜的视觉体验。此外，Vchitect 2.0还支持长视频生成模型的评估，通过VBench平台，提供全面且持续更新的评估排行榜，支持多种长视频模型，如Gen-3、Kling、OpenSora等。

中文精选

视频生成图像到视频

Infinity AI

探索人工智能的无限可能

无限人工智能致力于构建生成式视频模型，专注于人类。我们相信人是故事的中心，而故事是人类处理、学习和进化的方式。我们预测未来 10 年内，一支由 3 名作家组成的团队，无需演员、导演或其他工作人员，将赢得奥斯卡奖。我们正在开发他们将使用的工具。欢迎加入我们的探索之旅。

DeepMind

谷歌旗下领先的人工智能研究公司

Google DeepMind 是谷歌旗下的一家领先的人工智能公司，专注于开发先进的机器学习算法和系统。DeepMind 以其在深度学习和强化学习领域的开创性工作而闻名，其研究涵盖了从游戏到医疗保健等多个领域。DeepMind 的目标是通过构建智能系统来解决复杂的问题，推动科学和医学的进步。

全球热门

Wan2.1-FLF2V-14B

开源视频生成模型，支持多种生成任务。

Wan2.1-FLF2V-14B 是一个开源的大规模视频生成模型，旨在推动视频生成领域的进步。该模型在多项基准测试中表现优异，支持消费者级 GPU，能够高效生成 480P 和 720P 的视频。它在文本到视频、图像到视频等多个任务中表现出色，具有强大的视觉文本生成能力，适用于各种实际应用场景。

中文精选

视频生成深度学习

Create AI Bots with No-Code

探索人工智能机器人和应用 | Quetab

Quetab是由Quetab人工智能社区创建的顶级人工智能机器人、应用和工具的发现平台。它可以帮助你完成各种不同任务。

人工智能机器人人工智能应用

OLAMI 人工智能开放平台

OLAMI是一个人工智能开放平台

OLAMI是一个提供云端API、管理界面、多元机器感知解决方案的人工智能软件开发平台。OLAMI平台具有语音识别、自然语言理解、对话管理、语音合成等语音AI技术,以及图像识别、语义理解等视觉AI技术,可以轻松地为产品加入人工智能,提升用户体验。

中文精选

开发编程 Ai开放平台

Adept

机器学习研究与产品实验室，构建有用的通用人工智能

Adept是一个机器学习研究与产品实验室，通过使人类和计算机能够创造性地共同工作，构建通用人工智能。它将你的目标用简单的语言转化为日常使用的软件上的操作。

Ai online course

提供关于人工智能的最佳资源，学习机器学习、数据科学、自然语言处理等。

AI Online Course是一个互动学习平台，提供清晰简明的人工智能介绍，使复杂的概念易于理解。它涵盖机器学习、深度学习、计算机视觉、自动驾驶、聊天机器人等方面的知识，并强调实际应用和技术优势。