LTXV开源实时视频生成模型

MODEL ZOO Nov 24, 2024

Lightricks 推出了 LTX Video (LTXV),这是一种以前所未有的速度生成 AI 视频的开源模型。据开发人员介绍,该工具可以比播放速度更快地创建视频,使其成为时间敏感型工作流程的出色选择。

看下面这个示例:

LTXV prompt: “A woman with blonde hair styled up, wearing a black dress with sequins and pearl earrings, looks down with a sad expression on her face. The camera remains stationary, focused on the woman’s face. The lighting is dim, casting soft shadows on her face. The scene appears to be from a movie or TV show.”
LTXV 提示:“一位金发女子,身穿饰有亮片和珍珠耳环的黑色连衣裙,低头看着镜头,脸上带着悲伤的表情。摄像机保持静止,聚焦在女子的脸上。灯光昏暗,在她脸上投下柔和的阴影。这个场景看起来像是电影或电视节目中的场景。”
使用 LTX Video LTXV 生成的画面

LTX Video 专为无障碍设计,可在 NVIDIA RTX 4090 等消费级 GPU 上运行,无需昂贵的设备即可生成高质量的视频。

该工具在 GitHubHugging Facefal.ai 等平台上以预览模式提供,全面发布后将免费供个人和商业使用。 LTX Video 承诺在全面发布后将免费供个人和商业使用。

1、LTX Video 的核心功能

LTXV (LTX Video) 旨在简化和增强视频生成过程。据 Lightricks 称,该模型结合了多项独特功能,旨在在一个软件包中提供速度、可访问性和质量。

  • 实时视频生成

Lightricks 声称 LTX Video 可以比播放更快地生成视频,使其成为时间敏感型工作流程的卓越工具。

  • 文本到视频和图像到视频选项

使用 LTXV,用户可以通过输入描述性文本提示或上传静态图像进行动画来创建动态、流畅的视频。

  • 开源可访问性

作为开源模型,LTX Video 可免费进行修改和定制,促进开发人员之间的协作。

  • 无缝帧一致性

该工具最大限度地减少了闪烁和伪影,确保整个视频的过渡流畅且动作连贯。

  • 硬件效率

与许多需要专用硬件的工具不同,LTXV 可以在 NVIDIA RTX 4090 等消费级 GPU 上本地运行,从而在不影响质量的情况下降低成本。

  • 可自定义参数

用户可以控制分辨率、帧速率、指导尺度和推理步骤等方面,以根据自己的特定需求定制视频。

2、LTX Video 的优势

LTX Video(也称为 LTXV)与传统视频创建工具相比具有多项优势:

  • 经济实惠

通过在消费级硬件上运行并提供个人和商业用途的免费许可,LTXV AI Video Maker 消除了财务障碍。

  • 速度和效率

LTX Video 的实时生成功能使创作者能够快速制作内容,满足紧迫期限的要求。

  • 高质量输出

LTXV 确保清晰、生动的视觉效果和流畅的过渡,使其适用于专业和创意项目。

  • 社区驱动开发

LTX Video 的开源性质鼓励协作,确保该工具继续根据实际用例发展。

  • 易于使用

无论你是开发人员还是创作者,LTXV 都提供直观的工作流程,让广大用户都能轻松使用。

3、如何使用 LTX Video - LTXV

你可以在 Hugging Face 的 LTX Video游乐场上测试 LTXV AI 视频制作器,目前预览模型已可用。该平台支持文本转视频和图像转视频生成。

3.1 文本转视频

a) 输入你的提示。

写下你要创建的场景的详细描述。例如:

“A woman walks through a vibrant marketplace at sunset, the golden light reflecting off colorful stalls as the camera follows her from behind.”
“日落时分,一名女子走过一个生机勃勃的市场,金色的光线反射在色彩缤纷的摊位上,摄像机从她身后跟拍。”

b) 输入负面提示.

指定您要避免的元素,例如:

“motion blur, low quality, or distorted textures.”
“运动模糊、低质量或扭曲的纹理”。

c) 选择分辨率预设

选择视频的分辨率。更高的分辨率(例如 768x512)提供更多细节,但渲染时间更长。

d) 调整帧速率

设置帧速率以控制视频的流畅度。

e) 高级选项

  • 种子:设置一个值以重新创建特定样式。
  • 指导比例:使用 3–3.5 之间的值以获得平衡结果。
  • 推理步骤:选择 20–30 步以获得速度,或选择 40+ 以获得更高质量。

f) 生成视频

单击“生成视频”以创建动画。

3.2 图像到视频

a) 上传你的图像

首先上传高质量的静态图像。

b) 输入你的提示

添加所需动画的描述。例如:

“A lone astronaut drifts weightlessly in a sleek spaceship corridor, illuminated by soft blue lighting.”
“一名孤独的宇航员在光滑的宇宙飞船走廊中失重地漂浮,被柔和的蓝色灯光照亮。”

c) 输入负面提示

指定不良元素,例如:

“flickering, distorted details, or uneven lighting.”
“闪烁、扭曲的细节或不均匀的照明。”

d) 选择分辨率和帧速率

选择分辨率并根据您的喜好设置帧速率。

e) 高级选项

  • 使用种子值、指导尺度和推理步骤进一步自定义。
  • 生成视频
  • 预览并保存动画视频。

4、使用 LTX Video获得最佳效果的技巧

Lightrick提供了以下指南,以最大限度地提升你使用 LTX Video的体验:

a) 制作详细的提示

b) 专注于按时间顺序生动地描述动作、外观和环境。

示例:

“A young boy runs through a meadow, the camera capturing his joyful movements as golden sunlight streams through the trees.”
“一个小男孩穿过草地,相机捕捉到他快乐的动作,金色的阳光穿过树林。”

c) 遵循结构化格式

  • 用一句话开始主要动作。
  • 添加有关动作和手势的详细信息。
  • 准确描述外观和背景。
  • 指定摄像机角度、灯光和动态变化。

e)  参数指南

  • 分辨率预设:使用更高的分辨率获得详细的输出,较低的分辨率获得速度。
  • 种子:保存特定的种子值以重新创建输出。
  • 指导尺度:坚持使用 3-3.5 以获得平衡的结果。
  • 推理步骤:使用 20-30 来提高速度,或使用 40+ 来提高质量。

5、结束语

如果 Lightricks 就速度、质量和价格方面做出的承诺成真,LTX Video 将成为专业人士和业余爱好者工作流程的重要工具。目前,它的开源设计和免费商业许可表明它是一款值得探索的工具,尤其是对于那些致力于推进人工智能驱动的视频制作的人来说。


原文链接:LTX Video: Real-Time Video Generation with Open-Source Technology

汇智网翻译整理,转载请标明出处

Tags