首页 > AI教程资讯

Stable Virtual Camera：使用一张图片，可以生成360度旋转的3D视频

文章来源：08AI导航网发布时间：2025-04-09 17:32:33

Stable Virtual Camera是什么？

Stable Virtual Camera 是由 Stability AI 推出的一款用于NVS 的多视角扩散模型。它能够根据任意数量的输入视角及其对应的相机参数，生成目标相机视角下的新图像。当所有相机形成一条轨迹时，生成的视角在 3D 上具有一致性、时间上平滑，并且正如其名称所暗示的那样——“稳定”，能够生成无缝的轨迹视频。

Stable Virtual Camera：使用一张图片，可以生成360度旋转的3D视频.webp

Stable Virtual Camera功能

多视角输入：可以接受从 1 到 32 张输入图像，性能随着输入视角的增加而提升，尤其是在处理大型场景时。

灵活的图像分辨率：尽管模型仅在 576×576 的正方形图像上进行训练，但能够以零样本的方式生成不同宽高比的目标视角。

长视频生成与闭环一致性：能够生成长达 1000 帧的视频，并在相机返回到同一位置时保持 3D 一致性。

采样多样性：在给定稀疏输入视角时，能够捕捉视角合成的不确定性，并生成不同的可能场景。

基准测试：建立了一个全面的基准，用于在不同数据集和设置下评估 NVS 方法。Stable Virtual Camera 达到了新的最佳性能。

Stable Virtual Camera应用

广告和营销：快速生成吸引人的产品展示视频。

内容创作：帮助艺术家和设计师将静态图像转化为动态视频。

教育和培训：将教材中的静态插图转化为 3D 视频，增强学习体验。

数字电影和 3D 动画：为影视制作提供新的可能性。

Stable Virtual Camera使用方法

1. 获取代码和模型

代码：从 GitHub 克隆代码。链接见文章末尾。

模型权重：从 Hugging Face 下载模型文件。下载链接见文章末尾。

2. 安装依赖

运行以下命令安装所需依赖：

pipinstall-rrequirements.txt

3. 运行方式

交互式使用（Gradio 演示）

启动 Gradio 演示：

pythongradio_demo.py

通过图形界面上传图片并设置参数，生成 3D 视频。

命令行使用（CLI）

使用命令行运行：

pythondemo.py--data_path--output_path--camera_path

示例：

pythondemo.py--data_path./input_images--output_path./output_video--camera_pathspiral

4. 输入和输出

输入：支持 1 到 32 张 2D 图像，需提供相机参数。

输出：生成不同宽高比（如 1:1、9:16、16:9）的 3D 视频，支持长达 1000 帧。

GitHub 代码仓库：https://github.com/Stability-ai/stable-virtual-camera

Hugging Face 模型页面：https://huggingface.co/stabilityai/stable-virtual-camera

项目主页：https://stable-virtual-camera.github.io/

论文：https://arxiv.org/abs/2503.14489

空间智能领航者：弋途科技完成数千万元融资，领跑车载AIOS全栈技术商业化

上一篇: 空间智能领航者：弋途科技完成数千万元融资，领跑车载AIOS全栈技术商业化

弋途科技今日宣布完成数千万元Pre-A轮融资。本轮由徐汇资本领投，德宁资本、云启资本跟投，资金将重点投入汽车垂域大模型及智能空间AIOS系统研发。

字节跳动的SeedEdit 和谷歌的Gemini 2.0 Flash对比，哪个更强

下一篇: 字节跳动的SeedEdit 和谷歌的Gemini 2.0 Flash对比，哪个更强

Google 这几天的Gemini 2 0 Flash模型很火，字节跳动的 SeedEdit 模型也可以实现这样的功能，都能够理解和执行用户的指令来完成图像编辑任务。

相关攻略更多

热门AI工具更多

最新资讯更多

Framer-成功从网站开始

Framer-成功从网站开始

AI工具

更新时间：2025-02-25