ChatGPT「电影感AI视频制作教程」（含脚本模版 + 提示词 + 工具搭配）

YouTube视频教程1年前 (2025)更新 windy有风

在这期视频里，我想带大家一探 OpenAI 最新的 GPT-4o 图像生成功能，特别是它在 AI 影视制作和分镜设计方面展现出来的巨大潜力。它最吸引人的一点，就是可以稳定地生成“形象一致”的多角色图像，而且还能实现类似 3D 空间里的“切换镜头”效果——就好像你在跟一个懂镜头语言的导演沟通一样，随时调整角度来拍电影。

另外，它在处理图像中较长的文字时也非常清晰准确。不管是科学、物理还是现实生活场景，GPT-4o 的理解力都相当强，连各种细节都拿捏得很准。内建的图像编辑功能还支持“局部修图”（inpainting），对于搞 AI 电影、产品拍摄，甚至做广告图的人来说，这真的可以说是一个革命性的工具。

本期视频用到的工具链接：

►向有风咨询，加入我的知识星球圈子：
➜https://t.zsxq.com/16QP9JP8b

►办一张国外银行卡（可用于ChatGPT会员升级）
➜https://yeka.ai/i/19YC7OIQ

►本期视频提示词
➜https://aiyoufeng.com/characters

有风用到的AI工具
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
►elevenlabs 最好用的AI配音
➜https://bit.ly/47UBlUv

►沉浸式翻译
➜https://bit.ly/4ij7QAO

►pikzels AI视频封面制作
➜https://bit.ly/3UpmOf5

►chatGPT
➜https://chatgpt.com/

► midjourney+ChatGPT 账号合租平台、账号购买
➜https://nf.video/C1dxn

► AI生成视频
➜Fliki https://bit.ly/4b5LCiF (有风常用)
➜invideo https://bit.ly/46BDMty
➜Pictory https://bit.ly/3RZFxx3
➜VSUB https://bit.ly/3LFfTZT

►Mubert AI生成音乐（最长可生成25分钟）
➜https://bit.ly/3SxiE3O

► Epidemic Sound 好听的YouTube背景音乐
➜https://bit.ly/3RrPlPq

那我们直接进入正题吧！这期我会先讲讲怎么用它创建多个角色并保持统一风格，然后演示怎么用自然语言去控制镜头的角度变化，真的就像在拍一场真实的戏。

如果你也想体验 GPT-4o 的图像功能，建议升级到会员版，能解锁更多限制。

GPT提示词1：

👉 “帮我生成一张穿西装的帅哥照片，要那种很有电影氛围感的”

👉 “再做一张穿浴袍的男人的电影感照片，身上有不少纹身和打洞的饰品，气场要酷一点。”

👉 “把这两个男人放到沙滩上的同一场景里，两人分别骑着摩托车，彼此对峙，场面要有种紧张的氛围。整体画面要有电影大片的感觉，而且看起来要很真实。”

👉 “现在给我展示角色1（那个穿西装的男人）的特写镜头。人物要完全一致，脸和衣服都不能变。”

👉 “现在展示角色2（那个穿浴袍的男人）的特写镜头。人物形象要高度一致，脸和穿着都要保持不变。”

👉 “请给我这个场景的越肩视角画面，人物形象和环境都要跟之前保持一致，脸和穿着不能换。”

👉 “现在从另一个男人的越肩视角，展示同一个场景。角色和场景都要保持完全一致，脸和服装也不能变。”

👉 “镜头拉远点，让我看到这个场景更多的部分，但要保持人物和环境都跟之前一样，脸和衣服都不能换。”

👉 “镜头再拉远点，把更多场景内容展现出来，但人物和环境要完全一致，脸和衣服都不能换。”

👉 “现在换个视角，从一个藏在车里的人看到的画面来展示这个场景。人物和背景要和之前保持一致，脸和穿着都别换。”

👉 “从上帝视角（鸟瞰）来呈现这个场景，人物和环境保持高度一致，两位男角色的脸和衣服都要和之前一模一样。”

👉 “给我一张分屏画面，展示两位男主角的超近距离面部特写。角色形象和场景要和之前完全一致，脸和衣服都得一模一样。”

👉 “请还原达·芬奇作画《蒙娜丽莎》时的场景，用电影质感来呈现这张画面。”

👉 “展示梵高在深夜创作《星夜》的场景，用电影镜头感的方式来呈现这幅画面。”

👉 “请展示张大千在敦煌莫高窟里作画的场景，画面有浓厚的电影感。他穿着传统长衫，正专注地临摹壁画，身边摆着画具，洞窟中昏黄的光线打在他脸上和画面上，整个氛围安静而庄重。

👉 “换个角度，从角色背后来看这个画面。”

主题：末日废墟中的孤独武士

“生成一张电影感画面：广角镜头，一个身穿破旧盔甲的孤独武士，站在被战火摧毁的城市废墟中，天空乌云密布，远处建筑半毁，空气中弥漫着灰尘和微光。画面细节丰富，光影戏剧化，气氛沉重而史诗感十足，整体偏冷色调，有强烈对比和体积感光线。”

👉 “镜头推进，让角色转身面向镜头，能清楚看到他的脸。”

👉 “生成一张1995年夏天，在游戏厅里拍下的抓拍画面：一个小男孩刚赢了一局街机游戏，兴奋地举起双手，旁边其他小孩围观惊讶。画面要有浓浓90年代复古风，带点模糊感和老相机质感。”

👉 “换一个侧面视角来展示这个场景，人物设定不变，但他们的年龄全部增加20岁。”

新主题：失联飞行员与无人岛

📖 故事梗概（换主题后的版本）：

帮我为这个剧情做分镜：
一位名叫 Elena 的女飞行员在执行任务途中飞机失事，坠落在一座无人热带岛屿上。她在荒岛求生时发现，这座岛上似乎曾经有人留下过痕迹。某天晚上，她遇到了一名神秘的幸存者 Kai——一个已经在岛上独自生存了数年的男子。两人开始互相试探与信任，共同寻找离开的方法。

🎞️ 分镜图要求：

生成 8 张 具有电影感、真实感的图像：

风格：Cinematic photo
风格：真实写实、情绪丰富、光影戏剧化
人物形象要保持一致
要涵盖远景、中景、特写等镜头变化
要体现人物的孤独、惊恐、信任、希望等情绪变化

👉“请帮我为这个故事梗概做一个10张图的分镜设计，每张图像要有电影质感和真实感。人物的外貌、穿着、风格要保持一致，能表现出不同情绪。镜头类型要多样，比如远景航拍、特写、中景等。每个AI提示词请以‘Cinematic photo’开头。”

👉 可以生成一些参考图像，不过画面风格和电影色调要统一。

👉现在请生成分镜 1：坠落现场（远景 · 航拍），比例为3：2

👉 “请继续生成下一张接下来的画面”

👉 “请接着生成下一帧，同时保证角色的长相和穿着都一致。”

👉 “请生成一张学术上合理的信息图，用于详细展示尼古拉·特斯拉早期提出的‘无线能量传输塔’（即沃登克里夫塔）构想。图中需要包括他对电磁波传播原理的设想、机械结构示意图、能量传输路径示意，以及他探索的核心工程理念与实验数据。”

👉 “现在请生成一张第一人称视角的画面：一个人正坐在圆桌旁，在笔记本上手绘尼古拉·特斯拉早期构想的‘无线能量传输塔’（沃登克里夫塔）信息图。场景是在纽约长岛一间阳光洒入的工作室中，桌上散落着羽毛笔、电路图、旧纸张和一些铜线材料，氛围充满科学探索感与19世纪末的工程风格。”

👉 “把这张图改成吉卜力风格的画面。

https://www.pexels.com/photo/white-and-grey-kitten-on-brown-and-black-leopard-print-textile-45201/

https://item.jd.com/10029830493160.html

👉 “让我的猫咪穿上这件衣服，做一张图出来。”

👉你现在是专业的电影导演，我准备把图片转化为视频，请根据我给你的图片，帮生成对应的图片转视频的提示词，我好在可灵AI里面用来生成视频。

👉请根据以上内容，帮我生成视频脚本，我好用用AI把文字转为音频，作为视频的旁白

明白了，我会开始将这份完整的 ChatGPT 电影感 AI 视频制作教程整理成适合网站发布的文章。第一部分我将聚焦于：

在这个 AI 内容创作飞速发展的时代，OpenAI 最新发布的 GPT-4o 模型，不仅能生成人物一致的图像，还支持多角度、3D 空间感的“运镜”效果，让普通人也能制作出如同电影般的 AI 视频。本篇文章将手把手带你从生成图片、角色设定、视角切换到视频合成、AI 配音、背景音乐、封面图设计，全流程打造高质量的电影感短片。

第一步：用 GPT 4o 生成一致风格的人物图像

想要制作一部“电影感”的视频，保持角色形象一致是最关键的一步。

你可以向 ChatGPT 提出这样的请求：

“生成一张穿西装的帅哥的电影感图片，比例 16:9，风格真实写实、光影强烈。”

系统就会输出一张有氛围感的图片。如果你继续说：

“再生成一张穿旗袍的男人，有纹身、耳钉，酷一点。”

你就得到了电影中另一位角色。

随后，你可以让 GPT 把这两位角色放入同一张图中，例如：

“将上述两人放到沙滩上对峙，骑着摩托车，画面紧张、逼真、有大片感。”

这样不仅可以构建出统一的人物形象，还能从多个视角进行拍摄设计，例如：

角色1特写：“展示穿西装男人的特写，脸和穿着必须完全一致。”
角色2夜间视角：“从穿浴袍男人的越肩视角看对方，保持背景和角色一致。”
上帝视角切换：“从上帝视角展示沙滩场景，两人保持动作与穿着不变。”

这种“连续镜头 + 一致角色”的能力，就是 GPT-4o 在图像生成上的最大突破。

好的，下面是文章的第二部分，聚焦于如何将图像转化为电影感 AI 视频，并配上配音与背景音乐：

第二步：将AI生成图像转化为电影感视频

有了统一风格的图像后，下一步就是把这些图像“动起来”，生成带有镜头语言的短视频。目前主流的图片转视频工具有两款，分别是：

🎥 工具对比：Sora VS 可林AI（Kling AI）

功能对比	Sora（OpenAI）	可林AI（Kling AI）
图像风格	偏科幻、稳定性差	真实感强，支持镜头推进
适用人群	英语环境友好用户	中文用户体验更好
是否支持中文提示词	✅ 支持	✅ 支持
免费使用限制	有排队限制，偶尔出错	免费版限制每次仅1条
是否适合“电影运镜”	❌ 偏随机性高	✅ 支持推进、拉远等

建议优先使用 可林AI 2.0 版本，不仅生成速度更快，还能呈现火焰、推进等电影效果。

✅ 实操流程（以可林AI为例）：

进入可林AI的图片转视频工具（K02.0 模型）。
上传你生成好的图像（如“飞机失事图”）。
复制提示词（ChatGPT帮你生成）粘贴进去。示例提示词：
飞机残骸在热带岛屿沙滩上燃烧，黑烟冲天，画面要有大片感，镜头推进。
选择分辨率与时长（建议720p，生成约6秒）。
点击生成并下载视频片段。

你也可以尝试 Sora，它适合做实验性尝试，但稳定性和真实感略逊一筹。

第三步：用 ElevenLabs 合成 AI 语音配音

角色动起来了，接下来就是给视频配上“人声”旁白。

🎙 使用 ElevenLabs 生成真人感配音：

进入 ElevenLabs 官网（支持免费试用，每月1万字符）
👉 点此进入
选择 “Text to Speech（文字转语音）”。
粘贴你在 GPT 中生成的旁白脚本，例如：英文旁白示例：
“A wrecked aircraft lies sprawled across the shore…”
中文旁白示例（需高级账户）：
“一架飞机残骸横躺在荒岛沙滩上，浓烟滚滚……”
可自定义声音性别、年龄、口音，还可以克隆你自己的声音（需会员）。
生成完毕后，下载 MP3 音频，用于后期剪辑。

第四步：用 AI 工具自动生成背景音乐

一个有情绪起伏的短片，离不开配乐烘托气氛。推荐以下两款音乐工具：

🎵 工具推荐：

工具名称	特点	链接
Suno AI	英文提示词生成音乐，适合节奏感强的视频	点此使用
Mubert	可生成最长25分钟的纯背景音乐	点此进入

🎧 提示词示例（由GPT生成）：

场景一：孤岛惊魂 → “Suspenseful ambient music with mystery and isolation”
场景二：重逢希望 → “Hopeful orchestral strings with slow tempo and warmth”

将生成的音乐下载后，可在剪辑工具中作为背景音轨使用。

下一部分将讲解：

如何合成完整视频并剪辑（使用剪映）
如何生成 YouTube 封面图（使用 Pikzels）
如何发布视频并配好标题、简介、标签

第五步：用剪映完成视频合成与剪辑

到目前为止，你已经拥有了这些素材：

✅ 每一帧角色统一的“电影感”图像
✅ 可林AI生成的视频片段
✅ ElevenLabs生成的旁白配音
✅ Mubert 或 Suno 生成的背景音乐

现在就是将这些素材合成一部完整 AI 电影短片的关键步骤。

🖥 剪辑工具推荐：剪映（CapCut）

它支持中文操作界面，适合初学者使用。

📦 合成步骤如下：

打开剪映桌面版，点击“导入素材”
- 导入你生成的所有视频片段、MP3语音文件、背景音乐。
按照情节顺序拖入视频轨道
- 比如第一幕“飞机坠毁”、第二幕“女主醒来”、第三幕“丛林探险”……
添加配音
- 将旁白音频拖入音轨，与对应画面对齐。
添加背景音乐
- 可设置音量淡入淡出、或不同场景用不同风格配乐。
加入转场效果
- 剪映提供丰富的转场样式，如“镜头推进”“黑场切换”等。
智能生成字幕
- 选择“文字”>“识别字幕”，可自动将配音转成中文字幕。
导出视频
- 建议使用1080p或4K分辨率，格式为 MP4。

第六步：用 Pikzels 制作高点击率封面图

好视频还需要一张吸睛的封面图来获得点击。

🖼 推荐工具：Pikzels 封面图生成平台

👉 点击进入 Pikzels

这是一个专为 YouTube 设计的封面图 AI 工具，可以一键生成带人物、文字、氛围感的高质量封面。

操作流程如下：

进入 Pikzels 官网，点击“免费试用”
输入 GPT 帮你写好的提示词 示例提示词：
“飞机失事的女飞行员，身处荒岛，神秘、危机四伏，有大片感，带电影字体标题”
选择图像比例为 16:9
点击生成
如人物面部不符合要求，可使用“换脸”功能
- 上传你要替换的人物头像，AI 将自动生成新封面
下载封面图
- 免费版有水印，推荐升级去除水印

第七步：上传至 YouTube 并完善发布信息

一切准备就绪后，你就可以将作品发布到自己的频道了。

🚀 上传步骤如下：

进入 YouTube Studio，点击右上角“上传视频”
选择刚导出的视频文件
填写标题与简介（由 GPT 自动生成） 示例标题：
“AI重现达芬奇与荒岛求生｜全流程电影感AI短片制作教程”
粘贴描述与标签（推荐双语中英文混合，利于SEO）示例标签：
AI影片, ChatGPT视频制作, GPT4o, AI分镜, Midjourney, ElevenLabs, AI配音
上传封面图
选择合适的播放列表、观众定位与语言设置
点击“发布”即可上线！