ChatGPT「电影感AI视频制作教程」(含脚本模版 + 提示词 + 工具搭配)
在这期视频里,我想带大家一探 OpenAI 最新的 GPT-4o 图像生成功能,特别是它在 AI 影视制作和分镜设计方面展现出来的巨大潜力。它最吸引人的一点,就是可以稳定地生成“形象一致”的多角色图像,而且还能实现类似 3D 空间里的“切换镜头”效果——就好像你在跟一个懂镜头语言的导演沟通一样,随时调整角度来拍电影。
另外,它在处理图像中较长的文字时也非常清晰准确。不管是科学、物理还是现实生活场景,GPT-4o 的理解力都相当强,连各种细节都拿捏得很准。内建的图像编辑功能还支持“局部修图”(inpainting),对于搞 AI 电影、产品拍摄,甚至做广告图的人来说,这真的可以说是一个革命性的工具。
本期视频用到的工具链接:
►向有风咨询,加入我的知识星球圈子:
➜https://t.zsxq.com/16QP9JP8b
►办一张国外银行卡(可用于ChatGPT会员升级)
➜https://yeka.ai/i/19YC7OIQ
►本期视频提示词
➜https://aiyoufeng.com/characters
有风用到的AI工具
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
►elevenlabs 最好用的AI配音
➜https://bit.ly/47UBlUv
►沉浸式翻译
➜https://bit.ly/4ij7QAO
►pikzels AI视频封面制作
➜https://bit.ly/3UpmOf5
►chatGPT
➜https://chatgpt.com/
► midjourney+ChatGPT 账号合租平台、账号购买
➜https://nf.video/C1dxn
► AI生成视频
➜Fliki https://bit.ly/4b5LCiF (有风常用)
➜invideo https://bit.ly/46BDMty
➜Pictory https://bit.ly/3RZFxx3
➜VSUB https://bit.ly/3LFfTZT
►Mubert AI生成音乐(最长可生成25分钟)
➜https://bit.ly/3SxiE3O
► Epidemic Sound 好听的YouTube背景音乐
➜https://bit.ly/3RrPlPq
那我们直接进入正题吧!这期我会先讲讲怎么用它创建多个角色并保持统一风格,然后演示怎么用自然语言去控制镜头的角度变化,真的就像在拍一场真实的戏。
如果你也想体验 GPT-4o 的图像功能,建议升级到会员版,能解锁更多限制。
GPT提示词1:
👉 “帮我生成一张穿西装的帅哥照片,要那种很有电影氛围感的”
👉 “再做一张穿浴袍的男人的电影感照片,身上有不少纹身和打洞的饰品,气场要酷一点。”
👉 “把这两个男人放到沙滩上的同一场景里,两人分别骑着摩托车,彼此对峙,场面要有种紧张的氛围。整体画面要有电影大片的感觉,而且看起来要很真实。”
👉 “现在给我展示角色1(那个穿西装的男人)的特写镜头。人物要完全一致,脸和衣服都不能变。”
👉 “现在展示角色2(那个穿浴袍的男人)的特写镜头。人物形象要高度一致,脸和穿着都要保持不变。”
👉 “请给我这个场景的越肩视角画面,人物形象和环境都要跟之前保持一致,脸和穿着不能换。”
👉 “现在从另一个男人的越肩视角,展示同一个场景。角色和场景都要保持完全一致,脸和服装也不能变。”
👉 “镜头拉远点,让我看到这个场景更多的部分,但要保持人物和环境都跟之前一样,脸和衣服都不能换。”
👉 “镜头再拉远点,把更多场景内容展现出来,但人物和环境要完全一致,脸和衣服都不能换。”
👉 “现在换个视角,从一个藏在车里的人看到的画面来展示这个场景。人物和背景要和之前保持一致,脸和穿着都别换。”
👉 “从上帝视角(鸟瞰)来呈现这个场景,人物和环境保持高度一致,两位男角色的脸和衣服都要和之前一模一样。”
👉 “给我一张分屏画面,展示两位男主角的超近距离面部特写。角色形象和场景要和之前完全一致,脸和衣服都得一模一样。”
👉 “请还原达·芬奇作画《蒙娜丽莎》时的场景,用电影质感来呈现这张画面。”
👉 “展示梵高在深夜创作《星夜》的场景,用电影镜头感的方式来呈现这幅画面。”
👉 “请展示张大千在敦煌莫高窟里作画的场景,画面有浓厚的电影感。他穿着传统长衫,正专注地临摹壁画,身边摆着画具,洞窟中昏黄的光线打在他脸上和画面上,整个氛围安静而庄重。
👉 “换个角度,从角色背后来看这个画面。”
主题:末日废墟中的孤独武士
“生成一张电影感画面:广角镜头,一个身穿破旧盔甲的孤独武士,站在被战火摧毁的城市废墟中,天空乌云密布,远处建筑半毁,空气中弥漫着灰尘和微光。画面细节丰富,光影戏剧化,气氛沉重而史诗感十足,整体偏冷色调,有强烈对比和体积感光线。”
👉 “镜头推进,让角色转身面向镜头,能清楚看到他的脸。”
👉 “生成一张1995年夏天,在游戏厅里拍下的抓拍画面:一个小男孩刚赢了一局街机游戏,兴奋地举起双手,旁边其他小孩围观惊讶。画面要有浓浓90年代复古风,带点模糊感和老相机质感。”
👉 “换一个侧面视角来展示这个场景,人物设定不变,但他们的年龄全部增加20岁。”
新主题:失联飞行员与无人岛
📖 故事梗概(换主题后的版本):
帮我为这个剧情做分镜:
一位名叫 Elena 的女飞行员在执行任务途中飞机失事,坠落在一座无人热带岛屿上。她在荒岛求生时发现,这座岛上似乎曾经有人留下过痕迹。某天晚上,她遇到了一名神秘的幸存者 Kai——一个已经在岛上独自生存了数年的男子。两人开始互相试探与信任,共同寻找离开的方法。
🎞️ 分镜图要求:
生成 8 张 具有电影感、真实感的图像:
风格:Cinematic photo
风格:真实写实、情绪丰富、光影戏剧化
人物形象要保持一致
要涵盖远景、中景、特写等镜头变化
要体现人物的孤独、惊恐、信任、希望等情绪变化
👉“请帮我为这个故事梗概做一个10张图的分镜设计,每张图像要有电影质感和真实感。人物的外貌、穿着、风格要保持一致,能表现出不同情绪。镜头类型要多样,比如远景航拍、特写、中景等。每个AI提示词请以‘Cinematic photo’开头。”
👉 可以生成一些参考图像,不过画面风格和电影色调要统一。
👉现在请生成 分镜 1:坠落现场(远景 · 航拍),比例为3:2
👉 “请继续生成下一张接下来的画面”
👉 “请接着生成下一帧,同时保证角色的长相和穿着都一致。”
👉 “请生成一张学术上合理的信息图,用于详细展示尼古拉·特斯拉早期提出的‘无线能量传输塔’(即沃登克里夫塔)构想。图中需要包括他对电磁波传播原理的设想、机械结构示意图、能量传输路径示意,以及他探索的核心工程理念与实验数据。”
👉 “现在请生成一张第一人称视角的画面:一个人正坐在圆桌旁,在笔记本上手绘尼古拉·特斯拉早期构想的‘无线能量传输塔’(沃登克里夫塔)信息图。场景是在纽约长岛一间阳光洒入的工作室中,桌上散落着羽毛笔、电路图、旧纸张和一些铜线材料,氛围充满科学探索感与19世纪末的工程风格。”
👉 “把这张图改成吉卜力风格的画面。
https://www.pexels.com/photo/white-and-grey-kitten-on-brown-and-black-leopard-print-textile-45201/
https://item.jd.com/10029830493160.html
👉 “让我的猫咪穿上这件衣服,做一张图出来。”
👉你现在是专业的电影导演,我准备把图片转化为视频,请根据我给你的图片,帮生成对应的图片转视频的提示词,我好在可灵AI里面用来生成视频。
👉请根据以上内容,帮我生成视频脚本,我好用用AI把文字转为音频,作为视频的旁白
明白了,我会开始将这份完整的 ChatGPT 电影感 AI 视频制作教程整理成适合网站发布的文章。第一部分我将聚焦于:
在这个 AI 内容创作飞速发展的时代,OpenAI 最新发布的 GPT-4o 模型,不仅能生成人物一致的图像,还支持多角度、3D 空间感的“运镜”效果,让普通人也能制作出如同电影般的 AI 视频。本篇文章将手把手带你从生成图片、角色设定、视角切换到视频合成、AI 配音、背景音乐、封面图设计,全流程打造高质量的电影感短片。
第一步:用 GPT 4o 生成一致风格的人物图像
想要制作一部“电影感”的视频,保持角色形象一致是最关键的一步。
你可以向 ChatGPT 提出这样的请求:
“生成一张穿西装的帅哥的电影感图片,比例 16:9,风格真实写实、光影强烈。”
系统就会输出一张有氛围感的图片。如果你继续说:
“再生成一张穿旗袍的男人,有纹身、耳钉,酷一点。”
你就得到了电影中另一位角色。
随后,你可以让 GPT 把这两位角色放入同一张图中,例如:
“将上述两人放到沙滩上对峙,骑着摩托车,画面紧张、逼真、有大片感。”
这样不仅可以构建出统一的人物形象,还能从多个视角进行拍摄设计,例如:
- 角色1特写:“展示穿西装男人的特写,脸和穿着必须完全一致。”
- 角色2夜间视角:“从穿浴袍男人的越肩视角看对方,保持背景和角色一致。”
- 上帝视角切换:“从上帝视角展示沙滩场景,两人保持动作与穿着不变。”
这种“连续镜头 + 一致角色”的能力,就是 GPT-4o 在图像生成上的最大突破。
好的,下面是文章的第二部分,聚焦于如何将图像转化为电影感 AI 视频,并配上配音与背景音乐:
第二步:将AI生成图像转化为电影感视频
有了统一风格的图像后,下一步就是把这些图像“动起来”,生成带有镜头语言的短视频。目前主流的图片转视频工具有两款,分别是:
🎥 工具对比:Sora VS 可林AI(Kling AI)
功能对比 | Sora(OpenAI) | 可林AI(Kling AI) |
---|---|---|
图像风格 | 偏科幻、稳定性差 | 真实感强,支持镜头推进 |
适用人群 | 英语环境友好用户 | 中文用户体验更好 |
是否支持中文提示词 | ✅ 支持 | ✅ 支持 |
免费使用限制 | 有排队限制,偶尔出错 | 免费版限制每次仅1条 |
是否适合“电影运镜” | ❌ 偏随机性高 | ✅ 支持推进、拉远等 |
建议优先使用 可林AI 2.0 版本,不仅生成速度更快,还能呈现火焰、推进等电影效果。
✅ 实操流程(以可林AI为例):
- 进入可林AI的图片转视频工具(K02.0 模型)。
- 上传你生成好的图像(如“飞机失事图”)。
- 复制提示词(ChatGPT帮你生成)粘贴进去。 示例提示词:
飞机残骸在热带岛屿沙滩上燃烧,黑烟冲天,画面要有大片感,镜头推进。
- 选择分辨率与时长(建议720p,生成约6秒)。
- 点击生成并下载视频片段。
你也可以尝试 Sora,它适合做实验性尝试,但稳定性和真实感略逊一筹。
第三步:用 ElevenLabs 合成 AI 语音配音
角色动起来了,接下来就是给视频配上“人声”旁白。
🎙 使用 ElevenLabs 生成真人感配音:
- 进入 ElevenLabs 官网(支持免费试用,每月1万字符)
👉 点此进入 - 选择 “Text to Speech(文字转语音)”。
- 粘贴你在 GPT 中生成的旁白脚本,例如:英文旁白示例:
“A wrecked aircraft lies sprawled across the shore…”
中文旁白示例(需高级账户):
“一架飞机残骸横躺在荒岛沙滩上,浓烟滚滚……”
- 可自定义声音性别、年龄、口音,还可以克隆你自己的声音(需会员)。
- 生成完毕后,下载 MP3 音频,用于后期剪辑。
第四步:用 AI 工具自动生成背景音乐
一个有情绪起伏的短片,离不开配乐烘托气氛。推荐以下两款音乐工具:
🎵 工具推荐:
工具名称 | 特点 | 链接 |
---|---|---|
Suno AI | 英文提示词生成音乐,适合节奏感强的视频 | 点此使用 |
Mubert | 可生成最长25分钟的纯背景音乐 | 点此进入 |
🎧 提示词示例(由GPT生成):
- 场景一:孤岛惊魂 → “Suspenseful ambient music with mystery and isolation”
- 场景二:重逢希望 → “Hopeful orchestral strings with slow tempo and warmth”
将生成的音乐下载后,可在剪辑工具中作为背景音轨使用。
下一部分将讲解:
- 如何合成完整视频并剪辑(使用剪映)
- 如何生成 YouTube 封面图(使用 Pikzels)
- 如何发布视频并配好标题、简介、标签
第五步:用剪映完成视频合成与剪辑
到目前为止,你已经拥有了这些素材:
✅ 每一帧角色统一的“电影感”图像
✅ 可林AI生成的视频片段
✅ ElevenLabs生成的旁白配音
✅ Mubert 或 Suno 生成的背景音乐
现在就是将这些素材合成一部完整 AI 电影短片的关键步骤。
🖥 剪辑工具推荐:剪映(CapCut)
它支持中文操作界面,适合初学者使用。
📦 合成步骤如下:
- 打开剪映桌面版,点击“导入素材”
- 导入你生成的所有视频片段、MP3语音文件、背景音乐。
- 按照情节顺序拖入视频轨道
- 比如第一幕“飞机坠毁”、第二幕“女主醒来”、第三幕“丛林探险”……
- 添加配音
- 将旁白音频拖入音轨,与对应画面对齐。
- 添加背景音乐
- 可设置音量淡入淡出、或不同场景用不同风格配乐。
- 加入转场效果
- 剪映提供丰富的转场样式,如“镜头推进”“黑场切换”等。
- 智能生成字幕
- 选择“文字”>“识别字幕”,可自动将配音转成中文字幕。
- 导出视频
- 建议使用1080p或4K分辨率,格式为 MP4。
第六步:用 Pikzels 制作高点击率封面图
好视频还需要一张吸睛的封面图来获得点击。
🖼 推荐工具:Pikzels 封面图生成平台
这是一个专为 YouTube 设计的封面图 AI 工具,可以一键生成带人物、文字、氛围感的高质量封面。
操作流程如下:
- 进入 Pikzels 官网,点击“免费试用”
- 输入 GPT 帮你写好的提示词 示例提示词:
“飞机失事的女飞行员,身处荒岛,神秘、危机四伏,有大片感,带电影字体标题”
- 选择图像比例为 16:9
- 点击生成
- 如人物面部不符合要求,可使用“换脸”功能
- 上传你要替换的人物头像,AI 将自动生成新封面
- 下载封面图
- 免费版有水印,推荐升级去除水印
第七步:上传至 YouTube 并完善发布信息
一切准备就绪后,你就可以将作品发布到自己的频道了。
🚀 上传步骤如下:
- 进入 YouTube Studio,点击右上角“上传视频”
- 选择刚导出的视频文件
- 填写标题与简介(由 GPT 自动生成) 示例标题:
“AI重现达芬奇与荒岛求生|全流程电影感AI短片制作教程”
- 粘贴描述与标签(推荐双语中英文混合,利于SEO) 示例标签:
AI影片, ChatGPT视频制作, GPT4o, AI分镜, Midjourney, ElevenLabs, AI配音
- 上传封面图
- 选择合适的播放列表、观众定位与语言设置
- 点击“发布”即可上线!
🎯 小结:一整套 AI 电影感视频制作流程
你现在掌握了:
- 如何用 ChatGPT 生成稳定角色图像 + 分镜提示词
- 如何用 Kling AI 或 Sora 生成视频片段
- 如何用 ElevenLabs 制作配音
- 如何生成背景音乐、字幕与封面图
- 如何剪辑合成并发布完整作品
这一整套流程,无需真人拍摄,无需摄影棚,仅用AI就能制作出“电影级”短片!
好的,以下是本篇文章的结尾段与引导留言部分,可用于网站发布时增强互动性与转化率:
写在最后:人人都能上手的AI电影创作革命
随着 GPT-4o 的问世,AI 内容创作正式迈入“电影化”阶段。无论你是视频创作者、动画导演、游戏开发者,还是单纯想讲个好故事的普通人,只要你有想法、有脚本,借助本套流程中介绍的工具:
- 你可以让角色统一、镜头自由切换
- 你可以一键生成配音、背景音乐、字幕
- 你可以在几小时内制作出高质量的电影风视频
过去需要数十人团队、数十万预算才能完成的作品,现在一个人 + 一台电脑 + 一套AI工具链,就可以轻松完成。
📥 获取全部提示词 + 模板资源:
为了方便大家操作,我已将本期用到的所有 AI提示词模板 与 实操截图 汇总到我的个人网站:
💬 欢迎留言互动,一起探索更多AI视频玩法!
如果你也尝试过用 GPT 或 AI 工具制作视频,欢迎在评论区分享你的创作经历、碰到的问题或希望探索的新方向。我会定期精选留言,并更新更多实用教程。
如果你喜欢本期内容,也欢迎:
- 转发分享给需要的朋友
- 加入我的【AI电影创作知识圈】获取更多案例与素材
👉 点击加入圈子