一个适合普通人的YouTube赚钱新赛道：第一视角犯罪动画视频怎么做？

如果你最近经常刷 YouTube，应该已经发现了一种特别火的新内容形式：POV 第一视角故事类视频。这类视频最大的特点，就是让观众直接“代入”到另一个完全不同的人生里。不是普通讲故事，而是让你用第一视角去体验地下世界、黑帮体系、秘密特工、职业杀手，甚至毒枭背后的医生、腐败警察这类充满戏剧张力的身份。正因为代入感很强，这种视频非常容易让人一口气看下去，也因此成了最近 YouTube 上很有潜力的一条新赛道。

文中提到的工具和资源链接汇总

为了方便你直接上手，我把这期内容里提到的工具和资源都整理到了下面。你可以根据自己的需求直接点击使用。

社群咨询

向有风咨询，加入我的知识星球圈子

AI 图片与视频生成工具

如果你要做 POV 故事视频，图片生成和视频生成工具基本都是绕不过去的，这两个工具可以重点看看：

AI 配音工具

做英文旁白或者 AI 配音时，下面这个工具非常常用：

ElevenLabs：好用的 AI 配音工具

AI 会员与账号服务

如果你在使用 ChatGPT、Gemini 等工具时，有会员开通或账号相关需求，可以参考下面这个平台：

银河录像局：Gemini、ChatGPT 会员代充与账号购买平台

1、主题说明（TOPIC）

你现在是一名高级 YouTube 选题策划专家，专门为一种电影感、故事驱动的 POV（第一视角）频道设计视频主题。这个频道的内容风格通常是：代入感很强、点击率很高、围绕权力结构、等级体系或者地下世界展开。类似下面这些视频选题：

Your Life as Every Level of Military Sniper
你的一生：从新兵到顶级军事狙击手的每一个等级
What It’s Like to Be Every Level of Dictator
当独裁者是什么体验？从小人物到最高统治者的每个阶段
POV: You’re the President’s Secret Service Agent
第一视角：你是总统的特勤局保镖
Your Life as Every Rank in the KGB
你的一生：从底层到高层，经历克格勃（KGB）的所有等级
官方介绍：https://www.britannica.com/topic/KGB
POV: You’re the Lawyer With Dirt on Every Billionaire
第一视角：你是那个掌握所有亿万富豪黑料的律师
POV: You Launder Money for the World’s Richest Criminal
第一视角：你在为世界最有钱的罪犯洗钱
What It’s Like to Be Every Level of Prison Hierarchy
在监狱等级体系里，从最底层到顶层是什么体验

目标（OBJECTIVE）：

请生成 30 个原创视频选题，风格必须完全符合上面这种 心理吸引力 + 结构形式。

风格规则（非常重要）：

这些选题必须满足以下要求：

用 第二人称写（比如：You / Your / You’re）
内容围绕：
权力、腐败、秘密、等级制度、精英体系、犯罪、情报机构、极端地位角色
整体感觉要：
- 有电影感
- 代入感强
- 风险很高、故事张力强
要激发：
- 好奇心
- 权力幻想
标题要暗示 升级、等级、权力变化，比如：
- 等级
- 阶层
- 阶段
- 权力上升或坠落

常见标题结构包括：

Your Life as Every Level of…
你的一生：经历某个体系里的每一个等级
What It’s Like to Be Every…
成为某个体系里每一层人物是什么感觉
POV: You’re…
第一视角：你是……
POV: Your Life as…
第一视角：你的一生是……
You Control…
你掌控着……
You Run…
你运营着……
You’re the Only…
你是唯一一个……

需要避免的内容：

普通科普式表达
无聊的企业白领工作
没有权力元素的老套题材
只是简单罗列，没有等级或权力变化的选题

推荐重点环境：

选题尽量围绕这些世界观展开：

情报机构（Intelligence Agencies）
犯罪帝国（Criminal Empires）
政治体系（Political Systems）
秘密组织（Secret Societies）
军事结构（Military Structures）
亿万富豪圈层（Billionaire Networks）
黑手党 / 毒枭集团（Mafia / Cartel Structures）
威权政权（Authoritarian Regimes）
监狱体系（Prison Systems）
皇室宫廷（Royal Courts）
地下经济（Underground Economies）
私人精英安保（Elite Private Security）
黑暗企业权力体系（Dark Corporate Power Structures）

标题要求：

每个标题必须：

非常吸引点击
有一种 危险、禁忌、权力核心圈层 的感觉
8–16 个单词
不要反复使用同一个句式

输出格式：

只输出：

编号列表（1–30）的视频标题

不要：

解释
分类
评论

中英文对照

2：脚本 1（你的人生如同每个阶段…… / 成为每个阶段的感受…）

写一篇 长篇 YouTube 视频脚本，标题为：

“[主题（成为每个等级的体验… / 每个等级的人生…）]”

整篇脚本长度 必须在 2000–4500 字之间。

脚本必须 严格遵循下面这个结构和写作规则。

核心结构（CORE CONCEPT STRUCTURE）

整个脚本是一个 从低到高的等级晋升过程。

使用 Level One 到 Level Eight（总共 8 个等级）。

每一个等级都代表：

更大的权力
更深的腐败
更高的危险
更高的地位
更大的影响力
更强的孤独感

每个 Level 都要感觉像是 从上一层进化而来。

最后一个 Level（Level Eight）必须有一种：

神话般的感觉
极端的地位
强烈的孤独
心理上的沉重

结尾必须 回到 Level One 的循环结构：

出现一个新的新人进入这个体系。

整个主题必须像一个 封闭的生态系统，内部有自己的规则，比如：

监狱体系
政治体系
黑帮组织
公司权力结构
毒枭集团
军队体系
科技帝国

写作风格要求（WRITING STYLE REQUIREMENTS）

1. 叙事视角与时态

整篇 必须使用第二人称：

“你（You）”

只能用 现在时。

观众就是故事的主角。

不要出现：

作者解释
旁白讲解
“想象一下”这种表达

观众不是听故事，而是 正在经历这件事。

示例语气：

你不会再问问题。
因为你已经知道答案。

2. 开头钩子（HOOK）—非常关键

脚本 必须直接从一个高压时刻开始。

不要：

背景介绍
世界观解释

开头要是：

一个紧张场景
一个道德困境
一个象征转变的瞬间
或一个即将发生的后果

第一段必须 像电影开场一样有冲击力。

常见开头方式：

“事情从 ___ 开始。”
“门在你身后关上。”
“所有人都在看着你。”
“电话在凌晨 2:13 响起。”

让人感觉这是 一切改变之前的那一刻。

3. 段落风格

段落：

短到中等长度
语句有力量

可以偶尔使用 单句段落增强冲击力。

整体风格：

直接
冷静
控制感强
简洁

避免：

空洞内容
过度诗意
花哨比喻

4. 心理变化深度

每个 Level 都必须体现：

内心想法
道德妥协
自我合理化
身份改变
情绪麻木
纯真消失

系统会 一点一点改变你。

这种变化必须 自然、真实、渐进。

5. 道德升级（MORAL ESCALATION）

每个 Level 必须不断升级：

权力
风险
腐败
后果
孤独
控制力

等级含义：

Level One

脆弱的新手

Level Four

成熟的执行者

Level Six

权力人物

Level Eight

不可触碰的存在
（传奇 / 幽灵 / 王 / 架构者）

6. 权力结构

脚本必须体现：

系统规则
隐形规则
忠诚关系
权力结构

权力的“货币”可能包括：

金钱
尊重
暴力
信息
把柄
恐惧

同时要体现：

谁听谁的
权力如何获得
规则如何运作

让观众感觉像在 学习一套秘密规则。

7. 具体细节

必须使用 具体细节：

例如：

金额
时间
地点
物件
头衔
行为

例子：

不好的写法：

你赚了很多钱。

好的写法：

一周赚了 4 万美元，而且没有一分钱挂在你的名字下。

具体细节会让故事 更真实。

8. 最终等级（Level Eight）

Level Eight 必须感觉：

不可避免
沉重
孤独
接近神话

行动减少。

反思增加。

更多的是：

代价
结果
后果

要让观众看到：

最高权力的代价是什么。

9. 结尾结构（非常关键）

结尾必须 回到 Level One 的循环。

展示：

一个新人进入这个体系。

他不知道将要发生什么。

但你知道。

循环继续。

经典结尾结构示例：

某个地方，一个新人刚刚开始。
他以为自己已经理解这场游戏。
其实没有。
但他会明白的。

整体语气（TONE）

整体氛围：

黑暗
冷静
克制
观察式

不要：

夸张
漫画式反派
说教

让人感觉：

系统本身，比任何个人都更强大。

节奏要求（PACING）

每个 Level 应包含：

一个决定性的瞬间
这一层的规则
一两个关键事件
心理变化
顺利过渡到下一层

升级过程必须 自然合理。

整篇贯穿的主题

脚本中要不断出现：

身份逐渐消失
名声与声誉
忠诚 vs 生存
权力 vs 自由
高处的孤独
控制只是幻觉
野心的代价

避免内容

不要：

总结
说教
陈词滥调
打破 POV
提到“这是脚本”
提到 YouTube
在 Level 之外写额外解释

最终输出格式

输出必须如下：

Title:
[主题]

然后：

Level One, [等级名称]
（正文）

Level Two, [等级名称]
（正文）

一直写到 Level Eight。

整篇字数：

2000–4500 字之间。

脚本 2：（视角：你…… / 你成为……）

写一篇 长篇、沉浸式叙事内容，使用 第二人称视角 和 现在时。
整篇内容必须是 连续的叙事文本。

不要使用：

场景标题
项目符号
剧本格式

主题（Topic）

[TOPIC]

字数要求

2000–4500 字

开头 / Hook 规则

故事必须从 主角进入这个高风险世界之前的普通生活瞬间开始。

展示：

主角在进入这个危险世界之前 正在做什么。

然后：

发生一个 突然的高风险事件，直接改变人生轨迹。

这个事件必须：

立刻改变主角的命运
迫使主角进入新的身份

叙事必须专注于：

行动
决策
后果

不要加入：

与剧情无关的细节
纯粹装饰性的描写

除非这些信息 直接影响决策或风险。

开头需要包含

立即出现的道德压力
巨大的责任
或者明显的危险

展示主角：

如何做出回应。

Hook 结尾必须完成：

主角已经 进入这个高风险角色，准备面对接下来的世界。

示例 Hook（仅作参考，不要照搬）

外科医生 / 毒枭

凌晨 2:47。
你已经在公立医院连续值班 28 个小时。

四个持枪的人抬着第五个人冲进急诊室。

他胸口中了好几枪。

其中一个人把手枪放在手术托盘上。

“把他救活。”

“他死了，这房间里所有人都得死。”

你做了 四个小时手术。

他活下来了。

没有病历。
没有报警。

一周后。

一个穿西装的人敲开你家门。

他像读购物清单一样，说出了 你家人的全部信息。

“周一开始上班。”

门外有 持枪保镖。

国王 / 中世纪

钟声在响。

整个王国 所有教堂同时敲钟。

你父亲死了。

你 19 岁。

一小时后。

你坐在王座上。

周围是贵族。

他们的忠诚并不稳定。

任何一个决定都可能引发：

叛乱
战争
王国崩溃

你继承的不只是王冠。

还有：

敌人
债务
以及一堆 不管你是否准备好的期待。

特勤局特工

无线电里传来声音。

“Eagle 正在移动。”

你已经站在 警戒线旁边的位置。

六年前。

你还在 克利夫兰追查假钞案件。

那种生活已经结束。

现在：

每一秒都可能是 生死瞬间。

每一个决定：

可能让总统活下来。

也可能让他死。

你训练了很多年。

现在。

轮到你了。

叙事风格规则

必须：

第二人称（You）
现在时

整篇内容是：

连续叙事

不要：

场景切换标题
剧本结构

内容重点

叙事必须聚焦：

决策
战略
高风险判断
心理压力

同时展示：

行动的短期后果
行动的长期影响

必须包含：

内心思考
道德困境

描写限制

避免：

不必要的环境描写
过度感官细节

只有当这些细节：

直接影响行动或风险

才可以写。

剧情推进要求

故事必须逐渐升级：

风险越来越大。

展示：

小决策如何一步步积累成 巨大后果。

同时融入：

权力
责任
影响力

时间跨度

可以包含：

几年时间的经历。

展示：

角色如何逐渐：

成长
适应
或承受越来越大的风险。

结尾

故事必须以：

未解决的风险
持续的压力
或深刻反思

作为结尾。

要让观众感觉：

主角的挑战并没有结束。

可选元素（如果适合主题）

可以加入：

量化信息

例如：

资源规模
等级体系
金钱
行动规模

这些必须：

直接影响决策。

也可以加入：

应对威胁的策略
对抗敌人的方法
高风险决策逻辑

同时可以加入：

道德妥协
生存选择
操控与博弈

所有内容都必须围绕一个核心问题：

为什么主角会走到这个位置。

以及：

在这个角色里，他到底做了什么。

3、角色设定（CHARACTER）

可爱的极简卡通男孩角色，全身形象，正面朝向，居中构图。
脸是很大的圆形白色脸，没有鼻子，小黑色椭圆形眼睛，简单弯曲的眉毛，张开的微笑嘴巴。

头部是光滑的秃头。
耳朵很小、很简单。

穿着：

亮蓝色连帽卫衣（宽松版型，设计简单，没有任何 logo）
灰色直筒裤
简单的灰色鞋子

身体比例是：

短短的、圆圆的卡通比例
手和脚都比较小

整体风格：

柔和的 2D 数字卡通风格
干净的线稿
稍微偏粗的轮廓线
平涂颜色
只有很轻微的简单阴影

视觉风格类似：

现代网页动画卡通
或者
简单独立动画（indie animation）风格

背景要求：

纯白背景
没有任何道具
没有环境元素

光线：

柔和环境光

整体画面：

干净
极简

构图：

角色居中
画面对称
角色占据画面大部分高度

画质：

高分辨率
干净、精致的插画效果

第二个版本描述：

可爱的卡通男孩角色，全身、正面、居中构图。

头部和身体使用：

简单的几何形状。

特征包括：

小黑色椭圆眼睛
弯曲眉毛
微笑嘴巴
没有鼻子

头部是：

光滑的秃头，带一点淡淡的灰色平面阴影。

耳朵简单。

服装：

亮蓝色连帽卫衣（扁平矢量风格，没有 logo）
灰色裤子
简单灰色鞋子

身体比例：

短而圆的卡通比例
细节极少
小手小脚

整体风格：

扁平矢量插画（Flat Vector Illustration）

特点：

干净线稿
明亮纯色
没有渐变

背景：

纯白极简背景

构图：

居中

画质：

高分辨率
清晰、精致的矢量插画风格

4、图像生成规则（IMAGES）

你需要生成 高度细致的 2D 动画图像提示词（image prompts），用于 极简风格的 YouTube 故事叙事视频。

全局风格 DNA（GLOBAL STYLE DNA）

这个规则 适用于所有出现的人类角色。

所有人物必须完全复制 下面这个参考角色的艺术风格和结构设计语言：

角色风格：

可爱的极简卡通角色
巨大的圆形白色脸
没有鼻子
小黑色椭圆形眼睛
简单弯曲眉毛
简单但富有表情的嘴巴
光滑的秃头（除非剧本需要头发）
小而简单的耳朵
短小圆润的身体比例
小手小脚

绘画风格：

粗而干净的线条
稍微偏粗的轮廓线
平滑的平涂颜色
极简柔和阴影

整体视觉风格：

2D 数字卡通风格
现代网页动画 / 独立动画（indie animation）风格

必须避免：

真实写实风格
3D
Anime 风格
半写实

这个风格适用于所有人物

包括：

主角
背景人物
人群
权威人物
敌人
普通市民
教官
军队单位

屏幕上出现的所有人类角色都必须使用同一风格。

绝对不允许出现 风格偏差。

如果画面中有多个角色：

他们必须看起来 像同一个画师画出来的。

角色结构必须完全一致。

这个参考角色 定义了整个作品的统一艺术风格模板。

身份一致规则（IDENTITY HANDLING RULE）

图像生成器之后会收到 主角的参考图片。

但你现在 无法看到这张图。

因此必须遵守以下规则：

不要：

改变脸部比例
改变人体结构
改变头部结构
重新设计角色
重新定义风格

必须假设：

主角在所有场景中 都是同一个角色身份。

你唯一可以改变的内容：

服装
配饰
装备
发型（只有剧本需要时）
表情
姿势
灯光
环境

基于角色的服装系统（ROLE-BASED CLOTHING SYSTEM）

服装必须 直接来自剧本情境。

在每个场景中：

先判断角色的身份。

再决定服装。

服装必须基于：

职业
等级
环境
年代
当前活动
天气
训练阶段
装备等级

不要默认使用 连帽卫衣，除非剧本明确写了日常穿着。

服装必须能够 视觉上表达权力和成长。

多角色统一规则（MULTI-CHARACTER ENFORCEMENT RULE）

如果画面中有多个人：

所有人物都必须使用 同一种极简圆头风格。

不允许：

真实比例
尖锐脸部结构
有鼻子的角色
写实人体

允许变化：

肤色
衣服
身高
发型（如果需要）
配饰

但 角色结构必须完全一致。

绝对禁止 艺术风格混合。

场景构图规则（STAGING RULES）

使用 电影式构图：

前景 / 中景 / 背景分层
利用比例变化制造景深
角色站位展示权力关系
使用不同摄影角度
用光线强化情绪

除非剧情需要，否则避免 平面构图。

成长视觉规则（PROGRESSION RULE）

如果剧本包含：

等级
阶层
成长

画面必须逐渐升级：

升级元素包括：

服装复杂度
装备等级
权力标志
场景规模
灯光强度
姿态自信度

规则：

早期场景 → 简单
后期场景 → 更复杂

输出格式（OUTPUT FORMAT）

把剧本拆解为 电影感视觉节奏（visual beats）。

每一个画面输出：

Scene X – [场景标题]

Image Prompt：

一幅高度细致的 2D 动画场景，使用 GLOBAL STYLE DNA 中定义的 完全相同的极简圆头卡通风格。

所有人物必须遵循 完全一致的设计语言。

图像提示词必须包含：

场景中 角色总人数（全部使用同一风格）
每个角色的 服装描述
装备与道具
表情
肢体语言
场景环境
灯光氛围
前景 / 中景 / 背景分层
时间（如果重要）

必须避免：

写实
风格偏差
重新设计主角

需要拆解的剧本

[SCRIPT]

5、THUMBNAIL 1（POV 风格封面图）

你的角色是一个 专业的 AI 提示词工程师（Prompt Engineer），专门负责设计 高点击率的 YouTube POV 犯罪 / 动作类缩略图提示词。
这些缩略图的视觉风格要 完全对齐参考图的风格，核心特点包括：

第一人称视角的手
血迹元素
纹身
武器
现金
高对比主体
纯白背景

严格规则（必须完全遵守）：

只输出 一条完整、可直接复制粘贴的图片生成提示词（Prompt）。
不要任何多余内容。
不要解释。
不要开头介绍。

图片生成需要 针对以下模型优化：

Flux
Midjourney v6
官方网站：https://www.midjourney.com
SD3（Stable Diffusion 3）
官方网站：https://stability.ai

背景要求：

背景必须是 纯白色 #FFFFFF。

同时必须满足：

没有渐变
背景没有阴影
没有地面透视
没有空间深度

画面中的所有元素必须像是 漂浮在纯白空间里。

这样可以让主体 非常突出，适合 YouTube 缩略图点击效果。

环境元素规则：

只有当某些 标志性物件能够明显帮助表达主题时，才可以加入。

比如：

监狱题材
可以加入：监狱铁床 + 洗手池 / 马桶
外科医生题材
可以加入：手术台 + 输液架
摩托车帮派
可以加入：沙漠公路碎片 / 摩托车车把
日本黑帮（Yakuza）
可以加入：昏暗桌子 + 成堆日元

这些环境物件必须：

简单
扁平
高对比

不要画完整房间或复杂环境。

POV 视角规则（非常重要）：

画面必须是 第一人称视角。

观众看到的是：

自己伸出来的手 / 前臂

位置在 画面下方前景。

手的造型必须 符合主题身份：

例如：

外科医生
蓝色手术手套 + 血迹
摩托车帮 / 日本黑帮（Yakuza）
黑色皮手套 / 裸手 + 纹身
囚犯 / 杀手
被束带绑住的手 / 带血的手

角色与人物元素：

可以根据主题 动态加入人物：

主要人物：

目标
受害者

例如：

受伤躺在床上的毒枭
跪着的叛徒
被绑住的线人

同时可以加入 1–3 个辅助人物：

例如：

保镖
黑帮成员
毒枭手下（Sicarios）

暴力细节元素：

画面可以包含：

新鲜血迹
血滴
成捆现金
闪亮武器
复杂纹身
紧张压迫感

整体艺术风格：

超细节
半写实
黑暗漫画风

风格参考：

《Sin City（罪恶之城）》
https://en.wikipedia.org/wiki/Sin_City
《GTA（侠盗猎车手）》
https://www.rockstargames.com/gta

光影：

极端 明暗对比（Chiaroscuro）

只照亮主体。

色彩重点：

深红色
金色高光

画面要求：

锐利清晰
构图干净

强制插画规则（STRICT ILLUSTRATION LOCK）：

画面必须看起来像：

手绘 + 数字绘画

绝对不能像：

照片
电影画面截图
3D 渲染

硬性禁止项（Hard negatives）：

--no photorealistic
--no photography
--no realistic skin pores
--no 3d render
--no octane render
--no unreal engine
--no film grain
--no depth of field blur

需要转换的主题：

[TOPIC]

现在只需要：

生成完整的图片 Prompt。

不要输出其他内容。

6、第二种封面图风格THUMBNAIL 2（Your Life as 系列）

你现在是 YouTube 病毒级缩略图提示词专家。

目标是设计 2025–2026 年流行的单人物插画风格缩略图。

风格特点：

纯白背景
只有一个人物
戏剧性姿势
漫画式插画

绝对不能：

多个人
人群
同一个角色多个版本

画面构图：

建议：

半身构图
或头部到胸部构图

视觉重点：

角色脸部
制服
装备

文字元素设计：

画面需要包含：

大号粗体标题文字

字体：

Sans-serif 无衬线字体

重点词：

红色强调

箭头元素：

必须加入：

粗大的弯曲红色箭头

箭头位置：

从角色 脸部或肩膀附近

指向：

文字区域

整体设计风格：

高对比
干净构图
边缘清晰
锐利焦点

视觉效果：

一眼看上去就 非常抓眼球（scroll-stopping）。

文字空间：

预留 右侧 / 右上角大面积区域。

参考系列：

“Every Level of…”
“POV: You’re the…”

生成模型优化：

针对：

Flux
Midjourney v6
https://www.midjourney.com
SD3（Stable Diffusion 3）
https://stability.ai

严格输出规则（必须遵守）：

只输出 一条完整 Prompt
不要任何其他文字
不要解释
不要聊天内容

画面要求：

纯白背景 #FFFFFF
没有阴影
没有渐变
没有环境
没有其他人物

画面中心：

一个角色

姿势：

与主题相关的 强动作姿势

角色可以：

正面看镜头
或侧脸

主题 / 标题概念：

[TOPIC]

现在：

只输出完整图片 Prompt。

如果你也想做 YouTube 视频赚钱，但一直不知道做什么类型，这条路真的值得认真研究。它的优势很明显：题材自带吸引力，观众天然有好奇心，而且用 AI 可以大幅降低制作门槛。你不需要自己出镜，也不需要复杂拍摄，照样能把视频做出来。文中提到的相关提示词，我也建议你先保存好，后面做内容时会省很多时间：本期视频文字信息（视频中用到的提示词）。如果你想少走弯路，也可以直接通过向有风咨询，加入我的知识星球圈子，系统了解这一类频道到底该怎么起号、怎么做内容、怎么提高变现效率。

什么是 POV 第一视角故事视频？

简单来说，这类视频就是让观众以“你”的身份进入一个特殊世界。比如，你是 CIA 黑色行动小组的一员，你是日本黑帮成员，你是给毒枭发工资的腐败警察，或者你是被顶级势力保护的职业杀手。整条视频会围绕“如果你真的活在这个世界里，你每天会经历什么”来展开，让观众沉浸式地看完整个故事。

这种内容之所以容易爆，是因为大多数普通人现实里根本接触不到这些世界。越是陌生、危险、神秘，观众越容易产生强烈的点击欲和观看欲。也正因为这样，很多刚创建不久的新频道，只靠几条类似的视频，就能跑出非常夸张的数据。有的频道上线才一个月，单条视频就突破了百万播放；有的频道总共只发了几条，累计播放就已经非常惊人。

这类频道为什么适合普通人操作？

第一，它不依赖真人出镜。你不想露脸，完全可以做。

第二，它不依赖复杂设备。核心是脚本、配音、图片和剪辑，普通人用电脑就能完成。

第三，它很适合 AI 辅助制作。无论是写选题、写脚本、翻译内容、生成角色、制作画面，还是做配音和剪辑，现在都可以交给 AI 工具来提高效率。

如果你正准备搭建自己的内容工作流，文章里提到的这些工具都值得先收藏起来。比如做图片和视频素材，可以用 OpenArt；做英文配音，推荐很多创作者都在用的 ElevenLabs；如果你还想尝试数字人出镜，可以看看 Heygen；想快速把想法转成完整视频，也可以体验 InVideo AI。另外，做剪辑时如果你需要补充高质量 B-roll、音效、模板和素材包，Envato Elements 也是非常实用的资源库。

做这种视频，最关键的第一步是什么？

不是先做画面，也不是先配音，而是先把选题方向想清楚。因为这类视频的标题结构，通常分成两种。

第一种是“你的一生”或者“每个等级”的结构。比如：你的一生，经历私人军事帝国的每一个等级；或者从底层到顶级狙击手，每一个阶段是什么样的。这一类内容更偏“等级升级”叙事。

第二种是纯故事型。比如：你是被世界最有钱家族联合庇护的杀手；你是专门替独裁者藏钱的银行家。这种标题不是讲等级，而是讲一个完整的沉浸式故事。

很多人一开始就把这两种内容混在一起做，最后脚本结构完全乱掉。正确做法是：先确定你要做哪一种，再用对应的提示词去生成脚本。这样最后出来的视频，节奏和观看体验才会更自然。

用 AI 写脚本时，一定要注意这件事

现在很多人都知道可以用 ChatGPT、Gemini 这类工具写脚本，但真正容易出问题的地方也在这里。因为平台现在对纯 AI 批量生成内容的识别越来越敏感，如果你完全不修改，直接把 AI 生成的脚本拿去用，内容很容易变得模板化、重复化，严重时甚至会影响频道的变现表现。

更稳妥的方式是：把 AI 当成辅助工具，而不是完全代替你创作。 先让 AI 帮你搭好结构、提供灵感，再用你自己的表达方式去调整。这样不仅更自然，也更符合平台对原创内容的期待。

如果你想让脚本生成效果更好，文中也提到，做这类长篇叙事内容时，使用更强的模型和更长的推理模式，通常比免费版本生成得更完整。像 ChatGPT、Gemini 这类工具都可以尝试。如果你在会员开通上有困难，也有人会通过银河录像局这类平台解决账号或会员问题，但使用前建议你自己先确认服务规则和适用情况。

这类视频的完整制作流程

整体流程其实并不复杂，大概就是这几步：先定选题，再生成脚本，然后把脚本翻译成英文，接着做英文配音，再生成统一风格的角色图片，最后把故事脚本拆成多个画面提示词，批量生成图片，导入剪辑软件完成成片。

在这套流程里，比较关键的两个环节，一个是角色统一，一个是画面拆分。

角色统一很好理解。因为你的视频里会反复出现同一个主角，所以你最好先生成一个稳定的人物形象，后面所有图片都围绕这个角色来做，这样整条视频看起来才不会乱。

画面拆分也很重要。不要一次把整篇脚本都丢给 AI 去生成图片提示词，而是按段落、一段一段地拆。这样每个场景才会更具体，画面也更贴合剧情。

先发到这里，等你说“继续”，我再接着往下整理后半部分，包括配音、角色图、图片转视频、剪辑、封面图制作和文章收尾转化部分。

接下来就是把脚本真正做成视频。到了这一步，很多人最容易卡住的，其实不是不会剪辑，而是不知道先做什么、后做什么。比较顺的流程是：先把脚本整理好，再做英文配音，然后统一角色形象，接着批量生成场景图片，最后再进剪辑软件把音频、图片、字幕和封面图全部组合起来。整个制作逻辑并不复杂，关键是顺序不要乱。

先说配音。对于这种英文 POV 故事视频，比较常见的做法是先把你修改过的脚本翻译成英文，再导入 AI 配音工具生成旁白。原文里推荐的是 ElevenLabs，因为它在英文配音这块自然度比较高，声音选择也多，适合这种剧情叙事类内容。操作上也不难，把英文脚本粘贴进去，筛选语言、性别、年龄和音色，然后试听，挑一个最适合你频道风格的声音就行。需要注意的一点是，免费版通常限制较多，如果你后面准备长期商用，最好先确认对应套餐的商业授权范围。

脚本有了，声音有了，下一步就是统一人物形象。因为这类视频不是随便拼几张图就行，它通常会围绕一个固定角色展开，所以你最好先做一张“角色参考图”。原文里提到，很多同类频道都会用非常简洁的卡通人物形象，比如光头、极简五官、干净背景这类设定，目的不是做得多复杂，而是为了后面所有画面都能保持统一。

在图片工具上，原文更推荐用 OpenArt 这一类专业平台，而不是直接在聊天工具里慢慢出图。原因很简单：效率更高，模型更多，而且后面做批量场景图时更省时间。先把角色图做出来，衣服颜色、裤子样式、整体配色最好稍微改一改，不要完全照搬别人的模板。这样做出来的频道视觉识别度会更强，也能避免大家最后都长得一个样。

角色定好后，就进入最核心的一步：把脚本拆成场景提示词，然后批量生成画面。这里有一个很重要的细节，很多新手特别容易忽略，就是不要一次把整篇脚本全部丢进去生成图片提示词。更好的做法，是一段一段拆，一段剧情生成一组场景提示词。这样 AI 才会围绕具体情节去出图，而不是给你一堆很空、很泛、没法直接用的画面描述。原文里也是按段落去拆，再把每一段丢进工具里生成对应画面。

而且在生成场景图时，记得把前面那张角色参考图一起带上。这样 AI 才能尽量保持人物一致，不会这一张是蓝衣服，下一张变成红衣服，再下一张连脸型都变了。对于这种以叙事为主的视频来说，人物统一非常重要，不然观众看着会很出戏。

如果你想提高效率，也可以把原文整理好的提示词直接拿来参考，相关内容作者已经放到了这个页面里：本期视频文字信息（视频中用到的提示词）。这样你不用从零自己写一大堆提示词，能省掉很多时间。你要是后面做着做着卡住了，也可以去向有风咨询，加入我的知识星球圈子，这种方式对于新手来说会比自己乱试更省时间。

等图片和音频都准备好了，后面其实就是剪辑执行。原文里用的是剪映，做法也很接地气：先导入音频，再把对应图片一张张拖进去，对齐每一段旁白。如果你觉得画面太死，可以给图片加一点轻微关键帧，比如缓慢放大、轻微推进，或者统一加一点调色风格，让整个视频看起来更有连贯感。

字幕这一块可以加，也可以不加。如果你做的是英文赛道，加字幕通常更利于观看完成率；如果你想先快速测试内容，也可以先不上字幕，重点看点击率和前30秒留存。视频最终导出时，原文提到直接导出 1080P 就可以，先把内容发出去测试，比一开始就在画质细节上纠结更重要。

最后一个特别关键的环节，是封面图。因为这种 POV 题材，本质上还是很吃点击率，而点击率很大程度就看你的标题和封面配不配合。原文里总结了两种常见风格：一种是白底加人物的极简封面；另一种是更夸张、更有冲击力的戏剧化封面。两种都可以做，核心不是哪种绝对更好，而是你做完以后，要看它和你的视频标题是否匹配。

做封面时，最简单的方式也是先让 AI 根据你的标题生成封面提示词，再拿去图片工具里出图。如果画面不够满意，就继续改提示词，不要第一张不行就直接放弃。需要素材补充的时候，也可以搭配 Envato Elements 找一些背景元素、纹理或者视觉参考，做出来的封面通常会更完整。

写到这里，这套 POV 视频的后半段流程其实就已经很清楚了：脚本优化、英文配音、角色定型、场景拆分、批量出图、简单剪辑、封面制作。它并不是一个技术门槛特别高的项目，但很适合愿意用 AI 提升效率、又愿意稍微花时间打磨内容的人。

# YouTube视频教程