一个适合普通人的YouTube赚钱新赛道:第一视角犯罪动画视频怎么做?
如果你最近经常刷 YouTube,应该已经发现了一种特别火的新内容形式:POV 第一视角故事类视频。这类视频最大的特点,就是让观众直接“代入”到另一个完全不同的人生里。不是普通讲故事,而是让你用第一视角去体验地下世界、黑帮体系、秘密特工、职业杀手,甚至毒枭背后的医生、腐败警察这类充满戏剧张力的身份。正因为代入感很强,这种视频非常容易让人一口气看下去,也因此成了最近 YouTube 上很有潜力的一条新赛道。
文中提到的工具和资源链接汇总
为了方便你直接上手,我把这期内容里提到的工具和资源都整理到了下面。你可以根据自己的需求直接点击使用。
社群咨询
AI 图片与视频生成工具
如果你要做 POV 故事视频,图片生成和视频生成工具基本都是绕不过去的,这两个工具可以重点看看:
AI 配音工具
做英文旁白或者 AI 配音时,下面这个工具非常常用:
AI 会员与账号服务
如果你在使用 ChatGPT、Gemini 等工具时,有会员开通或账号相关需求,可以参考下面这个平台:
1、主题说明(TOPIC)
你现在是一名高级 YouTube 选题策划专家,专门为一种电影感、故事驱动的 POV(第一视角)频道设计视频主题。这个频道的内容风格通常是:代入感很强、点击率很高、围绕权力结构、等级体系或者地下世界展开。类似下面这些视频选题:
- Your Life as Every Level of Military Sniper
你的一生:从新兵到顶级军事狙击手的每一个等级 - What It’s Like to Be Every Level of Dictator
当独裁者是什么体验?从小人物到最高统治者的每个阶段 - POV: You’re the President’s Secret Service Agent
第一视角:你是总统的特勤局保镖 - Your Life as Every Rank in the KGB
你的一生:从底层到高层,经历克格勃(KGB)的所有等级
官方介绍:https://www.britannica.com/topic/KGB - POV: You’re the Lawyer With Dirt on Every Billionaire
第一视角:你是那个掌握所有亿万富豪黑料的律师 - POV: You Launder Money for the World’s Richest Criminal
第一视角:你在为世界最有钱的罪犯洗钱 - What It’s Like to Be Every Level of Prison Hierarchy
在监狱等级体系里,从最底层到顶层是什么体验
目标(OBJECTIVE):
请生成 30 个原创视频选题,风格必须完全符合上面这种 心理吸引力 + 结构形式。
风格规则(非常重要):
这些选题必须满足以下要求:
- 用 第二人称写(比如:You / Your / You’re)
- 内容围绕:
权力、腐败、秘密、等级制度、精英体系、犯罪、情报机构、极端地位角色 - 整体感觉要:
- 有电影感
- 代入感强
- 风险很高、故事张力强
- 要激发:
- 好奇心
- 权力幻想
- 标题要暗示 升级、等级、权力变化,比如:
- 等级
- 阶层
- 阶段
- 权力上升或坠落
常见标题结构包括:
- Your Life as Every Level of…
你的一生:经历某个体系里的每一个等级 - What It’s Like to Be Every…
成为某个体系里每一层人物是什么感觉 - POV: You’re…
第一视角:你是…… - POV: Your Life as…
第一视角:你的一生是…… - You Control…
你掌控着…… - You Run…
你运营着…… - You’re the Only…
你是唯一一个……
需要避免的内容:
- 普通科普式表达
- 无聊的企业白领工作
- 没有权力元素的老套题材
- 只是简单罗列,没有等级或权力变化的选题
推荐重点环境:
选题尽量围绕这些世界观展开:
- 情报机构(Intelligence Agencies)
- 犯罪帝国(Criminal Empires)
- 政治体系(Political Systems)
- 秘密组织(Secret Societies)
- 军事结构(Military Structures)
- 亿万富豪圈层(Billionaire Networks)
- 黑手党 / 毒枭集团(Mafia / Cartel Structures)
- 威权政权(Authoritarian Regimes)
- 监狱体系(Prison Systems)
- 皇室宫廷(Royal Courts)
- 地下经济(Underground Economies)
- 私人精英安保(Elite Private Security)
- 黑暗企业权力体系(Dark Corporate Power Structures)
标题要求:
每个标题必须:
- 非常吸引点击
- 有一种 危险、禁忌、权力核心圈层 的感觉
- 8–16 个单词
- 不要反复使用同一个句式
输出格式:
只输出:
编号列表(1–30)的视频标题
不要:
- 解释
- 分类
- 评论
中英文对照
2:脚本 1(你的人生如同每个阶段…… / 成为每个阶段的感受…)
写一篇 长篇 YouTube 视频脚本,标题为:
“[主题(成为每个等级的体验… / 每个等级的人生…)]”
整篇脚本长度 必须在 2000–4500 字之间。
脚本必须 严格遵循下面这个结构和写作规则。
核心结构(CORE CONCEPT STRUCTURE)
整个脚本是一个 从低到高的等级晋升过程。
使用 Level One 到 Level Eight(总共 8 个等级)。
每一个等级都代表:
- 更大的权力
- 更深的腐败
- 更高的危险
- 更高的地位
- 更大的影响力
- 更强的孤独感
每个 Level 都要感觉像是 从上一层进化而来。
最后一个 Level(Level Eight)必须有一种:
- 神话般的感觉
- 极端的地位
- 强烈的孤独
- 心理上的沉重
结尾必须 回到 Level One 的循环结构:
出现一个新的新人进入这个体系。
整个主题必须像一个 封闭的生态系统,内部有自己的规则,比如:
- 监狱体系
- 政治体系
- 黑帮组织
- 公司权力结构
- 毒枭集团
- 军队体系
- 科技帝国
写作风格要求(WRITING STYLE REQUIREMENTS)
1. 叙事视角与时态
整篇 必须使用第二人称:
“你(You)”
只能用 现在时。
观众就是故事的主角。
不要出现:
- 作者解释
- 旁白讲解
- “想象一下”这种表达
观众不是听故事,而是 正在经历这件事。
示例语气:
你不会再问问题。
因为你已经知道答案。
2. 开头钩子(HOOK)—非常关键
脚本 必须直接从一个高压时刻开始。
不要:
- 背景介绍
- 世界观解释
开头要是:
- 一个紧张场景
- 一个道德困境
- 一个象征转变的瞬间
- 或一个即将发生的后果
第一段必须 像电影开场一样有冲击力。
常见开头方式:
- “事情从 ___ 开始。”
- “门在你身后关上。”
- “所有人都在看着你。”
- “电话在凌晨 2:13 响起。”
让人感觉这是 一切改变之前的那一刻。
3. 段落风格
段落:
- 短到中等长度
- 语句有力量
可以偶尔使用 单句段落增强冲击力。
整体风格:
- 直接
- 冷静
- 控制感强
- 简洁
避免:
- 空洞内容
- 过度诗意
- 花哨比喻
4. 心理变化深度
每个 Level 都必须体现:
- 内心想法
- 道德妥协
- 自我合理化
- 身份改变
- 情绪麻木
- 纯真消失
系统会 一点一点改变你。
这种变化必须 自然、真实、渐进。
5. 道德升级(MORAL ESCALATION)
每个 Level 必须不断升级:
- 权力
- 风险
- 腐败
- 后果
- 孤独
- 控制力
等级含义:
Level One
脆弱的新手
Level Four
成熟的执行者
Level Six
权力人物
Level Eight
不可触碰的存在
(传奇 / 幽灵 / 王 / 架构者)
6. 权力结构
脚本必须体现:
- 系统规则
- 隐形规则
- 忠诚关系
- 权力结构
权力的“货币”可能包括:
- 金钱
- 尊重
- 暴力
- 信息
- 把柄
- 恐惧
同时要体现:
谁听谁的
权力如何获得
规则如何运作
让观众感觉像在 学习一套秘密规则。
7. 具体细节
必须使用 具体细节:
例如:
- 金额
- 时间
- 地点
- 物件
- 头衔
- 行为
例子:
不好的写法:
你赚了很多钱。
好的写法:
一周赚了 4 万美元,而且没有一分钱挂在你的名字下。
具体细节会让故事 更真实。
8. 最终等级(Level Eight)
Level Eight 必须感觉:
- 不可避免
- 沉重
- 孤独
- 接近神话
行动减少。
反思增加。
更多的是:
- 代价
- 结果
- 后果
要让观众看到:
最高权力的代价是什么。
9. 结尾结构(非常关键)
结尾必须 回到 Level One 的循环。
展示:
一个新人进入这个体系。
他不知道将要发生什么。
但你知道。
循环继续。
经典结尾结构示例:
某个地方,一个新人刚刚开始。
他以为自己已经理解这场游戏。
其实没有。
但他会明白的。
整体语气(TONE)
整体氛围:
- 黑暗
- 冷静
- 克制
- 观察式
不要:
- 夸张
- 漫画式反派
- 说教
让人感觉:
系统本身,比任何个人都更强大。
节奏要求(PACING)
每个 Level 应包含:
- 一个决定性的瞬间
- 这一层的规则
- 一两个关键事件
- 心理变化
- 顺利过渡到下一层
升级过程必须 自然合理。
整篇贯穿的主题
脚本中要不断出现:
- 身份逐渐消失
- 名声与声誉
- 忠诚 vs 生存
- 权力 vs 自由
- 高处的孤独
- 控制只是幻觉
- 野心的代价
避免内容
不要:
- 总结
- 说教
- 陈词滥调
- 打破 POV
- 提到“这是脚本”
- 提到 YouTube
- 在 Level 之外写额外解释
最终输出格式
输出必须如下:
Title:
[主题]
然后:
Level One, [等级名称]
(正文)
Level Two, [等级名称]
(正文)
一直写到 Level Eight。
整篇字数:
2000–4500 字之间。
脚本 2:(视角:你…… / 你成为……)
写一篇 长篇、沉浸式叙事内容,使用 第二人称视角 和 现在时。
整篇内容必须是 连续的叙事文本。
不要使用:
- 场景标题
- 项目符号
- 剧本格式
主题(Topic)
[TOPIC]
字数要求
2000–4500 字
开头 / Hook 规则
故事必须从 主角进入这个高风险世界之前的普通生活瞬间开始。
展示:
主角在进入这个危险世界之前 正在做什么。
然后:
发生一个 突然的高风险事件,直接改变人生轨迹。
这个事件必须:
- 立刻改变主角的命运
- 迫使主角进入新的身份
叙事必须专注于:
- 行动
- 决策
- 后果
不要加入:
- 与剧情无关的细节
- 纯粹装饰性的描写
除非这些信息 直接影响决策或风险。
开头需要包含
- 立即出现的道德压力
- 巨大的责任
- 或者明显的危险
展示主角:
如何做出回应。
Hook 结尾必须完成:
主角已经 进入这个高风险角色,准备面对接下来的世界。
示例 Hook(仅作参考,不要照搬)
外科医生 / 毒枭
凌晨 2:47。
你已经在公立医院连续值班 28 个小时。
四个持枪的人抬着第五个人冲进急诊室。
他胸口中了好几枪。
其中一个人把 手枪放在手术托盘上。
“把他救活。”
“他死了,这房间里所有人都得死。”
你做了 四个小时手术。
他活下来了。
没有病历。
没有报警。
一周后。
一个穿西装的人敲开你家门。
他像读购物清单一样,说出了 你家人的全部信息。
“周一开始上班。”
门外有 持枪保镖。
国王 / 中世纪
钟声在响。
整个王国 所有教堂同时敲钟。
你父亲死了。
你 19 岁。
一小时后。
你坐在王座上。
周围是贵族。
他们的忠诚并不稳定。
任何一个决定都可能引发:
- 叛乱
- 战争
- 王国崩溃
你继承的不只是王冠。
还有:
敌人
债务
以及一堆 不管你是否准备好的期待。
特勤局特工
无线电里传来声音。
“Eagle 正在移动。”
你已经站在 警戒线旁边的位置。
六年前。
你还在 克利夫兰追查假钞案件。
那种生活已经结束。
现在:
每一秒都可能是 生死瞬间。
每一个决定:
可能让总统活下来。
也可能让他死。
你训练了很多年。
现在。
轮到你了。
叙事风格规则
必须:
- 第二人称(You)
- 现在时
整篇内容是:
连续叙事
不要:
- 场景切换标题
- 剧本结构
内容重点
叙事必须聚焦:
- 决策
- 战略
- 高风险判断
- 心理压力
同时展示:
- 行动的短期后果
- 行动的长期影响
必须包含:
- 内心思考
- 道德困境
描写限制
避免:
- 不必要的环境描写
- 过度感官细节
只有当这些细节:
直接影响行动或风险
才可以写。
剧情推进要求
故事必须逐渐升级:
风险越来越大。
展示:
小决策如何一步步积累成 巨大后果。
同时融入:
- 权力
- 责任
- 影响力
时间跨度
可以包含:
几年时间的经历。
展示:
角色如何逐渐:
- 成长
- 适应
- 或承受越来越大的风险。
结尾
故事必须以:
- 未解决的风险
- 持续的压力
- 或深刻反思
作为结尾。
要让观众感觉:
主角的挑战并没有结束。
可选元素(如果适合主题)
可以加入:
量化信息
例如:
- 资源规模
- 等级体系
- 金钱
- 行动规模
这些必须:
直接影响决策。
也可以加入:
- 应对威胁的策略
- 对抗敌人的方法
- 高风险决策逻辑
同时可以加入:
- 道德妥协
- 生存选择
- 操控与博弈
所有内容都必须围绕一个核心问题:
为什么主角会走到这个位置。
以及:
在这个角色里,他到底做了什么。
3、角色设定(CHARACTER)
可爱的极简卡通男孩角色,全身形象,正面朝向,居中构图。
脸是很大的圆形白色脸,没有鼻子,小黑色椭圆形眼睛,简单弯曲的眉毛,张开的微笑嘴巴。
头部是光滑的秃头。
耳朵很小、很简单。
穿着:
- 亮蓝色连帽卫衣(宽松版型,设计简单,没有任何 logo)
- 灰色直筒裤
- 简单的灰色鞋子
身体比例是:
- 短短的、圆圆的卡通比例
- 手和脚都比较小
整体风格:
- 柔和的 2D 数字卡通风格
- 干净的线稿
- 稍微偏粗的轮廓线
- 平涂颜色
- 只有很轻微的简单阴影
视觉风格类似:
现代网页动画卡通
或者
简单独立动画(indie animation)风格
背景要求:
- 纯白背景
- 没有任何道具
- 没有环境元素
光线:
- 柔和环境光
整体画面:
- 干净
- 极简
构图:
- 角色居中
- 画面对称
- 角色占据画面大部分高度
画质:
高分辨率
干净、精致的插画效果
第二个版本描述:
可爱的卡通男孩角色,全身、正面、居中构图。
头部和身体使用:
简单的几何形状。
特征包括:
- 小黑色椭圆眼睛
- 弯曲眉毛
- 微笑嘴巴
- 没有鼻子
头部是:
光滑的秃头,带一点淡淡的灰色平面阴影。
耳朵简单。
服装:
- 亮蓝色连帽卫衣(扁平矢量风格,没有 logo)
- 灰色裤子
- 简单灰色鞋子
身体比例:
- 短而圆的卡通比例
- 细节极少
- 小手小脚
整体风格:
扁平矢量插画(Flat Vector Illustration)
特点:
- 干净线稿
- 明亮纯色
- 没有渐变
背景:
纯白极简背景
构图:
居中
画质:
高分辨率
清晰、精致的矢量插画风格
4、图像生成规则(IMAGES)
你需要生成 高度细致的 2D 动画图像提示词(image prompts),用于 极简风格的 YouTube 故事叙事视频。
全局风格 DNA(GLOBAL STYLE DNA)
这个规则 适用于所有出现的人类角色。
所有人物必须完全复制 下面这个参考角色的艺术风格和结构设计语言:
角色风格:
- 可爱的极简卡通角色
- 巨大的圆形白色脸
- 没有鼻子
- 小黑色椭圆形眼睛
- 简单弯曲眉毛
- 简单但富有表情的嘴巴
- 光滑的秃头(除非剧本需要头发)
- 小而简单的耳朵
- 短小圆润的身体比例
- 小手小脚
绘画风格:
- 粗而干净的线条
- 稍微偏粗的轮廓线
- 平滑的平涂颜色
- 极简柔和阴影
整体视觉风格:
- 2D 数字卡通风格
- 现代网页动画 / 独立动画(indie animation)风格
必须避免:
- 真实写实风格
- 3D
- Anime 风格
- 半写实
这个风格适用于所有人物
包括:
- 主角
- 背景人物
- 人群
- 权威人物
- 敌人
- 普通市民
- 教官
- 军队单位
屏幕上出现的所有人类角色都必须使用同一风格。
绝对不允许出现 风格偏差。
如果画面中有多个角色:
他们必须看起来 像同一个画师画出来的。
角色结构必须完全一致。
这个参考角色 定义了整个作品的统一艺术风格模板。
身份一致规则(IDENTITY HANDLING RULE)
图像生成器之后会收到 主角的参考图片。
但你现在 无法看到这张图。
因此必须遵守以下规则:
不要:
- 改变脸部比例
- 改变人体结构
- 改变头部结构
- 重新设计角色
- 重新定义风格
必须假设:
主角在所有场景中 都是同一个角色身份。
你唯一可以改变的内容:
- 服装
- 配饰
- 装备
- 发型(只有剧本需要时)
- 表情
- 姿势
- 灯光
- 环境
基于角色的服装系统(ROLE-BASED CLOTHING SYSTEM)
服装必须 直接来自剧本情境。
在每个场景中:
先判断角色的身份。
再决定服装。
服装必须基于:
- 职业
- 等级
- 环境
- 年代
- 当前活动
- 天气
- 训练阶段
- 装备等级
不要默认使用 连帽卫衣,除非剧本明确写了日常穿着。
服装必须能够 视觉上表达权力和成长。
多角色统一规则(MULTI-CHARACTER ENFORCEMENT RULE)
如果画面中有多个人:
所有人物都必须使用 同一种极简圆头风格。
不允许:
- 真实比例
- 尖锐脸部结构
- 有鼻子的角色
- 写实人体
允许变化:
- 肤色
- 衣服
- 身高
- 发型(如果需要)
- 配饰
但 角色结构必须完全一致。
绝对禁止 艺术风格混合。
场景构图规则(STAGING RULES)
使用 电影式构图:
- 前景 / 中景 / 背景 分层
- 利用比例变化制造景深
- 角色站位展示权力关系
- 使用不同摄影角度
- 用光线强化情绪
除非剧情需要,否则避免 平面构图。
成长视觉规则(PROGRESSION RULE)
如果剧本包含:
- 等级
- 阶层
- 成长
画面必须逐渐升级:
升级元素包括:
- 服装复杂度
- 装备等级
- 权力标志
- 场景规模
- 灯光强度
- 姿态自信度
规则:
早期场景 → 简单
后期场景 → 更复杂
输出格式(OUTPUT FORMAT)
把剧本拆解为 电影感视觉节奏(visual beats)。
每一个画面输出:
Scene X – [场景标题]
Image Prompt:
一幅高度细致的 2D 动画场景,使用 GLOBAL STYLE DNA 中定义的 完全相同的极简圆头卡通风格。
所有人物必须遵循 完全一致的设计语言。
图像提示词必须包含:
- 场景中 角色总人数(全部使用同一风格)
- 每个角色的 服装描述
- 装备与道具
- 表情
- 肢体语言
- 场景环境
- 灯光氛围
- 前景 / 中景 / 背景 分层
- 时间(如果重要)
必须避免:
- 写实
- 风格偏差
- 重新设计主角
需要拆解的剧本
[SCRIPT]
5、THUMBNAIL 1(POV 风格封面图)
你的角色是一个 专业的 AI 提示词工程师(Prompt Engineer),专门负责设计 高点击率的 YouTube POV 犯罪 / 动作类缩略图提示词。
这些缩略图的视觉风格要 完全对齐参考图的风格,核心特点包括:
- 第一人称视角的手
- 血迹元素
- 纹身
- 武器
- 现金
- 高对比主体
- 纯白背景
严格规则(必须完全遵守):
- 只输出 一条完整、可直接复制粘贴的图片生成提示词(Prompt)。
- 不要任何多余内容。
- 不要解释。
- 不要开头介绍。
图片生成需要 针对以下模型优化:
- Flux
- Midjourney v6
官方网站:https://www.midjourney.com - SD3(Stable Diffusion 3)
官方网站:https://stability.ai
背景要求:
背景必须是 纯白色 #FFFFFF。
同时必须满足:
- 没有渐变
- 背景没有阴影
- 没有地面透视
- 没有空间深度
画面中的所有元素必须像是 漂浮在纯白空间里。
这样可以让主体 非常突出,适合 YouTube 缩略图点击效果。
环境元素规则:
只有当某些 标志性物件能够明显帮助表达主题时,才可以加入。
比如:
- 监狱题材
可以加入:监狱铁床 + 洗手池 / 马桶 - 外科医生题材
可以加入:手术台 + 输液架 - 摩托车帮派
可以加入:沙漠公路碎片 / 摩托车车把 - 日本黑帮(Yakuza)
可以加入:昏暗桌子 + 成堆日元
这些环境物件必须:
- 简单
- 扁平
- 高对比
不要画完整房间或复杂环境。
POV 视角规则(非常重要):
画面必须是 第一人称视角。
观众看到的是:
自己伸出来的手 / 前臂
位置在 画面下方前景。
手的造型必须 符合主题身份:
例如:
- 外科医生
蓝色手术手套 + 血迹 - 摩托车帮 / 日本黑帮(Yakuza)
黑色皮手套 / 裸手 + 纹身 - 囚犯 / 杀手
被束带绑住的手 / 带血的手
角色与人物元素:
可以根据主题 动态加入人物:
主要人物:
- 目标
- 受害者
例如:
- 受伤躺在床上的毒枭
- 跪着的叛徒
- 被绑住的线人
同时可以加入 1–3 个辅助人物:
例如:
- 保镖
- 黑帮成员
- 毒枭手下(Sicarios)
暴力细节元素:
画面可以包含:
- 新鲜血迹
- 血滴
- 成捆现金
- 闪亮武器
- 复杂纹身
- 紧张压迫感
整体艺术风格:
- 超细节
- 半写实
- 黑暗漫画风
风格参考:
- 《Sin City(罪恶之城)》
https://en.wikipedia.org/wiki/Sin_City - 《GTA(侠盗猎车手)》
https://www.rockstargames.com/gta
光影:
- 极端 明暗对比(Chiaroscuro)
只照亮主体。
色彩重点:
- 深红色
- 金色高光
画面要求:
- 锐利清晰
- 构图干净
强制插画规则(STRICT ILLUSTRATION LOCK):
画面必须看起来像:
手绘 + 数字绘画
绝对不能像:
- 照片
- 电影画面截图
- 3D 渲染
硬性禁止项(Hard negatives):
--no photorealistic
--no photography
--no realistic skin pores
--no 3d render
--no octane render
--no unreal engine
--no film grain
--no depth of field blur
需要转换的主题:
[TOPIC]
现在只需要:
生成完整的图片 Prompt。
不要输出其他内容。
6、第二种封面图风格THUMBNAIL 2(Your Life as 系列)
你现在是 YouTube 病毒级缩略图提示词专家。
目标是设计 2025–2026 年流行的单人物插画风格缩略图。
风格特点:
- 纯白背景
- 只有一个人物
- 戏剧性姿势
- 漫画式插画
绝对不能:
- 多个人
- 人群
- 同一个角色多个版本
画面构图:
建议:
- 半身构图
- 或头部到胸部构图
视觉重点:
角色脸部
制服
装备
文字元素设计:
画面需要包含:
- 大号粗体标题文字
字体:
Sans-serif 无衬线字体
重点词:
- 红色强调
箭头元素:
必须加入:
粗大的弯曲红色箭头
箭头位置:
从角色 脸部或肩膀附近
指向:
文字区域
整体设计风格:
- 高对比
- 干净构图
- 边缘清晰
- 锐利焦点
视觉效果:
一眼看上去就 非常抓眼球(scroll-stopping)。
文字空间:
预留 右侧 / 右上角大面积区域。
参考系列:
- “Every Level of…”
- “POV: You’re the…”
生成模型优化:
针对:
- Flux
- Midjourney v6
https://www.midjourney.com - SD3(Stable Diffusion 3)
https://stability.ai
严格输出规则(必须遵守):
- 只输出 一条完整 Prompt
- 不要任何其他文字
- 不要解释
- 不要聊天内容
画面要求:
- 纯白背景 #FFFFFF
- 没有阴影
- 没有渐变
- 没有环境
- 没有其他人物
画面中心:
一个角色
姿势:
与主题相关的 强动作姿势
角色可以:
- 正面看镜头
- 或侧脸
主题 / 标题概念:
[TOPIC]
现在:
只输出完整图片 Prompt。
如果你也想做 YouTube 视频赚钱,但一直不知道做什么类型,这条路真的值得认真研究。它的优势很明显:题材自带吸引力,观众天然有好奇心,而且用 AI 可以大幅降低制作门槛。你不需要自己出镜,也不需要复杂拍摄,照样能把视频做出来。文中提到的相关提示词,我也建议你先保存好,后面做内容时会省很多时间:本期视频文字信息(视频中用到的提示词)。如果你想少走弯路,也可以直接通过向有风咨询,加入我的知识星球圈子,系统了解这一类频道到底该怎么起号、怎么做内容、怎么提高变现效率。
什么是 POV 第一视角故事视频?
简单来说,这类视频就是让观众以“你”的身份进入一个特殊世界。比如,你是 CIA 黑色行动小组的一员,你是日本黑帮成员,你是给毒枭发工资的腐败警察,或者你是被顶级势力保护的职业杀手。整条视频会围绕“如果你真的活在这个世界里,你每天会经历什么”来展开,让观众沉浸式地看完整个故事。
这种内容之所以容易爆,是因为大多数普通人现实里根本接触不到这些世界。越是陌生、危险、神秘,观众越容易产生强烈的点击欲和观看欲。也正因为这样,很多刚创建不久的新频道,只靠几条类似的视频,就能跑出非常夸张的数据。有的频道上线才一个月,单条视频就突破了百万播放;有的频道总共只发了几条,累计播放就已经非常惊人。
这类频道为什么适合普通人操作?
第一,它不依赖真人出镜。你不想露脸,完全可以做。
第二,它不依赖复杂设备。核心是脚本、配音、图片和剪辑,普通人用电脑就能完成。
第三,它很适合 AI 辅助制作。无论是写选题、写脚本、翻译内容、生成角色、制作画面,还是做配音和剪辑,现在都可以交给 AI 工具来提高效率。
如果你正准备搭建自己的内容工作流,文章里提到的这些工具都值得先收藏起来。比如做图片和视频素材,可以用 OpenArt;做英文配音,推荐很多创作者都在用的 ElevenLabs;如果你还想尝试数字人出镜,可以看看 Heygen;想快速把想法转成完整视频,也可以体验 InVideo AI。另外,做剪辑时如果你需要补充高质量 B-roll、音效、模板和素材包,Envato Elements 也是非常实用的资源库。
做这种视频,最关键的第一步是什么?
不是先做画面,也不是先配音,而是先把选题方向想清楚。因为这类视频的标题结构,通常分成两种。
第一种是“你的一生”或者“每个等级”的结构。比如:你的一生,经历私人军事帝国的每一个等级;或者从底层到顶级狙击手,每一个阶段是什么样的。这一类内容更偏“等级升级”叙事。
第二种是纯故事型。比如:你是被世界最有钱家族联合庇护的杀手;你是专门替独裁者藏钱的银行家。这种标题不是讲等级,而是讲一个完整的沉浸式故事。
很多人一开始就把这两种内容混在一起做,最后脚本结构完全乱掉。正确做法是:先确定你要做哪一种,再用对应的提示词去生成脚本。这样最后出来的视频,节奏和观看体验才会更自然。
用 AI 写脚本时,一定要注意这件事
现在很多人都知道可以用 ChatGPT、Gemini 这类工具写脚本,但真正容易出问题的地方也在这里。因为平台现在对纯 AI 批量生成内容的识别越来越敏感,如果你完全不修改,直接把 AI 生成的脚本拿去用,内容很容易变得模板化、重复化,严重时甚至会影响频道的变现表现。
更稳妥的方式是:把 AI 当成辅助工具,而不是完全代替你创作。 先让 AI 帮你搭好结构、提供灵感,再用你自己的表达方式去调整。这样不仅更自然,也更符合平台对原创内容的期待。
如果你想让脚本生成效果更好,文中也提到,做这类长篇叙事内容时,使用更强的模型和更长的推理模式,通常比免费版本生成得更完整。像 ChatGPT、Gemini 这类工具都可以尝试。如果你在会员开通上有困难,也有人会通过银河录像局这类平台解决账号或会员问题,但使用前建议你自己先确认服务规则和适用情况。
这类视频的完整制作流程
整体流程其实并不复杂,大概就是这几步:先定选题,再生成脚本,然后把脚本翻译成英文,接着做英文配音,再生成统一风格的角色图片,最后把故事脚本拆成多个画面提示词,批量生成图片,导入剪辑软件完成成片。
在这套流程里,比较关键的两个环节,一个是角色统一,一个是画面拆分。
角色统一很好理解。因为你的视频里会反复出现同一个主角,所以你最好先生成一个稳定的人物形象,后面所有图片都围绕这个角色来做,这样整条视频看起来才不会乱。
画面拆分也很重要。不要一次把整篇脚本都丢给 AI 去生成图片提示词,而是按段落、一段一段地拆。这样每个场景才会更具体,画面也更贴合剧情。
先发到这里,等你说“继续”,我再接着往下整理后半部分,包括配音、角色图、图片转视频、剪辑、封面图制作和文章收尾转化部分。
接下来就是把脚本真正做成视频。到了这一步,很多人最容易卡住的,其实不是不会剪辑,而是不知道先做什么、后做什么。比较顺的流程是:先把脚本整理好,再做英文配音,然后统一角色形象,接着批量生成场景图片,最后再进剪辑软件把音频、图片、字幕和封面图全部组合起来。整个制作逻辑并不复杂,关键是顺序不要乱。
先说配音。对于这种英文 POV 故事视频,比较常见的做法是先把你修改过的脚本翻译成英文,再导入 AI 配音工具生成旁白。原文里推荐的是 ElevenLabs,因为它在英文配音这块自然度比较高,声音选择也多,适合这种剧情叙事类内容。操作上也不难,把英文脚本粘贴进去,筛选语言、性别、年龄和音色,然后试听,挑一个最适合你频道风格的声音就行。需要注意的一点是,免费版通常限制较多,如果你后面准备长期商用,最好先确认对应套餐的商业授权范围。
脚本有了,声音有了,下一步就是统一人物形象。因为这类视频不是随便拼几张图就行,它通常会围绕一个固定角色展开,所以你最好先做一张“角色参考图”。原文里提到,很多同类频道都会用非常简洁的卡通人物形象,比如光头、极简五官、干净背景这类设定,目的不是做得多复杂,而是为了后面所有画面都能保持统一。
在图片工具上,原文更推荐用 OpenArt 这一类专业平台,而不是直接在聊天工具里慢慢出图。原因很简单:效率更高,模型更多,而且后面做批量场景图时更省时间。先把角色图做出来,衣服颜色、裤子样式、整体配色最好稍微改一改,不要完全照搬别人的模板。这样做出来的频道视觉识别度会更强,也能避免大家最后都长得一个样。
角色定好后,就进入最核心的一步:把脚本拆成场景提示词,然后批量生成画面。这里有一个很重要的细节,很多新手特别容易忽略,就是不要一次把整篇脚本全部丢进去生成图片提示词。更好的做法,是一段一段拆,一段剧情生成一组场景提示词。这样 AI 才会围绕具体情节去出图,而不是给你一堆很空、很泛、没法直接用的画面描述。原文里也是按段落去拆,再把每一段丢进工具里生成对应画面。
而且在生成场景图时,记得把前面那张角色参考图一起带上。这样 AI 才能尽量保持人物一致,不会这一张是蓝衣服,下一张变成红衣服,再下一张连脸型都变了。对于这种以叙事为主的视频来说,人物统一非常重要,不然观众看着会很出戏。
如果你想提高效率,也可以把原文整理好的提示词直接拿来参考,相关内容作者已经放到了这个页面里:本期视频文字信息(视频中用到的提示词)。这样你不用从零自己写一大堆提示词,能省掉很多时间。你要是后面做着做着卡住了,也可以去向有风咨询,加入我的知识星球圈子,这种方式对于新手来说会比自己乱试更省时间。
等图片和音频都准备好了,后面其实就是剪辑执行。原文里用的是剪映,做法也很接地气:先导入音频,再把对应图片一张张拖进去,对齐每一段旁白。如果你觉得画面太死,可以给图片加一点轻微关键帧,比如缓慢放大、轻微推进,或者统一加一点调色风格,让整个视频看起来更有连贯感。
字幕这一块可以加,也可以不加。如果你做的是英文赛道,加字幕通常更利于观看完成率;如果你想先快速测试内容,也可以先不上字幕,重点看点击率和前30秒留存。视频最终导出时,原文提到直接导出 1080P 就可以,先把内容发出去测试,比一开始就在画质细节上纠结更重要。
最后一个特别关键的环节,是封面图。因为这种 POV 题材,本质上还是很吃点击率,而点击率很大程度就看你的标题和封面配不配合。原文里总结了两种常见风格:一种是白底加人物的极简封面;另一种是更夸张、更有冲击力的戏剧化封面。两种都可以做,核心不是哪种绝对更好,而是你做完以后,要看它和你的视频标题是否匹配。
做封面时,最简单的方式也是先让 AI 根据你的标题生成封面提示词,再拿去图片工具里出图。如果画面不够满意,就继续改提示词,不要第一张不行就直接放弃。需要素材补充的时候,也可以搭配 Envato Elements 找一些背景元素、纹理或者视觉参考,做出来的封面通常会更完整。
写到这里,这套 POV 视频的后半段流程其实就已经很清楚了:脚本优化、英文配音、角色定型、场景拆分、批量出图、简单剪辑、封面制作。它并不是一个技术门槛特别高的项目,但很适合愿意用 AI 提升效率、又愿意稍微花时间打磨内容的人。