但大多数人都卡在同一个坎上——提示词不会写。 写多了,生出来一镜到底,毫无节奏感。写少了,人物动作直接崩一半。 这篇我把三种常见场景的提示词模板全部梳理出来了,实测验证过的,拿去直接用。 先搞清楚一个底层逻辑 参考生视频和纯文生视频,写提示词的思路完全不一样。 文生视频,你得从零开始描述画面——景别、色调、构图,全靠文字撑起来。 参考生视频不同。你已经上传了角色图和场景图,模型知道人长什么样。你只需要告诉它:这几秒钟里,发生了什么事。 所以提示词可以短很多,但动作和台词必须交代清楚。 短过渡镜头:3-5秒,越简单越好 表情变化、微小动作、情绪反应……这类镜头不需要任何运镜格式,大白话描述就行。 比如: @图片1(男主)靠在椅背上,不耐烦地瞥了一眼窗外,轻叹一声。 出片快,废片率极低。复杂的物理运动让模型自己补,反而更自然。 连续剧情片段:10-15秒,直接喂剧本 有对话、有情绪转折的戏,把剧本原文粘进去就行。 格式很简单:资产绑定 + 剧本内容,台词用双引号包裹。 几个细节必须注意—— "只生成音效,不生成音乐。不要生成任何字幕。"这句话必须加。不加的话,每段音乐风格不统一,字幕样式也乱,后期根本没法处理。 台词必须用双引号。不加双引号,模型不会同步口型,嘴就不动了。 动作描写保留原文即可,不用额外改格式。 精细化控制:15秒结构化分镜 如果你对镜头调度有明确要求——先给手部特写,再切面部近景,最后双人全景——就需要结构化分镜提示词。 格式是:资产绑定 + 逐条列出「XX-XX秒,景别,运镜,画面描述」。 比如:0-3秒,全景,固定,两人厅堂对坐,气氛凝重。3-7秒,中景推进,角色A缓缓站起身,说道:"……" 这种写法可控性强,但时间分配要合理。4秒内别指望完成跨越整个房间的大动作,写了模型也做不到。 让AI帮你拆分镜 觉得自己拆分镜麻烦?把系统提示词扔给DeepSeek或豆包,让它把剧本自动转成结构化分镜格式。你只需要检查微调,就能直接用。(具体的转换提示词模板,文末可以领取。) 首尾帧接力:解决跳帧问题 多段素材拼接,最常见的问题就是接缝处跳帧——上一段人在左边,下一段突然跑右边了。
解决方法很简单:把上一段视频的最后一帧截图,作为下一段的首帧参考图上传。在剪映里滑到视频结尾,点截图按钮导出,然后提示词里写上"@图片X 作为首帧"。 两段视频就能自然衔接。这个操作建议做成标准流程,每段生完就截尾帧备用。 总结一下 三种场景对应三种写法。每次动手前先判断:这段是短过渡、连续剧情、还是精细调度?然后套对应模板就行,不用每次从头想。 其实AI短剧这个赛道,真正拉开差距的不是工具,而是你对细节的把控。提示词只是其中一环,但把这一环做好,出片效率能翻好几倍。
方法都在这了,不算难。但任何项目都需要过程,不是一上来就能赚大钱的,得不断积累、持续优化。希望这份分享能帮你在AI短剧赛道跑出成绩。 |