模块02第4课:AI图像与视频脚本创作实战,含工具对比、提示词解剖、营销场景图像生成、视频脚本结构和互动生成器

模块 02 · 第 4 课 约 50 分钟 多媒体创作 本模块终章

AI图像与视频脚本创作实战

一张好的产品图、一条高完播的短视频,曾经需要专业摄影师和导演才能产出。现在,掌握几个关键的提示词技巧,一个营销人就能独立完成从视觉到视频的完整内容创作链。这节课把图像和视频脚本的创作方法论全部给你。

本课内容
1
主流AI图像工具选择与对比
2
图像提示词解剖:五个核心要素
3
营销场景图像实战:6大场景专项模板
4
品牌视觉一致性:风格锁定方法
5
短视频脚本AI创作:三种爆款结构
6
互动工具:图像提示词生成器
7
图文视频一体化工作流
1

主流AI图像工具选择

2025年的AI图像工具已经非常成熟,核心问题不再是"质量够不够用",而是"哪个工具适合我的场景"。下面从营销实用角度做一个直接的对比。

Midjourney

目前商业质量最高的AI图像工具,风格自由度强,擅长艺术感和氛围感图像。

最优质量付费

DALL·E 3

集成在ChatGPT内,理解自然语言最好,可以用中文描述直接生成,适合快速出图。

语言理解强ChatGPT内置

Canva AI

最适合营销人的图像工具,模板丰富,AI功能和设计工具无缝整合。

免费版可用国内可用

即梦 (Dreamina)

字节跳动出品,国内可直接访问,中文提示词友好,擅长人物和生活场景。

免费额度国内可用

可灵 (Kling)

快手出品的AI视频生成工具,支持图生视频和文生视频,国内质量领先。

视频生成国内可用

Runway

专业AI视频工具,Gen-3质量接近商业级别,擅长从文字或图片生成高质量视频。

视频生成付费

推荐起步组合:国内团队首选"即梦 + Canva AI"——免费额度充足、中文友好、直出营销规格。预算充足时加入Midjourney提升品牌图像质量。视频内容团队推荐"可灵 + Runway"组合。

2

图像提示词解剖:五个核心要素

一个高质量的图像提示词,无论多复杂,都可以拆解为五个核心要素。理解每个要素的作用,才能系统性地提升图像质量。

完整提示词示例(颜色标注各要素)
一位25岁的亚洲女性,站在现代简约的咖啡馆内,拿着一杯拿铁,微笑,自然光线小清新摄影风格,胶片质感,浅景深商业产品摄影,高清,8K柔和自然光,逆光轮廓 --no text, no watermark, no distorted hands, no blurry face
主体描述人物/物品/场景的具体描述,越详细越好
风格修饰摄影风格、艺术流派、画面整体感觉
质量参数商业摄影、高清、8K——告诉AI你要的画质上限
光线描述光线是图像质感最重要的因素
负向提示明确告诉AI"不要什么",大幅减少废图率

最常被忽视的要素是负向提示。养成每次都写负向提示的习惯,可以把废图率从50%降低到10%以下。必写的负向提示:no text, no watermark, no distorted fingers, no extra limbs, no blurry face

3

营销场景图像实战模板

不同的营销场景对图像有截然不同的要求。下面按6种最常见的营销图像场景,提供可直接复用的专项提示词模板。

产品图
社媒配图
活动KV
人物场景
广告Banner
品牌质感图
产品主图(白底/场景图)
基础

电商详情页、官网产品页的核心图。白底图用于基础展示,场景图用于建立使用情境和情感连接。

白底产品图
[产品名称],产品实拍风格,纯白色背景,居中构图,柔和均匀的摄影棚光线,高清商业产品摄影,细节清晰 --no shadows, no text, no watermark, clean background
场景使用图
[产品名称]放置在[使用场景]上,周围有[搭配道具][品牌色调]色系,电影感构图,浅景深,自然光,生活方式摄影风格 --no people, no text, no watermark
社媒配图(小红书/朋友圈)
基础
小红书风格配图
小清新风格生活场景,[内容主题],明亮温暖的自然光线,浅色系背景,胶片质感,生活方式摄影,竖版3:4构图,适合小红书封面 --no text overlay, no watermark
活动KV主视觉
进阶
活动KV底图
[活动主题]氛围感背景图,[色调方向]色系,现代感设计风格,有充足的留白区域用于排版,16:9横版构图 --no text, no logo, leave space for typography
人物使用场景图
进阶
真实感人物场景
[人物描述][使用场景][动作/表情],非摆拍感,街头摄影风格,自然光,浅景深,35mm镜头,胶片质感 --no artificial pose, no distorted hands, no text
信息流广告Banner
进阶
信息流广告图
强视觉冲击力广告图,主体是[产品或场景][品牌主色系]为主色调,构图简洁有力,[情绪方向]感,左侧或上方留出排版区域 --no text, leave text space, no watermark
品牌质感图(氛围/情绪)
高级
品牌调性氛围图
极简主义品牌摄影,传递[品牌调性]的生活方式,[色调],电影级构图和光线,高级感质感,留白充足,16:9宽幅构图 --no text, no product visible, no watermark
4

品牌视觉一致性:风格锁定

方法一

风格关键词固化

把视觉风格提炼成5-10个固定关键词,每次生成图像时都附加这些关键词。

胶片质感, 莫兰迪色系, 浅景深, 自然光
方法二

Midjourney风格ID

用--sref参数引用一张参考图,AI会学习其色调和构图风格。

--sref [参考图URL] --sw 100
方法三

色彩系统锁定

把品牌色系转化为提示词描述,用色彩名称而非色值。

主色:暖奶茶棕 / 辅色:哑光白
方法四

品牌视觉前缀

建立一段固定的"品牌视觉前缀",每次生成前粘贴,类似品牌声音提示词前缀。

【品牌视觉规范】色调+风格+构图
5

短视频脚本AI创作:三种爆款结构

视频脚本的核心是"节奏"而不是"文字"。三种结构对应三种不同的视频类型和目的。

结构一:钩子-价值-CTA(最通用)

适用:知识分享、产品介绍 · 60秒
0-3秒
钩子句:制造悬念或直接给出结论
4-15秒
承接:建立继续看的理由
16-50秒
核心价值:3个信息点,每点10-12秒
51-60秒
CTA:金句收尾 + 行动引导
AI脚本生成提示词
请用"钩子-价值-CTA"结构写一个60秒口播脚本: 内容主题:[主题] 核心洞察:[你最想传递的1个关键信息] 目标受众:[描述] 结构要求: - 0-3秒:钩子(≤12字) - 4-15秒:承接句(2-3句) - 16-50秒:3个核心信息点 - 51-60秒:金句总结 + 关注/收藏引导 格式:每句≤15字,口语化,用"/"标注停顿

结构二:问题-共鸣-解决方案(高评论率)

适用:用户痛点内容、产品种草 · 45-90秒
开场
场景还原:描述具体痛点场景
共鸣段
扩大痛点:说明问题的普遍性
解决方案
给出具体可操作的解法,产品自然融入
结尾
引发评论的问题 + 行动召唤
AI脚本生成提示词
请用"问题-共鸣-解决方案"结构写一个视频脚本: 用户核心痛点:[具体描述] 产品/解决方案:[你的产品或方法论] 目标平台:[抖音/小红书/视频号] 视频时长:[45秒/60秒/90秒] 要求: - 开头必须是极度具体的生活场景 - 中间放大痛点的普遍性 - 解决方案具体可操作,分2-3个步骤 - 产品植入自然,不像广告 - 结尾用开放问题引发评论

结构三:反转型故事(最高分享率)

适用:品牌故事、案例分享 · 90-180秒
建立预期
呈现一个大家认为"理所当然"的场景
情节发展
按预期方向发展,让观众觉得结局可预期
反转时刻
用事实或洞察打破预期,制造认知冲击
洞察升华
从个人故事提炼普遍性洞察
AI脚本生成提示词
请用"反转型故事"结构写一个视频脚本: 我的真实经历:[描述故事背景和结果] 反转点:[让你自己感到惊讶的事情] 最终洞察:[你想让观众带走的一句话] 视频时长:[90秒/2分钟] 要求: - 开头用一句话建立让人意外的期待 - 反转时刻要有具体细节 - 洞察要有普遍性 - 全程口语化,每句≤15字
6

互动工具:图像提示词生成器

AI图像提示词生成器

选择场景参数,一键生成可用提示词

① 使用场景 (选1个)
② 视觉风格 (选1-2个)
③ 画面比例 (选1个)
④ 主体描述
⑤ 色调方向 (可选)
生成的图像提示词
适用于Midjourney、即梦、DALL·E 3
7

图文视频一体化工作流

1

确定核心内容选题

选题确定后,同时拆解文字内容角度和视觉内容角度,两条线并行。

AI选题提示词内容日历
2

生成核心文字内容 + 视觉Brief

核心内容完成后,同步产出"视觉配图Brief",告诉AI图像工具需要什么样的配图。

Claude / ChatGPT
3

AI图像生成(批量出图)

基于视觉Brief批量生成5-10张候选图,从中筛选最优的2-3张用于不同平台。

Midjourney即梦DALL·E 3
4

视频脚本生成

基于同一个核心内容,用三种脚本结构生成视频口播稿。

脚本提示词(本课)CapCut / 剪映
5

组装 + 发布

在Canva中叠加文字排版,在剪映中配合视频脚本剪辑完成。

Canva AI剪映可灵(图生视频)
课程要点回顾
六大AI图像工具各有适用场景:国内团队首选即梦+Canva AI,品牌图像质量首选Midjourney
图像提示词五要素:主体描述+风格修饰+质量参数+光线描述+负向提示,负向提示最常被忽视
6大营销场景各有专项模板:产品图/社媒配图/KV/人物场景/广告Banner/品牌氛围图
三种视频脚本结构:钩子-价值-CTA(通用)/问题-共鸣-解决(高评论)/反转型(高分享)
图文视频一体化工作流:一个选题同步产出文字+图像+视频脚本,最大化内容效率