AI图像与视频脚本创作实战

一张好的产品图、一条高完播的短视频，曾经需要专业摄影师和导演才能产出。现在，掌握几个关键的提示词技巧，一个营销人就能独立完成从视觉到视频的完整内容创作链。这节课把图像和视频脚本的创作方法论全部给你。

本课内容

主流AI图像工具选择与对比

图像提示词解剖：五个核心要素

营销场景图像实战：6大场景专项模板

品牌视觉一致性：风格锁定方法

短视频脚本AI创作：三种爆款结构

互动工具：图像提示词生成器

图文视频一体化工作流

主流AI图像工具选择

2025年的AI图像工具已经非常成熟，核心问题不再是"质量够不够用"，而是"哪个工具适合我的场景"。下面从营销实用角度做一个直接的对比。

Midjourney

目前商业质量最高的AI图像工具，风格自由度强，擅长艺术感和氛围感图像。

最优质量付费

DALL·E 3

集成在ChatGPT内，理解自然语言最好，可以用中文描述直接生成，适合快速出图。

语言理解强ChatGPT内置

Canva AI

最适合营销人的图像工具，模板丰富，AI功能和设计工具无缝整合。

免费版可用国内可用

即梦 (Dreamina)

字节跳动出品，国内可直接访问，中文提示词友好，擅长人物和生活场景。

免费额度国内可用

可灵 (Kling)

快手出品的AI视频生成工具，支持图生视频和文生视频，国内质量领先。

视频生成国内可用

Runway

专业AI视频工具，Gen-3质量接近商业级别，擅长从文字或图片生成高质量视频。

视频生成付费

推荐起步组合：国内团队首选"即梦 + Canva AI"——免费额度充足、中文友好、直出营销规格。预算充足时加入Midjourney提升品牌图像质量。视频内容团队推荐"可灵 + Runway"组合。

图像提示词解剖：五个核心要素

一个高质量的图像提示词，无论多复杂，都可以拆解为五个核心要素。理解每个要素的作用，才能系统性地提升图像质量。

完整提示词示例（颜色标注各要素）

一位25岁的亚洲女性，站在现代简约的咖啡馆内，拿着一杯拿铁，微笑，自然光线，小清新摄影风格，胶片质感，浅景深，商业产品摄影，高清，8K，柔和自然光，逆光轮廓 --no text, no watermark, no distorted hands, no blurry face

主体描述人物/物品/场景的具体描述，越详细越好

风格修饰摄影风格、艺术流派、画面整体感觉

质量参数商业摄影、高清、8K——告诉AI你要的画质上限

光线描述光线是图像质感最重要的因素

负向提示明确告诉AI"不要什么"，大幅减少废图率

最常被忽视的要素是负向提示。养成每次都写负向提示的习惯，可以把废图率从50%降低到10%以下。必写的负向提示：no text, no watermark, no distorted fingers, no extra limbs, no blurry face

营销场景图像实战模板

不同的营销场景对图像有截然不同的要求。下面按6种最常见的营销图像场景，提供可直接复用的专项提示词模板。

产品图

社媒配图

活动KV

人物场景

广告Banner

品牌质感图

产品主图（白底/场景图）

基础

电商详情页、官网产品页的核心图。白底图用于基础展示，场景图用于建立使用情境和情感连接。

白底产品图

[产品名称]，产品实拍风格，纯白色背景，居中构图，柔和均匀的摄影棚光线，高清商业产品摄影，细节清晰 --no shadows, no text, no watermark, clean background

场景使用图

[产品名称]放置在[使用场景]上，周围有[搭配道具]，[品牌色调]色系，电影感构图，浅景深，自然光，生活方式摄影风格 --no people, no text, no watermark

活动KV主视觉

进阶

活动KV底图

[活动主题]氛围感背景图，[色调方向]色系，现代感设计风格，有充足的留白区域用于排版，16:9横版构图 --no text, no logo, leave space for typography

人物使用场景图

进阶

真实感人物场景

[人物描述]，[使用场景]，[动作/表情]，非摆拍感，街头摄影风格，自然光，浅景深，35mm镜头，胶片质感 --no artificial pose, no distorted hands, no text

品牌质感图（氛围/情绪）

高级

品牌调性氛围图

极简主义品牌摄影，传递[品牌调性]的生活方式，[色调]，电影级构图和光线，高级感质感，留白充足，16:9宽幅构图 --no text, no product visible, no watermark

品牌视觉一致性：风格锁定

方法一

风格关键词固化

把视觉风格提炼成5-10个固定关键词，每次生成图像时都附加这些关键词。

胶片质感, 莫兰迪色系, 浅景深, 自然光

方法二

Midjourney风格ID

用--sref参数引用一张参考图，AI会学习其色调和构图风格。

--sref [参考图URL] --sw 100

方法三

色彩系统锁定

把品牌色系转化为提示词描述，用色彩名称而非色值。

主色：暖奶茶棕 / 辅色：哑光白

方法四

品牌视觉前缀

建立一段固定的"品牌视觉前缀"，每次生成前粘贴，类似品牌声音提示词前缀。

【品牌视觉规范】色调+风格+构图

短视频脚本AI创作：三种爆款结构

视频脚本的核心是"节奏"而不是"文字"。三种结构对应三种不同的视频类型和目的。

结构一：钩子-价值-CTA（最通用）

适用：知识分享、产品介绍 · 60秒

▼

0-3秒

钩子句：制造悬念或直接给出结论

4-15秒

承接：建立继续看的理由

16-50秒

核心价值：3个信息点，每点10-12秒

51-60秒

CTA：金句收尾 + 行动引导

AI脚本生成提示词

请用"钩子-价值-CTA"结构写一个60秒口播脚本：内容主题：[主题] 核心洞察：[你最想传递的1个关键信息] 目标受众：[描述] 结构要求： - 0-3秒：钩子（≤12字） - 4-15秒：承接句（2-3句） - 16-50秒：3个核心信息点 - 51-60秒：金句总结 + 关注/收藏引导格式：每句≤15字，口语化，用"/"标注停顿

结构二：问题-共鸣-解决方案（高评论率）

适用：用户痛点内容、产品种草 · 45-90秒

▼

开场

场景还原：描述具体痛点场景

共鸣段

扩大痛点：说明问题的普遍性

解决方案

给出具体可操作的解法，产品自然融入

结尾

引发评论的问题 + 行动召唤

AI脚本生成提示词

请用"问题-共鸣-解决方案"结构写一个视频脚本：用户核心痛点：[具体描述] 产品/解决方案：[你的产品或方法论] 目标平台：[抖音/小红书/视频号] 视频时长：[45秒/60秒/90秒] 要求： - 开头必须是极度具体的生活场景 - 中间放大痛点的普遍性 - 解决方案具体可操作，分2-3个步骤 - 产品植入自然，不像广告 - 结尾用开放问题引发评论

结构三：反转型故事（最高分享率）

适用：品牌故事、案例分享 · 90-180秒

▼

建立预期

呈现一个大家认为"理所当然"的场景

情节发展

按预期方向发展，让观众觉得结局可预期

反转时刻

用事实或洞察打破预期，制造认知冲击

洞察升华

从个人故事提炼普遍性洞察

AI脚本生成提示词

请用"反转型故事"结构写一个视频脚本：我的真实经历：[描述故事背景和结果] 反转点：[让你自己感到惊讶的事情] 最终洞察：[你想让观众带走的一句话] 视频时长：[90秒/2分钟] 要求： - 开头用一句话建立让人意外的期待 - 反转时刻要有具体细节 - 洞察要有普遍性 - 全程口语化，每句≤15字

互动工具：图像提示词生成器

AI图像提示词生成器

选择场景参数，一键生成可用提示词

① 使用场景（选1个）

② 视觉风格（选1-2个）

③ 画面比例（选1个）

④ 主体描述

⑤ 色调方向（可选）

生成的图像提示词

适用于Midjourney、即梦、DALL·E 3

图文视频一体化工作流

确定核心内容选题

选题确定后，同时拆解文字内容角度和视觉内容角度，两条线并行。

AI选题提示词内容日历

生成核心文字内容 + 视觉Brief

核心内容完成后，同步产出"视觉配图Brief"，告诉AI图像工具需要什么样的配图。

Claude / ChatGPT

AI图像生成（批量出图）

基于视觉Brief批量生成5-10张候选图，从中筛选最优的2-3张用于不同平台。

Midjourney即梦DALL·E 3

视频脚本生成

基于同一个核心内容，用三种脚本结构生成视频口播稿。

脚本提示词（本课）CapCut / 剪映

组装 + 发布

在Canva中叠加文字排版，在剪映中配合视频脚本剪辑完成。

Canva AI剪映可灵（图生视频）

课程要点回顾

六大AI图像工具各有适用场景：国内团队首选即梦+Canva AI，品牌图像质量首选Midjourney

图像提示词五要素：主体描述+风格修饰+质量参数+光线描述+负向提示，负向提示最常被忽视

6大营销场景各有专项模板：产品图/社媒配图/KV/人物场景/广告Banner/品牌氛围图

三种视频脚本结构：钩子-价值-CTA（通用）/问题-共鸣-解决（高评论）/反转型（高分享）

图文视频一体化工作流：一个选题同步产出文字+图像+视频脚本，最大化内容效率

模块02第4课：AI图像与视频脚本创作实战，含工具对比、提示词解剖、营销场景图像生成、视频脚本结构和互动生成器

AI图像与视频脚本创作实战

主流AI图像工具选择

Midjourney

DALL·E 3

Canva AI

即梦 (Dreamina)

可灵 (Kling)

Runway

图像提示词解剖：五个核心要素

营销场景图像实战模板

品牌视觉一致性：风格锁定

风格关键词固化

Midjourney风格ID

色彩系统锁定

品牌视觉前缀

短视频脚本AI创作：三种爆款结构

结构一：钩子-价值-CTA（最通用）

结构二：问题-共鸣-解决方案（高评论率）

结构三：反转型故事（最高分享率）

互动工具：图像提示词生成器

AI图像提示词生成器

图文视频一体化工作流

确定核心内容选题

生成核心文字内容 + 视觉Brief

AI图像生成（批量出图）

视频脚本生成

组装 + 发布