Seedance 2.0 技能操作系统:AI 导演视频的完整工具链

Seedance 2.0 技能操作系统:AI 导演视频的完整工具链

当 AI 视频生成从"能不能做到"变成"怎么才能做好",瓶颈就不再是模型本身了。

Reading time 8 min read

当 AI 视频生成从"能不能做到"变成"怎么才能做好",瓶颈就不再是模型本身了。

2026 年春晚成为全球首个大规模使用 Seedance 2.0 的公开项目后,ByteDance 的这个多模态视频生成模型迅速成为创作者关注的焦点。3 月,它通过 CapCut 和 Dreamina 向全球市场推出——单次生成可接收最多 9 张图片、3 段视频、3 段音频作为参考,输出带原生同步音频的 2K 分辨率视频,最长 15 秒。

但能力越强,使用门槛往往越高。

一个叫 Emily2040(@iamemily2050)的开发者注意到了这个问题,并用一种非常工程化的方式解决了它:把专业电影制作的工作流,打包成一个 AI 代理可以直接读取和执行的"操作系统"。这个项目叫 Seedance 2.0 Skill OS,现在在 GitHub 有 980 颗星、183 次 Fork。


为什么需要一个操作系统

使用 Seedance 2.0 失败,大多数时候并不是因为模型能力不足,而是因为输入的方式错了。

典型的失败路径是这样的:用户有了一个模糊的创意,直接把它扔给模型,得到一段似是而非的视频,然后反复加描述词去调教:

"让这个视频更有电影感"、

"光线再柔和一些"、

"镜头移动慢一点"。

这种方法本质上是在用语言微操每一帧,而不是在导演一部短片。

用一句话可以概括这个项目的核心哲学:

"Direct the model. Don't micro-manage the frame."

导演这个模型,不要微操每一帧。

所以,Seedance 2.0 Skill OS 给的正确逻辑是:

创作前务必先弄清楚自己想表达什么,再把这个意图翻译成模型能理解的专业指令(这一步可以用AI辅助),最后在生成结果出来之后按照专业流程来判断和修复。


架构:24 个子技能,47 份参考文档

这个仓库不是一个单一的 prompt 模板,而是一个结构化的技能包,分三个层次:

核心 Pipeline(14 个子技能)

核心流程覆盖从创意到交付的完整链路:

  • seedance-interview / seedance-interview-short:当用户只有一个模糊想法时使用。不是直接写 prompt,而是先通过结构化问答提炼出创意简报
  • seedance-prompt / seedance-prompt-short:把创意简报转化为生产就绪的 prompt,分完整版(200 词左右)和压缩版(30-100 词)
  • seedance-cameraseedance-motionseedance-lightingseedance-charactersseedance-styleseedance-vfxseedance-audio:各专项的 prompt 构建,每个对应摄影指导、运动设计、灯光、角色、风格、视效、音频等专业维度
  • seedance-recipes:常见类型片(烹饪教程、健身演示、产品展示、动作场景)的快速模板
  • seedance-troubleshoot:生成结果失败时的根因诊断与修复建议
  • seedance-pipeline:API 调用、定价、模型 ID、工作流自动化的完整指南

治理层(3 个子技能)

这一层解决的是现实创作中最麻烦的问题:IP 和安全合规。

  • seedance-copyright:当用户的请求涉及名人、IP、品牌、受保护音乐时,提供"更安全的创意等价替换",而不是直接拒绝。比如不能使用"迪士尼城堡",技能会帮你找到保留同等视觉情绪、但不触碰 IP 的描述方式
  • seedance-antislop:过滤掉会触发内容安全警告的措辞,提供替代方案
  • seedance-filter:专门处理误报情况——当良性的专业内容被错误拦截时,帮助用户用正确的制作语境来澄清,而不是想办法绕过安全检查

多语言词汇库(7 个技能)

支持英、中、日、韩、西班牙、俄语的电影术语词汇库,专为混合语言 prompt 设计。这对于非英语母语的创作者尤其有用——用中文写 prompt 时,很多专业词汇没有精确对应,这个词汇库解决的正是这个摩擦点。


参考文档体系:47 份知识锚点

光有执行步骤不够,AI 代理还需要背景知识来做判断。仓库内的 47 份参考文档分几个类别:

平台事实文档(source-dated,带核实日期):API 状态、模型名称映射、各平台能力矩阵。这类文档明确标注核实日期,防止 AI 代理把已经过期的平台信息当成现时事实。

模型机制文档:解释模型为什么会有某种行为,不只是告诉代理"这样做",还告诉它"为什么这样做有效"。这让代理在遇到文档里没有明确覆盖的新情况时,能基于机制做合理推断而不是乱猜。

专业制作标准:面向专业电影/广告创作者的工作流文档,包括拍摄计划单、连续性台账、色彩流程(ACES)、音频后期、字幕本地化、交付 QC 清单。这些不是 AI 专用的——它们直接对应真实制片流程。

重拍协议(Retake Protocol):每次生成结果返回后的五个判断选项:保留、后期修复、剪辑重组、重新生成、重写 prompt。每个选项对应具体条件,并有"每次只改一个变量"的原则约束——和物理实验中的控制变量法是一回事。


操作循环:11 步执行链

根 SKILL.md 定义了一个 11 步的操作循环,AI 代理每次接到视频相关任务都会走这个流程:

1. Intake:识别目标、制作阶段、平台、模式、时长、画幅、参考素材、音频需求、交付要求和 IP 风险 2. 信源验证门:任何平台相关声明前,先加载最新的 API 状态文档 3. 专业标准门:涉及电影、广告、客户交付时,加载专业制作标准 4. 模式选择:T2V、I2V、V2V、R2V、FLF2V(首末帧)、剪辑、延伸或修复 5. 能力检查:加载能力图,确认计划方案在模型支持范围内 6. 参考素材映射:为每个资产分配角色(身份、首帧、末帧、产品、环境、运动、摄像机、时序、音频、风格) 7. 多语言门:处理中、俄、日、韩、西班牙语或混合语言 prompt 8. 安全门:IP、肖像、品牌、真人相关请求路由到专项处理 9. Prompt 构建:根据情况路由到面试、写作、压缩或专项技能 10. 质量检查:反 slop 检查、主运镜、物理光照、声音意图、连续性锚点 11. 修复循环:结果返回后的五判决分诊

这个流程最有意思的地方在于:它不允许把翻译工作推回给用户。"描述结果,不描述参数"——这是给 AI 代理的工作原则,但执行权在代理侧。


安装与使用

仓库支持多种 AI 代理客户端:Claude Code、Codex、Google Antigravity、OpenClaw、Hermes Agent 等。

Codex 用户(Windows/本地安装):

`bash python scripts/install_codex_skill.py --force `

会自动将技能包复制到 $CODEX_HOME/skills/seedance-20/~/.codex/skills/seedance-20/

Claude Code / 手动安装

把仓库克隆到你的代理客户端技能目录,通常是 .agents/skills/seedance-20/ 或等价路径:

`bash git clone https://github.com/Emily2040/seedance-2.0.git .agents/skills/seedance-20 `

安装后,在 AI 代理中通过 /seedance-20 或直接描述视频需求来调用技能。典型入口:

  • 有模糊创意 → 我想拍一段关于 X 的短视频(代理加载 seedance-interview
  • 有明确场景 → 直接描述场景(代理加载 seedance-prompt
  • 生成失败 → 这个结果不对,...(代理加载 seedance-troubleshoot

这个项目在解决什么本质问题

从工程角度看,Seedance 2.0 Skill OS 是在解决一个具体的软件工程问题:如何让 AI 代理在高度依赖专业领域知识的任务中保持一致性

专业视频制作有大量隐性知识——一个有经验的摄影指导知道为什么不应该在同一个 prompt 里同时指定镜头焦距和运动方式,一个经验丰富的制片知道合规审查应该发生在什么阶段而不是什么阶段。这些知识通常存在于人的脑子里,或者分散在各种内部文档里。

这个仓库做的事情是:把这些知识系统化、结构化,然后编码成 AI 代理能够访问和执行的指令。它的 47 份参考文档不只是给人读的——每一份都是代理在特定条件下应该加载的"专业记忆"。

从这个角度看,它和一个优秀的后端 SDK 在做同样的事情:抽象掉领域复杂度,提供一个清晰的接口,让调用方不需要了解所有细节就能做出正确的事情。


项目地址github.com/Emily2040/seedance-2.0当前版本:v5.5.2(2026-06-12) 许可证:MIT

Thoughts, reviews, practice, stories, and ideas.

Get the latest essays in your inbox

Weekly highlights across AI and software, SEO playbooks, reviews, and creator notes—concise, practical, and editorial.