SpecKit 深度研究：规范驱动开发的崛起、竞争与未来

发表于 2026/04/22

作者 latte

27 分钟阅读

一、发展历程：从混乱的 Vibe Coding 到规范先行

1.1 时代背景：AI 编程的第一个大坑

要理解 SpecKit 为什么会出现，必须先理解它要解决的问题。

2025 年上半年，以 Cursor、Windsurf、Claude Code 为代表的 AI 编程工具迎来爆发。”Vibe Coding”成为流行词——开发者用自然语言描述想法，AI 直接生成代码，整个过程凭感觉（vibe）驱动，快速、直觉、充满魔法感。

但随着项目规模增大，Vibe Coding 的问题开始暴露。上下文漂移是最普遍的抱怨：AI 在长对话中逐渐”忘记”最初的设计意图，代码风格和架构开始偏移，你在第 50 轮对话里写的代码和第 5 轮已经判若云泥。幻觉累积是另一个顽疾：没有规范约束时，AI 会自行发明 API、假设依赖关系，错误在迭代中叠加，等你发现时已经是一团乱麻。不可复现让团队协作变成噩梦：同一个 prompt 在不同 agent、不同时间给出截然不同的实现，没有人能说清楚”这段代码为什么这么写”。

这是 SpecKit 出现的土壤：Vibe Coding 解决了”能写代码”的问题，但没有解决”写对代码”的问题。

1.2 思想谱系：规范先行并非新发明

规范驱动开发（Spec-Driven Development，SDD）并非 SpecKit 首创，它有清晰的思想谱系。

传统软件工程阶段（1970s-2000s）：瀑布模型、形式化规范（Z notation、VDM）、契约式设计（Design by Contract，Bertrand Meyer，1986）。核心思想是”先写规范，再写代码”，但工具链繁重，工程师抵触，最终沦为纸面文档。

API 优先阶段（2010s）：OpenAPI/Swagger 规范的兴起让”规范即文档即合同”的理念在 Web 开发中落地。Stripe、Twilio 等公司以 API 规范为核心组织开发流程，证明了规范驱动的商业价值。这一阶段，规范开始真正”活”起来——它不只是给人看的文档，而是可以驱动代码生成、测试、文档的可执行制品。

AI 辅助编程早期（2021-2024）：GitHub Copilot 发布，代码补全成为主流。但这一阶段 AI 仍是”辅助”角色，规范由人来写，AI 来填充实现。规范和代码之间的鸿沟依然存在。

Agent 编程阶段（2025）：Claude Code、Gemini CLI 等 Agent 工具出现，AI 开始自主执行多步骤任务。这时”规范”的角色发生了质变——它不再只是给人看的文档，而是给 AI 看的”宪法”，是约束 Agent 行为的核心机制。没有规范，Agent 就像一个聪明但没有章程的员工，能力越强，跑偏越远。

SpecKit 正是在这个节点上出现的，它把 SDD 思想与 AI Agent 工作流深度结合，创造了一套新的开发范式。

1.3 诞生与爆发：一个月 2.8 万 Star

2025 年 8 月底：SpecKit 在 GitHub 开源（github/spec-kit），由 GitHub 官方团队主导。

2025 年 9 月 9 日：正式发布公告，在 Hacker News、X（Twitter）引发广泛讨论。GitHub 官方博客同步发布文章《Spec-driven development with AI: Get started with a new open source toolkit》，详细阐述了 SDD 方法论的核心理念。

发布后一个月：获得 2.8 万+ Star，成为 GitHub 有史以来增长最快的开发工具项目之一。这个数字背后，是整个开发者社区对”AI 编程混乱现状”的集体共鸣——大家都在等一个能把 AI Agent 用得”靠谱”的方法论。

2025 年 10 月：社区 fork panaversity/spec-kit-plus（v0.0.17）出现，添加了多 Agent 协作和云原生模式，说明社区已经开始在官方基础上进行扩展实验。

2025 年 11 月 15 日：官方发布 v0.0.85，带来 agent-specific template bundles（针对不同 AI Agent 的专属模板包），进一步降低了不同工具用户的上手门槛。同期，官方还推出了 domain-specific checklists（领域专项检查清单），覆盖安全、UX 等关键领域，这是 SpecKit 在验证层能力上的重要补强。

截至 2026 年 4 月：Star 数已突破 90,000，跻身 GitHub 全站 Star 增速前列。社区生态持续扩展，出现了针对 .NET、Python、云原生等不同技术栈的专项模板。

1.4 五层工作流的设计逻辑

SpecKit 的核心是一套五层工作流，每一层都有其历史渊源和设计意图：

Constitution（宪法）
    ↓
Spec（规范）
    ↓
Plan（计划）
    ↓
Tasks（任务）
    ↓
Implement（实现）

Constitution 层来自法律和组织治理的隐喻——就像宪法约束所有法律一样，它定义项目的核心原则、技术栈选择、不可逾越的边界。这是给 AI 的”最高法”，每次 Agent 启动时都会加载，确保行为基线的一致性。一个典型的 constitution 文件会规定：使用什么语言和框架、代码风格约定、禁止修改哪些核心文件、错误处理规范等。

Spec 层来自传统软件工程的功能规范（Functional Specification），但被简化为 AI 可理解的结构化 Markdown，描述”做什么”而非”怎么做”。它是需求的可执行化表达，不是 PRD 那种给人看的文档，而是 AI 可以直接解析和执行的蓝图。

Plan 层借鉴了敏捷开发的 Sprint Planning，将 Spec 分解为有序的实现步骤，解决 AI Agent 在复杂任务中的”迷失”问题。这一层回答的是”怎么做”——技术架构选择、模块划分、依赖关系。

Tasks 层对应传统的工单系统（Jira/Linear），但以 AI 可直接执行的格式存在，每个 Task 都是原子性的、可验证的。完成一个 Task 就勾掉一个，进度清晰可见。

Implement 层才是 AI 真正写代码的地方——但此时它已经有了完整的上下文约束，幻觉空间被大幅压缩。AI 不再是在黑暗中摸索，而是在清晰的图纸指导下施工。

这套设计的核心洞察是：AI 的问题不是能力不足，而是缺乏约束。 给它足够清晰的上下文和边界，它就能表现得像一个靠谱的工程师；没有约束，它就会像一个聪明但随性的实习生。

1.5 支持生态的快速扩张

SpecKit 发布时就宣布支持 15 种主流 AI Agent，包括 Claude Code、GitHub Copilot、Cursor、Gemini CLI、Windsurf 等。这种”生态中立”的策略是其快速传播的重要原因——无论你用什么 AI 工具，都可以用同一套规范文件工作。

v0.0.85 版本引入的 agent-specific template bundles 进一步强化了这一优势：针对不同 Agent 的使用习惯和能力特点，提供了定制化的模板，让 SpecKit 在每个 Agent 上都能发挥最佳效果。

官方还提供了 Specify CLI 工具，支持一键脚手架项目，自动生成 constitution、spec、plan、tasks 的目录结构，大幅降低了上手门槛。

二、竞品对比：SDD 赛道的三种路线

2.1 竞品全景：三剑客各占一角

在 SpecKit 所在的”AI Agent 开发规范化”赛道，目前有三类主要玩家，业界称之为”SDD 三剑客”：

SpecKit（GitHub 官方，开源）：规范约束层，核心是”把 AI 绑定在规则之内”。

Kiro（AWS，2025 年 7 月发布）：验证层，核心是”AI 产出必须通过验收才能进入主干”。

OpenSpec（OpenAI）：协议层，核心是”定义 AI 服务的行为契约”。

三者的关系用一个比喻来理解：SpecKit 是编码规范 + 架构规范，Kiro 是单元测试 + 静态扫描，OpenSpec 是 OpenAPI 规范。它们不是竞争关系，而是互补的三个层次——但在实际选型中，资源有限的团队往往需要在三者之间做取舍。

2.2 SpecKit vs Kiro：最直接的竞争

Kiro 是 AWS 在 2025 年 7 月 15 日推出的 AI IDE，与 SpecKit 最为直接竞争，但两者的切入点有本质差异。

定位差异：SpecKit 是一套方法论 + 工具包，形态是 Markdown 文件 + CLI；Kiro 是一个完整的 IDE（基于 VS Code 构建），形态是商业软件产品。这个差异决定了两者的受众和使用场景有所不同。

工作流差异：SpecKit 的工作流是 Constitution → Spec → Plan → Tasks → Implement，强调在编码前把所有规范和计划都写清楚；Kiro 的工作流是 Requirements → Design → Tasks（保存在 .kiro/specs/ 目录），同样强调先文档后代码，但更侧重需求的结构化拆解。

验证机制的核心差异：这是两者最关键的区别。Kiro 的 Agent Hooks 机制允许在代码生成后自动触发验证脚本（测试、lint、类型检查），形成”生成→验证→修复”的闭环。SpecKit 在 v0.0.85 之前这一层相对薄弱，主要依赖人工检查 Task 完成情况；v0.0.85 引入的 domain-specific checklists 是对这一短板的补强，但与 Kiro 的自动化 Hooks 相比仍有差距。

生态绑定差异：SpecKit 完全生态中立，支持 15 种 AI Agent，不绑定任何云厂商；Kiro 虽然内置了多种模型（Claude 全系列、DeepSeek、GLM、Qwen 等），但不支持自定义 API Key（BYOK），深度绑定 AWS 生态。这一点在社区中引发了不少批评，GitHub 上已有大量 BYOK 的 feature request，但截至 2026 年 4 月仍未有官方回应。

定价差异：SpecKit 完全开源免费；Kiro 采用 credit 制，Pro 版 $20/月提供 1,000 credits，对于频繁使用 Spec 模式的用户可能不够用。

用户口碑：SpecKit 的用户普遍反映”从指挥糊涂助手变成了跟靠谱工程师协作”，最大的价值在于让 AI 的行为变得可预测。Kiro 的用户则更多提到 Spec 模式在处理复杂需求时的有效性，以及 Agent Hooks 带来的自动化便利，但 credit 消耗不透明和不支持 BYOK 是主要槽点。

维度	SpecKit	Kiro
形态	开源方法论 + CLI	商业 IDE
核心理念	规范约束，绑定 AI 行为	验证层，确保产出质量
验证机制	Checklist（v0.0.85+）	Agent Hooks（自动化）
Agent 支持	15 种，完全中立	内置多模型，不支持 BYOK
生态绑定	无绑定	AWS 生态
开源程度	完全开源	闭源商业产品
定价	免费	$20-$200/月
上手成本	低（纯 Markdown）	中（需安装 IDE）

2.3 SpecKit vs OpenSpec：互补而非竞争

OpenSpec 是 OpenAI 官方推出的规范系统，定位更偏向”AI Agent 间的协议标准化”，与 SpecKit 的重叠度相对较低。

OpenSpec 解决的问题是：如何描述一个 AI 服务的行为——输入有哪些字段、输出是什么格式、哪些字段是强制的。它更像是给 LLM 做 OpenAPI，是 OpenAI 在构建”AI 操作系统”基建的一部分，以后所有”让 AI 调用工具、知识库、API”都将依赖 OpenSpec。

SpecKit 管的是”过程”——约束 AI 在项目内的行为；OpenSpec 管的是”接口”——定义 AI 服务的行为契约。两者更多是互补关系：OpenSpec 定义 Agent 之间”说什么语言”，SpecKit 定义在一个项目里 Agent “按什么规则干活”。

在企业级 AI 工程体系中，理想的组合是：OpenSpec 描述 API 和工具 schema，SpecKit 约束代码生成规则，Kiro 对生成结果进行验收。三者各司其职，形成完整的质量保障体系。

2.4 SpecKit vs 各 Agent 原生规范机制

各大 AI Agent 都有自己的”规范文件”机制，这是 SpecKit 最直接的替代品：

Agent	原生规范机制	SpecKit 的优势
Cursor	`.cursorrules`	更完整的层次结构（constitution→spec→plan）
Claude Code	`CLAUDE.md`	跨 Agent 一致性，不锁定 Anthropic
GitHub Copilot	`.github/copilot-instructions.md`	Plan/Tasks 层提供更细粒度的执行控制
Gemini CLI	`GEMINI.md`	同上
Windsurf	`.windsurfrules`	同上

SpecKit 的核心价值主张：当你的团队同时使用多种 AI Agent，或者未来可能切换 Agent 时，SpecKit 提供了一个与 Agent 无关的规范层，避免被单一工具锁定。这在多 Agent 协作场景下价值巨大——你不需要为每个 Agent 维护一套规范文件，一套 SpecKit 文件，所有 Agent 都能遵守。

2.5 用户真实反馈：踩坑与收获

社区中有一篇颇具代表性的”踩坑实录”值得关注。作者严格按照 SpecKit 的 7 步流程（Specify → Clarify → Plan → Tasks → Analyze → Checklist → Implement）走完，但最终生成的代码”数据库方言错了、重复造了已有的轮子、业务逻辑不仅没对齐甚至还跑偏了”。

这个案例揭示了 SpecKit 的一个重要局限：工具本身不能替代思考。如果 Spec 文件写得不够清晰、Plan 阶段没有充分考虑现有代码库的约束，AI 依然会产生幻觉。SpecKit 提供的是一个框架，但框架的质量取决于使用者的输入质量。

另一方面，大量用户反映在”从零开始做新功能”（Greenfield）场景下，SpecKit 的效果显著——需求清晰、架构干净、AI 行为可预测。而在”在存量代码上加功能”（Brownfield）场景下，需要额外花时间让 AI 理解现有代码库的约束，否则容易出现”重复造轮子”的问题。

三、综合判断：SpecKit 的位置与走向

3.1 SpecKit 真正解决了什么

从发展历程和竞品对比来看，SpecKit 的本质是把软件工程几十年积累的”规范先行”智慧，以 AI Agent 能理解的方式重新包装。它不是革命性的新发明，而是一次恰到好处的范式迁移。

它解决的核心问题是：AI Agent 的”失忆”和”幻觉”问题。通过在项目根目录维护一套层次化的规范文件，每次 Agent 启动时都能加载完整上下文，从而保证行为一致性。这个思路简单、直接、有效——正是这种”简单有效”让它在一个月内获得 2.8 万 Star。

3.2 SpecKit 的真实局限

尽管增长惊人，SpecKit 目前有几个值得关注的局限。

规范维护成本：Constitution 和 Spec 文件需要人工维护，当项目快速迭代时，规范文件可能滞后于实际代码，反而成为误导 AI 的”过时文档”。这是所有”文档驱动”方法论的通病，SpecKit 也不例外。

验证层仍然薄弱：相比 Kiro 的 Agent Hooks 机制，SpecKit 的 domain-specific checklists 虽然是进步，但仍然是人工检查而非自动化验证。”规范写了但 AI 没遵守”的情况难以被系统性发现。

个人项目 vs 团队项目：对于个人开发者的小项目，SpecKit 的五层结构可能过重；它的价值在多人协作、长周期项目中才能充分体现。

AI 能力依赖：SpecKit 的效果高度依赖底层 AI 的指令遵循能力。随着模型能力提升，”规范文件”的必要性可能会降低——更强的 AI 可能不需要那么多约束就能保持一致性。这是一个有趣的悖论：SpecKit 因 AI 能力不足而诞生，也可能因 AI 能力提升而被超越。

3.3 未来走向预判

短期（6-12 个月）：SpecKit 会快速完善验证层，可能引入类似 Kiro Hooks 的自动化验证机制。同时会出现大量基于 SpecKit 的模板生态（针对不同技术栈的 constitution 模板），降低不同领域开发者的上手门槛。

中期（1-2 年）：SDD 方法论会被主流 AI IDE 原生支持，Cursor、Windsurf 等工具可能内置 SpecKit 兼容的规范文件支持，SpecKit 的独立工具价值会被稀释，但方法论本身会成为行业标准。就像 Git Flow 最终被各种 GUI 工具内置一样，SDD 的核心思想会渗透进每个 AI 编程工具的设计中。

长期（2 年以上）：随着 AI 能力的进一步提升，”规范文件”的形式可能从 Markdown 演进为更结构化的格式（类似 OpenSpec 的方向），甚至由 AI 自动生成和维护规范，形成”AI 写规范 → AI 按规范写代码 → AI 验证规范符合度”的全自动闭环。

3.4 对开发者的实践建议

立即可用：如果你正在使用多种 AI Agent（比如同时用 Claude Code 和 Cursor），SpecKit 的 constitution + spec 两层就能立即带来价值，统一 AI 的行为基线。不需要一次性引入完整的五层结构，从最简单的 constitution 文件开始，按需扩展。

重点关注 Plan 层：SpecKit 的 Plan 层是最被低估的部分——它把”大任务”分解为”有序的小任务”，这对解决 AI Agent 在复杂任务中的”迷失”问题效果显著，值得优先实践。

Brownfield 场景要额外投入：在存量代码库上使用 SpecKit 时，需要花时间让 AI 充分理解现有代码库的约束，否则容易出现”重复造轮子”的问题。建议先用 SpecKit 的 constitution 文件记录现有架构约束，再开始新功能的 spec 编写。

持续观察 Kiro 的验证层：Kiro 的 Agent Hooks 机制是目前 SpecKit 的明显短板。如果你的项目对代码质量要求极高，可以考虑 SpecKit + Kiro 的组合——用 SpecKit 约束生成过程，用 Kiro 验证生成结果。

SpecKit 的爆红不是偶然，它踩在了 AI 编程从”能用”走向”可靠”的关键转折点上。90k Star 背后是整个开发者社区对”AI 写的代码怎么才能信任”这个问题的集体焦虑。无论 SpecKit 本身的命运如何，它所代表的核心理念——先写清楚规则，再让 AI 按规则写代码——将会是 AI 时代软件工程的重要基石之一。

本文基于截至 2026 年 4 月的公开信息撰写，部分未来走向为作者推断，仅供参考。

深度研究

SpecKit AI编程规范驱动开发 SDD Kiro OpenSpec

本文由作者按照 CC BY 4.0 进行授权

SpecKit 深度研究：规范驱动开发的崛起、竞争与未来

一、发展历程：从混乱的 Vibe Coding 到规范先行

1.1 时代背景：AI 编程的第一个大坑

1.2 思想谱系：规范先行并非新发明

1.3 诞生与爆发：一个月 2.8 万 Star

1.4 五层工作流的设计逻辑

1.5 支持生态的快速扩张

二、竞品对比：SDD 赛道的三种路线

2.1 竞品全景：三剑客各占一角

2.2 SpecKit vs Kiro：最直接的竞争

2.3 SpecKit vs OpenSpec：互补而非竞争

2.4 SpecKit vs 各 Agent 原生规范机制

2.5 用户真实反馈：踩坑与收获

三、综合判断：SpecKit 的位置与走向

3.1 SpecKit 真正解决了什么

3.2 SpecKit 的真实局限

3.3 未来走向预判

3.4 对开发者的实践建议

热门标签