2026년 4월 기준
Claude Code 3대 프레임워크 완벽 비교
설치부터 실전 워크플로우까지 — Superpowers · GSD · gstack 공식 GitHub 기반 총정리
1. 왜 프레임워크가 필요한데?
Claude Code는 처음 30분은 인상적이다. 그 이후부터 문제가 시작된다.
패턴은 예측 가능할 만큼 반복된다. 이 세 가지 문제를 각기 다른 방향에서 해결하는 프레임워크가 독립적으로 등장했다.
🧠 컨텍스트 부패(Context Rot) — 200K 토큰 윈도우가 차면서 초기 지시사항을 잊어버린다. 2시간 전에 요청한 보안 설정이 슬그머니 사라진다.
🧪 테스트 부재 — 그럴듯한 코드를 쏟아내지만 테스트는 안 쓴다. 기능 하나 추가하면 기존 두 개가 조용히 깨진다.
🎯 스코프 드리프트 — 서브넷 3개를 요청하면 NAT 게이트웨이, VPN, DNS 리졸버까지 덤으로 만든다. 요청하지 않은 인프라의 월 청구서가 날아온다.
2. 3대 프레임워크 한눈에 비교
| 항목 | Superpowers | GSD | gstack |
|---|---|---|---|
| 핵심 철학 | 테스트 주도 개발(TDD) 강제 | 컨텍스트 부패 방지 | 역할 기반 거버넌스(23인 팀) |
| 제작자 | Jesse Vincent | Lex Christopherson | Garry Tan (YC CEO) |
| GitHub Stars | 149K+ | 51K+ | 71K+ |
| 오케스트레이션 | 단일 오케스트레이터 + 서브에이전트 | 페이즈별 독립 오케스트레이터 | 23개 전문 역할 분리 |
| 컨텍스트 관리 | 하나의 윈도우 | 디스크 저장 → 페이즈마다 초기화 | 역할별 범위 한정 핸드오프 |
| 설치 형태 | Claude Code 플러그인 | 독립 CLI (npm) | Claude Code 스킬 |
| 지원 에이전트 | 6개 | 14개+ | 10개 |
| 최적 사용처 | 테스트 규율이 필요한 솔로 개발 | 수일~수주의 대규모 프로젝트 | 기획~배포 전체 스프린트 관리 |
3. Superpowers — "테스트 없이는 코드도 없다"
Jesse Vincent이 만든 Superpowers(GitHub 149K+ stars)는 AI 코딩 에이전트에 테스트 주도 개발(TDD)을 강제하는 프레임워크다. 핵심 원칙은 하나: "프로덕션 코드는 실패하는 테스트를 통과시키기 위해서만 존재한다."
에이전트가 코드부터 쓰려는 충동을 억제한다. 대신 7단계 게이트를 강제하고, 단계를 건너뛸 수 없다. 특히 서브에이전트 기반 개발이 핵심인데, 메인 오케스트레이터가 전체 흐름을 관리하면서 각 구현 태스크를 격리된 서브에이전트에 위임한다. Claude가 개입 없이 수 시간 동안 자율 작업하는 게 가능한 이유다.
실제 사례: chardet 라이브러리 메인테이너가 Superpowers로 v7.0.0을 처음부터 재작성하여 41배 성능 향상을 달성했다. 41%가 아니라 41x다.
✅ 설치 방법
# 방법 1: Claude Code 공식 마켓플레이스 (권장)
/plugin install superpowers@claude-plugins-official
# 방법 2: Superpowers 자체 마켓플레이스
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
설치 끝. 별도 설정 없이 스킬이 자동 트리거된다. 코딩을 시작하면 brainstorming부터 안내한다.
📋 7단계 워크플로우
| 단계 | 스킬 | 하는 일 |
|---|---|---|
| 1 | brainstorming |
소크라테스식 질문으로 아이디어 정제, 디자인 문서 저장 |
| 2 | using-git-worktrees |
새 브랜치에 격리 워크스페이스 생성, 테스트 베이스라인 확인 |
| 3 | writing-plans |
2~5분 단위 태스크 분해, 정확한 파일 경로와 코드 포함 |
| 4 | subagent-driven-development |
태스크당 서브에이전트 배치, 2단계 리뷰(스펙→코드 품질) |
| 5 | test-driven-development |
RED-GREEN-REFACTOR: 실패 테스트 → 최소 코드 → 커밋 |
| 6 | requesting-code-review |
계획 대비 리뷰, Critical 이슈는 진행 차단 |
| 7 | finishing-a-development-branch |
테스트 통과 확인, 머지/PR/유지/폐기 선택지 제시 |
🎯 실전 활용 시나리오
🟢 초기 작업 — 프로젝트 시작
"사용자 인증 시스템 만들어줘. 이메일/비밀번호 회원가입, JWT 기반 인증."
→ brainstorming이 자동 활성화. "세션 만료 정책은?", "OAuth 소셜 로그인도 필요한가?" 등 질문으로 요구사항 구체화 → 디자인 문서 작성 → git worktree 생성 → 계획 수립 단계로 진입.
🟡 중간 작업 — 기능 구현
"계획을 승인합니다. 구현을 시작해줘."
→ 서브에이전트가 각 태스크를 담당. 모든 코드 작성 전 실패 테스트 먼저(RED) → 최소한의 코드(GREEN) → 리팩토링. 테스트 없이 작성된 코드는 삭제된다. 각 태스크 완료 후 자동 코드 리뷰.
🔴 마무리 — 리뷰 및 머지
"모든 태스크가 완료되면 리뷰 후 머지해줘."
→ 전체 테스트 스위트 실행 → 결과 보고 → 머지/PR 생성/브랜치 유지/폐기 중 선택 → 워크트리 자동 정리.
4. GSD (Get Shit Done) — "컨텍스트를 절대 썩히지 않는다"
Lex Christopherson이 만든 GSD(GitHub 51K+ stars)는 컨텍스트 부패를 정면으로 해결한다. v1은 마크다운 프롬프트 모음이었지만, v2는 Pi SDK 기반 독립 CLI 애플리케이션으로 진화했다. LLM에게 "이렇게 해줘"라고 부탁하는 게 아니라, 프로그래밍적으로 에이전트 세션을 직접 제어한다.
🧠 핵심 설계 결정
단일 오케스트레이터 ❌ → 페이즈별 독립 오케스트레이터. 하나의 페이즈가 끝나면 상태를 디스크에 기록하고, 다음 페이즈는 새로운 200K 토큰 윈도우로 시작. 이전 쓰레기가 누적되지 않으므로 품질이 시간이 지나도 떨어지지 않는다.
작업 구조는 3계층이다:
Milestone 배포 가능한 버전 (4-10개 슬라이스)
└ Slice 데모 가능한 기능 하나 (1-7개 태스크)
└ Task 하나의 컨텍스트 윈도우에 들어가는 작업 단위
※ 철칙: 태스크 하나는 반드시 하나의 컨텍스트 윈도우 안에 들어가야 한다.
안 들어가면? → 두 개로 쪼갠다.
✅ 설치 방법
# npm으로 글로벌 설치
npm install -g gsd-pi@latest
# 설치 후 실행
gsd
# 첫 실행 시 LLM 프로바이더 선택 (20+개 지원)
/login
첫 실행 시 설정 마법사가 실행된다. LLM 프로바이더 선택(Anthropic, OpenAI, Google, OpenRouter 등), 도구 API 키 설정(Brave Search, Context7, Slack 등). 모든 단계 건너뛰기 가능.
📋 핵심 명령어
| 명령어 | 하는 일 |
|---|---|
/gsd |
스텝 모드 — 한 단위씩 실행, 사이사이 확인 |
/gsd auto |
자율 모드 — 리서치→계획→실행→검증→커밋 자동 반복. "실행하고 퇴근" |
/gsd discuss |
아키텍처·결정사항 토론 (auto 모드와 병행 가능) |
/gsd status |
진행 상황 대시보드 |
/gsd quick |
간단한 작업을 GSD 보증과 함께 빠르게 (계획 생략) |
/gsd ship |
검증된 페이즈 작업으로 자동 PR 생성 |
/gsd forensics |
auto 모드 실패 시 전체 디버거 접근 |
🔄 auto 모드가 하는 일 (내부 동작)
① 태스크마다 새 세션 — 200K 토큰 윈도우를 매번 새로 받는다. "간결하게 하겠습니다" 같은 타협 없음.
② 컨텍스트 사전 주입 — 태스크 플랜, 이전 태스크 요약, 결정 레지스터 등을 디스패치 프롬프트에 인라인. LLM이 파일 읽기에 토큰 낭비 안 함.
③ Git 격리 — 마일스톤별 독립 브랜치/워크트리. 완료 시 스쿼시 머지로 main에 클린 커밋 하나.
④ 크래시 복구 — 락 파일이 현재 유닛 추적. 세션이 죽으면 다음 /gsd auto가 복구 브리핑을 합성하여 재개.
⑤ 스턱 감지 — 반복되는 디스패치 패턴을 감지하면 1회 재시도 후 자동 중단 + 진단.
⑥ 비용 추적 — 페이즈/슬라이스/모델별 토큰·비용 기록. 예산 천장 도달 시 auto 모드 자동 일시정지.
🎯 실전 활용 시나리오
🟢 초기 작업 — 프로젝트 시작 및 토론
터미널 1: gsd → /gsd
"SaaS 결제 시스템을 만들고 싶어. Stripe 연동, 구독 관리, 인보이스 생성."
→ 프로젝트 토론 플로우 시작. 비전·제약조건·선호사항 질문 → PROJECT.md, DECISIONS.md, ROADMAP.md 자동 생성 → 마일스톤/슬라이스로 구조화된 로드맵 완성.
🟡 중간 작업 — 자율 실행 (두 터미널 전략)
터미널 1: /gsd auto ← 자율 모드, 자리 비움 OK
터미널 2: /gsd discuss ← 아키텍처 결정 토론 (병행 가능)
/gsd status ← 진행 확인
→ Plan → Execute → Complete → Reassess → Next Slice 자동 루프. 터미널 2의 결정은 다음 페이즈 경계에서 자동 반영. auto 모드를 멈출 필요 없음.
🔴 마무리 — 검증 및 배포
/gsd verify-work ← 수동 사용자 인수 테스트
/gsd ship ← 자동 PR 생성
→ validate-milestone 게이트가 로드맵 성공 기준 vs 실제 결과 비교. 통과 시 스쿼시 머지 → main에 클린 커밋 하나. HTML 리포트 자동 생성(진행 트리, 비용 메트릭, 실행 타임라인).
5. gstack — "혼자서 20인 팀처럼 일하기"
Y Combinator CEO Garry Tan이 만든 gstack(GitHub 71K+ stars)은 근본적으로 다른 접근이다. 단일 에이전트를 규율하는 대신, 23명의 전문가로 구성된 가상 팀을 모델링한다. CEO, 프로덕트 매니저, QA 리드, 엔지니어, 디자이너, 보안 리뷰어, 릴리즈 엔지니어 등 각 역할이 고유한 책임과 제약 조건을 가진다.
Garry Tan 본인이 YC 풀타임과 병행하면서 60일간 3개 프로덕션 서비스, 40+ 기능을 출시했다고 밝혔다. 핵심 원칙 "Boil the Lake(호수를 끓여라)"는 각 역할이 완벽하게 할 수 있는 것은 완수하고, 못하는 것은 건너뛴다는 뜻이다. 모든 것을 중간 수준으로 하느니, 적은 것을 완벽하게.
✅ 설치 방법
사전 요구사항: Claude Code + Git + Bun v1.0+
# Claude Code에서 아래를 붙여넣으면 자동 설치
git clone --single-branch --depth 1 \
https://github.com/garrytan/gstack.git \
~/.claude/skills/gstack \
&& cd ~/.claude/skills/gstack \
&& ./setup
# 팀 모드 (공유 레포에서 자동 업데이트)
(cd ~/.claude/skills/gstack && ./setup --team) \
&& ~/.claude/skills/gstack/bin/gstack-team-init required \
&& git add .claude/ CLAUDE.md \
&& git commit -m "require gstack for AI-assisted work"
📋 스프린트 순서대로 보는 핵심 명령어
gstack은 단순한 도구 모음이 아니라 프로세스다. Think → Plan → Build → Review → Test → Ship → Reflect 순서로 각 스킬이 이전 단계의 출력을 자동으로 읽어간다.
| 명령어 | 역할 | 하는 일 |
|---|---|---|
/office-hours |
YC 오피스아워 | 6개 핵심 질문으로 제품 재정의, 전제 도전, 구현 대안 생성 |
/plan-ceo-review |
CEO | 4가지 모드(확장/선택적확장/유지/축소)로 스코프 재검토 |
/plan-eng-review |
엔지니어링 매니저 | 아키텍처 잠금, 데이터 플로우 다이어그램, 엣지케이스 |
/autoplan |
리뷰 파이프라인 | CEO→디자인→엔지니어링 리뷰를 원커맨드로 자동 실행 |
/review |
스태프 엔지니어 | CI 통과하지만 프로덕션에서 터지는 버그 탐지, 자동 수정 |
/qa |
QA 리드 | 실제 Playwright 브라우저로 테스트, 버그 수정, 회귀 테스트 자동 생성 |
/cso |
보안 책임자 | OWASP Top 10 + STRIDE 위협 모델링 |
/ship |
릴리즈 엔지니어 | main 동기화, 테스트 실행, 커버리지 감사, PR 생성 |
/retro |
엔지니어링 매니저 | 주간 회고. 개인별 분석, 배포 스트릭, 테스트 건강도 |
🎯 실전 활용 시나리오
🟢 초기 작업 — 아이디어 검증
/office-hours
"캘린더 일정을 요약해주는 데일리 브리핑 앱을 만들고 싶어."
→ 6개 핵심 질문 ("실제로 겪는 고통이 뭔가요?", "구체적 사례는?"). 당신이 "데일리 브리핑 앱"이라고 했지만, gstack은 "당신이 만드려는 건 개인 비서 AI입니다"라고 재정의. 구현 접근법 3가지 + 디자인 문서 생성.
🟡 중간 작업 — 구현 및 리뷰
/autoplan ← CEO→디자인→엔지니어링 리뷰 자동 파이프라인
(코드 구현)
/review ← 프로덕션 버그 탐지 + 자동 수정
→ /autoplan이 CEO 리뷰(스코프 도전) → 디자인 리뷰(AI 슬롭 탐지) → 엔지니어링 리뷰(아키텍처 잠금, ASCII 데이터 플로우)를 자동으로 실행. 코드 구현 후 /review가 CI 통과하지만 프로덕션에서 터질 수 있는 문제를 잡는다.
🔴 마무리 — QA · 보안 · 배포
/qa https://staging.myapp.com ← 실제 브라우저 테스트
/cso ← 보안 감사
/ship ← 테스트 + 커버리지 감사 + PR
→ /qa가 실제 Chromium을 열어 클릭, 폼 입력, 페이지 전환을 수행하며 버그 발견 → 수정 → 회귀 테스트 자동 생성. /cso가 OWASP 기준 보안 감사(구체적 공격 시나리오 포함). /ship이 테스트 실행 + PR 생성까지 원커맨드.
6. 어떤 프레임워크를 선택해야 할까?
"최고의 프레임워크"는 없다. 본인의 가장 큰 실패 패턴이 선택 기준이다.
| 반복되는 문제 | 추천 | 이유 |
|---|---|---|
| 오늘 작동하던 코드가 내일 깨진다 | Superpowers | 모든 변경을 실패 테스트 → 통과로 강제 |
| 1시간 지나면 품질이 떨어진다 | GSD | 페이즈마다 새 컨텍스트, 이전 것은 버린다 |
| 요청 안 한 기능을 배포한다 | gstack | 엔지니어링 전에 제품 리뷰가 먼저 실행된다 |
| 위의 전부 다 | gstack + Superpowers | 하나의 프레임워크가 모든 걸 커버하진 못한다 |
💡 실전 선택 팁
Superpowers → 라이브러리·모듈 단위의 집중적인 개발. TDD가 자연스러운 애플리케이션 코드.
GSD → 수일~수주에 걸친 대규모 프로젝트. /gsd auto를 걸어놓고 자리를 비우는 워크플로우.
gstack → 기획~디자인~보안~QA~배포까지 전체 스프린트 관리. 특히 창업자-엔지니어에게 최적.
7. 설치 명령어 모아보기 (복붙용)
# ═══════════════════════════════════════════
# 1. Superpowers (Claude Code 플러그인)
# ═══════════════════════════════════════════
/plugin install superpowers@claude-plugins-official
# ═══════════════════════════════════════════
# 2. GSD (독립 CLI)
# ═══════════════════════════════════════════
npm install -g gsd-pi@latest
gsd # 실행
/login # 프로바이더 설정
/gsd # 스텝 모드
/gsd auto # 자율 모드
# ═══════════════════════════════════════════
# 3. gstack (Claude Code 스킬)
# ═══════════════════════════════════════════
git clone --single-branch --depth 1 \
https://github.com/garrytan/gstack.git \
~/.claude/skills/gstack \
&& cd ~/.claude/skills/gstack \
&& ./setup
8. 주의사항 & FAQ
⚠️ Superpowers — 장시간 세션 주의
단일 오케스트레이터 방식이라 매우 긴 세션(수십 개 파일)에서는 오케스트레이터 자체의 컨텍스트가 찰 수 있다. 대부분의 프로젝트에선 문제 없지만, 마라톤 세션은 주의.
⚠️ GSD — 작은 작업엔 오버킬
단일 파일 수정이나 간단한 스크립트에는 페이즈 기반 워크플로우가 과하다. 이 경우 /gsd quick을 사용.
⚠️ gstack — 순수 인프라 작업에는 무거움
23개 역할 중 프로덕트 매니저, 디자이너 등은 인프라 프로비저닝에서 불필요. 제품을 만드는 게 아니라 인프라만 다룬다면 오버헤드가 있다.
| 질문 | 답변 |
|---|---|
| 세 개를 동시에 쓸 수 있나? | 가능하지만 권장하지 않는다. gstack(방향) + Superpowers(TDD) 조합이 가장 현실적이다. |
| Claude Code 외 다른 에이전트에서도 되나? | Superpowers: 6개(Cursor, Codex, Gemini CLI 등). GSD: 14개+ (가장 넓음). gstack: 10개. |
| 비용이 드나? | 세 프레임워크 모두 MIT 라이선스, 무료. LLM API 비용만 기존과 동일하게 발생. |
| 어떤 걸 먼저 시도해볼까? | 가장 가벼운 건 Superpowers(플러그인 한 줄). 가장 강력한 자동화는 GSD auto. 가장 넓은 커버리지는 gstack. |
'AI > Claude' 카테고리의 다른 글
| Claude Code와 Codex 함께 쓰는 법: Obsidian LLM Wiki 세팅부터 실전 워크플로우까지 (0) | 2026.04.28 |
|---|---|
| Claude Desktop + Figma Desktop양방향 디자인 워크플로우 (0) | 2026.04.25 |
| GStack + Superpowers 조합 세팅 가이드 (0) | 2026.04.16 |
| Claude Desktop 신규 업데이트 정리 (0) | 2026.04.16 |
| Impeccable 완벽 가이드 (0) | 2026.04.16 |