🔥 불타는 고구미 블로그

일상을 맛있게
기록하는 곳

개발 · 맛집 · 여행 · 취미까지
모든 기록을 따뜻하게 담아냅니다.

불타는 고구미 캐릭터
불타는 고구미 🍠🔥

최근 글

새롭게 올라온 기록들을 확인해보세요.

/ AI/Claude
AI/Claude

Claude Code 3대 프레임워크 완벽 가이드 — Superpowers vs GSD vs gstack, 설치부터 실전 워크플로우까지

반응형

2026년 4월 기준

Claude Code 3대 프레임워크 완벽 비교

설치부터 실전 워크플로우까지 — Superpowers · GSD · gstack 공식 GitHub 기반 총정리

1. 왜 프레임워크가 필요한데?

Claude Code는 처음 30분은 인상적이다. 그 이후부터 문제가 시작된다.

패턴은 예측 가능할 만큼 반복된다. 이 세 가지 문제를 각기 다른 방향에서 해결하는 프레임워크가 독립적으로 등장했다.

🧠 컨텍스트 부패(Context Rot) — 200K 토큰 윈도우가 차면서 초기 지시사항을 잊어버린다. 2시간 전에 요청한 보안 설정이 슬그머니 사라진다.

🧪 테스트 부재 — 그럴듯한 코드를 쏟아내지만 테스트는 안 쓴다. 기능 하나 추가하면 기존 두 개가 조용히 깨진다.

🎯 스코프 드리프트 — 서브넷 3개를 요청하면 NAT 게이트웨이, VPN, DNS 리졸버까지 덤으로 만든다. 요청하지 않은 인프라의 월 청구서가 날아온다.

2. 3대 프레임워크 한눈에 비교

항목 Superpowers GSD gstack
핵심 철학 테스트 주도 개발(TDD) 강제 컨텍스트 부패 방지 역할 기반 거버넌스(23인 팀)
제작자 Jesse Vincent Lex Christopherson Garry Tan (YC CEO)
GitHub Stars 149K+ 51K+ 71K+
오케스트레이션 단일 오케스트레이터 + 서브에이전트 페이즈별 독립 오케스트레이터 23개 전문 역할 분리
컨텍스트 관리 하나의 윈도우 디스크 저장 → 페이즈마다 초기화 역할별 범위 한정 핸드오프
설치 형태 Claude Code 플러그인 독립 CLI (npm) Claude Code 스킬
지원 에이전트 6개 14개+ 10개
최적 사용처 테스트 규율이 필요한 솔로 개발 수일~수주의 대규모 프로젝트 기획~배포 전체 스프린트 관리
💡 팁: 세 프레임워크 모두 MIT 라이선스, 무료다. 하나를 골라 프로젝트 하나에 적용하면 1시간 내로 본인에게 맞는지 알 수 있다.

3. Superpowers — "테스트 없이는 코드도 없다"

Jesse Vincent이 만든 Superpowers(GitHub 149K+ stars)는 AI 코딩 에이전트에 테스트 주도 개발(TDD)을 강제하는 프레임워크다. 핵심 원칙은 하나: "프로덕션 코드는 실패하는 테스트를 통과시키기 위해서만 존재한다."

에이전트가 코드부터 쓰려는 충동을 억제한다. 대신 7단계 게이트를 강제하고, 단계를 건너뛸 수 없다. 특히 서브에이전트 기반 개발이 핵심인데, 메인 오케스트레이터가 전체 흐름을 관리하면서 각 구현 태스크를 격리된 서브에이전트에 위임한다. Claude가 개입 없이 수 시간 동안 자율 작업하는 게 가능한 이유다.

실제 사례: chardet 라이브러리 메인테이너가 Superpowers로 v7.0.0을 처음부터 재작성하여 41배 성능 향상을 달성했다. 41%가 아니라 41x다.

✅ 설치 방법

# 방법 1: Claude Code 공식 마켓플레이스 (권장)
/plugin install superpowers@claude-plugins-official

# 방법 2: Superpowers 자체 마켓플레이스
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace

설치 끝. 별도 설정 없이 스킬이 자동 트리거된다. 코딩을 시작하면 brainstorming부터 안내한다.

📋 7단계 워크플로우

단계 스킬 하는 일
1 brainstorming 소크라테스식 질문으로 아이디어 정제, 디자인 문서 저장
2 using-git-worktrees 새 브랜치에 격리 워크스페이스 생성, 테스트 베이스라인 확인
3 writing-plans 2~5분 단위 태스크 분해, 정확한 파일 경로와 코드 포함
4 subagent-driven-development 태스크당 서브에이전트 배치, 2단계 리뷰(스펙→코드 품질)
5 test-driven-development RED-GREEN-REFACTOR: 실패 테스트 → 최소 코드 → 커밋
6 requesting-code-review 계획 대비 리뷰, Critical 이슈는 진행 차단
7 finishing-a-development-branch 테스트 통과 확인, 머지/PR/유지/폐기 선택지 제시

🎯 실전 활용 시나리오

🟢 초기 작업 — 프로젝트 시작

"사용자 인증 시스템 만들어줘. 이메일/비밀번호 회원가입, JWT 기반 인증."

→ brainstorming이 자동 활성화. "세션 만료 정책은?", "OAuth 소셜 로그인도 필요한가?" 등 질문으로 요구사항 구체화 → 디자인 문서 작성 → git worktree 생성 → 계획 수립 단계로 진입.

🟡 중간 작업 — 기능 구현

"계획을 승인합니다. 구현을 시작해줘."

→ 서브에이전트가 각 태스크를 담당. 모든 코드 작성 전 실패 테스트 먼저(RED) → 최소한의 코드(GREEN) → 리팩토링. 테스트 없이 작성된 코드는 삭제된다. 각 태스크 완료 후 자동 코드 리뷰.

🔴 마무리 — 리뷰 및 머지

"모든 태스크가 완료되면 리뷰 후 머지해줘."

→ 전체 테스트 스위트 실행 → 결과 보고 → 머지/PR 생성/브랜치 유지/폐기 중 선택 → 워크트리 자동 정리.

4. GSD (Get Shit Done) — "컨텍스트를 절대 썩히지 않는다"

Lex Christopherson이 만든 GSD(GitHub 51K+ stars)는 컨텍스트 부패를 정면으로 해결한다. v1은 마크다운 프롬프트 모음이었지만, v2는 Pi SDK 기반 독립 CLI 애플리케이션으로 진화했다. LLM에게 "이렇게 해줘"라고 부탁하는 게 아니라, 프로그래밍적으로 에이전트 세션을 직접 제어한다.

🧠 핵심 설계 결정

단일 오케스트레이터 ❌ → 페이즈별 독립 오케스트레이터. 하나의 페이즈가 끝나면 상태를 디스크에 기록하고, 다음 페이즈는 새로운 200K 토큰 윈도우로 시작. 이전 쓰레기가 누적되지 않으므로 품질이 시간이 지나도 떨어지지 않는다.

작업 구조는 3계층이다:

Milestone    배포 가능한 버전 (4-10개 슬라이스)
  └ Slice    데모 가능한 기능 하나 (1-7개 태스크)
      └ Task    하나의 컨텍스트 윈도우에 들어가는 작업 단위

※ 철칙: 태스크 하나는 반드시 하나의 컨텍스트 윈도우 안에 들어가야 한다.
   안 들어가면? → 두 개로 쪼갠다.

✅ 설치 방법

# npm으로 글로벌 설치
npm install -g gsd-pi@latest

# 설치 후 실행
gsd

# 첫 실행 시 LLM 프로바이더 선택 (20+개 지원)
/login

첫 실행 시 설정 마법사가 실행된다. LLM 프로바이더 선택(Anthropic, OpenAI, Google, OpenRouter 등), 도구 API 키 설정(Brave Search, Context7, Slack 등). 모든 단계 건너뛰기 가능.

📋 핵심 명령어

명령어 하는 일
/gsd 스텝 모드 — 한 단위씩 실행, 사이사이 확인
/gsd auto 자율 모드 — 리서치→계획→실행→검증→커밋 자동 반복. "실행하고 퇴근"
/gsd discuss 아키텍처·결정사항 토론 (auto 모드와 병행 가능)
/gsd status 진행 상황 대시보드
/gsd quick 간단한 작업을 GSD 보증과 함께 빠르게 (계획 생략)
/gsd ship 검증된 페이즈 작업으로 자동 PR 생성
/gsd forensics auto 모드 실패 시 전체 디버거 접근

🔄 auto 모드가 하는 일 (내부 동작)

① 태스크마다 새 세션 — 200K 토큰 윈도우를 매번 새로 받는다. "간결하게 하겠습니다" 같은 타협 없음.

② 컨텍스트 사전 주입 — 태스크 플랜, 이전 태스크 요약, 결정 레지스터 등을 디스패치 프롬프트에 인라인. LLM이 파일 읽기에 토큰 낭비 안 함.

③ Git 격리 — 마일스톤별 독립 브랜치/워크트리. 완료 시 스쿼시 머지로 main에 클린 커밋 하나.

④ 크래시 복구 — 락 파일이 현재 유닛 추적. 세션이 죽으면 다음 /gsd auto가 복구 브리핑을 합성하여 재개.

⑤ 스턱 감지 — 반복되는 디스패치 패턴을 감지하면 1회 재시도 후 자동 중단 + 진단.

⑥ 비용 추적 — 페이즈/슬라이스/모델별 토큰·비용 기록. 예산 천장 도달 시 auto 모드 자동 일시정지.

🎯 실전 활용 시나리오

🟢 초기 작업 — 프로젝트 시작 및 토론

터미널 1: gsd → /gsd
"SaaS 결제 시스템을 만들고 싶어. Stripe 연동, 구독 관리, 인보이스 생성."

→ 프로젝트 토론 플로우 시작. 비전·제약조건·선호사항 질문 → PROJECT.md, DECISIONS.md, ROADMAP.md 자동 생성 → 마일스톤/슬라이스로 구조화된 로드맵 완성.

🟡 중간 작업 — 자율 실행 (두 터미널 전략)

터미널 1: /gsd auto        ← 자율 모드, 자리 비움 OK
터미널 2: /gsd discuss     ← 아키텍처 결정 토론 (병행 가능)
          /gsd status      ← 진행 확인

→ Plan → Execute → Complete → Reassess → Next Slice 자동 루프. 터미널 2의 결정은 다음 페이즈 경계에서 자동 반영. auto 모드를 멈출 필요 없음.

🔴 마무리 — 검증 및 배포

/gsd verify-work    ← 수동 사용자 인수 테스트
/gsd ship           ← 자동 PR 생성

→ validate-milestone 게이트가 로드맵 성공 기준 vs 실제 결과 비교. 통과 시 스쿼시 머지 → main에 클린 커밋 하나. HTML 리포트 자동 생성(진행 트리, 비용 메트릭, 실행 타임라인).

5. gstack — "혼자서 20인 팀처럼 일하기"

Y Combinator CEO Garry Tan이 만든 gstack(GitHub 71K+ stars)은 근본적으로 다른 접근이다. 단일 에이전트를 규율하는 대신, 23명의 전문가로 구성된 가상 팀을 모델링한다. CEO, 프로덕트 매니저, QA 리드, 엔지니어, 디자이너, 보안 리뷰어, 릴리즈 엔지니어 등 각 역할이 고유한 책임과 제약 조건을 가진다.

Garry Tan 본인이 YC 풀타임과 병행하면서 60일간 3개 프로덕션 서비스, 40+ 기능을 출시했다고 밝혔다. 핵심 원칙 "Boil the Lake(호수를 끓여라)"는 각 역할이 완벽하게 할 수 있는 것은 완수하고, 못하는 것은 건너뛴다는 뜻이다. 모든 것을 중간 수준으로 하느니, 적은 것을 완벽하게.

✅ 설치 방법

사전 요구사항: Claude Code + Git + Bun v1.0+

# Claude Code에서 아래를 붙여넣으면 자동 설치
git clone --single-branch --depth 1 \
  https://github.com/garrytan/gstack.git \
  ~/.claude/skills/gstack \
  && cd ~/.claude/skills/gstack \
  && ./setup

# 팀 모드 (공유 레포에서 자동 업데이트)
(cd ~/.claude/skills/gstack && ./setup --team) \
  && ~/.claude/skills/gstack/bin/gstack-team-init required \
  && git add .claude/ CLAUDE.md \
  && git commit -m "require gstack for AI-assisted work"

📋 스프린트 순서대로 보는 핵심 명령어

gstack은 단순한 도구 모음이 아니라 프로세스다. Think → Plan → Build → Review → Test → Ship → Reflect 순서로 각 스킬이 이전 단계의 출력을 자동으로 읽어간다.

명령어 역할 하는 일
/office-hours YC 오피스아워 6개 핵심 질문으로 제품 재정의, 전제 도전, 구현 대안 생성
/plan-ceo-review CEO 4가지 모드(확장/선택적확장/유지/축소)로 스코프 재검토
/plan-eng-review 엔지니어링 매니저 아키텍처 잠금, 데이터 플로우 다이어그램, 엣지케이스
/autoplan 리뷰 파이프라인 CEO→디자인→엔지니어링 리뷰를 원커맨드로 자동 실행
/review 스태프 엔지니어 CI 통과하지만 프로덕션에서 터지는 버그 탐지, 자동 수정
/qa QA 리드 실제 Playwright 브라우저로 테스트, 버그 수정, 회귀 테스트 자동 생성
/cso 보안 책임자 OWASP Top 10 + STRIDE 위협 모델링
/ship 릴리즈 엔지니어 main 동기화, 테스트 실행, 커버리지 감사, PR 생성
/retro 엔지니어링 매니저 주간 회고. 개인별 분석, 배포 스트릭, 테스트 건강도

🎯 실전 활용 시나리오

🟢 초기 작업 — 아이디어 검증

/office-hours
"캘린더 일정을 요약해주는 데일리 브리핑 앱을 만들고 싶어."

→ 6개 핵심 질문 ("실제로 겪는 고통이 뭔가요?", "구체적 사례는?"). 당신이 "데일리 브리핑 앱"이라고 했지만, gstack은 "당신이 만드려는 건 개인 비서 AI입니다"라고 재정의. 구현 접근법 3가지 + 디자인 문서 생성.

🟡 중간 작업 — 구현 및 리뷰

/autoplan       ← CEO→디자인→엔지니어링 리뷰 자동 파이프라인
(코드 구현)
/review         ← 프로덕션 버그 탐지 + 자동 수정

→ /autoplan이 CEO 리뷰(스코프 도전) → 디자인 리뷰(AI 슬롭 탐지) → 엔지니어링 리뷰(아키텍처 잠금, ASCII 데이터 플로우)를 자동으로 실행. 코드 구현 후 /review가 CI 통과하지만 프로덕션에서 터질 수 있는 문제를 잡는다.

🔴 마무리 — QA · 보안 · 배포

/qa https://staging.myapp.com    ← 실제 브라우저 테스트
/cso                              ← 보안 감사
/ship                             ← 테스트 + 커버리지 감사 + PR

→ /qa가 실제 Chromium을 열어 클릭, 폼 입력, 페이지 전환을 수행하며 버그 발견 → 수정 → 회귀 테스트 자동 생성. /cso가 OWASP 기준 보안 감사(구체적 공격 시나리오 포함). /ship이 테스트 실행 + PR 생성까지 원커맨드.

6. 어떤 프레임워크를 선택해야 할까?

"최고의 프레임워크"는 없다. 본인의 가장 큰 실패 패턴이 선택 기준이다.

반복되는 문제 추천 이유
오늘 작동하던 코드가 내일 깨진다 Superpowers 모든 변경을 실패 테스트 → 통과로 강제
1시간 지나면 품질이 떨어진다 GSD 페이즈마다 새 컨텍스트, 이전 것은 버린다
요청 안 한 기능을 배포한다 gstack 엔지니어링 전에 제품 리뷰가 먼저 실행된다
위의 전부 다 gstack + Superpowers 하나의 프레임워크가 모든 걸 커버하진 못한다

💡 실전 선택 팁

Superpowers → 라이브러리·모듈 단위의 집중적인 개발. TDD가 자연스러운 애플리케이션 코드.

GSD → 수일~수주에 걸친 대규모 프로젝트. /gsd auto를 걸어놓고 자리를 비우는 워크플로우.

gstack → 기획~디자인~보안~QA~배포까지 전체 스프린트 관리. 특히 창업자-엔지니어에게 최적.

7. 설치 명령어 모아보기 (복붙용)

# ═══════════════════════════════════════════
# 1. Superpowers (Claude Code 플러그인)
# ═══════════════════════════════════════════
/plugin install superpowers@claude-plugins-official

# ═══════════════════════════════════════════
# 2. GSD (독립 CLI)
# ═══════════════════════════════════════════
npm install -g gsd-pi@latest
gsd              # 실행
/login           # 프로바이더 설정
/gsd             # 스텝 모드
/gsd auto        # 자율 모드

# ═══════════════════════════════════════════
# 3. gstack (Claude Code 스킬)
# ═══════════════════════════════════════════
git clone --single-branch --depth 1 \
  https://github.com/garrytan/gstack.git \
  ~/.claude/skills/gstack \
  && cd ~/.claude/skills/gstack \
  && ./setup

8. 주의사항 & FAQ

⚠️ Superpowers — 장시간 세션 주의
단일 오케스트레이터 방식이라 매우 긴 세션(수십 개 파일)에서는 오케스트레이터 자체의 컨텍스트가 찰 수 있다. 대부분의 프로젝트에선 문제 없지만, 마라톤 세션은 주의.

⚠️ GSD — 작은 작업엔 오버킬
단일 파일 수정이나 간단한 스크립트에는 페이즈 기반 워크플로우가 과하다. 이 경우 /gsd quick을 사용.

⚠️ gstack — 순수 인프라 작업에는 무거움
23개 역할 중 프로덕트 매니저, 디자이너 등은 인프라 프로비저닝에서 불필요. 제품을 만드는 게 아니라 인프라만 다룬다면 오버헤드가 있다.

질문 답변
세 개를 동시에 쓸 수 있나? 가능하지만 권장하지 않는다. gstack(방향) + Superpowers(TDD) 조합이 가장 현실적이다.
Claude Code 외 다른 에이전트에서도 되나? Superpowers: 6개(Cursor, Codex, Gemini CLI 등). GSD: 14개+ (가장 넓음). gstack: 10개.
비용이 드나? 세 프레임워크 모두 MIT 라이선스, 무료. LLM API 비용만 기존과 동일하게 발생.
어떤 걸 먼저 시도해볼까? 가장 가벼운 건 Superpowers(플러그인 한 줄). 가장 강력한 자동화는 GSD auto. 가장 넓은 커버리지는 gstack.
<p
728x90
반응형