Context Compaction & Memory Management
Overview
Claude Code handles massive conversations that can exceed LLM context limits. The compaction system intelligently summarizes old messages to free up tokens while preserving critical information.
Plain text
┌─────────────────────────────────────────────────────────────────────────────┐
│ CONTEXT WINDOW MANAGEMENT │
├─────────────────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ CONTEXT WINDOW │ │
│ │ │ │
│ │ [System Prompt] ............... 500 tokens │ │
│ │ │ │
│ │ [Old Messages] ................ 10,000 tokens │ │
│ │ ↓ │ │
│ │ ┌─────────────────────────────────────────────────────────────┐ │ │
│ │ │ COMPACTED (Summary) ......... 500 tokens │ │ │
│ │ │ "Previously discussed: API design, chose REST over GraphQL" │ │ │
│ │ └─────────────────────────────────────────────────────────────┘ │ │
│ │ │ │
│ │ [Recent Messages] ............. 2,000 tokens │ │
│ │ (Full fidelity, not compacted) │ │
│ │ │ │
│ │ [Tool Results Pending] ........ 500 tokens │ │
│ │ │ │
│ │ ───────────────────────────────────────────── │ │
│ │ TOTAL: ~3,500 / 200,000 tokens (Claude 4.6 limit) │ │
│ │ │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ COMPACTION TRIGGERS │ │
│ │ │ │
│ │ 1. TOKEN THRESHOLD > 80% of context window │ │
│ │ 2. USER COMMAND /compact │ │
│ │ 3. AUTO-COMPACT Enabled in settings │ │
│ │ 4. ERROR RECOVERY prompt_too_long error │ │
│ │ 5. HISTORY SNIP Long sessions (HISTORY_SNIP feature) │ │
│ │ │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────────────────┘