02-query-engine

Inkdown

Start writing

Shared from "Claude-Code" on Inkdown

Query Engine & API Layer

The heart of Claude Code — how it talks to the AI model, streams responses, executes tools, and manages context.

The Query Loop (`query.ts`)

Location: src/query.ts (1500+ lines)

This is the most important file in the codebase. Every AI interaction goes through this loop.

The Loop, Simplified

TypeScript

Error	Recovery Strategy
Prompt too long (413)	1. Drain staged context collapses 2. Reactive compact (summarize) 3. Surface error if both fail
Max output tokens	1. Escalate to 64k output (once) 2. Inject "resume mid-thought" message 3. Retry up to 3 times
Model fallback	Switch to fallback model, strip thinking signatures, retry
Media size error	Reactive compact strips oversized media, retries

File	Purpose
`src/query.ts`	The query loop — model calls, tool execution, recovery
`src/QueryEngine.ts`	High-level query orchestration
`src/query/config.ts`	Query configuration snapshot
`src/query/deps.ts`	Dependency injection for query (callModel, compact, etc.)
`src/query/transitions.ts`	Continue/terminal state types
`src/query/tokenBudget.ts`	Per-turn token budget tracking
`src/query/stopHooks.ts`	Post-turn hooks (dream, PR review, etc.)
`src/services/api/claude.ts`	Anthropic API client, streaming
`src/services/api/bootstrap.ts`	Bootstrap data fetching
`src/services/api/filesApi.ts`	File download/upload API
`src/services/api/withRetry.ts`	Retry logic with exponential backoff
`src/services/tools/toolOrchestration.ts`	Tool execution orchestration
`src/services/tools/StreamingToolExecutor.ts`	Parallel tool execution
`src/services/compact/compact.ts`	Auto-compaction
`src/services/compact/autoCompact.ts`	Auto-compact trigger logic
`src/services/compact/microcompact.ts`	Micro-compaction
`src/services/compact/reactiveCompact.ts`	Reactive compact (on 413)
`src/services/compact/snipCompact.ts`	Snip compact (remove old messages)
`src/services/contextCollapse/`	Context collapse service
`src/services/toolUseSummary/`	Tool use summary generation

02-query-engine

Query Engine & API Layer

The Query Loop (`query.ts`)

The Loop, Simplified

02-query-engine

Query Engine & API Layer

The Query Loop (`query.ts`)

The Loop, Simplified

Key Concepts

Token Budget

Streaming Tool Execution

Recovery Mechanisms

Context Management

Compaction Strategies

1. Snip (`snipCompact.ts`)

2. Micro-Compact

3. Context Collapse

4. Auto-Compact

5. Reactive Compact (feature flag)

API Layer (`services/api/`)

Claude API Client (`claude.ts`)

Streaming

Retry & Fallback

Prompt Caching

Tool Execution (`services/tools/`)

StreamingToolExecutor

Tool Permission Flow

QueryEngine.ts

Query Configuration (`query/config.ts`)

Token Estimation (`services/tokenEstimation.ts`)

Key Files Reference

02-query-engine

Query Engine & API Layer

The Query Loop (query.ts)

The Loop, Simplified

02-query-engine

Query Engine & API Layer

The Query Loop (query.ts)

The Loop, Simplified

Key Concepts

Token Budget

Streaming Tool Execution

Recovery Mechanisms

Context Management

Compaction Strategies

1. Snip (snipCompact.ts)

2. Micro-Compact

3. Context Collapse

4. Auto-Compact

5. Reactive Compact (feature flag)

API Layer (services/api/)

Claude API Client (claude.ts)

Streaming

Retry & Fallback

Prompt Caching

Tool Execution (services/tools/)

StreamingToolExecutor

Tool Permission Flow

QueryEngine.ts

Query Configuration (query/config.ts)

Token Estimation (services/tokenEstimation.ts)

Key Files Reference

The Query Loop (`query.ts`)

The Query Loop (`query.ts`)

1. Snip (`snipCompact.ts`)

API Layer (`services/api/`)

Claude API Client (`claude.ts`)

Tool Execution (`services/tools/`)

Query Configuration (`query/config.ts`)

Token Estimation (`services/tokenEstimation.ts`)