AI Search (RAG)

Canonical scenario page for retrieval-augmented generation workloads dominated by context injection.

AI Search with RAG (High Context)

Variable usage pattern

Semantic search over large document collections with heavy context injection per query.

Model: GPT-5

Robust reasoning across long context windows, where retrieval quality matters more than raw throughput.

Expected

$18,000–$22,000 / mo

Spiky / peak usage

$30,000–$38,000 / mo

Breaks when context exceeds ~15k tokens per query or when retrieval relevance is poorly ranked.