OpenClaw 在实际使用中出现的高 Token 消耗与账单失控问题,系统拆解成本结构,并给出一套可直接落地的降本优化方案。通过分析 Token 消耗公式与上下文膨胀根源,重点介绍 QMD 记忆后端、Prompt Caching、记忆清理机制、Workspace 精简策略、模型分级使用以及子 Agent 隔离等核心优化手段。实测显示,合理配置后整体成本可降低 90% 以上,长期运行场景可达到 95%–97% 的综合节省效果。文章兼顾原理说明与配置示例,适用于个人开发者与企业级 Agent 运维场景。