Back to Articles
Feb 23, 20261 day ago

AI Agents Are Not Magic: 7 Pivots from Burning Tokens to Truly Usable Tools

Y
Yanhua@yanhua1010

AI Summary

This article offers a crucial reality check for anyone using powerful AI agent frameworks like OpenClaw, Claude Code, or AutoGPT, transforming them from frustrating "token burners" into genuinely productive partners. It cuts through the hype of viral demos to reveal the practical, often overlooked configurations required for reliable performance, starting with the single most impactful change you can make to slash costs. The guide argues that the secret isn't a magical prompt, but a strategic approach involving layered model usage, extensive rule-setting, and a fundamental shift in how we conceptualize an agent's workflow. The core insights provide a roadmap to efficiency, explaining how to implement a tiered model strategy to stop using expensive AI for trivial tasks, why your agent needs a comprehensive "rulebook" to avoid chaotic loops, and the critical difference between a chat session and scheduled autonomous work. It emphasizes starting small with a single, end-to-end process, the necessity of persistently saving working methods, and how choosing the right model for tool-calling is more important than raw conversational flair. Ultimately, it reassures readers that initial struggles are normal, framing the process as akin to training a new employee rather than operating a finished product. If you've ever been stunned by a monthly bill or spent hours debugging an agent that seemed to work perfectly for others, this article is your essential troubleshooting manual. Read the full piece to discover the detailed configurations, specific commands, and mindset shifts that will help you harness these powerful tools effectively and economically.

OpenClaw 这东西,理论上特别牛。但想从里面真正榨出价值来,是需要一些窍门的。

今天在Reddit看到有人发一篇实操作过程中总结出来的经验,讲的是怎么把它从一个让人抓狂的「Token 燃烧器」变成真正能干活的工具。而且这些经验不只适用于 OpenClaw,用 Claude Code、AutoGPT 或者其他智能体框架的朋友,一样能用得上。

1. 别让最贵的模型干所有活

这是大家犯的最大的错,也是账单炸裂的头号元凶。

默认情况下,OpenClaw 会把每一个请求都丢给你设的主模型。这里面包括:

心跳检测: 每 30 分钟一次的「你还活着吗」轮询

子智能体: 主智能体并行工作时自动启动的

随手一问: 比如「我日历上有什么」

真正烧脑的编码任务

如果你的主模型是 Claude Opus 或 GPT-5.2,那连心跳检测都在烧你最贵的额度。

打个比方: 用 Opus 处理心跳检测,就像请了个大律师来帮你看信箱。能干吗?能。有必要吗?真没有。

怎么搞

设置分层模型配置。便宜快速的模型当主力,聪明(贵)的模型当后备,只在真正需要的时候上。

设好 alias 之后,聊天中随时可以切模型:输入 /model Opus 切到 Opus 干硬活,完事后 /model Haiku 切回来省钱。

有人就靠这一个改动,单次请求 Token 从 20k-40k 降到了 1.5k。月账单从 300 美元直接变 30 美元。 十倍差距,就差一个配置。

2. 你的智能体需要规则,而且是很多规则

开箱即用的 OpenClaw 就是一张白纸。它完全不知道你想让它怎么干活,所以会各种抽风:陷入死循环、翻来覆去说同样的话、忘掉之前的任务、做出莫名其妙的决定,Token 就这么白白烧掉了。

这很正常。 你在网上看到那些炫酷演示,什么智能体一晚上搞定一个 App、像真人助手一样管邮件,背后都有一个你看不到的东西:大量定制化的指令集。

怎么加规则

OpenClaw 用的是 Skills(技能) 机制,就是包含 SKILL.md 指令文件的文件夹。你可以把技能理解成某个任务的「规则手册」。

规则写什么?下面这些都是实战中总结出来的:

你可以建任意多个技能文件夹(邮件处理、编码规范、日历管理,随你)。

一个高级玩法: 让智能体自己写规则。对它说:「回顾我们过去 10 条消息,看看出了什么问题,帮我写几条规则来避免。」然后把它的建议直接存成技能文件。用 AI 训练 AI,杠杆才算用对了。

3.「让它通宵干活」不是你以为的那样

这是最普遍的一个误解:「我把任务布置好去睡觉,智能体会自己干一整晚。」

但真相其实是: 当你跟 OpenClaw 聊天时,对话是在一个会话(Session)里的。你关掉聊天或者走开,会话就结束了。智能体不是在「后台持续工作」,它就是停了。

想让智能体按计划自动干活,你需要定时任务(Cron Jobs)。

Cron Job 是啥

简单说,就是智能体的闹钟。你定好时间,到点它自动启动一个全新的、独立的会话来执行任务,干完把结果发给你。

最简单的用法是直接在聊天里让智能体帮你建:

「创建一个每天早上 7 点运行的定时任务。检查我的紧急邮件,总结前 3 项,通过 Telegram 发给我。用 sessionTarget: 'isolated' 让它独立运行。」

也可以自己编辑配置文件:

关键就是 "sessionTarget": "isolated",这告诉系统起一个独立会话,不管你在不在线都能跑。

几个常用的 Cron 表达式:

| 表达式 | 啥意思 |

| 0 7 * | 每天早上 7 点 |

| 0 /2 | 每 2 小时一次 |

| /30 * | 每 30 分钟一次 |

| 0 9 1-5 | 工作日早上 9 点 |

| 0 22 * | 每天晚上 10 点 |

如果你需要的是一次性任务(比如「今晚帮我把这个 App 搞出来」),有两个办法:

办法 A: 让智能体建个定时任务,跑完手动删。

办法 B: 搞个任务队列,比如建一个文本文件,让定时任务每 30 分钟去检查有没有新任务。

4. 从一个小任务开始,做到端到端跑通

一口气把邮件 + 日历 + Telegram + 网页爬取 + 定时任务全设上,想想就激动。

其实正确做法:

每加一个集成就多一个出错的地方。两个集成之间的交互 bug 能让你排查一整天,最后啥正事都没干成。

靠谱的路径

挑一个特别小的流程。 比如「每天早上 8 点检查天气,发消息给我」。

把它做到完美。 端到端可靠运行,不需要任何手动干预。

稳定了再加下一项。 比如邮件检查。

逐层累加。

调试小技巧: 用 openclaw doctor --fix 命令。它能自动验证配置、做必要的迁移、修复常见问题。

5. 管用的方法赶紧存下来,以后一定用得着

OpenClaw 用压缩(Compaction)来管理记忆。对话越来越长时,它会自动总结旧消息来腾出上下文窗口的空间。结果就是:你之前折腾半天才搞定的配置、做过的决策,可能一压缩就全没了。

怎么应对

用状态文件。 状态文件是智能体可以读写的持久文件,不会被压缩掉。

对智能体说:「把当前项目状态存到状态文件 ~/.openclaw/workspace/memory/project-status.md 里。包括已完成的、进行中的、做过的决定、下一步计划。」

用工作区文档。 工作区里有几个特殊文件,智能体每次启动都会自动读取:

| 文件 | 干嘛用的 |

| USER.md | 你的偏好、时区、做事风格 |

| AGENTS.md | 智能体的行为准则 |

| TOOLS.md | 哪些工具怎么用 |

| HEARTBEAT.md | 心跳轮询时该检查什么 |

一句话原则: 凡是花了你超过 5 分钟才调通的东西,赶紧写下来。你一定会再用到,而智能体一定会忘。

6. 模型选得对不对,比什么都重要

大部分人对 OpenClaw 的挫败感,根源不在配置,而在模型不行。

OpenClaw 不是聊天机器人,是智能体。它需要精准地调用浏览器、文件系统、终端命令、各种 API。一个模型文字写得再漂亮,如果工具调用的格式老出错,整个系统照样崩。

另外,模型至少得有 64,000 Token 的上下文窗口,不然容易溢出导致冻住。

各模型表现参考

| 模型 | 工具调用 | 成本 | 备注 |

| Claude Opus 4.6 | 极佳 | $$$ | 质量最高,当主模型太贵 |

| Claude Sonnet 4.5 | 极佳 | $$ | 全能选手,最佳后备 |

| Claude Haiku 4.5 | 良好 | $ | 便宜,适合心跳和简单活 |

| GPT-5.2 | 良好 | $$ | 稳健的备用选择 |

| MiniMax M2.1 | 良好 | $ | API 性价比高,社区热门 |

| Kimi K2 (API) | 良好 | $ | 工具调用能力强 |

| Gemini 3 Flash | 尚可 | ¢ | 极快(~250 tok/s),适合子智能体 |

| DeepSeek V3.2 | 尚可 | ¢ | 便宜。别用 Reasoner 版本,工具调用容易出错 |

| GPT-5.1 Mini | 较弱 | ¢ | 极便宜,但干智能体的活很吃力 |

关于本地模型: 如果你有好显卡(16GB+ 显存),可以用 Ollama 或 LM Studio 跑本地模型。建议拿本地模型(比如 Qwen3 8B 或 30B)当日常主力,把云端模型(Sonnet 4.5)留给啃不动的硬骨头。本地 + 云端混合,是目前最划算的方案。

7. 你没有问题,是这件事本身就挺难的

如果你折腾了两周,感觉一事无成。

放心,你不孤单,也没做错什么。

OpenClaw 不是成品。它是一个早期阶段的、极其强大但也极其粗糙的框架。那些发帖说「智能体一晚上给我搞了个 App」的人,背后往往花了好几周甚至好几个月来调设置、写规则、建流程。你看到的是最终成果,中间的踩坑和崩溃他们没说。

三条建议

像带新人一样对待它。 新人第一天上班你不会指望他啥都会。你会给他培训、定规矩、讲清楚你的习惯和偏好。智能体也是一样的道理,需要你花时间去「带」。

从成功标准清晰的任务入手。 「帮我总结今天的邮件」比「帮我管理整个数字生活」靠谱一万倍。前者有明确的输入输出和成功标准,后者太模糊,注定翻车。

善用社区。 你踩的坑,大概率有人已经踩过了。OpenClaw 的 Discord 和 Reddit(r/openclaw)是找答案最快的地方。

常见问题速查

智能体陷入循环 :加「严禁死循环」的规则

成本太高 :切到分层模型配置(Haiku 为主,Opus 为辅)

网关崩溃 :跑一下 openclaw doctor --fix

智能体冻住了:通常是上下文窗口太小,换模型或清理记忆

工具调用失败:检查模型是否支持结构化输出,或换 Claude 系列

本文原文链接:https://clawfy.xyz/guide-openclaw-tips,你是否也在用OpenClaw AI 智能体吗?踩过什么坑?欢迎评论区聊聊。