Back to Articles
Feb 20, 20264 hours ago

You Think You're Using AI, But You're Only Using 10% of Its Capability

Y
Yanhua@yanhua1010

AI Summary

This article explores a fundamental shift in how we should understand and interact with artificial intelligence, based on the latest guide from Wharton professor Ethan Mollick. It argues that most people are operating with a severely limited view of AI's potential, creating a growing gap between casual users and those harnessing its full power. The piece is essential reading for anyone who uses tools like ChatGPT, Claude, or Gemini and wants to move beyond basic chat. The core insight reveals that effectively using AI is no longer about a single tool, but a combination of three elements: the underlying model, the application you access it through, and the crucial framework that determines its capabilities. This explains why many find AI underwhelming—they may have a powerful "brain" but are giving it a weak "body" to work with. Furthermore, the article outlines a critical evolution from treating AI as a chat partner to managing it as an autonomous agent that can execute complex tasks, from coding to handling office work, with minimal supervision. Ultimately, the guide provides a pragmatic path forward, urging readers to move beyond free tiers and default settings to actively engage with advanced features. It concludes that the leap from chatbot to intelligent agent is the most significant change since ChatGPT's debut, and the gap between those who merely chat and those who delegate is widening rapidly. To discover which layer you operate on and how to advance, the full article offers indispensable insights and actionable steps.

Ethan Mollick 刚发了他的第八版 AI 使用指南。

这位沃顿商学院教授从 ChatGPT 发布起就在写这系列指南,每一版都是对"普通人该怎么用 AI"最权威的回答之一。但他自己说了:这一版跟以往截然不同。

因为"使用 AI"这四个字的含义,已经发生了根本性的变化。

我读完之后最大的感触不是"又有新工具了",而是一种清晰的分层感。大多数人对 AI 的理解,正在被拉开三个层次的差距。而且每一层的差距,都在决定你能从 AI 中获得多少价值。

第一层认知差:你用的不是"AI",你用的是模型 × 应用 × 框架

大部分人说"我在用 AI"的时候,脑子里想的是一个东西。打开 ChatGPT,输入问题,得到回答。

Mollick 说这种理解已经过时了。现在你需要同时考虑三个要素:

模型(Model): AI 的大脑。目前三巨头是 GPT-5.2/5.3、Claude Opus 4.6 和 Gemini 3 Pro。它决定了系统有多聪明。

应用(App): 你实际使用的产品。chatgpt.com、claude.ai、gemini.google.com,以及 Claude Code、Claude Cowork 这类专用工具。

框架(Harness): 让模型真正发挥作用的系统。它决定了 AI 能用什么工具、能做什么事。同一个模型,在不同框架里能力天差地别。

这三者的组合才是你真正在用的东西。

举个例子:Claude Opus 4.6 这个模型,在 claude.ai 网页端能帮你搜索和写代码。但把同一个模型放进 Claude Code 的框架里,它就能访问你的整个代码库,自主编写、运行、测试代码,从零开始构建网站。

同一个大脑,换了身体,能力完全不同。

这就是为什么很多人觉得"AI 也就那样"。不是模型不行,是你给它的框架太弱了。就好比你请了一个顶尖厨师,但只给了他一口平底锅和一瓶盐。

第二层认知差:免费用户和付费用户之间,隔了一个时代

Mollick 在指南里专门加粗强调了一句话:

如果你想认真使用 AI,每月 20 美元的订阅费是必须的。

这不是广告。他解释了一个很多人没意识到的事实:免费模型通常是针对聊天速度优化的,不是针对准确性。当你需要处理复杂任务时,免费版本的表现会大幅下降。

但即使你付了费,还有一个关键操作大多数人不知道:手动选择最强的模型版本。

默认设置通常不是最强模型,而是性能和成本的平衡版。Mollick 给出了具体建议:

ChatGPT:手动选择 GPT-5.2 Thinking Extended 或 Thinking Heavy

Gemini:始终选择 Gemini 3 Pro 或 Thinking

Claude:选择 Opus 4.6 并开启扩展思考

这就像你买了一辆跑车,但出厂设置是经济模式。你得自己切换到运动模式,它才能发挥真正的性能。

大多数付费用户,其实一直在用"经济模式"的 AI。

第三层认知差:从"聊天"到"智能体",这是 ChatGPT 发布以来最大的跃迁

这是 Mollick 这篇指南真正想传达的核心信息。

直到几个月前,"使用 AI"对大多数人来说还是意味着跟聊天机器人进行往返对话。你提问,它回答。你不满意,再问一次。本质上是一个问答循环。

但现在,AI 作为智能体(Agent)使用已经切实可行了。你不是跟它聊天,你是给它分配任务,它会根据需要使用各种工具来完成任务。

这两者之间的差别,不是量变,是质变。

聊天模式: 你是主角,AI 是配角。每一步都需要你推进。

智能体模式: 你是导演,AI 是执行团队。你描述目标,它自主规划、调用工具、完成任务。

Mollick 在指南中列举了几类已经在运作的智能体框架:

编程智能体。 Claude Code、OpenAI Codex、Google Antigravity。它们能访问你的代码库,自主编写、运行和测试代码。即使你不是程序员,这些工具展示出的自主性也令人惊叹。

办公智能体。 Claude for Excel/PowerPoint 能像初级分析师一样处理电子表格。Claude Cowork 直接在你的桌面上运行,能操作本地文件和浏览器,处理从整理报销单到从 PDF 提取数据这类复杂任务。

知识管理智能体。 NotebookLM 让你上传文档、视频或网页,构建交互式知识库,甚至能生成播客式的内容讨论。

这些不是概念验证。它们已经在运行,已经在改变人们的工作方式。

三大应用的差异化,比你想象的更重要

以前选 AI 工具像选搜索引擎,差别不大。现在不一样了。三大平台正在走向截然不同的方向:

Gemini 正在成为多媒体创作中心。它集成了 nano banana(顶尖图像生成)、Veo 3.1(视频生成)、Guided Learning(导师模式)和 Deep Research。Google 的策略很清晰:用多模态能力和庞大的上下文窗口建立壁垒。

ChatGPT 在走"生活助手"路线。除了图像生成和 Deep Research,它还有 Shopping Research(购物研究)和 Study and Learn(学习模式)。OpenAI 想让 ChatGPT 成为你日常生活中无处不在的助手。

Claude 选择了"深度工作伙伴"的定位。功能看起来最少,但它的强项在于通过"项目(Projects)"功能连接用户数据,以及在编码和执行方面的卓越表现。

选择哪个平台,本质上是选择你希望 AI 在你生活中扮演什么角色。

Mollick 指出了一个有趣的现状:在编写/执行代码、处理文件和深度研究方面,Claude 和 ChatGPT 目前领先于 Gemini 的网页端。尽管 Gemini 的底层模型同样优秀,但它的应用框架还没有完全释放模型的潜力。

这再次印证了那个核心观点:模型只是大脑,框架才是身体。

一个安全问题:强大的代价

Mollick 在指南中提到了 OpenClaw,一个开源的 AI 智能体,可以本地运行并连接任何模型。

他特意标注了一个警告:虽然功能强大,但目前存在较大的安全风险,因为它需要广泛的计算机访问权限。

这不是小问题。智能体越强大,它需要的权限就越多。能操作你文件的 AI,理论上也能删除你的文件。能控制你浏览器的 AI,理论上也能看到你的密码。

每一个智能体产品都在安全和能力之间做权衡。Claude Cowork 选择了多层安全防护。Clawdbot 选择了本地部署。OpenClaw 选择了把决定权完全交给用户。

没有完美的方案,但你必须理解你在接受什么风险。

所以,现在该怎么做?

Mollick 给出了极其务实的建议,我在这里加上我自己的理解:

入门阶段。 选择 ChatGPT、Claude 或 Gemini 中的任何一个,花 20 美元订阅。记住切换到最强模型。然后做一件事:给它一个你工作中真正复杂的任务。不是"帮我写封邮件",而是一份完整的项目方案、一个复杂的数据分析、一份行业报告。通过往返对话不断推进,直到你对结果满意。

进阶阶段。 跳出聊天框。试试 NotebookLM(免费),把你的工作文档扔进去,看看它能给你什么。如果你有编程需求(哪怕只是一点点),试试 Claude Code。如果你想让 AI 帮你处理日常繁琐任务,试试 Claude Cowork。

关键心态转变: 别再把 AI 当搜索引擎用了。它不是一个更聪明的 Google。它是一个能"做事"的实体。你需要学会的不是怎么提问,而是怎么分配任务、怎么定义目标、怎么验收结果。

最后的话

Mollick 在指南结尾写了一句话,我觉得是整篇文章的点睛之笔:

从"聊天机器人"到"智能体"的转变,是自 ChatGPT 发布以来最重要的变化。

我想补充的是:这个变化比大多数人意识到的要快得多,也深远得多。

两年前,我们惊叹于 AI 能写出通顺的文章。一年前,我们开始让它帮我们写代码。现在,它能自主规划任务、调用工具、操作文件、浏览网页、运行测试。

下一步是什么?没人确切知道。但有一点很清楚:那些还停留在"跟 AI 聊天"阶段的人,和已经在"管理 AI 智能体"的人之间,差距正在以指数级拉开。

你站在哪一层?

本文基于 Ethan Mollick 2026 年 2 月 18 日发布的最新 AI 使用指南整理。Mollick 是沃顿商学院教授,著有《Co-Intelligence》,是 AI 应用领域最具影响力的研究者之一。