Back to Articles
Mar 9, 20266 days ago

The First "Little Lobster" That Can Run on a Phone is Here, Its Name is miclaw.

数字生命卡兹克@Khazix0918

AI Summary

This article offers an exclusive, hands-on review of Xiaomi's groundbreaking new AI agent, "miclaw," positioning it as the first true system-level assistant capable of running directly on a smartphone. Framed within the larger battle for the AI agent "entrance," the piece argues that hardware manufacturers like Xiaomi are now decisively entering the fray, with miclaw representing a pivotal shift from computer-based productivity agents to phone-based life managers. The author, having gained early access, explores how this changes the game by granting the AI deep, secure integration with core phone functions—from managing messages and notes to controlling smart home devices—all through natural conversation. The core experience revolves around miclaw's profound access to the phone's operating system, enabling tasks that were previously impossible or clunky for visual-based agents. The review highlights practical, everyday magic: automatically replying "R" to spam texts, creating voice-to-text diary entries that learn from corrections, and orchestrating complex "scenes" like a pre-writing routine that adjusts lights and reminds the user to drink water. Two capabilities stand out: seamless control over the user's entire Xiaomi smart home ecosystem and the ability to generate simple React Native mini-programs on the fly, showcasing a high-permission approach that threatens many standalone apps. However, the article also candidly addresses the current limitations, particularly the "walled garden" of third-party app permissions, which remains a significant frontier. Ultimately, this is more than a product review; it's a dispatch from the front lines of a technological shift. The author conveys a palpable sense of being an early tester in a "big era," where the phone is transforming from a tool into an intelligent, proactive companion. While still in a limited beta and facing challenges, miclaw is presented as a compelling vision of a future where our digital agents understand not just our words, but our context and environment. To grasp the full implications of this step toward that future—and the tangible excitement of its current capabilities—the full, detailed account is essential reading.

在OpenClaw火了之后,其实已经基本证明了一件事。

Agent场景,是用户刚需场景。

这个场景,是任何厂商都不可能放弃的,这就是最前端入口,谁掌握了入口,谁就是那个笑到最后的大爹。

不止软件厂商,硬件厂商也更不可能放过这个Agent时代的船票。

上周五,小米的Agent产品Xiaomi miclaw,正式官宣。

雷总也激情带货,四个字:

手机龙虾。

miclaw,第一个,能在手机上运行的、能调用手机系统级能力的、有安全保障的Agent产品。

这四个字我觉得我还是需要强调一下:安全保障。

OpenClaw你可以理解为,是在电脑上运行的、可以操控你电脑的、有你电脑绝大多数权限的Agent产品。

而micalw,就是在你的小米手机上运行的、可以操控你手机系统的Agent产品。

硬件厂商,终于下场,正式开启了Agent混战了。

大时代啊,朋友们。

目前miclaw是小规模封闭测试状态,并且只支持小米17系列机型。

但你说好巧不巧,我刚好是个稍微有一点名气的AI博主,还正好就是iPhone17和小米17的双持用户。。。

于是,顺理成章的通过了封测申请,拿到了miclaw的体验权限。

我是周五下午拿到的,写这篇文章是周日,大概体验了一天半时间,其实也差不多了,体验完以后,整体感觉还是有一些值得聊的东西。

首先,还是需要明确的是,这次的miclaw,是一个实验性产品,是面向发烧友和一些极客用户的。

因为小米虽然内置了一些场景和工具,但是像mcp和子代理这些确实没有预设的,需要用户自己配置,才能发挥一些额外的能力,而配置以代码的形式,直接交给用户的,所以你还是需要一些额外的知识,才能发挥更强的能力。

当我们更新好系统,下载好miclaw之后,无需任何部署啥的,打开即用。

你就可以跟他发出你的你第一句话,随便说个啥都行。

我就直接来了句喂喂喂。

第一次对话其实跟OpenClaw一模一样,他会跟人确认他的人设,问你是谁,他又谁,来把这块的内容写进自己的长期记忆里。

我就把我的老Prompt发给他了,这个Prompt,真的跟了我好久,Claude code是他,OpenClaw也是它。。。

这个Prompt就是:

你的名字是小卡,你的身份:是我 数字生命卡兹克的 AI 员工,你的性格:幽默风趣为主,带点自黑和毒舌,但绝不伤人  专属表情:*/ᐠ。ꞈ。ᐟ*

我还是喜欢贱贱的东西,AI也得贱一点好,越贱我越喜欢。

*/ᐠ。ꞈ。ᐟ*

你把这段Prompt发给它之后,你就会看到,它开始思考和执行了,调用了一个工具,write_file,来对他自己的长期记忆进行写入,从此以后,他就记得他叫小卡了,我是他的主人大人。

不过这个时候,他还不知道数字生命卡兹克是谁,作为一个十级懒癌晚期的AI博主,那我自然懒得描述给它,我就直接让他去网上搜了。

他就会继续调用网页搜索工具,查一查数字生命卡兹克是谁,再继续写到长期记忆里,给我进行回复。

前面的互相认识和寒暄,差不多到这就OK了,当然你也可以再跟他聊聊天,来多多满足一下他的长期记忆,让他更懂你,也可以直接开始让miclaw干活。

手机端的claw和电脑端的claw,最大或者最本质的区别,那必然就是操作系统的能力不一样。

比如大家都知道,为啥OpenClaw部署在macmini上体验那么好呢,除了底层Unix的原因之外,还有很多工具和能力,是mac专属,所以你才可以用小龙虾,操控你mac上的几乎一切系统能力。

但是手机,是另一个天地,很简单,就是你的OpenClaw再牛逼,你可以操控手机的电话、通讯录、短信、wifi、应用等等这些系统能力吗?

那必然是不可能的。

手机厂商也不可能给你开放那个权限,你要是硬做,那就只能用视觉Agent也就是豆包手机那套方案做,优点是非常通用,我能看到的东西都能操作,缺点就是很慢,因为要模拟点击,而且视觉Agent的特性,就是成功率和稳定性上,是比不过类似OpenClaw和Claude Code这种以编程和工具调用为核心逻辑的Agent。

而且这玩意也确实会抢一些蛋糕了,所以当时豆包手机才搞得各大厂商反应那么激烈。

而现在,小米自己下场做了,有了miclaw,那自然可以用编程Agent这套逻辑去适配自己家的手机了,毕竟都是自己的东西。

就比如,你可以直接总结短信。

而且速度非常快,大概十几秒就搞定了,快的离谱。

这块其实就是MiMo基座模型的特点了,我之前写过一篇文章,聊过小米的基座模型,在推理速度上,应该是独一档,所以在Agent体验上,就很愉快。

总结短信是小case,我不知道大家的短信,是不是会经常收到一些垃圾的营销信息,很烦,我真的很烦,他们又要我回复R拒收,但是谁没吊事花那个时间给他们打字啊。

那有了miclaw之后,就太简单了,一句话,全部都拒收。

真的,不骗你们,真的都发了。

以免引起一些不必要的麻烦,我就都打码了。

还有我之前写过一篇文章,一直强烈推荐大家在AI时代记日记:

有了miclaw之后,我感觉我可以抛弃掉IOS上那套豆包语音输入法+备忘录的流程了。

因为,我感觉用miclaw记日记,这个过程,好像更爽。

比如,我可以按住底部,直接发一段语音过去。

然后,它就会识别,然后直接记录到我的系统笔记里面,我录了一小段给大家演示一下。

但是这还没完,其实我过去用语音输入法一直有个痛点,就是因为我的英文奇差,口语极其不标准,所以那些产品名,比如Claude code、Openclaw啥的,总是会识别错误。

这个强迫症真的看着非常难受。

而这时候,我就可以追着说一句。

当然,你懂的,我肯定不可能只是为了纠正这一个笔记,我没那么闲,我的核心目的,还是让它记住,以后我再念这样的单词,都给我改正确。

它就会把这些,都写进它的记忆里,从此,识别再怎么错误,他都会记着了。

效果显著。

而且因为你还可以操控系统级别的应用管理,所以你也可以用嘴来卸载APP,虽然我也不知道这个场景他能有啥用。

比如我去让它给我把豆包卸了,这时候他其实不是直接卸载,而是弹出一个弹窗让我确认,这个比较合理。

除了短信、笔记、应用、通讯录等等,miclaw第一批,上线了不少系统级的工具,可以在设置的工具页面里面都看到。

一共27个大的,分别是20个系统应用工具、1个只能家居工具、6个网络工具,里面还包含了很多小的。

我知道这个很难看懂,所以我让miclaw,给我整理了一个他自己工具权限的md文件,虽然有点长,但是我觉得还是应该列出来让大家详细的看一看。

工具 功能
短信 读取、发送短信,支持自动处理短信事件

通话 拨打、挂断电话,支持 AI 接管或自动接听

通话记录 查询和删除通话记录

联系人 搜索、创建、修改、删除联系人,自动合并重复联系人

日历 读取、创建、删除日历事件,支持时间范围过滤

时间 & 定时器 获取当前时间,设置、更新、取消定时器

闹钟 查询、新增、修改、删除闹钟

文件 读写、编辑、复制、移动、删除、搜索文件

笔记 创建、编辑、查找、读取笔记,支持图片笔记

搜索 & 网页抓取 联网搜索信息,抓取指定网页内容

浏览器 后台打开浏览器,提取内容、点击元素、输入文本、自动登录

WiFi 查询、扫描、连接、断开 WiFi,自动切换到最强信号

蓝牙 查询状态、开关蓝牙、扫描并连接/断开蓝牙设备

媒体播放 获取当前播放信息,控制播放、暂停、切歌、音量

录音 开始、暂停、继续、停止录音,查看录音列表

录屏 开始、停止屏幕录制,查询录屏状态

相机 调用相机拍照或录像

图片 & 媒体库 加载图片供 AI 分析,支持 OCR 识别、转 PDF、管理相册

语音播报 文字转语音朗读,可切换音色

位置 & 天气 获取当前位置(经纬度/城市),查询天气和预报

截图 & 剪贴板 截取手机全屏,读写剪贴板内容

通知 & Intent 发送系统通知,启动应用或跳转系统设置页面

设备 & 权限 查询电池/存储/网络等设备状态,检查应用权限

智能家居 控制小米智能设备,执行场景,查询设备状态

记忆 & 历史 搜索 AI 记忆文件,查询/加载历史聊天记录

应用管理 & 系统 列出/启动/卸载应用,刷新提示词和 Agent 配置

RN 小程序 & 扩展工具 生成、预览、保存 RN 界面,动态调用扩展工具

这些工具,就代表着,miclaw在这一版,你不装任何mcp的情况下,可以做的事情。

有短信、联系人、日历、闹钟、文件、帮你寄、搜索和网页抓取、浏览器、蓝牙、媒体播放、录音、录屏、相机、相册、位置和天气、通知、设备、应用管理等等。

这些工具,你完全可以自由组合,想一想有趣的场景。

比如直接把别人的名片,扔给miclaw,让它给你录个联系人。

比如截图 + OCR + 笔记 + 联网搜索,就等于看到任何有意思的东西,截个图,miclaw自动OCR提取文字,搜索相关背景,写成一条带上下文的笔记,等于一个随身的素材采集流水线。

比如日历 + 天气 + TTS语音播报 + 定时器 + 网页搜索,就等于一个每天早上你出门或者刷牙时候的自动播报:"今天有3个会议,第一个10点产品评审。外面26度多云,不用带伞。昨天的重要的AI新闻balabala" 相当于一个私人晨间简报。

其实从这个就可以看出来很强的定位的差异。

电脑上的Agent是生产力工具,手机上的Agent是生活管家。

而在第一批miclaw的第一版自带的工具上,有两个是我觉得可以再额外提一下的。

一个是米家,另一个是React Native小程序。

先说米家。

作为一个家里的智能家居,能用小米就用小米的人,属实是狂喜。

有图为证,算是买的还比较多的了,毕竟是租的房子。

打开miclaw的设置页面,你就可以把你的米家,授权给miclaw。

于是,你现在,就可以任意操控你家里的所有智能家居了。

你可能会问,我都有小爱了,我为啥要用miclaw。

你相信我,这就像siri和OpenClaw的区别,能用新时代的东西,还是用新的,真的,比小爱丝滑太多了。

举个最简单的例子,开窗帘。

用人话控制,非常方便。

还能直接监控我的鱼缸温度,一旦有温度异常立刻通知我,要不然我怕我的鱼和我那个小龙虾到时候嘎了。

这里我不是玩抽象,我说的小龙虾不是OpenClaw,是我真的养了一只天空蓝魔鳌虾,简称小龙虾...

还能做很多的记忆操作,比如我写稿的时候,需要调整到最舒服的状态,比如调整我的显示器,要拉窗帘,要倒一杯满的水之类的一些屁事。。。

我自己就在miclaw上直接做了一个。

只要我跟miclaw说,我要写稿了。

他就会帮我把显示器挂灯亮度调到100%,根据天气是否会产生反光然后决定拉不拉开窗帘,再提醒我接一杯饮水机的满杯水记得喝水,再帮我把手机打开勿扰模式。

可惜的就是因为权限问题,miclaw只能跳转到勿扰页面,等待我手动开启,没有办法全自动化,然后喝水的提示,是一个tts会直接念出来提醒,还挺有人味的。

还有一个我觉得最实用的,就是监控我的米家家居的耗材,如果跌倒10%左右,就赶紧提醒我要买。

比较可惜的就还是交易安全问题,miclaw没有办法操控三方产品直接帮我完成下单,因为监控以后能配合京东或者小米商城自动下单,那就更香了。

这个看看未来小米怎么解决吧。

然后还有一个小的问题,估计是第一版封测的问题,所以米家各种智能家居上的数据开放的不够多,导致有的数据我拿不到。

就比如我的体脂秤和我的饮水机的出水数据,其实联动一下还是挺好玩的,但是miclaw就告诉我,现在拿不到,就还蛮可惜的,很希望小米后续能开放更多更细节的智能家居数据出来。

OpenClaw和Claude code其实在我这,更像是工作助理的感觉。

但是miclaw因为基于手机和米家特性,让我感觉,更像是一个生活助理。

这两者的调性差距,其实还是蛮大的。

米家说完了,再用一点点篇幅,来说一下另一个稍微我觉得有点用的功能,就是RN小程序,miclaw支持你用嘴,直接新建小程序,并且存下来,支持后续miclaw来进行调用。

我说实话,这个功能,其实感觉就是小米为了弥补手机端skills和插件生态缺失的问题,又因为国内特性没有办法调用其他的第三方APP,所以随手一加。

但是坦率的讲,这个随手一加,对很多卖点是手机上可以新建各种各样小程序的AI产品来说,几乎就是个毁灭性打击。

道理太简单了,因为权限和入口级别根本不成正比,这就不是一个维度的战争。

纯粹的高维打低维。

你直接在对话里,跟miclaw说,帮我建一个XX小程序就行了。

比如我就随口说了个,做一个占卜小程序,主要就是每天给我自己图个吉利。

他就给我搞了个小程序,每天根据当天的信息,给我生成一些素材给我占卜,看看我今天的运气怎么样,反正里面也只有上签和上上签。。。

然后,以后,我只要说,帮我占卜一卦,看看今天的运气,它就会给我打开这个小程序。

整体的完整性上肯定没有办法跟电脑Agent的Skills相比,但是也算是一个在手机上目前比较合适的解法。

以上,就是关于miclaw的一些体验和评价了。

作为小米的第一个Agent,整体的完整性还是比较高的,任务的成功率也是相当的的高,当然最麻烦的老大难问题,其实还是第三方APP的操作权限。

这个不只是手机上,电脑上也同样有这个问题,只不过电脑的软件墙没有那么严重,80%的事情,都可以通过命令行和浏览器解决。

那20%,大家懂的都懂。

但是手机上就不一样了,整体可能就是完全倒挂的状态,小米因为有米家,所以实用性提高了不少,如果是其他家,那可能真的就只能用那些系统应用了。

这个老大难问题,这个如此封闭的APP墙,就看小米下一步,要去怎么解决了。

但是我还是始终坚信。

这些墙在汹涌向前的洪流之下,必然会倒塌。

新时代,一定会到来的。

By
数字生命卡兹克