昨天情人节,字节发布了新一代的大模型,豆包大模型 2.0。
看了不少介绍,多数是解读规格参数。
也看了一些测试,多数是生成3D网页,虽然炫酷,但离大家实际生活和使用场景有点远。
到底模型怎么样?
哪里可以用?效果如何?优势和劣势分别是什么?
带着这些问题,乔帮主做了评测。
一句话简单结论:多模态能力强,擅长做视频理解推理,利好剪辑。工具调用稳定,接入 OpenClaw(龙虾)和 Claude Code 运行Skill 没问题。但前端审美不佳,代码能力跟顶级模型有差距。
火山引擎已同步上线了API,接入教程和评测如下,建议收藏,年后折腾。
哪里可以用?
豆包官网
https://www.doubao.com/
选择"专家"模式,背后就是豆包 Seed 2.0 模型。
Trae 体验最新 Seed 2.0 代码模型
https://www.trae.cn/
火山引擎
这里门槛稍微有点高,需要获取API。
就可以在OpenClaw(龙虾)中配置调用。
也可以用在Claude Code中。
下面会详细讲解方法。
测试案例
识别香料并解读
过年炖牛肉,家里翻出一些香料。
我手机拍照发给豆包。
提示词:标记出所有香料的名字,给出一句话做用介绍,我要炖牛肉用
识别的相当精准,建议也很靠谱。
比如不建议放太多丁香,否则可能会发苦;白芷和良姜去腥解腻效果好等。
接入 Claude Code 测试
为了测 Seed 2.0 多模态能力,建议先接入Claude Code。
这里推荐个工具叫 CC Switch(全平台支持),下载地址:
https://github.com/farion1231/cc-switch/releases/tag/v3.10.3
借助这个工具,能快速给Claude Code配第三方模型,也能随时切换。
安装后点"+"号,选中 DoubaoSeed。
点击下面链接:
https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey
去火山引擎获取API key填入,保存后启用。
回到 Claude Code 会换成 Doubao Seed 2.0 Code模型
运行Skill
运行自己写的Skill,抓取AI领取海外Newsletter更新。
执行效果不错。
创建 Skill
运行 Skill Creator,另外发三个火山引擎Seed 2.0 的官方API文档
https://www.volcengine.com/docs/82379/1399008?lang=zh
https://www.volcengine.com/docs/82379/1895586?lang=zh
https://www.volcengine.com/docs/82379/1902647?lang=zh
运行后创建一个名叫seed-multimodal的Skill。
我已经写好,你可以直接下载:
https://xiangyangqiaomu.feishu.cn/wiki/IXlVw1ceEiUkxAk525FctKjinKd
调用多模态分析视频
原始视频链接 :https://www.youtube.com/watch?v=LF4zSMyZydQ
用Yt-dl skill下载过来。
输入提示词:
调用 seed skill分析这个视频中的所有meme片段,然后裁切成多个meme视频 【视频路径】
没想到一次性全搞定了,还建了个文件夹,连文件名都和内容匹配。
视频字幕转写
既然 Doubao Seed 2.0 是多模态,那么理论上可以转写视频中的文本。
于是,我找了个英文访谈视频,下载后不带字幕。
https://www.youtube.com/watch?v=51KUocErpj0&t=104s
提示词:
/seed-multimodal 转录视频中人物对话为文本写入Markdown文件,另外按内容截取成多个片段:【本地视频路径】
顺利完成任务,写入 Markdown 文件。
也按画面内容和主题,切成5个视频。
接入OpenClaw并测试
如果你已安装OpenClaw,并接入飞书。
复制下面内容(记得修改API)发给 OpenClaw 飞书机器人。
我想给openclaw增加一个doubao seed 2.0 pro模型的配置支持cURL信息如下:
curl https://ark.cn-beijing.volces.com/api/v3/responses \
-H "Authorization: Bearer 换成你的API" \
-H 'Content-Type: application/json' \
-d '{
"model": "doubao-seed-2-0-pro-260215",
"input": [
{
"role": "user",
"content": [
{
"type": "input_image",
"image_url": "https://ark-project.tos-cn-beijing.volces.com/doc_image/ark_demo_img_1.png"
},
{
"type": "input_text",
"text": "你看见了什么?"
}
]
}
]
}'
OpenClaw 会自己完成 Doubao Seed 2.0接入。
如果你没有安装OpenClaw,或没有接入飞书。
可参考下面教程
https://mp.weixin.qq.com/s/8DwabUPPdOyOCAc_f8pKQw
让龙虾写小工具
快过年了,带孩子走访亲戚,不知道怎么称呼。
直接给龙虾提需求:
接入Doubao Seed 2.0 Pro的龙虾很快写好,竟然还有拼音和小测试。
除了蓝紫配色不好看,功能一点毛病没有。
体验地址:
https://32kw.com/view/6dc404c
让龙虾解读 Seed 2.0 模型文档
字节除了发模型,也发布了Seed2.0 Model Card,下载地址:
https://lf3-static.bytednsdoc.com/obj/eden-cn/lapzild-tss/ljhwZthlaukjlkulzlp/seed2/0214/Seed2.0%20Model%20Card.pdf
我丢给龙虾解读
生成的解读文章Markdown:
@@@IMG_20@@@
@@@IMG_21@@@
读完,我印象最深的是开头这句话:
"Note that the Seed2.0 Series still have gaps with international frontier LLMs."
(请注意,Seed 2.0 系列与国际前沿 LLM 仍存在差距)
果然"字节范",坦诚清晰!
做好模型不为刷分,只为解决真实世界的复杂性。
写在后面
感觉豆包 Seed 2.0 像一个低调的学霸。
不吹牛,只是踏踏实实把多模态和工具调用做到位。
坦然承认与顶级模型的差距,这很字节范。
三个让我眼前一亮的瞬间
① 识别香料那一刻,不仅全认对,还能提醒"丁香别放多会发苦",太贴心了。
② 视频自动切片,没字幕视频直接转文本,还能按主题自动分段,以后做视频笔记、剪辑素材,效率直接起飞。
③ 接入OpenClaw和飞书,对话聊天就能做小工具、解读论文,实在是方便。
说实话,除了谷歌,能做好多模态模型的公司真不多。
豆包 Seed 2.0 模型的多模态能力,全球前三完全没问题。
虽然当下代码能力还不够强,但相信字节的耐心和实力。
这才刚开始。
预祝大家新年快乐,2026年值得期待!

