第1章 OpenClaw 是什么?为什么需要它
一句话:OpenClaw 是一个开源、自托管的 AI Agent 多渠道网关,让你的 AI 助手同时连接 Telegram、微信、Discord、WhatsApp、飞书等 20+ 聊天平台。
版本声明:本教程基于 OpenClaw v2026.3.13 编写,定价和配置信息截至 2026 年 3 月。如有变化,请以官方文档为准。
1.1 一句话定位
Section titled “1.1 一句话定位”OpenClaw 是一个基于 MIT 协议的开源项目,核心定位是 自托管的 AI Agent 网关。它不是一个 AI 模型,也不是一个聊天界面——它是连接”AI 大脑”和”聊天渠道”之间的桥梁。
你可以把它理解为一个”AI 助手的通信中枢”:
- 上游连接各种 LLM 提供商(DeepSeek、智谱 GLM、Kimi、MiniMax、通义千问等 30+ 家)
- 下游连接各种聊天平台(Telegram、WhatsApp、Discord、飞书、Slack 等 20+ 个)
- 中间是你的 Agent——带有记忆、技能、人设和自动化能力的智能体
OpenClaw 运行在你自己的设备上(个人电脑或服务器),所有数据和配置都在本地,不经过任何第三方服务。
1.2 核心架构
Section titled “1.2 核心架构”OpenClaw 的架构由四个核心组件组成:
┌─────────────────────────────────────────────────────┐│ OpenClaw Gateway ││ ││ ┌───────────┐ ┌───────────┐ ┌────────────────┐ ││ │ Channels │ │ Agent │ │ Skills │ ││ │ │ │ │ │ │ ││ │ Telegram │ │ Pi Core │ │ 13,000+ 社区 │ ││ │ WhatsApp │←→│ Memory │←→│ 技能市场 │ ││ │ Discord │ │ Tools │ │ (ClawHub) │ ││ │ 飞书 │ │ Prompt │ │ │ ││ │ Slack │ │ │ │ │ ││ │ ...20+ │ │ │ │ │ ││ └───────────┘ └───────────┘ └────────────────┘ ││ ││ ┌──────────────────────────────────────────────┐ ││ │ Nodes (移动端节点) │ ││ │ macOS / iOS / Android — 本地设备操控 │ ││ └──────────────────────────────────────────────┘ │└─────────────────────────────────────────────────────┘Gateway(网关)= 公司总机
Section titled “Gateway(网关)= 公司总机”Gateway 是整个系统的控制面板,基于 WebSocket 协议运行。就像一家公司的总机——不管电话从座机、手机还是网络电话打进来,都先汇到总机这一个地方,由总机负责分拨。
Gateway 负责:会话管理、消息路由、配置管理和状态维护。默认监听端口 18789。
Agent(智能体)= 接线员
Section titled “Agent(智能体)= 接线员”Agent 是 AI 的运行时核心,基于 Pi agent 引擎。总机把电话接进来之后,转给接线员处理。Agent 就是那个真正接电话、回答问题、帮你办事的人。每个 Agent 拥有独立的工作目录、记忆系统、System Prompt 和工具集。你可以同时运行多个 Agent,分别处理不同的任务。
Channels(渠道)= 各种电话线路
Section titled “Channels(渠道)= 各种电话线路”Channels 是连接聊天平台的适配层。有人打座机进来,有人打手机进来,有人用 VoIP 打进来——这些就是不同的”线路”。每个渠道都有独立的配置、权限策略和消息格式转换逻辑。支持 Telegram、WhatsApp、Discord、Slack、Signal、飞书、LINE、Matrix、iMessage 等 20+ 渠道。线路可以随时加、随时减,总机不需要改造。
Nodes(节点)= 分机
Section titled “Nodes(节点)= 分机”Nodes 是运行在你手机或电脑上的客户端应用。你的手机是一台分机,你的 iPad 是一台分机,你办公室的电脑也是一台分机。通过分机,你可以随时随地拿起话筒跟接线员沟通,还能让接线员用分机上的功能——比如拍张照、录段语音、获取你的位置。支持 macOS、iOS 和 Android。
把这四个角色放在一起:
你的手机(Node)──→ 通过 Telegram 线路(Channel)──→ 总机(Gateway)──→ 接线员(Agent)你的 iPad(Node)──→ 通过 WhatsApp 线路(Channel)──→ 总机(Gateway)──→ 接线员(Agent)团队成员 ─────────→ 通过 Discord 线路(Channel)──→ 总机(Gateway)──→ 接线员(Agent)你只需要:
- 在服务器上跑一个 Gateway(装好总机)
- 配置好你要用的聊天渠道(接通线路)
- 接上一个 AI 模型(招聘接线员)
然后所有渠道的消息都会被路由到 Agent,Agent 的回复会自动发回对应的渠道。
1.3 与其他方案的对比
Section titled “1.3 与其他方案的对比”你可能会问:为什么不直接用 XXX?
直接调 API(比如用 Python 写个 Telegram Bot)
Section titled “直接调 API(比如用 Python 写个 Telegram Bot)”适合单一渠道、单一模型的简单场景。但当你想同时接多个渠道、切换模型、管理记忆、安装技能时,自己造轮子的工作量会指数级增长。OpenClaw 把这些基础设施都做好了。
Dify / Coze 等低代码平台
Section titled “Dify / Coze 等低代码平台”适合快速搭建工作流,有可视化编排界面。但它们通常是 SaaS 服务(数据在别人的服务器上),对渠道支持有限,模型选择受平台限制,定制深度不够。OpenClaw 是完全自托管的,你对数据和配置有完全控制权。
n8n / Make 等自动化平台
Section titled “n8n / Make 等自动化平台”适合跨系统的流程自动化(比如”收到邮件→发消息→更新表格”),但它们不是为”对话式 AI 助手”设计的,缺乏会话管理、记忆、技能生态等 AI Agent 特有的能力。
| 特性 | 直接调 API | Dify / Coze | n8n / Make | OpenClaw |
|---|---|---|---|---|
| 多渠道接入 | 需自建 | 有限 | 通过节点接入 | 20+ 渠道原生支持 |
| 多模型切换 | 需自建 | 平台限制 | 需额外对接 | 30+ 提供商,改一行配置 |
| 数据控制 | 完全自控 | 在云端 | 可自托管 | 完全自控 |
| 会话 & 记忆 | 需自建 | 基础 | 无 | 内置完整记忆系统 |
| 技能生态 | 无 | 有模板 | 有节点 | 13,000+ 社区技能 |
| 定时任务 | 需自建 | 基础 | 强项 | Cron + Heartbeat |
| 多 Agent | 需自建 | 部分支持 | 需编排 | 原生路由和切换 |
| 学习曲线 | 高(造轮子) | 低(可视化) | 中 | 中(配置驱动) |
| 适合场景 | 简单 Bot | 工作流 | 流程自动化 | AI Agent 通信基础设施 |
OpenClaw 的独特价值在于:它是一个专门为 AI Agent 设计的多渠道通信基础设施,在一个框架内解决了模型接入、渠道适配、会话管理、技能扩展、安全控制和自动化调度的完整链路。
1.4 国内用户的典型痛点
Section titled “1.4 国内用户的典型痛点”作为国内用户,你可能面临这些问题:
消息碎片化:你的同事在飞书,朋友在微信,海外客户在 WhatsApp,技术社区在 Discord。如果要给每个平台都配一个 AI 助手,你需要维护多套代码、多个部署、多份配置。OpenClaw 让你用一个 Gateway 统一管理所有渠道。
模型切换成本高:今天用 DeepSeek 便宜,明天 Kimi 出了新版本更强,后天想试试 Claude。每次切换都要改代码、改部署。OpenClaw 的模型配置是统一的,切换只需改一行配置。
数据主权:很多 SaaS 平台会把你的对话数据存在他们的服务器上。OpenClaw 运行在你自己的设备上,所有数据(聊天记录、配置、API Key)都在本地。
网络环境特殊:国内访问 Telegram、Discord 等平台需要代理。OpenClaw 内置了代理配置支持,可以在渠道级别独立设置。
国产模型友好:OpenClaw 原生支持智谱 GLM-5、月之暗面 Kimi K2.5、MiniMax M2.7/M2.5、通义千问、百度千帆、小米 MiMo、DeepSeek 等国产模型提供商,也支持通过 OpenRouter 一个 Key 访问全球所有主流模型,或用 Ollama 在本地运行开源模型。不依赖海外账户也能完整使用。
1.5 真实用户案例精选
Section titled “1.5 真实用户案例精选”光说”能干什么”太空泛。下面这些是社区里真实的使用案例,每一个都是有人已经跑通了的:
- 遛狗修 Bug:有人遛狗时收到报警,用手机语音指挥 Agent 查日志、改配置、重新部署,5 分钟搞定,手没离开狗绳。(详见第 15 章)
- Solo Founder 的虚拟团队:一个独立创业者用 4 个 Agent 组建了虚拟公司——策略、商务、营销、编码各一个,在 Telegram 群组里协调工作。(详见第 17 章)
- 手机建站:一个用户全程在手机上完成了网站从 Notion 到 Astro 的迁移——18 篇文章、DNS 切换、部署上线,没碰电脑。(详见第 15 章)
- 10-Agent 自动化军团:10 个 Agent、3 台机器、1 个 Discord 服务器,自动清理万封邮件、审查广告、发布社交内容。(详见第 17 章)
- Agent 超市购物:Agent 从 1Password 获取凭证,自动登录超市网站,处理 MFA 验证,完成下单。(详见第 15 章)
这些案例的共同点是:用户不在电脑前,但 Agent 在工作。
1.6 社区生态
Section titled “1.6 社区生态”OpenClaw 是 MIT 协议开源项目。除了代码本身开源之外,围绕它已经长出了一个活跃的社区生态:
- ClawHub:社区技能注册表,截至写作时已有 13,000+ 个技能(持续增长中),类似于 npm 之于 Node.js
- awesome-openclaw-skills:5,400+ 个精选高质量技能,按 30+ 分类整理
- clawskills.sh:技能浏览网站,更直观的搜索和发现体验
- 20+ 渠道:覆盖全球主流聊天平台
- 30+ 模型提供商:国产和国际模型全覆盖
1.7 小结
Section titled “1.7 小结”OpenClaw = 自托管 + 多渠道 + 多模型 + AI Agent + 技能生态。如果你想要一个运行在自己设备上、能同时连接多个聊天平台、自由切换 AI 模型的智能助手框架,OpenClaw 就是为你设计的。
| 概念 | 类比 | 作用 |
|---|---|---|
| Gateway | 公司总机 | 消息路由、会话管理、配置管理 |
| Agent | 接线员 | AI 对话、工具调用、记忆管理 |
| Channels | 电话线路 | 连接各聊天平台 |
| Nodes | 分机 | 手机/电脑端控制 |
下一章我们直接动手——安装 OpenClaw 并把环境跑起来。