ChatGPT 封号自救指南:申诉入口、英文模板和数据备份方法

这两天这张图,估计很多人都刷到了。

账号被删除停用

OpenAI 从昨天开始大规模封号,无差别、无规律、无逻辑,风控依旧是黑盒子。

不管你是什么邮箱、什么支付方式,不管你是 Plus、Pro 5x 还是 Pro 20x,都有人中招。就算续费了一年的老账户、正规付费用户,照样可能被停用。

看起来像是 Codex 崛起后,OpenAI 开始收紧风控了。两个月前大规模针对微软邮箱封号,就说过——太多人薅羊毛、搞注册机、0 元购,只会让平台封号封到麻木。

封号规模有多大?

根据目前统计,大约 5%~10% 的订阅用户受影响,100 个账号里大概有 5~10 个被封。数据量更大的情况下,可能只有 1% 左右。

好消息是:误封确实存在。已经有用户收到 OpenAI 官方邮件,确认账号被错误停用并恢复访问权限。说明后台在重新审核,正常用户不用慌,先按流程处理。

官方误封解号通知

先判断:真封还是误封?

更像真封的情况: 多人共享账号 / 频繁切换设备或地区 / 一个网络环境登录大量账号 / 异常高频使用 / 曾被官方警告

更像误封的情况: 长期正常使用 / 固定设备和网络 / 正常订阅 / 没有共享 / 突然被停用 / 后续收到官方恢复邮件

误封一定要申诉。真封也可以申诉,但通过概率很低。

ChatGPT 封号申诉流程

第一步:查收注册邮箱

打开注册 ChatGPT 的邮箱(包括垃圾箱),找官方发来的停用通知邮件,里面有一个 “Initiate appeal” 按钮,点击直接跳转申诉页面。

发起申诉

第二步:保存 Request ID

登录时如果页面显示账号停用,会出现一串 Request ID,复制保存,申诉时一起提交,方便官方定位问题。

复制请求 ID

第三步:没有按钮?直接走官方申诉页面

https://openai.com/form/appeal

img

建议用电脑浏览器打开,选择对应申诉原因,内容用英文填写,不要太长。

申诉英文模板(直接复制改)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Hello OpenAI Support,

My ChatGPT account appears to have been deactivated,
but I believe this may have happened by mistake.

I use this account for normal personal or work purposes
and have not intentionally violated OpenAI's policies.

Could you please review my account again?

Account email: [你的邮箱]
Approximate time of deactivation: [大概时间]
Request ID: [有就填,没有删掉这行]

Thank you for your help.

申诉内容越简单越好,不要编故事,不要情绪化,越像真实正常用户越有效。

申诉成功后注意

账号恢复后页面可能暂时显示”免费计划”,不要马上重新充值。原订阅状态官方会自动同步恢复,iOS / Google Play / 信用卡用户尤其注意,避免重复扣费。

GPT 封号后官方不会主动退款,所以尽量降低损失,优先申诉恢复。

封号前先备份聊天记录

别等到封号再后悔,现在就备份。

操作路径: Settings(设置),Data controls(数据控制), Export data(导出数据), 确认后官方会发送下载链接到你的注册邮箱,包含所有对话记录。

备份聊天记录

怎么降低封号风险?

根据我自己注册十几个账号、用了一年多没有封号的经验,核心原则就一句话:

一个干净的网络环境,不超过 3 个账号登录,订阅方式保持固定。

日常注意:

  • 不多人共享同一账号
  • 不在同一网络频繁登录大量账号
  • 不频繁切换地区或设备
  • 不反复更换支付方式
  • 重要账号定期导出聊天记录

总结一句话: 正常用户别慌,先查邮箱、保存 Request ID、走申诉流程,恢复后别急着充值,顺手把聊天记录备份了。

Anthropic 最强功能:Claude Dynamic Workflows 完整教程(含提示词)

很多人刷到 Claude 4.8 更新就直接划走了——因为 Opus 4.8 的 benchmark 太亮眼了。

但真正能让你的 Claude Code 生产力起飞 5-10 倍 的,是这个被大多数人忽略的 Dynamic Workflows(动态工作流)。

它是让 Claude 自己编写 JavaScript 编排脚本,在后台并行调用数十到数百个子代理(subagents),互相交叉验证、自我纠错,还能把整个流程保存成可复用的斜杠命令。

本文基于 Anthropic 最新 Claude Code 功能和真实使用经验,给你最完整的技术原理、启动方式、监控保存全流程,以及内容创作者实用的提示词模板。读完就能上手。

目录

一、Dynamic Workflows 到底是什么?核心原理
二、三种启动方式(最新触发技巧)
三、实时监控与保存复用(必学操作)
四、实战案例 + 可直接复制的提示词
五、5 个高级技巧和避坑指南
六、总结和行动建议

一、Dynamic Workflows 到底是什么?核心原理

img

Anthropic 官方定义:

A dynamic workflow is a JavaScript script that orchestrates subagents at scale. Claude writes the script for the task you describe, and a runtime executes it in the background while your session stays responsive.

解释
Claude 会根据你的任务描述,自动生成一个 JS 脚本。这个脚本把大任务拆成多个阶段,分配给不同的子代理并行执行。代理之间可以互相”挑刺“( adversarial review ),结果不一致就重新验证。

整个过程在后台运行,你的会话界面保持响应,还支持中途暂停和恢复。

img

它能做到但传统方式做不到的 4 件事

  1. 并行扇出(Fan Out):一个任务拆成 10-100+ 个子任务同时跑,而不是串行等待。
  2. 自我验证机制:代理互相交叉验证,大幅降低幻觉和错误。
  3. 可恢复(Resumable):长任务(几小时甚至几天)可以暂停,之后继续。
  4. 可复用编排:优秀的 workflow 可以保存成 /your-command,下次直接调用相同逻辑。

与 Skills、MCP/Connectors 的本质区别(很重要):

  • Skills:教 Claude「怎么做」它已经会的事(SOP 化)。
  • MCP / Connectors:给 Claude 接入外部工具和实时数据。
  • Dynamic Workflows协调整个团队去完成单次对话或单技能搞不定的大规模复杂任务。

例如你写一篇深度研究报告。
Skills 负责结构和润色,Connectors 拉取最新数据,而 Dynamic Workflows 可以同时调用几十个来源搜索、多个代理交叉验证事实、过滤噪声,最后输出带引用、高可信度的报告。

二、三种启动 Dynamic Workflows 的方式

方式1:手动触发(最灵活,推荐新手先用这个)
在 prompt 中直接包含 workflow 关键词(或根据最新更新,使用 use a workflow for this / create a workflow)。

Claude 会立即切换到编排模式:

  • 分析任务并生成阶段计划
  • 展示给你看,请求批准
  • 后台启动多个代理并行执行

小贴士:如果不想每次都触发,可在 /config 里关闭 Workflow keyword trigger,或按 Alt + W 临时忽略。

方式2:使用内置 /deep-research(最推荐入门)
直接输入:
/deep-research [你的研究问题]

它会自动并行搜索多个来源、交叉验证每个主张、过滤不可靠信息,最后输出带引用来源的结构化报告。适合每天做市场情报、竞品分析、AI 工具研究。

方式3:Ultracode 自动模式(最强大)
运行:
/effort ultracode

开启后,Claude 会为每个有实质性的任务自动规划并执行 workflow + 高推理努力
注意:token 消耗会明显增加,适合重要任务。

推荐一个自用的 Claude Pro 订阅升级服务(稳定正规,操作简单):http://cnmClaude.com

三、实时监控与保存复用(最核心的操作)

工作流启动后,输入:
/workflows

打开实时进度面板,可看到:

  • 每个阶段(phase)
  • 当前运行的代理数量
  • Token 消耗情况
  • 已用时间

面板内快捷键(非常实用):

  • p:暂停 / 恢复
  • x:停止选中代理或整个 workflow
  • r:重启某个代理
  • s保存当前脚本为可复用命令(最重要!)
  • Enter:深入查看某个代理的 prompt、工具调用和结果

保存 workflow:按 s 后可保存到项目库或个人库。以后在任何对话输入 /saved-workflow-name 就能复用相同编排逻辑。这才是把重复工作真正变成 SOP 的关键。

四、实战案例 + 可直接复制提示词(内容创作者最爱)

案例1:公众号爆款内容生产全流程工作流(强烈推荐)

把一个 X 帖子或想法,自动完成从选题到成文的全流程。

提示词模板(直接复制修改使用):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
使用 Dynamic Workflow 为我的微信公众号创建一个完整的内容生产流水线。

任务:基于这个 X 帖子 [粘贴链接或内容],产出一篇 3000-4000 字的技术干货公众号文章。

工作流阶段要求:
1. 内容角度挖掘与爆款标题变体生成(至少 5 个高点击标题)
2. 深度研究与事实交叉验证(使用多个来源)
3. 文章结构规划 + 钩子/结尾设计
4. 正文撰写(技术干货风格,带实操步骤和提示词)
5. 视觉生成提示词优化(封面 + 配图)
6. SEO 优化 + 互动引导语
7. 最终排版建议和发布 checklist

请先展示完整计划,得到我批准后再执行。使用并行代理和交叉验证确保质量。

运行后在 /workflows 实时监督进度。

案例2:深度研究报告
直接用:
/deep-research Claude Dynamic Workflows 最新技术细节、限制、最佳实践和真实用户案例,交叉验证官方文档与社区反馈

案例3:大型代码审计 / 重构(开发者向)
适合代码库级别的 bug hunting、安全审计、迁移重构等。多个代理可以互相 review 代码。

五、5 个高级技巧和避坑指南(技术干货核心)

1.
模型选择决定成本
大型 workflow 前先输入 /model 查看当前模型。Opus 4.8 跑几十上百个代理费用会很高,建议先用 Sonnet 测试逻辑,确认后再切强模型。
2.
提前连接好 MCPs / Connectors
做研究类 workflow 前,先把 Notion、Drive、网页搜索、特定 API 等工具连好。来源越多,交叉验证越强。
3.
与现有 Skills 深度结合
如果你已经有写钩子、润色、视觉提示等 Skills,可以在 workflow prompt 里指定调用它们,形成「技能包 + 编排」组合。
4.
成本与停止条件意识
长任务一定要利用 resumable 特性,设置合理 stop conditions。时刻监控 /workflows 的 token 面板,及时干预。
5.
最佳实践流程

  • 小任务先手动测试 workflow 逻辑
  • 保存高质量的 workflow 形成个人AI 团队标准作业程序
  • 迷茫时直接问 Claude:基于你对我的了解,我应该构建哪些 workflows?

六、总结和行动建议

Dynamic Workflows 把复杂、重复、高价值的工作,从我手动一步步催变成了我设计一次,团队自动跑。

对于公众号运营者、内容创作者、研究员、开发者来说,这可能是 2026 年最值得深度掌握的 Claude 技能之一。

现在就行动起来

  1. 打开 Claude Code,试试输入 workflow/deep-research 一个你当前的任务
  2. 把你最常做的重复流程做成一个 workflow 并保存下来

Codex 登录遭遇手机验证?解决手机验证的两种最新方案

为什么突然需要手机验证?

img

随着 Codex 用户量快速增长,OpenAI 近期明显加强了风控策略。常见触发场景包括:

  • 登录时突然弹出手机号验证
  • 原本无需验证的老账号也开始要求验证
  • 频繁切换多账号触发安全校验
  • 登录状态失效、无法正常进入 Codex

解决方案总览

方式 成本 稳定性 难度
WhatsApp 接收 低(几块钱)
eSIM 实体卡 中高 最高 高(需护照)

方案一:WhatsApp 接收验证码(推荐)

这是国内用户最快、最划算的方式,一次注册后续可持续使用。

Step 1:通过 hero-sms 申请国外手机号

前往 hero-sms 接码平台:

  • 价格便宜的地区单次费用约几毛到1元
  • 平台最低充值 3 USDT,支持支付宝
  • 建议按需充值,不要多充

img

hero-sms 平台界面

Step 2:用该号码注册 WhatsApp

  • iOS 用户:App Store 搜索 “WhatsApp” 直接安装
  • 安卓用户:需通过 Google Play 商店下载

用 hero-sms 获取的号码完成 WhatsApp 注册,注册后保持 WhatsApp 登录状态,不要随意注销

Step 3:在 Codex 验证页面选择 WhatsApp 接收

回到 Codex 登录页,输入你注册 WhatsApp 时使用的手机号,选择通过 WhatsApp 发送验证码

Step 4:查收并输入验证码

验证码会直接发送到你手机上的 WhatsApp 应用内,查收后填入即可完成验证。

img

WhatsApp 接收验证码

全流程总花费:约 3~10 元人民币,可长期复用。

方案二:eSIM 实体号码(长期稳定)

适合对账号安全要求较高、长期使用的用户。

  • 推荐德国 O2 运营商的 eSIM:免费开卡,前半年免月租
  • 后续只需充值约 0.01 欧元即可续期半年保号
  • 门槛:需要进行 KYC 身份认证,国内护照可用(办理费用约100+元)

推荐一个自用的 GPT 官方直冲网站(正规稳定):http://cnmgpt.com

小结

  • 最快上手 : WhatsApp 方案,几块钱搞定,后续可反复使用
  • 最稳长期 : eSIM 方案,有护照的用户首选

Composer 2.5 接入 Grok Build:终端 AI 编程助手开始进入“长任务执行”阶段

最近 xAI 放出了一条很值得关注的更新:

img

Composer 2.5 is now available inside Grok Build.

翻译就是: Composer 2.5 现在已经可以在 Grok Build 中使用了。

很多人可能会觉得只是一次普通的模型更新。但从 AI 编程工具的发展方向来看,这次更新其实挺关键。

因为它说明 Grok Build 不再只是一个“能在终端里写代码的 AI 工具”,而是开始朝着一个更完整的 Agentic Coding 工作台发展。

一、Composer 2.5 到底是什么?

按照 xAI 官方说法,Composer 2.5 是一个快速、智能度很高的模型,特点是:

擅长处理长时间运行的任务,也能更好地跟随复杂指令。

真正做开发的人,会更关注另外几个问题:

  1. 能不能理解整个项目结构?
  2. 能不能连续执行多个步骤?
  3. 能不能先分析再动手,而不是上来就乱改?
  4. 能不能处理多文件、多模块之间的依赖关系?
  5. 能不能在长任务里保持稳定,不跑偏?

Composer 2.5 这次被接入 Grok Build,重点就是补强这些场景。

不是单纯为了聊天,而是更偏向实际工程任务。

二、Grok Build 是什么?

Grok Build 可以理解为 xAI 推出的终端 AI 编程助手。

不是浏览器里的聊天窗口,也不是单纯的代码补全插件。

直接运行在终端里的 coding agent。

你可以在项目目录里启动它,让它读取项目文件、理解代码结构、分析问题、提出计划,并在你确认后执行修改。

这类工具最大的价值是: 它离真实开发环境更近。

因为开发者平时真正工作的地方,本来就是终端、IDE、Git、项目文件夹和调试日志。

Grok Build 进入终端之后,可以更接近实际开发流程。

点击查看文章:Grok Build 使用教程(2026 年最新版)

三、如何在 Grok Build 中使用 Composer 2.5?

使用方式不复杂。

如果还没有安装 Grok Build,可以使用官方安装命令: curl -fsSL https://x.ai/cli/install.sh | bash

安装完成后,进入你的项目目录: cd your-project

然后启动 Grok Build:grok

进入 Grok Build 后,可以通过模型菜单切换模型:/model 或者使用官方提到的 /models 菜单。

在模型列表里选择: Composer 2.5

img

选择Composer 2.5

选择完成后,当前会话就可以使用 Composer 2.5 来处理代码任务。

四、Composer 2.5 适合用在哪些场景?

不是所有任务都需要切到 Composer 2.5。它更适合处理那些上下文长、步骤多、需要持续理解项目结构的任务。

1. 多文件代码修改

比如登录功能,通常会涉及页面、接口请求、token 存储、路由守卫、用户状态管理和异常提示。 这类任务不是改一个文件就能完成的,如果模型只看局部,很容易改漏。Composer 2.5 更适合先理解整体,再分步骤修改。

2. 项目重构

项目重构通常包括拆分组件、整理目录、抽离工具函数、优化接口层、规范命名和删除重复代码。 这类任务很考验模型的上下文保持能力,Composer 2.5 更适合处理这种长任务。

3. 长链路 Bug 排查

真实项目里的 Bug 往往不是一行代码的问题,可能涉及页面、状态管理、接口、环境变量和构建配置。 Composer 2.5 适合顺着调用链持续分析,先定位问题,再给出修改方案。

4. 文档生成和项目交接

比如生成 README、安装说明、运行步骤、API 文档、目录结构说明和部署文档。 这类任务需要模型理解整个项目,而不是凭空写文档,所以也适合交给 Composer 2.5。

五、推荐使用方式:不要一上来就让它改代码

这是我觉得最重要的一点。

使用 Grok Build 或 Composer 2.5,不建议一上来就说: 帮我优化这个项目 指令太宽泛。

更好的方式是让它先分析,计划,最后执行。 例如:

1
2
3
请先阅读当前项目结构,不要直接修改代码。
先告诉我这个项目的主要模块、技术栈、入口文件和可能的风险点。
分析完成后,再给我一个修改计划。

这个提示词的好处是: 先让模型进入“理解项目”的状态,而不是直接进入“执行修改”的状态。

img

输出效果

六、几个适合 Composer 2.5 的实战提示词

1. 项目分析

1
2
3
4
5
6
7
请先分析当前项目结构,不要修改任何文件。
请输出:
1. 项目技术栈
2. 主要目录作用
3. 核心入口文件
4. 主要业务流程
5. 目前代码中可能存在的结构问题

2. Bug 排查

1
2
3
4
5
6
7
请帮我排查当前项目的报错。
要求:
1. 先不要修改代码
2. 先定位可能相关的文件
3. 分析错误产生的调用链
4. 给出 2-3 个可能原因
5. 最后再给出建议修改方案

3. 多文件修改

1
2
3
我需要优化当前项目的登录流程。
请先分析登录相关文件,包括页面、接口、token 存储、路由跳转和异常处理。
先给出修改计划,等我确认后再执行代码修改。

4. README 生成

1
2
3
4
5
6
7
8
9
10
请基于当前项目生成一份适合开源发布的 README。
需要包含:
1. 项目介绍
2. 技术栈
3. 安装方式
4. 本地运行
5. 目录结构
6. 环境变量说明
7. 常见问题
8. 后续开发计划

5. 重构任务

1
2
3
4
5
6
7
请分析当前项目是否存在重复代码、目录混乱、组件职责不清的问题。
先输出重构建议,不要直接修改。
每一条建议都要说明:
1. 涉及文件
2. 为什么要改
3. 改动风险
4. 预期收益

七、Composer 2.5 和普通模型怎么选?

建议是:

如果只是简单问答、小范围代码生成、解释报错,默认模型就够用。

但如果任务满足下面任意一个条件,就可以考虑切到 Composer 2.5:

  • 读取多个文件
  • 连续执行多个步骤
  • 先计划再修改
  • 长时间保持上下文
  • 复杂指令跟随
  • 处理真实项目结构
  • 做重构、排查、文档、迁移

小任务看速度,大任务看稳定。

Composer 2.5 的价值,主要体现在复杂任务和长任务里。

八、总结

如果你已经在使用 Grok Build,这次 Composer 2.5 值得试一下。

它的意义不是替代所有模型,而是让 Grok Build 多了一个更适合长任务和复杂指令的模型选择。

告别 Gemini CLI!Google 新神器 Antigravity CLI 上手指南(Windows 新手版)

核心命令只有一个:agy

跟着这篇走,10 分钟搞定安装、登录、第一个 Prompt。

写在前面

Google 已于 2026 年 5 月 19 日正式宣布 Antigravity CLI 向所有人开放。

img

同时,Gemini CLI 将在 2026 年 6 月 18 日之后停止为免费用户、Google AI Pro 及 Ultra 用户提供服务。

也就是说——现在该换了

本文面向 Windows 新手,手把手带你完成安装、登录和第一次使用。

一、你需要准备什么

开始之前,确认你手边有这几样东西:

Antigravity CLI 原生支持 Windows、macOS 和 Linux,安装后统一通过 agy 命令启动,简洁干净。

二、安装 Antigravity CLI

Windows 推荐:用 PowerShell

打开 PowerShell,粘贴以下命令并回车:

1
irm https://antigravity.google/cli/install.ps1 | iex

备选:用 CMD

打开命令提示符(CMD),执行:

1
curl -fsSL https://antigravity.google/cli/install.cmd -o install.cmd && install.cmd && del install.cmd

macOS / Linux

1
curl -fsSL https://antigravity.google/cli/install.sh | bash

安装完成后,agy 会自动加入系统路径,无需手动配置。

三、验证是否安装成功

安装完成后,关闭终端,重新打开 PowerShell,输入:

1
agy --version

看到版本号,说明一切正常。

img

四、第一次登录

直接运行:agy

第一次启动会进入登录引导,你会看到:

img

普通个人用户选第 1 项:Google OAuth。

img

它会自动打开浏览器(未自动打开你可以复制链接到浏览器,自行打开授权),用你的 Google 账号完成授权。

img

授权成功后,按提示把授权码粘贴回终端。

img

复制授权码

img

填写授权码,等待登录

再接受一下条款,就完成了。

什么时候选第 2 项? 如果你是企业用户、有 GCP 项目或团队协作场景,才需要选 Use a Google Cloud project。个人用户无需考虑。

五、创建并进入测试项目

强烈建议新手先建一个空文件夹来练手,避免误改真实项目:

1
2
3
mkdir C:\Users\屎努比\Desktop\grokdemo1
cd C:\Users\屎努比\Desktop\grokdemo1
agy

第一次进入新文件夹,它会问你是否信任该目录:

img

Yes——Antigravity CLI 需要读取和操作当前目录里的文件,这是正常权限请求。

img

六、第一个 Prompt,现在就试

进入 agy 交互界面后,可以直接输入中文。

分析项目结构(推荐第一步): 你现在是我的编程助手。请先阅读当前项目结构,不要修改任何文件。然后用中文告诉我:这个项目是什么、主要文件有哪些、下一步适合做什么。

让它创建一个小页面: 请帮我创建一个最简单的 HTML + CSS + JS 页面,主题是待办事项列表, 要求页面简洁、可运行,并解释每个文件的作用。

新手提示:先不要开”完全自动执行”模式。让它给出修改计划,你确认后再执行,这样最安全。

七、常用内置命令速查

进入 agy 后,这几个命令最常用:

命令 作用
/settings 打开设置面板
/config 修改配置(主题、模型、工具权限等)
/permissions 查看或修改工具权限
? 查看快捷键和帮助

配置文件默认保存在: ~/.gemini/antigravity-cli/settings.json

八、如何更新

agy update 更新后重新打开终端,运行 agy --version 确认版本已更新。

九、常见问题解答

agy 提示”不是内部或外部命令”

环境变量未生效。解决方法:关闭 PowerShell,重新打开,再试一次。如果还不行,重新执行安装命令即可。

登录后反复要求重新登录

先执行更新:agy update

这个问题在 1.0.1 版本已修复,更新后重启 agy 即可恢复正常。WSL 环境下此问题偶发,同样建议更新解决。

十、新手练习路线图

刚开始别急着让它改大项目,按这个顺序循序渐进,最稳:

1
2
3
4
5
6
第一步:让它读取并分析项目结构
第二步:让它解释某段代码
第三步:让它新增一个小功能
第四步:让它修复一个明确的 bug
第五步:让它生成 README 文档
第六步:熟练后,再考虑让它重构项目

功能越来越强大,但每一步你都清楚发生了什么——这才是用好 AI 编程工具的正确姿势。

小结

Antigravity CLI 的使用门槛其实很低,核心就一个命令:agy。安装、登录、信任项目、开始对话,全程不超过 10 分钟。

Grok Build error sending request 怎么解决?排查了一晚上,问题出在这里

前几天装 Grok Build,被一个特别隐蔽的问题卡了一晚上。

折腾完之后回头看,发现这个坑其实很多人都会踩,踩了之后第一反应基本都是错的。今天把过程整个写出来,看完这篇你应该可以省不少时间。

报错长这样

我本地装好 Grok Build 之后,初始化要跳转 xAI 登录认证。浏览器那边一切正常,但终端这边一直转圈,过一会儿就甩出来这段:error sending request for url https://auth.x.ai/.well-known/openid-configuration

img

翻译就是:Grok Build 想去请求 auth.x.ai 获取登录配置,但是请求根本发不出去。

我开始全猜错

我的第一反应是这么排查的:重装、换号、升级、清配置,全没用。

折腾快一小时才反应过来,报错里写得明明白白:error sending request

请求压根没发出去——这是网络层的问题,跟上面那些一个都不沾边。

最反直觉的一点

根本原因是:

浏览器能上不等于终端能上

我们日常用的本地网络工具,默认只接管浏览器流量。PowerShell、CMD、Node.js 这些命令行工具,默认不读取系统网络配置,全走直连。Grok Build 的请求自然也没走配好的通道。

完整排查步骤

第 1 步:先确认浏览器能打开

浏览器手动访问:

1
https://auth.x.ai/.well-known/openid-configuration

能看到一大段 JSON 配置就说明你的本地网络环境没问题。打不开的话先解决网络环境本身。

第 2 步:找到本地网络工具的端口

不同网络工具端口不一样,千万别照搬别人的端口号

打开你自己常用的那个本地网络工具,找到”本地端口”或”入站端口”,把 HTTP 和 SOCKS 两个端口号都记下来。一般在主界面就能看到,类似:

1
本地: socks:XXXXX | http:XXXXX

第 3 步:在终端里手动配置环境变量

用 PowerShell 的话,输入下面的命令,把端口号换成你自己的:

1
2
3
$env:HTTP_PROXY="http://127.0.0.1:你的HTTP端口"
$env:HTTPS_PROXY="http://127.0.0.1:你的HTTP端口"
$env:ALL_PROXY="socks5://127.0.0.1:你的SOCKS端口"

用 CMD 的话,命令换成:

1
2
3
set HTTP_PROXY=http://127.0.0.1:你的HTTP端口
set HTTPS_PROXY=http://127.0.0.1:你的HTTP端口
set ALL_PROXY=socks5://127.0.0.1:你的SOCKS端口

这是告诉这个终端窗口:你后续发出的请求都走本地这些端口。

有个特别重要的细节

这个配置只在当前窗口生效,窗口一关就失效。所以下面所有的测试和最后跑 Grok Build,都必须在同一个窗口里完成。

第 4 步:用 curl 做对比测试

这一步是整个排查的关键,能精准定位问题。

先测带端口参数的版本:

1
curl.exe -x http://127.0.0.1:你的HTTP端口 https://auth.x.ai/.well-known/openid-configuration

返回一大段 JSON 就说明本地通道本身没问题。

再测不带端口参数的版本:

1
curl.exe https://auth.x.ai/.well-known/openid-configuration

如果这个失败、上面那个成功,就 100% 锁定了问题:命令行环境没读取系统的网络配置,必须靠手动设置环境变量解决。

第 5 步:在同一个窗口跑 Grok Build

1
grok-build

然后点击界面里的:

1
Login with Grok

正常情况下浏览器会自动弹出登录页,跳转完成回到终端就能继续了。

img

授权登录

写在最后

整个问题的核心其实就一句话:

浏览器和终端是两套独立的网络通道,给浏览器配好了,不等于给终端配好了。

排查方法简单四步:

  1. 看到 error sending request,先怀疑网络可达性,不要先怀疑软件本身。
  2. 分别验证浏览器侧和终端侧的可达性。
  3. 用 curl 带参数和不带参数各测一次,对比结果就能定位问题。
  4. 实在不行就开 TUN,一了百了。

这套思路不光适用于 Grok Build,所有需要联网的命令行工具都适用。各种 AI 命令行工具、npm install 超时之类的问题,本质上都是这一类。

希望这篇能帮你少走点弯路。

Grok Build 使用教程(2026 年最新版)

Grok Build 是 xAI 官方推出的终端 AI 编码代理(Coding Agent CLI),于 2026 年 5 月正式进入早期 Beta 阶段。它把强大的 Grok 模型直接塞进你的终端,能帮你完成从规划、搜索、编码、测试到 Git 提交的全流程工作。

它支持交互式 TUI(全屏、鼠标操作、无闪烁)、Plan Mode(先规划再执行)、并行子代理无头模式(脚本/自动化)、ACP 协议接入其他工具等特性,是目前最接近“专业软件工程师”的终端 AI 工具之一。

1. 前提条件

2. 安装 Grok Build

macOS / Linux

1
curl -fsSL https://x.ai/cli/install.sh | bash

Windows(PowerShell,管理员权限推荐)

1
irm https://x.ai/cli/install.ps1 | iex

安装完成后,终端输入 grok --version 验证是否成功。

3. 首次启动与登录

  1. 进入你的项目目录:cd /path/to/your/project
  2. 启动 Grok Build:grok

输入 grok 启动 Grok Build

  1. 首次登录: 会自动打开浏览器进行 xAI 账号授权(推荐)。

点击允许即可连接成功

无浏览器环境可手动设置环境变量:export XAI_API_KEY="xai-你的密钥" (密钥可在 https://console.x.ai/team/default/api-keys 获取)

登录成功后会进入全屏交互式 TUI 界面。

TUI 界面

4. TUI 界面操作指南

Grok Build 的 TUI 支持鼠标点击键盘快捷键,界面清晰无闪烁:

输入框:直接输入自然语言指令(如中文或英文)。

常用命令(在 TUI 内输入):

命令 功能说明
/help 打开动态帮助面板(推荐新手必用)
/plan 手动进入 Plan Mode
/yolo 或 /always-approve 开启/关闭自动批准模式(YOLO 模式)
/model <模型名> 切换模型
/inspect 查看当前项目加载的技能、插件与配置
/feedback 直接向 xAI 团队提交反馈(Beta 阶段非常有用)
/clear 清空当前会话历史

5. Plan Mode(强烈推荐用于复杂任务)

输入复杂需求前,先用 /plan 或启动时加标志进入规划模式。

Grok Build 会先输出完整执行计划(分步骤)。 你可以:

  • 逐条批准(Enter)
  • 评论修改某一步
  • 完全重写计划
  • 批准后,所有文件变更都会以干净的 diff 形式展示,确认无误后再执行。

Plan Mode 的三种常用方法

  1. 快捷键切换(最快,推荐日常使用) :在 TUI 中按 Shift + Tab 循环切换模式,直到状态栏显示 Plan。

Plan

  1. 使用 Slash 命令: 输入命令/plan/plan on后按回车。
  2. 启动时直接进入(适合复杂任务):grok --plan 或结合项目路径:cd your-project && grok --plan

退出或切换回 Normal 模式

再次按 Shift + Tab 切换到 Normal 模式或输入命令:/plan off

6. 基本使用示例

示例 1:新建项目

1
创建一个现代化的 React + TypeScript Todo App,带暗黑模式、拖拽排序、本地存储,使用 Tailwind CSS,风格参考 Apple

操作建议:

  1. 直接在空文件夹中启动 grok
  2. 推荐开启 Plan Mode,让 Grok Build 先输出项目结构、依赖清单和技术方案
  3. 批准计划后,它会自动创建 package.json、组件文件、样式,并初始化 Git 仓库

项目创建中

项目创建完成

预期效果:

  • 生成完整的项目结构(含 README、测试文件)

项目结构

  • 包含暗黑模式切换、拖拽排序(@dnd-kit)、本地持久化(localStorage + Zustand)
  • 自动安装依赖并运行 npm run dev

示例 1 结果预览

进阶技巧:

  • 追加需求:“加上用户登录界面和后端 API 模拟”
  • 完成后输入:“帮我部署到 Vercel 并生成部署脚本”

示例 2:分析现有项目

1
Explain this repo in detail. 重点分析架构、核心模块和潜在优化点。

示例 3:修改代码

1
@src/main.rs 帮我把这个文件重构为更清晰的模块结构,并添加错误处理。

示例 4:并行子代理(大型任务)

Grok Build 会自动拆分任务给多个子代理并行执行(如一个写前端、一个写后端、一个写测试)。

7. 无头模式(Headless)—— 脚本/自动化神器

适合 CI/CD、自动化脚本或嵌入其他工具:

1
2
3
4
5
# 简单执行
grok -p "为当前项目添加用户认证模块(JWT + 数据库)"

# 输出 JSON 便于解析
grok -p "分析这个代码库的安全问题" --output-format streaming-json

8. 高级功能

功能 说明 如何使用
并行子代理 大任务自动拆分多个代理同时工作 自然语言描述即可
Git 深度集成 自动创建分支、提交、生成 PR 直接说“提交这些改动”
自定义配置 支持 AGENTS.md、技能、插件、MCP 服务器 项目根目录放置即可
自定义模型 可接入其他模型 配置文件 + /model 切换
ACP 协议 可接入 IDE、其他 Agent 框架 官方支持
Inspect 查看当前项目已加载的配置、技能等 grok inspect

9. 实用技巧 & 注意事项

  • 最好在 Git 仓库根目录运行,效果最强。
  • 大项目建议先用 Plan Mode,避免一次性改太多。
  • 图片支持:可直接粘贴截图让它分析 UI 或报错。
  • 多任务切换:支持同时运行多个 Grok Build 实例。
  • Beta 阶段:偶尔会有小 bug,遇到问题请用 /feedback 反馈。
  • 卸载:参考官方文档或删除对应二进制文件。

10 分钟实战:手把手教你用 Google AI Studio 做一个能用的安卓 App

Google Android 开发者博客宣布:AI Studio 正式支持在浏览器里生成原生 Android 应用——不是 H5 套壳,而是用 Kotlin + Jetpack Compose 构建的、能调用 GPS、蓝牙、NFC、摄像头的真原生 App。

img

在 Google AI Studio 中构建原生安卓应用

打开浏览器,描述需求,几分钟后 App 跑在你手机上。全程零安装、零配置。

这篇文章前半段讲清楚它是什么、能做什么、不能做什么;后半段是一份能跟着做的 10 分钟实战教程。读完你就能决定:今晚要不要打开它。

目录

  • Part 1:30 秒看懂这次更新
  • Part 2:它适合做什么(以及做不好什么)
  • Part 3:10 分钟实战教程——从零到手机上跑起来
  • Part 4:必须知道的边界
  • Part 5:Prompt 速查表

Part 1:30 秒看懂这次更新

① 入口:ai.dev/apps,零安装

img

ai.dev/apps

不需要 Android Studio,不需要 JDK,打开网页即用。

② 输出:真·原生 App

img

Kotlin + Jetpack Compose

Google 官方栈 Kotlin + Jetpack Compose,支持离线、后台服务、完整的硬件传感器调用——GPS、蓝牙、NFC、摄像头、加速度计。

这是 AI Studio 与所有”AI 建站”工具的根本区别——Web App 永远做不到这些。

③ 预览:浏览器内置 Emulator

内嵌完整安卓模拟器,在浏览器里直接预览交互手感,无需切换工具。

④ 真机:USB 一键安装

通过集成的 ADB,手机连电脑、点一下,App 就装到桌面。

⑤ 分发:直发 Play 内部测试

有 Play 开发者账号,可直接从 AI Studio 发布到 Google Play 内部测试轨道——不打包、不签名、不走传统流程。

⑥ 进阶:无缝”毕业”到 Android Studio

一键导出 ZIP 或推 GitHub,继续在 Android Studio 做精细打磨。

Part 2:它适合做什么(以及做不好什么)

官方甜区,三类应用:

  • 工具型 —— 计算器、记账、待办、单位换算。功能清晰、不依赖后端的小工具。
  • 硬件交互型 —— 运动记录、NFC 读卡、摄像头扫描、麦克风录音。Web App 做不到的事,这里都能做。
  • AI 原生型 —— AI 翻译、AI 笔记、AI 助手、AI 画图。这一类是 Google 最想推的——直接带动 Gemini API 调用。

当下做不好的事:超过 3-4 屏的复杂导航、深度依赖第三方 SDK(支付/IM/广告)、复杂数据库设计、对性能极敏感的场景(游戏/音视频)。

海外开发者吐槽得很准:”做 toy app 看着很酷,你让它做超过 3 屏的东西试试看。”——这是事实,但这只是 v1,Firebase 集成、Play Test Tracks 直管都在路上。

Part 3:10 分钟实战教程——从零到手机上跑起来

准备

img

Chrome + Google 账号 +(可选)安卓手机 + USB 线

  1. Chrome
  2. Google 账号
  3. (可选)安卓手机
  4. USB 线。

不知道怎么注册谷歌邮箱可以点击查看文章:

2026 年国内最新注册 Gmail 谷歌邮箱教程 | 一部手机五分钟,注册成功率90%以上

Step 1. 打开

访问 ai.dev/apps,登录,新建项目。

img

ai.dev/apps

界面三块:左侧对话框 / 中间代码预览 / 右侧模拟器

Step 2. 写 Prompt(决定 70% 成品质量)

不要写:”做一个喝水提醒 App”

要这样写:

1
2
3
4
5
6
7
8
9
10
11
做一个原生 Android App,主题是喝水提醒。

【功能】
1. 主页显示今日进度(已喝/目标),圆形进度环
2. 三个按钮:+100ml、+250ml、+500ml
3. 设置页可改每日目标(默认 2000ml)
4. 历史页:过去 7 天柱状图
5. 定时提醒(本地通知)

【设计】Material You,蓝色主调,支持深色模式
【技术】Jetpack Compose + DataStore

img

选择设计样式

功能列清单,设计给参考,技术指明确。Prompt 写得有多结构化,AI 做出来就有多接近”高级工程师”。

Step 3. 等生成(2-5 分钟)

img

生成中……

AI 自动:列计划 → 生成代码 → 编译 → 启动模拟器

首次编译失败是常态,别管,它会自己修。连修 3 次失败,说明 Prompt 有矛盾——回去精简,比硬改代码快 10 倍。

Step 4. 在模拟器里试

img

模拟器找一找毛病

点每个按钮、切每个页面、切深色模式。

这一步不是验收,是找毛病。一次成型几乎不可能,2-4 轮迭代才是常态。

Step 5. 用自然语言迭代

铁律:一次只改一件事

想改什么 这么说
UI “进度环放大到屏宽 70%,按钮改圆角矩形”
交互 “点 +100ml 加震动反馈和数字飘动动画”
配色 “主色改 #4A90E2,深色模式背景纯黑”
功能 “加撤销按钮,撤销最近一次记录”
Bug “切回主页进度显示不对,排查并修复”

经验:UI 改动放心交给 AI,业务逻辑改完务必全 App 点一遍——AI 经常”按下葫芦浮起瓢”

Step 6. 装到自己手机上

手机端:设置 → 关于手机 → 连点 7 次”版本号”打开开发者模式 → 开发者选项打开 USB 调试 → 连数据线。

img

AI Studio 端:点 Install via USB

img

安装应用

选择设备 → 手机授权(选”继续安装”)

img

等约 1 分钟 → 桌面出 App 图标

img

App样式

踩坑速查:

  • 识别不到设备 → 换数据线(很多 USB 线只能充电)
  • INSTALL_FAILED_USER_RESTRICTED → 开发者选项再开”USB 安装应用”
  • 国产手机 → 搜”XX 品牌 开启 USB 调试”,通常还要额外授权

Step 7. 之后怎么办

想干嘛 怎么走
自己用 留在 AI Studio 改,够了
发朋友测试 有 Play 账号直接发内部测试
正式上架 导出到 Android Studio 精修
加云端 等 Firebase 集成(官方已预告)

Part 4:必须知道的边界

擅长:3-4 屏工具型 App、Material 风格 UI、Compose 标准组件、硬件传感器调用

做不好:复杂业务逻辑、性能与内存优化、复杂自定义动画、第三方 SDK 深度集成

AI 做前 80% 的脚手架,你做后 20% 的精修。前者决定速度,后者决定品质。

Part 5:Prompt 速查表

1
2
3
4
5
6
7
【新建】做一个原生 Android App,主题[X],
功能:1...2...3...,设计[X],技术 Compose + DataStore
【改 UI】把[组件]改成[样式],尺寸[X],位置[X]
【加交互】点[X]时加[震动/动画/音效]反馈
【改色】主色改 #XXXXXX,深色模式下[X]
【加功能】在[页面]新增[功能],逻辑是[X]
【修 bug】[场景描述],出现[问题],排查并修复

铁律,只有一条:一次只改一件事。

本地 AI 代理神器 + Grok 模型,5–15 分钟搞定 24/7 智能助手

OpenClaw(原 Clawdbot/Moltbot)是目前最火的开源本地 AI 代理框架。它能通过 WhatsApp、Telegram、Discord 等聊天工具,让 Grok 等大模型真正”动手”做事——发邮件、管理日历、运行脚本、搜索网页、生成图片视频。

Grok(xAI)已原生深度集成到 OpenClaw 中,支持网页搜索、X 搜索、代码执行、图像/视频生成等高级功能,性价比高、工具调用稳定。

img

本文针对 Windows 用户,提供最详细、最实操的干货教程,全程使用原生 Windows 方案(无需 WSL)。

目录:

一、为什么在 Windows 上用 OpenClaw + Grok?

二、前置准备

三、原生 Windows 安装

四、Grok 模型配置与验证

五、启用 Grok 高级功能

六、连接 Telegram,实现手机远程指挥

七、常见问题与解决方案

八、维护与进阶建议

一、为什么在 Windows 上用 OpenClaw + Grok?

优势 说明
本地运行 数据不上传,隐私安全
Grok 原生支持 聊天 + 网页搜索 + X 搜索 + 代码执行 + 生图生视频
多渠道交互 手机 Telegram/WhatsApp 就能指挥
24/7 运行 设置守护进程后开机自启
成本可控 Grok fast 模型日常使用费用很低

推荐模型(2026 年最新):

  • 日常主力:grok-4.3(最均衡)
  • 追求速度:grok-4-fast / grok-4.1-fast
  • 代码开发:grok-code-fast-1

二、前置准备

preview

  1. Windows 10 / 11(推荐 Windows 11)
  2. 下载安装最新版 Node.js(官网 LTS 版本)
  3. SuperGrokX Premium 订阅(推荐 SuperGrok 官方订阅升级服务 : cnmGrok.com

三、原生 Windows 安装

1. 以管理员身份打开 PowerShell

Win + X,选择 PowerShell(管理员)

img

Win+X 选择 PowerShell(管理员)

2. 执行安装命令

1
iwr -useb https://openclaw.ai/install.ps1 | iex

img

执行命令

如果提示执行策略问题,先运行下面这条,再重试上一步:

1
Set-ExecutionPolicy RemoteSigned -Scope CurrentUser

3. 运行配置向导

1
openclaw onboard --install-daemon

按提示操作:

  • 模型提供商:选择 xAI
  • 认证方式:选择 xAI OAuth

img

选择 xAI OAuth

浏览器弹出授权页,点击”允许”即可连接成功。

img

允许即可连接成功

4. 自启动机制说明

原生 Windows 会优先尝试创建计划任务(Scheduled Task) 实现开机自启,若失败则回退到用户启动文件夹。无需手动干预。

四、Grok 模型配置与验证

1. 手动配置模型(可选)

配置文件路径:

1
C:\Users\你的用户名\.openclaw\openclaw.json

推荐配置:

1
2
3
4
5
6
7
8
9
{
"agents": {
"defaults": {
"model": {
"primary": "xai/grok-4.3"
}
}
}
}

如需切换其他模型(例如 grok-4-fast),直接修改 primary 字段即可。

2. 永久设置 API Key(可选)

若使用 API Key 方式认证,建议通过系统环境变量图形界面添加 XAI_API_KEY,避免每次启动重新输入。

3. 重启 Gateway

1
openclaw gateway restart

4. 验证是否成功

打开 Dashboard:

1
openclaw dashboard

浏览器访问 http://127.0.0.1:18789/,在聊天框输入测试:你是什么模型?

img

验证模型

如果回复中提到 Grok,说明整合成功。

五、启用 Grok 高级功能

网页搜索(强烈推荐开启)

1
openclaw config set tools.web.search.provider grok

img

开启网页搜索

其他原生支持功能(无需额外配置)

  • 图像生成:默认支持 grok-imagine-image
  • 视频生成:支持 grok-imagine-video
  • X 搜索(x_search):自动可用
  • 代码执行:自动可用
  • 文字转语音 / 语音转文字:已内置支持

六、连接 Telegram,实现手机远程指挥

1. 创建 Telegram Bot

打开 Telegram,搜索 @BotFather

img

BotFather

发送 /newbot,按提示创建机器人。完成后复制 Bot Token,格式类似 1234567890:AAxxxxxx

img

获取 Bot Token

2. 配置 OpenClaw

在 PowerShell 输入: notepad "$env:USERPROFILE\.openclaw\openclaw.json"

打开配置文件

添加 Telegram 配置:

1
2
3
4
5
6
7
8
9
{
"channels": {
"telegram": {
"enabled": true,
"botToken": "你的Bot Token",
"dmPolicy": "pairing"
}
}
}

如果文件里已有内容,不要整份覆盖,只合并 channels.telegram 字段。

3. 启动 Gateway

在 powershell 输入: openclaw gateway

4. 私聊 Bot 触发配对

在 Telegram 打开你创建的 Bot,发送:/start

Bot 会返回一段配对码,复制下来。

img

Bot 返回配对码

5. 在 PowerShell 批准配对

在 powershell 输入:openclaw pairing approve telegram 你的配对码

6. 测试连接

在 Telegram 给 Bot 发一句:你好

收到回复即代表 Telegram 接入成功。

img

Telegram 连接成功

七、常见问题与解决方案

问题 解决方案
PowerShell 执行策略报错 以管理员运行 Set-ExecutionPolicy RemoteSigned -Scope CurrentUser
守护进程未自启动 执行 openclaw gateway install
Dashboard 打不开 确认 Gateway 正在运行,检查端口 18789 是否被占用
想远程访问 配置 Telegram / Discord,或使用 Tailscale 组网
更新 OpenClaw 重新运行安装脚本,或执行 openclaw update

八、维护与进阶建议

  • 定期更新:运行安装脚本或 openclaw update
  • 查看日志openclaw gateway logs
  • 成本控制:日常用 fast 系列模型,复杂任务再切换到 grok-4.3
  • 配置备份:定期备份 C:\Users\你的用户名\.openclaw\ 整个文件夹
  • 多 Agent 进阶:后期可配置多个专业 Agent(研究、coding、自动化等)分工协作

总结

到这里,你已经在 Windows 上完成了 OpenClaw + Grok 的完整本地部署,拥有一个真正能”干活”的 24/7 AI 助手。

建议的体验路径:

  1. 先用 Dashboard 测试——确认模型、工具、生成能力都正常
  2. 再接入 Telegram——实现手机远程指挥
  3. 最后做自动化——把高频任务串成 Agent 工作流

至此,本地 AI 代理就真正跑起来了。

在 Windows 上用 Grok 订阅跑通 Hermes Agent(零 API key,15 分钟上手)

趁着 xAI 把 Grok 订阅接进开源代理 Hermes 这条热点,这篇文章不谈观点,只带你在 Windows 10 / 11 上动手:从 PowerShell 安装到第一次对话,再到把它变成一个会定时干活的代理。全程不需要申请 API key,也不需要额外计费——你已经付费的 Grok 订阅就是入场券。

先说一句重要的话:原生 Windows 是早期 Beta

在动手之前,这一点必须摆在最前面,因为它会影响你的选择。

Hermes 现在可以在 Windows 10 / 11 上原生运行——不需要 WSL、不需要 Cygwin、不需要 Docker。但官方明确把原生 Windows 标记为 early beta:它能装能跑,也通过了 Windows 相关的检查,但没有像 Linux/macOS/WSL2 路径那样被大规模实测过。粗糙的地方主要集中在子进程处理、路径怪癖和非 ASCII 控制台输出上。

所以请按这个判断来选:

  • 个人尝鲜、轻量 CLI、本地试用 → 原生 Windows 完全够用,按本文走
  • 要长期挂 gateway、跑长任务、多平台消息接入做生产自动化 → 官方建议优先用 WSL2 或 Linux 服务器

本文走原生 Windows 路径;文末会给出何时该切到 WSL2 的明确信号。

你将得到什么

跟完这篇教程,你会在 Windows 上拥有一个本地运行的 Hermes Agent,它用你的 Grok 订阅做推理,能跨会话记事,并且可以挂一个定时任务在后台自动跑。整个过程大概 15 分钟。

需要先确认的前提:

  • Windows 10 或 Windows 11(64 位;32 位会缺失 bash,功能受限)
  • 一个仍在生效的 Grok 订阅(任意档位的 SuperGrok,或含 Grok 权益的 X Premium)
  • 一个能打开网页的浏览器(本机即可)
  • 不需要预装 Python、Node.js 或 Git——安装器会自带一套隔离环境

关于依赖:Hermes 采用”零依赖”安装哲学。安装器会自行provision uv、Python 3.11、Node.js、ripgrep、ffmpeg,以及一份便携式 Git Bash(PortableGit,解包到 %LOCALAPPDATA%\hermes,不需要管理员权限,也不会碰你系统里已有的 Git)。如果你已经装了 Git,它会检测到并直接用。

第一步:用 PowerShell 安装 Hermes Agent

用普通权限打开 PowerShell(不需要”以管理员身份运行”),执行官方一行安装命令:

1
irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex

img

这条命令会把文件部署到 %LOCALAPPDATA%\hermes\,并把 hermes 加到你的用户级 PATH

它在背后做的事大致是:装 uv、Python 3.11、Node.js、ripgrep、ffmpeg、便携 Git Bash,克隆仓库到 %LOCALAPPDATA%\hermes\hermes-agent,建虚拟环境,最后跑一遍首次设置向导(选模型、provider、工具集)。

装完后最关键的一步,也是 Windows 上最容易踩的坑: PATH 改动不会作用于已经开着的终端窗口。你必须关掉当前 PowerShell,再开一个新的窗口(或新开一个 Windows Terminal 标签页),hermes 命令才会生效。不要用 $env:PATH += ... 手工临时拼,除非你清楚自己在做什么。

新开窗口后验证安装:

1
2
hermes --version
hermes doctor

img

hermes doctor 是这篇教程里你会反复用到的”体检命令”。它会列出环境、依赖和各个认证 provider 的状态。现在你应该能看到一个 ◆ Auth Providers 区块,里面的 xai-oauth 还是未登录状态——这正常,下一步解决。

img

安全提醒:irm ... | iex 等于把远程脚本直接执行,和 Linux 上的 curl | bash 是一回事,值得谨慎。想先审一遍脚本,可以把那个 URL 在浏览器里打开读一遍,或者先 irm <url> -OutFile install.ps1 存下来检查后再运行。

如果遇到 PowerShell 执行策略阻止脚本运行,可在当前会话临时放开(仅作用于这个窗口,不改全局):Set-ExecutionPolicy -Scope Process -ExecutionPolicy Bypass,然后重跑安装命令。

第二步:用 Grok 订阅登录(核心步骤)

这一步就是整条新闻的关键所在——浏览器一次授权,代替了传统的 API key 流程。

在新开的 PowerShell 窗口里走模型选择器:

1
hermes model

接下来会发生这些事:

  1. 从 provider 列表里选择 “xAI Grok OAuth (SuperGrok Subscription)”

img

  1. Hermes 自动打开你的默认浏览器,跳到 accounts.x.ai

img

  1. 你在浏览器里登录(或确认已登录的会话)并点击批准

img

  1. xAI 重定向回 Hermes,令牌保存到 %USERPROFILE%\.hermes\auth.json
  2. 回到选择器,挑一个模型——grok-4.3 永远被钉在列表最上面

img

  1. 完成

如果你只想单独触发登录、不进模型选择器:

1
hermes auth add xai-oauth

登录成功后,Hermes 会在每次会话前自动刷新令牌,你不用再管它,直到主动登出或在 xAI 账户设置里吊销授权。

再体检一次确认:

1
hermes doctor

这次 xai-oauth 那一行应该显示为已认证。

img

Windows 数据目录说明:%LOCALAPPDATA%\hermes 是可丢弃的基础设施(删掉后重跑安装命令即可恢复);而 %USERPROFILE%\.hermes 是你的数据——配置、记忆、skills、会话历史,结构和 Linux 安装完全一致。把这个目录在机器间同步,你的 Hermes 就跟着走。

常见小坑:浏览器授权有 180 秒超时窗口。点开浏览器后别去倒水了再回来,否则会看到 “Authorization timed out”。不要紧,重跑 hermes auth add xai-oauth 即可。

关于 SuperGrok 订阅: 这是本教程唯一的付费前提。值得注意的是,这次集成对所有订阅档位开放(xAI 未限制在高级套餐),且同一个登录就覆盖文本、语音、图像、视频、转写——相比单独申请 API key 还要管理速率和计费,订阅路径对个人用户更省心。推荐 SuperGrok 官方订阅升级服务 : cnmGrok.com

第三步:第一次对话

万事俱备,直接启动:

1
hermes

img

随便问点什么,确认 Grok 真的在背后回应——让它做一道需要推理的题,或者解释一段代码。

img

确认或固定模型可以这样设默认值:

1
2
hermes config set model.default grok-4.3
hermes config set model.provider xai-oauth

设置完之后,%USERPROFILE%\.hermes\config.yaml 里会出现类似这样的内容:

1
2
3
4
model:
default: grok-4.3
provider: xai-oauth
base_url: https://api.x.ai/v1

到这里,你已经有了一个用 Grok 驱动、带长期记忆的本地代理。和普通聊天框的区别在于:它跨会话不丢上下文,而且能动手干活。

第四步:启用语音和图像(同一个登录,无需额外配置)

这次集成有个容易被忽略但很实用的点:同一个 OAuth 令牌不仅覆盖文本,还覆盖语音、图像、视频、转写,不用为每项能力再单独认证。

打开工具选择器:

1
hermes tools

在菜单里给对应工具挑后端:

  • Text-to-Speech → 选 “xAI TTS”
  • Image Generation → 选 “xAI Grok Imagine (image)”
  • Video Generation → 选 “xAI Grok Imagine”

如果 OAuth 令牌已存在,选择器会直接确认并跳过凭证输入。

提醒两点:第一,视频生成默认关闭,需要在 hermes tools 里进入 🎬 Video Generation 用空格键手动开启。第二,图像默认模型大约 5–10 秒出图,想要更高保真可以选 quality 版,代价是 10–20 秒。

第五步:让它在后台自动干活(Windows 上的关键差异)

Windows 关键差异: Linux 靠 cron / systemd;原生 Windows 上 gateway 跑成后台 PowerShell 进程,定时调度走 Windows 计划任务(Scheduled Task)。别处教程写 crontab 的地方,这里对应计划任务——照搬 Linux 教程最容易卡在这。 具体配置见官方文档:Windows (Native) Guide 的 “gateway as a Scheduled Task” 节,及 “Automate Anything with Cron” / “Daily Briefing Bot” 教程。三条纪律:

  1. 先在 hermes 交互模式手动跑通,确认输出符合预期
  2. 验证过的指令再固化成计划任务,别直接写没测过的调度
  3. 要实时信息优先用 Grok 原生能力(模型层内置 X / 网络搜索,不必拼多步外部工具)

Windows 常见问题速查表

教程类文章最有用的部分往往是出问题时怎么办。下面是针对 Windows 整理的高频情况:

  1. hermes 命令找不到 / 不是可识别的命令 几乎都是因为没开新窗口。PATH 改动不作用于已打开的终端。解决:关掉当前 PowerShell,开一个全新的窗口,再 Get-Command hermes 验证。
  2. 控制台中文/emoji 显示乱码 原生 Windows 的非 ASCII 控制台输出是已知粗糙点。可以在环境变量里设 HERMES_DISABLE_WINDOWS_UTF8=1 回退到旧的 cp1252 stdio 路径(主要用于排查),或改用 Windows Terminal 而非老式 cmd 窗口。
  3. “No xAI credentials found”(运行时报找不到凭证) 还没登录,或凭证文件被删了。解决:hermes model 选 xAI Grok OAuth provider,或直接 hermes auth add xai-oauth
  4. 令牌过期但没自动重新登录 Hermes 会在每次会话前及遇到 401 时刷新令牌。若刷新令牌被吊销(你在 xAI 那边撤了授权,或账户轮换),它会给出明确的重新认证提示而非崩溃。解决:重跑 hermes auth add xai-oauth
  5. “Authorization timed out”(授权超时) 回环监听有 180 秒有效窗口,没及时批准就超时。解决:重跑 hermes auth add xai-oauthhermes model
  6. “State mismatch (possible CSRF)” Hermes 发现授权服务器返回的 state 与发出的不一致。解决:重新登录;反复出现就检查是否有代理或重定向在篡改 OAuth 响应。
  7. PowerShell 报执行策略错误,脚本无法运行 当前会话临时放开:Set-ExecutionPolicy -Scope Process -ExecutionPolicy Bypass,只作用于这个窗口。
  8. 想彻底登出 :hermes auth logout xai-oauth, 只想删某一条凭证池记录:先 hermes auth list xai-oauth 看清单,再 hermes auth remove xai-oauth <index|id|label>
  9. 想干净卸载整个 Hermes 官方卸载路径会移除 schtasks 计划任务条目、启动文件夹快捷方式、hermes.cmd 垫片,删除 %LOCALAPPDATA%\hermes\hermes-agent\,并清理用户 PATH。注意:你的数据目录 %USERPROFILE%\.hermes 不在自动清理范围内,需要保留或手动删除自行决定。

什么时候该切到 WSL2

出现以下任一信号,转 WSL2:

  • 需要 dashboard 网页内嵌终端面板(原生 Windows 无 POSIX PTY,仅此功能被禁,其余原生可用)
  • 要做稳定的生产自动化(长任务、常驻 gateway、多平台消息)——官方明确建议优先 WSL2 / Linux
  • 频繁遇到子进程、信号、路径分隔符的怪问题

切换:PowerShell 里 wsl --install 装 Ubuntu,在 WSL 里跑 curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash。两套可共存——原生数据在 %LOCALAPPDATA%\hermes,WSL~/.hermes

几条值得记住的实践纪律

  1. 实时数据 ≠ 准确数据。 Grok 可能把过时或讽刺内容当事实。高风险决策(金融、法律、危机)行动前交叉验证。
  2. 搜索成本会累积。 xAI 服务端搜索约 千次每天两三百次1/天,规模化要算进预算。
  3. 凭证当密码对待。 令牌在 %USERPROFILE%\.hermes\auth.json,能花你的订阅额度。别打包上传,别留在不可信机器,登出真的跑 hermes auth logout
  4. 先手动跑通,再固化成计划任务。 摩擦降到只剩”点一下授权”后,决定成败的是你有没有先想清楚它会在哪出错。
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×