告别 Gemini CLI!Google 新神器 Antigravity CLI 上手指南(Windows 新手版)

核心命令只有一个:agy

跟着这篇走,10 分钟搞定安装、登录、第一个 Prompt。

写在前面

Google 已于 2026 年 5 月 19 日正式宣布 Antigravity CLI 向所有人开放。

img

同时,Gemini CLI 将在 2026 年 6 月 18 日之后停止为免费用户、Google AI Pro 及 Ultra 用户提供服务。

也就是说——现在该换了

本文面向 Windows 新手,手把手带你完成安装、登录和第一次使用。

一、你需要准备什么

开始之前,确认你手边有这几样东西:

Antigravity CLI 原生支持 Windows、macOS 和 Linux,安装后统一通过 agy 命令启动,简洁干净。

二、安装 Antigravity CLI

Windows 推荐:用 PowerShell

打开 PowerShell,粘贴以下命令并回车:

1
irm https://antigravity.google/cli/install.ps1 | iex

备选:用 CMD

打开命令提示符(CMD),执行:

1
curl -fsSL https://antigravity.google/cli/install.cmd -o install.cmd && install.cmd && del install.cmd

macOS / Linux

1
curl -fsSL https://antigravity.google/cli/install.sh | bash

安装完成后,agy 会自动加入系统路径,无需手动配置。

三、验证是否安装成功

安装完成后,关闭终端,重新打开 PowerShell,输入:

1
agy --version

看到版本号,说明一切正常。

img

四、第一次登录

直接运行:agy

第一次启动会进入登录引导,你会看到:

img

普通个人用户选第 1 项:Google OAuth。

img

它会自动打开浏览器(未自动打开你可以复制链接到浏览器,自行打开授权),用你的 Google 账号完成授权。

img

授权成功后,按提示把授权码粘贴回终端。

img

复制授权码

img

填写授权码,等待登录

再接受一下条款,就完成了。

什么时候选第 2 项? 如果你是企业用户、有 GCP 项目或团队协作场景,才需要选 Use a Google Cloud project。个人用户无需考虑。

五、创建并进入测试项目

强烈建议新手先建一个空文件夹来练手,避免误改真实项目:

1
2
3
mkdir C:\Users\屎努比\Desktop\grokdemo1
cd C:\Users\屎努比\Desktop\grokdemo1
agy

第一次进入新文件夹,它会问你是否信任该目录:

img

Yes——Antigravity CLI 需要读取和操作当前目录里的文件,这是正常权限请求。

img

六、第一个 Prompt,现在就试

进入 agy 交互界面后,可以直接输入中文。

分析项目结构(推荐第一步): 你现在是我的编程助手。请先阅读当前项目结构,不要修改任何文件。然后用中文告诉我:这个项目是什么、主要文件有哪些、下一步适合做什么。

让它创建一个小页面: 请帮我创建一个最简单的 HTML + CSS + JS 页面,主题是待办事项列表, 要求页面简洁、可运行,并解释每个文件的作用。

新手提示:先不要开”完全自动执行”模式。让它给出修改计划,你确认后再执行,这样最安全。

七、常用内置命令速查

进入 agy 后,这几个命令最常用:

命令 作用
/settings 打开设置面板
/config 修改配置(主题、模型、工具权限等)
/permissions 查看或修改工具权限
? 查看快捷键和帮助

配置文件默认保存在: ~/.gemini/antigravity-cli/settings.json

八、如何更新

agy update 更新后重新打开终端,运行 agy --version 确认版本已更新。

九、常见问题解答

agy 提示”不是内部或外部命令”

环境变量未生效。解决方法:关闭 PowerShell,重新打开,再试一次。如果还不行,重新执行安装命令即可。

登录后反复要求重新登录

先执行更新:agy update

这个问题在 1.0.1 版本已修复,更新后重启 agy 即可恢复正常。WSL 环境下此问题偶发,同样建议更新解决。

十、新手练习路线图

刚开始别急着让它改大项目,按这个顺序循序渐进,最稳:

1
2
3
4
5
6
第一步:让它读取并分析项目结构
第二步:让它解释某段代码
第三步:让它新增一个小功能
第四步:让它修复一个明确的 bug
第五步:让它生成 README 文档
第六步:熟练后,再考虑让它重构项目

功能越来越强大,但每一步你都清楚发生了什么——这才是用好 AI 编程工具的正确姿势。

小结

Antigravity CLI 的使用门槛其实很低,核心就一个命令:agy。安装、登录、信任项目、开始对话,全程不超过 10 分钟。

Grok Build error sending request 怎么解决?排查了一晚上,问题出在这里

前几天装 Grok Build,被一个特别隐蔽的问题卡了一晚上。

折腾完之后回头看,发现这个坑其实很多人都会踩,踩了之后第一反应基本都是错的。今天把过程整个写出来,看完这篇你应该可以省不少时间。

报错长这样

我本地装好 Grok Build 之后,初始化要跳转 xAI 登录认证。浏览器那边一切正常,但终端这边一直转圈,过一会儿就甩出来这段:error sending request for url https://auth.x.ai/.well-known/openid-configuration

img

翻译就是:Grok Build 想去请求 auth.x.ai 获取登录配置,但是请求根本发不出去。

我开始全猜错

我的第一反应是这么排查的:重装、换号、升级、清配置,全没用。

折腾快一小时才反应过来,报错里写得明明白白:error sending request

请求压根没发出去——这是网络层的问题,跟上面那些一个都不沾边。

最反直觉的一点

根本原因是:

浏览器能上不等于终端能上

我们日常用的本地网络工具,默认只接管浏览器流量。PowerShell、CMD、Node.js 这些命令行工具,默认不读取系统网络配置,全走直连。Grok Build 的请求自然也没走配好的通道。

完整排查步骤

第 1 步:先确认浏览器能打开

浏览器手动访问:

1
https://auth.x.ai/.well-known/openid-configuration

能看到一大段 JSON 配置就说明你的本地网络环境没问题。打不开的话先解决网络环境本身。

第 2 步:找到本地网络工具的端口

不同网络工具端口不一样,千万别照搬别人的端口号

打开你自己常用的那个本地网络工具,找到”本地端口”或”入站端口”,把 HTTP 和 SOCKS 两个端口号都记下来。一般在主界面就能看到,类似:

1
本地: socks:XXXXX | http:XXXXX

第 3 步:在终端里手动配置环境变量

用 PowerShell 的话,输入下面的命令,把端口号换成你自己的:

1
2
3
$env:HTTP_PROXY="http://127.0.0.1:你的HTTP端口"
$env:HTTPS_PROXY="http://127.0.0.1:你的HTTP端口"
$env:ALL_PROXY="socks5://127.0.0.1:你的SOCKS端口"

用 CMD 的话,命令换成:

1
2
3
set HTTP_PROXY=http://127.0.0.1:你的HTTP端口
set HTTPS_PROXY=http://127.0.0.1:你的HTTP端口
set ALL_PROXY=socks5://127.0.0.1:你的SOCKS端口

这是告诉这个终端窗口:你后续发出的请求都走本地这些端口。

有个特别重要的细节

这个配置只在当前窗口生效,窗口一关就失效。所以下面所有的测试和最后跑 Grok Build,都必须在同一个窗口里完成。

第 4 步:用 curl 做对比测试

这一步是整个排查的关键,能精准定位问题。

先测带端口参数的版本:

1
curl.exe -x http://127.0.0.1:你的HTTP端口 https://auth.x.ai/.well-known/openid-configuration

返回一大段 JSON 就说明本地通道本身没问题。

再测不带端口参数的版本:

1
curl.exe https://auth.x.ai/.well-known/openid-configuration

如果这个失败、上面那个成功,就 100% 锁定了问题:命令行环境没读取系统的网络配置,必须靠手动设置环境变量解决。

第 5 步:在同一个窗口跑 Grok Build

1
grok-build

然后点击界面里的:

1
Login with Grok

正常情况下浏览器会自动弹出登录页,跳转完成回到终端就能继续了。

img

授权登录

写在最后

整个问题的核心其实就一句话:

浏览器和终端是两套独立的网络通道,给浏览器配好了,不等于给终端配好了。

排查方法简单四步:

  1. 看到 error sending request,先怀疑网络可达性,不要先怀疑软件本身。
  2. 分别验证浏览器侧和终端侧的可达性。
  3. 用 curl 带参数和不带参数各测一次,对比结果就能定位问题。
  4. 实在不行就开 TUN,一了百了。

这套思路不光适用于 Grok Build,所有需要联网的命令行工具都适用。各种 AI 命令行工具、npm install 超时之类的问题,本质上都是这一类。

希望这篇能帮你少走点弯路。

Grok Build 使用教程(2026 年最新版)

Grok Build 是 xAI 官方推出的终端 AI 编码代理(Coding Agent CLI),于 2026 年 5 月正式进入早期 Beta 阶段。它把强大的 Grok 模型直接塞进你的终端,能帮你完成从规划、搜索、编码、测试到 Git 提交的全流程工作。

它支持交互式 TUI(全屏、鼠标操作、无闪烁)、Plan Mode(先规划再执行)、并行子代理无头模式(脚本/自动化)、ACP 协议接入其他工具等特性,是目前最接近“专业软件工程师”的终端 AI 工具之一。

1. 前提条件

2. 安装 Grok Build

macOS / Linux

1
curl -fsSL https://x.ai/cli/install.sh | bash

Windows(PowerShell,管理员权限推荐)

1
irm https://x.ai/cli/install.ps1 | iex

安装完成后,终端输入 grok --version 验证是否成功。

3. 首次启动与登录

  1. 进入你的项目目录:cd /path/to/your/project
  2. 启动 Grok Build:grok

输入 grok 启动 Grok Build

  1. 首次登录: 会自动打开浏览器进行 xAI 账号授权(推荐)。

点击允许即可连接成功

无浏览器环境可手动设置环境变量:export XAI_API_KEY="xai-你的密钥" (密钥可在 https://console.x.ai/team/default/api-keys 获取)

登录成功后会进入全屏交互式 TUI 界面。

TUI 界面

4. TUI 界面操作指南

Grok Build 的 TUI 支持鼠标点击键盘快捷键,界面清晰无闪烁:

输入框:直接输入自然语言指令(如中文或英文)。

常用命令(在 TUI 内输入):

命令 功能说明
/help 打开动态帮助面板(推荐新手必用)
/plan 手动进入 Plan Mode
/yolo 或 /always-approve 开启/关闭自动批准模式(YOLO 模式)
/model <模型名> 切换模型
/inspect 查看当前项目加载的技能、插件与配置
/feedback 直接向 xAI 团队提交反馈(Beta 阶段非常有用)
/clear 清空当前会话历史

5. Plan Mode(强烈推荐用于复杂任务)

输入复杂需求前,先用 /plan 或启动时加标志进入规划模式。

Grok Build 会先输出完整执行计划(分步骤)。 你可以:

  • 逐条批准(Enter)
  • 评论修改某一步
  • 完全重写计划
  • 批准后,所有文件变更都会以干净的 diff 形式展示,确认无误后再执行。

Plan Mode 的三种常用方法

  1. 快捷键切换(最快,推荐日常使用) :在 TUI 中按 Shift + Tab 循环切换模式,直到状态栏显示 Plan。

Plan

  1. 使用 Slash 命令: 输入命令/plan/plan on后按回车。
  2. 启动时直接进入(适合复杂任务):grok --plan 或结合项目路径:cd your-project && grok --plan

退出或切换回 Normal 模式

再次按 Shift + Tab 切换到 Normal 模式或输入命令:/plan off

6. 基本使用示例

示例 1:新建项目

1
创建一个现代化的 React + TypeScript Todo App,带暗黑模式、拖拽排序、本地存储,使用 Tailwind CSS,风格参考 Apple

操作建议:

  1. 直接在空文件夹中启动 grok
  2. 推荐开启 Plan Mode,让 Grok Build 先输出项目结构、依赖清单和技术方案
  3. 批准计划后,它会自动创建 package.json、组件文件、样式,并初始化 Git 仓库

项目创建中

项目创建完成

预期效果:

  • 生成完整的项目结构(含 README、测试文件)

项目结构

  • 包含暗黑模式切换、拖拽排序(@dnd-kit)、本地持久化(localStorage + Zustand)
  • 自动安装依赖并运行 npm run dev

示例 1 结果预览

进阶技巧:

  • 追加需求:“加上用户登录界面和后端 API 模拟”
  • 完成后输入:“帮我部署到 Vercel 并生成部署脚本”

示例 2:分析现有项目

1
Explain this repo in detail. 重点分析架构、核心模块和潜在优化点。

示例 3:修改代码

1
@src/main.rs 帮我把这个文件重构为更清晰的模块结构,并添加错误处理。

示例 4:并行子代理(大型任务)

Grok Build 会自动拆分任务给多个子代理并行执行(如一个写前端、一个写后端、一个写测试)。

7. 无头模式(Headless)—— 脚本/自动化神器

适合 CI/CD、自动化脚本或嵌入其他工具:

1
2
3
4
5
# 简单执行
grok -p "为当前项目添加用户认证模块(JWT + 数据库)"

# 输出 JSON 便于解析
grok -p "分析这个代码库的安全问题" --output-format streaming-json

8. 高级功能

功能 说明 如何使用
并行子代理 大任务自动拆分多个代理同时工作 自然语言描述即可
Git 深度集成 自动创建分支、提交、生成 PR 直接说“提交这些改动”
自定义配置 支持 AGENTS.md、技能、插件、MCP 服务器 项目根目录放置即可
自定义模型 可接入其他模型 配置文件 + /model 切换
ACP 协议 可接入 IDE、其他 Agent 框架 官方支持
Inspect 查看当前项目已加载的配置、技能等 grok inspect

9. 实用技巧 & 注意事项

  • 最好在 Git 仓库根目录运行,效果最强。
  • 大项目建议先用 Plan Mode,避免一次性改太多。
  • 图片支持:可直接粘贴截图让它分析 UI 或报错。
  • 多任务切换:支持同时运行多个 Grok Build 实例。
  • Beta 阶段:偶尔会有小 bug,遇到问题请用 /feedback 反馈。
  • 卸载:参考官方文档或删除对应二进制文件。

10 分钟实战:手把手教你用 Google AI Studio 做一个能用的安卓 App

Google Android 开发者博客宣布:AI Studio 正式支持在浏览器里生成原生 Android 应用——不是 H5 套壳,而是用 Kotlin + Jetpack Compose 构建的、能调用 GPS、蓝牙、NFC、摄像头的真原生 App。

img

在 Google AI Studio 中构建原生安卓应用

打开浏览器,描述需求,几分钟后 App 跑在你手机上。全程零安装、零配置。

这篇文章前半段讲清楚它是什么、能做什么、不能做什么;后半段是一份能跟着做的 10 分钟实战教程。读完你就能决定:今晚要不要打开它。

目录

  • Part 1:30 秒看懂这次更新
  • Part 2:它适合做什么(以及做不好什么)
  • Part 3:10 分钟实战教程——从零到手机上跑起来
  • Part 4:必须知道的边界
  • Part 5:Prompt 速查表

Part 1:30 秒看懂这次更新

① 入口:ai.dev/apps,零安装

img

ai.dev/apps

不需要 Android Studio,不需要 JDK,打开网页即用。

② 输出:真·原生 App

img

Kotlin + Jetpack Compose

Google 官方栈 Kotlin + Jetpack Compose,支持离线、后台服务、完整的硬件传感器调用——GPS、蓝牙、NFC、摄像头、加速度计。

这是 AI Studio 与所有”AI 建站”工具的根本区别——Web App 永远做不到这些。

③ 预览:浏览器内置 Emulator

内嵌完整安卓模拟器,在浏览器里直接预览交互手感,无需切换工具。

④ 真机:USB 一键安装

通过集成的 ADB,手机连电脑、点一下,App 就装到桌面。

⑤ 分发:直发 Play 内部测试

有 Play 开发者账号,可直接从 AI Studio 发布到 Google Play 内部测试轨道——不打包、不签名、不走传统流程。

⑥ 进阶:无缝”毕业”到 Android Studio

一键导出 ZIP 或推 GitHub,继续在 Android Studio 做精细打磨。

Part 2:它适合做什么(以及做不好什么)

官方甜区,三类应用:

  • 工具型 —— 计算器、记账、待办、单位换算。功能清晰、不依赖后端的小工具。
  • 硬件交互型 —— 运动记录、NFC 读卡、摄像头扫描、麦克风录音。Web App 做不到的事,这里都能做。
  • AI 原生型 —— AI 翻译、AI 笔记、AI 助手、AI 画图。这一类是 Google 最想推的——直接带动 Gemini API 调用。

当下做不好的事:超过 3-4 屏的复杂导航、深度依赖第三方 SDK(支付/IM/广告)、复杂数据库设计、对性能极敏感的场景(游戏/音视频)。

海外开发者吐槽得很准:”做 toy app 看着很酷,你让它做超过 3 屏的东西试试看。”——这是事实,但这只是 v1,Firebase 集成、Play Test Tracks 直管都在路上。

Part 3:10 分钟实战教程——从零到手机上跑起来

准备

img

Chrome + Google 账号 +(可选)安卓手机 + USB 线

  1. Chrome
  2. Google 账号
  3. (可选)安卓手机
  4. USB 线。

不知道怎么注册谷歌邮箱可以点击查看文章:

2026 年国内最新注册 Gmail 谷歌邮箱教程 | 一部手机五分钟,注册成功率90%以上

Step 1. 打开

访问 ai.dev/apps,登录,新建项目。

img

ai.dev/apps

界面三块:左侧对话框 / 中间代码预览 / 右侧模拟器

Step 2. 写 Prompt(决定 70% 成品质量)

不要写:”做一个喝水提醒 App”

要这样写:

1
2
3
4
5
6
7
8
9
10
11
做一个原生 Android App,主题是喝水提醒。

【功能】
1. 主页显示今日进度(已喝/目标),圆形进度环
2. 三个按钮:+100ml、+250ml、+500ml
3. 设置页可改每日目标(默认 2000ml)
4. 历史页:过去 7 天柱状图
5. 定时提醒(本地通知)

【设计】Material You,蓝色主调,支持深色模式
【技术】Jetpack Compose + DataStore

img

选择设计样式

功能列清单,设计给参考,技术指明确。Prompt 写得有多结构化,AI 做出来就有多接近”高级工程师”。

Step 3. 等生成(2-5 分钟)

img

生成中……

AI 自动:列计划 → 生成代码 → 编译 → 启动模拟器

首次编译失败是常态,别管,它会自己修。连修 3 次失败,说明 Prompt 有矛盾——回去精简,比硬改代码快 10 倍。

Step 4. 在模拟器里试

img

模拟器找一找毛病

点每个按钮、切每个页面、切深色模式。

这一步不是验收,是找毛病。一次成型几乎不可能,2-4 轮迭代才是常态。

Step 5. 用自然语言迭代

铁律:一次只改一件事

想改什么 这么说
UI “进度环放大到屏宽 70%,按钮改圆角矩形”
交互 “点 +100ml 加震动反馈和数字飘动动画”
配色 “主色改 #4A90E2,深色模式背景纯黑”
功能 “加撤销按钮,撤销最近一次记录”
Bug “切回主页进度显示不对,排查并修复”

经验:UI 改动放心交给 AI,业务逻辑改完务必全 App 点一遍——AI 经常”按下葫芦浮起瓢”

Step 6. 装到自己手机上

手机端:设置 → 关于手机 → 连点 7 次”版本号”打开开发者模式 → 开发者选项打开 USB 调试 → 连数据线。

img

AI Studio 端:点 Install via USB

img

安装应用

选择设备 → 手机授权(选”继续安装”)

img

等约 1 分钟 → 桌面出 App 图标

img

App样式

踩坑速查:

  • 识别不到设备 → 换数据线(很多 USB 线只能充电)
  • INSTALL_FAILED_USER_RESTRICTED → 开发者选项再开”USB 安装应用”
  • 国产手机 → 搜”XX 品牌 开启 USB 调试”,通常还要额外授权

Step 7. 之后怎么办

想干嘛 怎么走
自己用 留在 AI Studio 改,够了
发朋友测试 有 Play 账号直接发内部测试
正式上架 导出到 Android Studio 精修
加云端 等 Firebase 集成(官方已预告)

Part 4:必须知道的边界

擅长:3-4 屏工具型 App、Material 风格 UI、Compose 标准组件、硬件传感器调用

做不好:复杂业务逻辑、性能与内存优化、复杂自定义动画、第三方 SDK 深度集成

AI 做前 80% 的脚手架,你做后 20% 的精修。前者决定速度,后者决定品质。

Part 5:Prompt 速查表

1
2
3
4
5
6
7
【新建】做一个原生 Android App,主题[X],
功能:1...2...3...,设计[X],技术 Compose + DataStore
【改 UI】把[组件]改成[样式],尺寸[X],位置[X]
【加交互】点[X]时加[震动/动画/音效]反馈
【改色】主色改 #XXXXXX,深色模式下[X]
【加功能】在[页面]新增[功能],逻辑是[X]
【修 bug】[场景描述],出现[问题],排查并修复

铁律,只有一条:一次只改一件事。

本地 AI 代理神器 + Grok 模型,5–15 分钟搞定 24/7 智能助手

OpenClaw(原 Clawdbot/Moltbot)是目前最火的开源本地 AI 代理框架。它能通过 WhatsApp、Telegram、Discord 等聊天工具,让 Grok 等大模型真正”动手”做事——发邮件、管理日历、运行脚本、搜索网页、生成图片视频。

Grok(xAI)已原生深度集成到 OpenClaw 中,支持网页搜索、X 搜索、代码执行、图像/视频生成等高级功能,性价比高、工具调用稳定。

img

本文针对 Windows 用户,提供最详细、最实操的干货教程,全程使用原生 Windows 方案(无需 WSL)。

目录:

一、为什么在 Windows 上用 OpenClaw + Grok?

二、前置准备

三、原生 Windows 安装

四、Grok 模型配置与验证

五、启用 Grok 高级功能

六、连接 Telegram,实现手机远程指挥

七、常见问题与解决方案

八、维护与进阶建议

一、为什么在 Windows 上用 OpenClaw + Grok?

优势 说明
本地运行 数据不上传,隐私安全
Grok 原生支持 聊天 + 网页搜索 + X 搜索 + 代码执行 + 生图生视频
多渠道交互 手机 Telegram/WhatsApp 就能指挥
24/7 运行 设置守护进程后开机自启
成本可控 Grok fast 模型日常使用费用很低

推荐模型(2026 年最新):

  • 日常主力:grok-4.3(最均衡)
  • 追求速度:grok-4-fast / grok-4.1-fast
  • 代码开发:grok-code-fast-1

二、前置准备

preview

  1. Windows 10 / 11(推荐 Windows 11)
  2. 下载安装最新版 Node.js(官网 LTS 版本)
  3. SuperGrokX Premium 订阅(推荐 SuperGrok 官方订阅升级服务 : cnmGrok.com

三、原生 Windows 安装

1. 以管理员身份打开 PowerShell

Win + X,选择 PowerShell(管理员)

img

Win+X 选择 PowerShell(管理员)

2. 执行安装命令

1
iwr -useb https://openclaw.ai/install.ps1 | iex

img

执行命令

如果提示执行策略问题,先运行下面这条,再重试上一步:

1
Set-ExecutionPolicy RemoteSigned -Scope CurrentUser

3. 运行配置向导

1
openclaw onboard --install-daemon

按提示操作:

  • 模型提供商:选择 xAI
  • 认证方式:选择 xAI OAuth

img

选择 xAI OAuth

浏览器弹出授权页,点击”允许”即可连接成功。

img

允许即可连接成功

4. 自启动机制说明

原生 Windows 会优先尝试创建计划任务(Scheduled Task) 实现开机自启,若失败则回退到用户启动文件夹。无需手动干预。

四、Grok 模型配置与验证

1. 手动配置模型(可选)

配置文件路径:

1
C:\Users\你的用户名\.openclaw\openclaw.json

推荐配置:

1
2
3
4
5
6
7
8
9
{
"agents": {
"defaults": {
"model": {
"primary": "xai/grok-4.3"
}
}
}
}

如需切换其他模型(例如 grok-4-fast),直接修改 primary 字段即可。

2. 永久设置 API Key(可选)

若使用 API Key 方式认证,建议通过系统环境变量图形界面添加 XAI_API_KEY,避免每次启动重新输入。

3. 重启 Gateway

1
openclaw gateway restart

4. 验证是否成功

打开 Dashboard:

1
openclaw dashboard

浏览器访问 http://127.0.0.1:18789/,在聊天框输入测试:你是什么模型?

img

验证模型

如果回复中提到 Grok,说明整合成功。

五、启用 Grok 高级功能

网页搜索(强烈推荐开启)

1
openclaw config set tools.web.search.provider grok

img

开启网页搜索

其他原生支持功能(无需额外配置)

  • 图像生成:默认支持 grok-imagine-image
  • 视频生成:支持 grok-imagine-video
  • X 搜索(x_search):自动可用
  • 代码执行:自动可用
  • 文字转语音 / 语音转文字:已内置支持

六、连接 Telegram,实现手机远程指挥

1. 创建 Telegram Bot

打开 Telegram,搜索 @BotFather

img

BotFather

发送 /newbot,按提示创建机器人。完成后复制 Bot Token,格式类似 1234567890:AAxxxxxx

img

获取 Bot Token

2. 配置 OpenClaw

在 PowerShell 输入: notepad "$env:USERPROFILE\.openclaw\openclaw.json"

打开配置文件

添加 Telegram 配置:

1
2
3
4
5
6
7
8
9
{
"channels": {
"telegram": {
"enabled": true,
"botToken": "你的Bot Token",
"dmPolicy": "pairing"
}
}
}

如果文件里已有内容,不要整份覆盖,只合并 channels.telegram 字段。

3. 启动 Gateway

在 powershell 输入: openclaw gateway

4. 私聊 Bot 触发配对

在 Telegram 打开你创建的 Bot,发送:/start

Bot 会返回一段配对码,复制下来。

img

Bot 返回配对码

5. 在 PowerShell 批准配对

在 powershell 输入:openclaw pairing approve telegram 你的配对码

6. 测试连接

在 Telegram 给 Bot 发一句:你好

收到回复即代表 Telegram 接入成功。

img

Telegram 连接成功

七、常见问题与解决方案

问题 解决方案
PowerShell 执行策略报错 以管理员运行 Set-ExecutionPolicy RemoteSigned -Scope CurrentUser
守护进程未自启动 执行 openclaw gateway install
Dashboard 打不开 确认 Gateway 正在运行,检查端口 18789 是否被占用
想远程访问 配置 Telegram / Discord,或使用 Tailscale 组网
更新 OpenClaw 重新运行安装脚本,或执行 openclaw update

八、维护与进阶建议

  • 定期更新:运行安装脚本或 openclaw update
  • 查看日志openclaw gateway logs
  • 成本控制:日常用 fast 系列模型,复杂任务再切换到 grok-4.3
  • 配置备份:定期备份 C:\Users\你的用户名\.openclaw\ 整个文件夹
  • 多 Agent 进阶:后期可配置多个专业 Agent(研究、coding、自动化等)分工协作

总结

到这里,你已经在 Windows 上完成了 OpenClaw + Grok 的完整本地部署,拥有一个真正能”干活”的 24/7 AI 助手。

建议的体验路径:

  1. 先用 Dashboard 测试——确认模型、工具、生成能力都正常
  2. 再接入 Telegram——实现手机远程指挥
  3. 最后做自动化——把高频任务串成 Agent 工作流

至此,本地 AI 代理就真正跑起来了。

在 Windows 上用 Grok 订阅跑通 Hermes Agent(零 API key,15 分钟上手)

趁着 xAI 把 Grok 订阅接进开源代理 Hermes 这条热点,这篇文章不谈观点,只带你在 Windows 10 / 11 上动手:从 PowerShell 安装到第一次对话,再到把它变成一个会定时干活的代理。全程不需要申请 API key,也不需要额外计费——你已经付费的 Grok 订阅就是入场券。

先说一句重要的话:原生 Windows 是早期 Beta

在动手之前,这一点必须摆在最前面,因为它会影响你的选择。

Hermes 现在可以在 Windows 10 / 11 上原生运行——不需要 WSL、不需要 Cygwin、不需要 Docker。但官方明确把原生 Windows 标记为 early beta:它能装能跑,也通过了 Windows 相关的检查,但没有像 Linux/macOS/WSL2 路径那样被大规模实测过。粗糙的地方主要集中在子进程处理、路径怪癖和非 ASCII 控制台输出上。

所以请按这个判断来选:

  • 个人尝鲜、轻量 CLI、本地试用 → 原生 Windows 完全够用,按本文走
  • 要长期挂 gateway、跑长任务、多平台消息接入做生产自动化 → 官方建议优先用 WSL2 或 Linux 服务器

本文走原生 Windows 路径;文末会给出何时该切到 WSL2 的明确信号。

你将得到什么

跟完这篇教程,你会在 Windows 上拥有一个本地运行的 Hermes Agent,它用你的 Grok 订阅做推理,能跨会话记事,并且可以挂一个定时任务在后台自动跑。整个过程大概 15 分钟。

需要先确认的前提:

  • Windows 10 或 Windows 11(64 位;32 位会缺失 bash,功能受限)
  • 一个仍在生效的 Grok 订阅(任意档位的 SuperGrok,或含 Grok 权益的 X Premium)
  • 一个能打开网页的浏览器(本机即可)
  • 不需要预装 Python、Node.js 或 Git——安装器会自带一套隔离环境

关于依赖:Hermes 采用”零依赖”安装哲学。安装器会自行provision uv、Python 3.11、Node.js、ripgrep、ffmpeg,以及一份便携式 Git Bash(PortableGit,解包到 %LOCALAPPDATA%\hermes,不需要管理员权限,也不会碰你系统里已有的 Git)。如果你已经装了 Git,它会检测到并直接用。

第一步:用 PowerShell 安装 Hermes Agent

用普通权限打开 PowerShell(不需要”以管理员身份运行”),执行官方一行安装命令:

1
irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex

img

这条命令会把文件部署到 %LOCALAPPDATA%\hermes\,并把 hermes 加到你的用户级 PATH

它在背后做的事大致是:装 uv、Python 3.11、Node.js、ripgrep、ffmpeg、便携 Git Bash,克隆仓库到 %LOCALAPPDATA%\hermes\hermes-agent,建虚拟环境,最后跑一遍首次设置向导(选模型、provider、工具集)。

装完后最关键的一步,也是 Windows 上最容易踩的坑: PATH 改动不会作用于已经开着的终端窗口。你必须关掉当前 PowerShell,再开一个新的窗口(或新开一个 Windows Terminal 标签页),hermes 命令才会生效。不要用 $env:PATH += ... 手工临时拼,除非你清楚自己在做什么。

新开窗口后验证安装:

1
2
hermes --version
hermes doctor

img

hermes doctor 是这篇教程里你会反复用到的”体检命令”。它会列出环境、依赖和各个认证 provider 的状态。现在你应该能看到一个 ◆ Auth Providers 区块,里面的 xai-oauth 还是未登录状态——这正常,下一步解决。

img

安全提醒:irm ... | iex 等于把远程脚本直接执行,和 Linux 上的 curl | bash 是一回事,值得谨慎。想先审一遍脚本,可以把那个 URL 在浏览器里打开读一遍,或者先 irm <url> -OutFile install.ps1 存下来检查后再运行。

如果遇到 PowerShell 执行策略阻止脚本运行,可在当前会话临时放开(仅作用于这个窗口,不改全局):Set-ExecutionPolicy -Scope Process -ExecutionPolicy Bypass,然后重跑安装命令。

第二步:用 Grok 订阅登录(核心步骤)

这一步就是整条新闻的关键所在——浏览器一次授权,代替了传统的 API key 流程。

在新开的 PowerShell 窗口里走模型选择器:

1
hermes model

接下来会发生这些事:

  1. 从 provider 列表里选择 “xAI Grok OAuth (SuperGrok Subscription)”

img

  1. Hermes 自动打开你的默认浏览器,跳到 accounts.x.ai

img

  1. 你在浏览器里登录(或确认已登录的会话)并点击批准

img

  1. xAI 重定向回 Hermes,令牌保存到 %USERPROFILE%\.hermes\auth.json
  2. 回到选择器,挑一个模型——grok-4.3 永远被钉在列表最上面

img

  1. 完成

如果你只想单独触发登录、不进模型选择器:

1
hermes auth add xai-oauth

登录成功后,Hermes 会在每次会话前自动刷新令牌,你不用再管它,直到主动登出或在 xAI 账户设置里吊销授权。

再体检一次确认:

1
hermes doctor

这次 xai-oauth 那一行应该显示为已认证。

img

Windows 数据目录说明:%LOCALAPPDATA%\hermes 是可丢弃的基础设施(删掉后重跑安装命令即可恢复);而 %USERPROFILE%\.hermes 是你的数据——配置、记忆、skills、会话历史,结构和 Linux 安装完全一致。把这个目录在机器间同步,你的 Hermes 就跟着走。

常见小坑:浏览器授权有 180 秒超时窗口。点开浏览器后别去倒水了再回来,否则会看到 “Authorization timed out”。不要紧,重跑 hermes auth add xai-oauth 即可。

关于 SuperGrok 订阅: 这是本教程唯一的付费前提。值得注意的是,这次集成对所有订阅档位开放(xAI 未限制在高级套餐),且同一个登录就覆盖文本、语音、图像、视频、转写——相比单独申请 API key 还要管理速率和计费,订阅路径对个人用户更省心。推荐 SuperGrok 官方订阅升级服务 : cnmGrok.com

第三步:第一次对话

万事俱备,直接启动:

1
hermes

img

随便问点什么,确认 Grok 真的在背后回应——让它做一道需要推理的题,或者解释一段代码。

img

确认或固定模型可以这样设默认值:

1
2
hermes config set model.default grok-4.3
hermes config set model.provider xai-oauth

设置完之后,%USERPROFILE%\.hermes\config.yaml 里会出现类似这样的内容:

1
2
3
4
model:
default: grok-4.3
provider: xai-oauth
base_url: https://api.x.ai/v1

到这里,你已经有了一个用 Grok 驱动、带长期记忆的本地代理。和普通聊天框的区别在于:它跨会话不丢上下文,而且能动手干活。

第四步:启用语音和图像(同一个登录,无需额外配置)

这次集成有个容易被忽略但很实用的点:同一个 OAuth 令牌不仅覆盖文本,还覆盖语音、图像、视频、转写,不用为每项能力再单独认证。

打开工具选择器:

1
hermes tools

在菜单里给对应工具挑后端:

  • Text-to-Speech → 选 “xAI TTS”
  • Image Generation → 选 “xAI Grok Imagine (image)”
  • Video Generation → 选 “xAI Grok Imagine”

如果 OAuth 令牌已存在,选择器会直接确认并跳过凭证输入。

提醒两点:第一,视频生成默认关闭,需要在 hermes tools 里进入 🎬 Video Generation 用空格键手动开启。第二,图像默认模型大约 5–10 秒出图,想要更高保真可以选 quality 版,代价是 10–20 秒。

第五步:让它在后台自动干活(Windows 上的关键差异)

Windows 关键差异: Linux 靠 cron / systemd;原生 Windows 上 gateway 跑成后台 PowerShell 进程,定时调度走 Windows 计划任务(Scheduled Task)。别处教程写 crontab 的地方,这里对应计划任务——照搬 Linux 教程最容易卡在这。 具体配置见官方文档:Windows (Native) Guide 的 “gateway as a Scheduled Task” 节,及 “Automate Anything with Cron” / “Daily Briefing Bot” 教程。三条纪律:

  1. 先在 hermes 交互模式手动跑通,确认输出符合预期
  2. 验证过的指令再固化成计划任务,别直接写没测过的调度
  3. 要实时信息优先用 Grok 原生能力(模型层内置 X / 网络搜索,不必拼多步外部工具)

Windows 常见问题速查表

教程类文章最有用的部分往往是出问题时怎么办。下面是针对 Windows 整理的高频情况:

  1. hermes 命令找不到 / 不是可识别的命令 几乎都是因为没开新窗口。PATH 改动不作用于已打开的终端。解决:关掉当前 PowerShell,开一个全新的窗口,再 Get-Command hermes 验证。
  2. 控制台中文/emoji 显示乱码 原生 Windows 的非 ASCII 控制台输出是已知粗糙点。可以在环境变量里设 HERMES_DISABLE_WINDOWS_UTF8=1 回退到旧的 cp1252 stdio 路径(主要用于排查),或改用 Windows Terminal 而非老式 cmd 窗口。
  3. “No xAI credentials found”(运行时报找不到凭证) 还没登录,或凭证文件被删了。解决:hermes model 选 xAI Grok OAuth provider,或直接 hermes auth add xai-oauth
  4. 令牌过期但没自动重新登录 Hermes 会在每次会话前及遇到 401 时刷新令牌。若刷新令牌被吊销(你在 xAI 那边撤了授权,或账户轮换),它会给出明确的重新认证提示而非崩溃。解决:重跑 hermes auth add xai-oauth
  5. “Authorization timed out”(授权超时) 回环监听有 180 秒有效窗口,没及时批准就超时。解决:重跑 hermes auth add xai-oauthhermes model
  6. “State mismatch (possible CSRF)” Hermes 发现授权服务器返回的 state 与发出的不一致。解决:重新登录;反复出现就检查是否有代理或重定向在篡改 OAuth 响应。
  7. PowerShell 报执行策略错误,脚本无法运行 当前会话临时放开:Set-ExecutionPolicy -Scope Process -ExecutionPolicy Bypass,只作用于这个窗口。
  8. 想彻底登出 :hermes auth logout xai-oauth, 只想删某一条凭证池记录:先 hermes auth list xai-oauth 看清单,再 hermes auth remove xai-oauth <index|id|label>
  9. 想干净卸载整个 Hermes 官方卸载路径会移除 schtasks 计划任务条目、启动文件夹快捷方式、hermes.cmd 垫片,删除 %LOCALAPPDATA%\hermes\hermes-agent\,并清理用户 PATH。注意:你的数据目录 %USERPROFILE%\.hermes 不在自动清理范围内,需要保留或手动删除自行决定。

什么时候该切到 WSL2

出现以下任一信号,转 WSL2:

  • 需要 dashboard 网页内嵌终端面板(原生 Windows 无 POSIX PTY,仅此功能被禁,其余原生可用)
  • 要做稳定的生产自动化(长任务、常驻 gateway、多平台消息)——官方明确建议优先 WSL2 / Linux
  • 频繁遇到子进程、信号、路径分隔符的怪问题

切换:PowerShell 里 wsl --install 装 Ubuntu,在 WSL 里跑 curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash。两套可共存——原生数据在 %LOCALAPPDATA%\hermes,WSL~/.hermes

几条值得记住的实践纪律

  1. 实时数据 ≠ 准确数据。 Grok 可能把过时或讽刺内容当事实。高风险决策(金融、法律、危机)行动前交叉验证。
  2. 搜索成本会累积。 xAI 服务端搜索约 千次每天两三百次1/天,规模化要算进预算。
  3. 凭证当密码对待。 令牌在 %USERPROFILE%\.hermes\auth.json,能花你的订阅额度。别打包上传,别留在不可信机器,登出真的跑 hermes auth logout
  4. 先手动跑通,再固化成计划任务。 摩擦降到只剩”点一下授权”后,决定成败的是你有没有先想清楚它会在哪出错。

img

Claude for Microsoft 365 是 Anthropic 推出的 AI 生产力集成方案,允许你在 Excel、PowerPoint、Word、Outlook 中直接调用 Claude 助手。

无需切换工具,无需重复粘贴上下文—— Claude 会在不同应用之间保持完整的对话记忆。

核心亮点:

  • 跨应用上下文连续性:从邮件到报告到数据模型到演示稿,一次对话全程贯通
  • 原生集成:生成内容直接嵌入 Office,支持修订模式、图表、模板
  • 安全优先:所有操作需手动确认,不会自动发送或保存
  • 企业合规:支持 Microsoft Foundry、Amazon Bedrock、Google Cloud Vertex AI 部署

各应用支持状态

应用 状态 说明
Excel 正式版 GA 数据分析、建立财务模型、公式优化
PowerPoint 正式版 GA 基于模板自动生成演示稿,图表原生可编辑
Word 正式版 GA 文档改写与生成,支持修订模式
Outlook 公测 Beta 邮件起草与分类、日历安排

一、使用要求

条件 说明
Claude 付费计划 Pro / Team / Enterprise 均可,免费版不支持
Microsoft 365 桌面版或 Web 版均可,桌面版体验更佳
账号登录 Claude 账号,或企业云服务商凭证
企业部署(可选) Microsoft Foundry、Amazon Bedrock、Google Cloud Vertex AI

Claude Pro 升级订阅教程,可参考本文第七部分

二、安装步骤

主插件安装(Word / Excel / PowerPoint)

打开官方安装页面:https://claude.com/claude-for-microsoft-365

img

点击 “Install Claude for Microsoft 365”

img

按提示授权并完成安装(通常不超过 2 分钟)

img

打开任意 Office 应用(以 Word 为例),顶部菜单 Home / InsertAdd-ins(加载项),Claude

img

在侧边栏用 Claude 账号登录

img

提示: 安装一次后,侧边栏会自动出现在 Word、Excel、PowerPoint 中,无需重复安装。

Outlook 插件安装(公测版)

在同一安装页面找到 Outlook Beta 专属链接,单独安装

img

打开 Outlook ,Ribbon 功能区找到 Claude 按钮

img

登录账号后即可使用

注意: Outlook 目前为公测阶段,功能持续更新,建议关注官方公告。

三、各应用详细使用方法

1.Outlook——邮件管理与起草

Outlook 集成是最直观的入门起点,适合作为跨应用工作流的起点。

主要功能:

  • 自动整理收件箱,识别优先邮件
  • 以你的语气起草回复
  • 从邮件内容安排日历事项
  • 一键生成邮件摘要

操作方式:

  1. 打开任意邮件
  2. 点击 Ribbon 上的 Claude 按钮,侧边栏展开
  3. 输入需求
  4. 起草的回复会在 Outlook 原生撰写窗口打开,你确认后才发送

示例提示词:

1
2
帮我整理收件箱,哪些邮件需要优先回复?
请以正式语气帮我回复这封邮件,感谢对方提案并说明我们需要一周时间评估

2. Word——文档撰写与改写

主要功能:

  • 根据简报或笔记生成完整文档
  • 改写现有内容:调整语气、格式、正式程度
  • 保留原有标题样式、编号、格式结构
  • 支持修订模式(Tracked Changes),逐一审核所有改动
  • 支持插入 PDF / Word 参考文件到侧边栏

操作方式:

  1. 打开文档,Claude 侧边栏(Add-ins → Claude)
  2. 如需参考其他文件,在侧边栏上传 PDF 或 Word
  3. 输入需求,Claude 以修订模式显示改动
  4. 在「审阅」选项卡中逐一接受或拒绝修改

示例提示词:

1
2
用公司模板帮我把这份备忘录改写成正式版,保留标题样式和编号
根据这份会议纪要,写一份给高管阅读的两页执行摘要,使用正式语气

3. Excel——数据分析与建模

主要功能:

  • 分析现有数据,识别趋势和异常
  • 建立财务模型,自动生成带注释的公式
  • 修改表格结构,高亮显示变更区域
  • 不破坏原有公式,支持撤销
  • 可跨应用引用 Word 文档中的内容

操作方式:

  1. 打开 Excel 工作簿,选中目标区域(可选)
  2. 在 Claude 侧边栏描述需求
  3. 修改后变更区域高亮显示,便于核查

示例提示词:

1
2
根据 Word 里的项目简报,帮我建一个完整的财务模型,公式要清晰,加上行注释
分析这个销售数据表,找出增长最快的三个产品类别,并在旁边新建一列标注

4. PowerPoint——演示稿生成

主要功能:

  • 基于现有模板和母版生成幻灯片
  • 从 Word / Excel 内容一键转化为演示稿
  • 生成的图表和布局可直接在 PowerPoint 中编辑
  • 保持公司品牌风格一致性

操作方式:

  1. 打开 PowerPoint(或新建并应用公司模板)
  2. 在侧边栏说明内容来源和要求
  3. 生成后在普通视图中直接编辑任何元素

示例提示词:

1
2
根据 Excel 数据和 Word 简报,帮我做一套符合公司风格的演示稿,8 到 10 页,重点突出财务数据
把这个 5 页报告浓缩成 3 页高管摘要 PPT,每页一个核心结论

四、跨应用工作流(最强功能)

Claude 在不同应用间携带完整对话上下文——你无需重复粘贴内容,它记住之前所有步骤。

实战示例:月度财务报告全流程

img

  1. Outlook: “帮我总结本月来自财务部门的邮件,提取关键数据点”
  2. Word: “把刚才邮件里的数据整理成月度财务简报,使用公司模板”
  3. Excel: “根据简报中的数字,建立收支对比模型,加上同比增长列”
  4. PowerPoint: “根据 Excel 模型和 Word 简报,生成董事会汇报 PPT,6 页”

重要: 整个流程中 Claude 始终记住前面步骤的所有内容,无需重复输入任何数据。

五、实用技巧

输入技巧

明确告诉 Claude 你的格式要求,它会严格遵守:

  • 指定模板: “使用公司标准模板”、”保持现有标题层级”
  • 限定范围: “只修改第三节”、”不要动原有公式”
  • 明确风格: “正式商务语气”、”简洁、高管阅读”
  • 指定长度: “不超过两页”、”压缩到 500 字”

语音输入

侧边栏支持 Dictation(语音输入)。在侧边栏输入框中点击麦克风图标即可开始,适合起草长邮件时使用。

保存技能(Skills)

  • 在 Claude 账号设置中找到 Skills 管理
  • 将高频工作流保存为可复用模板
  • 团队成员可共享技能,统一工作标准

安全机制

所有操作均需手动确认:

  • Word 改动以修订模式显示,逐一审核后接受
  • Excel 变更区域高亮标注,不会自动覆盖原始数据
  • Outlook 起草的邮件在原生撰写窗口等待你确认发送
  • PowerPoint 生成后可在普通视图逐张审核

六、快速上手建议

先从 Outlook 开始试用(最直观),然后顺着流程走:

步骤 应用 目标
1 Outlook 感受 Claude 理解邮件意图的能力
2 Word 把邮件转为文档,体验上下文延续
3 Excel 根据文档内容建模,验证跨应用记忆
4 PowerPoint 一键生成演示稿,感受完整流程

七、Claude Pro 如何订阅升级

Claude 的风控主要针对 IP 和非本地信用卡。代充直接解决了支付端的“水土不服”,而且不需要你研究什么指纹浏览器,什么纯净 IP。

推荐自己一直在用的一个靠谱渠道(操作简单、秒到账):http://cnmClaude.com

img

升级步骤

  • 登录你的 Claude 账号 (https://claude.ai)。
  • 进入设置 → 账户信息 → 复制ID

img

  • 在代充平台,直接用微信/支付宝支付下单购买 Claude Pro 订阅卡密

img

  • 粘贴你刚才复制的账户 ID

img

刷新 Claude 页面后,就能看到 Pro 标识。升级成功后,Artifacts 等高级功能可以正常使用,整体使用额度也会明显提升。

八、常用提示词速查表

应用 场景 示例提示词
Outlook 邮件优先级 整理收件箱,哪些邮件需要今天回复?
Outlook 起草回复 以我的语气回复这封邮件,感谢并约定下周会议
Word 改写文档 将这份备忘录改写成正式报告,保留所有小标题
Word 摘要提取 从这份 20 页报告中提取 3 个核心结论,写成执行摘要
Excel 建立模型 建立 Q4 销售预测模型,包含同比和环比对比
Excel 数据清洗 找出这列数据中的异常值,在旁边新列标注原因
PowerPoint 生成 PPT 根据这份 Word 简报生成 8 页汇报 PPT,突出关键数据
PowerPoint 精简幻灯片 把这 15 页压缩成 6 页高管摘要版,每页一个核心点

开始使用: https://claude.com/claude-for-microsoft-365 需要 Claude Pro / Team / Enterprise 订阅

2026 年最新注册 ChatGPT 账号教程,你只需要看这一篇

2026 年,注册 ChatGPT 已经没那么复杂。

先说最重要的一件事

OpenAI 官方已经明确:创建 ChatGPT 新账号,不再强制要求手机号验证。

手机号验证只在一种情况下还有用:开发者第一次申请 API Key 时。如果你只是想用 ChatGPT 聊天,手机号这关根本不存在。

不需要找海外手机号、上接码平台、折腾各种工具

真正需要准备的,只有这些

1. 一个稳定的邮箱

推荐 Gmail、Proton、iCloud,或者直接用 Google / Proton / Apple 账号登录。

谷歌邮箱注册教程可以看文章:2026 年国内最新注册 Gmail 谷歌邮箱教程 | 一部手机五分钟,注册成功率90%以上

不建议用临时邮箱或来路不明的邮箱——账号找回、安全验证、登录提醒,全都要靠它。

2. 一个干净的浏览器环境

不需要指纹浏览器,不需要复杂配置。普通浏览器,确保缓存和 Cookie 是干净的就行。

3. 一个干净的网络环境

确保使用独立、相对干净的 IP,避免任何形式的多人共享代理

就这三样

注册流程,五步搞定

第一步:确认支持地区

进入官方注册页面前,先确认当前地区是否受支持。

第二步:选择注册方式

进入注册页面后,选一种方式(优先建议使用谷歌邮箱注册):

img

GPT 注册页面

用哪种都行,但记住:之后登录要用同一种方式,混用会导致登录失败。

img

使用谷歌邮箱授权

第三步:验证邮箱

注册后会收到一封验证邮件,点击确认就好。如果你的 IP 干净会跳过邮箱验证。

如果没收到,先查垃圾邮件。官方发件域名是 noreply@tm.openai.comotp@tm1.openai.com,认准这个。

第四步:填写基础信息

姓名、生日,按实际情况填,不要乱填。

img

填写信息,完成创建

第五步:进去试试

登录后发一条消息测试一下,能正常回复就说明账号注册成功了。

img

测试是否正常使用

遇到问题,先查这几个地方

登录失败、一直转圈 :清除浏览器缓存和 Cookie,换无痕模式试试

收不到验证邮件 :查垃圾邮件文件夹,确认邮箱地址填对了

登录方式报错 :确认用的登录方式和注册时一致,Google 注册就用 Google 登录,别混用

提示”不支持的国家” :当前地区不在 OpenAI 支持范围,这个问题需要先解决

ChatGPT / Codex为什么突然要验证手机号?是不是OpenAI又在搞事情?

img

今天一次性说清楚。原因只有一个,但你可能没想到。

一、真正的原因:有人在薅羊毛,薅疯了

img

OpenAI推出免费Codex之后,免费用户安装后就能获得一定额度。听起来不错对吧?

但随之而来的就是——批量注册机来了。一些刷量团队疯狂注册账号,几万、十几万的刷,就为了白嫖Codex额度。

img

官方先封号,封不完。然后直接升级风控策略:所有免费使用Codex的用户,都必须验证手机号。

就算你是正常注册的ChatGPT账号,登录Codex或ChatGPT时也可能触发验证弹窗——这不是针对你,是针对所有人的全局策略。

还有两个额外触发场景:

  1. 使用共享IP(多人共用同一个IP地址)
  2. 你的IP恰好与批量注册机撞车,可能被误判为刷量账号

二、两种解法,选一个就够了

方法A:升级Plus(推荐,最最省事)

付费用户基本不再触发手机号验证,我自己多次实测有效。

升级之后仍然弹验证?99%是IP的问题,不是账号问题。 你用的很可能是共享IP,换一个质量更干净的独享IP基本就解决了。

可以通过专业的IP质量检测平台自查你的网络环境,输入IP后查看风险评分,评分越低说明IP越干净,高风险评分建议更换节点。

如:http://ping0.cchttp://ipdata.co

推荐一个自用的 GPT 官方直冲网站(正规稳定):http://cnmgpt.com

方法B:直接验证手机号

国内手机号无法通过验证,需要使用境外号码完成验证流程,可自行搜索相关接码方式了解。

注意:不同地区、不同服务商收码体验差异较大,建议在操作前做好信息收集。

img

把 Claude Word 插件塞进了大学生的 Word 里,论文降重、报告生成、PPT 大纲全搞定(含完整操作流程)

写给谁: 正在被论文、课程报告、实习简历、社团策划折磨的大学生
读完需要: 10 分钟
你能拿走什么: 7 个真实场景 + 可直接复制的 Prompt 模板 + 每个场景的完整操作步骤
门槛: 零,不需要会 Python、不需要懂 AI

一、为什么大学生最该用 Claude Word?

先说结论:大学生是性价比最高的用户群体。

1. 你写的东西,绝大多数都在 Word 里

论文、实验报告、简历、社团策划——这些都是 Word 文档。Claude 不是另开一个聊天窗口让你复制粘贴,它直接在你的 Word 文档里干活

2. 你最缺的不是”会写字”,是”懂结构”

大多数大学生写作的真实瓶颈,是不知道一份”合格的论文”长什么样、不知道”专业的简历”应该突出什么。Claude 最强的能力恰好就是结构化思考

3. 时间成本最高的就是你

熬夜赶论文,通宵改 PPT,这些时间换成睡眠或者实习,价值远比工具费用高。

二、安装 + 首次使用:5 分钟完成

安装步骤

  1. 打开 claude.ai,注册并登录

img

  1. 打开 Word(桌面版或网页版均可),学校发的 Office 365 完全够用
  2. 点击顶部菜单插入
  3. 找到加载项,在搜索框输入 “Claude”。
  4. 找到官方 Claude 插件,点击添加

img

  1. 同意权限弹窗,等待 5 秒安装完成,完成后右侧会出现侧边栏

第一次启动 Claude 面板

  1. 关闭再重新打开 Word(确保插件加载完整)
  2. 顶部菜单栏会出现一个新按钮:Claude

img

  1. 点击这个按钮,右侧弹出 Claude 工作面板
  2. 首次使用会要求你登录 Claude 账号

img

  1. 登录成功后,面板就会显示对话框了

img

关于账号选择(很多人没意识到这一点)

如果你想稳定使用 Claude Word 插件,是需要准备 Claude Pro 账号的。

免费版可以在网页端试水,但像这种连续 2-3 小时的高强度场景,很容易遇到额度上限。

具体值不值得,还是看你的使用频率。

推荐一个 Claude Pro 官方订阅服务:http://cnmClaude.com

img

三、所有场景共用的 4 个核心操作

在进入具体场景前,先记住这 4 个贯穿所有场景的基础操作:

操作 A:把内容喂给 Claude 的三种方式

**第一种是处理整篇文档。**如果你想让 Claude 阅读并分析完整内容,只需要在 Claude 面板里输入你的需求,它会自动读取当前 Word 文档,然后根据全文进行总结、改写、润色或提炼重点。

img

**第二种是处理选中的段落。**如果你只想修改某一小部分内容,可以先在 Word 里选中对应文字,再在 Claude 面板中输入类似“针对我选中的部分进行润色”“帮我改得更专业一点”这样的指令。Claude 会优先围绕你选中的内容进行处理,不会影响整篇文档。

img

**第三种是处理外部素材。**如果内容还没有放进 Word,比如网页资料、聊天记录、文章片段等,可以先把素材粘贴到 Word 文档里,然后再让 Claude 进行整理、总结、改写或扩展。这样 Claude 就能基于你放进文档里的内容继续处理。

操作 B:接收 Claude 输出的两种方式

  1. 直接插入到光标处:点击 Claude 回复下方的 Insert 按钮,内容自动写入文档
  2. 以修订模式插入:点击 Insert as tracked changes,所有改动都带修订标记,你可以逐条接受或拒绝

img

操作 C:接受 / 拒绝 Claude 的修改

Claude 用 Tracked Changes 模式给你修改后,在 Word 中:

  1. 点击顶部菜单审阅选项卡
  2. 看到修订工作组
  3. 逐条操作:

img

  • 接受:接受此修订
  • 拒绝:拒绝此修订
  • 一键全接受:接受所有修订

操作 D:保存 Prompt 模板供反复使用

最聪明的做法:在你的 OneDrive 或本地新建一个 Word 文档,名字叫 我的 Claude 模板库.docx

每次用得顺手的 Prompt,都复制保存进去。下次需要时:

  1. 打开模板库,复制对应 Prompt
  2. 切换到正在写的文档,打开 Claude 面板
  3. 粘贴 Prompt,替换占位符里的具体信息,发送

这个习惯能帮你第二次使用时节省 80% 的时间

四、7 个真实场景 + 完整操作流程

场景 1:课程论文——从开题到定稿

痛点: 不知道怎么开题、文献综述写成流水账、论证逻辑跳跃。

完整操作步骤

Step 1:准备文档

  • 新建一个 Word 文档(或打开你已有的论文草稿)
  • 文档第一页写上你的题目和已有内容(如果还没开始,留空)
  • 保存命名:课程论文_主题_v1.docx(版本号很重要,后面会反复迭代)

Step 2:打开 Claude 面板

  • 点击顶部 Claude 按钮,右侧打开面板
  • 确认面板顶部显示”已连接到当前文档”

Step 3:粘贴 Prompt 模板

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
角色:以我所在学科(请填:[学科名,例如 教育学/经济学/计算机])
的资深教授身份,帮我打磨这篇课程论文。

我的基本信息:
- 课程:[课程名称]
- 论文题目:[你的题目]
- 字数要求:[例如 6000-8000 字]
- 提交对象:[严格/宽松的老师,或 不确定]
- 我目前的进度:[只有开题/已完成初稿/卡在某章节]

任务:
1. 先帮我审视题目本身——
是否过大、过小、过宽泛、能否在规定字数内说清楚?
2. 如果题目可行,给出本科课程论文规格的标准结构
(引言-文献综述-理论框架-分析-结论)
3. 针对每个章节,列出 3-5 个我应该回答的核心问题
4. 在文末用 Tracked Changes 模式标注我现有内容中
逻辑跳跃、论证薄弱、引用缺失的地方

约束:
- 不要直接替我写论文(会被查重系统标记 AI 生成)
- 你的角色是"指导老师",不是"代笔"
- 提出建议,但保留我自己的表达

Step 4:替换占位符 → 发送

  • 把所有方括号 [ ] 里的内容换成你自己的信息
  • 点击面板底部的发送按钮(或回车)
  • 等待 20-40 秒,Claude 会先分析再给出反馈

Step 5:处理 Claude 的输出

  • 阅读 Claude 的诊断,先不要急着接受所有建议
  • 把它给出的”每章核心问题”复制到 Word 中,作为你接下来写作的提纲
  • 然后切换到审阅选项卡,逐条审视它的 Tracked Changes 建议

Step 6:迭代

  • 写完一个章节后,选中该章节
  • 在 Claude 面板输入:”针对我刚选中的章节,做第 2 轮审阅”
  • 重复这个流程直到全文完成

真实效果: 把”我不知道下一步该写什么”变成”我清楚地知道这一章要回答 4 个问题”。

进阶用法: 如果你的论文已经写到一半,可以把前半部分整篇粘贴进去,让 Claude 帮你”接续”思路。

场景 2:文献综述——告别堆砌

痛点: 把 20 篇文献一篇一篇罗列,看起来像在凑字数。

完整操作步骤

Step 1:整理素材

  • 把所有文献的核心要点整理到 Word 中(每篇文献占一个段落)
  • 在每篇文献前加标题:【作者(年份)】
  • 整段标黄

作用:方便后续视觉化对比 Claude 的修改

Step 2:选中全部文献综述部分

  • 鼠标拖选整段文献综述(从第一篇文献到最后一篇)
  • 确认选中状态(被高亮)

Step 3:打开 Claude 面板,输入 Prompt

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
我有一份文献综述初稿(我已选中),正在写一篇关于
[研究主题] 的论文。

请帮我做三件事:

1. 识别问题:
- 哪些段落只是在"复述文献",没有"对话与比较"?
- 哪些观点之间存在矛盾,但我没指出来?
- 哪些文献明显与我的研究问题相关性较弱?

2. 重组逻辑:
- 按"研究脉络"(时间线/学派分歧/方法演变)而不是"按作者"
重新组织,用 Tracked Changes 给出修改建议

3. 补强批判性:
- 在每个主要研究方向后,提示我应该加入的批判性评价
(而不是替我写完)

注意:
- 我不需要你帮我编造新的引用
- 不要替换我已有的文献,只对现有材料做结构优化

Step 4:接收输出

  • 当 Claude 完成后,点击它回复下方的Insert as tracked changes
  • 此时整篇文献综述会带着修订标记被替换

Step 5:对比和决策

  • 切换到审阅选项卡,打开修订窗格(显示在左侧)

img

  • 这样你能看到:
  1. 红色删除线 = Claude 建议删除的内容
  2. 红色下划线 = Claude 建议新增的内容
  3. 批注气泡 = Claude 给你的建议说明
  • 一条一条审视,接受合理的,拒绝你不认同的

Step 6:导出对比版本

  • 完成后另存为 文献综述_Claude修改版.docx
  • 保留原版,方便后续对比

场景 3:实验报告 / 课程作业报告

痛点: 实验做完了不知道怎么写,数据有了但分析像在记流水账。

完整操作步骤

Step 1:在 Word 中整理原始素材

按以下结构粘贴:

1
2
3
4
5
6
7
8
9
10
11
12
【实验目的】
(你的描述)

【操作步骤】
1. ...
2. ...

【原始数据】
(粘贴数据表格或数值)

【我的初步判断】
(你认为的结论)

Step 2:全选文档(Ctrl+A 或 Cmd+A)

确认所有素材都被选中。

Step 3:打开 Claude 面板,输入 Prompt

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
角色:以 [学科,例如 化学/心理学/计算机] 课程助教身份,
帮我把这份实验数据/原始记录整理成规范的实验报告。

我已选中所有素材。

输出要求:
1. 标准实验报告结构(摘要 / 引言 / 方法 / 结果 / 讨论 / 结论)
2. 帮我把"流水账描述"改写为"现象 → 数据 → 分析"的科学表达
3. 在讨论部分,提示我应该补充的对照、误差来源、改进方向
(用注释功能标出,不要直接写死)
4. 全文使用第三人称被动语态(学术规范)
5. 直接在我的文档中输出最终版本

不要做的事:
- 不要编造我没有的数据
- 不要替我下结论,只规范我的表达方式

Step 4:让 Claude 直接插入

  • 等待 30-60 秒
  • 点击 Insert (不是 tracked changes,因为这是从零生成)
  • 报告会直接生成在你的光标位置

Step 5:补充图表(Word 原生操作)

  • 结果章节,点击插入图表
  • 输入你的数据,生成图表
  • 图表下方加图注:图 1:[描述]

Step 6:打印前检查

  • 审阅,拼写和语法检查
  • 布局,调整页边距(默认 2.54 厘米通常 OK)
  • 顶部加页眉(姓名 + 学号 + 课程名)

场景 4:求职简历——一份简历多个版本

痛点: 投不同公司用同一份简历,投了 50 家没有面试。

完整操作步骤

Step 1:准备原始简历

  • 打开你现有的简历 Word 文档
  • 如果没有,先随便写一版(哪怕粗糙也行,Claude 后续会帮你打磨)
  • 保存为 简历_母版.docx

Step 2:每投一家公司,做”另存为”

  • 打开母版 → 另存为 简历_[公司名]_[岗位].docx
  • 例如:简历_字节跳动_产品实习生.docx
  • 这样每个公司都有独立版本,不会混淆

Step 3:复制 JD 内容到一个临时文档(便于 Claude 读取)

  • 从公司招聘页复制完整 JD
  • 临时粘贴到当前简历文档的最底部
  • (后面 Claude 处理完会删掉这部分)

Step 4:打开 Claude 面板,输入 Prompt

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
角色:以资深 HR + [目标岗位类别,例如 互联网产品/快消管培生/咨询]
招聘官的双重身份,帮我改简历。

我的原始简历在文档上半部分,
我要应聘的岗位 JD 在文档下半部分。

我现在要投递的岗位:
- 公司:[公司名]
- 岗位:[岗位名]
- 我最希望突出的优势:[一句话]

改写要求:
1. STAR 原则审视我每一段经历——
情境(Situation)/任务(Task)/行动(Action)/结果(Result)
是否齐全?用 Tracked Changes 直接修改
2. 量化薄弱处用 [量化占位符] 标出(让我自己补数据)
3. 删除与该岗位无关的内容(用删除线标记,我决定是否真删)
4. 关键词与 JD 对齐——
你写的描述里应该自然出现 JD 关键词
5. 一页纸限制

注意:
- 不要凭空捏造经历或数据
- 不要使用"积极乐观、吃苦耐劳"这类无效形容词
- 修改完后告诉我:简历末尾的 JD 内容可以删除了

Step 5:逐条接受修改

  • 审阅选项卡 → 逐条查看修订
  • 重点关注:Claude 给的 [量化占位符]
  • 把这些占位符替换成你的真实数据(例如:提升 [转化率]提升 12% 转化率)

Step 6:删除底部 JD

  • 选中底部 JD 部分, Delete

Step 7:导出 PDF

  • 文件,另存为,格式选 PDF
  • 命名:姓名_岗位_简历.pdf
  • 一定要导出 PDF,直接发 Word 给 HR 是新手错误(格式可能错位)

进阶玩法: 改完一份之后,换一个岗位 JD 再让 Claude 改一次,你会得到针对不同公司的”精准弹药”。

场景 5:课程 PPT 大纲 / 演讲稿

痛点: 5 分钟演讲稿要么写得像论文(信息密度太高观众跟不上),要么写得像段子(显得不够专业)。

完整操作步骤

Step 1:新建大纲文档

  • 新建 Word:[课程名]_展示大纲.docx
  • 这份文档将作为你 PPT 的”内容母本”

Step 2:打开 Claude 面板,输入 Prompt

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
角色:以大学课堂演讲教练身份,帮我准备这次课堂展示。

基本信息:
- 课程:[课程名]
- 主题:[展示主题]
- 时长:[例如 8 分钟]
- 观众:[例如 30 个同学 + 1 位老师,大多数对该主题陌生]
- 评分维度:[逻辑清晰 30% / 内容深度 40% / 表达 30%]

输出要求(都直接写入我当前的 Word 文档):

1. 演讲大纲(分钟级时间分配,例如):
- 0:00-1:00 引入(钩子)
- 1:00-3:00 核心观点 1
- ...

2. 每个章节配:
- 演讲要点(口语化,不是书面语)
- 一句必说的"金句"(加粗显示)
- PPT 上对应的关键词(不要把整段话写在 PPT 上)

3. 三个"老师可能会问的刁钻问题"+ 应对思路

约束:
- 演讲稿用口语,不要"综上所述"这种书面词
- 替我想 3 个不同风格的开场(故事型/数据型/提问型),让我选

Step 3:Claude 输出后,直接 Insert

Step 4:从大纲到 PPT 的衔接

  • 打开 PowerPoint
  • 插入,从大纲新建幻灯片(File , New from Outline)
  • 选择你刚才生成的 Word 大纲
  • PowerPoint 会自动按标题层级创建幻灯片!
  • 然后你只需要美化样式即可

Step 5:打印演讲提示卡

  • 回到 Word 大纲文档
  • 把”演讲要点和金句”部分单独复制到新文档
  • 设置为大字号(20 号以上)
  • 打印出来,演讲时偷瞄(比看手机自然)

场景 6:论文降重 / 改写(合法使用边界)

重要提醒: 这里指的是改善表达,不是规避学术不端。如果你大段抄袭,任何工具都帮不了你也不该帮你。

完整操作步骤

Step 1:精确选中要改的段落

  • 不要全选!只选中具体觉得啰嗦的那几段
  • Claude 在小范围处理时质量更高

Step 2:在 Claude 面板输入 Prompt

1
2
3
4
5
6
7
8
9
10
11
12
13
14
我已选中一段我自己写的文字,感觉太啰嗦/太书面/重复用词太多。

要求:
1. 保持原意 100% 不变
2. 表达更精炼、更地道
3. 替换重复出现的连接词("因此""所以""综上"——
这些不要全删,但不要每段都用)
4. 用 Tracked Changes,我能看到每一处改动
5. 如果某个句子有更合适的学术表达,
用批注标注出来让我选(给 2-3 个选项)

不要做:
- 不要改变我的论点
- 不要用更华丽但更空洞的词替换

Step 3:点击 Insert as tracked changes

Step 4:对比修订(关键步骤)

  • 审阅修订窗格打开
  • 你会看到 Claude 的修改和它的批注
  • 对每一处修改问自己:“这个改法比我原来的好吗?”
  • 好就接受,不好就拒绝——不要无脑全部接受

Step 5:最终通读一遍

  • 关闭修订显示(审阅,显示标记,取消勾选)
  • 把文档”假装”打印出来的样子通读一遍
  • 找出仍然别扭的地方,再单独让 Claude 处理

场景 7:小组作业——你写完了别人没动?

痛点: 小组报告每个人写一段,合起来风格混乱,像四五个人各说各话。

完整操作步骤

Step 1:整理小组提交

  • 新建文档:小组报告_整合版.docx
  • 把每个组员的部分按顺序粘贴进去
  • 在每段开头加标注:【组员A 撰写部分】【组员B 撰写部分】 作用:方便 Claude 识别风格差异

Step 2:打开 Claude 面板,输入 Prompt

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
这是一份四人小组完成的报告(已粘贴),
我用【组员A】【组员B】【组员C】【组员D】标注了每个人写的部分。
四个人的写作风格差异很大。

任务:
1. 统一全文语气和用词风格(以"严谨学术 + 适度通俗"为基准)
2. 修复段落之间的过渡(很多地方明显是"硬接")
3. 检查事实矛盾——
不同人写的章节是否有相互冲突的论点或数据?
4. 用 Tracked Changes 显示所有修改,
并在每一处大改的地方加批注说明原因
5. 完成后告诉我【组员A】【组员B】标签可以删除

约束:
- 不要重写,只做"打磨"
- 保留每位组员核心观点,只统一表达方式
- 如果发现严重的逻辑矛盾,先用批注提示,不要自己强行调和

Step 3:处理完后,先和组员同步

  • 千万不要直接交——尤其是 Claude 标注的”逻辑矛盾”
  • 截图给组员看,确认改动方向
  • 这一步是为了避免组员事后翻脸

Step 4:删除标签,最终美化

  • Ctrl+H 打开”查找和替换”
  • 查找:【组员A 撰写部分】,替换为空
  • 重复处理其他标签
  • 设计选项卡,选择统一的样式集

五、Prompt 万能公式

1
2
3
4
[角色]   +   [场景]   +   [输出要求]   +   [约束]
↓ ↓ ↓ ↓
你扮演谁 我是谁、 格式、长度、 不要做什么、
在做什么 结构、风格 避免什么坑

举个例子,同一个问题,两种问法:

1
2
"帮我写一份关于人工智能的报告"
"以人工智能专业大三学生的视角(角色),为《AI 与社会伦理》课程 写一份 3000 字课程报告(场景),要求包含三个真实案例分析、 一个原创观点、标准 APA 引用格式(输出要求),不要用太学术化 的语言让普通读者也能看懂,不要使用 GPT/Claude 等模型作为案例 (这种例子太烂大街了)(约束)。"

两个版本的输出质量,差出三个数量级。

六、4 个新手常踩的坑

坑 1:把它当 Google 用
Claude 不是搜索引擎,它的强项是重组、改写、结构化你提供的信息,不是替你查最新数据。

坑 2:Prompt 太短
“帮我改一下”——Claude 不知道你的目标读者、场景、风格。Prompt 越具体,输出越有用。

坑 3:一次性丢给它太多
50 页文档一次性扔进去,效果会变差。建议分章节处理。这一点免费版和 Pro 都需要注意。

坑 4:不审核就交
Claude 会偶尔”自信地胡说”(尤其在具体数据、引用文献上)。它给你的所有具体数字和引用,都要自己核实。 这是底线。

七、学术诚信:一条不能越过的线

工具帮你思考结构、改善表达、检查逻辑——这是 OK 的,这和你用 Word 帮你拼写检查、用 Excel 帮你算数据是同一类辅助。

但是:

  • 不要让它替你写完整篇论文,然后改个名字交上去 —— 这是学术不端
  • 不要让它编造引用和数据 —— 后果可能严重到无法挽回
  • 不要在禁止使用 AI 的考试 / 闭卷作业里使用 —— 没有例外

你所在的学校大概率有明确的 AI 使用政策,写论文之前先去查一下你们学校的具体规定

健康的心态: Claude 是一个 24 小时在线、不会嫌你烦的学姐学长。她可以帮你梳理思路,但不会替你考试。

八、一份”今晚就能用”的行动清单

如果你看到这里还没动手,那这篇文章对你的价值就只剩”读过”两个字。

今晚 30 分钟可以完成:

  1. 用 5 分钟装好 Claude Word 插件
  2. 选一份你这周最头疼的文档
  3. 从上面 9 个场景里挑一个最匹配的
  4. 完整跟着操作步骤走一遍(不要只复制 Prompt)
  5. 把”我的 Claude 模板库.docx”建起来,保存第一个 Prompt

三天后回来看你节省了多少时间。 如果你发现自己已经每天都在用,那升级 Pro 这件事就不需要纠结——工具的价值在于使用频率,你高频用它,它就值这个钱。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×