Skip to main content

Superpowers 是什么?

· 5 min read

AI Coding 的下半场不是 更强的模型,而是更难违反的流程。

  1. Superpowers 是什么:一套 Claude Code 插件,注入 14 个 skill,强制 5 阶段不可绕过流程。
  2. TDD 硬约束:RED-GREEN-REFACTOR 循环被写进 skill 代码,测试必须先失败才能写实现。
  3. 官方收编信号:Anthropic 一月将其纳入官方插件市场——承认纯灵活无法规模化。
  4. 数据说话:任务完成率 62% → 89%,token 消耗增加 37%。
  5. 版本化管理:skill 是文本文件,可 git 提交、code review——团队第一次能把 AI 写代码的规矩版本化。
  6. 动态 vs 静态:相比 .cursorrules 和 CLAUDE.md,skill 按任务状态精确触发,不打扰无关流程。
  7. 一句话记住把规则写进 skill 代码,不是 prompt 里

agent browser 和 playwright-cli 区别?

· 5 min read

agent-browser 和 Playwright CLI 的区别不在"谁更好",而在谁在做决策——是 LLM 自己看着办,还是人写好每一步指令。

  1. agent-browser 目标驱动:给自然语言目标,LLM 自己规划并执行
  2. Playwright CLI 步骤驱动:open → click → fill,每一步都得人写清楚
  3. agent-browser 用 Accessibility Tree + @ref,Token 仅为完整 DOM 的 5%
  4. Playwright CLI 交互结果写磁盘,Agent 按需读,Token 比 MCP 方案省更多
  5. agent-browser 直连 CDP 复用登录会话;Playwright CLI 默认隔离上下文
  6. 容错逻辑相反:agent-browser LLM 语义兜底,Playwright CLI ref 变就挂
  7. 两条路都能走,走反了就是纯烧 Token

playwright mcp 和 chrome devtools mcp 区别?

· 4 min read

Playwright MCP 和 Chrome DevTools MCP 不是竞品——一个负责"开",一个负责"修"。

  1. Playwright 做浏览器自动化(干活),DevTools 做性能诊断(找问题)
  2. Playwright 基于 Accessibility Tree,Token 仅为原始 DOM 的 20-30%
  3. DevTools 基于 CDP,能拿到网络瀑布、Lighthouse、堆快照等完整运行时数据
  4. Playwright 支持全平台浏览器;DevTools 仅 Chromium
  5. DevTools 独有 Trace 自动分析、Lighthouse 审计、V8 堆内存快照
  6. Playwright 独有 Auto-wait、跨浏览器测试、结构化定位

一句话:日常交互用 Playwright,需要性能/网络排查时切 DevTools。

JS 的异步迭代器 AsyncIterable 是什么?

· 5 min read

for await...of 不是 async 版 for...of,而是一套"随时间产生的值流"消费模型。

  1. 普通 for...of 遍历同步数组,迭代立刻拿到值;for await...of 每次迭代要等下一个值,生产者产出与消费者消费完全解耦
  2. 这就是流式响应的底层逻辑:Node Stream、AsyncGenerator、LLM streaming 本质上是同一件事
  3. 实现 Symbol.asyncIterator 协议就能让任意对象变成可异步遍历的流
  4. Async Generator 是最简洁的生产端实现:yield 产出,for await...of 消费
  5. 适用场景:分页 API、Stream、实时事件——凡是数据"不是一次性到齐"的地方

Claude Cowork 是什么?

· 4 min read

Claude Cowork 是 Claude Desktop 桌面 App 里的一个 Tab,本质和 Code Tab 差不多,主要面向非程序员——默认去掉了 GitHub、Preview、Diff、Terminal 等开发功能,换成了 VM 沙箱隔离执行、定时任务、MCP 办公套件集成这类知识工作场景更常用的能力

核心问题很简单:非程序员怎么用 Code Agent?

  1. Cowork 和 Code 共享同一 Agent 引擎,差异只在交互界面,零编程门槛。
  2. 授权文件夹后,Claude 自动规划并执行多步文件操作,破坏性操作需用户二次确认。
  3. macOS AVF 轻量 VM 隔离执行,Agent 循环自动拆解子任务并行处理。
  4. MCP 集成 Google、Office 等数十款工具,支持企业私有插件市场。
  5. Agent 的真正战场不是 IDE,是桌面。Agent 从开发者专属变成全员可用——AI 工具进入企业的关键一步。

Openspec是什么?如何使用?

· 6 min read

OpenSpec 解决了一个我在 AI 编码里反复踩的坑:你和 AI 达成的共识,/clear 之后全没了

  • 问题本质:AI 在长对话中遗忘早期约束,清空上下文后设计共识归零
  • OpenSpec 的解法:把共识写成结构化文档(proposal → spec → tasks),存进文件系统,不依赖对话记忆
  • 核心流程Propose → Apply → Archive,三步闭环,所有变更可追溯
  • Delta Spec 机制:改需求不重写规格,用 ADDED/MODIFIED/REMOVED 增量描述,自动合并
  • 和 Superpowers 的关系:OpenSpec 管"写什么",Superpowers 管"怎么写"——一个定方向,一个定纪律
  • 得物团队落地数据:10 天净增 25,546 行代码,研发提效 36%,关键是把规范写成 AI 的"可执行契约"

agent-browser 是什么?

· 4 min read

agent-browser 把浏览器从"给人用的 GUI"变成了"给 AI 用的 API"。

  1. 定位:专为 AI Agent 设计的浏览器操控工具,自然语言输入、结构化结果输出。
  2. 两种实现:Vercel agent-browser 是 Rust CLI(二进制 7MB),browser-use 是 Python 框架。
  3. 核心差异:传统自动化写死每一步,agent-browser 是目标驱动——只关心"做到没有"。
  4. 底层原理:CDP 直连 + Accessibility Tree 快照,context 用量比完整 DOM 少 90%。
  5. 实际数据:WebVoyager 成功率 91.3%,单任务成本不到 $0.09。
  6. 2026 趋势:MCP 集成、本地优先、反 Bot 对抗升级三条主线。

Linux 如何查看某个端口对应的进程并kill?

· 3 min read

线上排查端口冲突时,查进程、杀进程、防复活是三个标准动作。

  • 查端口lsof -i :端口 一把梭,比 netstat/ss 更直观。
  • 一行 killkill -9 $(lsof -ti :端口),查 PID 和杀进程一条命令搞定。
  • 一行 killlsof -ti :端口 | xargs kill -9,查 PID 和杀进程一条命令搞定。
  • 杀了又活大概率是守护程序自动拉起,先查 systemd/supervisor/pm2。
  • 根本解法:直接停掉守护服务再操作,从源头控制,不跟重启赛跑

Linux tree 命令

· 4 min read

tree 把一个目录变成终端里的一棵树。日常使用记住两个参数就够了。

  1. -L N 限制展示层级,默认无限制,深层目录直接输出爆炸。
  2. -a 控制隐藏文件可见性,默认不显示 . 开头的文件和目录。
  3. tree -L 2 -a 是覆盖大多数日常开发场景的组合。
  4. -d 只看目录骨架,跳过文件层噪音。
  5. -I 'node_modules|.git' 排除指定目录,tree 输出立刻清爽。
  6. macOS 不自带,brew install tree 一行安装。

软件开发范式的转变

· 5 min read

软件开发范式的底层逻辑变了——从瀑布到敏捷再到 AI 开发,不是在改进旧流程,而是把整个开发流程替换掉了。

  • 瀑布模型:靠前期规划,像从零攒一辆摩托,上线那天才知道对不对
  • 敏捷开发:靠快速反馈,从滑板迭代到摩托,但每一步仍然要人写代码
  • AI 开发:靠意图表达,你描述要什么,直接给你成品摩托
  • 核心转变在于驱动力的迁移:Plan → Feedback → Intent
  • 效率提升不是"AI 写代码更快",而是消灭了中间的等待和沟通成本

别再把 AI 当成"更快的程序员"——它在替换开发流程本身,不只是加速写代码这个动作。