cd /news/artificial-intelligence/how-i-turned-claude-code-into-my-per… · home topics artificial-intelligence article
[ARTICLE · art-33615] src=dev.to ↗ pub= topic=artificial-intelligence verified=true sentiment=↑ positive

How I Turned Claude Code into My Personal Operating System

A developer built a personal operating system for Claude Code, an AI coding assistant, to address recurring issues like misunderstood requirements, out-of-scope modifications, and false completion claims. By adding structured components such as project context files, planning steps, rules, hooks, reusable skills, and validation checks, the developer transformed Claude Code from a chaotic chat interface into a reliable tool that respects boundaries and verifies results. The system evolved organically as the developer patched each pain point, resulting in a tailored workflow that reduces rework and frees attention for higher-level tasks.

read1 min views1 publishedJun 19, 2026

副标题:后来我才发现,AI 越强,就越需要被磨成一把顺手的工具。

我最近越来越强烈地感觉到一件事:

AI 明明已经很强了,但很多人并没有因此真正变强。

我们每天都在用 AI。学习时用它,写文章时用它,做项目时用它,改代码时也用它。它确实能回答问题、生成方案,也能帮我们把很多事情做得更快。

但用得越久,一个问题反而越明显:

AI 很强,不代表我们就能稳定地把事情做好。

很多时候,我们不是不会用 AI,而是太随便地使用 AI。想到什么就问一句,遇到报错就贴一下,想写文章就让它生成一版,想改功能就直接让它动手。

短期看,好像每一步都有结果。时间一长,却会发现自己总是在反复解释、反复返工、反复验证,甚至反复收拾 AI 留下来的残局。

一开始我以为,这是因为 AI 还不够聪明。

后来我也换过更强的模型,用上了当时公认的最顶级的模型。我原本以为,只要模型能力足够强,那些理解错误、越界修改和虚假完成的问题自然就会减少。

结果并没有。

模型确实变强了。它理解代码更快,给出的方案更完整,执行复杂任务的能力也更强。

但它依然可能没理解清楚就开始动手,顺手改掉我没让它碰的地方,再很自信地告诉我:“已经修复完成。”

等我重新运行项目,报错可能还在那里。

我对这件事感受最深的时候,是在用 Claude Code 做项目。

刚开始,我只是想让它帮我把项目做得快一点。遇到 Bug,就把报错贴给它;想加功能,就直接告诉它需求;哪里样式不对,就让它顺手改一下。

任务很小时,这套用法没什么问题。一个文件、一个函数、一个明确的报错,它通常都能处理得不错。

真正的问题,是从项目开始变复杂之后出现的。

我只是让它修一个小问题,它却顺手改了更多文件。这些修改不一定完全错误,甚至有些看起来很合理,但它们根本不在这次任务的范围里。

它给出的方案可能很完整,解释也很自信,可我重新运行项目,报错仍然存在。它说“已经修复完成”,我看到的却是又一轮返工。

前几天刚提醒过的项目规则,打开新会话后,它也可能像一个刚入职的人一样,重新问、重新猜、重新犯差不多的错。

这些事情单独看,好像都不严重。

改多了,可以回滚;没修好,可以继续贴报错;忘了规则,也可以再提醒一次。

真正折磨人的,是它们会反复发生。

同一个项目背景,我讲了一遍又一遍;同一种边界问题,我提醒了一次又一次;同一句“已经修复完成”,我相信了一次,又被现实打回来一次。

时间久了,人真的会被搞得心烦意乱。

明明我是想让 AI 帮我提高效率,结果却花了大量时间检查它有没有跑偏。

我开始怀疑自己。

是不是我需求没说清楚?是不是我不会用 AI?是不是别人用 Claude Code 都很顺,只有我一直在收拾残局?

我也开始怀疑 AI。

它到底是真的理解了,还是只是看起来理解了?它是真的修好了,还是只是很会把“修好了”说得像真的?

后来我慢慢发现,最难受的不是 Claude Code 偶尔犯错,而是我一直在用一种临时、粗糙的方式驱动它。

它很强,但我没有给它稳定的项目背景;它很快,但我没有让它先把方向想清楚;它很主动,但我没有给它清楚的边界;它很自信,但我没有建立真正的验收方式。

问题可能不只是模型够不够强,也和我怎么使用它有关。

于是,我先做了一个很小的改变。

我不再直接让它动手,而是让它先说明:它理解的问题是什么,准备改哪里,为什么这么改,哪些文件不能碰,最后怎么验证。

这个改变很小,但效果很明显。

以前一旦方向错了,我往往要等它改完几个文件,甚至运行失败以后才发现。

现在很多问题在计划阶段就会暴露出来:它准备修改哪些文件,有没有超出范围,理解的需求是不是我真正想要的。

我只需要在它动手前纠正一次,而不是在它改完后重新返工。

后来,我又把项目背景写进 CLAUDE.md,给它补上 Rules 和任务边界,用 Hooks 把危险操作和交付检查变成强制执行,再把常用流程沉淀成 Skills。

这些改变单独看都不复杂,但叠在一起之后,Claude Code 开始慢慢变得不一样。

不是它突然换了一个更聪明的模型,而是它做事开始有了背景、有了方向、有了边界,也有了验收标准。

我也不再只是想着,怎么写出一句更厉害的 Prompt。

我开始想的是:怎么先把自己手里的工具磨顺。

以前我把 Claude Code 当成一个更强的聊天框:遇到问题就问,拿到答案就让它动手。

但项目越复杂,我越发现,这种用法不够。

Claude Code 更像一个执行力很强、但刚进入项目的新搭档。它有能力,也愿意主动做事,但它不了解项目历史,也不知道边界和验收标准。

如果我要让它长期参与项目,就不能只靠每次临时说一句需求。

我要给它项目说明、工作流程、行为边界、强制检查、可复用的工具和明确的验收方式。

这些东西加起来,就是我后来慢慢搭出来的 Claude Code OS。

我说的 OS,不是一个新的软件,而是一套让 Claude Code 了解项目、遵守边界、复用能力并接受验收的工作环境。

它不是我一开始设计好的一套系统。

更真实的情况是:我每踩一个坑,就往里面补上一块。

第一块,是 CLAUDE.md

以前每次打开新会话,我都要重新介绍项目:它是做什么的,哪些目录不能动,哪些地方不能顺手重构,修改完必须怎么验证。

所以我把这些稳定信息写进 CLAUDE.md,让它开始工作前,先知道自己站在哪里。

第二块,是 Plan

以前我看到 Claude Code 写得很快,就容易直接让它动手。可方向一旦错了,速度越快,返工反而越多。

所以我开始要求它先说清楚:理解的问题是什么,准备改哪里,为什么这么改,最后怎么验证。

先对准方向,再开始执行。

第三块,是 Rules 和任务边界

Claude Code 很容易“顺手多做一点”。

你让它修一个 Bug,它可能顺手重构;你让它改一个页面,它可能顺手动到其他组件。

所以我会在 Rules 里写下长期需要遵守的规则,也会在每次任务开始前,单独说明这次允许修改的范围。

只改任务要求的内容,不确定先问,涉及高风险修改必须提前说明。

第四块,是 Hooks

写下规则以后,我发现有些事情仍然不能只靠提醒。

危险命令、敏感文件、连续失败、交付前验证,这些一旦出问题,代价太高。

所以我用 Hooks 把它们变成真正会执行的门禁:该停的时候必须停,该检查的时候必须检查。

第五块,是 Skills

调试、代码审查、项目初始化、交付验证,这些任务会反复出现。

如果每次都靠临时 Prompt 重新解释,做法很容易变形:有时很细,有时很粗,有时会验证,有时又漏掉关键步骤。

所以我把常用流程沉淀成 Skills,让 Claude Code 不再完全依赖现场发挥,而是逐渐有了自己的工具箱。

第六块,是 Validation

这是我最不敢省掉的一块。

Claude Code 说“已经修复完成”,不代表项目真的能跑。

所以我不再只看它怎么说,而是看构建、类型检查、Lint、测试、关键路径和 Diff。

只有证据站得住,任务才算真的完成。

这六块东西没有让 Claude Code 突然变成一个完美的 AI。

但它开始变得更顺手了。

它进入项目时知道背景,动手前会先对准方向,执行时有边界,危险操作会被拦住,常用能力可以复用,最后的结果也有证据可以检查。

到这里,Claude Code 才不再只是一个很强、但经常让我心烦意乱的聊天框。

我开始有了一套真正适合自己的使用方式:它知道我的项目背景,理解我的工作习惯,也会按照我能接受的边界和标准完成任务。

回头看,我真正得到的,并不是一份可以复制给所有人的“最强配置”。

因为每个人遇到的问题都不一样。

有人最受不了 Claude Code 总是改出任务范围,所以他需要更清楚的边界。

有人最怕它说“已经修复完成”,结果项目根本跑不起来,所以他最需要的是验证。

也有人每天都在重复同一种任务,那他最值得做的,可能是把流程沉淀成 Skill。

所以真正重要的,不是把别人用过的 CLAUDE.md、Rules、Hooks 和 Skills 全部照搬回来。

而是先看清楚:你使用 AI 时,究竟是哪一个问题在反复消耗你。

哪里总在返工,就补哪里。

哪里容易失控,就约束哪里。

哪里一直重复,就沉淀哪里。

我现在这套 Claude Code OS,就是这样一点点长出来的。

它不一定最全面,也不一定适合所有人,但它越来越适合我的项目、我的习惯和我在意的边界。

而工具真正变顺手的标志,也不是它从此不再犯错。

而是那些原本需要我反复解释、反复提醒、反复检查的事情,开始有了稳定的处理方式。

我的注意力终于可以从“它这次会不会又跑偏”,重新回到“我真正想把事情做成什么样”。

这才是我最终想要的。

不是一个配置最多的 Claude Code,而是一套真正适合我、能够让我更专注地做事的使用方式。

你也不需要一开始就搭出一套完整系统。

先找出最近最让你返工的一件事,把它变成一条规则、一个固定流程,或者一次必须执行的检查,就已经是在让工具变得更顺手。

这篇总篇,我不想再把每一个配置重新讲一遍。

CLAUDE.md 怎么写,Rules 怎么划边界,Hooks 怎么把规则变成强制检查,Skills 怎么沉淀常用能力,Validation 怎么判断任务是否真的完成,前面的文章里都已经分别展开过。

这篇文章,我更想留下一个整体判断:

AI 时代,决定我们能走多远的,或许不只是 AI 本身有多强,还在于我们如何看待它,又选择用什么样的方式驾驭它。

把它当成一个随叫随到的聊天框,我们得到的可能只是一次次临时生成的答案。

把它当成一件值得长期打磨的工具,我们才会开始为它准备背景、建立流程、划清边界、沉淀能力,并认真验证最终的结果。

模型的能力,决定了这把工具可以有多锋利。

而我们使用它的方式,决定了它最终能不能真正为我们所用。

── more in #artificial-intelligence 4 stories · sorted by recency
── more on @claude code 3 stories trending now
sponsored brought to you by zahid.host 4,200+ EU-deployed projects
reading about agents? ship yours in a single git push.

Run your AI side-project on zahid.host

EU-based hosting, git-push deploys, automatic HTTPS, no cold starts. Free tier with a custom domain — perfect for shipping the agent you just read about.

$git push zahid main
Live at https://your-agent.zahid.host
Get free account → Pricing
from €0/mo · no card required
LIVE [news/how-i-turned-claude-…] indexed:0 read:1min 2026-06-19 ·