AI Berkshire AI Berkshire, a set of investment research skills compatible with Claude Code and Codex, systematizes the methodologies of value investors Warren Buffett, Charlie Munger, Duan Yongping, and Li Lu. The framework achieved a 69.29% return in 2024 and 66.38% in 2025, significantly outperforming major indices, with cumulative real account gains exceeding 1.46 million yuan over two years. 中文 | English /xbtlin/ai-berkshire/blob/main/README EN.md "Price is what you pay, value is what you get." — Warren Buffett 用 AI 重新定义投资研究的深度与效率。 AI Berkshire 是一套同时兼容 Claude Code 与 Codex 的投资研究 Skill 合集,将巴菲特、芒格、段永平、李录四位价值投资大师的方法论系统化、结构化,通过 AI Agent 实现专业级投资研究。 一个人 + Claude Code / Codex = 一个投研团队。 不是纸上谈兵。这套框架背后是真金白银验证的投资体系。 | 指标 | 2024 全年 | 2025 至今 | |---|---|---| 本框架实盘 | +69.29% | +66.38% | | 恒生指数 | +17.67% | +27.77% | | 标普500 | +23.31% | +16.39% | | 沪深300 | +14.68% | +17.66% | | 纳斯达克 | +28.64% | +20.36% | 2024 年超额收益 :跑赢标普500 46个百分点 ,跑赢恒生指数 52个百分点 2025 年超额收益 :跑赢标普500 50个百分点 ,跑赢恒生指数 39个百分点 两年累计实盘收益超 146万元 ,连续两年大幅跑赢全球主要指数。 免责声明:历史收益不代表未来表现。截图来自富途证券真实账户。 你当然可以直接问 Claude:"帮我分析拼多多值不值得买"。你会得到一篇"一方面...另一方面..."的平衡分析,最后以"投资有风险,请自行判断"收尾。 这种分析看起来对,但没法拿来做决策。 AI Berkshire 解决的不是"能不能分析"的问题,而是 分析质量和决策纪律 的问题。以下是核心差异: 直接问AI,你得到的是两面讨好的"分析"。AI Berkshire 强制输出: 通过/不通过/灰色地带 ,带具体价格区间和分层建议。 普通AI回答: "拼多多有增长潜力但也面临竞争压力,投资者需要权衡..."AI Berkshire 输出: 策略 建议 价格区间 激进型 当前价位可建仓20% $95-105 稳健型 等回购政策明确后建仓 $85-95 保守型 不符合10年确定性标准,观望 — 镜子测试:5句话说不完整 = 不买,没有例外。 不是"用巴菲特方法分析一下"这么简单。四个视角会产生 真实的矛盾和张力 —— 以拼多多为例: 段永平 (商业模式):好生意,C2M模式难以复制 → 评分 3.7/5 巴菲特 (财务估值):扣现金PE仅6.3x,印钞机 → 评分 4.4/5 芒格 (逆向思考):护城河比想象中浅,抖音3年做到4万亿GMV → 评分 3.5/5 李录 (长期确定性):管理层文化有隐患,10年后不确定 → 评分 2.0/5 巴菲特说"真便宜",李录说"不确定就不买" ——这种冲突才是投资决策的真实状态。单一prompt无法制造这种多视角对抗,而这恰恰是避免盲点的关键。 AI最危险的不是给错答案,而是给一个 看起来很对但经不起推敲 的答案。AI Berkshire 在流程中内置了多层"防骗"机制: | 机制 | 解决什么问题 | 举例 | |---|---|---| 信息丰富度评级(A/B/C) | 防止"资料多=确定性高"的幻觉 | 泡泡玛特评为B级:数据有限,推算指标标注置信度 | 芒格式逆向检验 | 强制思考失败场景 | "什么情况下拼多多会死?"→ 列出5大情景及概率 | 快速否决清单 | 8条红线一票否决 | 管理层诚信污点 → 直接否决,不管估值多便宜 | 反共识检查 | 避免和市场想法一样 | "聪明人为什么在做空?"→ 发现被忽视的风险 | 留白原则 | 宁可说"不知道" | 数据不足时标注"灰色地带",不用推测伪装确定性 | LLM心算不可靠。PE算错一个小数点、市值单位搞混港币和人民币,就可能导致错误的投资决策。 真实案例 :分析腾讯时,不同来源的市值数据有"港币亿"和"人民币亿"两种单位。AI Berkshire 的处理方式: 市值手算校验:股价 × 总股本,与报告数据对比 python3 tools/financial rigor.py verify-market-cap \ --price 510 --shares 9.11e9 --reported 4.65e12 --currency HKD ✅ 验证通过, 偏差仅 0.08% 所有计算使用 Python decimal.Decimal (精确十进制),不用 float 。关键数据至少2个独立来源交叉验证。 直接问AI,每次输出的格式、深度、覆盖面都不一样——今天分析腾讯有护城河评分,明天分析美团可能就忘了。 AI Berkshire 确保: 同样的输入 → 结构一致、深度一致的输出 。这意味着你可以: - 7家公司横向对比,评分标准完全一致 - 同一家公司半年后重新分析,直接对比变化 - 团队成员之间的研究结果可以对齐 真实输出——7家公司用同一标准 Checklist 筛选: 公司 通过? 能力圈 好生意 护城河 管理层 安全边际 综合 茅台 ✅ 通过 ★★★★★ ★★★★★ ★★★★★ ★★★☆☆ ★★★★☆ 4.7 腾讯 ✅ 通过 ★★★★☆ ★★★★★ ★★★★★ ★★★★★ ★★★★☆ 4.7 英伟达 ✅ 有条件 ★★★★☆ ★★★★★ ★★★★★ ★★★★★ ★★★☆☆ 4.3 美团 ✅ 有条件 ★★★★☆ ★★★★☆ ★★★★☆ ★★★★☆ ★★★★☆ 4.0 快手 ✅ 有条件 ★★★☆☆ ★★★★☆ ★★★★☆ ★★★★☆ ★★★★★ 4.0 拼多多 ❓ 灰色 ★★★★☆ ★★★★☆ ★★★☆☆ ★★★☆☆ ★★★★★ 3.8 泡泡玛特 ❓ 灰色 ★★★☆☆ ★★★★☆ ★★★★☆ ★★★★★ ★★★☆☆ 3.7 /investment-team 启动4个独立Agent 同时 研究一家公司。每个Agent各自搜索网络、交叉验证数据、独立给出结论。这不是把一个prompt拆成四段——是4个"分析师"各自做了完整的研究,Team Lead再综合。 一个人直接问AI,上下文窗口是一个。4个Agent并行,等于4倍的搜索量、4倍的信息源、4个独立视角。 ┌─────────────────────────────────────────────┐ │ Team Lead 你 │ │ 统筹协调 · 汇总研判 │ ├──────┬──────┬──────────┬───────────┤ │ Agent 1 │ Agent 2 │ Agent 3 │ Agent 4 │ │ 商业模式 │ 财务估值 │ 行业竞争 │ 风险管理层 │ │ 段永平视角 │ 巴菲特视角 │ 芒格视角 │ 李录视角 │ └──────┴──────┴──────────┴───────────┘ ↓ 并行研究,实时汇报进度 ↓ 最终综合报告 普通人问AI得到的是"看起来对的分析",用 AI Berkshire 得到的是"可以拿来做决策的投研报告"。 图源: (Mermaid 可编辑源码) assets/architecture.mmd 三层设计哲学 : Skill 层 :把"你要做什么"抽象成 16 个明确入口——深度研究、财报分析、行业筛选、持仓管理、思维工具,按场景选用 Agent 层 :每个 skill 内部都是 4 个 Agent 并行——它们各自独立搜索、独立判断、互相挑战,最后由 Team Lead 综合 工具层 :精确计算、实时检索、报告抽检——保证每份报告的数据严谨性可验证 | Skill | 用途 | 适合场景 | |---|---|---| /investment-research | /investment-team /management-deep-dive /private-company-research /deep-company-series | Skill | 用途 | 适合场景 | |---|---|---| /earnings-review | /earnings-team | Skill | 用途 | 适合场景 | |---|---|---| /industry-research | /industry-funnel /quality-screen /bottleneck-hunter /investment-checklist | Skill | 用途 | 适合场景 | |---|---|---| /portfolio-review | /thesis-tracker /news-pulse | Skill | 用途 | 适合场景 | |---|---|---| /dyp-ask | /financial-data /wechat-article 本仓库保留同一套 canonical workflow,并分别提供 Claude Code commands 与 Codex skills。按你使用的客户端安装即可。 Claude Code 用户: npm install -g @anthropic-ai/claude-code Codex 用户: macOS / Linux curl -fsSL https://chatgpt.com/codex/install.sh | sh 或使用 npm npm install -g @openai/codex 或使用 Homebrew brew install --cask codex 验证安装 codex --version Windows 用户可使用官方 PowerShell 安装命令: powershell -ExecutionPolicy ByPass -c "irm https://chatgpt.com/codex/install.ps1 | iex" 。 如果 codex --version 能正常输出版本号,就可以继续安装本项目的 Codex skills。 Claude Code 用户安装: 克隆仓库 git clone https://github.com/xbtlin/ai-berkshire.git 复制 skills 到 Claude Code 全局 commands 目录 cd ai-berkshire ./scripts/install-claude-commands.sh Codex 用户安装: 克隆仓库 git clone https://github.com/xbtlin/ai-berkshire.git 生成并安装 Codex skills 到 ~/.codex/skills cd ai-berkshire ./scripts/install-codex-skills.sh 可选:安装 Codex slash prompts 到 ~/.codex/prompts 用于获得接近 Claude Code 的 /investment-research 体验 ./scripts/install-codex-prompts.sh 仓库同时维护三套入口: skills/ .md 是 Claude Code command 源文件; codex-skills/ /SKILL.md 是 Codex skill 包,由 scripts/sync-codex-skills.py 从 skills/ .md 生成; codex-prompts/ .md 是可选的 Codex slash prompt 兼容层。 在 Claude Code 中直接调用: 深度研究 /investment-research 腾讯 /investment-team 美团 /management-deep-dive 王兴 美团 /private-company-research SpaceX /deep-company-series 拼多多 财报分析 /earnings-review 腾讯 2025Q4 /earnings-team PDD 2025年报 行业筛选 /industry-research 核电 /industry-funnel AI算力 /quality-screen 恒生指数成分股 /bottleneck-hunter AI基础设施 /investment-checklist 茅台, 英伟达, 苹果 持仓管理 /portfolio-review 腾讯30%, 美团20%, 茅台20%, 现金30% /thesis-tracker 拼多多 /news-pulse 腾讯 思维工具 /dyp-ask 拼多多的护城河到底在哪里? /wechat-article 大模型OPD技术解读 在 Codex 中安装后重启 Codex,然后直接按 skill 名称描述任务,例如: 使用 investment-research 研究腾讯 使用 earnings-review 分析 PDD 2025年报 使用 industry-funnel 筛选 AI算力 使用 bottleneck-hunter 扫描 AI基础设施瓶颈 使用 wechat-article 写大模型OPD技术解读 如果安装了 Codex slash prompts,重启 Codex 后也可以在 / 菜单里搜索这些 prompt。Codex 官方的 custom prompt 入口通常显示为 prompts: