Agent Post-Training Playbook

12 篇 · Agent 后训练:RL/持续学习/自我改进 · 公式/代码静态渲染(零外部 CDN,国内直连)· 输入关键词过滤
📍 📍 学习路径 / Roadmap建议从这里开始 · 按主题顺序刷 cheatsheet + drill

Cheatsheets 题解 7

Drills 手撕 4