Week 4 · LangSmith & Capstone
上线前必须能看到 trace、能跑评估、能复现:LangSmith 把这三件事串成生产级工具链。
章节
- tracing — trace 收集与 debug
- evaluation — LLM-as-Judge + 自定义指标
- dataset — 评估数据集管理
- capstone — 综合项目
学完应能
- 用 LangSmith 看完整 agent 调用链
- 配置 evaluator 跑回归测试
- 把 prompt / chain / agent 改动量化对比