可观测性
1. 目标
- 对关键链路做到“出问题能定位、出错能解释、答辩时能展示”。
- 让平台概览与管理员仪表盘成为课程加分项而非摆设。
2. 最小可行方案
- 应用日志
- 接口错误日志
- 判题任务执行日志
- 部署启动日志
- 平台概览指标
3. 关键指标
| 指标 | 说明 |
|---|---|
| 登录失败次数 | 发现账号异常和暴力尝试 |
| 提交成功率 | 发现提交流程异常 |
| 评测成功率与耗时 | 发现判题拥塞或失败 |
| 成绩发布时间 | 发现批改链路延迟 |
| 关键接口异常率 | 发现接口级故障 |
4. 仪表盘建议
4.1 平台管理员仪表盘
- 活跃课程数
- 活跃用户数
- 今日提交量
- 判题成功率
- 异常事件数
4.2 教师课程仪表盘
- 课程成员数
- 任务完成率
- 评测通过率
- 成绩分布
- 待批改数量
5. 告警建议
- 判题队列深度持续升高
- API 5xx 短时间内激增
- 登录失败次数异常升高
- 对象存储不可用