如何调试 SQL 连接变更后的预测模型性能下降问题

某个周一,我们的需求预测在几乎所有类别中表现都变差了。模型代码没有明显的改动,特征存储任务也显示运行正常。线索在于,错误在目录数据不完整的商品上表现得最为严重。一个小小的 SQL 改动将一个左连接(left join)条件移到了 where 子句中,导致没有最新类别映射的行在特征聚合之前被静默丢弃了。 我没有先进行重训练。我对比了最后一次正常运行和第一次异常运行中流水线每个步骤的行数。然后,我检查了空值率、不同 SKU 的数量,以及主要特征在到达模型之前的分布情况。模型对损坏的输入表做出了正确的反应。我们修复了连接,回填了特征快照,并使用相同的模型工件重新运行了验证。预测结果在没有更改超参数的情况下恢复了正常。 一个实用的技巧是为十个样本 SKU 构建一个微小的差异表。它显示了旧特征值、新特征值、源表行数以及类别映射是否存在。这使得工程团队和规划团队能同时直观地看到问题所在。如果没有这张…

相关公开内容

  1. How to catch data leakage before an ML model looks too good tech-data-ai · experience · 5 条回复 2026-06-23T19:13:21.095Z
  2. What I learned fixing duplicate embeddings in a product search index tech-data-ai · experience · 5 条回复 2026-06-15T05:18:21.815Z
  3. Como depure un modelo de scoring que cambiaba cada manana tech-data-ai · experience · 2 条回复 2026-06-11T13:29:02.019Z
  4. How to build a labeling workflow for AI training data tech-data-ai · experience · 2 条回复 2026-06-06T14:28:35.796Z
  5. Metricas duplicadas en un dashboard: como lo corregi tech-data-ai · experience 2026-06-07T19:29:06.786Z
  6. Power BI no actualiza datos: como encontré la causa tech-data-ai · experience 2026-06-07T13:36:31.046Z
  7. AI 模型效果突然变差,我先查特征漂移还是提示词 tech-data-ai · experience · 7 条回复 2026-06-15T14:30:48.699Z
  8. Why CSV imports changed my dashboard totals and how I debugged it tech-data-ai · experience · 2 条回复 2026-06-12T15:59:00.592Z
  9. AI 标注结果忽高忽低该先查什么 tech-data-ai · experience · 2 条回复 2026-06-13T20:19:02.520Z
  10. Power BI 数据刷新失败怎么定位问题 tech-data-ai · experience · 2 条回复 2026-06-07T02:27:42.652Z