推荐列表分数一早波动,怎么查特征更新时间

今天早上商品推荐列表的排序忽上忽下,运营看到点击率掉了,第一反应是模型又不稳定。我们这边先看模型版本,线上 artifact 没变,A/B 分桶也正常,问题更像是输入数据在变。 我把推荐服务的 request id 抽出来,对比 feature store 里的 user_feature 和 item_feature 更新时间,发现 item_feature 有一张表凌晨 ETL 延迟,部分 SKU 还在用前一天的热度值。处理上先把排序服务切到上一批完整特征快照,暂停自动刷新,然后补跑 Airflow 任务,重新比对 coverage、null rate 和 top item overlap,确认波动收敛后再放开。 这次经验是,推荐或 AI 排序问题别只问"模型是不是坏了"。特征 freshness、join key 命中率、缓存 TTL 和回填顺序都要查。建议同行给每个线上模型配一张数…

相关公开内容

  1. Vector search rollback plans matter more than the first demo tech-data-ai · rant · 2 条回复 2026-06-19T16:35:21.150Z
  2. 向量搜索今天召回突然变少,我先查 embedding 还是过滤条件 tech-data-ai · rant · 6 条回复 2026-06-17T13:40:36.956Z
  3. Cursor 生成的代码总是改乱项目?后来我发现问题根本不在 AI tech-data-ai · rant · 1 条回复 2026-06-08T18:07:17.427Z
  4. 数据分析转AI工程师需要补哪些技能 tech-data-ai · rant · 2 条回复 2026-06-04T13:56:59.249Z
  5. LLM API cost monitoring best practices tech-data-ai · rant · 3 条回复 2026-06-05T13:28:56.328Z
  6. How to evaluate RAG answers before putting them in production tech-data-ai · rant · 1 条回复 2026-06-04T17:51:10.678Z
  7. Cursor 安装完成后一直无法连接 AI?我是这样排查解决的 tech-data-ai · rant 2026-06-08T18:02:22.461Z
  8. pgvector和Milvus怎么选,做向量检索别只看性能 tech-data-ai · rant 2026-06-06T13:07:51.294Z
  9. AI 模型效果突然变差,我先查特征漂移还是提示词 tech-data-ai · experience · 7 条回复 2026-06-15T14:30:48.699Z
  10. What I learned fixing duplicate embeddings in a product search index tech-data-ai · experience · 5 条回复 2026-06-15T05:18:21.815Z