为什么 CSV 导入改变了我的仪表板总数以及我是如何调试的

这个问题出现在一个每周运营仪表板的维护过程中,该仪表板的数据源自两个供应商门户网站的 CSV 导出文件。起初问题并不严重:每次导入替换后的 CSV 文件时,即使可见行看起来完全相同,相同的收入总额也会发生变化。我怀疑是图表聚合出现了错误,尤其是当财务部门上传了从 Excel 导出而非直接从供应商门户导出的文件时,这种情况就会发生。当它导致管理层不再信任仪表板并要求重新进行手动电子表格核对时,我将其视为一个运营问题来处理。 我提取了行数、文件哈希值、导入时间戳以及类型转换前的原始列值,并将它们与暂存表、dbt 模型和 BI 语义层进行了对比。第一个有用的步骤是将两个文件加载到临时表中,而不是比较格式化后的电子表格。之后,在触及仪表板之前,我对发票 ID、货币和税码进行了分组检查。揭示根本原因的细节是:Excel 将两个长发票 ID 转换成了科学计数法,从而产生了虚假的重复项。 我选择了一个…

相关公开内容

  1. AI 标注结果忽高忽低该先查什么 tech-data-ai · experience · 2 条回复 2026-06-13T20:19:02.520Z
  2. Como depure un modelo de scoring que cambiaba cada manana tech-data-ai · experience · 2 条回复 2026-06-11T13:29:02.019Z
  3. Power BI 数据刷新失败怎么定位问题 tech-data-ai · experience · 2 条回复 2026-06-07T02:27:42.652Z
  4. 数据异常监控怎么做才不会天天误报 tech-data-ai · experience · 3 条回复 2026-06-05T20:53:23.775Z
  5. How to build a labeling workflow for AI training data tech-data-ai · experience · 2 条回复 2026-06-06T14:28:35.796Z
  6. The model was fine. The feature table was not. tech-data-ai · experience · 2 条回复 2026-06-03T15:57:00.258Z
  7. Why business dashboards lose trust and how we fixed ours tech-data-ai · experience · 1 条回复 2026-06-04T21:47:28.797Z
  8. AI 模型效果突然变差,我先查特征漂移还是提示词 tech-data-ai · experience 2026-06-15T14:30:48.699Z
  9. What I learned fixing duplicate embeddings in a product search index tech-data-ai · experience 2026-06-15T05:18:21.815Z
  10. AI 标注结果忽高忽低该先查什么 tech-data-ai · experience 2026-06-13T20:21:24.159Z