产品 Feed 图片需要爬虫式检查,而非浏览器检查
一个产品图片问题误导了我们,因为在浏览器中查看店面时一切正常。Google Merchant Center 开始发出警告,称部分图片 URL 无法抓取。我们的团队可以打开这些图片,CDN 仪表板显示的流量也正常,所以第一反应是等待。但警告却越来越多。 我们像爬虫一样测试了这些图片 URL,而不是像已登录的购物者那样。这意味着没有 Cookie、没有浏览器缓存、使用普通的 User Agent,并且请求来自我们办公网络之外。一些 URL 返回了重定向链,最终在 CDN 上被一个拦截尺寸参数阻断。浏览器有缓存版本,但爬虫访问的是损坏的路径。我们修复了图片转换规则,清除了受影响的 URL,并重新生成了 Feed,这样 Merchant Center 就能看到正常的链接了。 结论是:Feed 的质量保证(QA)不同于店面的质量保证。产品 Feed 是由爬虫、市场平台和广告系统读取的,它们的行为与…