pgvector和Milvus怎么选,做向量检索别只看性能
做向量检索选型时,很多人一开始就问 pgvector 够不够快、Milvus 能不能扛量。我觉得先别急着压测,先问业务到底要检什么。只是给内部知识库做几十万条文档检索,和做千万级商品、图片或日志相似搜索,复杂度完全不是一回事。 如果团队本来就用 PostgreSQL,数据量不大、权限和事务又想跟业务表放在一起,pgvector 上手确实省事。问题是后面一旦要多集合、冷热分层、批量重建索引、专门调召回率和延迟,专用向量库会轻松很多。选 Milvus 这种方案,也别只看 QPS,运维、备份、索引重建时间、数据同步链路都要有人管。 我现在更习惯先做一版小样本评估:同一批查询,看召回、误召、过滤条件、重排效果和更新延迟。向量检索不是越高级越好,关键是团队能不能解释为什么这条结果排在前面,线上错了能不能查得回来。