分布键选择规范

最近更新时间: 2024-06-12 15:06:00

  • 分布键关系到数据分布是否均衡,原则就是不能由于各个分布键值数据不均产生数据倾斜,出现木桶效应。

  • 如果有主键,则选择主键做分布键。

  • 如果是复合主键,则可选择数据重复率低的字段来做分布键。

  • 没有主键的可以使用JAVA生成UUID来做分布键。

  • 如果涉及数据表JOIN,则选择JOIN字段来做分布键。

  • 也可以按业务类型,地区或者分公司来做分布键。