最近更新时间: 2024-10-17 17:10:00
分布键关系到数据分布是否均衡,原则就是不能由于各个分布键值数据不均产生数据倾斜,出现木桶效应。
如果有主键,则选择主键做分布键。
如果是复合主键,则可选择数据重复率低的字段来做分布键。
没有主键的可以使用JAVA生成UUID来做分布键。
如果涉及数据表JOIN,则选择JOIN字段来做分布键。
也可以按业务类型,地区或者分公司来做分布键。