SparkRecentDaysClusteringPlanStrategy:根據(jù)以前的N天分區(qū)創(chuàng)建一個計劃,將這些分區(qū)中的小文件片進行Clustering,這是默認策略,當工作負載是可預測的并且數(shù)據(jù)是按時間劃分時,它可能很有用。 SparkSelectedPartitionsClusteringPlanStrategy:如果只想對某個范圍內(nèi)的特定分區(qū)進行Clustering,那么無論這些分區(qū)是新分區(qū)還是舊分區(qū),此...
www.dbjr.com.cn/article/2428...htm 2025-5-26