txt_.map(lambda x:x.split('\1')):使用lambda函數(shù)和map函數(shù)快速處理每一行數(shù)據(jù),這里表示將每一行以 '\1'字符分隔開,每一行返回一個(gè)list;此時(shí)數(shù)據(jù)結(jié)構(gòu)是:'pyspark.rdd.PipelinedRDD' txt_.map(lambda x:(x, x.split('\1'))).filter(lambda y:y[0].startswith('北京')):表示在返回 (x, x.split(...
www.dbjr.com.cn/article/1836...htm 2025-6-9