CountVectorizer()和TfidfVectorizer()里面都有一個成員叫做vocabulary_(后面帶一個下劃線) 這個成員的意義是詞典索引,對應的是TF-IDF權(quán)重矩陣的列,只不過一個是私有成員,一個是外部輸入,原則上應該保持一致。 1 vectorizer=TfidfVectorizer(stop_words=stpwrdlst, sublinear_tf=True, max_df=0.5) 關(guān)于參數(shù) input:s...
www.dbjr.com.cn/python/306248o...htm 2025-6-8