0
我有CountVectorizer和CharNGramAnalyzer之間的混淆。根據我的理解,scikit-learn中的CountVectorizer和CharNGramAnalyzer有什麼不同?
- CountVectorizer構建一個計數矩陣,其中行是出現計數的不同詞考慮到高維稀疏性。
- CharNGramAnalyzer構建一個計數矩陣,其中行是不同字符出現次數的計數。由於它不考慮文字,因此不需要知道單詞之間的分隔,並且適用於英語以外的語言。
我對我的理解是否正確?如果不是,我想要一個詳細的解釋或任何來源解釋它。
如果我的答案解決並回答了問題,請將其標記爲答案。 –