1
我有一個字符串表示一篇文章,名爲text
。我試圖運行TFIDF並得到一個數據幀。生成的數據框應該將每個單詞作爲列名稱。這裏是我的嘗試:此代碼運行SKLearn:使用TfidfVectorizer時丟失列名稱
corpus = [text]
tfidf_transformer = TfidfVectorizer(min_df=1, ngram_range=(1,1), use_idf=True)
tfidf_df = tfidf_transformer.fit_transform(corpus)
tfidf_df = pd.DataFrame(tfidf_df.toarray())
print 'tfidf_df: ', tfidf_df.head()
之後,我有一個數字我的列名,而不是較TFIDF的特徵詞。
我應該如何得到列中的每個詞在text
字符串中遇到?
謝謝!