使用Ngram-Python創建多個句子的單詞計數矩陣

-2

假設我在csv文件中有多個句子（不是段落），比如句子A，B，C等。我想用N-gram（Unigrams或Bigrams）來計算每個句子中的單詞矩陣。這樣我就可以輕鬆地從我的矩陣中爲每個句子得到一個計算的N-gram向量。我該怎麼做？ PS：我已經嘗試了幾種方法，但是他們都是爲一個句子或整個段落計算N-gram！使用Ngram-Python創建多個句子的單詞計數矩陣

來源

2017-09-05 Hamid Ali

的可能的複製[什麼是NGRAM計數，以及如何使用NLTK實現？（https://stackoverflow.com/questions/12821201/what-are-ngram-counts-and-how-to-implement -using-nltk） –

@YuvalRaz已經在鏈接中回答的問題與我的不同:) –

，你可以嘗試用熊貓的數據幀，並使用在每一行「應用」

import pandas as pd 

x = pd.read_csv("the_santances.csv") 

x.apply("the function that calculates the ngram")

來源

2017-09-06 13:27:49

這沒有奏效，但我解決了這個問題 –

使用Ngram-Python創建多個句子的單詞計數矩陣

回答

相關問題