尋找代名詞，並在蟒蛇

計數器我在蟒蛇新我寫一個程序，尋找那些主題和提出反算來代詞，例如貝拉熱愛音樂，她也喜歡時尚。櫃檯應該返回貝拉，2包括代名詞。有沒有一個簡單的方法來做到這一點謝謝尋找代名詞，並在蟒蛇

2013-03-14 student1

我想你可能會用[nltk]（http://nltk.org/）來做到這一點。 – 2013-03-14 09:38:55

給我們一些代碼 – Vor 2013-03-14 10:22:56

+1。使用NLTK。標記你的句子和pos標記會給你代詞。您也可以使用頻率分佈進行計數。見他們的網站代碼示例

EDITED

import nltk 

tokens = nltk.word_tokenize("Bella loves music, she also loves fashion") 
tagged = nltk.pos_tag(tokens)

還可以使用nltk.download（）下載任何缺失NLTK包。

標記將每個詞pos標記，然後可以計數他們在一個循環或做某種freq分佈。這是pos標籤列表http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html。

來源

2013-03-14 09:57:10 Raghu

我不確定這真的提供了一個答案 - 更多的是它同意評論。也許如果您指出可能有用的相關示例，或者在您鏈接到文檔幷包含片段時更具體...... – 2013-03-14 10:17:26

我不想在提供的鏈接中提供代碼示例。我已經描述了獲取代詞數量的3個高級步驟。評論來自我的回答之前，我只是承認它... – Raghu 2013-03-14 12:02:12

我會以爲這是功課什麼的（因爲個人項目的事情不尋常的那種），因此你不能用庫。

#!/usr/bin/python 
# homework style, not using libraries 

source = "the cat sat on the mat" 
pronouns = ["i", "you", "bella", "fred", "he", "she"] # download a list from somewhere 

count = 0 
words = source.split() 
for w in words: 
    if w.lower() in pronouns: 
     count += 1 
print count

編輯：是的，它是紅色的，我不能在上午10點30分匹配報價，當我還沒有睡覺呢。

來源

2013-03-14 10:26:20 gecko

尋找代名詞，並在蟒蛇

回答

相關問題