2013-03-14 58 views
0

計數器我在蟒蛇新我寫一個程序,尋找那些主題和提出反算來代詞,例如 貝拉熱愛音樂,她也喜歡時尚。 櫃檯應該返回貝拉,2包括代名詞。 有沒有一個簡單的方法來做到這一點 謝謝尋找代名詞,並在蟒蛇

+0

我想你可能會用[nltk](http://nltk.org/)來做到這一點。 – 2013-03-14 09:38:55

+1

給我們一些代碼 – Vor 2013-03-14 10:22:56

回答

0

+1。使用NLTK。標記你的句子和pos標記會給你代詞。您也可以使用頻率分佈進行計數。見他們的網站代碼示例

EDITED

import nltk 

tokens = nltk.word_tokenize("Bella loves music, she also loves fashion") 
tagged = nltk.pos_tag(tokens) 

還可以使用nltk.download()下載任何缺失NLTK包。

標記將每個詞pos標記,然後可以計數他們在一個循環或做某種freq分佈。這是pos標籤列表http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html

+0

我不確定這真的提供了一個答案 - 更多的是它同意評論。也許如果您指出可能有用的相關示例,或者在您鏈接到文檔幷包含片段時更具體...... – 2013-03-14 10:17:26

+0

我不想在提供的鏈接中提供代碼示例。我已經描述了獲取代詞數量的3個高級步驟。評論來自我的回答之前,我只是承認它... – Raghu 2013-03-14 12:02:12

0

我會以爲這是功課什麼的(因爲個人項目的事情不尋常的那種),因此你不能用庫。

#!/usr/bin/python 
# homework style, not using libraries 

source = "the cat sat on the mat" 
pronouns = ["i", "you", "bella", "fred", "he", "she"] # download a list from somewhere 

count = 0 
words = source.split() 
for w in words: 
    if w.lower() in pronouns: 
     count += 1 
print count 

編輯:是的,它是紅色的,我不能在上午10點30分匹配報價,當我還沒有睡覺呢。