計數器我在蟒蛇新我寫一個程序,尋找那些主題和提出反算來代詞,例如 貝拉熱愛音樂,她也喜歡時尚。 櫃檯應該返回貝拉,2包括代名詞。 有沒有一個簡單的方法來做到這一點 謝謝尋找代名詞,並在蟒蛇
回答
+1。使用NLTK。標記你的句子和pos標記會給你代詞。您也可以使用頻率分佈進行計數。見他們的網站代碼示例
EDITED
import nltk
tokens = nltk.word_tokenize("Bella loves music, she also loves fashion")
tagged = nltk.pos_tag(tokens)
還可以使用nltk.download()下載任何缺失NLTK包。
標記將每個詞pos標記,然後可以計數他們在一個循環或做某種freq分佈。這是pos標籤列表http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html。
我不確定這真的提供了一個答案 - 更多的是它同意評論。也許如果您指出可能有用的相關示例,或者在您鏈接到文檔幷包含片段時更具體...... – 2013-03-14 10:17:26
我不想在提供的鏈接中提供代碼示例。我已經描述了獲取代詞數量的3個高級步驟。評論來自我的回答之前,我只是承認它... – Raghu 2013-03-14 12:02:12
我會以爲這是功課什麼的(因爲個人項目的事情不尋常的那種),因此你不能用庫。
#!/usr/bin/python
# homework style, not using libraries
source = "the cat sat on the mat"
pronouns = ["i", "you", "bella", "fred", "he", "she"] # download a list from somewhere
count = 0
words = source.split()
for w in words:
if w.lower() in pronouns:
count += 1
print count
編輯:是的,它是紅色的,我不能在上午10點30分匹配報價,當我還沒有睡覺呢。
- 1. 尋找列表中的蟒蛇
- 2. 解析列表尋找具有蟒蛇
- 3. 蟒蛇 - 尋找DB驅動程序
- 4. 比較兩個文件,並找到在蟒蛇匹配詞
- 5. 蟒蛇名
- 6. 蟒蛇迭代
- 7. 代表蟒蛇
- 8. 蟒蛇使用詞典
- 9. 蟒蛇身份詞典
- 10. 蟒蛇查找表
- 11. 蟒蛇RuntimeError: 「MI」 沒有找到替代
- 12. 合併名單列表內的蟒蛇
- 13. 無法在蟒蛇蟒蛇
- 14. 差異「是」,並在蟒蛇
- 15. 蟒蛇:按名稱
- 16. 迭代在循環蟒蛇
- 17. 蟒蛇 - 查找替換詞在兩個字符串
- 18. 迭代與蟒蛇
- 19. 蟒蛇從代理
- 20. 替代蟒蛇代替
- 21. 蟒蛇xml.etree - 如何尋找一個以上的屬性
- 22. 蟒蛇的grep尋找一個圖案,然後前
- 23. 找到列表串 - 蟒蛇
- 24. 蟒蛇沒有找到pygame.locals
- 25. cxfreeze找不到libpyside,蟒蛇
- 26. 如何找到蟒蛇
- 27. 蟒蛇找不到GL
- 28. 蟒蛇找到位置
- 29. 蟒蛇找不到OpenCV的
- 30. 蟒蛇在PowerShell中VS蟒蛇CLI
我想你可能會用[nltk](http://nltk.org/)來做到這一點。 – 2013-03-14 09:38:55
給我們一些代碼 – Vor 2013-03-14 10:22:56