2014-09-02 63 views
2

我剛從項目GRIAL下載了一個西班牙文Wordnet,格式是XML。我如何在Python NLTK中使用它?如何在NLTK中使用西班牙文的Wordnet?

除此之外,在同一頁面中,您可以用西班牙語下載帶標籤的語料庫。我怎樣才能整合它?

+0

爲什麼不直接使用NLTK內置的西班牙功能? – 2014-09-10 16:16:23

+0

@JamesTobin內置的問題是它很深,並不是很精確。你有任何想法如何整合? – nanounanue 2014-09-11 14:49:35

+0

好吧,我的西班牙語是有限的,所以試圖瀏覽你列出的網站對我來說很難。但考慮到你有xml,我相信你可以用NLTKs語料庫讀者做些事情。他們可以閱讀XML文件,使用http://nltk.googlecode.com/svn/trunk/doc/api/nltk.corpus.reader.xmldocs-module.html或許 – 2014-09-15 16:02:13

回答

1

使用XMLCorpusReader加載XML數據爲主體

下面的代碼做

from nltk.corpus.reader import XMLCorpusReader 
reader = XMLCorpusReader(dir, file) 

它採用XMLCorpusReader工作的完整示例給出here

+0

讓我試試吧... – nanounanue 2014-09-18 03:54:14

相關問題