2017-06-23 159 views
1

在我的實驗中,我使用的WordNet18數據,其中包含的形式(主語,謂語,賓語)的三元組,一些例子如下:如何解碼Wordnet實體?

03964744 _hyponym 04371774 00260881 _hypernym 00260622 02199712 _member_holonym 02188065

我想知道什麼實體ID,如03964744,代表。有沒有人知道如何解碼實體?

預先感謝您。

回答

1

您看到的8位數字是可能是數據文件中條目的字節偏移量。看到http://wordnet.princeton.edu/wordnet/man/wnintro.5WN.html

經過相當多的狩獵周圍,我認爲你看WordNet 3.0的數量(一個給定synset的字節偏移量不同版本之間; 3.1是最新版本)。

你的第一個條目似乎是說,揮杆是一種玩具:

http://compling.hss.ntu.edu.sg/omw/cgi-bin/wn-gridx.cgi?usrname=&gridmode=grid&synset=04371774-n&lang=eng&lang2=eng

http://compling.hss.ntu.edu.sg/omw/cgi-bin/wn-gridx.cgi?synset=03964744-n