2017-09-05 63 views
0

我知道從文檔獲取各種屬性的基本空間工作流,但是我找不到內置函數來返回單詞的位置(開始/結束)這是一個句子的一部分。用空間獲取單詞的位置

有人會知道Spacy有可能嗎?

回答

3

這些可用作句子中的標記屬性。 Doc說:

idx int父級文檔中令牌的字符偏移量。

i int父級文檔中令牌的索引。

>>> import spacy 
>>> nlp = spacy.load('en') 
>>> parsed_sentence = nlp(u'This is my sentence') 
>>> [(token.text,token.i) for token in parsed_sentence] 
[(u'This', 0), (u'is', 1), (u'my', 2), (u'sentence', 3)] 
>>> [(token.text,token.idx) for token in parsed_sentence] 
[(u'This', 0), (u'is', 5), (u'my', 8), (u'sentence', 11)]