2017-04-24 548 views
0

我正在使用pycornlp庫。這個庫爲stanford corenlp提供了一個python包裝器。如何使用python庫提取NP(名詞短語)和VP(動詞短語)pycorenlp

我能夠得到下面給出的分析樹。

(ROOT 
(S 
(NP (PRP He)) 
(VP (VBP drink) 
    (NP 
    (NP (NN tomato) (NN soup)) 
    (PP (IN in) 
     (NP (DT the) (NN morning))))))) 

現在我想提取第一個NP和VP。

(NP (PRP He)) 
(VP (VBP drink) 

pycorenlp中是否有任何API可用?

是否有其他可用的API可用於提取所有NP或全部VP?

回答

0

CoreNLP的輸出通常是一個JSON(這是一個列表和字典的組合),您可以輕鬆篩選出所需的東西。

以下鏈接提供了一個很好的示例,向您展示如何連接到服務器,然後顯示一小段代碼,說明如何移動輸出文件並獲取所需內容。這個鏈接是:http://stanza.readthedocs.io/en/latest/example.text_classification.html#annotating-using-corenlp

,通過你的輸出文件進行篩選,該示例代碼是:

for token in annotation['sentences'][0]['tokens']: print token['word'], token['pos']

「註釋」是輸出變量。此代碼將打印出單詞及其詞類的列表。一旦找到NP和VP的第一個實例,您可以輕鬆修改此代碼以停止。

對於你的問題的簡單回答是,你可以通過for循環對輸出數據進行排序,找到NP和VP的第一個實例。

相關問題