2012-03-14 87 views
0

是否可以從句子中刪除標籤?一個人可以通過掃描文件並找到標籤並將其刪除,但由於標籤很多(某些型號有30多個,一些有48-50個,基本上跟着penn treebank pos tags),是否有一種快速和甜美的方式以更高效的方式去除標籤? 我沒有檢查API,但沒有這種方法去除標籤。刪除POS tagger的標籤

+0

你能用一個例子來解釋你想要什麼嗎?如果你只是不想要POS標籤,你不會運行一個POS標籤.... – 2012-03-15 02:51:18

+0

假設我使用標籤標籤了一個文件,現在我想根據下一個出現的標籤在文件上應用某些條件到每個單詞。之後,在修改過的文件中,我顯然不希望標籤出現,它們根本沒有用處,並且不受用戶的歡迎。所以,我想刪除標籤。 我已經找到了解決這個問題的方法,它不像上面我剛纔解釋的那樣簡單,我必須同時掃描原始文檔和標記文檔中的每一行以實現它。但是,我只是好奇,是否有一種更簡單的方法去除標籤。 :-) – 2012-03-15 12:22:15

回答

1

這裏沒有什麼特別的內容,但是由於輸出包括單詞和它的標籤,我不確定爲什麼你需要再次掃描原始文檔。難道你不能通過從最後一個tagSeparator字符('/'或其他)中刪除直到空格來刪除標籤嗎?或者,它可能是簡單的使用

-outputFormat tsv 

然後你會得到與在第一列的話,並在第二列標籤兩列的輸出,你可以只保留第一列完成時。