0
我最近使用首發NLTK看着數據提取。雖然有幾個例子,用於檢測「真實」的名稱,位置等技術。我還沒有找到一個有效的方法來檢測「由」或「虛」的名字。一個例子字符串是:可能訓練NLTK以檢測句子中「拼湊」的名字?
他的名字是wuzzywugg,他有一個名爲fizzbuzz
狗,我想訓練NLTK是能夠檢測「wuzzywugg」和「fizzbuzz」的名字的字符。看到了一些解決方案,依靠開頭大寫字母詞,但這種感覺很「哈克」 而且容易出錯和誤報。
如何解決這個問題的任何幫助,將不勝感激。提前致謝。
命名實體識別依靠各種線索(通常包括大小寫),以決定哪一種命名實體的(如果有的話),他們正在尋找。如果你不關心從名稱中區分實際情況,這對你來說應該已經足夠好了。 – alexis