對不起,這個奇怪的「問題標題」,但我想不出一個合適的標題。命名實體識別:對於新/最新實體
進出口新的NLP概念,所以我用NER演示(http://cogcomp.cs.illinois.edu/demo/ner/results.php)。現在的問題是,「我如何使用NER完成這些標記的方式」如何&「。我的意思是這些答案或推論可以從這些在某些羣體中被標記的命名實體 - 位置,人員,組織等等得出。如果我有一個擁有全新公司名稱,地點等名稱的數據,那我該怎麼去爲這些數據做這些NER標記?
請不要downvote或阻止我,我只是需要完蛋了指導/專家的建議。閱讀一個概念是另一回事,同時能夠知道什麼時候應用它是另一回事,這就是我要求指導的地方。萬分感謝 !!!
一個從演示片段: -
狗已經在貨運領域一段時間以來一直使用,但剛剛被最近在 乘客區域在LOC紐瓦克和LOC JFK機場介紹。 LOC JFK有一隻狗LOC紐瓦克有一個 極少數,PER Farbstei n說。
因此,例如,香港專業教育學院得到了人們談論蘋果手機100萬個鳴叫,我想將它們歸類爲信息共享者,在討論價格,詢問供應情況等,然後在這種情況下,我想這不會是更大的知識庫。此外,在這種情況下,NER如何幫助我成爲解決這個問題的中間步驟?謝謝 – shalini 2014-10-08 18:19:11
我不確定NER會在這個用例中幫助你。你試圖將其稱爲文檔分類。 http://en.wikipedia.org/wiki/Document_classification 特別是如果你可以選擇足夠小的一組類別。你可以在你的分類器中使用NER作爲一個功能,但是如果你已經知道例如你所有的推文都是關於蘋果的,那麼我不知道你會從中得到什麼。 – aelfric5578 2014-10-08 18:24:32
Thansk aelfric,這就是爲什麼當sumbdy建議我時我對NER感到困惑。雖然我的情況只是3/4類別的推文分類,但在NER有幫助時也可以提供一些情況。即什麼樣的probs是有用的和在哪裏使用它,它是如何協助等。謝謝 – shalini 2014-10-08 18:37:19