我需要一些靈感。對於一個愛好項目,我正在玩內容分析。我基本上試圖分析輸入以將其與主題地圖相匹配。您使用哪些工具分析文本?
例如:
- 「在伊拉克問題上的方式」>歷史,中東
- 「Halloumni」>食品,中東
- 「寶馬」>德國,汽車
- 「奧巴馬「>美國
- 」黑斑羚「>美國,汽車
- 」柏林牆「>歷史,德國
- 」 Bratwu RST」>食品,德國
- ‘漢堡’>食品,美國
- ...
我一直在閱讀了很多關於分類,最後,不管我讀的結論是,所有的人標籤不同的,因此係統必然會失敗。
我想到了標記化輸入和停止詞彙列表,但他們當然需要大量的工作來構建和構建。建立單詞和主題之間的相關鏈接看起來很累,也永遠不會因爲你處理的任何語言而產生,它非常豐富,大多數語言也很大程度上依賴於上下文。更不用說維護它了。
我想我需要拿出東西聰明和訓練我想讓它能夠猜測的主題。有點像Eliza bot。
無論如何,我不認爲有些東西可以開箱即用,但是沒有人有任何技術指導或示例用於分析輸入以便提取含義?
我想我嘗試了多次註冊。他們仍然欠我一個密碼。但我想我會再試一次,讓你知道它是如何結果。非常感謝! – Till 2009-05-30 16:59:35