2009-08-09 58 views
1

我開始研究一個項目,其中我必須用關鍵字標記文檔,如果您手動執行(特別是如果您有成千上萬個文檔),這非常困難和耗時。所以我打算自動化這個過程(知道結果並不完美,但至少會給你一些建議的標籤)。 在最新的Firefox版本中,他們實現了這樣一個系統(當您爲頁面添加書籤時,它會建議您使用一些標籤)。自動文檔標記相關

yahoo term extraction服務也是一個很好的例子

因此,如果任何機構可以幫我解決這個問題,我會很感激的幫助。或者如果有人知道Firefox的標籤系統,那麼一點幫助就會很棒。

回答

1

統計算法會起作用嗎?也許是貝葉斯的東西?我知道他們用於垃圾郵件過濾,也許您可​​以調整貝葉斯過濾器以適應您的需求。

至少,你可以建議經常使用的詞語,但不是英語中常見的詞語(他,她,我,和它,或者等等)。