2009-11-11 71 views

回答

6

如果你有一大堆的例子已經被分類,你可以使用這些訓練分類。 這是一個非常簡單的文檔分類問題,任何一套機器學習工具都會有這樣的算法和教程。例如,檢查出秧雞:http://www.cs.waikato.ac.nz/ml/weka/

或rapidminer:http://rapid-i.com/content/blogcategory/38/69/

如果你的需求是有限的,而你只想要一個簡單的API,你不能去錯了這個樸素貝葉斯庫:https://ci-bayes.dev.java.net/

好運氣!

0

這將是對你有什麼幫助?

http://en.wikipedia.org/wiki/Document_classification

這不是一個最終的產品或服務,無論是代碼,但它描述了可以用於語義分析的各種算法。進一步Google搜索,我相信它還沒有真正走出實驗室。人們用KNN算法大多實驗,導致很酷的東西,而不是你真的需要什麼:

http://www.ebi.ac.uk/webservices/whatizit/info.jsf

但是如果有一些軟件,將你問什麼,它會在這個名單:

http://www.kdnuggets.com/software/text.html

例如,接口板,這似乎是能夠學習,如果你給它足夠的教學文件。

http://www.cs.uic.edu/~liub/LPU/LPU-download.html

0

如果您使用Python /解釋型語言,請查看nltk.org上出色的NLTK框架。它有一個很好的如何頁面和最近出版的O'Reilly書。

如果您正在使用Java和/或需要更成熟但更難掌握的框架,請嘗試使用GATE