2011-12-21 73 views
1

我是數據挖掘的新手。我在做我的B.Tech最後一年,我的最後一年的項目標題是「使用文本挖掘從學生反饋中提取和分析教師管理學科的表現」。在這裏,我們將有一些包含學生反饋的文件,每個學生將有一個文件。從所有這些文件中,我們必須檢索有用的信息。需要關於文本挖掘的想法,以從大量文件中挖掘數據

任何人都可以告訴我如何開始,有什麼工具可以使用? 有什麼技術可以使用? 我熟悉JAVA(jse),我可以用java編程語言實現這個,怎麼樣?

問候...... Upendra.S

回答

3

一些想法:

  • 這是最常用的單詞或短語?
  • 哪些詞經常共同出現(關聯分析)的學生成績
  • 詞/短語頻率(這詞做頂部和底部的學生在教授的評論使用?)通過教師的評價
  • 詞/短語頻率(哪些詞與學生給予教員比分
  • 詞/短語頻率由教師任職有關(?)這詞與新舊PROFS關聯?)

這裏是我的五個部分組成的系列上快速採礦文本挖掘:

http://vancouverdata.blogspot.com/2010/11/text-analytics-with-rapidminer-loading.html

0

在我看來,你可以通過這些話題。它幫助了我的一個項目。

工具 - Matlab TMG tool

使用的算法 - 潛在語義分析。 (LSA Example

數學概念 - 奇異值分解。 (SVD