2010-12-08 59 views
0

我試過RSAR,一個免費軟件包,但我想知道是否還有其他好的屬性縮減器。即使是R或matlab的包,任何資源都可以讓我找到最小的屬性歸類數據。例如,如果擁有一組包含數百個郵件示例和不同屬性的集合,並將它們描述爲垃圾郵件或垃圾郵件,我希望找到描述所有數據的最小屬性集合,以放棄無用信息。基於粗糙集的屬性約簡

我希望我自己expal,如果沒有,我願意接受你的建議。

謝謝。

回答

0

考慮到您描述的問題類型,即:爲電子郵件分類選擇正確的屬性,最好的方法可能是使用Weka(Weka home)。它有幾個特徵選擇算法,可以交互式應用以顯示其效果,或與各種分類算法結合使用,以評估它們對實際分類的影響。 (注意,如果沒有對特定分類器進行適當的驗證,選擇屬性進行分類可能會導致實際生活中的結果不盡如人意)。

一些相關鏈接:

Weka's manual regarding attribute selection

A (somewhat outdated) hands-on example

0

均可以使用語言的RoughSets包。請參閱R中的FS.one.reduct.computation的描述(安裝RoughSets包後)

例如:HIRING2Matrix是具有多個屬性的決策表。 reduct1是屬性

reduct1 <的減少集 - FS.one.reduct.computation(HIRING2Matrix,貪婪= TRUE,功率= 1)