我有22家公司在22x22矩陣中響應22個問題/參數。我應用了聚類技術,它給了我不同的羣體之間的相似之處。使用數據挖掘技術的定性數據分析
- 現在我想找到參數和公司偏好之間的相關性。哪種技術更適合於R?
- 通常情況下,我們建立貝葉斯網絡,從數據中找出不同參數之間的圖形關係。由於這些數據非常有限,我如何爲它建立貝葉斯網絡?
- 任何建議來分析這些數據。
我有22家公司在22x22矩陣中響應22個問題/參數。我應用了聚類技術,它給了我不同的羣體之間的相似之處。使用數據挖掘技術的定性數據分析
試着看一下特徵選擇和的特徵重要性在R,這很簡單, 這可能導致你:http://machinelearningmastery.com/feature-selection-with-the-caret-r-package/
一些包好:https://cran.r-project.org/web/packages/FSelector/FSelector.pdf ,https://cran.r-project.org/web/packages/varSelRF/varSelRF.pdf
這是好的SE問題很好的回答:https://stats.stackexchange.com/questions/56092/feature-selection-packages-in-r-which-do-both-regression-and-classification
這不是一個壞的曲estion,但它不是一個StackOverflow問題。我建議將其從此處刪除並重新發布到Data Science SE。或者提供一個MCVE,並顯示你已經完成的工作,確切地說你需要什麼統計數據以及你卡在哪裏,然後就可以。 –
是的,我已經在Data Science SE上試過了,但與StackOverflow相比,響應非常緩慢。 – DataMiner
的確如此,但這並不是向SO發佈離題問題的理由。這樣做會導致您的問題關閉,如果重複發生,您的帳戶將被刪除。 –