2016-07-27 95 views
-1

我有22家公司在22x22矩陣中響應22個問題/參數。我應用了聚類技術,它給了我不同的羣體之間的相似之處。使用數據挖掘技術的定性數據分析

  • 現在我想找到參數和公司偏好之間的相關性。哪種技術更適合於R?
  • 通常情況下,我們建立貝葉斯網絡,從數據中找出不同參數之間的圖形關係。由於這些數據非常有限,我如何爲它建立貝葉斯網絡?
  • 任何建議來分析這些數據。
+1

這不是一個壞的曲estion,但它不是一個StackOverflow問題。我建議將其從此處刪除並重新發布到Data Science SE。或者提供一個MCVE,並顯示你已經完成的工作,確切地說你需要什麼統計數據以及你卡在哪裏,然後就可以。 –

+0

是的,我已經在Data Science SE上試過了,但與StackOverflow相比,響應非常緩慢。 – DataMiner

+0

的確如此,但這並不是向SO發佈離題問題的理​​由。這樣做會導致您的問題關閉,如果重複發生,您的帳戶將被刪除。 –

回答

1
+0

@Masousd謝謝你的好建議和鏈接,我想再澄清一點,它是一個定性數據,沒有標籤或類。所以,我不能使用監督學習技巧。 – DataMiner

+0

@ user986789我知道,你可以對數據進行聚類(例如使用kmeans),然後每個元組屬於一個聚類(例如cluster1,cluster2和...),因此每個元組都會得到一個標籤,然後嘗試這些特徵選擇方法 – Masoud

+0

是的,現在我明白了。再次感謝。 – DataMiner