我仍在研究評估使用聚類(無監督學習)形成的聚類?如何評估羣集?
我試着用搜索引擎,但我得到的措施過於理論化。如果人們可以分享他們正在使用的機制來評估形成的集羣,那將是非常好的。假設我有一個Java集羣,以便包含Java EE,Java ME,RMI,JVM等,另一個集羣表示NoSQL,並且將包含Neo4j,OrientDB,CouchDB等。這是完美的,我的聚類算法給了我最多準確的羣集。
但是經過培訓和測試後,我可能會說NoSQL集羣下的MySQL,Oracle,所以我只是做一個手動/視覺解釋,然後重新訓練我的算法或調整它,以便我得到更好的聚類。
現在我想自動執行這個手動可視化集羣的過程,並有一個系統給我準確的集羣形成。我正在尋找類似於搜索中使用的Precision,Recall,NDCG,Map等的東西。我的聚類長度不同,可能會形成n個不同的聚類,因此精度/回憶並不是正確的。
感謝您提供此信息。你的文章絕對有用。 – Yavar 2012-02-02 17:13:13
希望它有幫助!我很期待知道這個項目是如何結束的 – 2012-02-03 16:56:29