我正在學習mahout中的fpgrowth,我找到了頻繁項目集的出生函數,但是如何使用mahout形成頻繁項目集的規則?它不是在mahout中實現嗎?如何使用mahout形成頻繁項目集的規則
1
A
回答
0
從頻繁模式計算規則相當容易,並且可能不會從並行和分佈中獲益很多。畢竟,預計數據中的頻繁模式數量會少得多。
因此,在Mahout之外做這件事可能會快很多,這取決於您擁有的頻繁模式的數量。
0
Mahout並不專門用於模式挖掘。
您可以檢查SPMF軟件:http://www.philippe-fournier-viger.com/spmf/index.php(我是作者)。
它擁有超過45種與頻繁項目集和關聯規則挖掘相關的算法的Java源代碼。
它包括一些經典算法,如FPGrowth的算法。但它也提供了幾種專門的算法,這些算法在其他數據挖掘工具中找不到,例如用於挖掘稀有項目集,可擦除項目集,高效用項目集,來自不確定數據的項目集等等。
例如,許多不同類型的關聯規則,您可以嘗試旁邊的「經典」關聯規則,如:封閉關聯規則,關聯規則的信息和通用基本規則,順序規則等。
它是根據GPL對於一些最流行的算法有一個簡單的GUI界面,如果你有任何問題,你可以在論壇發帖,我會盡力回答你。
相關問題
- 1. 如何根據來自支持的初始頻繁項目集生成關聯規則?
- 2. 查找頻繁項集
- 3. 從封閉頻繁項目集生成計數
- 4. 如何使用Orange3從CSV文件中的列中提取頻繁項目集?
- 5. 關聯規則挖掘和頻繁項目挖掘有什麼區別
- 6. 爲什麼apache Mahout頻繁模式minnig算法只返回1個項目itemsets?
- 7. 集成使用梯形規則用C給予某些價值
- 8. 檢查是否使用規定的規則集形成字符串
- 9. C#linq,獲取集合中最頻繁的項目
- 10. 如何查找頻繁的項目集而不考慮屬性名稱?
- 11. 如何將Hadoop與Mahout集成?
- 12. 如何從數據庫中選擇最頻繁的項目?
- 13. 如何使用mysql查詢從表中選擇最頻繁的項目?
- 14. 辛普森規則集成
- 15. Drupal規則/分類集成?
- 16. PMD與Maven - 如何禁用規則集中的一個規則?
- 17. 如何使用R計算項目集的頻率?
- 18. 如何將關聯規則集成到新的數據集
- 19. 形成項目
- 20. 使用boost生成一組矩形以形成不規則多邊形網格
- 21. 從事實形成規則。基於規則的編程
- 22. SonarQube規則不會同步到解決方案和項目規則集
- 23. 集成測試中的Autowire junit規則
- 24. 如何使用Eclipse項目的持續集成?
- 25. 如何繁殖2個陣列項目
- 26. 如何加快繁重的條件格式規則
- 27. 如何頻繁更新UILabel?
- 28. 如何使用Outlook規則
- 29. 使用集合時超越的規則
- 30. 頻繁項集最好的算法和圖書館
謝謝,但它不是我想要的 – whiletrue 2012-07-19 00:35:11
在mahout中,只有他們所謂的「並行FP增長」才能找到項目集。找到項目集後,沒有用於生成關聯規則的算法。如果你想找Mahout的規則,你需要自己實現它。此外,請注意,他們所稱的「並行FPGrowth」與原始FPGrowth有點不同。 Mahout中的版本挖掘了top-k項目集,而不是使用minsup閾值挖掘項目集。 – Phil 2012-07-31 14:28:55