Q

如何使用mahout形成頻繁項目集的規則

2012-07-17 64 views 1 likes

1

我正在學習mahout中的fpgrowth，我找到了頻繁項目集的出生函數，但是如何使用mahout形成頻繁項目集的規則？它不是在mahout中實現嗎？如何使用mahout形成頻繁項目集的規則

2012-07-17 whiletrue

A

回答

0

從頻繁模式計算規則相當容易，並且可能不會從並行和分佈中獲益很多。畢竟，預計數據中的頻繁模式數量會少得多。

因此，在Mahout之外做這件事可能會快很多，這取決於您擁有的頻繁模式的數量。

2012-07-17 16:54:12

0

Mahout並不專門用於模式挖掘。

您可以檢查SPMF軟件：http://www.philippe-fournier-viger.com/spmf/index.php（我是作者）。

它擁有超過45種與頻繁項目集和關聯規則挖掘相關的算法的Java源代碼。

它包括一些經典算法，如FPGrowth的算法。但它也提供了幾種專門的算法，這些算法在其他數據挖掘工具中找不到，例如用於挖掘稀有項目集，可擦除項目集，高效用項目集，來自不確定數據的項目集等等。

例如，許多不同類型的關聯規則，您可以嘗試旁邊的「經典」關聯規則，如：封閉關聯規則，關聯規則的信息和通用基本規則，順序規則等。

它是根據GPL對於一些最流行的算法有一個簡單的GUI界面，如果你有任何問題，你可以在論壇發帖，我會盡力回答你。

2012-07-18 03:36:37 Phil

+0

謝謝，但它不是我想要的 – whiletrue 2012-07-19 00:35:11

+0

在mahout中，只有他們所謂的「並行FP增長」才能找到項目集。找到項目集後，沒有用於生成關聯規則的算法。如果你想找Mahout的規則，你需要自己實現它。此外，請注意，他們所稱的「並行FPGrowth」與原始FPGrowth有點不同。 Mahout中的版本挖掘了top-k項目集，而不是使用minsup閾值挖掘項目集。 – Phil 2012-07-31 14:28:55

相關問題