2012-07-17 64 views

回答

0

從頻繁模式計算規則相當容易,並且可能不會從並行和分佈中獲益很多。畢竟,預計數據中的頻繁模式數量會少得多。

因此,在Mahout之外做這件事可能會快很多,這取決於您擁有的頻繁模式的數量。

0

Mahout並不專門用於模式挖掘。

您可以檢查SPMF軟件:http://www.philippe-fournier-viger.com/spmf/index.php(我是作者)。

它擁有超過45種與頻繁項目集和關聯規則挖掘相關的算法的Java源代碼。

它包括一些經典算法,如FPGrowth的算法。但它也提供了幾種專門的算法,這些算法在其他數據挖掘工具中找不到,例如用於挖掘稀有項目集,可擦除項目集,高效用項目集,來自不確定數據的項目集等等。

例如,許多不同類型的關聯規則,您可以嘗試旁邊的「經典」關聯規則,如:封閉關聯規則,關聯規則的信息和通用基本規則,順序規則等。

它是根據GPL對於一些最流行的算法有一個簡單的GUI界面,如果你有任何問題,你可以在論壇發帖,我會盡力回答你。

+0

謝謝,但它不是我想要的 – whiletrue 2012-07-19 00:35:11

+0

在mahout中,只有他們所謂的「並行FP增長」才能找到項目集。找到項目集後,沒有用於生成關聯規則的算法。如果你想找Mahout的規則,你需要自己實現它。此外,請注意,他們所稱的「並行FPGrowth」與原始FPGrowth有點不同。 Mahout中的版本挖掘了top-k項目集,而不是使用minsup閾值挖掘項目集。 – Phil 2012-07-31 14:28:55