2009-08-10 57 views
4

先驗算法所以一個recent question,我注意到相當清涼apriori algorithm的。我可以看到它爲什麼起作用,但我不確定的是實際用途。據推測,計算相關物品組的主要原因是能夠根據他們自己的購買(或擁有物品等)爲某人提供推薦。但是,你如何從一組相關的項目到個人建議?使用的建議

維基百科的文章完成:

第二個問題是產生自那些大型 項集與 最小的信心約束 關聯規則。假設其中一個大項目集是Lk,Lk = {I1,I2,..., ,Ik},則按照以下方式在 中生成與此 項目集的關聯規則:第一個規則是{I1, I2,...,Ik -1} {⇒益},通過檢查 信心,這個規則可以被確定 有趣與否。然後其他規則 被刪除最後 項目的前提和插入 它隨之產生,進一步的新規則 置信度 檢查,以確定 興趣他們。這些 過程重複直到 前因變空

我不知道的關聯規則組如何幫助確定建議的最佳設置要麼,雖然。也許我錯過了這個觀點,並且apriori不適合這種用途?在這種情況下,它的用途是什麼?

回答

2

所以apriori算法不再是現有技術的市場購物籃分析(又名Association Rule Mining)。雖然Apriori原理(即子集的支持上限支持該集合)仍然是一種推動力,但這些技術已經得到改進。

在任何情況下,雙向關聯規則是用來生成建議是,給予一定的歷史項集,我們可以檢查每個規則的antecedant以查看是否包含在歷史。如果是這樣,那麼我們可以推薦該規則的結果(排除當然已經包含在歷史中的情況)。

我們可以用不同的指標來排名我們的建議,因爲有規則的大量比較它們的歷史時,我們可以有很多的點擊,我們只能做建議的數量有限。一些有用的度量標準是支持的規則(這與支持先前者和後繼者的聯合相同),置信度的規則(規則支持先前者的支持)和規則(該規則在支撐antecedant和隨之而來的產品的支持),以及其他的電梯

+0

比較每個規則與給定用戶的集合似乎效率極低 - 這不是一個性能問題?有沒有可能對此進行優化? – 2009-08-10 16:17:51

+0

那麼,您可以按照指標對規則進行一次排序,然後對於每個歷史記錄,在足夠的規則匹配歷史記錄後停止檢查;或者,您可以通過antecedant創建規則的網格檢查子規則,如果他們的父規則匹配,你可以通過antecedant將規則聚類在一起 – rampion 2009-08-10 17:38:33

+0

好主意。排名似乎仍然只會通過一個常數因子減少工作量 - 大多數規則不匹配。更好的主意,儘管我不知道任何索引對於查找作爲搜索查詢子集的條目都適用。 – 2009-08-10 18:40:37

0

如果您想了解先驗如何用於分類你不需經過看報紙關於CBA算法的一些細節:

劉兵,許懷恩,亦名馬「集成分類和關聯規則挖掘。「第四屆知識發現和數據挖掘國際會議論文集(KDD-98,全體會議演講),紐約,美國,1998年