我正在挖掘一些數據。 我想節省時間。 那麼任何方法?任何一種優化Apriori算法的數據挖掘算法?
1
A
回答
1
- 使用正確的編程語言(EX:用VB可能是災難性的)
- 制定您所需要的信息和代碼的相應
- 計劃減少數據庫的大小或準備數據庫根據您的需要
- SUPER計算機(硬件是沒有的事,玩笑歸玩笑,你需要一個非常大的數據集尤指良好的計算機)
提高Apriori算法本身:
•基於散列的項目集計數:相應的散列存儲桶計數低於閾值的k項目集不能很頻繁。
•事務減少:在隨後的掃描中不包含任何頻繁的k-itemset無效的事務。
•分區:數據庫中可能頻繁出現的任何項目集都必須在數據庫的至少一個分區中頻繁出現。
•抽樣:在給定數據的子集上進行挖掘,降低支持閾值+確定完整性的方法。
•動態項目集計數:僅在估計所有子集都頻繁時才添加新的候選項目集。
2
如果你是挖掘數據,你想節省時間,你應該考慮使用,而不是試圖優化先驗FPGrowth。
即使您優化Apriori,它也不會像FPGrowth的良好實施一樣快。
Apriori很重要,因爲它是第一個用於頻繁項目集挖掘和關聯挖掘的算法。但現在有一些更高效的算法。
相關問題
- 1. 哪種數據挖掘算法最好?
- 2. 數據挖掘算法比較
- 3. 建議這種情況的數據挖掘算法
- 4. DBSCAN算法和數據挖掘聚類算法
- 5. 數據集Apriori算法
- 6. 關於一些數據挖掘算法的問題
- 7. 在數據挖掘中映射數據的算法
- 8. 簡單的比特幣挖掘算法
- 9. Weka Apriori算法
- 10. Pseudo-Apriori算法
- 11. R數據挖掘語法
- 12. 斜率一種算法,優化查詢
- 13. Apriori算法的超市數據集
- 14. Weka Apriori算法轉換數據集
- 15. 算法優化
- 16. 算法的優化
- 17. 優化數據庫的搜索算法
- 18. 循環數據的優化算法
- 19. scipy.optimize.leastsq使用哪種優化算法?
- 20. SciPy優化算法
- 21. 優化WordWrap算法
- 22. 數據挖掘:Apriori問題。最小支持
- 23. 你會如何在哪一種算法優於另一種算法
- 24. 確定類別的內容挖掘的算法
- 25. apriori算法無法轉換成csv的數據集
- 26. 進化優化算法
- 27. python數據挖掘
- 28. 什麼是文本挖掘的基本算法?
- 29. 錯誤(數據挖掘):在挖掘模型中未指定任何案例
- 30. 用於核心外計算/數據挖掘的Python工具