我一直在研究決策樹學習者算法,以檢測欺詐性銀行交易。 到目前爲止,我已經根據我的數據集爲決策樹生成了規則集。 我還爲每個規則生成了顯着性值:我的數據集中有多少交易滿足特定規則,規則捕獲的欺詐百分比等。 現在,根據規則的重要性,我需要選擇top十條規則。決策樹學習者算法生成的規則是否相關?
我的問題是當我選擇前十條規則時,是否有一些規則相關的機會?
例如: 我正在處理的數據集有10000個事務。 決策樹算法給了我20條規則。 在20條規則中,我需要選擇前十條規則。 現在,假設規則1標識了50個事務,規則2標識了60個事務。規則1所標識的一些規則也有可能被規則2識別出來了嗎?
注:前十名交易是捕獲大部分欺詐行爲的交易。