2
我有一個包含2個標籤的數據集,我知道這兩個標籤之間有很強的相關性。然而,當我使用不考慮相關性的scikit multilearn二元相關性時,我會得到與考慮這些標籤相關性的Labelpowerset分類器非常相似的結果嗎?對此有何評論? 除了我用http://scikit-multilearn.github.io/ 我不知道它有多有效?儘管強烈的標籤關聯,爲什麼多標籤性能結果與獨立標籤相同?
我有一個包含2個標籤的數據集,我知道這兩個標籤之間有很強的相關性。然而,當我使用不考慮相關性的scikit multilearn二元相關性時,我會得到與考慮這些標籤相關性的Labelpowerset分類器非常相似的結果嗎?對此有何評論? 除了我用http://scikit-multilearn.github.io/ 我不知道它有多有效?儘管強烈的標籤關聯,爲什麼多標籤性能結果與獨立標籤相同?
我是scikit-multilearn的作者。爲了回答你的問題,我需要看到標籤組合的情節。兩個標籤產生4種組合,但如果組合[1,0]和[0,1]嚴重支配[0,0]或[1,1]的情況,那麼您可能會遇到Label Powerset無法訪問的問題正確學習相關案例的基本分類器。它還取決於您使用哪種方法來驗證性能?