outliers

    0熱度

    1回答

    我想編寫一個程序來從我的數據集中刪除異常值。這段代碼顯示了異常的行數和列數,但它不會從我的數據集將其刪除: library(outliers) out <- outlier(Practice_data[,2:4], logical=TRUE) out <- cbind(FALSE, out) Practice_data[which(out[,], TRUE)] which(out[,],

    0熱度

    1回答

    我可以通過ELKI運行變化的k來運行LOF,以便比較哪個k最好? 通常你選擇一個k,然後你可以看到例如ROCAUC。我想爲數據集取出最好的k,所以我需要比較多個運行。我能做到這一點比手動更改k的值並執行運行更容易嗎?我想舉個例子比較所有k = [1-100]。 感謝

    1熱度

    1回答

    我試圖在我的數據框中檢測異常值,並用NA替換異常值。 我稍微修改了這裏提供的功能:How to repeat the Grubbs test and flag the outliers。當嘗試一個向量的函數時效果很好,但是我的問題是當我在數據框上使用它時。該函數檢測異常值,但我不知道如何將結果作爲數據幀。 我想要的結果是我的原始數據框由NA s取代。 NA將被檢測到的異常值。 這是我曾嘗試到現在爲

    0熱度

    1回答

    我幾乎所有來自R程序包的函數都有問題:離羣值。 的 「choosen一個」 功能,正常工作是異常值 list_ = ['chisq.out.test','cochran.test', 'dixon.test', 'grubbs.test', 'outlier', 'qcochran'] y = some data without brackets like 0.0, 0.0, 0.0

    -1熱度

    2回答

    我會盡力解釋我的疑問。 例如,我有一個表格,其中包含一些變量X,Y,Z。 每個變量都有數字值。 所以,讓我們說我有 RDIST RDENS AGR BLF 1 146 0.000 0 0.0 2 338 0.000 0 0.0 3 931 0.000 0 3.7 我試圖找出異常值,所以我用dotchart。 但是現在,我想知道,在每個變量中,在哪個觀察中我有異常值。 使用list(

    0熱度

    1回答

    我有一些極端異常值將我的迴歸模型拋出,並使用If-Then-Else語句將它們刪除。然而,SAS完全消除了這些數據點,並在剩餘的數據點中找到了新的異常值。有沒有辦法從分析中刪除異常值,而不會在混合中投入更多? 我計算Q3 + 1.5 * IQR,並使用該值作爲如此: Data lungcancer; input trt surv age sex @@; /* create a new varia

    1熱度

    1回答

    對於處理這樣的數據來說相當新穎;我有兩條曲線,我不知道如何處理,但我知道我希望得到什麼結果。兩個數據集的原始圖如下所示(左);下面(右)顯示了我想我對他們的粗略配合,疊加配合爲紅色。 第一個示例: 幅度的突然下降是數據採集過程中的一個假象。這意味着它本質上是不可預測的,並且我理想地希望找到一種對此行爲有效的方法。 在第一種情況下,我可以嘗試通過使用閾值以消除幅度的急劇下降,但不會幫助我在第二種情況

    2熱度

    1回答

    當執行進口 from sklearn.ensemble import IsolationForest 得到錯誤 Traceback (most recent call last): File "<ipython-input-13-90a3d865c881>", line 1, in <module> from sklearn.ensemble import IsolationForest

    -1熱度

    1回答

    想,我在我的手下面的數據集(google drive link), 最左邊一欄代表類型/類別的卡(梅花,黑桃,方塊,紅心)。其餘的列是特徵(Hu Moments)。 4.00000000e+000 1.81685834e-001 9.69817396e-006 1.38999809e-003 4.53935830e-006 -3.00925971e-010 -1.02459512e-008 -1.

    1熱度

    2回答

    我正在嘗試使用kmeans進行分析。 我有一個數據集: > head(data) tstamp elementid value hours 2016-09-15 15:20:28 IN_TEMP 25.12237 15 2016-09-15 15:20:29 IN_TEMP 25.44952 15 2016-09-15 15:20:29 IN_TEMP 25.5355