outliers

    2熱度

    1回答

    我正在嘗試使用geom_boxplot繪製圖片。然而,我想改變晶須的定義,這意味着晶須的末端是我的數據的最大值和最小值,異常值應該被移除。基於我的存在代碼將會很好。 非常感謝。 con.for2=data.frame(d=as.character(gl(9,20)),close=exp(rnorm(180)),open=exp(rnorm(180))) concentration=melt(co

    1熱度

    1回答

    我正嘗試使用聚類來識別我的數據集中的帶。我與供應鏈數據的工作,所以我的數據是這樣的: 相關列是個每價格。 問題是,有時我們錯誤地認爲該產品的價格是100而不是10,所以每個價格看起來像(2,0.25,3)。我想創建一個只創建集羣的代碼,如果其他集羣的平均價格至少比所有現有集羣大2倍或更少。 例如,如果我的每個價格是(4,5,6,13,14,15),我希望它返回質心爲5和14的2個集羣。另一方面,如

    2熱度

    1回答

    我在R v3.2.3中使用tsoutliers v0.6.5,並遇到與tso函數有關的問題。此外,使用forecast v7.3和KFKSDS v1.6(如果有幫助)。 這裏是一個重複的例子: library(tsoutliers) s <- ts( c(61,26,10,2,6,20,139,185,132,162,160,140,148, 173,171,160,119,

    0熱度

    1回答

    我有一個(268X4)df,並找到一列的異常值(22,1)。我想從df中刪除那些異常值。我怎麼做? > df=df_nonull import pandas as pd # to manipulate dataframes import > numpy as np # to manipulate arrays > > # a number "a" from the vector "x" is

    1熱度

    1回答

    我的代碼檢測時間序列中的異常值。我想要做的是將第一個數據幀列中的異常值替換爲以前的值,這不是異常值。 此代碼只是檢測離羣值,創建布爾陣列,其中: True意味着,在數據幀的值是異常值 False意味着,在數據幀的值不是異常值 series = read_csv('horario_completo.csv', header=None, squeeze=True) df=pd.DataFrame(s

    1熱度

    2回答

    我是R新手。在使用R之前,我使用了GraphPad Prism 7.0。 Só現在我試圖比較兩個數據處理器。我在分位數計算中創建了一個區別,所以任何人都知道他們爲什麼是不同的? 在R I具有 par(pty="s", cex.axis=1, las=1, cex.lab=1) a1=c(22.02, 23.83, 26.67, 25.38, 25.49, 23.50, 25.90, 24.89,

    0熱度

    1回答

    我想在應用groupby函數後使用列變量的標準偏差從熊貓數據框中刪除異常值。 這是我的數據幀: ARI Flesch Kincaid Speaker Score 0 -2.090000 121.220000 -3.400000 NaN NaN 1 8.276460 64.478573 9.034156 William Dudley 1.670275 2 19.

    0熱度

    1回答

    我試圖捕獲FIRST_CONTACT_CAL_DAYS的平均值,但是我想要做的是爲值的頂部和底部10%創建一個指標,以便我可以將這些(異常值)從我的平均計算。 不知道如何去做這個,有什麼想法? SELECT DISTINCT TO_CHAR(A.FIRST_ASSGN_DT,'DAY') AS DAY_NUMBER, A.FIRST_ASSGN_DT, A.FI

    0熱度

    1回答

    使用K均值聚類時,我刪除了獨立變量的前5位和後5位百分位數值,因此我在幾個數據點上丟失了數據。 現在我使用K均值聚類後,我得到每個數據點的聚類。我如何獲得先前由於異常值而被刪除的數據點羣集

    1熱度

    2回答

    分組我有由樣本分組的3個參數測量值的數據幀一個數據幀中刪除異常值: ORD curv exp rep mu lam abs 1 Combi pH=7 Curva_F_Cor Exp_F Rep1 0.15637365 714.947.305 0.4990000 2 Combi pH=7 Curva_F_Cor Exp_F Rep10 0.12817901 6.797.925.883