outliers

    1熱度

    1回答

    我有一個數組如下: var myArray = [3, 6, 8, 9, 16, 17, 19, 37] 我需要去除異常值以及組中的剩餘數據到任何出現的獨特的基團。在這種情況下,37將作爲異常值被刪除,[3, 6, 8, 9]將被返回,因爲第一組和[16, 17, 19]將作爲第二組返回。 這裏是第二示例 var mySecondArray = [80, 90, 100, 200, 280, 28

    0熱度

    1回答

    我使用在包「mvoutlier」功能aq.plot(DF)獲取aq.plot()的異常值的索引。它很好地將異常值指數確定爲一個數組異常值。查看附件結果。如何通過將值複製到新變量來獲得該數組,如僞代碼index <- aq.plot(df)$outliers? 我試圖index <- aq.plot(df)$outliers和index <- aq.plot(df),這兩者的失敗。 > aq.plo

    1熱度

    1回答

    大熊貓數據異常檢測我有幾個缺口長期的數據系列,並想用一個低通濾波器來檢測異常。從理論上講,(數據中值)> 3西格瑪似乎是一個合適的測試,但有兩個問題與此: 數據系列過長和可變的,所以只使用一箇中間值和標準差爲整個系列不起作用, 使用pandas.rolling_median和pandas.rolling_std讓我很遠了,但現在的數據差距成爲一個問題,因爲在每一個有效的區間兩端的滾動值缺失,因此沒

    1熱度

    1回答

    所以我新的R和目前我正在試圖找出一組數據的異常值,到目前爲止,我已經輸入到R, lifespan_yrs<- c(38.6, 4.5, 14, 8, 69, 27, 19, 30.4, 28, 50, 7, 30, 3.5, 40, 3.5, 50, 6, 10.4, 34, 7, 28, 20, 3.9, 39.3, 41, 16.2, 9, 7.6, 46, 22.4, 16.3, 2.6

    0熱度

    1回答

    我經常使用的數據具有異常值。在Matlab中,我使用了非常有用的trimmean函數,但現在我想使用Python。我試圖尋找類似的功能,但找不到一個。我知道你可以使用matlab引擎的pymatlab使用Python的Matlab函數,但我想本機做到這一點。 (我發現在Matlab引擎中使用大的numpy數組非常慢,這是一個單獨的主題。)。在numpy或scipy中是否有trimmean函數?

    0熱度

    1回答

    我想編寫一個函數,該函數將輸入data.frame作爲輸入,並返回一個新的data.frame,該函數使用預測包中的tsclean()函數替換異常值。 對於例如輸入df(含明顯的異常值): df <- data.frame(col1 = runif(24, 400, 700), col2 = runif(24, 350, 600), col3 = runif(24,

    0熱度

    1回答

    我正在嘗試做一個簡單的函數,它將自動查找並刪除異常值。這是我迄今爲止創建的功能: fOutlier <- function(x, y) { outlier <- with(x, boxplot.stats(y)$out) subset(x, !(y %in% outlier)) } data <- fOutlier(data, variable) 問題是函數不會讀取x作

    -1熱度

    1回答

    基本上我想對一個名爲output9.csv的文件進行卡方檢驗。該文件中有兩列,我想選擇其中的一個進行grubbs分析。 1)如何讀取輸出。 這是我到目前爲止有: d <- read.csv('data.csv') 因此,對於這部分,應該是什麼我的括號內,即output9.csv? chisq.(mydata)

    -2熱度

    1回答

    現在我正試圖在我的一個名爲output9.csv的文件上做一個鐘形曲線。 這裏是我的代碼,我想用z值來檢測異常值,並使用數據集的值和平均值之間的差值。將差值與標準偏差進行比較以找出異常值。 VA #DATA LOAD data <- read.csv('output9.csv') height <- data$Height hist(height) #histogram #POPULA

    0熱度

    1回答

    我做了boxplot沒有異常值。 boxplot(data, names = names(files), las = 2, outline=FALSE) 現在,我想就加stripchart: stripchart(data, method = "jitter", add = T, col = "red") 情節看起來是這樣的: 我明白爲什麼情節是這樣的:因爲我沒有用boxplot繪製異常值