outliers

    -1熱度

    2回答

    我已經在matlab中生成了一個數據集,然後在數據中嵌入了一些異常值。我想繪製它,因爲我是新的matlab中,我不知道如何從不同的符號或不同的顏色從內部指定異常值。相對於x軸,y軸以及它們兩者的偏離點。這是matlab的代碼; pd = makedist('Normal'); rng(38) a = random(pd,100,1); b = datasample(1:100,40,'Rep

    0熱度

    1回答

    我強加了「方塊圖」作爲方法和1.5作爲因素。 節點描述告訴: 「子集 選擇對測量結果進行分組的列(例如:板,批次,運行...)」 什麼功能「組測量」?使用Mean + IQR *(1.5)和Mean - IQR *(1.5)獨立測量其他列的異常值是否不是?

    1熱度

    1回答

    我正在從Michael Faraway的線性模型(其中R(第11章,第160頁))開始PCA部分的工作。 PCA分析對異常值敏感,Mahalanobis距離有助於我們識別它們。 作者通過繪製馬哈拉諾比斯距離和卡方分佈的分位數來檢查異常值。 if require(faraway)==F install.packages("faraway"); require(faraway) data(fat,

    0熱度

    1回答

    我正在尋找一個宏或SAS中的某些東西,可以幫助我隔離數據集中的異常值。我將異常值定義爲:上限:Q3 + 1.5(IQR)下限:Q1-1.5(IQR)。我有以下SAS代碼: title 'Fall 2015'; proc univariate data = fall2015 freq; var enrollment_count; histogram enrollment_count/vscal

    2熱度

    1回答

    我有一個數據集,它包含一個幀的某個對象的像素值。我的代碼可以在大多數時間準確地檢測到對象;但是,有負面影響。我繪製了前600個值(x軸:幀號,y軸:對象的像素位置)。在第一張圖片中,您可以看到原始數據;在第二張圖片中,您可以看到正確的路徑。 我已經嘗試過使用不同參數進行平均值和中值濾波,但我無法獲得任何有用的信息。是否有任何方法/算法用正確值替換異常值?

    0熱度

    1回答

    我想知道是否有方法來計算異常值在直方圖的情節。我想繪製一個隨機變量的頻率,這個隨機變量非常小,分佈在零附近。然而,在我考慮的大多數情況下,我也有一個讓事情複雜化的異常點。有沒有辦法在R/Matlab中調整x軸的縮放比例,以便我可以捕獲我正在考慮的隨機變量的分佈,並顯示異常值?因爲獲得繪圖的正常方法導致所有值都被認爲是零,我想要顯示它們是如何分佈在零附近的。因此,理想情況下,我希望將零附近的比例表示

    0熱度

    1回答

    關於數據科學的另一個常見問題! 假設我有一堆樣本,並且必須檢測每個樣本的異常值。我的數據是單變量的,所以我可以使用簡單的方法,如標準偏差或中位數絕對偏差。 現在我的問題是:怎麼會做任何形式的驗證,以查看結果是否一致,尤其是如果由於數據的大小而不是一個選項來看待它們?例如,選擇用多少標準差來定義異常值。到目前爲止,我還沒有看到任何定量方法。它甚至存在嗎? 乾杯

    1熱度

    1回答

    是否ELKI對於其中有許多重複值的數據失敗?我有超過200萬觀測值(1D)的文件,但它只包含幾百個獨特值。其餘的都是重複的。當我在ELKI中運行此文件時,對於LOF或LoOP計算,它將返回NAN作爲任何k的異常值得分,小於頻率最高的值的出現次數。我可以想象如果重複被認爲是最近的鄰居,LRD計算必須引起這個問題。但不應該這樣做?我們可以依靠ELKI爲這種情況生產的結果嗎?

    6熱度

    2回答

    你們是否有一個想法如何處理在血壓曲線發現文物/異常的問題?我的目標是編寫一個程序,找出每個人工製品的開始和結束。這裏有不同文物的一些例子中,綠地面積是正確的血壓曲線,紅色的是人工製品,也需要檢測: 這是一個整體的血壓曲線的例子: 我的第一個想法是計算意思是從整條曲線和許多曲線的短時間間隔中找出它們的不同之處。但血壓變化很大,我認爲這不會奏效,因爲它會發現太多不存在的「人造物」。 感謝您的輸入! 編

    3熱度

    1回答

    我想繪製使用ggplot()的直方圖,但是我無法處理極端值。我希望他們能夠在一個垃圾箱內(例如,稱爲「500以上」)聯合起來。 我已經嘗試了scale_x_continuous(breaks = seq(0,500, by = 50))函數,但它只是從x軸上刪除標籤(附後)如何處理這個問題的任何想法?