mahalanobis

    1熱度

    1回答

    我正在從Michael Faraway的線性模型(其中R(第11章,第160頁))開始PCA部分的工作。 PCA分析對異常值敏感,Mahalanobis距離有助於我們識別它們。 作者通過繪製馬哈拉諾比斯距離和卡方分佈的分位數來檢查異常值。 if require(faraway)==F install.packages("faraway"); require(faraway) data(fat,

    1熱度

    1回答

    我有一個12x202矩陣(12個實例有202個特徵)。我想計算每個12個實例之間的馬氏距離,但似乎列數不能比實例數(行數)大很多。 (我不得不使用沒有問題的計算12x11矩陣但超過11個特徵的距離會導致錯誤的MATLAB要麼linkage(X,'ward','mahalanobis');或mahal(X,X);或pdist2(X,X,'mahalanobis');)

    1熱度

    1回答

    我想要計算每個觀測值之間的數據集dat之間的Mahalanobis距離,其中每一行是一個觀測值,每一列都是一個變量。這樣的距離定義爲: 我寫的,做它的功能,但我覺得它是緩慢的。有沒有更好的方法來計算R? 生成一些數據測試功能: generateData <- function(nObs, nVar){ library(MASS) mvrnorm(n=nObs, rep(0,nV

    0熱度

    1回答

    我正在研究模式識別和統計。我喜歡在R中使用直接函數而不是明確編寫代碼。 我的問題是, 在三級2維問題,我對每一類的特徵向量通常與協方差矩陣分佈 s <- matrix(c(1.2,0.4,0.4,8),nrow=2) 和平均爲每個類向量 m1 <- t(c(0.1, 0.1));m2 <- t(c(2.1, 1.9));m3 <- t(c(-1.5, 2.0)) 假設類同樣可能, 我想分類特徵向量

    2熱度

    1回答

    我在R中計算了Iris數據集上的mahalanobis距離並返回了一個數值向量,其中包含150個值,數據集中的每個觀察值都有一個值。 x=read.csv("Iris Data.csv") mean<-colMeans(x) Sx<-cov(x) D2<-mahalanobis(x,mean,Sx) 我嘗試使用「scipy.spatial.distance.mahalanobis(U,V

    0熱度

    1回答

    我有一個數據集,每個樣本和25個變量有5個重複。 我想使用這些參數在所有樣本之間製作一個馬哈拉諾比斯距離矩陣。我使用了「mahal」函數,但是這給出了每個重複的所有距離的向量。如何製作樣本間距(38 * 38)而不是矢量(1 * 190)之間的距離矩陣?

    0熱度

    1回答

    我有一個8 GB的RAM和英特爾酷睿I5處理器的聯想IdeaPad筆記本電腦。我每100個維度有60k個數據點。我想做KNN,爲此我運行LMNN算法來查找Mahalanobis度量標準。 問題是在我的Ubuntu上運行一個空白屏幕2小時後出現。我沒有得到什麼問題!我的記憶變滿了還是別的什麼? 那麼有什麼方法可以優化我的代碼? 我的數據集:data 我LMNN實現: import numpy as