dimensionality-reduction

    1熱度

    1回答

    我正在尋找使用類似geohash的索引來存儲地理空間信息,可能使用Hilbert曲線。我的問題是關於如何最好地在這樣的索引上分割區域查詢。 This文章舉例說明了如何將一個區域查詢拆分爲多個查詢以避免查詢顯示較差的區域(請參閱this圖像)。如果你想用一個單一的查詢來搜索圓形區域,就像使用正常的geohash一樣使用Z曲線,你將不得不查詢整個左下象限,它只有我們關注的區域的一小部分。 在這種情況下

    1熱度

    1回答

    我想創建一個手寫數字0和1(http://yann.lecun.com/exdb/mnist/)的散點圖。我拿了4個樣本,即兩個0和兩個1。 每個手寫數字的像素值都有1維交叉778矩陣。 現在我想要做兩維數字散點圖來檢查它們是否可分離。 我試圖在R中繪製這些圖,但最終的圖只是混合點。 我應該如何進行繪圖,以便每個數字的散點圖看起來與其他不同。我在繪圖時是否正確地朝着正確的方向前進? 請指教。

    1熱度

    1回答

    我有一套變量的耦合方程H,W,P,& T(下面),我需要非維度化。在Mathematica中有沒有辦法實現這一點,因爲手動執行操作很困難。 {(a 1/(1 + R T[t]) - b) H[t] - (ap + bp) P[t] - bt T[t] == H'[t], L P[t] - g W[t] - B W[t] H[t] == W'[t], B W[t] H[t] - (up +

    4熱度

    2回答

    我具有R數據幀均可進行2場減少字符串長度: 如:AAAAABBBBB應該給我AB 和ABCAAABBBDDD應該給我ABCABD 任何人有關於如何做到這一點的想法?

    4熱度

    1回答

    我想減少一組圖像上的尺寸使用Matlab Toolbox for Dimensionality Reduction。問題是:我對減少尺寸知之甚少。所以我試着通過試驗和錯誤,將數據集傳遞給函數。到目前爲止我已經嘗試了6次,PCA正在返回一個複數的矩陣。其他人凍結了matlab。什麼圖像縮小方法適用於圖像?

    0熱度

    2回答

    我有2D數據(我有一個零均值歸一化數據)。我知道它的協方差矩陣,特徵值和特徵向量。我想決定是否將維度減少到1(我使用主成分分析,PCA)。我該如何決定?有沒有任何方法? 我正在尋找某物。就像如果你看看這個比例,如果這個比例高,那麼繼續降維也是合乎邏輯的。 PS 1: PoV(變異比例)代表它嗎? PS 2:這裏是一個答案:https://stats.stackexchange.com/questi

    1熱度

    2回答

    我想要投影的無向圖到2D平面上,使得: 的歐幾里得距離保留的分步距離(即如果A和B之間的最短路徑是除C和d之間的最短路徑短,則A和B之間的歐氏距離小於A和B之間的歐幾里德距離) 的歐幾里德距離和所述階梯距離之間的最小差被最小化。理想情況下,如果沒有唯一的最小值,則生成或描述解決方案集合。 如果這是不可能的,那麼圖上的最小約束集是什麼使它成爲可能?我對這個問題一般很感興趣,儘管目前我希望它能用於有限

    0熱度

    1回答

    我想在一個非常大的數據集上運行LSA或主成分分析,大約50,000個文檔和超過300,000個詞/項,以減少維度,所以我可以繪製文檔在2 - d。 我嘗試過使用Python和MATLAB,但是由於數據集的體積,我的系統內存不足,崩潰。有誰知道我可以如何減少負載,或者做一些近似的LSA/PCA,它可以更快,更高效地運行?我的總體目標是大幅降低300k字以上的維度。

    3熱度

    1回答

    我在大型數據集上使用了維度降低方法(此處討論:Random projection algorithm pseudo code)。 降維從1000到50後,我讓我的新的數據集,其中每個樣品的樣子: [1751 -360。 -2069。 ...,2694. -3295。 -1764。] 現在我有點困惑,因爲我不知道負面特徵值應該是什麼意思。有沒有像這樣的負面特徵可以嗎?由於減少之前,每個樣品是這樣的:

    0熱度

    1回答

    我有一個稀疏矩陣,其形狀是570000 * 3000。我嘗試nima做NMF(使用默認的nmf方法,並將max_iter設置爲65)。不過,我發現nimfa很慢。有沒有人使用過更快的庫(可以被Python/R使用)或軟件來做NMF?