pca

    1熱度

    2回答

    我使用的是python package爲多個分類變量多元對應分析的王子模塊。我學習的一組地質數據,這裏是一個示例預覽: Quartz Oxides Hematite Limonite Geothite Clay Soil_Type 1 2 3 4 1 0 A 2 1 4 3 0 1 B 3 4 2 1 4 0

    0熱度

    1回答

    我遵循this教程來創建和可視化PCA。 Im特別感興趣的部分是爲現有模型添加新的數據點。 正如本教程所示,我們將使用predict(ir.pca,newdata = tail(log.ir,2))來預測新的PC。但是,我如何將這些新觀察添加到現有的情節?它看起來不像預測函數返回與ggplot函數中使用的ir.pca相同的對象。 我發現了類似的問題here和here但他們計算新的PCA評分並將它們

    2熱度

    1回答

    我試着關於測試單元測試的this answer,但是當我嘗試列舉要測試的包中的文件時,我總是得到0。 下面的代碼有什麼問題? [TestFixture] public class BundleConfigTests { private TestVirtualPathProvider _vpp; private BundleCollection _bundles;

    0熱度

    1回答

    如果我想將序列(特徵)A,B和C投影到帶有張量LSTM的目標序列,我怎麼能知道每個特徵對目標影響的重要性?主成分分析有幫助嗎?如果pca可以幫助,該怎麼辦?數據的 的結構(列)設定如下面: A sequence B sequence C sequence Target sequence

    2熱度

    1回答

    所以我一直在通過現有的問題來解決這個問題,但無濟於事。 我有一個由個人(117)組成的數據集,每個個人都有來自不同變量(12)的觀察結果,並且由具有8個級別的因子變量分組。 我想根據Anderson和Willis的方法對這些數據的主要座標進行規範分析。我開始使用BiodiversityR :: CAPdiscrim。讓我們先從一些示例數據: individual <- c(1:30) group

    1熱度

    1回答

    我在Python中使用PCA來減少我擁有的數據的維數。目前的數據有768行和10列。 我使用下面的代碼來實現PCA: import numpy as np from sklearn import decomposition demo_df = pd.read_csv('data.csv') pca = decomposition.PCA(n_components=4) comps =

    1熱度

    1回答

    我想知道是否需要在R中對我的樣本進行PCA轉置數據。我正在使用內置函數prcomp()。我的數據集是RNA seq表達數據,列是樣本,行是基因表達。它看起來有效,但是對行/列應該有什麼共識?謝謝!

    2熱度

    1回答

    我想對特定數據集執行主成分分析,然後將主成分饋送到LogisticRegression分類器。 具體而言,我想申請PCA並使用函數computePrincipalComponentsAndExplainedVariance來保持總方差的90%。 下面的代碼讀取數據集: // Load the data val text = sparkSession.sparkContext.textFile("

    2熱度

    1回答

    我有一個具有特定列和行組的數據矩陣。 Promoters Exons Introns Intergenic UTR5 UTR3 EncodeDnase TFBS CpGislands CpGshores CpGshelf Enhancer Valley umrs canyons genebodies enhancer34 groups 44905 34778 49182 32420 21190

    2熱度

    2回答

    我有115 * 8000的數據,其中115是功能的數量。當我使用像這樣的matlab pca功能 [coeff,score,latent,tsquared,explained,mu] = pca(data); 對我的數據。我有一些價值。我在here上閱讀了如何減少我的數據,但有一件事讓我感到困惑。 explained數據顯示功能在計算上有多重,但功能是否在此過程中重新組織,或者功能與我給它的功