pca

    -1熱度

    1回答

    我有一個數據集: https://docs.google.com/spreadsheets/d/1ZgyRQ2uTw-MjjkJgWCIiZ1vpnxKmF3o15a5awndttgo/edit?usp=sharing ,我試圖運用主成分分析和基於在這個崗位提供圖形來實現圖形: https://stats.stackexchange.com/questions/61215/how-to-inter

    0熱度

    1回答

    我有一個顯示兩個真正大集羣的PCA,我不知道如何確定每個集羣中的哪些樣本。 如果有幫助,進出口使用prcomp生成PCA: pca1 <- autoplot(prcomp(df), label = TRUE, label.size = 2) 我的方法是嘗試集羣中使用K均值的PCA輸出,2組獲得集羣: pca <- prcomp(df, scale.=TRUE) clust <- kmeans

    0熱度

    1回答

    我有一個'數據集合' df,數據如下。我正在嘗試使用sklearn對數據集合進行主成分分析(PCA)。但我越來越Typeerror from sklearn.decomposition import PCA df # dataframe collection pca = PCA(n_components=5) pca.fit(X) 如何將數據幀集合轉換爲數組矩陣與序列。我想,如果我轉換成

    0熱度

    1回答

    是谷歌告訴我的是: 對於keras的ImageDataGenerator功能似乎已經可以開箱即用的zca_whitening。但是如果設置了該選項,則需要在整個數據集X上調用ImageDataGenerator.fit。所以這不是一個選項。 對於sklearn,IncrementalPCA似乎與一個巨大的數據集一起工作,但我不知道如何將PCA旋轉到ZCA的發生器風格。 感謝您的幫助!

    0熱度

    1回答

    我嘗試使用Python sklearn對breast_canser數據集進行主成分分析。 並且不明白爲什麼特徵向量的點積(3個分量)不是零? frst = pca.components_[0,:] scnd = pca.components_[1,:] thrd = pca.components_[2,:] orth1 = np.dot(frst,scnd) orth2 = np.dot(

    0熱度

    1回答

    我有維基百科文章的語料庫。我找出了10,000個最常用的單詞,找到了它們的Word2Vec向量,並且在這些向量上使用了球形k-均值,根據意義上的相似性將這些單詞聚類爲500個組。 我挑出了3個單詞集並將單詞轉換回單詞向量。每個單詞向量都是一個300個數值的數組,所以我將它們全部應用PCA(從sklearn)將它們轉換爲2D。然後我繪製: 每個點代表一個字,每種顏色代表1簇。問題是,這些羣集不應該重

    4熱度

    1回答

    我有一個300萬×900萬的稀疏矩陣,有幾十億個非零條目。 R和Python不允許超過MAXINT非零條目的稀疏矩陣,因此我發現自己使用了Julia。 雖然用標準偏差縮放這些數據是微不足道的,但貶低當然是一種天真的方式,因爲這會創建一個密集的200+太字節矩陣。 做SVD相關的代碼朱莉婭可以在https://github.com/JuliaLang/julia/blob/343b7f56fcc84

    0熱度

    1回答

    我使用PCA將文檔減少到2點,以便可以將它們可視化。 我的方法看起來像這樣。 pipeline = Pipeline([('tfidf', TfidfVectorizer())]) X = pipeline.fit_transform(sent_list).todense() pca = PCA(n_components = 2).fit(X) data2D

    0熱度

    1回答

    我正在對5大人格特徵進行迴歸,以及出生順序如何影響這些特質。首先,我試圖根據捕獲這些特徵的調查構建5個變量。我曾想過爲類別(特質)中的每個問題創建假人,然後取平均值,但其中一些問題高度相關,因此重量將錯誤。 我做了一個主成分分析,它給了我一個特徵值超過一個的四個分量。問題是,他們都沒有超過40 pct。方差。 有什麼方法可以將四個合併爲一個變量?它是因變量,所以只能有一個。 否則你是否有另外一個關

    0熱度

    1回答

    的標準偏差是否有可能是,一個或一些特徵從所獲得的主成分的標準偏差比任何的特徵更多。 例如, 如果我的特點的標準偏差爲FEAT1,FEAT2,feat3,feat4,feat5,feat6是0.019,0.027,0.026,0.025,0.026,0.030,0.019。我掌握的標準差主成分爲: PC1,PC2,PC3,PC4,PC5,PC6作爲0.05,0.020,0.018,0.016,0.0