pca

-1熱度

1回答

我有一個數據集： https://docs.google.com/spreadsheets/d/1ZgyRQ2uTw-MjjkJgWCIiZ1vpnxKmF3o15a5awndttgo/edit?usp=sharing ，我試圖運用主成分分析和基於在這個崗位提供圖形來實現圖形： https://stats.stackexchange.com/questions/61215/how-to-inter

0熱度

1回答

從PCA獲取集羣r

我有一個顯示兩個真正大集羣的PCA，我不知道如何確定每個集羣中的哪些樣本。如果有幫助，進出口使用prcomp生成PCA： pca1 <- autoplot(prcomp(df), label = TRUE, label.size = 2) 我的方法是嘗試集羣中使用K均值的PCA輸出，2組獲得集羣： pca <- prcomp(df, scale.=TRUE) clust <- kmeans

0熱度

1回答

需要使用numpy或sklearn對python中的數據集合進行主成分分析

我有一個'數據集合' df，數據如下。我正在嘗試使用sklearn對數據集合進行主成分分析（PCA）。但我越來越Typeerror from sklearn.decomposition import PCA df # dataframe collection pca = PCA(n_components=5) pca.fit(X) 如何將數據幀集合轉換爲數組矩陣與序列。我想，如果我轉換成

0熱度

1回答

如何將ZCA應用於內存有限的大型圖像數據集？

是谷歌告訴我的是：對於keras的ImageDataGenerator功能似乎已經可以開箱即用的zca_whitening。但是如果設置了該選項，則需要在整個數據集X上調用ImageDataGenerator.fit。所以這不是一個選項。對於sklearn，IncrementalPCA似乎與一個巨大的數據集一起工作，但我不知道如何將PCA旋轉到ZCA的發生器風格。感謝您的幫助！

0熱度

1回答

主成分分析 - 爲什麼特徵向量的點積不是零？

我嘗試使用Python sklearn對breast_canser數據集進行主成分分析。並且不明白爲什麼特徵向量的點積（3個分量）不是零？ frst = pca.components_[0,:] scnd = pca.components_[1,:] thrd = pca.components_[2,:] orth1 = np.dot(frst,scnd) orth2 = np.dot(

0熱度

1回答

PCA和K-means for word clustering

我有維基百科文章的語料庫。我找出了10,000個最常用的單詞，找到了它們的Word2Vec向量，並且在這些向量上使用了球形k-均值，根據意義上的相似性將這些單詞聚類爲500個組。我挑出了3個單詞集並將單詞轉換回單詞向量。每個單詞向量都是一個300個數值的數組，所以我將它們全部應用PCA（從sklearn）將它們轉換爲2D。然後我繪製：每個點代表一個字，每種顏色代表1簇。問題是，這些羣集不應該重

4熱度

1回答

內存有效集中稀疏SVD/PCA（在Julia中）？

我有一個300萬×900萬的稀疏矩陣，有幾十億個非零條目。 R和Python不允許超過MAXINT非零條目的稀疏矩陣，因此我發現自己使用了Julia。雖然用標準偏差縮放這些數據是微不足道的，但貶低當然是一種天真的方式，因爲這會創建一個密集的200+太字節矩陣。做SVD相關的代碼朱莉婭可以在https://github.com/JuliaLang/julia/blob/343b7f56fcc84

0熱度

1回答

向PCA模型添加一個點

我使用PCA將文檔減少到2點，以便可以將它們可視化。我的方法看起來像這樣。 pipeline = Pipeline([('tfidf', TfidfVectorizer())]) X = pipeline.fit_transform(sent_list).todense() pca = PCA(n_components = 2).fit(X) data2D

0熱度

1回答

你可以合併兩個主要組件嗎？

我正在對5大人格特徵進行迴歸，以及出生順序如何影響這些特質。首先，我試圖根據捕獲這些特徵的調查構建5個變量。我曾想過爲類別（特質）中的每個問題創建假人，然後取平均值，但其中一些問題高度相關，因此重量將錯誤。我做了一個主成分分析，它給了我一個特徵值超過一個的四個分量。問題是，他們都沒有超過40 pct。方差。有什麼方法可以將四個合併爲一個變量？它是因變量，所以只能有一個。否則你是否有另外一個關

0熱度

1回答

主成分

的標準偏差是否有可能是，一個或一些特徵從所獲得的主成分的標準偏差比任何的特徵更多。例如，如果我的特點的標準偏差爲FEAT1，FEAT2，feat3，feat4，feat5，feat6是0.019，0.027，0.026，0.025,0.026,0.030,0.019。我掌握的標準差主成分爲： PC1，PC2，PC3，PC4，PC5，PC6作爲0.05，0.020,0.018，0.016,0.0