scikit-learn

    0熱度

    1回答

    最近我正在研究Dimension Reduction方法,我發現python包「sklearn.feature_selection」看起來很有用,但問題在於SelectPercentile.fit方法沒有解釋它如何計算得分函數。 link 有誰知道它是如何工作的?先謝謝了。例如,如果我爲「SelectPercentile」選擇「SelectFdr」,並且SelectFdr方法的標準取決於每個要素的

    1熱度

    1回答

    import numpy as np temp_data_x = np.random.randn(200,3) temp_data_y = temp_data_x[:,0] + temp_data_x[:,1] + temp_data_x[:,2] + np.random.randn(200,1).reshape(200,) from sklearn.neural_network impor

    0熱度

    1回答

    我想重現一個教程看到 here。 一切工作完美,直到我用我的訓練集添加.fit方法。 這裏是我的代碼示例: # TRAINING PART train_dir = 'pdf/learning_set' dictionary = make_dic(train_dir) train_labels = np.zeros(20) train_labels[17:20] = 1 train_m

    0熱度

    1回答

    包版本: numpy的:1.13.3 sklearn:0.19.0 SciPy的:0.19.1 我有一個緻密的基質svd_matrix svd_matrix.shape >>> (30000,50) 我要到t使用「餘弦」作爲度量標準 tsne = sklearn.manifold.TSNE(n_components=2, random_state=0, metric='cosine') m

    1熱度

    1回答

    我想將投票分類器應用於多個管道分類器並調整網格搜索中的參數。最小的例子給我一個錯誤。我必須以不同的方式做到這一點嗎? from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble import AdaBoostClassifier from sklearn.ensemble import VotingClas

    1熱度

    1回答

    我正在嘗試通過創建一個字符文本的熱編碼來準備數據文件,我可以稍後使用這些編碼來訓練我的模型進行分類。我有一個由字符行組成的訓練數據文件,我最初正在做它們的整數編碼,然後是一個熱門編碼。 例如這是數據文件的外觀: afafalkjfalkfalfjalfjalfjafajfaflajflajflajfajflajflajfjaljfafj fgtfafadargggagagagagagavcacac

    1熱度

    1回答

    語境下的測試誤差正確方法: 據穆勒的「入門機器學習與蟒蛇」推薦工作流,人會做一個單一的分數評價對一個測試組是在過程的開始擱置: 這樣做的好處來獲得其超參數設置,在可能使用多個(不同的)模型嵌套交叉驗證一個給定的模型。 單個測試集的評估給出了具有高方差的估計器。 問題: 有沒有什麼辦法讓比這個單一的分數更好的泛化誤差估計? (即使這種方法需要更多的訓練迭代)

    1熱度

    1回答

    我使用GridSearchCV與管道管線內部方差解釋如下: grid = GridSearchCV( Pipeline([ ('reduce_dim', PCA()), ('classify', RandomForestClassifier(n_jobs = -1)) ]), param_grid=[ { 'reduc

    0熱度

    2回答

    我想查看LinearRegression的源代碼,但linear_model文件夾中沒有像LinearRegression.py這樣的文件。 當我寫一個程序: from sklearn import linear_model regr = linear_model.LinearRegression() 它的工作原理,所以我假設線性迴歸包括在我的圖書館。 我使用anaconda3與Python

    1熱度

    1回答

    user1190882幫助固定TRANSPOSE(移調)的問題,我會打開一個新的線程爲SKlearn問題 columns_train = np.array([df['A'], df['B'], df['C'], df['D'], df['E'], df['F'], df['G']]) X = columns_train Y = columns_target X = np.transpose