machine-learning

    -2熱度

    1回答

    我已經使用下面的代碼進行分類。我得到55%到60%的變量準確度。 我想提高我的準確率高達85%-90%。我分爲8個不同的類別。我應該採取什麼措施來提高準確性。 import pandas as pd import numpy as np from sklearn.feature_extraction.text import CountVectorizer from sklearn.featu

    -1熱度

    1回答

    我有一個數據集,我想爲它建立一個分類模型。鑑於scikit-learn提供了混淆矩陣實現confusion_matrix(test_y, pred_r),我想用它來計算我的模型的準確性,而不是直接使用.predict。爲此,我應該只查找false positive或true positive或兩者的組合? 謝謝

    0熱度

    1回答

    我試圖弄清楚爲什麼LinearRegressionWithSGD不適用於Spark的ParamGridBuilder。從火花文檔: lr = LinearRegression(maxIter=10) paramGrid = ParamGridBuilder()\ .addGrid(lr.regParam, [0.1, 0.01]) \ .addGrid(lr.fitIntercept, [F

    0熱度

    1回答

    下面的Tensorflow代碼,我正在用來檢查一個小技巧,迴歸。 x = tf.placeholder(tf.float32, [None, input_size], name="input_data") y = tf.placeholder(tf.float32, [None], name="input_data") W1 = tf.get_variable("W1", [input_si

    0熱度

    1回答

    下面是用Keras編寫的代碼,用於迴歸正弦函數。它工作完美。 import numpy as np from keras.layers import Dense, Activation from keras.models import Sequential import matplotlib.pyplot as plt import math import time x = np.a

    1熱度

    1回答

    我想寫一個神經網絡,從頭開始識別xor函數。完整的代碼是here(在python 3中)。 我目前得到的錯誤: ValueError: No gradients provided for any variable, check your graph for ops that do not support gradients 我是新來tensorflow,我不明白這是爲什麼。任何人都可以幫我糾正

    -1熱度

    1回答

    我是機器學習的新手請原諒我,如果我愚蠢。 我有一個包含22個屬性和30000個數據點的traindata.csv文件。 我必須訓練我的模型(不是特定的算法),並預測testdata.csv文件中的20000個數據點,我必須使用我的訓練模型進行預測。 在traindata.csv中,'0'和'1'類標籤的比例爲5:1。 如果我用這整列火車數據訓練我的模型,我的模型顯示了一些偏向於預測0的比例。 我以

    2熱度

    3回答

    經常利益相關者不希望有一個很好的預測黑箱模型;他們希望瞭解有關功能的深入瞭解,以便他們能夠向其他人解釋。 當我們檢查xgboost或sklearn漸變增強模型的特徵重要性時,我們可以確定特徵的重要性......但我們不明白爲什麼這些特徵很重要,是嗎? 有沒有辦法解釋不僅是什麼功能重要,而且爲什麼它們很重要? 我被告知使用shap但即使運行一些樣板實例拋出錯誤,所以我在尋找替代品(或者甚至只是一個程

    0熱度

    1回答

    是谷歌告訴我的是: 對於keras的ImageDataGenerator功能似乎已經可以開箱即用的zca_whitening。但是如果設置了該選項,則需要在整個數據集X上調用ImageDataGenerator.fit。所以這不是一個選項。 對於sklearn,IncrementalPCA似乎與一個巨大的數據集一起工作,但我不知道如何將PCA旋轉到ZCA的發生器風格。 感謝您的幫助!

    -2熱度

    1回答

    我正在爲我們的項目之一探索Azure認知服務。我們有一個名爲DewaList.com的分類社區網站,該網站正在與垃圾郵件作鬥爭。我們有一個機器人過程自動化(RPA),根據我們作爲人類識別並標記爲垃圾郵件的列出的垃圾郵件關鍵字來識別和刪除廣告。 我們的下一個項目是使用本機學習智能生成垃圾郵件關鍵字列表。邏輯是定期觀看新廣告,或者一週或一個月內即將到來的廣告,以及是否在一天或一週內重複多次。然後將其標