statistics

    1熱度

    1回答

    目前,我正在將我的Likert類型比例重新編碼爲數字值。但是,我在這個數據集中有很多不同比例的項目。例如:Q2.1_1:Q2.1_16是一個Likert量表,它具有與其他調查不同的關鍵字。目前,我手動輸入每個重新編碼是這樣的: final$Q2.1_1rc <- as.numeric(recode( final$Q2.1_1, "Very slightly or not at a

    0熱度

    1回答

    這裏的問題是: 2組: A組:初始膽固醇水平通常與平均值= 244毫克/ 100毫升和標準偏差= 51毫克/ 100毫升分佈。 B組:初始膽固醇水平正態分佈,平均值= 219mg/100ml,標準偏差= 41mg/100ml。 我需要回答的問題是如何在同一個框架中生成兩個正態分佈(組A +組B)? 我使用命令dnorm()? 這裏是我的代碼嘗試: curve(dnorm(x, mean=219,

    -1熱度

    2回答

    我正在訓練二元分類器使用python和流行的scikit-learn模塊的SVM類。在訓練後,我使用predict方法進行分類,如sci-kit's SVC documentation所示。 我想知道更多關於我的樣本特徵對經過訓練的decision_function(支持向量)所產生的分類的重要性。歡迎使用這種模型進行預測時評估特徵重要性的任何策略。 謝謝! Andre

    0熱度

    1回答

    from keras.models import Sequential from keras.layers import Dense from keras.wrappers.scikit_learn import KerasClassifier from sklearn.model_selection import StratifiedKFold from sklearn.model_se

    1熱度

    1回答

    我使用SPSS作爲我的數據集的統計分析工具。 我對kurtosis概念以及SPSS和excel生成的概念幾乎沒有任何疑問。 請更正下列理解和後續的問題: 峯度作爲分配平整度或peakness(駝峯)圍繞平均值的度量。就分佈尾巴而言,它會告訴數據集是相對於正態分佈而言是重尾還是輕尾。 正態分佈的峯度恰好爲3(過度峯度正好爲0,即kurt-3),也稱爲mesokurtic分佈。 高峭度分佈的峯值大於m

    0熱度

    1回答

    我正在一個網站上文章和標籤(他們的關係是N:M)。網站的一個重要部分是通過標籤過濾文章。這些標籤具有某些重量,代表它們的相對重要性。重量隨時間變化(每天),取決於它們用於過濾物品的頻率(命中))。 我應該使用什麼算法來計算權重?關鍵標準: 基於歷史數據(命中),但相當短期(〜最後10-20 天) 過去數據的相關性下降一段時間(從 昨天的點擊率是更重要比10天前點擊) 尊重標籤的「個人傾向」(即從1

    0熱度

    1回答

    我有一個模型,其中有幾個屬性/屬性是固定的(約15個獨立屬性)。 相同的模型有另一個屬性,這是我最感興趣的屬性。我想最大化該屬性的某個值。 我想找出哪些固定的屬性值影響最有趣的屬性根據我的數據。我認爲這是一個統計問題,但我不確定。 一個現實生活中的例子是具有以下所有固定屬性的抵押貸款數據庫:銀行分行,郵政編碼,就業,薪水,信用評分,關係狀態,子女數量等。然後我有一個屬性是抵押貸款是否違約。 我想找

    0熱度

    1回答

    我需要保存每個月我模型字段的值。我已經看過Celery的計劃任務,但我想知道是否有其他方法可以做到這一點? 我的代碼: class Sales(models.Model): ... sales_objective = models.IntegerField(blank=True, null=True) sales_objective可以從一個月改變爲其他,我想再創造一些統計

    1熱度

    1回答

    我有一個類似如下(散點圖)一些衛星數據: 我現在想斌這個數據到規則的網格上時間和緯度,並且每個bin都等於落入其中的所有數據點的平均值。我一直在試驗scipy.stats.binned_statistic_2d,並對我所得到的結果感到困惑。首先,如果我將「count」統計信息傳遞給scipy binning函數,它看起來可以正常工作(最小代碼和下圖)。 id1 = np.ma.masked_whe

    0熱度

    2回答

    我正在跟隨僞隨機數生成器測試的描述,並嘗試在C中實現測試。雖然有一件事我掛了,雖然。在問題的文本如下: 適用的相關性測試上連續塊的位L 的漢明權重。令Xj爲jth塊的漢明權重( 位的數目等於1),對於j = 1, . . . , n。測試 計算連續Xj「S之間的經驗相關性, 在H0,如n ⇢ infinity,p̂ * sqrt(n - 1)具有漸近標準正態分佈。這是測試中使用的。該測試僅對大n有