statistics

1熱度

1回答

目前，我正在將我的Likert類型比例重新編碼爲數字值。但是，我在這個數據集中有很多不同比例的項目。例如：Q2.1_1：Q2.1_16是一個Likert量表，它具有與其他調查不同的關鍵字。目前，我手動輸入每個重新編碼是這樣的： final$Q2.1_1rc <- as.numeric(recode( final$Q2.1_1, "Very slightly or not at a

0熱度

1回答

如何在一個框架中繪製2個正態分佈？

這裏的問題是： 2組： A組：初始膽固醇水平通常與平均值= 244毫克/ 100毫升和標準偏差= 51毫克/ 100毫升分佈。 B組：初始膽固醇水平正態分佈，平均值= 219mg/100ml，標準偏差= 41mg/100ml。我需要回答的問題是如何在同一個框架中生成兩個正態分佈（組A +組B）？我使用命令dnorm()？這裏是我的代碼嘗試： curve(dnorm(x, mean=219,

-1熱度

2回答

查找支持向量機分類的最重要功能

我正在訓練二元分類器使用python和流行的scikit-learn模塊的SVM類。在訓練後，我使用predict方法進行分類，如sci-kit's SVC documentation所示。我想知道更多關於我的樣本特徵對經過訓練的decision_function（支持向量）所產生的分類的重要性。歡迎使用這種模型進行預測時評估特徵重要性的任何策略。謝謝！ Andre

0熱度

1回答

如何申請鉀對迴歸類型的目標變量

from keras.models import Sequential from keras.layers import Dense from keras.wrappers.scikit_learn import KerasClassifier from sklearn.model_selection import StratifiedKFold from sklearn.model_se

1熱度

1回答

關於SPSS和MS的統計峯度excel

我使用SPSS作爲我的數據集的統計分析工具。我對kurtosis概念以及SPSS和excel生成的概念幾乎沒有任何疑問。請更正下列理解和後續的問題：峯度作爲分配平整度或peakness（駝峯）圍繞平均值的度量。就分佈尾巴而言，它會告訴數據集是相對於正態分佈而言是重尾還是輕尾。正態分佈的峯度恰好爲3（過度峯度正好爲0，即kurt-3），也稱爲mesokurtic分佈。高峭度分佈的峯值大於m

0熱度

1回答

算法跟蹤的相對趨勢

我正在一個網站上文章和標籤（他們的關係是N：M）。網站的一個重要部分是通過標籤過濾文章。這些標籤具有某些重量，代表它們的相對重要性。重量隨時間變化（每天），取決於它們用於過濾物品的頻率（命中））。我應該使用什麼算法來計算權重？關鍵標準：基於歷史數據（命中），但相當短期（〜最後10-20 天）過去數據的相關性下降一段時間（從昨天的點擊率是更重要比10天前點擊）尊重標籤的「個人傾向」（即從1

0熱度

1回答

找到最大化另一個屬性的正確屬性

我有一個模型，其中有幾個屬性/屬性是固定的（約15個獨立屬性）。相同的模型有另一個屬性，這是我最感興趣的屬性。我想最大化該屬性的某個值。我想找出哪些固定的屬性值影響最有趣的屬性根據我的數據。我認爲這是一個統計問題，但我不確定。一個現實生活中的例子是具有以下所有固定屬性的抵押貸款數據庫：銀行分行，郵政編碼，就業，薪水，信用評分，關係狀態，子女數量等。然後我有一個屬性是抵押貸款是否違約。我想找

0熱度

1回答

在Django中每月保存模型字段的值

我需要保存每個月我模型字段的值。我已經看過Celery的計劃任務，但我想知道是否有其他方法可以做到這一點？我的代碼： class Sales(models.Model): ... sales_objective = models.IntegerField(blank=True, null=True) sales_objective可以從一個月改變爲其他，我想再創造一些統計

1熱度

1回答

用於計數scipy.stats.binned_statistic_2d工作，但並不意味着

我有一個類似如下（散點圖）一些衛星數據：我現在想斌這個數據到規則的網格上時間和緯度，並且每個bin都等於落入其中的所有數據點的平均值。我一直在試驗scipy.stats.binned_statistic_2d，並對我所得到的結果感到困惑。首先，如果我將「count」統計信息傳遞給scipy binning函數，它看起來可以正常工作（最小代碼和下圖）。 id1 = np.ma.masked_whe

0熱度

2回答

計算相關性並執行適合prng測試

我正在跟隨僞隨機數生成器測試的描述，並嘗試在C中實現測試。雖然有一件事我掛了，雖然。在問題的文本如下：適用的相關性測試上連續塊的位L 的漢明權重。令Xj爲jth塊的漢明權重（位的數目等於1），對於j = 1, . . . , n。測試計算連續Xj「S之間的經驗相關性，在H0，如n ⇢ infinity，p̂ * sqrt(n - 1)具有漸近標準正態分佈。這是測試中使用的。該測試僅對大n有