statistics

    0熱度

    1回答

    我想用我擁有的數據集做一個天真的預測,我正在努力做一點。 values = DataFrame(dataset.iloc[:, -1]) Y_naive = pd.concat([values.shift(24), values], axis=1) Y_naive.columns = ['t', 't+1'] x = Y_naive.values 我基本上有什麼是

    0熱度

    2回答

    我有兩個數據框案例和對照,我執行了兩個樣本t檢驗,如下所示。但我正在從特徵集中進行特徵提取(1299特徵/列),所以我想計算每個特徵的p值。基於爲每個要素生成的p值,我想拒絕或接受零假設。 任何人都可以向我解釋如何解釋下面的輸出,以及如何計算每個功能的p值? t.test(New_data_zero,New_data_one) Welch Two Sample t-test data

    0熱度

    1回答

    給定具有非均勻分佈(高度尖峯)的數據集,我想重新採樣以創建具有大致均勻分佈的新數據集。我的方法: 將數據分成分檔。 目標箱水平=所有箱中每個箱的最小樣本數。 隨機刪除樣本,直到每個bin計數=目標bin級別。 有沒有更好的技術?

    0熱度

    1回答

    我正在爲我的工作編寫ffmpeg鏈進程腳本。目標是正常化/壓縮很多音頻文件(mp3)。 它在Python完成,關鍵的部分是線: ffmpeg -y -i "Input.mp3" -codec:a libmp3lame -b:a 96k -af acompressor=threshold=-15dB:ratio=5:attack=0.01:release=1000:knee=2,dynaudnorm

    0熱度

    2回答

    我對Iris數據集Iris data-set執行了t檢驗。我計算了萼片和花瓣的長度和寬度之間的比例,並創建了一個名爲IrisLeafRatio.csv的新數據集。 import scipy.stats as stats # First, we'll import pandas, a data processing and CSV file I/O library import pandas

    2熱度

    1回答

    看起來在最新版本的熊貓中,所有的ols功能都已被棄用(pandas.stats已被刪除,並且沒有PanelOLS或ols函數) 。我正在嘗試使用statsmodels運行面板迴歸,但找不到有效的方式來執行此操作?以前我可以用這樣的代碼: panel_ols = ols(y=DataFrame, x=DataFrame, ...,) 這估計使用一個單一的面板迴歸中的所有數據係數。 現在有辦法做到

    0熱度

    1回答

    我有一個矩陣操作Y=B*A*X;;其中A=exp(1i.*pi*rand(50,50)); B=transpose(A); X爲,其輸入是隨機 X=exp(1i.*pi*rand(50,50)); 所以我ÿ計算。 現在我發現另一個Y說Y1爲另一個X1=exp(1i.*pi*rand(50,50)); Y和Y1是複雜的輸出。我如何度量這些文件之間的相似度? 有人可以請幫忙。我試過 rsme=sq

    1熱度

    1回答

    當計算G *所需的樣本量時,重複測量,內部相互作用ANOVA,輸出中「總樣本量」是指什麼?每組需要參與者的人數還是所有組的總數?

    0熱度

    1回答

    假設我有一個正態分佈變量向量x,平均值爲m和標準分配s。 是否有一個有效的(顯式)函數f(x, m, s)將x轉換爲均勻分佈的向量? 隨着明確我的意思是該功能只利用標準的數學運算一樣+,-,*,/,pow(),exp()但沒有for循環。所以,其實我在尋找一個變換函數逼近normal distribution的累積分佈函數。

    1熱度

    3回答

    我有一個包含兩個類別字段和一個計數值的表。我需要根據其他類別的計數來計算一個類別的行之間的相關性。 因此,例如: Category_A|Category_B|Count Alan |Turkey |7 Alan |Ham |1 Alan |Spam |0 ... Bob |Turkey |2 Bob |Ham |9 Bob |Spam |12 ... 我需要