statistics

0熱度

1回答

我想用我擁有的數據集做一個天真的預測，我正在努力做一點。 values = DataFrame(dataset.iloc[:, -1]) Y_naive = pd.concat([values.shift(24), values], axis=1) Y_naive.columns = ['t', 't+1'] x = Y_naive.values 我基本上有什麼是

0熱度

2回答

如何使用兩個樣本t檢驗計算R中每個特徵的p值

我有兩個數據框案例和對照，我執行了兩個樣本t檢驗，如下所示。但我正在從特徵集中進行特徵提取（1299特徵/列），所以我想計算每個特徵的p值。基於爲每個要素生成的p值，我想拒絕或接受零假設。任何人都可以向我解釋如何解釋下面的輸出，以及如何計算每個功能的p值？ t.test(New_data_zero,New_data_one) Welch Two Sample t-test data

0熱度

1回答

從非均勻數據創建均勻分佈的示例

給定具有非均勻分佈（高度尖峯）的數據集，我想重新採樣以創建具有大致均勻分佈的新數據集。我的方法：將數據分成分檔。目標箱水平=所有箱中每個箱的最小樣本數。隨機刪除樣本，直到每個bin計數=目標bin級別。有沒有更好的技術？

0熱度

1回答

如何計算ffmpeg astats波峯因數

我正在爲我的工作編寫ffmpeg鏈進程腳本。目標是正常化/壓縮很多音頻文件（mp3）。它在Python完成，關鍵的部分是線： ffmpeg -y -i "Input.mp3" -codec:a libmp3lame -b:a 96k -af acompressor=threshold=-15dB:ratio=5:attack=0.01:release=1000:knee=2,dynaudnorm

0熱度

2回答

stats.ttest_ind返回NoneType對象，但我可以打印它

我對Iris數據集Iris data-set執行了t檢驗。我計算了萼片和花瓣的長度和寬度之間的比例，並創建了一個名爲IrisLeafRatio.csv的新數據集。 import scipy.stats as stats # First, we'll import pandas, a data processing and CSV file I/O library import pandas

2熱度

1回答

statsmodels中的面板OLS（因爲它在Pandas中不推薦使用）

看起來在最新版本的熊貓中，所有的ols功能都已被棄用（pandas.stats已被刪除，並且沒有PanelOLS或ols函數）。我正在嘗試使用statsmodels運行面板迴歸，但找不到有效的方式來執行此操作？以前我可以用這樣的代碼： panel_ols = ols(y=DataFrame, x=DataFrame, ...,) 這估計使用一個單一的面板迴歸中的所有數據係數。現在有辦法做到

0熱度

1回答

如何測量matlab中兩個二維複雜場之間的相似度？

我有一個矩陣操作Y=B*A*X;;其中A=exp(1i.*pi*rand(50,50)); B=transpose(A); X爲，其輸入是隨機 X=exp(1i.*pi*rand(50,50)); 所以我ÿ計算。現在我發現另一個Y說Y1爲另一個X1=exp(1i.*pi*rand(50,50)); Y和Y1是複雜的輸出。我如何度量這些文件之間的相似度？有人可以請幫忙。我試過 rsme=sq

1熱度

1回答

G *中的功率總樣本量 - 在ANOVA內

當計算G *所需的樣本量時，重複測量，內部相互作用ANOVA，輸出中「總樣本量」是指什麼？每組需要參與者的人數還是所有組的總數？

0熱度

1回答

變換：正態分佈變量 - >均勻分佈變量

假設我有一個正態分佈變量向量x，平均值爲m和標準分配s。是否有一個有效的（顯式）函數f(x, m, s)將x轉換爲均勻分佈的向量？隨着明確我的意思是該功能只利用標準的數學運算一樣+，-，*，/，pow()，exp()但沒有for循環。所以，其實我在尋找一個變換函數逼近normal distribution的累積分佈函數。

1熱度

3回答

pandas：計算表間行間的相關度