statistics

0熱度

1回答

我創建了以下用戶定義的函數，它使用Acceptance-Rejection方法生成隨機變量。然而，每當它被調用時，我的程序就會繼續，最終崩潰或者我不得不強制退出。我經歷了幾次。任何想法可能會導致這種情況？我知道，這可能不是寫這個的最好方法（昨天是我第一次使用R），所以任何額外的提示都是獎勵！ acceptReject <- function(){ Z <- 0 Y <- c(

-1熱度

1回答

個人X值的平均Y值

我有一個.dta格式的數據集，包含棒球運動員的身高和體重。我想計算每個體重值的平均身高。從我所能找到的，我可以使用dplyr和「group_by」，但我的R腳本無法識別該命令，儘管已安裝並調用該程序包。謝謝！

-1熱度

1回答

當創建幾個地塊時，擬合分佈被削減

我想繪製出版物的正常分佈的3個數字，但我只得到一個很好的數字（英國）。其餘兩個（美國和日本）的曲線不完整。我將曲線擬合成直方圖，因此您可以說每個圖需要保存兩個圖，即直方圖和高斯分佈。請看看我的代碼的一部分，讓我知道如何解決這個問題。我很樂意提供建議，謝謝。我Matplotlib數字：fitted distribution，fitted distribution，fitted distrib

0熱度

1回答

計算Inv Chi Squared Java

那麼我正在爲java編寫一個測試模擬subjet的pseudoRandom數字，我需要計算Chi平方的倒數，所以我有alpha和度數as you can see here。的書我讀，利用Excel函數Excel ChiSQ.INV這樣的： CHISQ.INV(probability,deg_freedom) CHISQ.INV(0.025,39) = 58.12005973 < - 這個值是什麼

1熱度

1回答

Python-如何做2D數組的f測試？

問題我有兩個數組，我們會打電話給他們AR1和AR2（大小（192289）），代表LAT-LON標準偏差的地圖，我有一個同樣大小的數組區別。我想繪製這個差異，並且在兩個陣列之間的差異在統計上顯着的95％置信水平（α= 0.05）上的點狀模式上。我是用我的coding-這個例子的代碼 How do I do a F-test in python 我用喬爾·科內特的解決方案，替代ar1並在X ar2

-1熱度

1回答

如何計算高爾距離權重

所以我使用高爾距離做出一些集羣，但我一直在試圖尋找一種具體的方法來計算變量的權重，我還沒有發現有用的東西。在一些示例中，它們使用1和4之間的值，並且在其他示例中它們使用0至150或更多的值，所以是否存在限制？或者一個實際的方法來計算它們？謝謝。

-1熱度

1回答

Python和Stata中強大的線性迴歸結果不同意

我和我的同班同學正在完成這項任務，涉及在Fama-French 3因子模型上運行迴歸。我使用python Statsmodels模塊，他們使用Stata，我們共享相同的一組數據。對於普通最小二乘迴歸，我們得到了相同的答案。但由於某種原因，穩健的迴歸結果並不一致。下面是塔塔結果：這裏是Statsmodels結果：只是想知道這可能是這個問題的原因是什麼？任何方式來解決它？我還在Statsmode

1熱度

1回答

sql - 針對列樣本中的每個唯一值2來自另一列的不同值

我困在一個困難的sql聚合問題上。考慮下面的表/視圖： Column1 Column2 1 2564 2 6550 1 3578 2 6548 2 4789 1 9876 我想設計一個查詢，以做到以下幾點：對於每一個不同的列1值，樣品2分的記錄。採樣策略可能是某種引導/重新採樣，因爲可能沒有太多的數據點。因此該表將成爲： Column1 Column2 1

1熱度

1回答

計算PRESS統計/預測Rsquared C＃

我想創建一個方法，將使用C＃計算PRESS統計信息，但我顯然沒有做正確的事情，因爲即使我使用垃圾數據（它的rsquared值爲0.2 ）我仍然得到新聞統計的負面總數。有沒有人看到我在做什麼錯了？參考如何計算按統計可以https://en.wikipedia.org/wiki/PRESS_statistic public double CalculatePredictedRSquared(List

-1熱度

1回答

X和Y是不相關的（0.3）;然而，當我把X在隨機森林分類預測Y，旁邊兩（A，B）其他（相關）變量，X和兩個其他變量（A，B）爲Y.注意的顯著預測的是，其他兩個（A， B）變量也無法與Y. 相關怎樣才能根據統計和機器學習的想法解釋這一點。代表一個或多個可變（A或B或Y）相對於另一變量（X），其中變量不具有很強的相關性。