statistics

    0熱度

    1回答

    我創建了以下用戶定義的函數,它使用Acceptance-Rejection方法生成隨機變量。然而,每當它被調用時,我的程序就會繼續,最終崩潰或者我不得不強制退出。我經歷了幾次。任何想法可能會導致這種情況? 我知道,這可能不是寫這個的最好方法(昨天是我第一次使用R),所以任何額外的提示都是獎勵! acceptReject <- function(){ Z <- 0 Y <- c(

    -1熱度

    1回答

    我有一個.dta格式的數據集,包含棒球運動員的身高和體重。我想計算每個體重值的平均身高。 從我所能找到的,我可以使用dplyr和「group_by」,但我的R腳本無法識別該命令,儘管已安裝並調用該程序包。 謝謝!

    -1熱度

    1回答

    我想繪製出版物的正常分佈的3個數字,但我只得到一個很好的數字(英國)。其餘兩個(美國和日本)的曲線不完整。 我將曲線擬合成直方圖,因此您可以說每個圖需要保存兩個圖,即直方圖和高斯分佈。 請看看我的代碼的一部分,讓我知道如何解決這個問題。 我很樂意提供建議,謝謝。 我Matplotlib數字:fitted distribution,fitted distribution,fitted distrib

    0熱度

    1回答

    那麼我正在爲java編寫一個測試模擬subjet的pseudoRandom數字,我需要計算Chi平方的倒數,所以我有alpha和度數as you can see here。 的書我讀,利用Excel函數Excel ChiSQ.INV這樣的: CHISQ.INV(probability,deg_freedom) CHISQ.INV(0.025,39) = 58.12005973 < - 這個值是什麼

    1熱度

    1回答

    問題 我有兩個數組,我們會打電話給他們AR1和AR2(大小(192289)),代表LAT-LON標準偏差的地圖,我有一個同樣大小的數組區別。我想繪製這個差異,並且在兩個陣列之間的差異在統計上顯着的95%置信水平(α= 0.05)上的點狀模式上。 我是用我的coding-這個例子的代碼 How do I do a F-test in python 我用喬爾·科內特的解決方案,替代ar1並在X ar2

    -1熱度

    1回答

    所以我使用高爾距離做出一些集羣,但我一直在試圖尋找一種具體的方法來計算變量的權重,我還沒有發現有用的東西。 在一些示例中,它們使用1和4之間的值,並且在其他示例中它們使用0至150或更多的值,所以是否存在限制?或者一個實際的方法來計算它們? 謝謝。

    -1熱度

    1回答

    我和我的同班同學正在完成這項任務,涉及在Fama-French 3因子模型上運行迴歸。我使用python Statsmodels模塊,他們使用Stata,我們共享相同的一組數據。對於普通最小二乘迴歸,我們得到了相同的答案。但由於某種原因,穩健的迴歸結果並不一致。 下面是塔塔結果: 這裏是Statsmodels結果: 只是想知道這可能是這個問題的原因是什麼?任何方式來解決它?我還在Statsmode

    1熱度

    1回答

    我困在一個困難的sql聚合問題上。 考慮下面的表/視圖: Column1 Column2 1 2564 2 6550 1 3578 2 6548 2 4789 1 9876 我想設計一個查詢,以做到以下幾點: 對於每一個不同的列1值,樣品2分的記錄。採樣策略可能是某種引導/重新採樣,因爲可能沒有太多的數據點。 因此該表將成爲: Column1 Column2 1

    1熱度

    1回答

    我想創建一個方法,將使用C#計算PRESS統計信息,但我顯然沒有做正確的事情,因爲即使我使用垃圾數據(它的rsquared值爲0.2 )我仍然得到新聞統計的負面總數。有沒有人看到我在做什麼錯了? 參考如何計算按統計可以https://en.wikipedia.org/wiki/PRESS_statistic public double CalculatePredictedRSquared(List

    -1熱度

    1回答

    X和Y是不相關的(0.3);然而,當我把X在隨機森林分類預測Y,旁邊兩(A,B)其他(相關)變量,X和兩個其他變量(A,B)爲Y.注意的顯著預測的是,其他兩個(A, B)變量也無法與Y. 相關怎樣才能根據統計和機器學習的想法解釋這一點。 代表一個或多個可變(A或B或Y)相對於另一變量(X),其中變量不具有很強的相關性。