我希望能找到P值。我來自更多的統計背景,對於Python來說是相當新穎的。有沒有任何軟件包可以讓我做到這一點?我正在關注「從頭開始的數據科學」一書,並且有些被卡在了假設檢驗和推理上。如何在Python中進行假設測試?
回答
SciPy的包有很多的統計材料整體模塊,包括假設檢驗和內部的分佈函數:scipy.stats
例如,這是你如何測試一個隨機樣本使用柯爾莫哥洛夫正態分佈-Smirnov測試:
import numpy as np
from scipy.stats import norm, pareto, kstest
n = 1000
sample_norm = norm.rvs(size=1000) # generate normally distributed random sample
sample_pareto = pareto.rvs(1.0, size=1000) # sample from some other distribution for comparison
d_norm, p_norm = kstest(sample_norm, norm.cdf) # test if the sample_norm is distributed normally (correct hypothesis)
d_pareto, p_pareto = kstest(sample_pareto, norm.cdf) # test if the sample_pareto is distributed normally (false hypothesis)
print('Statistic values: %.4f, %.4f' % (d_norm, d_pareto))
print('P-values: %.4f, %.4f' % (p_norm, p_pareto))
正如你可以看到kstest
返回統計值和p值。 norm.cdf
表示正態隨機變量的累積分佈函數。
這更多的是我一直在尋找的感謝!只是一對夫婦跟進問題。首先,在你提供的代碼中,你在哪裏描述無效和替代假設?你是否爲這些價值賦予了價值? 「sample_norm」和「sample_pareto」的值是否只是隨機值? – rmahesh
'sample_norm'和'sample_pareto'基本上只是從正態分佈和帕累託分佈中抽取的數字數組。在這個例子中,我只是通過調用具有給定2個參數的'kstest'函數來測試零假設「sample_norm是否正常分發」,而不是「替代sample_norm不正常分發」,而不是我爲'sample_pareto'做同樣的事情。所以你可以看到它不像是假設本身是在代碼的某個地方定義的,但它們被代碼隱含起來:) – Slippy
完美的非常感謝你!我一直在尋找一種方法來做到這一點,並獲得P值,這似乎是它! – rmahesh
- 1. 如何設置Loglevel進行JUnit測試
- 2. 如何使用假數據環境進行Specflow測試
- 3. 如何在Python中對策略進行回溯測試
- 4. 如何在Python模塊中對類進行樁測試?
- 5. 設置DefaultFileSystemProvider進行測試
- 6. 如何設置CurrentMessageContext.TimeSent以在NServiceBus中進行測試?
- 7. 如何在python單元測試中測試python二進制文件?
- 8. 在Python單元測試,SystemExit:假印,即使測試跑「OK」
- 9. 如何在Visual Studio中調試python(如何在庫中進行)?
- 10. 如何在設備上導致onLowMemory進行測試
- 11. 如何在進行測試時設置日誌級別?
- 12. 如何訪問Android設備中的wamp localhost進行測試?
- 13. 如何訪問android設備中的LAMP localhost進行測試?
- 14. 如何在使用pytest進行測試後顯示測試名*?
- 15. Python假設 - 爲許多測試構建策略一次?
- 16. 在Python中使用鼻子進行並行化測試
- 17. protractorjs e2e測試,假日/設定時間
- 18. 如何在Python中執行「如果從ipython運行」測試?
- 19. 如何從python啓動測試pubsub仿真器進行自動測試
- 20. 使用Python進行基準測試
- 21. Python,導入模塊進行測試
- 22. 調用一個類進行測試 - Python
- 23. 使用Python進行易碎測試
- 24. Python注入模擬值進行測試
- 25. 如何爲您的Facebook應用創建假用戶進行測試?
- 26. 如何使用activejdbc對假數據進行單元測試/模擬?
- 27. 如何測試gevent套接字導致超時的假設?
- 28. 改變假庫進行單元測試使用依賴注入
- 29. Specflow - 如何在BeforeFeature中使用FeatureContext進行並行測試
- 30. 如何在使用espresso進行測試時在imageview中設置圖像?
也許[SciPy包](http://docs.scipy.org/doc/)可以做到,[chi-square]上有一個頁面(http://docs.scipy.org/doc/scipy /reference/generated/scipy.stats.chisquare.html#scipy-stats-chisquare) – davedwards
[如何計算兩個浮點列表的p值?](https://stackoverflow.com/questions/29561360/how-to -calculate-p-value-for-two-lists-of-floats),[來自t-statistic的Python p值](https://stackoverflow.com/questions/17559897/python-p-value-from-t -statistic)也可能有幫助/相關 – davedwards