我正在做一些工作,處理某些月份某些家庭審批的統計數據。我希望能夠顯示趨勢 - 也就是說,自上個月以來哪些區域出現較大幅度的相對增加或減少。在計算趨勢時,您如何解釋樣本量較小?
我的第一個幼稚的做法是隻計算兩個月份之間的百分比變化,但有問題,當數據量非常低 - 在所有的任何變化被放大:
// diff = (new - old)/old
Area | June | July | Diff |
--------------|--------|--------|--------|
South Sydney | 427 | 530 | +24% |
North Sydney | 167 | 143 | -14% |
Dubbo | 1 | 3 | +200% |
我不想只是忽略任何區域或價值作爲異常值,但我不希望達博每月增加2個,以超過南悉尼的103個增幅。有沒有更好的方程可以用來顯示更多有用的趨勢信息?
這些數據最終被繪製在Google地圖上。在第一次嘗試中,我只是將差異轉換爲「熱圖顏色」(藍色 - 減少,綠色 - 不變,紅色增加)。也許使用其他度量標準來改變每個區域的視圖可能是一個解決方案,例如,根據批准總數或類似的方式更改Alpha通道,在這種情況下,Dubbo將是鮮紅色,但非常透明,而南悉尼將更接近黃色但非常不透明。
有關顯示此數據的最佳方式的任何想法?
統計,數據分析和定量顯示不是編程*本身*,但它們是有時交給程序員的問題。關於後面的內容的經典參考資料:http://www.edwardtufte.com/tufte/books_vdqi,值得一讀的人誰*必須顯示數據。即使你只使用excel。 – dmckee 2009-09-24 13:31:32