我仍在研究紐約地鐵數據。我以這樣一種方式清理和爭奪數據,即我現在每個工作站每小時(從0到23)的「平均條目數」和「平均出口數」分隔爲週末和工作日(類別變量有兩個可能的值:週末/週日)。有沒有一種很好的方式來可視化大量子圖(> 500)?
我想要做的是創建一個情節,每個工作站都是一排,每行有兩列(第一個是平日,第二個是週末)。我想繪製每小時的「平均參賽作品」和「平均出場次數」,以獲得有關電臺的一些信息。這裏有兩件有趣的事情。首先是純粹的數字來表明一個電臺有多忙;其次是給定小時的入場和出場比例,以表明該臺站是否爲居住區(早上入場負荷,晚上出口負荷)或更多的工作區域(早上出口負荷,入口大約在下午4點,6點和8點左右偷看)。唯一的問題是,大約有550個電臺。
我試圖用seaborn facetgrid繪製它,它不能處理多個站點(10個左右)而沒有遇到內存問題。
所以我想知道是否有人有一個好主意來完成我想要做的事情。
請隨附筆記本(倒數第二格表示我試圖將數據可視化,即繪製4個站點)。這顯然不適用於500多個電臺,所以可能連續5個電臺?
的最後一個單元格包含站R001的數據作爲評論請..
https://github.com/FBosler/Udacity/blob/master/Example.ipynb
任何輸入非常感謝! Fabian
您能否提供一個站點數據的快速示例? – kezzos
https://github.com/FBosler/Udacity/blob/master/Example.ipynb最後一個單元格用於工作站R001 –