我通常使用Stata,但現在想使用Python並拼命嘗試創建pandel數據集。我嘗試了pandas.panel,但沒有得到它的工作。 我有以下數據集:Python面板數據
date id1 id2
2000 100 50
2001 101 48
現在我想使它看起來像這樣:
date id variable
2000 1 100
2000 2 101
2001 1 50
2001 2 48
接下來,我要確定一個時間和id變量運行一些面板功能。我也試過dataframe.stack(),但是這不會根據id進行排序。我該如何做,或者我在這裏錯過了熊貓的一些很好的時間序列功能?
對不起。我確信這個問題已經在某個地方得到解答,但我現在嘗試了幾個小時,但無法弄清楚。
我已想出這個問題是我沒有該列的ID,因爲id1和i2列用不同的字符串命名。 但是,如何在不扭曲數據集的情況下爲每列分配一個ID? –
我相信變量列中的某些值不正確。 – pylang