9
我做錯了合併,我不明白它是什麼。我已經做了如下估算了一系列的整數值的直方圖:熊貓:理解如何合併工作的困難
import pandas as pnd
import numpy as np
series = pnd.Series(np.random.poisson(5, size = 100))
tmp = {"series" : series, "count" : np.ones(len(series))}
hist = pnd.DataFrame(tmp).groupby("series").sum()
freq = (hist/hist.sum()).rename(columns = {"count" : "freq"})
如果我打印hist
和freq
這是我得到:
> print hist
count
series
0 2
1 4
2 13
3 15
4 12
5 16
6 18
7 7
8 8
9 3
10 1
11 1
> print freq
freq
series
0 0.02
1 0.04
2 0.13
3 0.15
4 0.12
5 0.16
6 0.18
7 0.07
8 0.08
9 0.03
10 0.01
11 0.01
他們都是由"series"
索引但如果我嘗試合併:
> df = pnd.merge(freq, hist, on = "series")
我得到KeyError: 'no item named series'
異常。如果我省略on = "series"
,我會得到一個IndexError: list index out of range
異常。
我不明白我做錯了什麼。可能是「系列」是索引而不是列,所以我必須以不同的方式做?
改進合併文檔字符串的時間! – 2012-04-13 22:23:10
@WesMcKinney:好:) – Avaris 2012-04-13 23:11:16