合併兩個熊貓數據幀

我已經看過這個問題幾次，但答案不適合我。我有兩個數據幀，split_df和csv_df，我試圖合併一個名爲key的列。合併兩個熊貓數據幀

下面是split_df

 key  tags 
2785 30000  ipv6 
2785 30000 networking 
2785 30000 wireless 
2785 30000 standards 
2785 30000  satcom

前5項下面是來自csv_df

當我運行此合併聲明的前5項：

common_df = pd.merge(split_df,csv_df, on=['key'], suffixes=('_left', '_right'))

我得到：

個

Empty DataFrame 
Columns: [key, tags] 
Index: []

過程完成，退出代碼爲0

我想不通爲什麼合併是不是爲我工作。有什麼建議麼？

我有兩個索引（和已經運行與他們進行合併以及）

csv_df.set_index('key') 
split_df.set_index('key')

我很新的Pyton和大熊貓

謝謝！

來源

2017-01-25 S Coe

從上面的代碼這個工作對我來說：

In [11]: pd.merge(split_df,csv_df, on=['key'], suffixes=('_left', '_right')) 
Out[11]: 
    key  tags 
0 30000  ipv6 
1 30000 networking 
2 30000 wireless 
3 30000 standards 
4 30000  satcom

我懷疑是列類型key在你dataframes（和我的相同int）不同。

最有可能的一個是字符串（另一個是float/int）。

In [12]: split_df["key"] = split_df["key"].apply(str) 

In [13]: pd.merge(split_df,csv_df, on=['key'], suffixes=('_left', '_right')) 
Out[13]: 
Empty DataFrame 
Columns: [key, tags] 
Index: []

如果他們兩個字符串：

In [14]: csv_df["key"] = csv_df["key"].apply(str) 

In [15]: pd.merge(split_df,csv_df, on=['key'], suffixes=('_left', '_right')) 
Out[15]: 
    key  tags 
0 30000  ipv6 
1 30000 networking 
2 30000 wireless 
3 30000 standards 
4 30000  satcom

來源

2017-01-25 21:16:25

檢查與'splitt_df.dtypes'和'csv_df.dtypes' –

在dataframes之一的key列int，而另一個是str

split_df.key = split_df.key.astype(int) 
csv_df.key = csv_df.key.astype(int) 

pd.merge(split_df,csv_df, on=['key'], suffixes=('_left', '_right'))

來源

2017-01-25 21:16:49 piRSquared

謝謝你 - 就是這樣:-) –

合併兩個熊貓數據幀

回答

相關問題