我有一個多索引的數據幀象下面這樣: col1 col2 col3 col4
row1 0 A A b b
1 B B c c
row2 0 A B d d
1 B B e e
,並想知道例如串聯信息的最有效方式對於ROW1 + COL1,ROW1 + COL2等,使得我的結果將是: col1 col2 col3 col4
row1 AB AB bc b
熊貓to_csv根據它們是多索引系列還是簡單拆分的數據幀來寫入大小不同的文件(後者似乎不足一半尺寸)。 從csv格式可能有一些背後的直覺,但我不能弄明白。 爲什麼熊貓系列在.csv格式上的數據幀大得多? 代碼,以生成一個這樣的例子: # imports
import pandas as pd
from numpy.random import random
from random import
給定兩個熊貓數據幀dfa和dfb,我如何確保每個DataFrame的MultiIndex包含所有其他行? In [147]: dfa
Out[147]:
c
a b
0 5 10.0
1 6 11.0
2 7 12.0
3 8 13.5
4 9 14.0
In [148]: dfb
Out[148]:
c
a b
0 5 10
2 7 12