multi-index

    2熱度

    1回答

    我確實有兩個多索引數據幀,它們包含相同的多索引級別。它們之間的唯一區別在於索引級別的排列順序。 有沒有辦法從df1重新排列multiindex的級別,以便它們與df2中的一樣? df1.index.names產生 FrozenList([u'Local code', u'Nature of holding', u'Issuer long name', u' Internal Issuer rati

    2熱度

    1回答

    我有一個MultiIndexed的Pandas數據框。第二級包含一年([2014,2015]),第三級包含月份編號([1,2,...,12])。我想將這兩個合併爲一個單一的層次,例如 - [1/2014,2/2014 ...,6/2015]。這怎麼能做到? 我是熊貓新手。搜索了很多,但找不到任何類似的問題/解決方案。 編輯:我找到了一種避免與this question的答案完全做到這一點的方法。我

    2熱度

    1回答

    我有一個parent_df和一個child_df,如下所示。 parent_df: x y colA x1 y1 A1 x1 y2 A2 x2 y1 A3 x2 y2 A4 child_df: p q colB colC p1 q1 B1 C1 p1 q2 B2 C2 p2 q1 B3 C3 p2 q2 B4 C4 我想要麼修改parent_df或將child_df到p

    2熱度

    1回答

    我有一個多索引的數據幀象下面這樣: col1 col2 col3 col4 row1 0 A A b b 1 B B c c row2 0 A B d d 1 B B e e ,並想知道例如串聯信息的最有效方式對於ROW1 + COL1,ROW1 + COL2等,使得我的結果將是: col1 col2 col3 col4 row1 AB AB bc b

    0熱度

    1回答

    我具有形式 "a" "b" "c" #first level index 0, 1, 2 0, 1, 2 0, 1, 2 #second level index index 0 1,2,3 6,7,8 5,3,4 1 2,3,4 7,5,4 9,2,5 2 3,4,5 4,5,6 0,4,5 ... 代表點的數據幀的熊

    2熱度

    1回答

    熊貓to_csv根據它們是多索引系列還是簡單拆分的數據幀來寫入大小不同的文件(後者似乎不足一半尺寸)。 從csv格式可能有一些背後的直覺,但我不能弄明白。 爲什麼熊貓系列在.csv格式上的數據幀大得多? 代碼,以生成一個這樣的例子: # imports import pandas as pd from numpy.random import random from random import

    1熱度

    1回答

    給定兩個熊貓數據幀dfa和dfb,我如何確保每個DataFrame的MultiIndex包含所有其他行? In [147]: dfa Out[147]: c a b 0 5 10.0 1 6 11.0 2 7 12.0 3 8 13.5 4 9 14.0 In [148]: dfb Out[148]: c a b 0 5 10 2 7 12

    2熱度

    1回答

    我認爲通過使用龐大的pandas.DataFrame庫,它應該是非常簡單的做所有標準的東西,你可以做一個SQL表..但考慮到許多選擇後,我仍然沒有找到一個好的工作解決方案。 要求: 表具有4列與不同的數據類型(UINT32,字符串,...),3關閉他們應該工作作爲索引 許多(> 10,000)的額外類型的列int8 最初我有想動態地添加行和列的想法,但結果非常慢(使用df.at [row,col]

    1熱度

    1回答

    我想創建一個索引作爲嵌入在列名中的數據的多級索引的一部分。這個問題比描述要容易得多。這是我原來的數據是這樣的: d = {'time':[0,1,2], 'part_0_hits': [100,200,300], 'part_1_hits': [25,50,75]} df = pd.DataFrame(d) 我想創建一個名爲「部分」已在列名零件號的新指標。結果需要看起來像這樣: d2 = {

    1熱度

    1回答

    我有熊貓一個多指標,看起來像由下面的代碼生成一個: arrays = [[2001, 2001, 2003, 2004], ['January', 'March', 'June', 'December']] tuples= list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, names=['year', 'month'])