dataframe

    1熱度

    1回答

    我有3個df,每個列有25個列。所有列在3 df中都是相同的。 我想合併三個df,並將25列df1的列名更改爲「_a」,將25列df2更改爲「_b」,將25列df3更改爲「_c」。 我使用下面的代碼: pd.merge(pd.merge(df1,df2,'left',on='year',suffixes=['_a','_b']),df3,'left',on='year') 如何使用重命名或其他

    0熱度

    1回答

    我是R初學者,目前面臨着我現在無法概念化的問題。 我已經看過幾個相關的職位,但還沒有發現除了有 一個明確的答案: Aggregating rows with same Ids and retaining only unique entries in R 但我的問題是有點不同。 這裏的初始DF我想使用的結構: sta_RHP_metho(3528,4)的變量是: - 「code.sandre」 女巫

    1熱度

    3回答

    假設我有一個熊貓數據幀,其中兩列由字符串列表的如下所示 df=pd.DataFrame({'A' : [ ['a','b','c'], ['d','e','f'] ], 'B':[ ['g','h','i'], ['j','k','l'] ] }) 我想連接在所述第一字符串元素在A中的第一個列表中的第一個字符串元素位於B的第一個列表中,並帶有連字符等。最終的產品將是另一個C柱使 df['C']

    -1熱度

    1回答

    我有以下兩個數據框。 DF1: date customers 2017-10-09 8 2017-10-10 5 2017-10-11 4 2017-10-12 8 2017-10-13 9 2017-10-16 1 DF2: date manager prev_day next_day on_or_next_day 2017-10-10 george 201

    0熱度

    1回答

    我有一堆數據存儲在DataFrame中。我試圖讓用戶在查詢條件通過以下形式: column, operator, variable_name 所以用戶可能通過在下面作爲一個例子 'Action equal allow,total_bytes > 10000,application neq facebook' 我通過拆分和格式化成解析字符串看起來像這樣 query_string = (dfr

    0熱度

    1回答

    我想從Python中現有的csv文件創建data.frame對象,但我面臨着問題。 我試圖將csv文件導入python,但我不知道我是否成功。 >>> import os >>> userhome = os.path.expanduser('~') >>> csvfile= userhome + r'\Desktop\train.csv' >>> with open(

    1熱度

    2回答

    我想改變我的數據框列名,我試過兩種方法,但沒有一個工作。 這是我的代碼; 方法1: def func(): energy=pd.ExcelFile('Energy Indicators.xls').parse('Energy') energy=energy.iloc[16:][['Environmental Indicators: Energy','Unnamed:3','Un

    0熱度

    1回答

    我有這樣 train['finally'].head(5) 0 [0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, ... 1 [0, 0, 0, 4, 0, 0, 0, 5, 0, 0, 6, 0, 0, 0, 0, ... 2 [0, 0, 0, 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 0, ... 3 [2, 0,

    0熱度

    1回答

    非常感謝您的任何意見! 我想將數據框中的一列列表映射到分組類別。 更具體地說,我的名單列會是什麼樣子: List "item1|item2" "item3|item2" "item1|item3" 另外我還有一個分組類別數據幀: Category Item C1 item1 C1 item3 C2 item2 C2 item4 我想創建原數據幀新的列(列

    1熱度

    1回答

    我試圖用np.nan值替換我的數據框中由'...'反映的缺失值。 我也想更新一些舊的值,但我的方法似乎不工作。 這裏是我的代碼: import numpy as np import pandas as pd def func(): energy=pd.ExcelFile('Energy Indicators.xls').parse('Energy') energy=en