pandas

    1熱度

    3回答

    基於下面的數據框(1),我希望創建一個數據框(2),其中y或z等於2.是否有方法可以方便地執行此操作? 如果我要創建一個僅包含dataframe(1)但不包含dataframe(2)的行的數據框(3),我該如何處理它? id x y z 0 324 1 2 1 213 1 1 2 529 2 1 3 347 3 2 4 109 2 2 ...

    1熱度

    2回答

    我有以下的數據幀,並想: 組記錄由month 總和QTY_SOLD和各UPC_ID(每月)獨特的NET_AMT 附上其餘的列以及產生的數據幀 我認爲我可以做到這一點的方式是第1種:創建month列彙總D_DATES,然後通過UPC_ID彙總QTY_SOLD。 腳本: # Convert date to date time object df['D_DATE'] = pd.to_datetime(

    1熱度

    2回答

    從Excel中讀取到的大熊貓時,這樣表示 t0001 Albania 0.03914382317658349 0 t0001 Algeria 0.298994 1 t0001 Austria 1.01137 2 t0001 Belgium 0.306369 我想實現的是插入的「時間」,「區域」一欄,「價值」,它應該如下所示: time region value 0 t0001 Alba

    1熱度

    1回答

    我的目標:我希望刪除具有特定列中的NaN的行。我會允許NaN存在於某些列,但不允許存在其他列。 英文例如:如果一行中'detail_age'的值是NaN,我想刪除該行。 這裏是我的數據的視圖: import pandas as pd df = pd.read_csv('allDeaths.csv', index_col=0, nrows=3, engine='python') print(df

    1熱度

    1回答

    我有一個包含多個列的數據框。 >>> df.take(1) [Row(A=u'{dt:dt=string, content=Prod}', B=u'{dt:dt=string, content=Staging}')] 我想從df列A和B的值中去掉花括號'{'和'}'。我知道我們可以使用: df.withColumn('A',regexp_replace('A','//{','')) df.

    1熱度

    2回答

    第一篇文章,盡我所能描述我的問題。讓我知道是否需要根據格式調整任何內容或澄清問題的任何方面。謝謝! 我有大熊貓電影評級的數據框,我需要爲每部電影創建用戶評分向量。我正在尋找更高效的方法(使用熊貓/ numpy操作或向量化),以便處理數據集中的26M行或用戶電影評級對。 電影等級的數據幀看起來像這樣: 輸入: movieId userId rating 1 1 1.0 1 2 4.5

    1熱度

    1回答

    我正在尋找最大量的!在數據幀和IM不是100%肯定,如果我有權利代碼: finefoods_df['Review'].max().count("!")

    0熱度

    1回答

    如果我有2個Series對象,像這樣:[0,0,1] [1,0,0] 如何得到兩個交點和聯合? 它們只包含布爾值,這意味着它們是非唯一值。 我有一個大的布爾矩陣。我對它進行了細化,現在我試圖找到誤報和否定,我認爲這意味着我必須讓每個原始對的Jaccard相似。

    1熱度

    1回答

    我有一個熊貓數據幀,看起來如下: name1 country1 name2 country2 A GER B USA C GER E GER D GER Y AUS E GER A USA 我想獲得一個新的數據幀有兩列name和country包含唯一對(name1, country1)和(name2,country2)。 預期的結果應該是這樣的: nam

    1熱度

    1回答

    我有一個數據幀DF = DF [[「A」,「B」,「C」] 3列和2000行 然後,我有另一組數據只有200行 我怎樣才能將這個添加到df ['D'],使這200行將只顯示爲2000行的尾部? 所以,從0-1800一行DF [「d」]將爲NaN,然後​​1801至2000年將是價值 一直在嘗試各種方法都沒有成功......謝謝 data with 200 rows in this format