pandas

1熱度

3回答

基於下面的數據框（1），我希望創建一個數據框（2），其中y或z等於2.是否有方法可以方便地執行此操作？如果我要創建一個僅包含dataframe（1）但不包含dataframe（2）的行的數據框（3），我該如何處理它？ id x y z 0 324 1 2 1 213 1 1 2 529 2 1 3 347 3 2 4 109 2 2 ...

1熱度

2回答

熊貓集團 - 包括所有列

我有以下的數據幀，並想：組記錄由month 總和QTY_SOLD和各UPC_ID（每月）獨特的NET_AMT 附上其餘的列以及產生的數據幀我認爲我可以做到這一點的方式是第1種：創建month列彙總D_DATES，然後通過UPC_ID彙總QTY_SOLD。腳本： # Convert date to date time object df['D_DATE'] = pd.to_datetime(

1熱度

2回答

大熊貓用於插入的列索引

從Excel中讀取到的大熊貓時，這樣表示 t0001 Albania 0.03914382317658349 0 t0001 Algeria 0.298994 1 t0001 Austria 1.01137 2 t0001 Belgium 0.306369 我想實現的是插入的「時間」，「區域」一欄，「價值」，它應該如下所示： time region value 0 t0001 Alba

1熱度

1回答

Python - 熊貓 - 在dropna調用特定子集期間出現的關鍵錯誤

我的目標：我希望刪除具有特定列中的NaN的行。我會允許NaN存在於某些列，但不允許存在其他列。英文例如：如果一行中'detail_age'的值是NaN，我想刪除該行。這裏是我的數據的視圖： import pandas as pd df = pd.read_csv('allDeaths.csv', index_col=0, nrows=3, engine='python') print(df

1熱度

1回答

如何從火花數據幀的所有列中替換多個字符？

我有一個包含多個列的數據框。 >>> df.take(1) [Row(A=u'{dt:dt=string, content=Prod}', B=u'{dt:dt=string, content=Staging}')] 我想從df列A和B的值中去掉花括號'{'和'}'。我知道我們可以使用： df.withColumn('A',regexp_replace('A','//{','')) df.

1熱度

2回答

Pandas GroupBy列值，並根據每組中的值創建固定大小的列表

第一篇文章，盡我所能描述我的問題。讓我知道是否需要根據格式調整任何內容或澄清問題的任何方面。謝謝！我有大熊貓電影評級的數據框，我需要爲每部電影創建用戶評分向量。我正在尋找更高效的方法（使用熊貓/ numpy操作或向量化），以便處理數據集中的26M行或用戶電影評級對。電影等級的數據幀看起來像這樣：輸入： movieId userId rating 1 1 1.0 1 2 4.5

1熱度

1回答

計算大熊貓數據幀中字符的最大出現次數

我正在尋找最大量的！在數據幀和IM不是100％肯定，如果我有權利代碼： finefoods_df['Review'].max().count("!")

0熱度

1回答

如何獲得非唯一值的熊貓兩個系列的交集和聯合？

如果我有2個Series對象，像這樣：[0,0,1] [1,0,0] 如何得到兩個交點和聯合？它們只包含布爾值，這意味着它們是非唯一值。我有一個大的布爾矩陣。我對它進行了細化，現在我試圖找到誤報和否定，我認爲這意味着我必須讓每個原始對的Jaccard相似。

1熱度

1回答

得到一個大熊貓數據幀的列的唯一對

我有一個熊貓數據幀，看起來如下： name1 country1 name2 country2 A GER B USA C GER E GER D GER Y AUS E GER A USA 我想獲得一個新的數據幀有兩列name和country包含唯一對(name1, country1)和(name2,country2)。預期的結果應該是這樣的： nam

1熱度

1回答

級聯數據幀具有不同數目的行的

我有一個數據幀DF = DF [[「A」，「B」，「C」] 3列和2000行然後，我有另一組數據只有200行我怎樣才能將這個添加到df ['D']，使這200行將只顯示爲2000行的尾部？所以，從0-1800一行DF [「d」]將爲NaN，然後1801至2000年將是價值一直在嘗試各種方法都沒有成功......謝謝 data with 200 rows in this format