dataframe

    0熱度

    1回答

    我有一個熊貓數據幀,看起來像這樣 ​​ 每一行裏面包含一些整數,列表和零字符串 我試圖取代列表中的0與另一個值一樣,如 [2,0]。我想將它轉換爲[2,7]。 我試圖train['finally'] = train['finally'].map({0:7}) 這是怎麼train['finally']看起來像 0 [zero, zero, zero, zero, 2, zero, zero, zer

    0熱度

    1回答

    我想將具有n行和n列的數據幀轉換爲單行,並添加了列名和行名稱 例如,我想將下表轉換爲單行 Country Percentage United States 97.89% United Kingdom 0.65% Switzerland 0.50% Ireland 0.48% Singapore 0.45% Hong Kong

    0熱度

    1回答

    我已經創建了一個循環取的所有值從人物A保存的值: [1] "Arsenal" "Aston Villa" "Cardiff City" "Chelsea" "Crystal Palace" [6] "Everton" ... ,並通過數據幀england運行,並且找到其他變量的所有的對應值。 for (i in 1:length(teams)) { print(sum(england

    0熱度

    1回答

    如何使用NA識別和替換數據框中的超範圍數據? 我目前使用下面的代碼來識別使用盒圖的異常值,然後手動確定哪些異常值超出範圍(例如,比例是1-4,數據點是負值)並刪除它們。 >boxplot(data$scale1, data = data) >outliers <- boxplot(cw$N, plot=FALSE)$out >outliers >data$scale1[data$scale1

    0熱度

    1回答

    讓說,我有 sim_users critic critic Claudia Puig Gene Seymour Jack Matthews Lisa Rose Mick LaSalle Toby 0 Claudia Puig 1.000000 0.314970 0.028571 0.566947 0.566947 0.893405 1 Gene Seymour 0.314970 1.00000

    1熱度

    2回答

    我有一個數據幀,看起來像: Col1 Col2 0 A PY 1 B PA 2 C PB 3 B PB 而這一系列: Value Col1 Col2 A PY 20 B PB 30 我願做一個映射,如果該系列產品具有一個索引(例如它只是相當簡單: df['Value'] = df

    1熱度

    3回答

    分類列值我有一個數據幀,DF這樣 a b c 1 0 2 5 7 8 4 1 3 3 4 6 5 2 5 ....... 現在我想用以下範圍 0-3 = 1 4-6 = 2 7-9 = 3 列值小於10,以代替那些在數據,所以範圍在0-9之內。 我想和範圍內的類別,以取代上述的數據幀的值和輸出應該是這樣的 a b c 1 1 1 2 3 3 2 1 1 1 2 2

    -1熱度

    1回答

    我想用pandas創建一個數據框,其中1列是'EmployeeID',第二個是'技能'集,他具有1到5的範圍。'EmployeeID'列應該有唯一值,而「技能」列可以具有重複值。 1.我試圖產生「僱員」使用下面的代碼: df = pd.DataFrame({'EmployeeID':[random.sample(range(123456,135000),100)]}) 但結果不是我所期待。它產

    0熱度

    1回答

    通過迭代遍歷熊貓中的for循環,我爲行和列創建了具有相同信息的矩陣。 這裏是我當前的代碼: for i in range(60): eachMatrix = pd.DataFrame(index=df.WordTeams[i],columns=df.WordTeams[i]) eachMatrixcols = eachMatrix.columns.values eachMatrixInde

    2熱度

    1回答

    我是新來的python,我想做這個特殊的任務,這對我來說似乎並不明顯。我甚至不知道要搜索什麼才能找到它。首先這裏是代碼片段,我會解釋我的目標在它下面: import pandas as pd mycolumns = ['col1', 'col2', 'col3'] df = pd.DataFrame(data=[[**1**,2,3,**1**,5,6],[1,2,3,4,5,6]],