dataframe

0熱度

1回答

我有一個熊貓數據幀，看起來像這樣每一行裏面包含一些整數，列表和零字符串我試圖取代列表中的0與另一個值一樣，如 [2,0]。我想將它轉換爲[2,7]。我試圖train['finally'] = train['finally'].map({0:7}) 這是怎麼train['finally']看起來像 0 [zero, zero, zero, zero, 2, zero, zero, zer

0熱度

1回答

將R中的錶轉換爲單行

我想將具有n行和n列的數據幀轉換爲單行，並添加了列名和行名稱例如，我想將下表轉換爲單行 Country Percentage United States 97.89% United Kingdom 0.65% Switzerland 0.50% Ireland 0.48% Singapore 0.45% Hong Kong

0熱度

1回答

不能從迴路R

我已經創建了一個循環取的所有值從人物A保存的值： [1] "Arsenal" "Aston Villa" "Cardiff City" "Chelsea" "Crystal Palace" [6] "Everton" ... ，並通過數據幀england運行，並且找到其他變量的所有的對應值。 for (i in 1:length(teams)) { print(sum(england

0熱度

1回答

如何使用NA識別和替換數據框中的超範圍數據？

如何使用NA識別和替換數據框中的超範圍數據？我目前使用下面的代碼來識別使用盒圖的異常值，然後手動確定哪些異常值超出範圍（例如，比例是1-4，數據點是負值）並刪除它們。 >boxplot(data$scale1, data = data) >outliers <- boxplot(cw$N, plot=FALSE)$out >outliers >data$scale1[data$scale1

0熱度

1回答

作出具體列只新的數據幀熊貓

讓說，我有 sim_users critic critic Claudia Puig Gene Seymour Jack Matthews Lisa Rose Mick LaSalle Toby 0 Claudia Puig 1.000000 0.314970 0.028571 0.566947 0.566947 0.893405 1 Gene Seymour 0.314970 1.00000

1熱度

2回答

地圖上2列大熊貓

我有一個數據幀，看起來像： Col1 Col2 0 A PY 1 B PA 2 C PB 3 B PB 而這一系列： Value Col1 Col2 A PY 20 B PB 30 我願做一個映射，如果該系列產品具有一個索引（例如它只是相當簡單： df['Value'] = df

1熱度

3回答

熊貓：由範圍

分類列值我有一個數據幀，DF這樣 a b c 1 0 2 5 7 8 4 1 3 3 4 6 5 2 5 ....... 現在我想用以下範圍 0-3 = 1 4-6 = 2 7-9 = 3 列值小於10，以代替那些在數據，所以範圍在0-9之內。我想和範圍內的類別，以取代上述的數據幀的值和輸出應該是這樣的 a b c 1 1 1 2 3 3 2 1 1 1 2 2

-1熱度

1回答

使用熊貓和隨機模塊創建數據幀

我想用pandas創建一個數據框，其中1列是'EmployeeID'，第二個是'技能'集，他具有1到5的範圍。'EmployeeID'列應該有唯一值，而「技能」列可以具有重複值。 1.我試圖產生「僱員」使用下面的代碼： df = pd.DataFrame({'EmployeeID':[random.sample(range(123456,135000),100)]}) 但結果不是我所期待。它產

0熱度

1回答

JSONDecodeError：期望值：第1行第1列（char 0）在Panda的For循環中

通過迭代遍歷熊貓中的for循環，我爲行和列創建了具有相同信息的矩陣。這裏是我當前的代碼： for i in range(60): eachMatrix = pd.DataFrame(index=df.WordTeams[i],columns=df.WordTeams[i]) eachMatrixcols = eachMatrix.columns.values eachMatrixInde

2熱度

1回答

如何從熊貓數據框中動態選擇一個子集？

我是新來的python，我想做這個特殊的任務，這對我來說似乎並不明顯。我甚至不知道要搜索什麼才能找到它。首先這裏是代碼片段，我會解釋我的目標在它下面： import pandas as pd mycolumns = ['col1', 'col2', 'col3'] df = pd.DataFrame(data=[[**1**,2,3,**1**,5,6],[1,2,3,4,5,6]],