dataframe

    0熱度

    1回答

    我正在嘗試解析一些網域(數以萬計)以查看它們是否包含任何英文單詞。 我很容易解析域名以獲取tldextract域的主要部分,然後嘗試使用enchant來查看它們是否存在於英文字典中。 問題是我不知道如何將域分割成多個單詞來檢查,即latimes返回False,但times會返回True。 有沒有人知道一個聰明的方法來看,如果在字符串中包含任何英語單詞? 謝謝!

    0熱度

    2回答

    我有一個包含列「日期」數據集: date item 20.3.2010 17:08 a 20.3.2010 11:16 b 2010-03-20 15:55:14.060 c 2010-03-21 13:56:45.077 d 我想有格式20.3.2010 17:08所有值轉換爲2010-03-21 13:56:45.077。 有沒有人有想法? 謝謝。

    2熱度

    3回答

    我有一個數據框,以便該列包含json對象和字符串。我想擺脫不包含json對象的行。 下面是我的數據框的樣子: import pandas as pd df = pd.DataFrame({'A': ["hello","world",{"a":5,"b":6,"c":8},"usa","india",{"a":9,"b":10,"c":11}]}) print(df) 我應該如何刪除只包

    -1熱度

    1回答

    1)我有兩個數據幀。他們有相同的數量和名稱的列。我怎樣才能將它整合到一個數據框中? 我需要像np.vstack那樣的數據框。 2)我有'性'欄的數據框,'男'和'女'在哪裏。我怎樣才能改變值「男性」 1和「女」爲0(無環路) 預先感謝

    1熱度

    1回答

    我正在嘗試創建一個新列,其中另一列中的值的平均值取決於另一列中的值。 pd.DataFrame({"A":[1, 2, 1, 2], "B":[4, 6, 8, 12] 我想創建一個新的列「C」,這將是 pd.DataFrame({"A":[1, 2, 1, 2, 3], "B":[4, 6, 8, 12, 4], "C":[6,9,6,9,4]} 如果

    1熱度

    3回答

    非常新的火花/斯卡拉。我想知道是否有一種簡單的方法來以列式方式聚合Array [Double]。這裏有一個例子: c1 c2 c3 ------------------------- 1 1 [1.0, 1.0, 3.4] 1 2 [1.0, 0,0, 4.3] 2 1 [0.0, 0.0, 0.0] 2 3 [1.2, 1.1, 1.1] 然後,一旦聚集,我會看起來像一個表

    2熱度

    2回答

    組 從等於最高值的值數據框中選擇多行我有一個數據幀,看起來像這樣: query <- c('a','a','a','b','b','b','c','c','c') hit <- c(1,2,3,4,5,6,7,8,9) score <- c(97,97,96,98,97,96,99,99,98) df <- data.frame(query,hit,score) df quer

    3熱度

    1回答

    我有一個csv文件,它有很多列。一列包含字典對象形式的數據以及字符串。例如:列包含以下數據:{「a」:5,「b」:6,「c」:8},「usa」,「india」,{「a」:9,「b」 :10,「C」:11} 當我使用閱讀本CSV成數據幀: df = pd.read_csv(path) 該列的數據被識別爲字符串當我沒有df.applymap(type) 檢查每個類型元素存儲在這個特定的列中。 但是

    0熱度

    2回答

    我的數據集示例如下: df1 <- data.frame(v1 = c(1,1,1,4,5,5,4,1,2,3,5,6,2,1,5), v2 = c(11,13,3,42,15,25,44,13,21,73,65,26,52,11,57)) df2 <- data.frame(v3 = c(1,2,3,0,4,5,6,7)) df2$newCol = 0 我想要做以下的僞代

    1熱度

    2回答

    如果您想要查找數據框中每列的最大頻率並返回因子,類別和頻率,您會做什麼? 所以我的代碼如下: dfreqcommon = data.frame() for (i in 1:ncol(diamonds)){ dfc = data.frame(t(table(diamonds[,i]))) dfc$Var1 = names(diamonds)[i] dfreqcommon = rbind