dummy-variable

    -1熱度

    1回答

    假設我有一個分類變量,例如表格中的國家/地區列。 如何快速添加每個類別的虛擬變量 - WITH A NAME NAME? 所以,如果列是針對國家的,那麼這個人是否居住在美國的變量將被稱爲美國而不是country16什麼的。

    1熱度

    1回答

    我對編程頗爲陌生,我無法在任何地方找到它。基本上,我的一個變量的範圍是0到200000,我試圖用pd.get_dummies爲0和> 0的值創建一個虛擬模型,但我無法弄清楚,有人能幫我做這個嗎?謝謝!

    0熱度

    1回答

    ,我不知道我是否應該列入各級當我創建從一個列表中的因素: random_merge_patients$MedCond <-factor(sort(random_merge_patients[[35]])) 因子的例子看起來是這樣的: [6589] "wt loss ftt arthritis anemia of chronic disease mild cognitive impairment

    0熱度

    1回答

    如果變量名稱包含任何短語「idx」,我想創建一個等於1的新變量created_idx_var, ,「Idx」,「indx」,「Indx」,「index」,「Index」,「etf」,「ETF」或變量索引是否爲「是」。 我剛開始學習R.我的第一步是消除數據集並只保留股票基金。然後,我想創建一個標誌,看看基金是否是指數基金。我在網上搜索,但找不到任何東西。 一些樣本數據: enter image de

    1熱度

    1回答

    我有這樣一個數據幀: date sales company country 16/03/2012 3000 H&M US 13/04/2012 2300 H&M US 26/03/2012 1230 H&M FR 13/04/2012 1300 H&M FR 23/03/2012 2230 H&M IT 19/04/2012 1100 H&M

    0熱度

    1回答

    我有一個有多個因素的數據庫。我想迭代每個變量的每個因子的迴歸,但對於整個數據庫。例如: for (i in unique(db$Product)) { for (j in unique(db$Super)) { for (c in unique(db$Category)) { db$prueba <- lm(prueba ~ 0 + as.factor(Super)[j] *

    0熱度

    1回答

    我想創建虛擬變量爲R.幾個不同的欄目,我可以用代碼中的變量殘疾做到這一點: Disability <- model.matrix(~ Disability - 1, transform(Dev_Mod, Disability = factor(paste(Disability, sep = "_")))) 因爲我要運行這個各種變量的代碼多次我寧願爲此創建功能,所以我寫了下面的

    1熱度

    1回答

    在我的數據框中,我有一個分類變量,我想將其轉換爲虛擬變量。然而,該塔具有由逗號分隔的多個值: 0 'a' 1 'a,b,c' 2 'a,b,d' 3 'd' 4 'c,d' 最後,我想爲每一個可能的離散值二進制列;換句話說,最終列數等於原始列中唯一值的數量。我想我必須使用split()來獲得每個單獨的值,但不知道以後要做什麼。任何提示非常感謝! 編輯:額外的扭曲。列有空值。並在迴應評論

    0熱度

    1回答

    我必須爲可能有16個值(0-15)的列創建虛擬變量,但是當我基於它創建虛擬變量時,不需要全部16個值: my_column 0 3 1 4 2 7 3 1 4 9 我希望我的虛擬變量有16列,或者更多 - 任何預先固定由我一個值,並在列名稱中的數字對應於my_column價值,但如果my_column只有,比方說,從16個可能值中的5個值,方法pd.get_dummies將只創建5列

    0熱度

    2回答

    我有一個雙重索引(日期,時間)的數據框,並且如果索引日屬於假期列表,則希望創建等於一個新列的「假日」 。 我喜歡的類型DatetimeIndex的假期表: holidays = ['2017-09-11', '2017-12-24'] 我原來的數據幀: Visitor Date Time 2017-09-11 4:45 0 5