1
我正在與合作,該圖概述了美國各縣的健康保險計劃。對於每個計劃有一排State
和County
列以及關於計劃本身(溢價,抵扣等)的信息。識別由第二個變量區分的重複值
作爲我的分析的一部分,我想將此與另一個包含人口統計信息的數據框(我們稱之爲「人口普查」)相關聯,每個County
。我計劃在match()
使用County
名稱共享兩個data.tables和FIPS ID(地理聯邦標識符)。
在開始第二步(match()
)之前,我需要檢查各個州的「常見」縣名 - 即在愛荷華州和北達科他州(以及內布拉斯加州)都有一個蘇族郡縣)。如果我找不到解決辦法,我可能會錯誤地輸入FIPS ID和「人口普查」信息。
sioux <- hi[hi$County == "Sioux",]
sioux[26:31,1:3]
State County Metal.Level
15407 IA Sioux Platinum
15408 IA Sioux Catastrophic
15409 IA Sioux Silver
46129 ND Sioux Silver
46130 ND Sioux Silver
46131 ND Sioux Gold
看來unique()
,將工作做好,但鑑於County
和State
是在單獨的列,不知道如何指定我正在尋找在不同狀態下的同名縣。
你爲什麼不創造出既融合州,縣名稱爲'paste0一個新的變量(州,縣,九月=「 - 」)'...然後執行一個獨特的比賽......這將創造'愛荷華蘇族'和'北達科他蘇族'作爲不同的價值...... – Gaurav
所以這將是'hi $ state_county < - paste0(嗨$狀態,嗨$縣,sep =「 - 」)'.. 。然後跟隨'unique()' – Gaurav
任何(真實)數據進行測試?你可以用'dput'將它們粘貼在這裏嗎? –