2017-10-04 103 views
0

如何解析url查詢字符串,這些字符串本質上是鍵值對,放入典型的data.frame中?在R中有這樣簡單的方法嗎?也許有一個圖書館?將url查詢鍵值對轉換爲數據框

輸入:

unique1=blub&same=aaaa-aaaa-aaaa&date=01.01.2017&time=12:30:00 
date=02.01.2017&unique2=blub&time=12:30:00&same=bbbb-bbbb 
same=cccc&time=12:35:00&unique3=blub&date=03.01.2017` 

所需的輸出作爲data.frame:

 date   same  time unique1 unique2 unique3 
1 01.01.2017 aaaa-aaaa-aaaa 12:30:00 blub <NA> <NA> 
2 02.01.2017  bbbb-bbbb 12:30:00 <NA> blub <NA> 
3 03.01.2017   cccc 12:35:00 <NA> <NA> blub 

回答

1

下面是一個方法。請注意,字段按「&」分隔,「鍵值」按「=」分隔。然後,我們使用strsplit來產生每行的列表,使用兩個字符進行分割。在第二行中,利用數據的規律性,使用模數2將鍵與值分開。這將返回一個嵌套列表,使我們可以將其提供給data.tablerbindlist返回一個data.table

# get list of key-values by line 
tmp <- strsplit(urlDat, "&|=") 
# use modulus to select keys and values 
tmp <- lapply(tmp, function(x) setNames(as.list(x[seq_along(x) %% 2 == 0L]), 
             x[seq_along(x) %% 2 == 1L])) 
library(data.table) 
dat <- rbindlist(tmp, fill=TRUE, use.names=TRUE) 

這將返回

dat 
    unique1   same  date  time unique2 unique3 
1: blub aaaa-aaaa-aaaa 01.01.2017 12:30:00  NA  NA 
2:  NA  bbbb-bbbb 02.01.2017 12:30:00 blub  NA 
3:  NA   cccc 03.01.2017 12:35:00  NA blub 

列順序顛倒,但這是很容易解決與標準索引,[

setDF(dat)[, c("date", "same", "time", "unique1", "unique2", "unique3")] 
     date   same  time unique1 unique2 unique3 
1 01.01.2017 aaaa-aaaa-aaaa 12:30:00 blub <NA> <NA> 
2 02.01.2017  bbbb-bbbb 12:30:00 <NA> blub <NA> 
3 03.01.2017   cccc 12:35:00 <NA> <NA> blub 

其中setDF強制dat到一個data.frame到位(沒有副本)。

數據

urlDat <- readLines(textConnection(
"unique1=blub&same=aaaa-aaaa-aaaa&date=01.01.2017&time=12:30:00 
date=02.01.2017&unique2=blub&time=12:30:00&same=bbbb-bbbb 
same=cccc&time=12:35:00&unique3=blub&date=03.01.2017"))