2017-04-20 85 views
0

我試圖在河創建(數值)前綴rownames R中

創建數字前綴rownames

我有如下:

看到png格式

enter image description here

..我需要的是以下內容:

http://www.wordfish.org/uploads/1/2/9/8/12985397/wcger_alldim_chop.csv

格式是一個術語文檔矩陣或僅僅是一個R矩陣。

我需要格式才能使用程序「wordfish」(文本挖掘)。

格式應該看起來完全一樣。我可以創建矩陣,如下面的鏈接所示,但是不能在每個單詞前添加數字計數,也不能在數字和單詞本身之間分配引號。

不幸的是,

write.table(wcdata,文件= 「test.csv」,row.names = TRUE,col.names = NA, qmethod = C( 「雙」))

write.csv(wcdata,報價= TRUE,row.names = TRUE, 「test.csv」)

柱周圍唯一的地方引號(這是當然好)

在此先感謝您的任何幫助

+0

你好,歡迎來到StackOverflow。請花一些時間閱讀幫助頁面,尤其是名爲[「我可以詢問什麼主題?」(http://stackoverflow.com/help/on-topic)和[「我應該問什麼類型的問題避免問?「](http://stackoverflow.com/help/dont-ask)。更重要的是,請閱讀Stack Overflow [問題清單](http://meta.stackexchange.com/q/156810/204922)。您可能還想了解[最小,完整和可驗證示例](http://stackoverflow.com/help/mcve)。 –

回答

0

我希望我有你的問題,但我不太確定。

r1 <- c("alt", 1,2,3,4,5,6,7) 
r2 <- c("neu", 2,3,4,5,6,7,8) 
r3 <- c("zu", 1,1,1,1,1,1,1) 
r4 <- c("hier", 1,2,1,2,1,2,1) 
r5 <- c("das", 4,3,4,3,4,3,4) 
r6 <- c("die", 7,7,7,7,7,7,7) 
r7 <- c("der", 2,5,4,4,5,7,6) 

tdm <- rbind(r1,r2,r3,r4,r5,r6,r7) 

tdm2 <- cbind(c(1:nrow(tdm)),tdm) 
tdm2[,1] <- sapply(tdm2[,1], function(x) paste('\"', x,'\"',sep = "")) 
tdm2[,2] <- sapply(tdm2[,2], function(x) paste('\"', x,'\"',sep = "")) 

我認爲最後3行對你很有意思。其他人只是爲我的例子,因爲你沒有提供數據。

0

非常感謝您的快速回復。

該解決方案走向正確的方向,但不完全是我所需要的。

的數據提供的截屏:

在這裏看到:

TDM_1

執行的兩行代碼時,我得到了你提供

wcdata_2 <- cbind(c(1:nrow(wcdata)),wcdata) 
wcdata_2[,1] <- sapply(wcdata_2[,1], function(x) paste('\"', x,'\"',sep = "")) 

是以下

TDM 2

它進入正確的方向,但我需要的是前面的每行前綴(數字),然後引用前綴和行信息本身,可以在上面的鏈接中看到。

所以:

r1 <- c("1" "alt", 1,2,3,4,5,6,7) 
r2 <- c("2" "neu", 2,3,4,5,6,7,8) 
r3 <- c("3" "zu", 1,1,1,1,1,1,1) 
r4 <- c("4" "hier", 1,2,1,2,1,2,1) 
r5 <- c("5" "das", 4,3,4,3,4,3,4) 
r6 <- c("6" "die", 7,7,7,7,7,7,7) 
r7 <- c("7" "der", 2,5,4,4,5,7,6) 

所以一排就是一個字計數和每個文檔各自的字和文件的列。單詞由tdm提供,但前綴和單詞的計數和引號不是。

我希望這可以使它更清楚。