2016-03-02 152 views
0

我有一個帶有整數表示字符的向量的文本文件。該文本文件是這樣的:R從文本文件中導入int編碼字的向量

x<-c(intToUtf8(c(105,110,100,105,118,105,100,117,117,109)), intToUtf8(c(101,105,110,122,101,108,112,101,114,115,111,110)),...) 

使用它們R I複製內容的文本文件,並將其粘貼在R和當我想看到的值「X」它給了我:

[1] word1 word2 

現在我的文本文件包含9000個字,當我複製粘貼時,需要很長時間才能將所有單詞加載到R中,並且在穿過新行時總會出現錯誤。

所以我嘗試:

x <- readLines("text.txt") 
y <- c(x) 
y 
[1] "intToUtf8(c(105,110,100,105,118,105,100,117,117,109)),intToUtf8(c(101,105,110,122,101,108,112,101,114,115,111,110))" 

正如你所看到的結果不是我所需要的。

我也試着用read.table()給它加上一個表,只有一個元素在位置[1,「V1」],然後使用該元素,但它也沒有工作。

如何將單詞載入到R中?我不想和我複製粘貼時一樣的結果。

謝謝。

回答

0

你可以做

y <- "intToUtf8(c(105,110,100,105,118,105,100,117,117,109)),intToUtf8(c(101,105,110,122,101,108,112,101,114,115,111,110))" 
x <- strsplit(y, "(?<=\\)\\)),", perl=TRUE)[[1]] 
unname(sapply(x, function(str) eval(parse(text=str)))) 
# [1] "individuum" "einzelperson" 
+0

這是非常密切的,我需要給X只出現前的值:「individuum」「einzelperson」 ......我怎麼能做到這一點@lukeA? – mitko993

+0

你可以用'unname'來包裝它以得到一個未命名的矢量 - 請參閱我的編輯 – lukeA

+0

謝謝你這是我需要的答案 – mitko993