-1
我的電腦中有一個文件夾中有多個HTML文件。我想在R中閱讀它們,試圖儘可能保持原始格式。順便說一句,只有文字。我嘗試了兩種方法,其中錯誤地失敗了:在R中的文件夾中讀取多個本地html文件
##first approach
library (tm)
cname <- file.path("C:", "Users", "usuario", "Desktop", "DEADataset", "The Phillipines", "gazzetes.presihtml")
docs <- Corpus(DirSource(cname))
## second approach
list_files_path<- list.files(path = './gazzetes.presihtml')
a<- paste0(list_files_path, names) # vector names contain the names of the file with the .HTML extension
rawHTML <- readLines(a)
任何猜測?所有最好的
謝謝!我完全忘記了對這類案件使用「lapply」。只是爲了記錄:一旦我使用貓,我得到「炸彈」(會議中止) –
回覆:貓炸彈......可能超過了字符串字符大小的限制?當我測試這個時,我使用了兩個小的html文件 - 相對較短的字符串。 – jdbcode
呵呵貓炸彈。你是對的。 –