2011-02-14 129 views
0

我剛剛開始使用R,我無法弄清楚如何將文件從任何其他程序轉化爲R.我嘗試了一個從Word轉到R的基本示例。我將此網站用作應該如何做到這一點的例子http://www.mayin.org/ajayshah/KB/R/html/r1.html。所以這是我輸入:將Word2007轉換爲R

一個< -read.table( 「C:\用戶\ anr28 \桌面\ x.docx」 09月= 「 」col.names = C(「 年」 ,「my1」,「my2」))

我在Microsoft Word中有一個名爲「x」的文檔,根據我電腦上的屬性菜單以docx結尾。我完全按照他們在這個例子中所做的事情來做事,但它沒有奏效。這是打印出的錯誤信息,但我不知道如何解釋它們。

Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : 
    line 1 did not have 3 elements 
In addition: Warning message: 
In read.table("C:\\Users\\anr28\\Desktop\\x.docx", sep = ",", col.names = c("year", : 
    incomplete final line found by readTableHeader on 'C:\Users\anr28\Desktop\x.docx' 

請幫幫忙,我想學習這個我自己,這是非常令人沮喪的不能夠把文件在實際學習計劃,這是我真正追求的是癥結。謝謝

+0

您正在嘗試做一些非常不尋常的事情:將文字處理器文檔導入到統計處理工具中。您引用的示例代碼僅適用於逗號分隔值或其他類似表格格式的數據。嘗試將數據導出到.csv文件並再次嘗試導入。這也可能有助於閱讀R手冊,例如:http://cran.r-project.org/doc/manuals/R-data.pdf – Andrie 2011-02-14 17:40:06

+0

Adam,我建議查看R手冊中的數據導入並在此輸出:http://cran.r-project.org/doc/manuals/R-data.pdf。您可能還想查看與Word文檔交互的R2wd軟件包。上面的問題是,R期待某種平面文件結構(在這種情況下是csv),而不是Word放在其上的任何膨脹。將該文檔重新保存爲文本文件3,並且它應該可以正常工作。 – Chase 2011-02-14 17:40:57

回答

6

read.table函數(和相關)需要一個純文本文件。 Word使用它自己的文件類型(因此是.docx擴展名),它不是純文本格式,它包含您的數據(可能是壓縮的)以及有關字體,顏色,大小和其他一些事物的信息理解。

最好的方法是用word打開文件,然後再以純文本文件的形式保存(嘗試點擊左上角的圓圈,然後選擇「另存爲」,然後選擇「其他格式」,然後在對話框中選擇「另存爲類型」的「純文本(.txt)」選項)。然後按照例子將文本文件讀入R.

0

從專有的Windows格式讀取數據到R中是沒有意義的。 R會高興地接受任何純文本格式。在你的情況,只保存爲純文本,並在閱讀

2

您發佈的鏈接是關於類似如下的文件:

1997,3.1,4 
1998,7.2,19 
1999,1.7,2 
2000,1.1,13 

用「看起來」是指如果你讀這個文件在像記事本這樣的純文本編輯器中,這就是你得到的。 一個單詞文件不是純文本。純文本文件是僅包含文本的文件(通常以.txt作爲擴展名,但這不是必需的)。 word文件是一個文件,可以按單詞打開和讀取,幷包含有關文本的信息,還包括排版,字體等等,以不可讀的機器語言編碼。您可以通過在記事本中打開單詞文檔來查看區別。

正如在其他答案中所說的,你可以將你的word文件保存爲純文本文件並保存爲「另存爲」。您也可以將excel中的數據保存爲一個純文本文件,可以在R中輕鬆讀取。

2

您可能希望使用純文本編輯器(而不是文字處理器)來輸入簡單的數據文件 - 嘗試使用notepad ++,與記事本一樣易於使用,但功能更多。

谷歌和下載它,然後輸入一些逗號分隔的數字,保存和讀入R.

有一個還內置爲R的Windows一個基本的文本編輯器,您可以使用R型和功能數據文件。