中Stata .DTA文件的一部分如果在某個地方有一個簡單的答案,請提前道歉。這似乎是這樣的事情,但我似乎無法通過搜索或谷歌搜索找到它的幫助文件。只讀R
我正在處理幾個數據集,現在有幾個GB。這足以適應我有權訪問的某個羣集節點的內存,但需要相當多的時間才能加載。對於使用這些數據的許多調試/編程活動,我不需要加載整個文件,只需要前幾千個觀測數據就可以得到一個數據集來測試代碼。我當然可以讀取整個文件和子集,但是我想知道是否有辦法告訴read.dta()
只能讀取前N行?這當然會快得多。
我也可以使用合適的格式,例如.csv,然後使用read.csv()
的nrows參數,但是我會丟失Stata數據集中的因子標籤(並且必須重新創建其他人的幾GB數據因此,直接解決.dta文件是首選。
這可能是值得您的指點stata-using-colleague在'outsheet'函數的方向上導出爲CSV。也許這個項目有點晚了,但下次你們一起工作時可能會更容易些。 http://www.ats.ucla.edu/stat/stata/faq/outsheet.htm – 2011-04-11 17:10:48