2012-01-07 85 views
8

我開始學習如何在Python中進行數據分析。類似Python中的.rdata功能?

在R中,您可以將數據加載到內存中,然後將變量保存到.rdata文件中。

我想創建一個分析「項目」,所以我可以加載數據,存儲腳本,然後保存輸出,所以我可以回想一下,如果我需要。

Python中是否有等價的函數?

感謝

回答

11

你在找什麼是二進制序列化。 Python中最顯着的功能是pickle。如果你有一些標準的科學數據結構,你可以看看HDF5。 JSON也適用於很多對象,但它不是二進制序列化 - 它是基於文本的。

如果擴展選項,還有很多其他序列化選項。比如Google的協議緩衝區(Rprotobuf的開發者是SO上的標籤的排名最高的回覆者),Avro,Thrift等等。

雖然有通用序列化選項,如pickle.Rdat,您使用的慎重考慮將在製造I/O速度快,適合您的需求,特別是如果你需要隨機訪問,便攜性,並行訪問,工具有幫助重新使用等。例如,我現在傾向於避免.Rdat大型對象。