分割文件並將數據傳遞給其他類

在我當前的項目中，我有很多不同格式的二進制文件。其中有幾個作爲簡單的檔案，因此我試圖想出一個很好的方法將提取的文件數據傳遞給其他類。分割文件並將數據傳遞給其他類

這是我目前的做法的一個簡單的例子：

class Archive { 
    private: 
     std::istream &fs; 
     void Read(); 
    public: 
     Archive(std::istream &fs); // Calls Read() automatically 
     ~Archive(); 
     const char* Get(int archiveIndex); 
     size_t GetSize(int archiveIndex); 
}; 

class FileFormat { 
    private: 
     std::istream &fs; 
     void Read(); 
    public: 
     FileFormat(std::istream &fs); // Calls Read() automatically 
     ~FileFormat(); 
};

存檔類基本分析存檔和讀取存儲的文件到char指針。爲了從Archive加載第FileFormat文件，我將目前使用下面的代碼：（請注意，在存檔一些文件可能有其他的檔案，但不同的格式）

std::ifstream fs("somearchive.arc", std::ios::binary); 
Archive arc(fs); 
std::istringstream ss(std::string(arc.Get(0), arc.GetSize(0)), std::ios::binary); 
FileFormat ff(ss);

讀取二進制數據時，我使用了一個BinaryReader類的功能，如這些：

BinaryReader::BinaryReader(std::istream &fs) : fs(fs) { 
} 

char* BinaryReader::ReadBytes(unsigned int n) { 
    char* buffer = new char[n]; 
    fs.read(buffer, n); 
    return buffer; 
} 

unsigned int BinaryReader::ReadUInt32() { 
    unsigned int buffer; 
    fs.read((char*)&buffer, sizeof(unsigned int)); 
    return buffer; 
}

我喜歡這種方法的簡單，但我目前有很多內存兒的掙扎rors和SIGSEGVs，我擔心這是因爲這種方法。一個例子是當我在一個循環中重複創建和讀取一個檔案時。它適用於大量迭代，但過了一段時間，它開始讀取垃圾數據。

我對你的問題是，如果這種方法是可行的（在這種情況下，我問我做錯了什麼），如果不是，有什麼更好的方法嗎？

來源

2012-01-05 Merigrim

你沒有顯示存檔類的實現，我認爲用std :: ios :: binary打開istream？ – Benj 2012-01-05 17:32:55

我在這裏寫的代碼中忘記了std :: ios :: binary，但它在我的版本中。 istream是從ifstream構建的，並且該流用std :: ios :: binary打開，如上所示。 – Merigrim 2012-01-05 18:22:32

在OP中的代碼缺陷是：

您分配堆內存，並從你的函數中返回一個指針。這可能會導致內存泄漏。你沒有泄漏問題（現在），但是在設計你的課程時你必須記住這些東西。
處理Archive和FileFormat類時，用戶始終必須考慮到存檔的內部結構。基本上它會影響數據封裝的想法。

當你的類框架的用戶創建一個存檔對象時，他只是得到一個方法來提取一些原始數據的指針。然後用戶必須將這些原始數據傳遞給完全獨立的類。你也將有不止一種FileFormat。即使不需要注意處理這種系統的泄漏堆分配，也會非常容易出錯。

讓我們嘗試將一些面向對象的原則應用於任務。您的存檔對象是不同格式文件的容器。因此，存檔的等價得到（）一般應返回文件對象，而不是一個指向原始數據：

//We gonna need a way to store file type in your archive index 
enum TFileType { BYTE_FILE, UINT32_FILE, /*...*/ } 

class BaseFile { 
public: 
virtual TFileType GetFileType() const = 0; 
/* Your abstract interface here */ 
}; 

class ByteFile : public BaseFile { 
public: 
ByteFile(istream &fs); 
virtual ~ByteFile(); 
virtual TFileType GetFileType() const 
{ return BYTE_FILE; } 
unsigned char GetByte(size_t index); 
protected: 
/* implementation of data storage and reading procedures */ 
}; 

class UInt32File : public BaseFile { 
public: 
UInt32File(istream &fs); 
virtual ~UInt32File(); 
virtual TFileType GetFileType() const 
{ return UINT32_FILE; } 
uint32_t GetUInt32(size_t index); 
protected: 
/* implementation of data storage and reading procedures */ 
}; 


class Archive { 
public: 
Archive(const char* filename); 
~Archive(); 
BaseFile* Get(int archiveIndex); 
{ return (m_Files.at(archiveIndex)); } 
/* ... */ 
protected: 
vector<BaseFile*> m_Files; 
} 

Archive::Archive(const char* filename) 
{ 
    ifstream fs(filename); 

    //Here we need to: 
    //1. Read archive index 
    //2. For each file in index do something like: 
    switch(CurrentFileType) { 
    case BYTE_FILE: 
      m_Files.push_back(new ByteFile(fs)); 
      break; 
    case UINT32_FILE: 
      m_Files.push_back(new UInt32File(fs)); 
      break; 
    //..... 
    } 
} 

Archive::~Archive() 
{ 
    for(size_t i = 0; i < m_Files.size(); ++i) 
     delete m_Files[i]; 
} 

int main(int argc, char** argv) 
{ 
    Archive arch("somearchive.arc"); 
    BaseFile* pbf; 
    ByteFile* pByteFile; 

    pbf = arch.Get(0); 

    //Here we can use GetFileType() or typeid to make a proper cast 
    //An example of former: 

    switch (pbf.GetFileType()) { 
    case BYTE_FILE: 
     pByteFile = dynamic_cast<ByteFile*>(pbf); 
     ASSERT(pByteFile != 0); 
     //Working with byte data 
     break; 
    /*...*/ 
    } 

    //alternatively you may omit GetFileType() and rely solely on C++ 
    //typeid-related stuff 

}

那只是可以簡化您的應用程序檔案的使用類的一個總體思路。

請記住，良好的類設計可以幫助您防止內存泄漏，代碼澄清等。但是，無論你有什麼類，你仍然會處理二進制數據存儲問題。例如，如果您的存檔存儲了64字節的字節數據和8個uint32，並且您以某種方式讀取了65個字節而不是64個字節，則讀取以下整數將會給您帶來垃圾。您可能還會遇到對齊和排序問題（如果您的應用程序應該在多個平臺上運行，則後者非常重要）。儘管如此，良好的課堂設計可能會幫助您制定更好的代碼來解決這些問題。

來源

2012-01-05 17:21:05

我真的很喜歡這種方法！一旦我嘗試了，我會再次寫在這裏，如果它的工作，我會接受你的答案。 – Merigrim 2012-01-05 18:28:54

雖然實施這個我有一個問題，但。如果我不想在需要時將數據讀入內存，該怎麼辦？例如，如果我有兩個文件的存檔，現在需要一個，但另一個只在極少數情況下需要。這種系統很容易做到嗎？這不是一個可怕的記憶開銷，但它可能在以後很重要。 – Merigrim 2012-01-05 19:01:42

另一個問題：將ifstream傳遞給文件類會使文件中的絕對搜索變得困難。我是否必須用它們各自的偏移量初始化它們，以便它們可以執行fs.seekg（offset + x）還是有更好的方法？ – Merigrim 2012-01-05 21:46:48

這是要求麻煩從你的函數傳遞一個指針，並希望用戶知道要刪除它，除非函數名稱很明顯這樣做，例如，一個以單詞create開頭的函數。

所以

Foo * createFoo();

很可能是創建一個對象，用戶必須刪除的功能。

對於初學者來說，一個優選的解決方案是返回std::vector<char>或允許用戶將std::vector<char> &傳遞給函數，並且將字節寫入其中，並在必要時設置其大小。（如果在可以重複使用相同緩衝區的地方進行多次讀取，這會更有效）。

你還應該學習const正確性。

至於你的「一段時間後它填滿垃圾」，你在哪裏檢查文件的結尾？

來源

2012-01-05 15:45:46 CashCow

我正在研究你現在寫的東西。至於垃圾數據，在讀取檔案時（讀取文件入口並使用seekg（偏移量），讀取指定長度的數據，然後看到kg（orig_pos）），EOF永遠不會到達。當我創建一個歸檔對象（因此將文件讀入內存）並在之後立即刪除它時，問題就出現了。請注意，在此過程中沒有（明顯的）內存泄漏。 – Merigrim 2012-01-05 15:56:25

這並不是壞建議，但它不太可能幫助OP解決他們原來的問題。同時返回一個向量只是在C++ 11中的好建議，其中移動構造將使其成爲高效操作。在向量中傳遞的另一種選擇將是任何C++實現中的一個很好的選擇。 – Benj 2012-01-05 17:26:47

很難看到OP的實際問題，我猜想任何內存問題可能都是由於必須進行太多的內存管理而產生的，並且在沒有任何先前知識的情況下，垃圾結果可能來自分配緩衝區，但未能讀取字節（如果已經達到EOF）。 – CashCow 2012-01-05 18:43:42

分割文件並將數據傳遞給其他類

回答

相關問題