目前,我使用默認64作爲seq2seq tensorflow模型的批量大小。什麼是最大批量大小,圖層大小等,我可以與一個單一的Titan X GPU與12GB RAM和Haswell-E xeon 128GB RAM一起使用。輸入數據被轉換爲嵌入。以下是我使用的一些有用的參數,它看上去細胞輸入尺寸爲1024:如何確定seq2seq張量流RNN訓練模型的最大批量大小
encoder_inputs: a list of 2D Tensors [batch_size x cell.input_size].
decoder_inputs: a list of 2D Tensors [batch_size x cell.input_size].
tf.app.flags.DEFINE_integer("size", 1024, "Size of each model layer.")
因此,基於我的硬件什麼是最大批量大小,層,輸入大小我能去嗎?目前GPU顯示佔用了99%的內存。
目前GPU顯示99%的內存被上面的配置佔用。 – stackit
@stackit我發現TF'佔據'整個GPU,即使它沒有將它全部用於計算......如果你的模型超出了GPU內存限制,那麼它會拋出一個錯誤,所以你可以找出你的最大模型大小通過試驗和錯誤。 – j314erre