2017-10-04 46 views
0

我正在創建機器學習模型文件,其大小可以爲幾GB。將它們簽入存儲庫需要一些時間。將這些文件存入存儲庫是否是一種好的做法?事實是,這些模型文件必須是應用程序的集成部分。謝謝你的建議。我應該檢查大型模型文件到git存儲庫嗎?

回答

1

如果你真的需要那麼版本的文件中,您最有可能正在尋找的Git LFS:https://git-lfs.github.com/

Git的大文件存儲(LFS)取代大的文件,如音頻 樣本,視頻,數據集和圖形在Git中使用文本指針, ,同時將文件內容存儲在GitHub.com或 GitHub Enterprise等遠程服務器上。

但是,如果它不改變太多,那麼也許只是讓下載

+0

Git LFS是商業嗎? – marlon

+0

看到我鏈接到的網站? –

0

還有其他的方法來做到這一點,雖然。如果模型文件真的很大(我假設神經網絡?!),另一種方法可能是使用類似於配置文件的東西,該文件指向存儲該模型的生產服務器上的特定位置。 然後,您可以手動複製模型文件(如果模型沒有每天更新),或者編寫一個腳本來爲您更新已部署的模型。 然後,您可以將配置文件存儲在git倉庫中(非常小),但您仍然可以定義特定的模型。

相關問題