2016-11-10 54 views
1

我有訓練有素的im2txt模型(https://github.com/tensorflow/models/tree/master/im2txt)。我使用MSCOCO imageset進行培訓,因爲它是在文檔中編寫的。使用Open Images數據集重新設置im2txt模型

我想繼續使用Google Open Images Dataset進行培訓。

我想知道是否可以重新訓練im2txt模型,以及我需要做什麼準備一個新的數據集的培訓。 Google數據集和MSCOCO數據集似乎有不同的格式。

我會很感激任何幫助。

+0

打開圖片數據集鏈接:https://research.googleblog.com/2016/09/introducing-open-images-dataset.html。 – Okasanasan

+0

微軟COCO數據集鏈接http://mscoco.org/dataset/#download – Okasanasan

回答

4

儘管可能重新訓練模型,但請記住這兩個數據集帶有不同的標註語義和約定,因此要理解結果可能不是100%可比較的。

您需要使用類似於COCO script的腳本預處理數據。

有一個script在openimages發行版中提供推斷,但它確實包含解壓縮數據的代碼。

最後,如果你完成了這個工作,我們會在我們的github models頁面以拉取請求的形式開放。

+0

謝謝,drpng,我會盡力這樣做。 – Okasanasan

相關問題