0

用於培訓的標籤和用於驗證的標籤是否相同?我認爲他們應該是一樣的;但是,網上可用的標籤似乎存在差異。當我從官方網站下載imagenet 2012的驗證數據標籤時,我得到的標籤以kit_fox作爲第一個標籤,與我從官方網站下載的2012年數據集驗證圖像相匹配。這是標籤的示例:https://gist.github.com/aaronpolhamus/964a4411c0906315deb9f4a3723aac57爲什麼imagenet數據集標籤中存在差異?

但是,對於幾乎所有的預訓練模型(包括Google培訓的模型),它們用於訓練的圖像網絡標籤實際上都是以tench, tinca tinca開頭。請看這裏:https://gist.github.com/yrevar/942d3a0ac09ec9e5eb3a

爲什麼會有這麼大的差異? 'tinca tinca'類標籤是從哪裏來的?

如果我們使用與實際驗證圖像相對應的第一個標籤映射,我們會面臨另一個問題:2個類(「Crane」和「maillot」)實際上是重複的,即它們具有相同的名稱,的起重機 - 機械起重機和動物起重機 - 導致在2個類中的100個圖像而不是假設的50個。如果我們不使用第一個映射,那麼對應於第二個標籤的驗證圖像的可靠來源在哪裏映射?

回答

0

我在我的微調中遇到同樣的問題。你解決了你的問題,將類tench, tinca tinca的名字改爲synset number。你可以找到here的地圖