爲什麼imagenet數據集標籤中存在差異？

用於培訓的標籤和用於驗證的標籤是否相同？我認爲他們應該是一樣的;但是，網上可用的標籤似乎存在差異。當我從官方網站下載imagenet 2012的驗證數據標籤時，我得到的標籤以kit_fox作爲第一個標籤，與我從官方網站下載的2012年數據集驗證圖像相匹配。這是標籤的示例：https://gist.github.com/aaronpolhamus/964a4411c0906315deb9f4a3723aac57 爲什麼imagenet數據集標籤中存在差異？

但是，對於幾乎所有的預訓練模型（包括Google培訓的模型），它們用於訓練的圖像網絡標籤實際上都是以tench, tinca tinca開頭。請看這裏：https://gist.github.com/yrevar/942d3a0ac09ec9e5eb3a

爲什麼會有這麼大的差異？ 'tinca tinca'類標籤是從哪裏來的？

如果我們使用與實際驗證圖像相對應的第一個標籤映射，我們會面臨另一個問題：2個類（「Crane」和「maillot」）實際上是重複的，即它們具有相同的名稱，的起重機 - 機械起重機和動物起重機 - 導致在2個類中的100個圖像而不是假設的50個。如果我們不使用第一個映射，那麼對應於第二個標籤的驗證圖像的可靠來源在哪裏映射？

來源

2017-06-27 kwotsin

我在我的微調中遇到同樣的問題。你解決了你的問題，將類tench, tinca tinca的名字改爲synset number。你可以找到here的地圖

來源

2017-07-25 00:27:09

爲什麼imagenet數據集標籤中存在差異？

回答

相關問題