2017-04-03 96 views
1

我對CNTK很新穎。 我想用CNTK-ResNet/Fast-R CNN訓練一組圖像(用於檢測酒精杯/酒瓶等物體)。使用CNTK進行對象檢測

我想從GitHub下面的文檔;但是,這似乎並不是一個簡單的過程。 https://github.com/Microsoft/CNTK/wiki/Object-Detection-using-Fast-R-CNN

我找不到合適的文檔來爲具有不同大小和形狀的圖像生成ROI。以及如何基於訓練好的模型創建對象標籤?有人可以指出一個適當的文檔或培訓鏈接,使用我可以在cntk模型上工作嗎?請參閱附加的圖像,我可以在腳本中加載具有默認ROI的示例圖像。如何正確設置尺寸並在圖像中標註對象?提前致謝!

sample image loaded for training

回答

0

不知道你的意思是正確的文件。這是本文的實施(https://arxiv.org/pdf/1504.08083.pdf)。看起來你正在努力產生投資回報率。您可以通過輔助功能看起來在現場記錄來分析你可能需要的東西:

要運行的玩具例子,確保在PARAMETERS.py的數據集名稱設置爲「雜貨店」。

  • 運行A1_GenerateInputROIs.py生成用於訓練和測試輸入的ROI。

  • 運行A2_RunCntk_py3.py使用CNTK Python API訓練Fast R-CNN模型並計算測試結果。

的ALGO將工作在幾個候選區,然後生成輸出:一個用於對象的類和另外一個,生成用於屬於這些類別中的對象的邊界框。請參閱代碼以獲取實施細節。

0

有人可以指出一個適當的文檔或培訓鏈接使用我可以在cntk模型上工作嗎?

你可以看看my repository on GitHub

它將引導您完成所有需要的步驟,以培訓您自己的CNTK對象檢測和分類模型。

但在短期適當的步驟應該是這個樣子:

  1. 安裝環境
  2. 準備數據
  3. 標籤圖像(地面實況)
  4. 下載預訓練的模式,創建映射爲您定製數據集
  5. 運行訓練
  6. 評估測試儀上的模型