2014-09-01 127 views
0

我的目標是認識上的航空照片建築物的足跡。聽說機器視覺方面的最新進展(ImageNet大規模視覺識別挑戰),儘管我可以(至少)嘗試使用神經網絡來完成這項任務。神經網絡拓撲

有人可以告訴我這個網絡的拓撲結構應該是什麼?我想它應該具有與輸入一樣多的輸出(這意味着圖片中的所有像素),因爲我想通過它們(至少近似)在圖片上的位置來識別建築物的輪廓。我猜輸入圖片應該是標準尺寸,每個像素歸一化爲灰度或YUV顏色空間(每種顏色1個值),也許標準化的分辨率(每個像素應該代表實際的固定尺寸)。我不確定圖片是否可以在輸入到網絡之前以任何其他方式進行預處理,也許通過首先提取邊緣?

棘手的部分是應該如何表示輸出以及如何訓練網絡。僅使用例如對於建築物佔地面積內的像素輸出= 0,對於其外部的像素輸出1,可能不是最好的想法。也許我應該教網絡識別建築物的邊緣,所以表示建築物邊緣的像素對於其餘像素應該有1和0。

任何人都可以提出有關網絡拓撲/輸入/輸出格式的建議嗎? 或者也許這個任務是絕望的困難,我有0個機會解決它?

+0

這是一項艱鉅的任務。我嘗試用OpenCV和MATLAB分類器級聯檢測航拍圖像中的建築物,但效果不佳。我也嘗試使用Neuroph,並且它是Encog?但它再次工作得不好。我建議你先成功地訓練一個可以識別'這個圖像是建築物'或'這個圖像不是建築物'的網絡(圖像應該被剪裁到建築物)。 這可以讓你更好地開始艱鉅的任務。您還可以比較哪一種可以獲得更好的結果:識別邊緣檢測圖像或顏色。 – PawelP 2014-09-05 18:26:35

回答

0

我認爲我們需要「建築物」的一個更好的定義。如果您想要建立「檢測」,即檢測到任何形狀/大小的建築物的存在,對於級聯分類器來說這是困難的。不過,您可以嘗試以下操作:

  1. 將一組已知圖像分區爲固定大小的塊。
  2. 標籤的每個塊爲「建築物」,「未建立」,或 「邊界(包括部分兩者的 )」
  3. 提取基本功能,如強度的直方圖,邊緣, 霍夫線,HOG等

  4. 基於這些功能訓練SVM分類器(您也可以嘗試其他功能,但我推薦SVM的經驗)。

現在你可以再次分割你的圖像,並使用訓練過的分類器來獲得結果。結果必須結合起來才能識別建築物。

這仍然需要一些測試來獲取參數(直方圖的大小,SVM分類器的參數等)。

我已經使用這種方法來檢測圖像上的「食物」區域。準確度低於70%,但我的猜測是這對建築物會更好。