3

我正在尋找一種方式,給定一個輸入圖像和一個神經網絡,它將輸出圖像中每個像素的標記類天空,草地,山地,人物,汽車等)。每像素圖像場景標記輸出問題(使用FCN-32s語義分割)

我設置了Caffe(未來分支)併成功運行了FCN-32s Fully Convolutional Semantic Segmentation on PASCAL-Context模型。但是,我無法使用它製作清晰的標籤圖片。

圖片是可視化我的問題:
輸入圖像

地面實況

我的結果:

這可能是一些解決問題。任何想法我要去哪裏錯了?

回答

5

似乎32s模型正在大步邁進,從而以粗略的分辨率工作。你可以嘗試8s model似乎執行較少的分辨率降低。
看着J Long, E Shelhamer, T Darrell Fully Convolutional Networks for Semantic Segmentation, CVPR 2015(尤其是圖4),似乎32s模型並不是爲了捕獲細分的細節而設計的。

+1

謝謝!這似乎是訣竅。我現在得到了很好的結果。 – irri

+0

@irri是否接受了由shelhamer培訓的8步模型? https://gist.github.com/shelhamer/91eece041c19ff8968ee –

+0

@Shai:你可能會回答[與「分割」和「場景標記」相比,什麼是「語義分割」?](http://stackoverflow.com/q /562769分之33947823)? –