2017-09-03 147 views
0

我正在嘗試實現卷積神經網絡(CNN)模型來分類手勢。數據集不是現成的,因此我需要準備它。爲卷積神經網絡準備數據集

我應該如何準備數據集?我拍攝的圖像是否應該包含手或除手之外的物體?哪個會給我一個準確的模型,可以準確的工作,儘管背景和框架中的其他物體?

回答

1

這裏有一個例子: http://cims.nyu.edu/~tompson/NYU_Hand_Pose_Dataset.htm

它包含其他圖像將僅僅意味着你必須實現東西你的管道隔離手。我會建議在圖像中只有手,這樣您就可以立即開始對圖像進行建模。

很多cnn在這方面的架構使用多分辨率的CNNs。所以在您的數據準備中只需製作多個分辨率並輸入到多輸入CNN。你可以使用Keras功能性API做到這一點。低分辨率圖像很適合區分某些非常不同的姿勢,較高的分辨率可以關注較小的差異。

很明顯,標準數據增加並不適合手勢。像鏡像或更改角度等內容可能會使您的數據不適合給定的標籤。所以如果你沒有那麼多,那麼對你的數據增加要保守一點。