2013-02-17 89 views
18

閱讀了一些關於深度學習和深度信念網絡的論文後,我對它的工作原理有了一個基本概念。但仍然堅持最後一步,即分類步驟。 我在互聯網上發現的大多數實現都與世代相同。 (MNIST數字)圖像分類深度學習

是否有一些解釋(或代碼)可用的地方談論使用DBN分類圖像(最好是自然圖像或對象)?

另外一些方向上的指針將會非常有幫助。

+0

在交叉驗證:見這個問題:http://stats.stackexchange.com/a/41201/14673 – 2013-02-18 09:51:24

+0

這個問題屬於交叉驗證http://stats.stackexchange.com/questions/41029/restricted-boltzmann-機換回歸/ 41201#41201 – lejlot 2014-01-12 10:10:22

回答

24

基本思想

這些天,對圖像分類問題的狀態的最先進的深度學習(例如ImageNet)通常是「深卷積神經網絡」(深ConvNets)。他們看起來大致是這樣的ConvNet配置由Krizhevsky et alenter image description here

對於推理(分類),你喂的圖像到左側(請注意,在左側的深度爲3,對於RGB),緊縮通過一系列卷積濾波器,並在右側吐出一個1000維向量。這張圖片特別針對ImageNet,它專注於對1000種圖像進行分類,因此1000d矢量「是該圖像適合該類別的可能性的得分。」

訓練神經網絡只是稍微複雜一點。對於訓練,你基本上是反覆運行分類,並且每經常進行一次反向傳播(參見Andrew Ng的講座)以改進網絡中的卷積濾波器。基本上,反向傳播問「網絡分類正確/錯誤的分類是什麼?對於錯誤分類的東西,讓我們稍微修復一下網絡。」


實施

Caffe深卷積神經網絡的速度非常快的開源實現(快於cuda-convnet從Krizhevsky等)。 Caffe代碼很容易閱讀;基本上每種網絡層都有一個C++文件(例如卷積層,最大池層等)。

2

現在人們開始在分類層中使用SVM。

深度學習是非常自由和廣泛的發展。