2016-04-03 123 views
2

使用神經網絡估計靜止圖像或視頻流中的距離是否可行?使用神經網絡估計圖像中的距離

我有一個激光測距儀提供視頻輸出以及距離測量。但是,距離測量需要將激光照射到環境中,但這並不總是理想的或允許的。我希望可以選擇將其切換到「被動」模式,將圖像輸入到神經網絡,然後提供距離估計而無需激活激光。該網絡最初將在主動模式下在來自探測器的圖像+距離對上進行訓練。

我並不是神經網絡方面的專家,雖然Google發現神經網絡具有很多用於圖像分類和姿態估計的用途,但我找不到任何用於距離估計的現有技術。這看起來很實際嗎,還是我在浪費時間?每個N像素具有一個輸入的基本前饋網絡是否就夠了?還是我需要一個不同的體系結構?

+0

是的,這是可能的。你需要什麼樣的架構?可能是一些網絡,但這顯然是一個研究問題,需要相當的努力才能找到答案。 – lejlot

+0

所以你想估計距離任意內容的* single *圖像的距離?無論您使用哪種技術 - 該如何工作? –

回答

3

是的,這是可能的,假設你有訓練的地面實況數據。早在2006年,就有關這個問題的出版物,但使用馬爾科夫隨機場。你可以閱讀它here。最近用Convolutional Neural NetworksDeep Convolutional Neural Fields完成了。這3個例子估計圖像上每個像素的深度,因此他們需要對每個像素進行正確的測量。

如果您使用的是平面測距儀,根據您的激光分辨率,您將獲得圖像各列的正確深度。這可能意味着你需要從圖像中訓練NN的單行像素而不是完整的圖像。對於全景深度提取,人們通常會使用雙目相機或Kinect(當然,僅用於培訓)。

+0

謝謝。我不知道爲什麼我的搜索沒有出現這些文件,但這正是我所期待的。 – Cerin