2016-09-14 89 views
3

閱讀this article關於一個使用tensorflow將黃瓜分爲九個不同類的傢伙,我想知道這種類型的過程是否可以應用於大量的類。我的想法是用它來識別樂高部件。使用張量流來識別樂高積木?

目前,像Bricklink這樣的網站描述的不止是40,000 different parts,所以它會比黃瓜的例子有點不同,但我想知道它是否聽起來合適。沒有簡單的方法可以爲每個部件獲得數百張照片,但是可以採用以下過程聲音:

  • 拍攝零件的照片;
  • 嘗試使用張量流確定零件;
  • 如果它沒有識別正確的部分,拍攝更多的圖片並將它們與神經網絡一起饋送;
  • 繼續下一部分。

這樣,每當我們遇到一件新作品時,我們都會「教」網絡的參考,以便下次更好地認識到它。像這樣,經過人類監測的數百次迭代之後,我們可以想象tensorflow能夠識別這些部分嗎?至少最常見的是?

我的問題可能聽起來很愚蠢,但我不進入神經網絡,所以任何建議都是值得歡迎的。目前我還沒有找到任何方法來識別基於圖片的樂高部分,這個「黃瓜的例子」聽起來很有希望,所以我正在尋找一些反饋。

謝謝。

+0

請記住,你把所有的部分,這至少是你可以用它來製作訓練圖像 – Eric

回答

1

你可以閱讀有關雅克Mattheij的工作,他居然使用在https://keras.io/上運行的定製版本的Xception 。

引言是Sorting 2 Metric Tons of Lego

Sorting 2 Tons of Lego, The software Side你可以閱讀:

面臨的艱鉅挑戰,以應對未來是得到訓練集大 足以讓與1000+類可能的工作。起初這個 似乎是一個不可逾越的問題。我不知道如何 足夠的圖像,並在可接受的時間手動標記他們,即使 最樂觀的計算讓我工作了6個月或更長的時間 全職爲了做一個數據集,將允許機到 與許多類的部分工作,而不僅僅是一對夫婦。

最終,解決方案在我最後一次提示之前至少在一週內注視着我: :沒關係。重要的是, 機器大多數時間標記自己的圖像,然後我需要做的所有 是正確的錯誤。隨着它變得越來越好,將會有更少的錯誤 。這非常迅速地擴大了訓練圖像的數量。 第一天我設法手工標記了大約500個零件。第二天 該機器增加了2000多個,其中約一半標記爲錯誤。 由此產生的2500個零件在下一輪 訓練3天后的基礎上,這導致4000多個零件,90%其中 被標記爲正確!所以我只需要糾正一些400部分,沖洗, 重複...因此,在兩週結束時,有一個20K圖像的數據集, 所有標記正確。

這是遠遠不夠的,一些類是嚴重不足的 所以我需要增加對這些圖像的數量,也許我會 剛剛經歷 機器運行單個批次包括什麼,但那些部分。不需要更正,它們全部標記爲 。

最近的更新是Sorting 2 Tons of Lego, Many Questions, Results


CHOLLET, François. Xception: Deep Learning with Depthwise Separable Convolutions. arXiv preprint arXiv:1610.02357, 2016.

+0

感謝亞歷山德羅的三維CAD模型,我已經錯過了這個博客帖子,他似乎說這個解決方案比Tensorflow真的更有效率,所以我會接受這個答案,因爲它似乎是最好的方式!謝謝。 – Sylvain