使用張量流來識別樂高積木？

閱讀this article關於一個使用tensorflow將黃瓜分爲九個不同類的傢伙，我想知道這種類型的過程是否可以應用於大量的類。我的想法是用它來識別樂高部件。使用張量流來識別樂高積木？

目前，像Bricklink這樣的網站描述的不止是40,000 different parts，所以它會比黃瓜的例子有點不同，但我想知道它是否聽起來合適。沒有簡單的方法可以爲每個部件獲得數百張照片，但是可以採用以下過程聲音：

拍攝零件的照片;
嘗試使用張量流確定零件;
如果它沒有識別正確的部分，拍攝更多的圖片並將它們與神經網絡一起饋送;
繼續下一部分。

這樣，每當我們遇到一件新作品時，我們都會「教」網絡的參考，以便下次更好地認識到它。像這樣，經過人類監測的數百次迭代之後，我們可以想象tensorflow能夠識別這些部分嗎？至少最常見的是？

我的問題可能聽起來很愚蠢，但我不進入神經網絡，所以任何建議都是值得歡迎的。目前我還沒有找到任何方法來識別基於圖片的樂高部分，這個「黃瓜的例子」聽起來很有希望，所以我正在尋找一些反饋。

謝謝。

來源

2016-09-14 Sylvain

請記住，你把所有的部分，這至少是你可以用它來製作訓練圖像 – Eric

你可以閱讀有關雅克Mattheij的工作，他居然使用在https://keras.io/上運行的定製版本的Xception 。

引言是Sorting 2 Metric Tons of Lego。

在Sorting 2 Tons of Lego, The software Side你可以閱讀：

面臨的艱鉅挑戰，以應對未來是得到訓練集大足以讓與1000+類可能的工作。起初這個似乎是一個不可逾越的問題。我不知道如何足夠的圖像，並在可接受的時間手動標記他們，即使最樂觀的計算讓我工作了6個月或更長的時間全職爲了做一個數據集，將允許機到與許多類的部分工作，而不僅僅是一對夫婦。

最終，解決方案在我最後一次提示之前至少在一週內注視着我：：沒關係。重要的是，機器大多數時間標記自己的圖像，然後我需要做的所有是正確的錯誤。隨着它變得越來越好，將會有更少的錯誤。這非常迅速地擴大了訓練圖像的數量。第一天我設法手工標記了大約500個零件。第二天該機器增加了2000多個，其中約一半標記爲錯誤。由此產生的2500個零件在下一輪訓練3天后的基礎上，這導致4000多個零件，90％其中被標記爲正確！所以我只需要糾正一些400部分，沖洗，重複...因此，在兩週結束時，有一個20K圖像的數據集，所有標記正確。

這是遠遠不夠的，一些類是嚴重不足的所以我需要增加對這些圖像的數量，也許我會剛剛經歷機器運行單個批次包括什麼，但那些部分。不需要更正，它們全部標記爲。

最近的更新是Sorting 2 Tons of Lego, Many Questions, Results。

CHOLLET, François. Xception: Deep Learning with Depthwise Separable Convolutions. arXiv preprint arXiv:1610.02357, 2016.

來源

2017-07-11 13:44:48

感謝亞歷山德羅的三維CAD模型，我已經錯過了這個博客帖子，他似乎說這個解決方案比Tensorflow真的更有效率，所以我會接受這個答案，因爲它似乎是最好的方式！謝謝。 – Sylvain