0

我想從包裝標籤Sample Nutrient label中識別營養信息。這是一個包裝圖像,不同的品牌可能會以不同的方式標記/佈置標籤。但我知道一些事情是肯定的,佈局會有些表格,標題中的某些關鍵詞如「營養素」,以及表格的內容將具有某些常見詞語,例如能量/脂肪等。我想提取這些值文本形式並將其保存到我的數據庫。圖片中的自動文本識別(OCR)

示例圖像是一個更大問題的一部分,找到可能包含此部分'營養素標籤'的輪廓/框。

據我所知,他們有3大步。

  1. 掃描輸入圖像(產品前/後/側圖像),以尋找可能是含有這些的營養信息
  2. 回到這個輪廓我的目標輪廓和執行OCR最佳輪廓(可能保留佈局信息並不輸出1行中的所有內容)
  3. 掃描文本並查找所需的信息。

我是圖像識別的初學者。這將是一個很大的幫助,

  1. 如果我能得到我的方法反饋。例如我應該在圖像中尋找文字還是收集相似的圖像並訓練模型然後進行分類?類似於進行臉部識別。
  2. 如果有人已經解決了這個問題,那麼得到一些指針會很棒(他們沒有樂趣重新發明輪子)。
  3. 如果它的研究問題,然後相關的代碼/庫/指針/類似的SO問題,我可以參考。

這將是,如果答案是不一般的高度明顯(如進行特徵提取,我不知道什麼是特徵提取,而不是示例代碼的指針將是真棒。)

我感謝你你的時間和幫助。

感謝 Chahat

回答

0
  1. 這將需要收集足夠的培訓至少200-300圖像。

2/3。我確實解決了這個問題,但是使用的不是免費的解決方案,所以我不應該在這裏給出方向。