2017-03-09 67 views
-1

我有一個簡單的數字識別項目,並且注意到人們在Python中這樣做時通常使用兩種方法。我的目標是輸入一個PDF文檔,並在頁面的特定位置獲取手寫數字。Python中用於數字識別的最簡單的方法

我看到人們使用opencv,如this問題,或者scikitlearn,如在this示例中所見。我對這兩者都不熟悉,並且想知道根據我的預期用法,哪一種方法最容易學習和實施。謝謝。

+0

你是什麼意思「獲取數字」?通常,您可以使用任何pdf閱讀工具(pdfminer等),打開它並使用正則表達式來查找您的數字,如果這就是您所指的。考慮到你提到了scikit,我認爲你不打算這麼做。 – nir0s

+0

scikit-learn示例不解決同樣的問題! (對預處理和裁剪的數字進行分類!=查找數字)。 – sascha

+0

我總是推薦scikit-learn,它更健壯,並且有許多功能可以幫助您處理大型數據集。要獲取數字,請根據像素位置裁剪數字,然後將它們輸入機器學習算法。你打算使用什麼? – JahKnows

回答

1

我建議你應該同時使用opencvscikitlearn。將PDF轉換爲圖像後,可以使用opencv進行圖像預處理(高斯模糊,閾值處理,侵蝕/膨脹濾波器),以便數字更容易提取。然後您可以使用輪廓跟蹤(再次opencv)來檢測單個數字。提取數字後(並且假設您有一套訓練集),您可以使用scikitlearn進行分類。

+0

謝謝,這很有用。我沒有訓練集。有什麼地方可以找到通用訓練組數字嗎? – splinter

+0

據我所知,最着名的手寫數字訓練集是[MNIST](http://yann.lecun.com/exdb/mnist/)。 – GStav