Python中用於數字識別的最簡單的方法

-1

我有一個簡單的數字識別項目，並且注意到人們在Python中這樣做時通常使用兩種方法。我的目標是輸入一個PDF文檔，並在頁面的特定位置獲取手寫數字。Python中用於數字識別的最簡單的方法

我看到人們使用opencv，如this問題，或者scikitlearn，如在this示例中所見。我對這兩者都不熟悉，並且想知道根據我的預期用法，哪一種方法最容易學習和實施。謝謝。

2017-03-09 splinter

你是什麼意思「獲取數字」？通常，您可以使用任何pdf閱讀工具（pdfminer等），打開它並使用正則表達式來查找您的數字，如果這就是您所指的。考慮到你提到了scikit，我認爲你不打算這麼做。 – nir0s

scikit-learn示例不解決同樣的問題！（對預處理和裁剪的數字進行分類！=查找數字）。 – sascha

我總是推薦scikit-learn，它更健壯，並且有許多功能可以幫助您處理大型數據集。要獲取數字，請根據像素位置裁剪數字，然後將它們輸入機器學習算法。你打算使用什麼？ – JahKnows

我建議你應該同時使用opencv和scikitlearn。將PDF轉換爲圖像後，可以使用opencv進行圖像預處理（高斯模糊，閾值處理，侵蝕/膨脹濾波器），以便數字更容易提取。然後您可以使用輪廓跟蹤（再次opencv）來檢測單個數字。提取數字後（並且假設您有一套訓練集），您可以使用scikitlearn進行分類。

來源

2017-03-10 00:30:35 GStav

謝謝，這很有用。我沒有訓練集。有什麼地方可以找到通用訓練組數字嗎？ – splinter

據我所知，最着名的手寫數字訓練集是[MNIST]（http://yann.lecun.com/exdb/mnist/）。 – GStav

Python中用於數字識別的最簡單的方法

回答

相關問題