2017-05-01 31 views
0

我的基本要求是我有從OCR工具生成的文本文檔,現在我想確定哪種文檔是這種類型。護照,駕駛執照,銀行對賬單,S.S.N./Aadhar,通過編程方式通過java。任何指針/啓動器都會有所幫助。謝謝確定類型/類文檔

+0

索取建議的請求在SO上是無關緊要的。但是,您可以查看https://stats.stackexchange.com/ – Sentry

回答

0

什麼是需要的:內容解析的關鍵字與「模糊搜索」或「荒野字符」,以適應OCR可能的錯誤。這些文件很困難,肯定會包含由於背景等原因導致的OCR錯誤。搜索多個關鍵字以獲得冗餘和更寬容的分類。

如何:許多在線來源。我建議從「文本解析」的通用研究開始。