2014-10-02 62 views
0

我正在使用接收發票中所有文本的應用程序(通過處理該發票的掃描圖像來獲取文本)。現在,因爲有幾種可用的發票格式,所以我需要對應用程序接收的格式進行分類。例如,某些格式可能包含單位數量,有些則不包含(但它們都具有總成本)。發票格式識別器

我做了一些關於解析技術的研究,但沒有找到可行的解決方案。你對這類問題有什麼建議嗎?

+0

學習使用ANTLR。 – 2015-01-09 19:09:27

回答

1

在Perl中,您可以使用Marpa,一個通用的BNF解析器 - 在BNF中描述您的發票格式,Marpa會解析您的BNF發票,參見例如。它是如何解決這個complex example與這simple code