2015-08-03 25 views
1

我是一個完整的初學者,通常也是字符識別和機器學習。如何獲取中文字符的分解

我想要寫的程序,其能夠處理以下輸入:

  • 甲中國字符(矢量格式的任一像素),例如:

enter image description here

enter image description hereenter image description here以及它們水平對齊的信息。

中文字符的分解總是3件事:2個其他字符和描述2字符如何形成初始字符的模式(它被稱爲合成類型)。在上面的例子中,組合類型是「水平對齊」。

給出這樣的輸入,我希望我的程序知道哪些像素或初始字符中的哪些輪廓屬於其分解中的哪個子字符。

從哪裏開始?

回答

2

好了,我不能說我提供一個完整的答案,但想想:

1)閱讀谷歌如何翻譯應用工作的文件。您知道,當您將iPhone的相機對準文字時,它會立即翻譯文本(甚至保留字體!)。它支持chineese語言,所以它會很有趣,你看他們是否解決了類似的任務,他們是如何做到的

2)另一個大問題要回答 - 如何準備輸入數據。您至少需要提供一些輸入數據 - 即分解至少一些字符。嘗試爲幾個字符手動執行此操作,並嘗試正式確定您正在執行的操作 - 這將幫助您更好地制定出您希望算法執行的操作。

3)嘗試使用一些深層神經網絡來處理來自#2的數據。使用卷積圖層。用RBM(限制玻爾茲曼機器)進行預訓練。之後 - 只需仔細查看所得到的神經網絡。不要指望得到任何好的結果,但看着ANN層將幫助你瞭解網絡從數據中學到了什麼,並可能提供一些有關下一步移動的信息

+0

感謝您讓我走上正軌!作爲輸入數據,我已經有20'000個字符並且分解了它們中的每一個。你提供給我的提示看起來非常令人興奮,我會研究它! – Brainless

+1

@Brainless酷。爲了幫助你,這裏是一個簡單的教程深入神經網絡圖像處理一個很酷的工具 - nolearn(千層麪)庫。如果您想開始對ANN進行調查,您可以使用它。他們解決了完全不同的任務,但至少有一些代碼向你展示瞭如何使用這個庫以及不同圖層的基本描述:danielnouri.org/notes/2014/12/17/using-convolutional-neural-nets-to-檢測面部-關鍵點教程/ –