0
爲了做一個關於字符識別的項目,我找到了一個我可以用作訓練集的數據庫。另一方面,即使給出了下面的說明,我也無法理解給定的格式。如何找出這種格式,我找不到進一步的幫助。瞭解這個字符數據庫格式
字段1-6以逗號分隔。源製品的
- ID號碼
- 2字節符號代碼(寫在十六進制,使用4個字節)的位圖 位圖的
- 字符寬度
- 位圖圖像的
- 字符高度,其中每個8位單位被寫爲0到255的小數
- 換行
下面附加了數據庫文件(Google驅動器)的鏈接。
https://drive.google.com/file/d/0B-WsCQkhd_1iUUtJdHg0R1hfTHM/view?usp=sharing
這將是很大的幫助,如果有人能想出這種格式呈現的方式。這實際上令我困惑。
謝謝你的迴應。但我仍然無法分解哪些列是爲什麼...比如哪一列爲高度,哪一列爲寬度,哪一列爲符號代碼等。 –
1列必須是ID。 2-3可能是一個2字符的代碼,每列1字節,3 - 高度,4 - 寬度,我無法理解的下一列,但自身位圖數據可能從第15列開始,至少所有值在該列之後的範圍從0到255,每個值中的每一位代表一個像素(可能),我不確定第5-14列的目的是什麼。 –
謝謝,高度和寬度,你的意思是第4和第5列的權利。 –