tensorflow關注ocr合成器90k數據集

我想用合成器90k測試集評估關注ocr模型可用在http://download.tensorflow.org/models/attention_ocr_2017_05_17.tar.gz。問題是評估結果很差，報告只有0.1個字符的精度。看來，對於每個輸入圖像模型輸出與FSNS數據集的東西：tensorflow關注ocr合成器90k數據集

python eval.py --split_name test --train_log_dir attention_ocr_2017_05_17 --dataset_name synth90k --num_batches 10

彈劾：

這裏用這個命令運行eval.py腳本時輸入和輸出值的列表：街杜Chauzou
誘惑：街樂樂樂樂Tetuint劉...
：街德拉Ruere
...

這裏有一些實現細節：

我創建tfrecord與合成器90K測試集10個例。另外，我創建了包含字符編碼的charset_synth90k.txt文件（與fsns charset_size = 134.txt相同的內容）。

這是我synth90k.py數據集文件（包括僅改變行）：

DEFAULT_DATASET_DIR = os.path.join（os.path.dirname（文件）， 'synth90k'）

DEFAULT_CONFIG = {

'名稱'： 'synth90k'，

'分裂'：{
'test': { 
     'size': 10, 
     'pattern': 'synth90k_test*.tfrecord' 
    } 
}，

'charset_filename'： 'charset_synth90k.txt'，

'image_shape'：（31，200，3），

'num_of_views'：1，

'max_sequence_length'：37，

'null_code'：133，

...

}

來源

2017-08-05 Antonio Simunovic

注意OCR模型是使用FSNS訓練集只有經過培訓，也將努力只爲看起來或多或少類似於法國的街道名稱的圖像。爲了將它應用於不同分佈的圖像，您需要使用該分佈圖像重新訓練（或至少調整）它。

來源

2017-08-07 17:01:07

tensorflow關注ocr合成器90k數據集

回答

相關問題