2017-08-05 303 views
0

我想用合成器90k測試集評估關注ocr模型可用在http://download.tensorflow.org/models/attention_ocr_2017_05_17.tar.gz。問題是評估結果很差,報告只有0.1個字符的精度。看來,對於每個輸入圖像模型輸出與FSNS數據集的東西:tensorflow關注ocr合成器90k數據集

python eval.py --split_name test --train_log_dir attention_ocr_2017_05_17 --dataset_name synth90k --num_batches 10 
  • 彈劾:

    這裏用這個命令運行eval.py腳本時輸入和輸出值的列表:街杜Chauzou

  • 誘惑:街樂樂樂樂Tetuint劉...
  • 潛隨
  • :街德拉Ruere
  • ...

這裏有一些實現細節:

我創建tfrecord與合成器90K測試集10個例。另外,我創建了包含字符編碼的charset_synth90k.txt文件(與fsns charset_size = 134.txt相同的內容)。

這是我synth90k.py數據集文件(包括僅改變行):

DEFAULT_DATASET_DIR = os.path.join(os.path.dirname(文件), 'synth90k')

DEFAULT_CONFIG = {

'名稱': 'synth90k',

'分裂':{

'test': { 
     'size': 10, 
     'pattern': 'synth90k_test*.tfrecord' 
    } 

},

'charset_filename': 'charset_synth90k.txt',

'image_shape':(31,200,3),

'num_of_views':1,

'max_sequence_length':37,

'null_code':133,

...

}

回答

2

注意OCR模型是使用FSNS訓練集只有經過培訓,也將努力只爲看起來或多或少類似於法國的街道名稱的圖像。爲了將它應用於不同分佈的圖像,您需要使用該分佈圖像重新訓練(或至少調整)它。