我想用合成器90k測試集評估關注ocr模型可用在http://download.tensorflow.org/models/attention_ocr_2017_05_17.tar.gz。問題是評估結果很差,報告只有0.1個字符的精度。看來,對於每個輸入圖像模型輸出與FSNS數據集的東西:tensorflow關注ocr合成器90k數據集
python eval.py --split_name test --train_log_dir attention_ocr_2017_05_17 --dataset_name synth90k --num_batches 10
- 彈劾:
這裏用這個命令運行eval.py腳本時輸入和輸出值的列表:街杜Chauzou
- 誘惑:街樂樂樂樂Tetuint劉... 潛隨
- :街德拉Ruere
- ...
這裏有一些實現細節:
我創建tfrecord與合成器90K測試集10個例。另外,我創建了包含字符編碼的charset_synth90k.txt文件(與fsns charset_size = 134.txt相同的內容)。
這是我synth90k.py數據集文件(包括僅改變行):
DEFAULT_DATASET_DIR = os.path.join(os.path.dirname(文件), 'synth90k')
DEFAULT_CONFIG = {
'名稱': 'synth90k',
'分裂':{
'test': { 'size': 10, 'pattern': 'synth90k_test*.tfrecord' }
},
'charset_filename': 'charset_synth90k.txt',
'image_shape':(31,200,3),
'num_of_views':1,
'max_sequence_length':37,
'null_code':133,
...
}