2017-05-04 66 views
1

我正在將CNTK的培訓和評估配置從Brainscript遷移到Python。由於我們的訓練數據是在map/reduce框架中創建的,因此我將圖像和標籤存儲在一個巨大的文本文件中,該文件包含base64編碼圖像作爲其中一列。這一切都運行良好,但我仍然沒有找到一種方法來做Python中的等價物。用於Python中base64編碼圖像的CNTK閱讀器

我CNTK.exe配置類似於this example configuration

deserializers = ({ 
     type = "Base64ImageDeserializer" ; module = "ImageReader" 
     file = "myFile.tsv" 
... 

所有Python示例(例如this one)使用ImageDeserializer,其從作爲單個文件的圖像的讀取。我還沒有在Python代碼cntk.io中發現任何聽起來像base64圖像解串器的東西。

如何通過Python在CNTK中使用base64編碼圖像?

一個相關的問題:Brainscript Base64ImageDeserializer接受第一列中包含序列ID的文件,這對於我們在測試時識別單個示例至關重要。我如何在Python中使用它?

回答

1

對Python的Base64反序列化器支持已合併爲主。有關示例用法,請參閱/bindings/python/cntk/io/tests/io_tests.py test_base64_image_deserializer。

關於獲取標籤 - 目前沒有簡單的方法,您可以編寫將包含ID的CNTKTextFormat。但這很麻煩,我們正在討論使這更容易。