2017-04-04 80 views
0

如果我想向現有的分類模型添加更多的訓練數據。由於標註訓練數據的成本很高,我只想將最有價值的數據標註到現有模型中。如何在張量流框架下獲得最有價值的訓練數據

例如,我們只有兩個班(A/B)在我們的分類問題,然後利用現有的模型來預測三個聯合國標號數據,並獲得概率分佈:

Data    A B 
Case 1: features -> 0.9 0.1 
Case 2: features -> 0.6 0.4 
Case 3: features -> 0.5 0.5 

案例3應該是最有價值的培訓數據,因爲當前模型不知道它屬於哪個類。這樣對嗎?如果是的話,熵應該是一個很好的指標,但我不能找到執行tf.reduce_entropytensorflow

回答

相關問題