2017-06-03 125 views
0

我想用簡單的tf.contrib.learn.LinearRegressor開始使用TensorFlow。我的數據集是一個時間序列,我希望使用T-n, ..., T-1作爲特徵的步驟以及T-0作爲標籤。所有的值都是浮點數,所以當然我想我會把每個時間步轉換爲real_valued_column特性。Tensorflow:具有多個特徵列和具有多個維度的一個特徵列之間有什麼區別?

但是,這些列具有dimension=屬性,並且在TF網站上的Iris數據集的示例中,具有四維的單列作爲特徵。我原以爲這裏的每一個屬性(萼片寬度/長度,花瓣寬度/長度)都應該成爲它自己的特徵,因此它是自己的real_valued_column。我的理解錯了嗎?這些方法有什麼區別?

回答

0

每朵花都由其四個屬性來表示,所以你的特徵矩陣的確有4列。但是爲了訓練分類器,你不能單獨獲取每個特徵,因爲它們可能與花屬於的類相關因此維度被設置爲維度= 4。將real_valued_column作爲一組列(它們的數量是維度)來構思特徵矩陣。

+0

你有一個鏈接,更詳細地解釋這一點?我並不是真的意識到特徵的數量和維度之間存在差異,我會認爲一個特徵==訓練樣本的一個維度。 – user8793

+0

功能和尺寸數量沒有區別。如果您有4列,則有4個功能,因此尺寸= 4,正如我所說的。唯一的辦法可能會變得更復雜一點是,如果每個特徵由具有其自己的維度的向量表示。除非是這種情況,特徵=維度。 – Laxius

相關問題