2015-10-16 42 views
1

我有時間序列數據的分類問題。用時間序列實現在線學習

每個示例具有被以不規則的間隔測量,並且在結束時的對象被分類爲2個可能的類(二元分類)的1 10個變量。

我只有最後一類的例子,從訓練中學習。但是,當給出一個新的例子,我想在每個時間戳(以在線方式)進行預測。所以,如果新的例子有25次測量,我想對它的類別做25次預測;每個時間戳一個。

我實現這個目前是使用最小的方式,意味着其10個變量,直到該點的測量值的最大值作爲特徵進行分類。這是最佳嗎?什麼會是更好的方法。

回答

1

如果你有在每個時間戳進行預測,那麼這不會成爲AA時間序列問題(除非你打算使用以前的觀測序列,使你的下一個預測,在這種情況下,你需要訓練基於序列的模型)。假設你只能根據你觀察到的最終數據訓練一個模型,可以有很多方法,但是我建議你在每棵樹中使用具有大量樹木和3或4個變量的隨機森林。這種方式即使有些變量不能給你想要的輸入,其他樹仍然可以做出相當準確的預測。除此之外,還有許多合奏方法。

目前工作可能是一個非常鬆散的逼近和現實,但並沒有太大的統計意義的方式。

+0

因此,時間序列嚴格*根據以前的值預測下一個值*? –

+0

假設我使用每個數據點的最後一類來訓練RF,當我希望預測一個新的例子的類時,我輸入了RF的哪些特徵用於分類,其10個變量的測量的最小值,平均值和最大值,直到點? –

+0

集合方法的想法是你不使用所有變量來創建單個模型,而是使多個模型起訴變量的幾個小子集......所以當你有一些數據時,你的一些變量隨時間波動由於噪音,多種模式的組合可以幫助您更準確地預測數值 – Gaurav