2016-01-20 95 views
4

我在R中建模聲明頻率(poisson distr)。我使用的是gbmxgboost包,但似乎xgboost沒有用於考慮曝光的偏移參數?xgboost,抵消風險?

gbm,一個將採取曝光考慮如下:

gbm.fit(x = train,y = target, n.trees = 100,distribution = "poisson", offset = log(exposure)) 

如何實現與`xgboost一樣嗎?

PS:我無法將曝光度用作預測因子,因爲每次觀察到聲明時都會創建新的obs。

+0

setinfo(xgtrain, "base_margin", log(d$exposure)) 

您可以從類似的問題,我在這裏問看到完整的例子如果你發佈了一些數據,我會採取一些措施。 (但經過一段時間的睡眠)。有兩種不同的泊松迴歸公式可用於glm,只有其中一個需要偏移量。也許這也將在gbm和/或xboost中起作用。 –

回答

0

通過曝光標準化您的計數並將曝光用作重量。有關更多詳細信息,請參閱this答案。