2015-11-04 102 views
0

我正在使用Python進行情感分析的研究,此刻我對nltk.probability產生了一些困惑拉普拉斯估計與預期可能性估計之間的區別?

拉普拉斯估計與預期似然估計有什麼區別? 這兩種情感分析研究的適當平滑技術是什麼?

下面是從NLTK documentation定義 -

拉普拉斯估計用於生成頻率分佈上 實驗的概率分佈。所述 「拉普拉斯 估計」 近似的樣品的count Ç從 實驗概率與Ñ結果和倉作爲 (C + 1)/(N + B)。這相當於爲每個分箱添加一個計數,並對所得到的頻率分佈進行最大似然估計。

預期的似然估計爲概率分佈 實驗用於生成頻率分佈。所述 「期望似然估計」 近似於 樣品與計數Ç的從實驗與Ñ結果和 倉作爲(C + 0.5)/(N + B/2)的概率。這相當於將每個分箱的計數加0.5,並且得到最終的頻率分佈的最大似然估計。

回答

0

當存在大量未見過的可能事件時,拉普拉斯技術幾乎將所有可能性質量分配給之前未見過的數據。 ELE通過使α變小 - 0.5來補償這一點,從而將更少的數據分配給看不見的事件。

看看here瞭解更多詳情