0
我正在使用Python進行情感分析的研究,此刻我對nltk.probability產生了一些困惑拉普拉斯估計與預期可能性估計之間的區別?
拉普拉斯估計與預期似然估計有什麼區別? 這兩種情感分析研究的適當平滑技術是什麼?
下面是從NLTK documentation定義 -
拉普拉斯估計用於生成頻率分佈上 實驗的概率分佈。所述 「拉普拉斯 估計」 近似的樣品的count Ç從 實驗概率與Ñ結果和乙倉作爲 (C + 1)/(N + B)。這相當於爲每個分箱添加一個計數,並對所得到的頻率分佈進行最大似然估計。
預期的似然估計爲概率分佈 實驗用於生成頻率分佈。所述 「期望似然估計」 近似於 樣品與計數Ç的從實驗與Ñ結果和 乙倉作爲(C + 0.5)/(N + B/2)的概率。這相當於將每個分箱的計數加0.5,並且得到最終的頻率分佈的最大似然估計。