我有一個任務,將一部看不見的電影評論分類爲肯定評論或否定評論。我有兩個文件夾neg和pos,每個文件夾包含1,000個文件,這些文件是已經被分類的電影評論。Python:樸素貝葉斯電影評論
到目前爲止,我所做的是加載正面評論,並且我將每個單詞與每個單詞出現的頻率一起存儲在字典中。然後我將每個單詞頻率除以正文件夾文件中的單詞總量。我對負文件夾做了同樣的事情。
我現在堅持下一步要去哪裏。最後,我將不得不加載一個看不見的評論,並確定評論是積極還是消極。我不是在尋找任何代碼,只是爲了達到這個目的我需要做下一步的工作。任何幫助大大appriciated,謝謝!
你說「我不是在尋找任何代碼,只是指導」:所以在[代碼評論](http://codereview.stackexchange.com/)上發佈你的問題 –
@LaurentLAPORTE這似乎並不像它在任何地方接近代碼審查的主題。我們應該擺脫向[代碼評論](http://codereview.stackexchange.com/tour)發送提問者的習慣。請閱讀[this](http://meta.codereview.stackexchange.com/questions/5777/a-guide-to-code-review-for-stack-overflow-users)meta post澄清。 – idjaw
這個問題對於StackOverflow來說有點寬泛。既然你現在已經有了一些你的要求,現在你還有一個你有困難的任務。我可以給出的一些建議是嘗試構建並嘗試您嘗試添加的剩餘功能。然後,收集你的困難,並將其作爲一個問題發佈在這裏。這將使它成爲主題,並更傾向於*好的*有用的答案。希望這可以幫助。祝你好運。 – idjaw