對於那些處理數據的人來說,有句話說:「如果你充分拷打數據,它會承認幾乎任何東西」。這一點在Boferroni定理的數學支持下表明,「隨着越來越多的統計測試的執行,獲得錯誤重要發現(類型I錯誤)的可能性也增加」。例如,我們知道Principles of Data Mining中給出的情況:「Leinweber(個人通信)提供了這種類型預測的一個特別幽默的例子,他幾乎完美地預測了着名的標準普爾500金融指數作爲前幾年黃油生產,奶酪生產和孟加拉國和美國 綿羊種羣的年度值的函數。「數據處理過於複雜的模型
在使用過於複雜的模型時,您是否遇到實際情況,結果是錯誤的?你能否提出這種情況,以及你使用的方法?
優秀的答案......謝謝。 – lmsasu 2009-07-30 07:44:14