研究人員如何處理不完美正態分布的數據?他們是否對適用于正態分布的數據使用統計方法,然后確認結果可能不是很準確?
數據本身很少需要正常分布才能構建有用的模型。
相反,經典統計所依賴的是中心極限定理,這說明了關于分配的一些事情平均許多觀察結果(以及回歸模型中各種數量的分布,如系數)。
即使我們自己處理數據而不是平均值,我們仍然可以使用正態性。回想一下,回歸模型告訴你意思一組數據點,而點本身是正態分布的周圍這意味著。舉一個非常簡單的例子,這是一個雙峰分布:

數據本身顯然不是正常分布的。然而,這可能代表兩組,一組平均值約為-2,另一組平均值約為1.5。如果我們有一個二進制變量來告訴你從哪個組中抽取數據點 - 稱之為“G” - 我們可以寫一個模型說:
Y = beta * G +錯誤
這其實很簡單單因素方差分析模型,所有它的說法是錯誤通常是分布式的,而不是數據本身。
本站所有相關知識僅供大家參考、學習之用,部分來源于互聯網,其版權均歸原作者及網站所有,如無意侵犯您的權利,請與小編聯系,我們將會在第一時間核實并給予反饋。



















