Dalam statistika, uji normalitas digunakan untuk menentukan apakah suatu kumpulan data dimodelkan dengan baik oleh distribusi normal dan untuk menghitung seberapa besar kemungkinan variabel acak yang mendasari kumpulan data tersebut terdistribusi secara normal.
Lebih tepatnya, uji ini merupakan bentuk pemilihan model, dan dapat diinterpretasikan dengan beberapa cara, tergantung pada interpretasi probabilitas seseorang:
Dalam istilah statistika deskriptif, seseorang mengukur kesesuaian model normal dengan data. Jika kesesuaiannya buruk maka data tersebut tidak dimodelkan dengan baik dalam hal itu oleh distribusi normal, tanpa membuat penilaian pada variabel yang mendasarinya.
Dalam pengujian hipotesis statistika frequentist, data diuji terhadap hipotesis nol bahwa data tersebut terdistribusi secara normal.
Dalam statistika Bayes, kita tidak "menguji normalitas" secara harfiah, tetapi lebih tepatnya menghitung kemungkinan bahwa data berasal dari distribusi normal dengan parameter μ,σ tertentu (untuk semua μ,σ), dan membandingkannya dengan kemungkinan bahwa data berasal dari distribusi lain yang dipertimbangkan, paling sederhana menggunakan faktor Bayes (memberikan kemungkinan relatif untuk melihat data berdasarkan model yang berbeda), atau lebih halus lagi dengan mengambil distribusi prior pada kemungkinan model dan parameter, dan menghitung distribusi posterior berdasarkan kemungkinan yang dihitung.
Uji normalitas digunakan untuk menentukan apakah data sampel telah diambil dari populasi yang terdistribusi normal (dalam batas toleransi tertentu). Sejumlah uji statistika, seperti uji t Student dan analisis varians satu arah dan dua arah (ANOVA), memerlukan populasi sampel yang terdistribusi normal.
Uji frekuensi
Uji normalitas univariat meliputi:
Uji K-kuadrat D'Agostino,
Uji Jarque–Bera,
Uji Anderson–Darling,
Kriteria Cramér–von Mises,
Uji Kolmogorov–Smirnov: uji ini hanya berfungsi jika rata-rata dan varians distribusi normal diasumsikan diketahui di bawah hipotesis nol,
Uji Lilliefors: berdasarkan uji Kolmogorov–Smirnov, disesuaikan ketika juga memperkirakan rata-rata dan varians dari data,
Sebuah studi tahun 2011 menyimpulkan bahwa uji Shapiro–Wilk memiliki kekuatan terbaik untuk signifikansi tertentu, diikuti oleh Anderson–Darling ketika membandingkan uji Shapiro–Wilk, Kolmogorov–Smirnov, Lilliefors, dan Anderson–Darling.[1]
Beberapa karya yang diterbitkan merekomendasikan uji Jarque–Bera,[2][3] namun uji ini memiliki kelemahan. Secara khusus, uji ini memiliki daya uji yang rendah untuk distribusi dengan ekor pendek, terutama untuk distribusi bimodal.[4] Beberapa penulis menolak untuk memasukkan hasilnya dalam studi mereka karena kinerja keseluruhannya yang buruk.[5]
Secara historis, momen terstandarisasi ketiga dan keempat (kemiringan dan kurtosis) adalah beberapa uji normalitas paling awal. Uji Lin–Mudholkar secara khusus menargetkan alternatif asimetris.[6] Uji Jarque–Bera sendiri diturunkan dari estimasi kemiringan dan kurtosis. Uji kemiringan dan kurtosis multivariat Mardia menggeneralisasi uji momen ke kasus multivariat.[7] Statistik uji awal lainnya mencakup rasio deviasi absolut rata-rata terhadap deviasi standar dan rentang terhadap deviasi standar.[8]
Uji normalitas yang lebih baru mencakup uji energi[9] (Székely dan Rizzo) dan uji berdasarkan fungsi karakteristik empiris (ECF) (misalnya Epps dan Pulley,[10] Henze–Zirkler,[11] uji BHEP[12]). Uji energi dan ECF adalah uji yang ampuh yang berlaku untuk menguji normalitas univariat atau multivariat dan secara statistik konsisten terhadap alternatif umum.
Distribusi normal memiliki entropi tertinggi dari semua distribusi untuk deviasi standar tertentu. Ada sejumlah uji normalitas berdasarkan sifat ini, yang pertama dikaitkan dengan Vasicek.[13]
Uji Bayes
Perbedaan Kullback–Leibler antara seluruh distribusi posterior kemiringan dan varians tidak menunjukkan non-normalitas. Namun, rasio ekspektasi posterior ini dan ekspektasi rasio memberikan hasil yang mirip dengan statistik Shapiro–Wilk kecuali untuk sampel yang sangat kecil, ketika prior non-informatif digunakan.[14]
Spiegelhalter menyarankan penggunaan faktor Bayes untuk membandingkan normalitas dengan kelas alternatif distribusi yang berbeda.[15] Pendekatan ini telah diperluas oleh Farrell dan Rogers-Stewart.[16]
Penggunaan
Salah satu penggunaan uji normalitas adalah pada residual dari model regresi linear.[17] Jika residual tidak terdistribusi normal, maka residual tersebut tidak boleh digunakan dalam uji Z atau uji lain yang berasal dari distribusi normal seperti uji t, uji F, dan uji khi-kuadrat. Jika residual tidak terdistribusi normal, maka variabel dependen atau setidaknya satu variabel penjelas mungkin memiliki bentuk fungsional yang salah, atau variabel penting mungkin hilang, dan sebagainya. Memperbaiki satu atau lebih kesalahan sistematis ini dapat menghasilkan residual yang terdistribusi normal; dengan kata lain, ketidaknormalan residual seringkali merupakan kekurangan model daripada masalah data.[18]
↑Filliben, J. J. (February 1975). "The Probability Plot Correlation Coefficient Test for Normality". Technometrics. 17 (1): 111–117. doi:10.2307/1268008. JSTOR1268008.
↑Székely, G. J. and Rizzo, M. L. (2005) A new test for multivariate normality, Journal of Multivariate Analysis 93, 58–80.
↑Epps, T. W., and Pulley, L. B. (1983). A test for normality based on the empirical characteristic function. Biometrika 70, 723–726.
↑Henze, N., and Zirkler, B. (1990). A class of invariant and consistent tests for multivariate normality. Communications in Statistics – Theory and Methods 19, 3595–3617.
↑Henze, N., and Wagner, T. (1997). A new approach to the BHEP tests for multivariate normality. Journal of Multivariate Analysis 62, 1–23.
↑Vasicek, Oldrich (1976). "A Test for Normality Based on Sample Entropy". Journal of the Royal Statistical Society. Series B (Methodological). 38 (1): 54–59. JSTOR2984828.
↑Young K. D. S. (1993), "Bayesian diagnostics for checking assumptions of normality". Journal of Statistical Computation and Simulation, 47 (3–4),167–180
↑Spiegelhalter, D.J. (1980). An omnibus test for normality for small samples. Biometrika, 67, 493–496. DOI:10.1093/biomet/67.2.493
↑Farrell, P.J., Rogers-Stewart, K. (2006) "Comprehensive study of tests for normality and symmetry: extending the Spiegelhalter test". Journal of Statistical Computation and Simulation, 76(9), 803 – 816. DOI:10.1080/10629360500109023
↑Portney, Leslie Gross; Watkins, Mary P. (2000). Foundations of Clinical Research: Applications to Practice (Edisi 2nd). New Jersey: Prentice Hall. hlm.516–517. ISBN0-8385-2695-0.
Ralph B. D'Agostino (1986). "Tests for the Normal Distribution". Dalam D'Agostino, R.B.; Stephens, M.A. (ed.). Goodness-of-Fit Techniques. New York: Marcel Dekker. ISBN978-0-8247-7487-5.