dengan tanda kurung yang mengapit indeks subskrip i adalah statistika urutan ke-i, yaitu angka terkecil ke-i dalam sampel (jangan dikacaukan dengan ).
adalah rata-rata sampel.
Koefisien diberikan oleh:[1], di mana C adalah norma vektor:[2] dan vektor m,
terdiri dari nilai harapan statistika urutan variabel acak independen dan terdistribusi identik yang diambil sampelnya dari distribusi normal standar; akhirnya, adalah matriks kovariansi dari statistika urutan normal tersebut.[3]
Tidak ada nama untuk distribusi . Nilai batas untuk statistika dihitung melalui simulasi Monte Carlo.[2]
Interpretasi
Hipotesis nol dari uji ini adalah bahwa populasi berdistribusi normal. Jika nilai p kurang dari tingkat alfa yang dipilih, maka hipotesis nol ditolak dan ada bukti bahwa data yang diuji tidak berdistribusi normal.[4]
Seperti kebanyakan uji signifikansi statistika, jika ukuran sampel cukup besar, uji ini dapat mendeteksi bahkan penyimpangan kecil dari hipotesis nol (yaitu, meskipun mungkin ada beberapa efek yang signifikan secara statistika, efek tersebut mungkin terlalu kecil untuk memiliki signifikansi praktis); oleh karena itu, investigasi tambahan terhadap "ukuran efek" biasanya disarankan, misalnya, plot Q–Q dalam kasus ini.[5]
Analisis kekuatan
Simulasi Monte Carlo telah menunjukkan dalam pengaturan yang relevan secara praktis bahwa Shapiro–Wilk memiliki daya terbaik untuk signifikansi tertentu, diikuti oleh Anderson–Darling ketika membandingkan Shapiro–Wilk, Kolmogorov–Smirnov, dan Lilliefors.[6][sumber tepercaya?]
Pendekatan
Royston mengusulkan metode alternatif untuk menghitung vektor koefisien dengan menyediakan algoritma untuk menghitung nilai yang memperluas ukuran sampel dari 50 menjadi 2.000.[7] Teknik ini digunakan dalam beberapa paket perangkat lunak termasuk GraphPad Prism, Stata,[8][9]SPSS dan SAS.[10] Rahman dan Govidarajulu memperluas ukuran sampel lebih lanjut hingga 5.000.[11]
↑Davis, C. S.; Stephens, M. A. (1978). The covariance matrix of normal order statistics(PDF) (Technical report). Department of Statistics, Stanford University, Stanford, California. Technical Report No. 14. Diakses tanggal 2022-10-04.
↑Field, Andy (2009). Discovering statistics using SPSS (Edisi 3rd). Los Angeles [i.e. Thousand Oaks, Calif.]: SAGE Publications. hlm.143. ISBN978-1-84787-906-6.
↑Royston, Patrick (September 1992). "Approximating the Shapiro–Wilk W-test for non-normality". Statistics and Computing. 2 (3): 117–119. doi:10.1007/BF01891203. S2CID122446146.
↑Royston, Patrick. "Shapiro–Wilk and Shapiro–Francia Tests". Stata Technical Bulletin, StataCorp LP. 1 (3).