ENSIKLOPEDIA

Kembali ke Ensiklopedia Arsip Wikipedia Indonesia

Analisis varians satu arah

Dalam statistika, analisis varians satu arah (atau ANOVA satu arah) adalah teknik untuk membandingkan apakah rata-rata dua atau lebih sampel berbeda secara signifikan (menggunakan distribusi F). Teknik analisis varians ini membutuhkan variabel respons numerik "Y" dan satu variabel penjelas "X", oleh karena itu disebut "satu arah".^[1]

ANOVA menguji hipotesis nol, yang menyatakan bahwa sampel di semua kelompok diambil dari populasi dengan nilai rata-rata yang sama. Untuk melakukan ini, dua estimasi dibuat dari varians populasi. Estimasi ini bergantung pada berbagai asumsi (lihat di bawah). ANOVA menghasilkan statistika F, yaitu rasio varians yang dihitung di antara rata-rata terhadap varians di dalam sampel. Jika rata-rata kelompok diambil dari populasi dengan nilai rata-rata yang sama, varians antara rata-rata kelompok seharusnya lebih rendah daripada varians sampel, sesuai dengan teorema limit pusat. Oleh karena itu, rasio yang lebih tinggi menyiratkan bahwa sampel diambil dari populasi dengan nilai rata-rata yang berbeda.^[1]

Namun, biasanya ANOVA satu arah digunakan untuk menguji perbedaan di antara setidaknya tiga kelompok, karena kasus dua kelompok dapat dicakup oleh uji t (Gosset, 1908). Ketika hanya ada dua rata-rata untuk dibandingkan, uji t dan uji F setara; hubungan antara ANOVA dan t diberikan oleh F = t². Perluasan ANOVA satu arah adalah analisis varians dua arah yang memeriksa pengaruh dua variabel independen kategorikal yang berbeda pada satu variabel dependen.

Asumsi

Hasil ANOVA satu arah dapat dianggap andal selama asumsi berikut terpenuhi:

Residual variabel respons terdistribusi normal (atau mendekati normal).
Varians populasi adalah sama.
Respons untuk kelompok tertentu adalah variabel acak normal yang independen dan terdistribusi secara identik (bukan sampel acak sederhana (SRS)).

Varian utamanya adalah: Jika data bersifat ordinal, alternatif non-parametrik untuk uji ini harus digunakan seperti analisis varians satu arah Kruskal–Wallis. Jika varians tidak diketahui sama, generalisasi uji t Welch 2 sampel dapat digunakan.^[2]

Penyimpangan dari normalitas populasi

ANOVA adalah prosedur yang relatif kuat terhadap pelanggaran asumsi normalitas.^[3]

Seringkali dinyatakan dalam literatur populer bahwa tidak satu pun dari uji F ini kukuh ketika terjadi pelanggaran berat terhadap asumsi bahwa setiap populasi mengikuti distribusi normal, terutama untuk tingkat alfa kecil dan tata letak yang tidak seimbang.^[4] Lebih lanjut, juga diklaim bahwa jika asumsi dasar homoskedastisitas dilanggar, sifat kesalahan Tipe I akan memburuk jauh lebih parah.^[5]

Namun, ini adalah kesalahpahaman, berdasarkan pekerjaan yang dilakukan pada tahun 1950-an dan sebelumnya. Investigasi komprehensif pertama tentang masalah ini dengan simulasi Monte Carlo adalah Donaldson (1966).^[6] Ia menunjukkan bahwa dalam penyimpangan umum (kemiringan positif, varians tidak sama) "uji F bersifat konservatif", sehingga kemungkinannya lebih kecil daripada seharusnya untuk menemukan bahwa suatu variabel signifikan. Namun, seiring bertambahnya ukuran sampel atau jumlah sel, "kurva daya tampaknya konvergen ke kurva yang didasarkan pada distribusi normal". Tiku (1971) menemukan bahwa "daya teori non-normal dari F ditemukan berbeda dari daya teori normal dengan suku koreksi yang menurun tajam dengan meningkatnya ukuran sampel."^[7] Masalah non-normalitas, terutama pada sampel besar, jauh kurang serius daripada yang disarankan oleh artikel-artikel populer.

Pandangan saat ini adalah bahwa "studi Monte-Carlo digunakan secara luas dengan uji berbasis distribusi normal untuk menentukan seberapa sensitif uji tersebut terhadap pelanggaran asumsi distribusi normal dari variabel yang dianalisis dalam populasi. Kesimpulan umum dari studi ini adalah bahwa konsekuensi dari pelanggaran tersebut kurang parah daripada yang diperkirakan sebelumnya. Meskipun kesimpulan ini seharusnya tidak sepenuhnya menghalangi siapa pun untuk memperhatikan asumsi normalitas, hal ini telah meningkatkan popularitas keseluruhan uji statistik yang bergantung pada distribusi di semua bidang penelitian."^[8]

Untuk alternatif nonparametrik dalam tata letak faktorial, lihat Sawilowsky.^[9] Untuk diskusi lebih lanjut, lihat ANOVA pada peringkat.

Kasus efek tetap, eksperimen acak penuh, data tidak seimbang

Model

Model linier normal menggambarkan kelompok perlakuan dengan distribusi probabilitas yang merupakan kurva lonceng (normal) yang identik dengan rata-rata yang berbeda. Dengan demikian, pemasangan model hanya membutuhkan rata-rata dari setiap kelompok perlakuan dan perhitungan varians (varians rata-rata dalam kelompok perlakuan digunakan). Perhitungan rata-rata dan varians dilakukan sebagai bagian dari uji hipotesis.

Model linear normal yang umum digunakan untuk percobaan acak lengkap adalah:^[10]

y_{i,j}=\mu _{j}+\varepsilon _{i,j}

(model rata-rata)

atau

y_{i,j}=\mu +\tau _{j}+\varepsilon _{i,j}

(model efek)

di mana

i=1,\dotsc ,I

adalah indeks atas unit percobaan

j=1,\dotsc ,J

adalah indeks atas kelompok perlakuan

I_{j}

adalah jumlah unit percobaan dalam kelompok perlakuan ke-j

I=\sum _{j}I_{j}

adalah jumlah total unit percobaan

y_{i,j}

adalah observasi

\mu _{j}

adalah rata-rata observasi untuk kelompok perlakuan ke-j

\mu

adalah rata-rata keseluruhan observasi

\tau _{j}

adalah efek perlakuan ke-j, penyimpangan dari rata-rata keseluruhan

\sum \tau _{j}=0

\mu _{j}=\mu +\tau _{j}

\varepsilon \thicksim N(0,\sigma ^{2})

\varepsilon _{i,j}

adalah kesalahan acak berdistribusi normal dengan rata-rata nol.

Indeks $i$ pada unit eksperimental dapat diinterpretasikan dengan beberapa cara. Dalam beberapa percobaan, unit eksperimental yang sama dikenai berbagai perlakuan; $i$ dapat menunjuk ke unit tertentu. Dalam eksperimen lain, setiap kelompok perlakuan memiliki serangkaian unit eksperimental yang berbeda; $i$ mungkin hanya merupakan indeks ke dalam daftar $j$ -th.

Data dan ringkasan statistik data

Salah satu bentuk pengorganisasian observasi eksperimental $y_{ij}$ adalah dengan mengelompokkan data dalam kolom:

Pengorganisasian data ANOVA, Tidak Seimbang, Faktor Tunggal
	Daftar Observasi Kelompok
	$I_{1}$	$I_{2}$	$I_{3}$	$\dotso$	$I_{j}$
1	$y_{11}$	$y_{12}$	$y_{13}$		$y_{1j}$
2	$y_{21}$	$y_{22}$	$y_{23}$		$y_{2j}$
3	$y_{31}$	$y_{32}$	$y_{33}$		$y_{3j}$
$\vdots$					$\vdots$
$i$	$y_{i1}$	$y_{i2}$	$y_{i3}$	$\dotso$	$y_{ij}$

	Statistika Ringkasan Kelompok						Statistika Ringkasan Utama
# Diamati	$I_{1}$	$I_{2}$	$\dotso$	$I_{j}$	$\dotso$	$I_{J}$	# Diamati	$I=\sum I_{j}$
Jumlah				$\sum _{i}y_{ij}$			Jumlah	$\sum _{j}\sum _{i}y_{ij}$
Jumlah kuadrat				$\sum _{i}(y_{ij})^{2}$			Jumlah kuadrat	$\sum _{j}\sum _{i}(y_{ij})^{2}$
Rata-rata	$m_{1}$	$\dotso$		$m_{j}$	$\dotso$	$m_{J}$	Rata-rata	$m$
Varians	$s_{1}^{2}$	$\dotso$		$s_{j}^{2}$	$\dotso$	$s_{J}^{2}$	Varians	$s^{2}$

Membandingkan model dengan ringkasan: $\mu =m$ dan $\mu _{j}=m_{j}$ . Rata-rata dan varians keseluruhan dihitung dari jumlah keseluruhan, bukan dari rata-rata dan varians kelompok.

Uji hipotesis

Berdasarkan statistika ringkasan, perhitungan uji hipotesis ditampilkan dalam bentuk tabel. Meskipun dua kolom SS ditampilkan untuk nilai penjelasannya, hanya satu kolom yang diperlukan untuk menampilkan hasil.

Tabel ANOVA untuk model tetap, faktor tunggal, percobaan acak
Sumber variasi	Jumlah kuadrat	Jumlah kuadrat	Derajat kebebasan	Kuadrat rata-rata	F
	Penjelasan SS^[11]	Komputasional SS^[12]	DF	MS
Perlakuan	$\sum _{Perlakuan}I_{j}(m_{j}-m)^{2}$	$\sum _{j}{\frac {(\sum _{i}y_{ij})^{2}}{I_{j}}}-{\frac {(\sum _{j}\sum _{i}y_{ij})^{2}}{I}}$	$J-1$	${\frac {SS_{Perlakuan}}{DF_{Perlakuan}}}$	${\frac {MS_{Perlakuan}}{MS_{Galat}}}$
Galat	$\sum _{Perlakuan}(I_{j}-1)s_{j}^{2}$	$\sum _{j}\sum _{i}y_{ij}^{2}-\sum _{j}{\frac {(\sum _{i}y_{ij})^{2}}{I_{j}}}$	$I-J$	${\frac {SS_{Galat}}{DF_{Galat}}}$
Total	$\sum _{Observasi}(y_{ij}-m)^{2}$	$\sum _{j}\sum _{i}y_{ij}^{2}-{\frac {(\sum _{j}\sum _{i}y_{ij})^{2}}{I}}$	$I-1$

$MS_{Galat}$ adalah estimasi varians yang sesuai dengan $\sigma ^{2}$ dari model.

Ringkasan analisis

Analisis ANOVA inti terdiri dari serangkaian perhitungan. Data dikumpulkan dalam bentuk tabel. Kemudian

Setiap kelompok perlakuan diringkas berdasarkan jumlah unit eksperimental, dua jumlah, rata-rata, dan varians. Ringkasan kelompok perlakuan digabungkan untuk memberikan total jumlah unit dan jumlahnya. Rata-rata dan varians keseluruhan dihitung dari jumlah keseluruhan. Rata-rata perlakuan dan rata-rata keseluruhan digunakan dalam model.
Tiga DF dan SS dihitung dari ringkasan. Kemudian MS dihitung dan rasio menentukan F.
Komputer biasanya menentukan nilai p dari F yang menentukan apakah perlakuan menghasilkan hasil yang berbeda secara signifikan. Jika hasilnya signifikan, maka model tersebut secara sementara memiliki validitas.

Jika percobaan seimbang, semua istilah $I_{j}$ sama sehingga persamaan SS disederhanakan.

Dalam percobaan yang lebih kompleks, di mana unit eksperimental (atau efek lingkungan) tidak homogen, statistika baris juga digunakan dalam analisis. Model ini mencakup suku-suku yang bergantung pada $i$ . Menentukan suku-suku tambahan mengurangi jumlah derajat kebebasan yang tersedia.

Contoh

Pertimbangkan sebuah percobaan untuk mempelajari efek dari tiga tingkat faktor yang berbeda terhadap suatu respons (misalnya tiga tingkat pupuk terhadap pertumbuhan tanaman). Jika kita memiliki 6 pengamatan untuk setiap tingkat, kita dapat menulis hasil percobaan dalam tabel seperti ini, di mana a₁, a₂, dan a₃ adalah tiga tingkat faktor yang sedang dipelajari.

a₁	a₂	a₃
6	8	13
8	12	9
4	9	11
5	11	8
3	6	7
4	8	12

Hipotesis nol, yang dilambangkan dengan H₀, untuk uji F keseluruhan pada percobaan ini adalah bahwa ketiga level faktor tersebut menghasilkan respons yang sama, rata-rata. Untuk menghitung rasio F:

Langkah 1: Hitung rata-rata dalam setiap kelompok:

{\begin{aligned}{\overline {Y}}_{1}&={\frac {1}{6}}\sum Y_{1i}={\frac {6+8+4+5+3+4}{6}}=5\\{\overline {Y}}_{2}&={\frac {1}{6}}\sum Y_{2i}={\frac {8+12+9+11+6+8}{6}}=9\\{\overline {Y}}_{3}&={\frac {1}{6}}\sum Y_{3i}={\frac {13+9+11+8+7+12}{6}}=10\end{aligned}}

Langkah 2: Hitung rata-rata keseluruhan:

{\overline {Y}}={\frac {\sum _{i}{\overline {Y}}_{i}}{a}}={\frac {{\overline {Y}}_{1}+{\overline {Y}}_{2}+{\overline {Y}}_{3}}{a}}={\frac {5+9+10}{3}}=8

di mana a adalah jumlah kelompok.

Langkah 3: Hitung jumlah kuadrat selisih "antar kelompok":

{\begin{aligned}S_{B}&=n({\overline {Y}}_{1}-{\overline {Y}})^{2}+n({\overline {Y}}_{2}-{\overline {Y}})^{2}+n({\overline {Y}}_{3}-{\overline {Y}})^{2}\\[8pt]&=6(5-8)^{2}+6(9-8)^{2}+6(10-8)^{2}=84\end{aligned}}

di mana n adalah jumlah nilai data per kelompok.

Derajat kebebasan antar kelompok adalah satu kurang dari jumlah kelompok.

f_{b}=3-1=2

jadi nilai kuadrat rata-rata antar kelompok adalah

MS_{B}=84/2=42

Langkah 4: Hitung jumlah kuadrat "dalam kelompok". Mulailah dengan memusatkan data di setiap kelompok.

a₁	a₂	a₃
6−5=1	8−9=−1	13−10=3
8−5=3	12−9=3	9−10=−1
4−5=−1	9−9=0	11−10=1
5−5=0	11−9=2	8−10=−2
3−5=−2	6−9=−3	7−10=−3
4−5=−1	8−9=−1	12−10=2

Jumlah kuadrat dalam kelompok adalah jumlah kuadrat dari semua 18 nilai dalam tabel ini

{\begin{aligned}S_{W}=&(1)^{2}+(3)^{2}+(-1)^{2}+(0)^{2}+(-2)^{2}+(-1)^{2}+\\&(-1)^{2}+(3)^{2}+(0)^{2}+(2)^{2}+(-3)^{2}+(-1)^{2}+\\&(3)^{2}+(-1)^{2}+(1)^{2}+(-2)^{2}+(-3)^{2}+(2)^{2}\\=&\ 1+9+1+0+4+1+1+9+0+4+9+1+9+1+1+4+9+4\\=&\ 68\\\end{aligned}}

Derajat kebebasan dalam kelompok adalah

f_{W}=a(n-1)=3(6-1)=15

Dengan demikian nilai kuadrat rata-rata dalam kelompok adalah

MS_{W}=S_{W}/f_{W}=68/15\approx 4.5

Langkah 5: Rasio F adalah

F={\frac {MS_{B}}{MS_{W}}}\approx 42/4.5\approx 9.3

Nilai kritis adalah angka yang harus dilampaui oleh statistika uji untuk menolak uji tersebut. Dalam kasus ini, F_crit(2,15) = 3.68 pada α Karena F=9.3 > 3.68; hasilnya signifikan pada tingkat signifikansi 5%. Hipotesis nol tidak akan diterima, sehingga dapat disimpulkan bahwa terdapat bukti kuat bahwa nilai yang diharapkan dalam ketiga kelompok tersebut berbeda. Nilai p untuk uji ini adalah 0,002.

Setelah melakukan uji F, biasanya dilakukan analisis post hoc terhadap rata-rata kelompok. Dalam kasus ini, rata-rata dua kelompok pertama berbeda 4 unit, rata-rata kelompok pertama dan ketiga berbeda 5 unit, dan rata-rata kelompok kedua dan ketiga hanya berbeda 1 unit. Kesalahan standar dari masing-masing perbedaan ini adalah ${\sqrt {4.5/6+4.5/6}}=1.2$ . Dengan demikian, kelompok pertama sangat berbeda dari kelompok lain, karena perbedaan rata-ratanya lebih dari 3 kali kesalahan standar, sehingga kita dapat sangat yakin bahwa rata-rata populasi kelompok pertama berbeda dari rata-rata populasi kelompok lain. Namun, tidak ada bukti bahwa kelompok kedua dan ketiga memiliki rata-rata populasi yang berbeda satu sama lain, karena perbedaan rata-ratanya sebesar satu unit sebanding dengan kesalahan standar.

Catatan: F(x, y) menunjukkan fungsi distribusi kumulatif distribusi F dengan x derajat kebebasan di pembilang dan y derajat kebebasan di penyebut.

Lihat juga

Analisis varians
Uji F (Termasuk contoh ANOVA satu arah)
Model campuran
Analisis varians multivariat (MANOVA)
Analisis varians dua arah
Uji t Welch

Catatan

1 2 Howell, David (2002). Statistical Methods for Psychology. Duxbury. hlm. 324–325. ISBN 0-534-37770-X.
↑ Welch, B. L. (1951). "On the Comparison of Several Mean Values: An Alternative Approach". Biometrika. 38 (3/4): 330–336. doi:10.2307/2332579. JSTOR 2332579.
↑ Kirk, RE (1995). Experimental Design: Procedures For The Behavioral Sciences (Edisi 3). Pacific Grove, CA, USA: Brooks/Cole.
↑ Blair, R. C. (1981). "A reaction to 'Consequences of failure to meet assumptions underlying the fixed effects analysis of variance and covariance.'". Review of Educational Research. 51 (4): 499–507. doi:10.3102/00346543051004499.
↑ Randolf, E. A.; Barcikowski, R. S. (1989). "Type I error rate when real study values are used as population parameters in a Monte Carlo study". Paper Presented at the 11th Annual Meeting of the Mid-Western Educational Research Association, Chicago.
↑ Donaldson, Theodore S. (1966). "Power of the F-Test for Nonnormal Distributions and Unequal Error Variances". Paper Prepared for United States Air Force Project RAND.
↑ Tiku, M. L. (1971). "Power Function of the F-Test Under Non-Normal Situations". Journal of the American Statistical Association. 66 (336): 913–916. doi:10.1080/01621459.1971.10482371.
↑ "Getting Started with Statistics Concepts". Diarsipkan dari asli tanggal 2018-12-04. Diakses tanggal 2016-09-22.
↑ Sawilowsky, S. (1990). "Nonparametric tests of interaction in experimental design". Review of Educational Research. 60 (1): 91–126. doi:10.3102/00346543060001091.
↑ Montgomery, Douglas C. (2001). Design and Analysis of Experiments (Edisi 5th). New York: Wiley. hlm. Section 3–2. ISBN 9780471316497.
↑ Moore, David S.; McCabe, George P. (2003). Introduction to the Practice of Statistics (Edisi 4th). W H Freeman & Co. hlm. 764. ISBN 0716796570.
↑ Winkler, Robert L.; Hays, William L. (1975). Statistics: Probability, Inference, and Decision (Edisi 2nd). New York: Holt, Rinehart and Winston. hlm. 761.

Bacaan lanjutan

George Casella (18 April 2008). Statistical design. Springer. ISBN 978-0-387-75965-4.