Dalam statistika, analisis varians satu arah (atau ANOVA satu arah) adalah teknik untuk membandingkan apakah rata-rata dua atau lebih sampel berbeda secara signifikan (menggunakan distribusi F). Teknik analisis varians ini membutuhkan variabel respons numerik "Y" dan satu variabel penjelas "X", oleh karena itu disebut "satu arah".[1]
ANOVA menguji hipotesis nol, yang menyatakan bahwa sampel di semua kelompok diambil dari populasi dengan nilai rata-rata yang sama. Untuk melakukan ini, dua estimasi dibuat dari varians populasi. Estimasi ini bergantung pada berbagai asumsi (lihat di bawah). ANOVA menghasilkan statistika F, yaitu rasio varians yang dihitung di antara rata-rata terhadap varians di dalam sampel. Jika rata-rata kelompok diambil dari populasi dengan nilai rata-rata yang sama, varians antara rata-rata kelompok seharusnya lebih rendah daripada varians sampel, sesuai dengan teorema limit pusat. Oleh karena itu, rasio yang lebih tinggi menyiratkan bahwa sampel diambil dari populasi dengan nilai rata-rata yang berbeda.[1]
Namun, biasanya ANOVA satu arah digunakan untuk menguji perbedaan di antara setidaknya tiga kelompok, karena kasus dua kelompok dapat dicakup oleh uji t (Gosset, 1908). Ketika hanya ada dua rata-rata untuk dibandingkan, uji t dan uji F setara; hubungan antara ANOVA dan t diberikan oleh F=t2. Perluasan ANOVA satu arah adalah analisis varians dua arah yang memeriksa pengaruh dua variabel independen kategorikal yang berbeda pada satu variabel dependen.
Asumsi
Hasil ANOVA satu arah dapat dianggap andal selama asumsi berikut terpenuhi:
Residual variabel respons terdistribusi normal (atau mendekati normal).
Varians populasi adalah sama.
Respons untuk kelompok tertentu adalah variabel acak normal yang independen dan terdistribusi secara identik (bukan sampel acak sederhana (SRS)).
Varian utamanya adalah: Jika data bersifat ordinal, alternatif non-parametrik untuk uji ini harus digunakan seperti analisis varians satu arah Kruskal–Wallis. Jika varians tidak diketahui sama, generalisasi uji t Welch 2 sampel dapat digunakan.[2]
Penyimpangan dari normalitas populasi
ANOVA adalah prosedur yang relatif kuat terhadap pelanggaran asumsi normalitas.[3]
Seringkali dinyatakan dalam literatur populer bahwa tidak satu pun dari uji F ini kukuh ketika terjadi pelanggaran berat terhadap asumsi bahwa setiap populasi mengikuti distribusi normal, terutama untuk tingkat alfa kecil dan tata letak yang tidak seimbang.[4] Lebih lanjut, juga diklaim bahwa jika asumsi dasar homoskedastisitas dilanggar, sifat kesalahan Tipe I akan memburuk jauh lebih parah.[5]
Namun, ini adalah kesalahpahaman, berdasarkan pekerjaan yang dilakukan pada tahun 1950-an dan sebelumnya. Investigasi komprehensif pertama tentang masalah ini dengan simulasi Monte Carlo adalah Donaldson (1966).[6] Ia menunjukkan bahwa dalam penyimpangan umum (kemiringan positif, varians tidak sama) "uji F bersifat konservatif", sehingga kemungkinannya lebih kecil daripada seharusnya untuk menemukan bahwa suatu variabel signifikan. Namun, seiring bertambahnya ukuran sampel atau jumlah sel, "kurva daya tampaknya konvergen ke kurva yang didasarkan pada distribusi normal". Tiku (1971) menemukan bahwa "daya teori non-normal dari F ditemukan berbeda dari daya teori normal dengan suku koreksi yang menurun tajam dengan meningkatnya ukuran sampel."[7] Masalah non-normalitas, terutama pada sampel besar, jauh kurang serius daripada yang disarankan oleh artikel-artikel populer.
Pandangan saat ini adalah bahwa "studi Monte-Carlo digunakan secara luas dengan uji berbasis distribusi normal untuk menentukan seberapa sensitif uji tersebut terhadap pelanggaran asumsi distribusi normal dari variabel yang dianalisis dalam populasi. Kesimpulan umum dari studi ini adalah bahwa konsekuensi dari pelanggaran tersebut kurang parah daripada yang diperkirakan sebelumnya. Meskipun kesimpulan ini seharusnya tidak sepenuhnya menghalangi siapa pun untuk memperhatikan asumsi normalitas, hal ini telah meningkatkan popularitas keseluruhan uji statistik yang bergantung pada distribusi di semua bidang penelitian."[8]
Untuk alternatif nonparametrik dalam tata letak faktorial, lihat Sawilowsky.[9] Untuk diskusi lebih lanjut, lihat ANOVA pada peringkat.
Kasus efek tetap, eksperimen acak penuh, data tidak seimbang
Model
Model linier normal menggambarkan kelompok perlakuan dengan distribusi probabilitas yang merupakan kurva lonceng (normal) yang identik dengan rata-rata yang berbeda. Dengan demikian, pemasangan model hanya membutuhkan rata-rata dari setiap kelompok perlakuan dan perhitungan varians (varians rata-rata dalam kelompok perlakuan digunakan). Perhitungan rata-rata dan varians dilakukan sebagai bagian dari uji hipotesis.
Model linear normal yang umum digunakan untuk percobaan acak lengkap adalah:[10]
(model rata-rata)
atau
(model efek)
di mana
adalah indeks atas unit percobaan
adalah indeks atas kelompok perlakuan
adalah jumlah unit percobaan dalam kelompok perlakuan ke-j
adalah jumlah total unit percobaan
adalah observasi
adalah rata-rata observasi untuk kelompok perlakuan ke-j
adalah rata-rata keseluruhan observasi
adalah efek perlakuan ke-j, penyimpangan dari rata-rata keseluruhan
, adalah kesalahan acak berdistribusi normal dengan rata-rata nol.
Indeks pada unit eksperimental dapat diinterpretasikan dengan beberapa cara. Dalam beberapa percobaan, unit eksperimental yang sama dikenai berbagai perlakuan; dapat menunjuk ke unit tertentu. Dalam eksperimen lain, setiap kelompok perlakuan memiliki serangkaian unit eksperimental yang berbeda; mungkin hanya merupakan indeks ke dalam daftar -th.
Data dan ringkasan statistik data
Salah satu bentuk pengorganisasian observasi eksperimental adalah dengan mengelompokkan data dalam kolom:
Pengorganisasian data ANOVA, Tidak Seimbang, Faktor Tunggal
Daftar Observasi Kelompok
1
2
3
Statistika Ringkasan Kelompok
Statistika Ringkasan Utama
# Diamati
# Diamati
Jumlah
Jumlah
Jumlah kuadrat
Jumlah kuadrat
Rata-rata
Rata-rata
Varians
Varians
Membandingkan model dengan ringkasan: dan . Rata-rata dan varians keseluruhan dihitung dari jumlah keseluruhan, bukan dari rata-rata dan varians kelompok.
Uji hipotesis
Berdasarkan statistika ringkasan, perhitungan uji hipotesis ditampilkan dalam bentuk tabel. Meskipun dua kolom SS ditampilkan untuk nilai penjelasannya, hanya satu kolom yang diperlukan untuk menampilkan hasil.
Tabel ANOVA untuk model tetap, faktor tunggal, percobaan acak
adalah estimasi varians yang sesuai dengan dari model.
Ringkasan analisis
Analisis ANOVA inti terdiri dari serangkaian perhitungan. Data dikumpulkan dalam bentuk tabel. Kemudian
Setiap kelompok perlakuan diringkas berdasarkan jumlah unit eksperimental, dua jumlah, rata-rata, dan varians. Ringkasan kelompok perlakuan digabungkan untuk memberikan total jumlah unit dan jumlahnya. Rata-rata dan varians keseluruhan dihitung dari jumlah keseluruhan. Rata-rata perlakuan dan rata-rata keseluruhan digunakan dalam model.
Tiga DF dan SS dihitung dari ringkasan. Kemudian MS dihitung dan rasio menentukan F.
Komputer biasanya menentukan nilai p dari F yang menentukan apakah perlakuan menghasilkan hasil yang berbeda secara signifikan. Jika hasilnya signifikan, maka model tersebut secara sementara memiliki validitas.
Jika percobaan seimbang, semua istilah sama sehingga persamaan SS disederhanakan.
Dalam percobaan yang lebih kompleks, di mana unit eksperimental (atau efek lingkungan) tidak homogen, statistika baris juga digunakan dalam analisis. Model ini mencakup suku-suku yang bergantung pada . Menentukan suku-suku tambahan mengurangi jumlah derajat kebebasan yang tersedia.
Contoh
Pertimbangkan sebuah percobaan untuk mempelajari efek dari tiga tingkat faktor yang berbeda terhadap suatu respons (misalnya tiga tingkat pupuk terhadap pertumbuhan tanaman). Jika kita memiliki 6 pengamatan untuk setiap tingkat, kita dapat menulis hasil percobaan dalam tabel seperti ini, di mana a1, a2, dan a3 adalah tiga tingkat faktor yang sedang dipelajari.
a1
a2
a3
6
8
13
8
12
9
4
9
11
5
11
8
3
6
7
4
8
12
Hipotesis nol, yang dilambangkan dengan H0, untuk uji F keseluruhan pada percobaan ini adalah bahwa ketiga level faktor tersebut menghasilkan respons yang sama, rata-rata. Untuk menghitung rasio F:
Langkah 1: Hitung rata-rata dalam setiap kelompok:
Langkah 2: Hitung rata-rata keseluruhan:
di mana a adalah jumlah kelompok.
Langkah 3: Hitung jumlah kuadrat selisih "antar kelompok":
di mana n adalah jumlah nilai data per kelompok.
Derajat kebebasan antar kelompok adalah satu kurang dari jumlah kelompok.
jadi nilai kuadrat rata-rata antar kelompok adalah
Langkah 4: Hitung jumlah kuadrat "dalam kelompok". Mulailah dengan memusatkan data di setiap kelompok.
a1
a2
a3
6−5=1
8−9=−1
13−10=3
8−5=3
12−9=3
9−10=−1
4−5=−1
9−9=0
11−10=1
5−5=0
11−9=2
8−10=−2
3−5=−2
6−9=−3
7−10=−3
4−5=−1
8−9=−1
12−10=2
Jumlah kuadrat dalam kelompok adalah jumlah kuadrat dari semua 18 nilai dalam tabel ini
Derajat kebebasan dalam kelompok adalah
Dengan demikian nilai kuadrat rata-rata dalam kelompok adalah
Langkah 5: Rasio F adalah
Nilai kritis adalah angka yang harus dilampaui oleh statistika uji untuk menolak uji tersebut. Dalam kasus ini, Fcrit(2,15) = 3.68 pada α Karena F=9.3>3.68; hasilnya signifikan pada tingkat signifikansi 5%. Hipotesis nol tidak akan diterima, sehingga dapat disimpulkan bahwa terdapat bukti kuat bahwa nilai yang diharapkan dalam ketiga kelompok tersebut berbeda. Nilai p untuk uji ini adalah 0,002.
Setelah melakukan uji F, biasanya dilakukan analisis post hoc terhadap rata-rata kelompok. Dalam kasus ini, rata-rata dua kelompok pertama berbeda 4 unit, rata-rata kelompok pertama dan ketiga berbeda 5 unit, dan rata-rata kelompok kedua dan ketiga hanya berbeda 1 unit. Kesalahan standar dari masing-masing perbedaan ini adalah . Dengan demikian, kelompok pertama sangat berbeda dari kelompok lain, karena perbedaan rata-ratanya lebih dari 3 kali kesalahan standar, sehingga kita dapat sangat yakin bahwa rata-rata populasi kelompok pertama berbeda dari rata-rata populasi kelompok lain. Namun, tidak ada bukti bahwa kelompok kedua dan ketiga memiliki rata-rata populasi yang berbeda satu sama lain, karena perbedaan rata-ratanya sebesar satu unit sebanding dengan kesalahan standar.
Catatan: F(x,y) menunjukkan fungsi distribusi kumulatif distribusi F dengan x derajat kebebasan di pembilang dan y derajat kebebasan di penyebut.
↑Welch, B. L. (1951). "On the Comparison of Several Mean Values: An Alternative Approach". Biometrika. 38 (3/4): 330–336. doi:10.2307/2332579. JSTOR2332579.
↑Blair, R. C. (1981). "A reaction to 'Consequences of failure to meet assumptions underlying the fixed effects analysis of variance and covariance.'". Review of Educational Research. 51 (4): 499–507. doi:10.3102/00346543051004499.
↑Randolf, E. A.; Barcikowski, R. S. (1989). "Type I error rate when real study values are used as population parameters in a Monte Carlo study". Paper Presented at the 11th Annual Meeting of the Mid-Western Educational Research Association, Chicago.
↑Sawilowsky, S. (1990). "Nonparametric tests of interaction in experimental design". Review of Educational Research. 60 (1): 91–126. doi:10.3102/00346543060001091.
↑Montgomery, Douglas C. (2001). Design and Analysis of Experiments (Edisi 5th). New York: Wiley. hlm.Section 3–2. ISBN9780471316497.