Dalam statistika, analisis varians dua arah (atau ANOVA dua arah) digunakan untuk mempelajari bagaimana dua variabel independen kategorikal memengaruhi satu variabel dependen sinambung. ANOVA dua arah memperluas analisis varians satu arah (one-way ANOVA) dengan memungkinkan kedua faktor dianalisis secara bersamaan. ANOVA dua arah mengevaluasi efek utama dari setiap variabel independen dan apakah ada interaksi di antara keduanya.[1]
Para peneliti menggunakan uji ini untuk melihat apakah dua faktor bertindak secara independen atau gabungan untuk mempengaruhi variabel dependen. ANOVA dua arah digunakan dalam bidang psikologi, pertanian, pendidikan, dan penelitian biomedis. Misalnya, ANOVA dua arah dapat digunakan untuk mempelajari bagaimana jenis pupuk dan tingkat air secara bersama-sama memengaruhi pertumbuhan tanaman. Analisis ini menghasilkan statistika F yang menunjukkan apakah perbedaan yang diamati antar kelompok signifikan secara statistika.[2][3]
Sejarah
Analisis varians dua arah dikembangkan pada awal abad ke-20 selama munculnya rancangan percobaan modern. Pada tahun 1925, Ronald Fisher menyebutkan ANOVA dua arah dalam bukunya, Statistical Methods for Research Workers (bab 7 dan 8). Melalui karyanya, Fisher menunjukkan bahwa variasi dalam hasil eksperimen dapat ditelusuri ke berbagai penyebab.[4]
Pada tahun 1934, Frank Yates memperluas pendekatan Fisher dengan mengusulkan prosedur komputasi untuk kasus dengan ukuran sampel yang tidak sama (rancangan tidak seimbang).[5] Hal ini membuat metode ini lebih praktis untuk percobaan di dunia nyata. Penelitian selanjutnya menyempurnakan teori ANOVA dua arah, termasuk tinjauan Yasunori Fujikoshi tahun 1993 yang berfokus pada model dengan data tidak seimbang.[2]
Dengan munculnya komputasi statistika pada akhir abad ke-20, ANOVA dua arah menjadi tersedia secara luas dalam perangkat lunak seperti SAS, SPSS, dan R. Pada tahun 2005, Andrew Gelman mengusulkan interpretasi baru ANOVA, sebagai model multilevel,[3] yang membingkainya sebagai cara untuk menggambarkan sumber variasi hierarkis daripada uji hipotesis tunggal. Pandangan ini tetap berpengaruh dalam statistika modern.
Pengembangan ANOVA dua arah memberikan dasar untuk menganalisis data faktorial. Bagian selanjutnya menjelaskan bagaimana data diatur untuk jenis analisis ini.
Kumpulan data
Pertimbangkan kumpulan data di mana variabel dependen dapat dipengaruhi oleh dua faktor yang merupakan sumber variasi potensial. Faktor pertama memiliki level () dan faktor kedua memiliki level (). Setiap kombinasi mendefinisikan suatu perlakuan, dengan total perlakuan. Jumlah replikasi untuk perlakuan i dilambangkan dengan , dan misalkan adalah indeks replikasi dalam perlakuan ini ().[1]
Dari data ini, kita dapat membangun tabel kontingensi, di mana
Distribusi observasi antar perlakuan menentukan apakah rancangan tersebut seimbang atau tidak seimbang. Rancangan percobaan dikatakan seimbang jika setiap perlakuan memiliki jumlah replikasi yang sama, K. Dalam kasus ini, desain tersebut ortogonal, yang memungkinkan efek dari kedua faktor dibedakan secara independen. Dengan demikian,
,
dan
.
Pertimbangkan sebuah studi pertanian yang meneliti bagaimana jenis pupuk (faktor A) dan tingkat irigasi (faktor B) mempengaruhi pertumbuhan tanaman. Setiap kombinasi pupuk dan irigasi mewakili suatu perlakuan, dan beberapa tanaman diukur dalam setiap kelompok sebagai replikasi:
Jenis pupuk
Irigasi rendah
Irigasi tinggi
Tidak ada
7, 2, 1
7, 6
Nitrat
11, 6
11, 7, 3
Fosfat
5, 3, 4
11, 4
Tabel ini menunjukkan tata letak dua arah yang khas di mana baris mewakili satu faktor, kolom mewakili faktor lain, dan tiap sel mewakili kombinasi perlakuan. Tata letak ini membentuk dasar untuk menganalisis bagaimana kedua faktor dan interaksinya memengaruhi variabel dependen.
Struktur data ini membentuk dasar model statistika yang digunakan dalam ANOVA dua arah. Dengan mendefinisikan setiap kombinasi perlakuan secara matematis, model dapat menggambarkan bagaimana faktor dan interaksinya mempengaruhi variabel respons.
Model
Setelah mengamati variasi di antara semua titik data, misalnya melalui histogram, "probabilitas dapat digunakan untuk menggambarkan variasi tersebut". Oleh karena itu, mari kita nyatakan sebagai variabel acak yang nilai teramatinya adalah ukuran ke- untuk perlakuan . ANOVA dua arah memodelkan semua variabel ini sebagai variabel yang bervariasi secara independen dan normal di sekitar rata-rata, , dengan varians konstan, (homoskedastisitas):[6]
.
Secara spesifik, rata-rata variabel respons dimodelkan sebagai kombinasi linear dari variabel penjelas:
,
Di mana:
adalah rata-rata keseluruhan dari semua pengamatan
adalah efek utama tingkat i dari faktor pertama
adalah efek utama tingkat j dari faktor kedua
adalah efek interaksi, yang mewakili bagaimana kombinasi kedua faktor tersebut menyimpang dari jumlah efek masing-masing.
Cara lain yang setara untuk menggambarkan ANOVA dua arah adalah dengan menyebutkan bahwa selain variasi yang dijelaskan oleh faktor-faktor tersebut, masih ada beberapa noise statistika. Jumlah variasi yang tidak dijelaskan ini ditangani melalui pengenalan satu variabel acak per titik data, , yang disebut galat.[6] Variabel acak ini dilihat sebagai penyimpangan dari rata-rata, dan diasumsikan independen dan terdistribusi normal:
Model matematika bergantung pada beberapa asumsi untuk memastikan validitasnya. Asumsi-asumsi ini menghubungkan formulasi teoritis ANOVA dengan kondisi yang diperlukan untuk interpretasi hasil yang akurat.
Asumsi
Validitas ANOVA dua arah bergantung pada beberapa asumsi tentang model dan data. Kondisi-kondisi ini memastikan bahwa uji statistika yang digunakan untuk membandingkan efek faktor dapat diandalkan dan bahwa hasilnya dapat diinterpretasikan secara bermakna. Mengikuti Gelman dan Hill, asumsi ANOVA, dan lebih umum lagi model linear umum, adalah, dalam urutan kepentingan yang menurun:[7]
Relevansi data: Data harus mewakili pertanyaan yang sedang diselidiki. Misalnya, dalam studi pemupukan-irigasi, pengukuran pertumbuhan tanaman harus secara langsung mencerminkan perlakuan yang dibandingkan, bukan variasi yang tidak terkait seperti perbedaan tanah atau kesalahan pengukuran.
Aditivitas dan linearitas: Rata-rata variabel respons dipengaruhi secara aditif dan linier oleh faktor-faktor, kecuali jika terdapat istilah interaksi. Ini berarti bahwa efek dari setiap faktor bergabung sedemikian rupa untuk memprediksi hasilnya, dan penyimpangan dari aditivitas diwakili oleh istilah interaksi.
Kemandirian kesalahan: Kesalahan (atau residual) harus independen di seluruh pengamatan. Dalam contoh pemupukan-irigasi, pertumbuhan satu tanaman tidak boleh memengaruhi pengukuran pertumbuhan tanaman lain. Jika tidak, asumsi kemandirian dilanggar.
Homogenitas varians: Varians variabel dependen harus kira-kira sama di semua kombinasi perlakuan (Homoskedastisitas).[1] Ini memastikan bahwa tidak ada kelompok yang secara tidak proporsional mempengaruhi hasil keseluruhan.
Normalitas residual: Residual dalam setiap kombinasi perlakuan harus mengikuti distribusi Normal.[1] Asumsi ini memungkinkan uji F dan interval kepercayaan yang valid pada sampel kecil, meskipun ANOVA tangguh terhadap penyimpangan sedang dari normalitas ketika ukuran sampel besar.[6]
Pelanggaran asumsi ini dapat mendistorsi uji signifikansi dengan meningkatkan tingkat kesalahan Tipe I atau mengurangi kekuatan statistika.[1] Ketika kondisi ini tidak terpenuhi, peneliti dapat menerapkan transformasi data, menggunakan uji nonparametrik, atau mengadopsi model linier umum untuk mengakomodasi data dengan lebih baik.
Setelah asumsi ini cukup terpenuhi, parameter model dapat diperkirakan untuk mengukur efek utama dan interaksi dari faktor-faktor tersebut.
Setelah asumsi ini terpenuhi, parameter model dapat ditetapkan. Perkiraan parameter mengukur kontribusi setiap faktor dan interaksinya dalam analisis keseluruhan.
Perkiraan parameter
Setelah memverifikasi bahwa data memenuhi asumsi ANOVA (misalnya, normalitas dan kesamaan varians), langkah selanjutnya adalah mengestimasi parameter model. Tujuan estimasi parameter adalah untuk menemukan nilai-nilai yang paling baik menggambarkan bagaimana faktor dan interaksinya mempengaruhi hasil.
Untuk memastikan "identifikasi" parameter dalam model ANOVA dua arah, batasan jumlah-ke-nol biasanya diterapkan pada efek faktor:
Batasan ini menghilangkan tumpang tindih parameter, memungkinkan efek utama dan interaksi untuk diestimasi dengan tepat.
Dalam rancangan seimbang (di mana setiap kelompok atau kombinasi perlakuan memiliki jumlah sampel yang sama), nilai untuk setiap faktor dan interaksinya dapat diperkirakan menggunakan respons rata-rata dari setiap sel dan rata-rata keseluruhan. Dengan asumsi kesalahan terdistribusi normal, perkiraan kuadrat terkecil (LS) ini sama dengan perkiraan kemungkinan maksimum.[2]
Dalam rancangan yang tidak seimbang (di mana ukuran sampel berbeda), perkiraan bergantung pada sistem batasan yang digunakan. Beberapa sistem pembobotan ada termasuk "pembatasan C-", "UV-", dan "W-", yang bervariasi dalam cara mereka menangani ukuran kelompok yang tidak sama. Di antara ini, pendekatan "pembatasan W", di mana bobot proporsional dengan jumlah pengamatan di setiap sel, sering kali lebih disukai karena menghasilkan perkiraan parameter yang lebih jelas dan lebih mudah diinterpretasikan serta mempertahankan sifat statistika seperti ortogonalitas bila memungkinkan.[2]
Pengujian hipotesis
Dalam ANOVA dua arah klasik, pengujian hipotesis digunakan untuk menentukan apakah salah satu faktor, atau interaksinya, secara signifikan mempengaruhi variabel dependen. Hal ini dicapai dengan membagi total variasi dalam data menjadi beberapa bagian, yang disebut "jumlah kuadrat", yang sesuai dengan:
Faktor A (efek utama)
Faktor B (efek utama)
Interaksi A x B
Kesalahan acak (variasi residual)
Setiap "jumlah kuadrat" mewakili seberapa besar variasi dalam data yang dijelaskan oleh sumber tersebut.
Hipotesis nol untuk pengujian ini menyatakan bahwa setiap efek sama dengan nol. Artinya, baik faktor maupun interaksinya tidak memengaruhi hasil. Hipotesis nol yang sesuai adalah:
Praktik standar merekomendasikan pengujian istilah interaksi terlebih dahulu. Jika interaksi tersebut signifikan secara statistika, hal itu menunjukkan bahwa dampak satu faktor bergantung pada tingkat faktor lainnya, dan interpretasi harus difokuskan pada efek sederhana dalam setiap tingkat.[1]
Jika "istilah interaksi" tidak signifikan, maka tepat untuk memeriksa kedua efek utama secara terpisah. Dalam desain yang tidak seimbang, hasil dapat sedikit bervariasi tergantung pada metode yang digunakan untuk menghitung jumlah kuadrat. Tiga jenis yang paling umum adalah Tipe I (sekuensial), Tipe II (hierarkis), dan Tipe III (marginal). Sebagian besar program perangkat lunak statistika menggunakan jumlah kuadrat Tipe III karena mereka menyesuaikan setiap pengujian untuk semua faktor lain dalam model, sehingga hasil lebih mudah diinterpretasikan dalam praktik.[2][8]
Rancangan yang tidak seimbang
Meskipun ANOVA dua arah bekerja paling baik dengan ukuran sampel yang sama, eksperimen kehidupan nyata seringkali memiliki ukuran kelompok yang tidak sama, sehingga menghasilkan rancangan yang tidak seimbang. Ketika jumlah pengamatan berbeda di seluruh kombinasi perlakuan, ANOVA dua arah tidak lagi memiliki ortogonalitas, artinya variasi yang dijelaskan oleh satu faktor tidak lagi sepenuhnya independen dari faktor lainnya.[2] Hal ini membuat pemisahan dan interpretasi efek dari setiap faktor menjadi lebih sulit.
Dalam kasus seperti itu, dua pendekatan dapat diterapkan:
Menghilangkan pengaruh satu faktor sebelum menguji faktor lainnya ("efek yang disesuaikan").
Mengabaikan faktor lainnya ("efek yang tidak disesuaikan").[2]
Kedua metode ini memberikan hasil yang sama hanya ketika ukuran sampel proporsional di semua level. Untuk sebagian besar tujuan praktis, peneliti menggunakan efek yang disesuaikan untuk memastikan bahwa pengujian setiap faktor memperhitungkan variasi yang telah dijelaskan oleh faktor lainnya.[2]
Perangkat lunak statistika modern (misalnya R, SPSS, SAS) menerapkan logika ini secara otomatis, tetapi penting untuk menentukan jenis "jumlah kuadrat" yang digunakan dalam laporan. Dalam rancangan seimbang atau proporsional, semua jenis menghasilkan hasil yang identik.[9]
Contoh
Dataset hipotetis berikut memberikan contoh sederhana tentang bagaimana ANOVA dua arah memisahkan variasi total menjadi komponen yang dijelaskan oleh dua faktor eksperimental: Jenis pupuk dan Kondisi lingkungan. Pengukuran tersebut mewakili hasil panen tanaman yang dikumpulkan di bawah kombinasi pupuk dan pengaturan lingkungan yang berbeda.
CO2 ekstra
Kelembapan ekstra
Tanpa pupuk
7, 2, 1
7, 6
Nitrat
11, 6
10, 7, 3
Fosfat
5, 3, 4
11, 4
Dari hasil ini, variasi total (SSTotal) dibagi menjadi jumlah kuadrat untuk setiap faktor utama, interaksinya, dan kesalahan acak. Tabel ringkasan ANOVA di bawah ini menunjukkan berapa banyak variasi yang disebabkan oleh setiap sumber.
Sumber variasi
Jumlah kuadrat
Derajat kebebasan
Kuadrat rata-rata
Pupuk
525.43
2
262,72
Lingkungan
519,27
1
519,27
Pupuk x Lingkungan
84,83
2
42,42
Galat
9,43
9
1,05
Total
1138.96
14
-
Terakhir, nilai F untuk setiap efek dihitung dengan membagi kuadrat rata-rata faktor dengan kuadrat rata-rata kesalahan:
Jika istilah interaksi signifikan, ini menunjukkan bahwa jenis pupuk dan lingkungan memengaruhi hasil panen secara kombinasi, dan langkah selanjutnya adalah membandingkan efek sederhana dalam setiap level. Jika interaksi tidak signifikan, kedua efek utama dapat diinterpretasikan secara terpisah. Interpretasi semacam ini standar dalam biometri dan rancangan percobaan.[1][9]
↑Yates, Frank (March 1934). "The analysis of multiple classifications with unequal numbers in the different classes". Journal of the American Statistical Association. 29 (185): 51–66. doi:10.1080/01621459.1934.10502686. JSTOR2278459.