Waktu tunggu antara letusan dan durasi letusan untuk Geyser Old Faithful di Taman Nasional Yellowstone, Wyoming, AS. Diagram sebar ini menunjukkan bahwa secara umum ada dua "tipe" letusan: waktu tunggu singkat-durasi singkat, dan waktu tunggu lama-durasi lama.
Analisis bivariat adalah salah satu bentuk analisis kuantitatif (statistika) yang paling sederhana. Analisis ini melibatkan analisis dua variabel (sering dilambangkan sebagai X, Y), dengan tujuan untuk menentukan hubungan empiris di antara keduanya.[1]
Analisis bivariat dapat membantu dalam menguji hipotesisasosiasi sederhana. Analisis bivariat dapat membantu menentukan sejauh mana menjadi lebih mudah untuk mengetahui dan memprediksi nilai untuk satu variabel (mungkin variabel dependen) jika diketahui nilai variabel lain (mungkin variabel independen) (lihat juga korelasi dan regresi linear sederhana).[2]
Analisis bivariat dapat dibedakan dengan analisis univariat di mana hanya satu variabel yang dianalisis. Seperti analisis univariat, analisis bivariat dapat bersifat deskriptif atau inferensial. Ini merupakan analisis hubungan antara dua variabel. Analisis bivariat adalah kasus khusus sederhana (dua variabel) dari analisis multivariat (di mana beberapa hubungan antara beberapa variabel diperiksa secara bersamaan).[1]
Regresi bivariat
Regresi adalah teknik statistik yang digunakan untuk membantu menyelidiki bagaimana variasi dalam satu atau lebih variabel memprediksi atau menjelaskan variasi dalam variabel lain. Regresi bivariat bertujuan untuk mengidentifikasi persamaan yang mewakili garis optimal yang mendefinisikan hubungan antara dua variabel berdasarkan kumpulan data tertentu. Persamaan ini kemudian diterapkan untuk mengantisipasi nilai variabel dependen yang tidak ada dalam kumpulan data awal. Melalui analisis regresi, seseorang dapat menurunkan persamaan untuk kurva atau garis lurus dan memperoleh koefisien korelasi.
Regresi linier sederhana
Regresi linier sederhana adalah metode statistik yang digunakan untuk memodelkan hubungan linier antara variabel independen dan variabel dependen. Metode ini mengasumsikan hubungan linier antara variabel dan sensitif terhadap pencilan (outlier). Persamaan linier yang paling sesuai sering direpresentasikan sebagai garis lurus untuk meminimalkan perbedaan antara nilai prediksi dari persamaan dan nilai aktual yang diamati dari variabel dependen.
Skema diagram sebar dengan regresi garis sederhana
Persamaan:
: variabel independen (prediktor)
: variabel dependen (hasil)
: kemiringan garis
: perpotongan sumbu
Garis regresi kuadrat terkecil (LSRL)
Garis regresi kuadrat terkecil adalah metode dalam regresi linier sederhana untuk memodelkan hubungan linier antara dua variabel, dan berfungsi sebagai alat untuk membuat prediksi berdasarkan nilai baru dari variabel independen. Perhitungannya didasarkan pada metode kriteria kuadrat terkecil. Tujuannya adalah untuk meminimalkan jumlah kuadrat jarak vertikal (residual) antara nilai y yang diamati dan nilai y prediksi yang sesuai dari setiap titik data.
Korelasi bivariat
Korelasi bivariat adalah ukuran apakah dan bagaimana dua variabel berkorelasi secara linier, yaitu apakah varians dari satu variabel berubah secara linier seiring perubahan varians variabel lainnya.
Kovarians dapat sulit diinterpretasikan di berbagai studi karena bergantung pada skala atau tingkat pengukuran yang digunakan. Karena alasan ini, kovarians distandarisasi dengan membagi dengan hasil perkalian deviasi standar dari kedua variabel untuk menghasilkan koefisien korelasi momen produk Pearson (juga disebut sebagai koefisien korelasi Pearson atau koefisien korelasi), yang biasanya dilambangkan dengan huruf r.[3]
Koefisien korelasi Pearson digunakan ketika kedua variabel diukur pada skala interval atau rasio. Koefisien korelasi atau analisis lain digunakan ketika variabel bukan interval atau rasio, atau ketika variabel tersebut tidak terdistribusi normal. Contohnya adalah koefisien korelasi Spearman, tau Kendall, korelasi biserial, dan analisis Chi-kuadrat.
Koefisien korelasi Pearson
Nilai
Jenis korelasi
Interpretasi
Contoh
Antara 0 dan 1
Positif
Ketika satu variabel berubah, variabel lainnya juga berubah ke "arah yang sama".
Waktu yang dihabiskan untuk berlari dan kalori yang terbakar
0
Tidak ada korelasi
"Tidak ada hubungan" antara variabel-variabel tersebut.
Jumlah teh yang diminum dan harga buah kiwi
Antara 0 dan −1
Negatif
Ketika satu variabel berubah, variabel lainnya berubah ke arah yang "berlawanan"..
Penurunan suhu dan penjualan es krim
Tiga catatan penting perlu digarisbawahi terkait korelasi:
Kehadiran pencilan dapat sangat membiaskan koefisien korelasi.
Ukuran sampel yang besar dapat menghasilkan korelasi yang signifikan secara statistika tetapi mungkin memiliki sedikit atau tidak ada signifikansi praktis.
Tidak mungkin untuk menarik kesimpulan tentang kausalitas berdasarkan analisis korelasi saja.
Ketika ada variabel dependen
Jika variabel dependen—variabel yang nilainya ditentukan sampai batas tertentu oleh variabel independen lainnya—adalah variabel kategorikal, seperti merek sereal pilihan, maka regresi probit atau logit (atau probit multinomial atau logit multinomial) dapat digunakan. Jika kedua variabel bersifat ordinal; artinya keduanya diurutkan sebagai pertama, kedua, dan seterusnya; maka koefisien korelasi peringkat dapat dihitung. Jika hanya variabel dependen yang ordinal, maka probit terurut atau logit terurut dapat digunakan. Jika variabel dependen bersifat sinambung—baik pada tingkat interval maupun rasio, seperti skala suhu atau skala pendapatan—maka regresi sederhana dapat digunakan.
Jika kedua variabel berupa deret waktu, jenis kausalitas tertentu yang dikenal sebagai kausalitas Granger dapat diuji, dan autoregresi vektor dapat dilakukan untuk memeriksa keterkaitan antar waktu antara variabel-variabel tersebut.
Ketika tidak ada variabel dependen
Ketika tidak ada variabel yang dapat dianggap bergantung pada variabel lainnya, regresi tidak tepat; tetapi beberapa bentuk analisis korelasi mungkin tepat.[4]
Metode grafis
Grafik yang tepat untuk analisis bivariat bergantung pada jenis variabel. Untuk dua variabel kontinu, plot hamburan adalah grafik yang umum. Ketika satu variabel kategorikal dan yang lainnya sinambung, plot kotak umum digunakan, dan ketika keduanya kategorikal, plot mosaik umum digunakan. Grafik-grafik ini merupakan bagian dari statistika deskriptif.