Apakah Error Kita Sudah Normal? Pertanyaan Klasik dalam Analisis Regresi
Gambar 1. Scatterplot dan garis regresi
Sumber: https://web.stanford.edu/class/stats202/notes/Linear-regression/Simple-linear-regression.html
Regresi merupakan suatu metode analisis statistik yang banyak digunakan di berbagai bidang, mulai dari ekonomi, sosial, kesehatan, hingga teknik. Dengan menggunakan regresi, seseorang dapat memperoleh informasi variabel bebas yang berpengaruh signifikan terhadap variabel tak bebas. Selain itu, model regresi yang diperoleh berdasarkan sampel dapat digunakan sebagai model prediksi. Sejak pertama kali diperkenalkan oleh Francis Galton pada akhir abad ke-19, regresi sudah mengalami banyak perkembangan, baik dari segi teori maupun aplikasi. Kini, berbagai bentuk pengembangan seperti regresi berganda, regresi logistik, hingga regresi spasial telah memperluas cakupan penggunaan metode ini, menjadikannya salah satu alat analisis yang paling penting dalam pemodelan dan pengambilan keputusan berbasis data.

Gambar 2. Tahapan Analisis Regresi
Secara umum, analisis data menggunakan regresi dilakukan melalui beberapa langkah. Pertama, menentukan variabel bebas dan variabel tak bebas yang akan digunakan. Dalam langkah ini, perlu dipahami mana variabel yang diduga memengaruhi nilai variabel lain dan mana yang dipengaruhi oleh variabel lain. Setelah itu, langkah kedua adalah membentuk model regresi taksiran. Model ini diperoleh setelah nilai koefisien regresi dihitung berdasarkan formula yang berlaku. Setelah model regresi ini diperoleh, langkah selanjutnya adalah langkah ketiga yang berisi pengecekan asumsi-asumsi regresi. Tujuan dilakukannya pengecekan ini adalah agar model yang diperoleh merupakan model yang valid dan tidak memberikan kesimpulan yang salah. Langkah keempat adalah melakukan uji F dan uji t untuk mengetahui apakah variabel bebas benar-benar berpengaruh terhadap variabel tak bebas, baik secara bersama-sama maupun secara terpisah. Terakhir, setelah semua tahap itu dilalui, model regresi yang sudah terbentuk dapat digunakan untuk memprediksi nilai variabel tak bebas di masa mendatang. Melalui rangkaian tahapan tersebut, analisis regresi tidak hanya membantu memahami hubungan antarvariabel, tetapi juga memberikan dasar yang kuat untuk membuat keputusan berdasarkan data.

Gambar 3. Analisis Error dalam Model Regresi
Model regresi yang diperoleh berdasarkan data disebut model taksiran. Dengan menggunakan model taksiran ini akan diperoleh nilai prediksi variabel respon. Ketika membandingkan nilai prediksi ini dengan nilai aktual variabel respon maka akan diperoleh error. Nilai error ini yang selanjutnya perlu diuji apakah berdistribusi normal atau tidak. Greene (2018) dalam bukunya yang berjudul Econometric Analysis, menyatakan bahwa ketika error berdistribusi normal, maka koefisien regresi akan berdistribusi normal, dimana hal ini menjamin akan penggunaan uji F dan uji t. Dengan kata lain, normalitas error menjamin bahwa hasil uji statistik yang diperoleh benar-benar mencerminkan kondisi sebenarnya dan dapat dijadikan dasar untuk menarik kesimpulan yang sahih tentang hubungan antara variabel bebas dan variabel tak bebas yang ada di dalam model.
Apa yang terjadi ketika error tidak berdistribusi normal? Jika merujuk ke paragraf sebelumnya maka dapat dikatakan bahwa hasil yang diperoleh pada uji F dan uji t akan tidak valid. Pada beberapa literatur disebutkan bahwa ketika jumlah sampel yang digunakan besar, akibat dari error yang tidak berdistribusi normal ini tidak terlalu serius. Hal ini dikaitkan dengan adanya Teorema Limit Pusat yang menyatakan bahwa ketika jumlah sampel meningkat, maka distribusinya akan mendekati distribusi normal. Namun yang menjadi pertanyaan selanjutnya adalah “berapakah jumlah sampel yang diperlukan untuk dapat dikatakan sebagai jumlah sampel yang besar?” Untuk menjawab hal ini diperlukan kajian lain yang akan di bahas dalam artikel selanjutnya.
Penulis: Margaretha Ohyver, S.Si., M.Si.
Referensi:
Greene, W. (2018) Econometric Analysis. 8th Edition, Pearson Education Limited, London.
Last updated :
SOCIAL MEDIA
Let’s relentlessly connected and get caught up each other.
Looking for tweets ...