Regresi pada dasarnya adalah memprediksi nilai suatu variabel (variabel terikat) berdasarkan variabel-variabel bebasnya. Regresi hanya memprediksi variabel yang sifat datanya interval atau rasio. Penggunaan regresi ini sangat banyak, mulai dari prediksi harga rumah, prediksi harga saham, prediksi kurs mata uang, sampai bidang geotermal yang misalnya dipakai untuk prediksi decline dari suatu sumur, baik itu sumur injeksi atau sumur produksi. Bahkan regresi juga bisa digunakan dalam kasus yang lebih sederhana, misalnya kamu ingin meneliti apakah tinggi badan mempengaruhi berat badan, maka kamu bisa menggunakan regresi dengan melihat berat badan sebagai variabel terikat dan tinggi badan sebagai variabel bebasnya.
Regresi terdiri dari 2 jenis, ada regresi linear dan juga regresi non-linear. Regresi linear ini merupakan salah satu jenis regresi yang paling sederhana. Persamaan linear itu jika kita plot, maka akan menghasilkan suatu garis lurus saja. Kita mengambil bentuk paling umum dari persamaan linear yaitu, slope-intercept form.
Jika kita masukkan konteks pengertian regresi tadi, maka kita bisa menganggap bahwa y adalah variabel yang ingin diprediksi, dan x adalah variabel bebas yang mempengaruhi nilai y. Sedangkan m merupakan slope atau gradien, dan b adalah intercept.
Kapan kita harus pakai linear regression?
Ada 4 tips yang bisa kalian pakai.
1. Pastikan bahwa proyek / masalah yang kalian kerjakan itu bisa diselesaikan dengan memprediksi suatu output.
2. Pastikan data yang kalian ingin prediksikan itu merupakan variabel terikat, dan tentunya dipengaruhi oleh minimal 1 variabel bebas.
3. Pastikan bahwa variabel terikat dan variabel bebas kalian memiliki tipe data kontinu.
4. Pastikan bahwa variabel bebas dan variabel terikat kalian memiliki strong positive relationship atau strong negative relationship. Strong positive relationship itu adalah berbanding lurus, sehingga semakin besar nilai variabel bebas, semakin besar juga nilai variabel terikat. Sementara strong negative relationship itu berbanding terbalik, sehingga semakin besar nilai variabel bebas, maka semakin kecil nilai variabel terikatnya.
Pelajari lebih lengkap di .