Membuat Model Linear Regression dengan Google Colabs (Supervised Learning — ML)

Imelda Zahra Tungga Dewi
3 min readAug 15, 2020

--

Salah satu teknik supervised learning yang mudah dan sering dipakai adalah si Regression atau Regresi ini. Pada model regresi, ML akan memprediksi bilangan numerik berdasarkan atribut yang ada. Jenis-jenis regresi linear adalah regresi linear, regresi polinomial, lasso regression, stepwise regression dan lain-lain. Namun pada kesempatan kali ini kita akan mencoba membuat regresi linear. Regresi linear adalah sebuah pendekatan untuk memodelkan hubungan antara variable terikat Y dan satu atau lebih variable bebas yang disebut X. Salah satu kegunaan dari regresi linear ini untuk melakukan nilai prediksi berdasarkan model dari data-data yang telah dimiliki sebelumnya. Hubungan di antara variabel-variabel tersebut disebut sebagai model regresi linear. Sesuai namanya (linear), regresi linear direpresentasikan dengan sebuah garis lurus atau garis regresi. Garis ini hanyalah sebuah prediksi, jadi pasti akan ada penyimpangan nilai terhadap nilai asli yang kita sebut dengan error. Semakin sedikit nilai error maka model regresi linear kita memiliki hasil yang optimal.

Contoh sederhana regresi linear adalah memperkirakan harga mobil berdasarkan kategori mobil yaitu harga, kapasitas dan lain-lain. Namun untuk implementasi pada kebanyakan kasus, regresi linear kurang direkomendasikan karena selalu mengasumsikan ada hubungan linier pada data, padahal terkadang tidak.

Pada latihan kali ini kita akan belajar membuat prediksi harga mobil dengan metode regresi linear.

Untuk menjalankan program ML, tools yang akan kita gunakan adalah Google Colaboratory.

https://colab.research.google.com

tools ini secara penggunaannya mirip sama Jupyter Notebook dan dibuat diatas environment Jupyter dengan tidak memerlukan pengaturan atau setup terlebih dahulu sebelum digunakan. Google colab berjalan sepenuhnya pada Cloud dengan memanfaatkan media penyimpanan Google Drive. Google colab cocok untuk belajar kalo pake hape kentang yang suka ngelag atau lemot kalau pake jupyter notebook ><

Okay gausah basa basi lagi ya, let’s code!

  1. Masukkan atau import library yang mau kita pakai. Pada latihan ini kita menggunakan library sklearn yang dapat mengimplementasikan regresi linear. Lalu buat array dengan data yang kita punya (data yang kita pakai disini yaitu capacity dan car_price)

2. Buat scatter plot

Nah selanjutnya kita buat scatter plot dengan plt.scatter , lalu kita definisikan variabel capacity sebagai sumbu x dan car_price sebagai sumbu y.

Nah sudah terlihat ya variabel capacity ada di sumbu x dan car_price di sumbu y.

3. Melatih model dengan fungsi fit

4. Model prediksi menyesuaikan plot yang kita buat

Model regresi linier merupakan salah satu model machine learning yang paling sederhana. Namun ia memiliki kompleksitas yang rendah namun optimal pada dataset yang memiliki hubungan linear. Tanda titik diluar garis merupakan error atau penyimpangan. Semakin banyak error maka data prediksi memiliki hasil yang kurang optimal. Model linear regression ini juga merupakan representasi dari visualisasi data menggunakan diagram scatter plot. Mungkin nanti aku akan bahas juga kenapa si visualisasi data itu sangat penting diberbagai lini kehidupan kita.

Okey, sampai sini dulu hari ini! Besok kita lanjut ke contoh pengimplementasian yang lain. Semangat ngoding🤗❤

--

--

Imelda Zahra Tungga Dewi
Imelda Zahra Tungga Dewi

Written by Imelda Zahra Tungga Dewi

Electronics and Instrumentation💥 Applied Physics✨

No responses yet