Referensi : Pengenalan Konsep Pembelajaran Mesin dan Deep Learning (Jan Wira Gotama Putra)
1. Tujuan [back]
1. Memahami algoritma machine learning model linear
2. Alat dan Bahan [back]
Alat yang digunakan pada pembelajaran ini adalah software Matlab
3. Dasar Teori [back]
MATLAB merupakan bahasa pemrograman tingkat tinggi yang dikembangkan oleh MathWorks dan dikhususkan untuk komputasi numerik, visualisasi, dan pemrograman.
MODEL LINEAR
1. Pengertian
Model linear adalah kombinasi linear dari fungs nonlinear dari variable input.
Persamaan linear sederhana :
Dimana yi adalah nilai sebenarnya dan yi~ adalah nilai perkiraan.
2. Binary classification
Binary classification adalah suatu metode untuk menklasifikasikan data menjadi 2 kelas.
F(x) > threshold maka masuk ke kelas 1, F(x) < threshold maka masuk ke kelas 2. Threshold ini menjadi pembatas antara 2 kela (boundary decision).
3. Log-Linear Binary Classification
Digunakan untuk mengetahui besar peluang data tergolong pada suatu kelas.
Fungsi diatas juga dapat diyatakan dalam fungsi logistik
Terdapat 2 jenis multiclass classification, yaitu :
a. One versus one
Pada teknik one versus one, kita membuat sejumlah kombinasi pasangan kelas. Kemudian tiap model mengklasifikasikan input ke dalam satu dari 2 kelas. Pemilihan kelas klasifikasi didasarkan pada kelas yang sering muncul.
yi = 1 | yi = -1 | Hipotesis |
Kelas 1 | kelas 2 | |
Kelas 1 | kelas 3 | |
Kelas 1 | kelas 4 | |
Kelas 2 | kelas 3 | |
Kelas 2 | Kelas 4 | |
Kelas 3 | Kelas 4 |
a. One versus all
Model pertama mengklasifikasikan input sebagai kelas pertama atau bukan kelas pertama. Setelah itu, dilanjutkan ke model kedua mengklasifikasikan input sebagai kelas kedua atau bukan kelas kedua, dan seterusnya.
Pada Multi label Classification mendefinisikan suatu data bisa saja tidak hanya dikelompokkan ke dalam 1 kelas, tetapi bisa saja memenuhi kategori dari 2 kelas yang berbeda.
Contoh :
Tujuan dari pembelajaran (training) adalah untuk meminimalkan error sehingga kinerja learning machine (model) diukur oleh squared error. Dengan kata lain, utility function adalah meminimalkan squared error.
θ adalah learning parameter dan θ^ adalah nilai parameter paling optimal. Dan L adalah loss function.
7. Batasan Model Linear
Terdapat 2 batasan yaitu:
a. Additive assumption
Additive assumption berarti model linear menganggap hubungan antara input dan output adalah linear
a. Linear assumption
Linear assumption berarti perubahan pada suatu fitur xi mengakibatkan perubahan yang konstan terhadap output, walaupun seberapa besar/kecil nilai xi tersebut.
Underfitting adalah keadaan ketika kinerja model bernilai buruk baik pada training atau validation maupun testing data.
Overfitting adalah keadaan ketika kinerja model bernilai baik untuk training tetapi buruk pada unseen data.
Merupakan suatu metode untuk menghindari overfitting. Caranya degan mengontrol kompleksitas parameter.
Dimana R(w) adalah fungsi regularization dan L adalah parameter control.
10. Transformasi Data
Fungsi transformasi yang digunakan :
Beberapa fungsi transformasi :
1. Fisher Kernel
2. Graph Kernel
3. Kernel Smoother
4. Polynomial Kernel
5. Radial Basis Function Kernel
6. String Kernel
Tidak ada komentar:
Posting Komentar