telojowo.web.id

Berlayar Mengikuti Arus Perubahan

Post Page Advertisement [Top]

Fundamental  Machine Learning
Fundamental Machine Learning 


Machine learning, pada dasarnya berada di persimpangan antara dua disiplin ilmu—data science dan rekayasa perangkat lunak. Tujuan dari machine learning adalah menggunakan data untuk membuat model prediktif yang dapat diintegrasikan ke dalam aplikasi atau layanan perangkat lunak.  

Untuk mencapai tujuan ini, diperlukan kolaborasi antara data scientist, yang bertugas mengeksplorasi dan menyiapkan data sebelum digunakan untuk melatih model machine learning, dan software developer, yang mengintegrasikan model tersebut ke dalam aplikasi agar dapat digunakan untuk memprediksi nilai data baru (proses ini dikenal sebagai inferensi).



Apa itu Machine Learning? 


Machine learning berasal dari statistika dan pemodelan matematis data. Gagasan utama dalam machine learning adalah menggunakan data dari observasi sebelumnya untuk memprediksi hasil atau nilai yang belum diketahui.  

 

Sebagai contoh:


  • Seorang pemilik toko es krim mungkin menggunakan aplikasi yang menggabungkan data penjualan historis dan catatan cuaca untuk memprediksi berapa banyak es krim yang kemungkinan akan terjual pada hari tertentu berdasarkan prakiraan cuaca.  
  • Seorang dokter dapat menggunakan data klinis dari pasien sebelumnya untuk menjalankan tes otomatis yang memprediksi apakah pasien baru berisiko terkena diabetes berdasarkan faktor seperti berat badan, kadar gula darah, dan pengukuran lainnya.  
  • Seorang peneliti di Antartika dapat menggunakan data observasi sebelumnya untuk mengotomatisasi identifikasi berbagai spesies penguin (seperti Adelie, Gentoo, atau Chinstrap) berdasarkan pengukuran sirip, paruh, dan atribut fisik lainnya.

 

 

Machine Learning sebagai Fungsi

 

Karena machine learning didasarkan pada matematika dan statistika, tidak jarang model machine learning dipahami dalam istilah matematis. Secara fundamental, model machine learning adalah aplikasi perangkat lunak yang merangkum sebuah fungsi untuk menghitung nilai output berdasarkan satu atau lebih nilai input. Proses mendefinisikan fungsi ini disebut training (pelatihan). Setelah fungsi tersebut didefinisikan, model dapat digunakan untuk memprediksi nilai baru dalam proses yang disebut inferensi.  

Mari kita jelajahi langkah-langkah yang terlibat dalam training dan inferensi.

machine learning

 

1. Data pelatihan terdiri dari observasi masa lalu. Dalam kebanyakan kasus, observasi mencakup atribut atau fitur yang diamati dari suatu objek, serta nilai yang ingin diprediksi oleh model (dikenal sebagai label).  

Dalam istilah matematika, fitur sering kali dilambangkan dengan variabel x, sedangkan label dilambangkan dengan y. Biasanya, sebuah observasi memiliki beberapa nilai fitur, sehingga x sebenarnya berbentuk vektor (array dengan beberapa nilai), seperti berikut: [x₁, x₂, x₃, ...].


Agar lebih jelas, mari kita terapkan konsep ini pada contoh-contoh sebelumnya:  

  • Penjualan es krim: Tujuan kita adalah melatih model yang dapat memprediksi jumlah es krim yang akan terjual berdasarkan kondisi cuaca. Pengukuran cuaca pada hari tertentu (seperti suhu, curah hujan, kecepatan angin, dll.) adalah fitur (x), sedangkan jumlah es krim yang terjual pada hari itu adalah label (y).  
  • Prediksi risiko diabetes: Tujuannya adalah memprediksi apakah seorang pasien berisiko terkena diabetes berdasarkan pengukuran klinisnya. Data pasien seperti berat badan, kadar gula darah, dan faktor kesehatan lainnya merupakan fitur (x), sedangkan risiko diabetes (misalnya, 1 untuk berisiko, 0 untuk tidak berisiko) adalah label (y).  
  • Identifikasi spesies penguin: Kita ingin memprediksi spesies penguin berdasarkan atribut fisiknya. Pengukuran utama seperti panjang sirip dan lebar paruh adalah fitur (x), sedangkan spesies penguin (misalnya, 0 untuk Adelie, 1 untuk Gentoo, atau 2 untuk Chinstrap) adalah label (y).

 

2. Penerapan algoritma
Sebuah algoritma diterapkan pada data untuk menemukan hubungan antara fitur dan label, serta merumuskannya sebagai sebuah perhitungan yang dapat digunakan untuk menentukan y berdasarkan x.  
Algoritma yang digunakan tergantung pada jenis masalah prediktif yang ingin diselesaikan (akan dibahas lebih lanjut nanti). Namun, prinsip dasarnya adalah mencoba menyesuaikan data dengan suatu fungsi sehingga nilai fitur dapat digunakan untuk menghitung label.

 

3. Hasil dari algoritma adalah model
Algoritma menghasilkan sebuah model yang merangkum perhitungan yang telah diturunkan sebagai sebuah fungsi—mari kita sebut fungsi ini sebagai f. Dalam notasi matematika, hubungan ini dapat dituliskan sebagai:  

     y = f(x)
  

Artinya, model yang telah dilatih dapat menggunakan fitur x sebagai input untuk menghitung atau memprediksi nilai y sebagai output.


4. Inferensi dengan model yang telah dilatih
Setelah fase training selesai, model yang telah dilatih dapat digunakan untuk inferensi. Model ini pada dasarnya adalah sebuah program perangkat lunak yang merangkum fungsi hasil dari proses pelatihan.  

Saat kita memasukkan sekumpulan nilai fitur sebagai input, model akan menghasilkan prediksi dari label yang sesuai sebagai output. Karena output dari model ini adalah hasil perhitungan berdasarkan fungsi, bukan nilai yang benar-benar diamati, maka sering kali output tersebut dilambangkan sebagai Ĺ· (dibaca y-hat).  

Dengan kata lain:  
  
   Ĺ· = f(x)
 

Ini menunjukkan bahwa nilai Ĺ· adalah hasil prediksi dari model, bukan nilai y yang sebenarnya.


Selanjutnya



Tidak ada komentar:

Posting Komentar

Postingan Terbaru

Bottom Ad [Post Page]