Kotak masuk email Anda memilah pesan promosi ke folder spam. Toko online menampilkan barang yang kebetulan sedang Anda cari. Papan ketik ponsel menebak kata berikutnya sebelum Anda selesai mengetik. Ketiga hal ini punya satu kesamaan: tidak ada orang yang menuliskan aturannya satu per satu. Mesinlah yang mempelajari polanya sendiri dari data, dan kemampuan itu kita sebut machine learning.

Secara singkat, machine learning adalah cabang kecerdasan buatan yang membuat mesin belajar dari data untuk membuat prediksi atau keputusan, tanpa diprogram untuk setiap kemungkinan. Istilah ini sering diterjemahkan sebagai pembelajaran mesin. Artikel ini akan membahasnya dari nol: apa pengertiannya, apa saja jenisnya, bagaimana cara kerjanya, hingga contoh nyatanya.

Machine Learning Adalah? Pengertian Sederhana

Machine learning adalah metode agar komputer bisa "belajar" dari pengalaman berupa data, lalu memperbaiki kinerjanya tanpa harus diprogram ulang secara manual. Istilah ini sudah dipakai sejak 1959 oleh Arthur Samuel, seorang peneliti yang membuat program catur yang makin pintar setiap kali bermain.

Untuk memahami apa yang istimewa, mari kita bandingkan dengan cara pemrograman biasa. Pada pemrograman tradisional, manusia menulis aturan secara eksplisit: "kalau email mengandung kata X, tandai sebagai spam". Pendekatan ini cepat kewalahan, karena pengirim spam terus mengganti kata-katanya.

Machine learning membalik urutannya. Daripada menulis aturan, kita memberi mesin ribuan contoh email yang sudah ditandai "spam" dan "bukan spam". Dari contoh-contoh itu, mesin menyusun sendiri pola yang membedakan keduanya. Hasil dari proses belajar ini disebut model, yaitu semacam rumus yang bisa dipakai untuk menilai email baru. Begitu ada trik spam baru, kita cukup memberi contoh tambahan, bukan menulis ulang aturan.

Istilah Penting dalam Machine Learning

Sebelum melangkah lebih jauh, ada beberapa istilah yang akan sering muncul. Mengenalnya sejak awal akan memudahkan Anda mengikuti pembahasan dan membaca berita teknologi.

  1. Dataset: kumpulan data yang dipakai untuk melatih dan menguji model.
  2. Fitur (feature): ciri atau variabel di dalam data, misalnya luas dan lokasi pada data harga rumah.
  3. Label: jawaban benar yang menyertai data, misalnya penanda "spam" atau "bukan spam".
  4. Model: hasil dari proses belajar; inilah yang dipakai untuk memprediksi data baru.
  5. Akurasi: ukuran seberapa sering prediksi model ternyata benar.

Posisi Machine Learning: AI, Machine Learning, Deep Learning

Tiga istilah ini sering tertukar: kecerdasan buatan, machine learning, dan deep learning. Padahal hubungannya berlapis, seperti lingkaran di dalam lingkaran.

  1. Kecerdasan buatan (AI): lingkaran terluar, yaitu segala upaya membuat mesin meniru kemampuan berpikir manusia.
  2. Machine learning: bagian dari AI tempat mesin belajar dari data, bukan dari aturan yang ditulis manusia. Inilah pendekatan yang mendasari hampir semua AI modern.
  3. Deep learning: bagian dari machine learning yang memakai jaringan saraf tiruan berlapis-lapis.

Jadi setiap machine learning adalah AI, tetapi tidak semua AI memakai machine learning. Untuk memahami lingkaran terluarnya, Anda bisa membaca pembahasan kami tentang apa itu kecerdasan buatan. Sementara untuk lingkaran terdalamnya, ada artikel khusus soal deep learning.

Diagram hierarki AI, machine learning, dan deep learning.Diagram hierarki AI, machine learning, dan deep learning.

Bagaimana Mesin Belajar? Cara Kerja Machine Learning

Proses melatih sebuah model machine learning bukan keajaiban, melainkan rangkaian langkah yang cukup tertib. Secara umum, alurnya seperti ini:

  1. Mengumpulkan data: semuanya berawal dari data, misalnya ribuan transaksi, foto, atau catatan cuaca. Semakin relevan datanya, semakin baik hasilnya.
  2. Membersihkan dan menyiapkan data: data mentah biasanya berantakan. Tahap ini merapikan data, mengisi yang kosong, dan memilih informasi yang penting untuk dipelajari.
  3. Melatih model: data dimasukkan ke sebuah algoritma yang mencari pola di dalamnya. Hasil pencarian pola inilah yang menjadi model.
  4. Menguji model: model diuji memakai data yang belum pernah ia lihat, untuk memastikan ia benar-benar mengenali pola, bukan sekadar menghafal.
  5. Menerapkan model: setelah hasilnya cukup baik, model dipakai untuk data nyata, lalu terus dipantau dan diperbarui.

Satu kebiasaan penting di sini adalah memisahkan data latih (untuk mengajari model) dari data uji (untuk menilai model). Tanpa pemisahan ini, kita bisa tertipu oleh model yang sebenarnya hanya menghafal jawaban.

Sebagai gambaran, bayangkan kita membuat penyaring spam. Kita kumpulkan ribuan email yang sudah ditandai spam dan bukan spam sebagai data. Teksnya kita rapikan agar siap diolah. Algoritma lalu mempelajari kata dan pola yang khas pada email spam. Setelah itu kita uji modelnya dengan email yang belum pernah ia lihat. Jika hasilnya memuaskan, penyaring dipasang di kotak masuk dan terus diperbarui seiring munculnya trik spam baru.

Diagram alur machine learning dari data hingga penerapan model.Diagram alur machine learning dari data hingga penerapan model.

Jenis-Jenis Machine Learning

Tidak semua mesin belajar dengan cara yang sama. Ada tiga gaya belajar utama, dan cara termudah memahaminya adalah lewat analogi.

  1. Supervised learning (belajar dengan kunci jawaban): mesin dilatih memakai data yang sudah diberi label, ibarat siswa yang belajar dari soal lengkap dengan kunci jawabannya. Gaya ini dipakai untuk memprediksi harga rumah atau memilah email spam. Sebagai contoh lain, dari ribuan data pasien berlabel, model bisa belajar memperkirakan risiko sebuah penyakit. Saat data berlabel sudah tersedia, supervised learning adalah pilihan paling umum.
  2. Unsupervised learning (mengelompokkan tanpa petunjuk): mesin diberi data tanpa label, lalu diminta menemukan pola atau kelompok sendiri. Ibarat Anda diberi setumpuk foto tanpa nama, lalu mengelompokkannya berdasarkan kemiripan. Toko online memakai gaya ini untuk mengelompokkan pembeli dengan kebiasaan belanja serupa, lalu menyesuaikan promosinya.
  3. Reinforcement learning (belajar dari hadiah dan hukuman): mesin belajar lewat coba-coba, mendapat "hadiah" saat benar dan "hukuman" saat salah. Ibarat melatih hewan dengan camilan. Gaya ini dipakai pada robotika dan AI permainan, misalnya program yang menjadi mahir setelah jutaan kali berlatih melawan dirinya sendiri.

Selain ketiganya, ada juga pendekatan semi-supervised learning, yang memakai sedikit data berlabel digabung dengan banyak data tanpa label. Pendekatan ini berguna ketika memberi label pada semua data terlalu mahal atau memakan waktu.

Diagram tiga jenis machine learning: supervised, unsupervised, dan.Diagram tiga jenis machine learning: supervised, unsupervised, dan.

Mengenal Algoritma Machine Learning Sekilas

Di dalam setiap proses belajar, ada algoritma, yaitu rangkaian langkah perhitungan yang dipakai mesin untuk menemukan pola. Anda tidak perlu menghafalnya, tetapi mengenal beberapa nama membantu Anda memahami berita atau dokumentasi.

Beberapa yang sering muncul antara lain regresi untuk memprediksi angka seperti harga. Ada pula decision tree yang memilah sesuatu ke dalam kategori lewat serangkaian pertanyaan. Ada juga clustering untuk mengelompokkan data yang mirip tanpa label. Setiap algoritma punya kekuatan masing-masing, dan pemilihannya menyesuaikan jenis data serta tujuannya. Kalau Anda ingin memahami konsep dasar di balik istilah ini, kami punya pembahasan terpisah soal pengertian algoritma.

Machine Learning vs Deep Learning: Apa Bedanya?

Karena keduanya sering disebut bersamaan, wajar bila banyak yang bingung. Deep learning sebenarnya bagian dari machine learning, tetapi punya ciri khas tersendiri.

Pada machine learning klasik, manusia masih perlu membantu menentukan ciri-ciri penting dalam data. Sedangkan deep learning, yang memakai jaringan saraf tiruan berlapis, menemukan ciri itu sendiri dari data mentah. Akibatnya deep learning unggul untuk data rumit seperti gambar dan suara, tetapi menuntut data dan daya komputasi yang jauh lebih besar.

Sebagai gambaran, untuk mengenali kucing dari foto, machine learning klasik mungkin perlu diberi tahu agar memperhatikan bentuk telinga dan kumis. Deep learning, sebaliknya, menemukan ciri-ciri itu sendiri setelah melihat ribuan foto. Karena itu, untuk masalah dengan data tabel yang rapi dan jumlah terbatas, machine learning klasik sering lebih hemat dan sudah cukup.

AspekMachine Learning KlasikDeep Learning
Perancangan fiturSebagian dibantu manusiaOtomatis oleh mesin
Kebutuhan dataBisa dengan data lebih sedikitSangat besar
Kebutuhan komputasiLebih ringanBerat, umumnya butuh GPU
Cocok untukData tabel & terstrukturGambar, suara, teks

Pembahasan lebih dalam soal lapisan jaringan dan cara kerjanya bisa Anda baca di artikel deep learning.

Kenapa Machine Learning Berkembang Pesat?

Gagasan machine learning sudah lama ada, tetapi baru terasa di mana-mana belakangan ini. Ada tiga hal yang membuatnya melonjak pada waktu yang tepat.

  1. Melimpahnya data: internet, ponsel, dan berbagai sensor menghasilkan data dalam jumlah raksasa, dan data inilah bahan bakar utama mesin untuk belajar.
  2. Komputasi yang terjangkau: perangkat keras makin kuat dan layanan komputasi awan membuat pelatihan model bisa dijangkau banyak orang, bukan hanya laboratorium besar.
  3. Kemajuan algoritma: metode belajar yang terus disempurnakan membuat hasil model makin akurat dan andal.

Pertemuan ketiga faktor inilah yang menjadikan machine learning sebagai tulang punggung hampir semua kemajuan kecerdasan buatan hari ini, mulai dari asisten suara hingga AI generatif.

Contoh Penerapan Machine Learning Sehari-hari

Banyak layanan yang Anda pakai setiap hari sebenarnya digerakkan oleh machine learning. Beberapa contohnya:

  1. Filter spam email: memilah pesan penting dari pesan sampah secara otomatis.
  2. Rekomendasi: daftar produk, film, atau lagu yang muncul untuk Anda berasal dari pola kebiasaan banyak pengguna.
  3. Deteksi penipuan: bank menandai transaksi kartu yang tidak wajar secara langsung.
  4. Prediksi: memperkirakan cuaca, permintaan barang, atau harga berdasarkan data masa lalu.
  5. Asisten suara: mengubah ucapan menjadi teks lalu memahami maksudnya.
  6. Pengenalan wajah dan gambar: mengenali wajah di foto atau saat membuka kunci ponsel.
  7. Chatbot layanan pelanggan: menjawab pertanyaan umum tanpa operator manusia.

Benang merah semua contoh ini sama: ada data masa lalu yang dipelajari, lalu polanya dipakai untuk menghadapi situasi baru. Itulah inti dari machine learning.

Ilustrasi enam penerapan machine learning dalam ikon grid.Ilustrasi enam penerapan machine learning dalam ikon grid.

Kelebihan Machine Learning

Deretan contoh di atas tidak akan ada tanpa sejumlah keunggulan yang membuat machine learning banyak diandalkan:

  1. Menemukan pola yang sulit dilihat manusia: mesin bisa menelaah jutaan data dan menangkap pola halus yang luput dari pengamatan manual.
  2. Mengotomasi keputusan berulang: pekerjaan menilai atau memilah dalam jumlah besar bisa berjalan otomatis dan konsisten.
  3. Makin baik seiring data bertambah: secara umum, semakin banyak data berkualitas, semakin akurat modelnya.
  4. Bekerja dalam skala besar: satu model bisa melayani jutaan permintaan tanpa kelelahan.

Kekurangan dan Hal yang Perlu Anda Pertimbangkan

Sekuat apa pun, machine learning bukan solusi ajaib. Ada beberapa hal yang perlu Anda pahami sebelum menaruh harapan terlalu tinggi.

  1. Sangat bergantung pada kualitas data: ada prinsip terkenal, garbage in, garbage out. Jika data latihnya buruk, hasil modelnya pun buruk, sebagus apa pun algoritmanya.
  2. Rentan terhadap bias: model belajar dari data yang diberikan. Jika data itu berat sebelah, keputusan model ikut berat sebelah, dan kesalahan ini sering sulit terdeteksi.
  3. Bisa terjebak menghafal (overfitting): model bisa terlalu cocok dengan data latih sehingga gagal saat menghadapi data baru. Ibarat siswa yang hafal soal latihan tetapi bingung saat soalnya diubah.
  4. Sebagian model sulit dijelaskan: beberapa model memberi jawaban benar tanpa bisa menunjukkan alasannya dengan jelas, dan ini menyulitkan di bidang yang menuntut pertanggungjawaban.
  5. Butuh pemeliharaan berkelanjutan: pola di dunia nyata berubah, sehingga model perlu dievaluasi dan dilatih ulang secara berkala.

Memahami batasan ini penting supaya Anda memakai machine learning di tempat yang tepat, bukan menganggapnya jawaban untuk semua masalah.

Bagaimana Cara Mulai Belajar Machine Learning?

Kalau pembahasan ini membuat Anda tertarik mendalaminya, kabar baiknya, jalan masuknya kini lebih terbuka daripada dulu. Anda tidak harus langsung menjadi ahli matematika.

Sebagai langkah awal, kuasai dasar pemrograman, khususnya bahasa Python yang paling banyak dipakai di bidang ini. Lalu pahami statistik dasar secukupnya, karena machine learning banyak berurusan dengan data dan peluang. Setelah itu, berlatihlah memakai dataset publik yang tersedia gratis, dan mulailah dari proyek kecil seperti memprediksi harga atau memilah gambar sederhana. Pemahaman akan tumbuh dari praktik, bukan sekadar teori.

Banyak kursus daring gratis dan komunitas yang bisa menemani perjalanan ini, baik berbahasa Inggris maupun Indonesia. Kuncinya bukan kecepatan, melainkan konsistensi menyelesaikan proyek kecil satu per satu hingga Anda terbiasa dengan alur kerjanya.

Kesimpulan

Machine learning adalah cabang kecerdasan buatan yang membuat mesin belajar pola dari data. Pola itu kemudian dipakai untuk memprediksi atau mengambil keputusan, tanpa perlu diprogram aturannya satu per satu. Cara kerjanya mengikuti alur yang tertib: mengumpulkan data, menyiapkannya, melatih model, mengujinya, lalu menerapkannya. Berdasarkan gaya belajarnya, ada tiga jenis utama, yaitu supervised, unsupervised, dan reinforcement learning.

Yang perlu selalu diingat, kualitas hasil sangat ditentukan oleh kualitas data. Tanpa data yang baik dan evaluasi yang jujur, model secanggih apa pun bisa keliru. Dengan memahami cara kerja sekaligus batasannya, Anda bisa menilai kapan machine learning benar-benar layak dipakai. Semoga artikel ini membantu.