📑 Table of Contents


Pembelajaran tak terbimbing, pembelajaran tidak terawasi, pemelajaran tak terarah (Inggris: unsupervised learning) adalah teknik pemelajaran mesin di mana kita tidak perlu mengawasi modelnya namun kita perlu mengizinkan model bekerja sendiri untuk menemukan informasi yang dibutuhkan. Hal ini terutama berkaitan dengan data tanpa label.

Algoritma pembelajaran tak terarah memungkinkan kita melakukan tugas pemrosesan yang lebih kompleks dibandingkan dengan pembelajaran terarah. Meskipun, pembelajaran tak terarah bisa lebih tak terduga dibandingkan dengan pembelajaran alami lainnya dalam pembelajaran dan metode reinforcement learning. Pembelajaran mesin tak terarah dapat menemukan semua jenis pola yang tidak diketahui dalam data. Metode yang tak terarah ini dapat membantu menemukan fitur yang berguna untuk pengelompokan. Pengelompokan ini dapat berlangsung secara real time, sehingga semua data masukan dianalisis dan diberi label. Realitasnya, lebih mudah untuk mendapatkan data tidak berlabel dari komputer daripada data berlabel yang membutuhkan intervensi manual.

Zoubin Ghahramani menyatakan dalam tulisannya yang disunting lebih dari 530 kali, bahwa ia menjelaskan secara ringkas mengenai pemelajaran tak terarah dari sudut pandang pemodelan statistic.[1] Pemelajaran tak terarah terinspirasi dari teori informasi dan prinsip Bayesian. Ghahramani menjelaskan scara ringkas model dasar pada pemelajaran tak terarah meliputi Analisa faktor, Principal Component Analysis (PCA), percampuran Gaussian, Hidden Markov Model, ruang-status model, dan berbagai variasi tambahan. Ia menurunkan algoritma EM dan memberikan tinjauan singkat mengenai konsep dasar model grafis, dan algoritma inferensi grafis. Ia juga memberikan pemelajaran singkat mengenai perkiraan inferensi Bayesian yang dimana juga termasuk Markov Chain Monte Carlo (MCMC), Perkiraan Laplace, BIC, perkiraan variasi, dan Expectation Propagation (EP). Ia bertujuan dengan adanya karya nya ini agar ia dapat menyajikan pandangan dari sisi yang lebih tinggi dalam bidang ini.

Cara kerja

sunting

Sebagai contoh pada seorang bayi dan anjing peliharaan keluarganya. Bayi dapat mengenali dan mengidentifikasi anjing ini. Beberapa minggu kemudian seorang teman keluarga membawa serta seekor anjing dan mencoba bermain dengan bayinya. Bayi tersebut belum pernah melihat anjing lain ini sebelumnya. Namun, ia mengakui banyak fitur (2 telinga, mata, berjalan dengan 4 kaki) seperti anjing peliharaannya yang telah ia kenal sebelumnya. Dia mengidentifikasi hewan baru yang tampaknya seperti ciri-ciri anjing walaupun belum bisa menyebutkan jenis mereka adalah anjing. Ini adalah pembelajaran tak terarah, di mana kita tidak diajarkan label tetapi kita belajar dari data (dalam hal ini data atau ciri-ciri tentang seekor anjing). Seandainya ini pembelajaran yang diawasi, teman keluarga akan memberi tahu bayi bahwa itu seekor anjing.[butuh rujukan]

Jenis-Jenis

sunting
  • Kekelompokan (clustering) adalah teknik analisis data yang digunakan untuk mengelompokkan objek berdasarkan kesamaan tertentu. Metode ini membantu mengidentifikasi struktur tersembunyi dalam dataset dengan membagi data ke dalam beberapa kelompok atau cluster yang memiliki karakteristik serupa.
  • K-Means merupakan algoritma kekelompokan yang bekerja dengan menentukan sejumlah pusat cluster (centroid) dan mengalokasikan setiap data ke centroid terdekat. Proses iteratif dilakukan hingga posisi centroid stabil. Algoritma ini banyak digunakan dalam segmentasi pelanggan, analisis perilaku, dan pengelompokan data tanpa label.
  • Pengelompokan Hirarkis membangun struktur pengelompokan dalam bentuk dendrogram. Metode ini dapat dilakukan melalui pendekatan agglomerative (penggabungan dari unit kecil ke besar) atau divisive (pemisahan dari cluster besar menjadi lebih kecil). Teknik ini memungkinkan peninjauan hubungan bertingkat antar objek dalam dataset.
  • DBSCAN (Density-Based Spatial Clustering of Applications with Noise) adalah algoritma berbasis kepadatan yang mengidentifikasi cluster pada area dengan konsentrasi titik data tinggi. Titik dengan kepadatan rendah dianggap sebagai noise. Algoritma ini efektif untuk dataset dengan bentuk cluster tidak beraturan dan ukuran bervariasi.
  • Pengurangan dimensi (dimensionality reduction) adalah proses menyederhanakan dataset dengan mengurangi jumlah variabel tanpa menurunkan informasi penting. Teknik ini berguna untuk visualisasi data berdimensi tinggi dan meningkatkan efisiensi analisis.
  • Principal Component Analysis (PCA) mentransformasikan data berdimensi tinggi menjadi dimensi lebih rendah dengan mempertahankan variansi terbesar. PCA digunakan untuk penyederhanaan dataset, pengurangan noise, dan eksplorasi pola.
  • t-SNE adalah algoritma visualisasi yang memetakan data berdimensi tinggi ke ruang dua atau tiga dimensi. Teknik ini efektif mengungkap struktur lokal dan pola tersembunyi dalam dataset kompleks.
  • Autoencoder atau Pengkode Otomatis adalah jaringan saraf tiruan yang digunakan untuk pengurangan dimensi melalui proses rekonstruksi data. Dengan menggunakan lapisan tersembunyi berukuran lebih kecil, autoencoder menghasilkan representasi fitur yang lebih ringkas.
  • Pembelajaran aturan asosiasi (association rule learning) digunakan untuk menemukan hubungan antar variabel dalam dataset, terutama pada data transaksi.
  • Algoritma Apriori mengidentifikasi pola frekuensi tinggi (frequent itemsets) untuk menghasilkan aturan asosiasi. Algoritma ini umum diterapkan dalam analisis keranjang belanja untuk memahami keterkaitan antaritem.
  • Algoritma Eclat merupakan algoritma yang menggunakan pendekatan set intersection untuk menemukan pola asosiasi. Metode ini sering lebih efisien dibanding Apriori dalam mengidentifikasi hubungan antaritem karena eksplorasi himpunan dilakukan secara sistematis. [2]

Referensi

sunting
  1. ^ Ghahramani, Zoubin (2004). Bousquet, Olivier; von Luxburg, Ulrike; Rätsch, Gunnar (ed.). Advanced Lectures on Machine Learning: ML Summer Schools 2003, Canberra, Australia, February 2 - 14, 2003, Tübingen, Germany, August 4 - 16, 2003, Revised Lectures. Lecture Notes in Computer Science (dalam bahasa Inggris). Berlin, Heidelberg: Springer. hlm. 72–112. doi:10.1007/978-3-540-28650-9_5. ISBN 978-3-540-28650-9.
  2. ^ "Apa itu Unsupervised Learning ? Arti, Jenis, dan Penerapan". www.fanruan.com. Diakses tanggal 2025-11-22.

📚 Artikel Terkait di Wikipedia

Kecerdasan buatan generatif

"Generate Your Favourite Characters' Voice Lines using Machine Learning". Towards Data Science (dalam bahasa American English). Diakses tanggal 2025-11-22

Seni kecerdasan buatan

terbuka Automatic1111. Eksibisi "Thinking Machines: Art and Design in the Computer Age, 1959–1989" yang digelar di MoMA memperlihatkan ikhtisar tentang penerapan

Pemelajaran mesin kuantum

Sébastien (2006-06-07). "Machine Learning in a Quantum World". Advances in Artificial Intelligence. Lecture Notes in Computer Science (dalam bahasa Inggris). Vol

Pembelajaran mesin

Machine perception Computer vision, including object recognition Natural language processing Syntactic pattern recognition Machine learning Medical diagnosis

Kecerdasan buatan dalam kesehatan mental

menjadikannya lebih aksesibel, praktis, dan etis bagi individu. Machine Learning merupakan sebuah subset dari kecerdasan buatan (AI) yang memungkinkan mesin

Jaringan saraf konvolusional

neural networks represent deep learning architectures that are currently used in a wide range of applications, including computer vision, speech recognition

Augmentasi data

Cryptographic Hardware and Embedded Systems – CHES 2017. Lecture Notes in Computer Science (dalam bahasa Inggris). Vol. 10529. Cham: Springer International Publishing

Meteorologi

to understand meteorological computer models. Written at a bachelor's degree level. The GLOBE Program - (Global Learning and Observations to Benefit the