Dalam deteksi anomali, faktor pencilan setempat[1] (bahasa Inggris: local outlier factor, disingkat LOF) adalah algoritma untuk mencari titik-titik data yang menyimpang (anomali) dengan mengukur simpangan setempat tiap titik data terhadap para tetangganya.[2] Algoritma ini diusulkan oleh Markus M. Breunig, Hans-Peter Kriegel, Raymond T. Ng, dan Jörg Sander pada tahun 2000.

LOF menggunakan konsep yang sama dengan DBSCAN dan OPTICS, yaitu konsep "jarak inti" dan "jarak keterjangkauan" yang sering dipakai dalam perkiraan kerapatan setempat.[3]

Penjelasan sederhana

sunting
Secara sederhana, LOF membandingkan kerapatan setempat suatu titik dengan kerapatan setempat para tetangganya. Titik A memiliki kerapatan yang lebih rendah daripada para tetangganya.

Faktor pencilan setempat menggunakan konsep kerapatan setempat (kerapatan lokal), yaitu jarak ke k tetangga terdekat dipakai untuk memperkirakan kerapatannya. Dengan membandingkan kerapatan setempat suatu titik dengan kerapatan setempat para tetangganya, kita dapat menentukan wilayah yang memiliki kerapatan yang mirip dan titik-titik yang memiliki kerapatan yang lebih rendah daripada para tetangganya. Titik-titik itulah yang disebut sebagai pencilan.

Kerapatan setempat diperkirakan dengan menghitung jarak suatu titik yang dapat "dijangkau" dari para tetangganya.

Referensi

sunting
  1. ^ Pusat Bahasa. "Glosarium". Departemen Pendidikan Nasional. Diarsipkan dari asli tanggal 2023-07-17. Diakses tanggal 2020-12-03.
  2. ^ Breunig, M. M.; Kriegel, H.-P.; Ng, R. T.; Sander, J. (2000). LOF: Identifying Density-based Local Outliers (PDF). Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data. SIGMOD. hlm. 93–104. doi:10.1145/335191.335388. ISBN 1-5811-3217-4.
  3. ^ Breunig, M. M.; Kriegel, H.-P.; Ng, R. T.; Sander, J. R. (1999). "OPTICS-OF: Identifying Local Outliers" (PDF). Principles of Data Mining and Knowledge Discovery. Lecture Notes in Computer Science. Vol. 1704. hlm. 262. doi:10.1007/978-3-540-48247-5_28. ISBN 978-3-5406-6490-1. Diarsipkan dari asli (PDF) tanggal 2022-02-11. Diakses tanggal 2020-12-03.

📚 Artikel Terkait di Wikipedia

Pembelajaran tak terbimbing

memungkinkan peninjauan hubungan bertingkat antar objek dalam dataset. DBSCAN (Density-Based Spatial Clustering of Applications with Noise) adalah algoritma

Apache SystemDS

Algoritma pengelompokan DBSCAN dengan jarak Euclidean. X = rand(rows=1780, cols=180, min=1, max=20) [indices, model] = dbscan(X = X, eps = 2.5, minPts

Lokalisasi suara 3D

(RANSAC) dan Pengelompokan spasial berbasis kepadatan aplikasi dengan derau (DBSCAN) dapat diterapkan untuk mengidentifikasi pergeseran fase (pemetaan ke azimuth)