Pembelajaran mesin adversarial (AI) merupakan teknologi yang sangat berkembang pesat, dan berkembang pada berbagai sektor bidang kehidupan masyarakat sosial. Kemajuan AI genaratif teks dan gambar juga memengaruhi perkembangan kecerdasan buatan (AI) karena peranannya sangat penting dalam kehidupan. Di mana AI sangat dibutuhkan karena kecerdasan buatan ini dianggap oleh masyarakat sebagai tempat yang aman, andal dan tangguh untuk penyedia berbagai informasi.[1][2] Kecerdasan buatan sangat berkembang pesat dan berpengaruh besar, namun sangat rentan terhadap kegagalan sistem, kebocoran data dan ancaman keamanan. Sehingga diperlukan pengawasan yang lebih terhadap pengembangan sistem model kecerdasan buatan ini. Serangan ini dikenal dengan istilah adversarial machine learning.[3] Hal ini dapat mengeksploitasi kelemahan dalam model AI sehingga, dapat memanipulasi data yang berpotensi kesalahan dalam klasifikasi yang disenga hal ini sangat berbahaya bagi sistem AI sendiri.[4][5]

Adversarial Machine Learning sering kali menambahkann distorsi yang tidak terlihat oleh pengamat manusia. Di mana ia mengubah label prediksi dan dikaitan dengan sumber data atau gambar yang diambil. Dengan adanya adversarial machine learning ini dapat membantu manusia untuk menjelaskan sesuatu pembelajaran mesin yang terawasi dan tidak terawasi oleh manusia. Serta juga dapat memprediksi berbagai macam serangan yang akan terjadi dengan teknik algoritmanya.[6][7]

Cara kerja Adversarial

sunting

Serangan adversarial ini memanfaatkan cara kerja kecerdasan buatan (AI),[8] karena kerentanan dan keterbatasan yang melekat pada sistem model AI. Sistem ini bekerja dengan cara memaipulasi data masuk sehingga menghasilkan suatu model yang salah atau keliru. Pada sistem ini biasanya dimanfaatkan dengan beberapa langkah yaitu pemahaman sistem, manipulasi model dan ekspoilitasi sistem target.[9][3]

Pertama mereka mengalisis model penyerangan dengan cara mempelajari algoritma, proses pemerolehan data, serta menggunakan rekayasa balik model yang nanti akan memecah model AI dan mengidentifikasi kelemahan sistem. Kedua merancang input yang akan disalah artikan oleh sistem dan memodifikasi data yang masuk dalam pemerolahan bahasa alami sistem. Ketiga membuat sistem berperilaku tidak terduga dengan tujuan dapat meretas keamanan sistem. Setelah sistem rusak maka keaman sistem sulit untuk diketahui begitulah adversarial bekerja.[10]

Jenis-Jenis Serangan Adversarial

sunting

White box attacks memanfaatkan sistem informasi untuk perubahan kata. Selain itu ada juga serangan dengan cara merusak proses pembuatan model, yang bertujuan untuk penurunan akurasi dan kerentanan yang disengaja.[8] Black box attacks adalah serangan dengan memanfaatkan output dan input suatu sistem, hal ini bisa dengan serangan model tiruan. Dan juga sering kali mereka menebak model arah perubahan input yang memengaruhi output. Selanjutnya ada rondomized smoothing yang bekerja dengan cara menambahkan noise acak dalam proses inferensi. Teknik ini dapat memitigasi serangan adversarial terhadap prediksi model yang lebih stabil.[11] Jenis- jenis serangan seperti ini sangat bahaya karena penyerangan tidak butuh akses internal model sehingga lebih realistis serta dapat menargetkan pelayanan komersial kecerdasan buatan (AI).[12][7]

Keuntungan dan Kekurangan

sunting

Kelebihan

sunting

Adversarial training [10] sangat menguntungkan, karena cara sistemnya bekerja dengan menipu model. Sistem tujuan ini sangat bisa kita gunakan dalam hal meningkatan kualitas model sistem yang sedang kita kembangkan. Sistem training ini juga melatih sistem kita untuk tahan terhadap serangan dan kesalahan. Dengan mempelajari adversarial ini dapat kita ketahui bagaimana cara menjaga kemampuan generalisasi serta kalibrasi dan kepercayaan model yang lebih baik.[13]

Kekurangan

sunting

Kekurangan utama dalam Pembelajaran Mesin Adversarial, terutama terkait dengan Generative Adversarial Networks (GANs) dan kerentanan model terhadap serangan, adalah ketidakstabilan dan kesulitan pelatihan, di mana GAN sering mengalami Mode Collapse yaitu Generator hanya menghasilkan variasi data yang terbatas dan proses pelatihannya rentan terhadap gradien yang menghilang; selain itu, model Deep Learning secara umum menunjukkan kerentanan yang signifikan terhadap Adversarial Attacks, di mana manipulasi kecil pada data input, yang tidak terdeteksi oleh manusia, dapat menyebabkan kesalahan klasifikasi yang fatal dengan tingkat keyakinan tinggi, menyoroti kurangnya ketahanan (robustness) model dalam menghadapi gangguan, dan seringkali membutuhkan biaya komputasi yang tinggi untuk implementasi teknik pertahanan yang efektif.[5][7]

Galeri

sunting

Referensi

sunting
  1. ^ Alina Oprea, Alina (March 08, 2023 - September 30, 2023). Adversarial Machine Learning A Taxonomy and Terminology of Attacks and Mitigations (PDF). NIST Technical Series Policies Copyright, Use, and Licensing Statements NIST Technical Series Publication Identifier Synta. hlm. 74. ISBN NIST AI 100-2e2023 ipd. ; ; ; Pemeliharaan CS1: Status URL (link)
  2. ^ Geiping, Jonas; Fowl, Liam H.; Huang, W. Ronny; Czaja, Wojciech; Taylor, Gavin; Moeller, Michael; Goldstein, Tom (2020-10-02). "Witches' Brew: Industrial Scale Data Poisoning via Gradient Matching" (dalam bahasa Inggris).
  3. ^ a b "Pembelajaran Mesin Bermusuhan: Konsep, Jenis Serangan, Strategi & Pertahanan - Devzv". www.devzv.com. Diakses tanggal 2025-11-07.
  4. ^ "Adversarial Machine Learning: Menyerang dan Memperkuat Sistem Kecerdasan Buatan | SoalTekno.com" (dalam bahasa American English). 2024-07-09. Diakses tanggal 2025-11-07.
  5. ^ a b Blanchard, Peva; El Mhamdi, El Mahdi; Guerraoui, Rachid; Stainer, Julien (2017). "Machine Learning with Adversaries: Byzantine Tolerant Gradient Descent". Advances in Neural Information Processing Systems. 30. Curran Associates, Inc.
  6. ^ Vorobeychik, Yevgeniy; Kantarcioglu, Murat (2018-08-08). Adversarial Machine Learning (dalam bahasa Inggris). Morgan & Claypool Publishers. ISBN 978-1-68173-396-8.
  7. ^ a b c El-Mhamdi, El Mahdi; Farhadkhani, Sadegh; Guerraoui, Rachid; Guirguis, Arsany; Hoang, Lê-Nguyên; Rouault, Sébastien (2021). "Collaborative Learning in the Jungle (Decentralized, Byzantine, Heterogeneous, Asynchronous and Nonconvex Learning)". Advances in Neural Information Processing Systems. 34. Curran Associates, Inc.: 25044–25057.
  8. ^ a b "What Are Adversarial AI Attacks on Machine Learning?". Palo Alto Networks (dalam bahasa American English). Diakses tanggal 2025-11-08.
  9. ^ Goodfellow, Ian; McDaniel, Patrick; Papernot, Nicolas (2018-06-25). "Making machine learning robust against adversarial inputs". Commun. ACM. 61 (7): 56–66. doi:10.1145/3134599. ISSN 0001-0782.
  10. ^ a b "How Does Adversarial Training Create More Robust AI Agents?". www.getmonetizely.com (dalam bahasa Inggris). Diakses tanggal 2025-11-08.
  11. ^ Yanti, Hesmi Aria; Aulia, Indra; Fathiyana, Rana Zaini; Sularso, Alva Nurvina; Ilmi, Nurul; Muttaqin, Widang; Adidrana, Demi; Yutia, Syifa Nurgaida; Putro, Zuki Pristiantoro (2025-08-27). ARTIFICIAL INTELLIGENCE AND CYBERSECURITY: FOUNDATIONS, APPLICATIONS, AND FUTURE PERSPECTIVES. Penerbit Widina. ISBN 978-634-246-188-4.
  12. ^ "How to beat an adaptive/Bayesian spam filter (2004)" (dalam bahasa Inggris). Diakses tanggal 2025-11-22.
  13. ^ Chen, Lingjiao; Wang, Hongyi; Charles, Zachary; Papailiopoulos, Dimitris (2018-07-03). "DRACO: Byzantine-resilient Distributed Training via Redundant Gradients". Proceedings of the 35th International Conference on Machine Learning (dalam bahasa Inggris). PMLR: 903–912.

📚 Artikel Terkait di Wikipedia

Suplemen besi

Fortification Among Women of Childbearing Age: A Literature Review and Bayesian Meta-Analysis". Matern Child Nutr e13801. doi:10.1111/mcn.13801. PMID 39899434