Narrative Network of US Election 2012 - Nodes indicate noun phrases, links go from subject to object, color expresses relation of support or opposition. Appeared in: "Automated analysis of the US presidential elections using Big Data and network analysis; S Sudhahar, GA Veltri, N Cristianini; Big Data & Society 2 (1), 1-28, 2015"

Penambangan teks (bahasa Inggris: text mining) adalah proses ekstraksi pola berupa informasi dan pengetahuan yang berguna dari sejumlah besar sumber data teks, seperti dokumen Word, PDF, kutipan teks, dll. Jenis masukan untuk penambangan teks ini disebut data tak terstruktur dan merupakan pembeda utama dengan penambangan data yang menggunakan data terstruktur atau basis data sebagai masukan. Penambangan teks dapat dianggap sebagai proses dua tahap yang diawali dengan penerapan struktur terhadap sumber data teks dan dilanjutkan dengan ekstraksi informasi dan pengetahuan yang relevan dari data teks terstruktur ini dengan menggunakan teknik dan alat yang sama dengan penambangan data. Proses yang umum dilakukan oleh penambangan teks di antaranya adalah perangkuman otomatis, kategorisasi dokumen, penggugusan teks, deteksi plagiarisme, dll. (Turban, et.al., 2011)

Rujukan

sunting
  • Berry, M.W.; Kogan, J. (2010). Text Mining: Application and Theory. Chichester: John Wiley & Sons, Ltd.
  • Feldman, R.; Sanger, J. (2007). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. New York: Cambridge University Press.
  • Turban, E.; et al. (2011). Decision Support and Business Intelligence Systems (Edisi 9). New Jersey: Pearson Education, Inc.


📚 Artikel Terkait di Wikipedia

Tumpang air

(2017-07-01). "Optimization of ionic liquid-based microwave-assisted extraction of polyphenolic content from Peperomia pellucida (L) kunth using response

Pembelajaran terbimbing

Pencarian informasi dan ekstraksi informasi (information retrieval & extraction) Visions komputer (computer vision) seperti pengenalan objek/ citra Deteksi

Solnitsata

2012. Ranguelov, Boyko; Nikolov, Vassil (2010). Ancient earthquake data extraction by archeological findings. EGU General Assembly 2010. 2–7 May 2010

Delta Force (permainan video 2025)

bahasa Inggris). Diakses tanggal 2024-08-10. Sarkar, Arka (2024-08-06). "Extraction shooter Delta Force Hawk Ops kicks off alpha test". Destructoid (dalam

Model bahasa besar

dan pembangkitan bahasa. LLM memperoleh kemampuan ini dengan menggunakan data dalam jumlah besar untuk mempelajari miliaran parameter selama pelatihan

Timol

Chemat, Farid; Smadja, Jacqueline (2004-07-23). "Solvent-free microwave extraction of essential oil from aromatic herbs: comparison with conventional hydro-distillation"

Penyulingan uap

water-soluble constituents of rose oil using simultaneous distillation–extraction". Flavour and Fragrance Journal (dalam bahasa Inggris). 20 (6): 555–558

Sergey Brin

di Stanford. Ia menulis banyak paper yang membahas tentang data-mining dan pattern extraction. Ia juga menulis software yang dapat mengubah TeX menjadi