Narrative Network of US Election 2012 - Nodes indicate noun phrases, links go from subject to object, color expresses relation of support or opposition. Appeared in: "Automated analysis of the US presidential elections using Big Data and network analysis; S Sudhahar, GA Veltri, N Cristianini; Big Data & Society 2 (1), 1-28, 2015"

Penambangan teks (bahasa Inggris: text mining) adalah proses ekstraksi pola berupa informasi dan pengetahuan yang berguna dari sejumlah besar sumber data teks, seperti dokumen Word, PDF, kutipan teks, dll. Jenis masukan untuk penambangan teks ini disebut data tak terstruktur dan merupakan pembeda utama dengan penambangan data yang menggunakan data terstruktur atau basis data sebagai masukan. Penambangan teks dapat dianggap sebagai proses dua tahap yang diawali dengan penerapan struktur terhadap sumber data teks dan dilanjutkan dengan ekstraksi informasi dan pengetahuan yang relevan dari data teks terstruktur ini dengan menggunakan teknik dan alat yang sama dengan penambangan data. Proses yang umum dilakukan oleh penambangan teks di antaranya adalah perangkuman otomatis, kategorisasi dokumen, penggugusan teks, deteksi plagiarisme, dll. (Turban, et.al., 2011)

Rujukan

sunting
  • Berry, M.W.; Kogan, J. (2010). Text Mining: Application and Theory. Chichester: John Wiley & Sons, Ltd.
  • Feldman, R.; Sanger, J. (2007). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. New York: Cambridge University Press.
  • Turban, E.; et al. (2011). Decision Support and Business Intelligence Systems (Edisi 9). New Jersey: Pearson Education, Inc.


📚 Artikel Terkait di Wikipedia

Identifikasi

Identify Human identification (disambiguation) Identification tag (disambiguation) Identity (disambiguation) ID (disambiguation) Animal identification, identifying

Model bahasa besar

"Language Models are Few-Shot Learners" (PDF). Advances in Neural Information Processing Systems. 33. Curran Associates, Inc.: 1877–1901. Manning, Christopher

Linguistik komputasi

antardisiplin yang mengkaji pengolahan bahasa alami (Natural Language Processing) dengan statistika dan berbasis aturan dari sudut pandang komputasi. Komputer

Ayu Purwarianti

learning (2023), Speech Recognition and Meaning Interpretation: Towards Disambiguation of Structurally Ambiguous Spoken Utterances in Indonesian (2023), Peningkatan

Pemelajaran swabimbing

PMID 29425969. S2CID 3796689. Yarowsky, David (1995). "Unsupervised Word Sense Disambiguation Rivaling Supervised Methods". Proceedings of the 33rd Annual Meeting

Pengolahan bahasa alami

PMID 7479812. Natural Language Processing with Python. O'Reilly Media. 2009. ISBN 978-0-5965-1649-9. Speech and Language Processing (Edisi 2). Pearson Prentice

Pengenalan karakter optis

di berbagai bidang seperti untuk membaca data secara otomatis dan langsung memasukkannya ke dalam basis data -- contohnya seperti dalam pemindaian passport

Pentransformasi praterlatih generatif

(ed.). 31st Conference on Neural Information Processing Systems. Advances in Neural Information Processing Systems. Vol. 30. Curran Associates, Inc. arXiv:1706