Dalam statistik, data yang hilang, atau nilai yang hilang, terjadi ketika tidak ada nilai data yang disimpan untuk variabel dalam suatu observasi. Data yang hilang merupakan kejadian umum dan dapat berdampak signifikan pada kesimpulan yang dapat ditarik dari data tersebut.

Data yang hilang dapat terjadi karena tidak responsif: tidak ada informasi yang diberikan untuk satu atau beberapa item atau untuk seluruh unit ("subjek"). Beberapa item lebih cenderung menghasilkan respons yang tidak merespons daripada yang lain: misalnya item tentang subjek pribadi seperti pendapatan. Gesekan adalah jenis kesalahan yang dapat terjadi dalam studi longitudinal-misalnya mempelajari perkembangan di mana pengukuran diulang setelah jangka waktu tertentu. Missingness terjadi ketika peserta putus sekolah sebelum tes berakhir dan satu atau lebih pengukuran hilang.

Data sering hilang dalam penelitian di bidang ekonomi, sosiologi, dan ilmu politik karena pemerintah atau entitas swasta memilih untuk tidak melaporkan statistik penting,[1] atau karena informasinya tidak tersedia. Terkadang, nilai yang hilang disebabkan oleh peneliti—misalnya, ketika pengumpulan data dilakukan secara tidak benar atau terjadi kesalahan dalam entri data.[2]

Bentuk-bentuk kelalaian ini memiliki tipe yang berbeda-beda, dengan dampak yang berbeda terhadap validitas kesimpulan dari penelitian: Hilang sama sekali secara acak, hilang secara acak, dan hilang tidak secara acak. Data yang hilang dapat ditangani dengan cara yang sama seperti data yang disensor.

Referensi

sunting
  1. ^ Messner SF (1992). "Exploring the Consequences of Erratic Data Reporting for Cross-National Research on Homicide". Journal of Quantitative Criminology. 8 (2): 155–173. doi:10.1007/bf01066742.
  2. ^ Hand, David J.; Adèr, Herman J.; Mellenbergh, Gideon J. (2008). Advising on Research Methods: A Consultant's Companion. Huizen, Netherlands: Johannes van Kessel. hlm. 305–332. ISBN 978-90-79418-01-5.

Pranala luar

sunting

📚 Artikel Terkait di Wikipedia

Statistika

menginterpretasikan, dan akhirnya mempresentasikan data. Singkatnya, statistika adalah ilmu yang bersangkutan dengan suatu data. Istilah statistika berbeda dengan statistik

Sistem pengumpulan data

Sistem pengumpulan data (Bahasa inggris: DCS) adalah aplikasi komputer yang memfasilitasi proses pengumpulan data, yang memungkinkan informasi spesifik

Kumpulan data COVID-19

Kumpulan data COVID-19 (Inggris: COVID-19 datasets) adalah kumpulan data atau database publik atau bisa diakses secara terbuka atau umum, untuk berbagi

Peladen

diandalkan daripada komputer pribadi standar, tetapi sebagai alternatif, cluster komputasi besar dapat terdiri dari banyak komponen server yang relatif

Kluster data

sektor, sementara cluster 4 kilobyte akan memakan 8 sektor. Semakin besar ukuran cluster, maka semakin cepat proses transfer data yang dapat dilakukan

Graph database

Machine.). OpenLink Virtuoso - the shared-nothing Cluster Edition supports distributed graph data processing. Oracle Spatial and Graph Diarsipkan 2013-11-06

Model generatif

menghasilkan data baru yang serupa dengan pelatihan.Model generatif mempelajari distribusi dan hubungan sekuensial atau temporal dari data yang mendasarinya

Stephenson 2

Stephenson 2, juga dikenal sebagai RSGC2 (Red Supergiant Cluster 2), adalah gugus terbuka masif muda yang termasuk dalam galaksi Bima Sakti. Gugus ini