Dalam statistik, data yang hilang, atau nilai yang hilang, terjadi ketika tidak ada nilai data yang disimpan untuk variabel dalam suatu observasi. Data yang hilang merupakan kejadian umum dan dapat berdampak signifikan pada kesimpulan yang dapat ditarik dari data tersebut.

Data yang hilang dapat terjadi karena tidak responsif: tidak ada informasi yang diberikan untuk satu atau beberapa item atau untuk seluruh unit ("subjek"). Beberapa item lebih cenderung menghasilkan respons yang tidak merespons daripada yang lain: misalnya item tentang subjek pribadi seperti pendapatan. Gesekan adalah jenis kesalahan yang dapat terjadi dalam studi longitudinal-misalnya mempelajari perkembangan di mana pengukuran diulang setelah jangka waktu tertentu. Missingness terjadi ketika peserta putus sekolah sebelum tes berakhir dan satu atau lebih pengukuran hilang.

Data sering hilang dalam penelitian di bidang ekonomi, sosiologi, dan ilmu politik karena pemerintah atau entitas swasta memilih untuk tidak melaporkan statistik penting,[1] atau karena informasinya tidak tersedia. Terkadang, nilai yang hilang disebabkan oleh peneliti—misalnya, ketika pengumpulan data dilakukan secara tidak benar atau terjadi kesalahan dalam entri data.[2]

Bentuk-bentuk kelalaian ini memiliki tipe yang berbeda-beda, dengan dampak yang berbeda terhadap validitas kesimpulan dari penelitian: Hilang sama sekali secara acak, hilang secara acak, dan hilang tidak secara acak. Data yang hilang dapat ditangani dengan cara yang sama seperti data yang disensor.

Referensi

sunting
  1. ^ Messner SF (1992). "Exploring the Consequences of Erratic Data Reporting for Cross-National Research on Homicide". Journal of Quantitative Criminology. 8 (2): 155–173. doi:10.1007/bf01066742.
  2. ^ Hand, David J.; Adèr, Herman J.; Mellenbergh, Gideon J. (2008). Advising on Research Methods: A Consultant's Companion. Huizen, Netherlands: Johannes van Kessel. hlm. 305–332. ISBN 978-90-79418-01-5.

Pranala luar

sunting

📚 Artikel Terkait di Wikipedia

Sistem pengumpulan data

Sistem pengumpulan data (Bahasa inggris: DCS) adalah aplikasi komputer yang memfasilitasi proses pengumpulan data, yang memungkinkan informasi spesifik

Statistika

dipopulerkan oleh John Sinclair (1791- 1799) dalam bukunya yang berjudul Statistical Account of Scotland. Pada abad ke-19 dan awal abad ke-20 statistika mulai

Statistical Analysis System

SAS (Statistical Analysis System) adalah program komputer untuk analisis statistika yang dikembangkan oleh perusahaan SAS Institute. Perangkat lunak ini

Eurostat

Statistical Office of the European Communities (Eurostat) (Kantor Statistik Komunitas Eropa) adalah badan milik Komisi Eropa yang menyediakan data untuk

Daftar negara menurut tingkat bunuh diri

"KSH Stadat database, causes of death (1949-2013)". Hungarian Central Statistical Office (KSH). Diakses tanggal 2014-10-31. "平成 26 年中における自殺の状況" (PDF).

Daftar ibu kota negara menurut jumlah penduduk

menurut jumlah penduduk. "China Statistical Yearbook 2018". www.stats.gov.cn. Diakses tanggal 2019-07-24. "Tokyo Statistical Yearbook". Tokyo Metropolitan

Model generatif

menghasilkan data baru yang serupa dengan pelatihan.Model generatif mempelajari distribusi dan hubungan sekuensial atau temporal dari data yang mendasarinya

Kawasan statistik metropolitan di Amerika Serikat

Annual Estimates of the Population of Metropolitan and Micropolitan Statistical Areas: April 1, 2000 to July 1, 2005 U.S. Census 2000 Metropolitan Area