Penghitungan median dalam data banyaknya ganjil dan genap.

Median atau nilai paling banyak adalah salah satu ukuran pemusatan data. Cara berhitung median adalah melihat mana angka yang paling banyak[1][2]

Untuk data populasi median dilambangkan dengan . Sedangkan untuk data contoh, median dilambangkan dengan .[1]

Contoh penghitungan

sunting

Untuk data ganjil

sunting

Untuk data 6, 7, 8, 3, 5: pertama menyortirkan data menjadi 3, 5, 6, 7, 8. Lalu dengan mudah diketahui median adalah 6 yang berada di tengah.

Untuk data genap

sunting

Untuk data 2, 8, 3, 4, 1, 8: pertama menyortirkan menjadi 1, 2, 3, 4, 8, 8. Karena jumlah data pengamatan genap, yaitu enam biji bilangan, maka median terletak pada rata-rata dua nilai pengamatan yang di tengah yaitu data ketiga dan data keempat, maka mediannya adalah .[2]

Kelebihan dan kekurangan

sunting
Data menjulur ke kanan sehingga modus, median dan rata-rata berbeda-beda[3]

Kelebihan

sunting

Kelebihan dari median adalah terletak pada kemudahan untuk dihitung jika jumlah data relatif kecil dan median sama sekali tidak dipengaruhi oleh nilai pencilan.[1]

Kekurangan

sunting

Kekurangan dari median adalah nilai median relatif tidak stabil bahkan untuk data dalam populasi yang sama.[1]

Konsep lain yang terkait

sunting

Median terinterpolasi

sunting

Variabel diskrit, terkadang berguna untuk nilai-nilai yang diamati sebagai titik tengah dari interval kontinu yang mendasarinya. Contohnya adalah skala Likert, di mana pendapat atau preferensi dinyatakan pada skala dengan sejumlah kemungkinan respons yang tetap. Jika skala terdiri dari bilangan bulat positif, pengamatan 3 dapat dianggap mewakili interval dari 2,50 hingga 3,50. Dimungkinkan untuk memperkirakan median dari variabel yang mendasarinya.

Jika, misalnya, 22% pengamatan bernilai 2 atau di bawahnya dan 55,0% bernilai 3 atau di bawahnya (sehingga 33% bernilai 3), maka median adalah 3 karena median adalah nilai terkecil dari yang mana lebih besar dari setengah. Namun, median terinterpolasi berada di antara 2,50 dan 3,50. Pertama kita tambahkan setengah dari lebar interval ke median untuk mendapatkan batas atas interval median. Kemudian dikurangi proporsi lebar interval yang sama dengan proporsi dari 33% yang berada di atas tanda 50%. Dengan kata lain, kita membagi lebar interval secara pro rata dengan jumlah pengamatan. Dalam kasus ini, 33% dibagi menjadi 28% di bawah median dan 5% di atasnya, jadi dikurangi 5/33 dari lebar interval dari batas atas 3,50 untuk mendapatkan median terinterpolasi sebesar 3,35. Secara lebih formal, jika nilai-nilai diketahui, median terinterpolasi dapat dihitung dari

Atau, jika dalam sampel yang diamati terdapat skor di atas kategori median, skor di dalamnya, dan skor di bawahnya, maka median terinterpolasi diberikan oleh

Median semu (pseudo-median)

sunting

Untuk distribusi univariat yang simetris terhadap satu median, estimator Hodges–Lehmann adalah estimator yang robust dan sangat efisien untuk median populasi; untuk distribusi yang tidak simetris, estimator Hodges–Lehmann adalah estimator yang robust dan sangat efisien untuk median semu (pseudo-median) populasi, yang merupakan median dari distribusi yang disimmetriskan dan dekat dengan median populasi.[4] Estimator Hodges–Lehmann telah digeneralisasi untuk distribusi multivariat.[5]

Varian regresi

sunting

Estimator Theil–Sen adalah metode untuk regresi linear robust berdasarkan pencarian median dari kemiringan (slope).[6]

Filter median

sunting

Filter median adalah alat penting dalam pengolahan citra, yang dapat secara efektif menghilangkan noise garam-dan-merica dari citra skala abu-abu.

Analisis klaster

sunting

Dalam analisis klaster, algoritme klastering k-medians menyediakan cara untuk mendefinisikan klaster, di mana kriteria memaksimalkan jarak antara rata-rata klaster yang digunakan dalam klastering k-means, digantikan dengan memaksimalkan jarak antara median-median klaster.

Garis median–median

sunting

Ini adalah metode regresi robust. Idenya berawal dari Wald pada tahun 1940 yang menyarankan untuk membagi sekumpulan data bivariat menjadi dua bagian tergantung pada nilai parameter independen : bagian kiri dengan nilai kurang dari median dan bagian kanan dengan nilai lebih besar dari median.[7] Dia menyarankan untuk mengambil rata-rata variabel dependen dan independen dari bagian kiri dan kanan serta memperkirakan kemiringan garis yang menghubungkan kedua titik ini. Garis tersebut kemudian dapat disesuaikan agar sesuai dengan sebagian besar titik dalam kumpulan data.

Nair dan Shrivastava pada tahun 1942 mengusulkan ide serupa tetapi lebih menyarankan untuk membagi sampel menjadi tiga bagian yang sama sebelum menghitung rata-rata dari sub-sampel.[8] Brown dan Mood pada tahun 1951 mengusulkan gagasan menggunakan median dari dua sub-sampel daripada rata-ratanya.[9] Tukey menggabungkan ide-ide ini dan merekomendasikan untuk membagi sampel menjadi tiga sub-sampel berukuran sama dan memperkirakan garis berdasarkan median dari sub-sampel tersebut.[10]

Rujukan

sunting
  1. ^ a b c d Ronald E.Walpole. Pengantar Statistika, halaman 22-27". 1993. Jakarta: PT Gramedia Pustaka Utama. ISBN 979-403-313-8
  2. ^ a b http://www.stat.psu.edu/old_resources/ClassNotes/ljs_07/sld008.htm Diarsipkan 2010-07-30 di Wayback Machine. Simon, Laura J "Descriptive statistics" Statistical Education Resource Kit Penn State Department of Statistics
  3. ^ "AP Statistics Review - Density Curves and the Normal Distributions". Diarsipkan dari asli tanggal 8 April 2015. Diakses tanggal 16 March 2015.
  4. ^ Pratt, William K.; Cooper, Ted J.; Kabir, Ihtisham (1985-07-11). Corbett, Francis J (ed.). "Pseudomedian Filter". Architectures and Algorithms for Digital Image Processing II. 0534: 34. Bibcode:1985SPIE..534...34P. doi:10.1117/12.946562. S2CID 173183609.
  5. ^ Oja, Hannu (2010). Multivariate nonparametric methods with R: An approach based on spatial signs and ranks. Lecture Notes in Statistics. Vol. 199. New York, NY: Springer. hlm. xiv+232. doi:10.1007/978-1-4419-0468-3. ISBN 978-1-4419-0467-6. MR 2598854.
  6. ^ Wilcox, Rand R. (2001), "Theil–Sen estimator", Fundamentals of Modern Statistical Methods: Substantially Improving Power and Accuracy, Springer-Verlag, hlm. 207–210, ISBN 978-0-387-95157-7.
  7. ^ Wald, A. (1940). "The Fitting of Straight Lines if Both Variables are Subject to Error" (PDF). Annals of Mathematical Statistics. 11 (3): 282–300. Bibcode:1940AnnMS..11..284W. doi:10.1214/aoms/1177731868. JSTOR 2235677.
  8. ^ Nair, K. R.; Shrivastava, M. P. (1942). "On a Simple Method of Curve Fitting". Sankhyā: The Indian Journal of Statistics. 6 (2): 121–132. JSTOR 25047749.
  9. ^ Brown, G. W.; Mood, A. M. (1951). "On Median Tests for Linear Hypotheses". Proc Second Berkeley Symposium on Mathematical Statistics and Probability. Berkeley, CA: University of California Press. hlm. 159–166. Zbl 0045.08606.
  10. ^ Tukey, J. W. (1977). Exploratory Data Analysis. Reading, MA: Addison-Wesley. ISBN 0201076160.

📚 Artikel Terkait di Wikipedia

Distribusi normal

Erlangga. Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2012). Statistical methods for business & economics. Edisi 17. New York: McGraw-Hill Irwin.

Perilaku

(24 September 2012). Behavioral Genetics. Shaun Purcell (Appendix: Statistical Methods in Behavioral Genetics). Worth Publishers. ISBN 978-1-4292-4215-8

Anatoli Timofeyewic Fomenko

and Statistical Methods of Analysis of Star Configurations. Dating Ptolemy's Almagest. – CRC-Press, USA, 1993. A.T. Fomenko New Methods of Statistical Analysis

Statistika nonparametrik

test: tests whether a sample is drawn from a given distribution Statistical bootstrap methods: estimates the accuracy/sampling distribution of a statistic

Rata-rata bergerak

Investopedia. Statistical Analysis, Ya-lun Chou, Holt International, 1975, ISBN 0-03-089422-0, section 17.9. NIST/SEMATECH e-Handbook of Statistical Methods: Single

Statistika parametrik

Statistika parametrik disebutkan oleh Ronald Fisher dalam karyanya yakni Statistical Methods for Research Workers pada tahun 1925, yang menciptakan dasar bagi

Analisis varians dua arah

tahun 1925, Ronald Fisher menyebutkan ANOVA dua arah dalam bukunya, Statistical Methods for Research Workers (bab 7 dan 8). Melalui karyanya, Fisher menunjukkan

Uji t Student

JSTOR 2684684. O'Mahony, Michael (1986). Sensory Evaluation of Food: Statistical Methods and Procedures. CRC Press. hlm. 487. ISBN 0-82477337-3. Press, William