Median 📖 Wikipedia

Median atau nilai paling banyak adalah salah satu ukuran pemusatan data. Cara berhitung median adalah melihat mana angka yang paling banyak^[1]^[2]

Untuk data populasi median dilambangkan dengan ${\tilde {u}}$ . Sedangkan untuk data contoh, median dilambangkan dengan ${\tilde {x}}$ .^[1]

Contoh penghitungan

sunting

Untuk data ganjil

sunting

Untuk data 6, 7, 8, 3, 5: pertama menyortirkan data menjadi 3, 5, 6, 7, 8. Lalu dengan mudah diketahui median adalah 6 yang berada di tengah.

Untuk data genap

sunting

Untuk data 2, 8, 3, 4, 1, 8: pertama menyortirkan menjadi 1, 2, 3, 4, 8, 8. Karena jumlah data pengamatan genap, yaitu enam biji bilangan, maka median terletak pada rata-rata dua nilai pengamatan yang di tengah yaitu data ketiga dan data keempat, maka mediannya adalah $(3+4)/2=3{\text{,}}5$ .^[2]

Kelebihan dan kekurangan

sunting

Kelebihan

sunting

Kelebihan dari median adalah terletak pada kemudahan untuk dihitung jika jumlah data relatif kecil dan median sama sekali tidak dipengaruhi oleh nilai pencilan.^[1]

Kekurangan

sunting

Kekurangan dari median adalah nilai median relatif tidak stabil bahkan untuk data dalam populasi yang sama.^[1]

Konsep lain yang terkait

sunting

Median terinterpolasi

sunting

Variabel diskrit, terkadang berguna untuk nilai-nilai yang diamati sebagai titik tengah dari interval kontinu yang mendasarinya. Contohnya adalah skala Likert, di mana pendapat atau preferensi dinyatakan pada skala dengan sejumlah kemungkinan respons yang tetap. Jika skala terdiri dari bilangan bulat positif, pengamatan 3 dapat dianggap mewakili interval dari 2,50 hingga 3,50. Dimungkinkan untuk memperkirakan median dari variabel yang mendasarinya.

Jika, misalnya, 22% pengamatan bernilai 2 atau di bawahnya dan 55,0% bernilai 3 atau di bawahnya (sehingga 33% bernilai 3), maka median $m$ adalah 3 karena median adalah nilai terkecil dari $x$ yang mana $F(x)$ lebih besar dari setengah. Namun, median terinterpolasi berada di antara 2,50 dan 3,50. Pertama kita tambahkan setengah dari lebar interval $w$ ke median untuk mendapatkan batas atas interval median. Kemudian dikurangi proporsi lebar interval yang sama dengan proporsi dari 33% yang berada di atas tanda 50%. Dengan kata lain, kita membagi lebar interval secara pro rata dengan jumlah pengamatan. Dalam kasus ini, 33% dibagi menjadi 28% di bawah median dan 5% di atasnya, jadi dikurangi 5/33 dari lebar interval dari batas atas 3,50 untuk mendapatkan median terinterpolasi sebesar 3,35. Secara lebih formal, jika nilai-nilai $f(x)$ diketahui, median terinterpolasi dapat dihitung dari

$m_{\text{int}}=m+w\left[{\frac {1}{2}}-{\frac {F(m)-{\frac {1}{2}}}{f(m)}}\right].$

Atau, jika dalam sampel yang diamati terdapat $k$ skor di atas kategori median, $j$ skor di dalamnya, dan $i$ skor di bawahnya, maka median terinterpolasi diberikan oleh

$m_{\text{int}}=m+{\frac {w}{2}}\left[{\frac {k-i}{j}}\right].$

Median semu (pseudo-median)

sunting

Untuk distribusi univariat yang simetris terhadap satu median, estimator Hodges–Lehmann adalah estimator yang robust dan sangat efisien untuk median populasi; untuk distribusi yang tidak simetris, estimator Hodges–Lehmann adalah estimator yang robust dan sangat efisien untuk median semu (pseudo-median) populasi, yang merupakan median dari distribusi yang disimmetriskan dan dekat dengan median populasi.^[4] Estimator Hodges–Lehmann telah digeneralisasi untuk distribusi multivariat.^[5]

Varian regresi

sunting

Estimator Theil–Sen adalah metode untuk regresi linear robust berdasarkan pencarian median dari kemiringan (slope).^[6]

Filter median

sunting

Filter median adalah alat penting dalam pengolahan citra, yang dapat secara efektif menghilangkan noise garam-dan-merica dari citra skala abu-abu.

Analisis klaster

sunting

Dalam analisis klaster, algoritme klastering k-medians menyediakan cara untuk mendefinisikan klaster, di mana kriteria memaksimalkan jarak antara rata-rata klaster yang digunakan dalam klastering k-means, digantikan dengan memaksimalkan jarak antara median-median klaster.

Garis median–median

sunting

Ini adalah metode regresi robust. Idenya berawal dari Wald pada tahun 1940 yang menyarankan untuk membagi sekumpulan data bivariat menjadi dua bagian tergantung pada nilai parameter independen $x$ : bagian kiri dengan nilai kurang dari median dan bagian kanan dengan nilai lebih besar dari median.^[7] Dia menyarankan untuk mengambil rata-rata variabel dependen $y$ dan independen $x$ dari bagian kiri dan kanan serta memperkirakan kemiringan garis yang menghubungkan kedua titik ini. Garis tersebut kemudian dapat disesuaikan agar sesuai dengan sebagian besar titik dalam kumpulan data.

Nair dan Shrivastava pada tahun 1942 mengusulkan ide serupa tetapi lebih menyarankan untuk membagi sampel menjadi tiga bagian yang sama sebelum menghitung rata-rata dari sub-sampel.^[8] Brown dan Mood pada tahun 1951 mengusulkan gagasan menggunakan median dari dua sub-sampel daripada rata-ratanya.^[9] Tukey menggabungkan ide-ide ini dan merekomendasikan untuk membagi sampel menjadi tiga sub-sampel berukuran sama dan memperkirakan garis berdasarkan median dari sub-sampel tersebut.^[10]

Rujukan

sunting

^ ^a ^b ^c ^d Ronald E.Walpole. Pengantar Statistika, halaman 22-27". 1993. Jakarta: PT Gramedia Pustaka Utama. ISBN 979-403-313-8
^ ^a ^b http://www.stat.psu.edu/old_resources/ClassNotes/ljs_07/sld008.htm Diarsipkan 2010-07-30 di Wayback Machine. Simon, Laura J "Descriptive statistics" Statistical Education Resource Kit Penn State Department of Statistics
^ "AP Statistics Review - Density Curves and the Normal Distributions". Diarsipkan dari asli tanggal 8 April 2015. Diakses tanggal 16 March 2015.
^ Pratt, William K.; Cooper, Ted J.; Kabir, Ihtisham (1985-07-11). Corbett, Francis J (ed.). "Pseudomedian Filter". Architectures and Algorithms for Digital Image Processing II. 0534: 34. Bibcode:1985SPIE..534...34P. doi:10.1117/12.946562. S2CID 173183609.
^ Oja, Hannu (2010). Multivariate nonparametric methods with R: An approach based on spatial signs and ranks. Lecture Notes in Statistics. Vol. 199. New York, NY: Springer. hlm. xiv+232. doi:10.1007/978-1-4419-0468-3. ISBN 978-1-4419-0467-6. MR 2598854.
^ Wilcox, Rand R. (2001), "Theil–Sen estimator", Fundamentals of Modern Statistical Methods: Substantially Improving Power and Accuracy, Springer-Verlag, hlm. 207–210, ISBN 978-0-387-95157-7.
^ Wald, A. (1940). "The Fitting of Straight Lines if Both Variables are Subject to Error" (PDF). Annals of Mathematical Statistics. 11 (3): 282–300. Bibcode:1940AnnMS..11..284W. doi:10.1214/aoms/1177731868. JSTOR 2235677.
^ Nair, K. R.; Shrivastava, M. P. (1942). "On a Simple Method of Curve Fitting". Sankhyā: The Indian Journal of Statistics. 6 (2): 121–132. JSTOR 25047749.
^ Brown, G. W.; Mood, A. M. (1951). "On Median Tests for Linear Hypotheses". Proc Second Berkeley Symposium on Mathematical Statistics and Probability. Berkeley, CA: University of California Press. hlm. 159–166. Zbl 0045.08606.
^ Tukey, J. W. (1977). Exploratory Data Analysis. Reading, MA: Addison-Wesley. ISBN 0201076160.

[walpole-1] Ronald E.Walpole. Pengantar Statistika, halaman 22-27". 1993. Jakarta: PT Gramedia Pustaka Utama. ISBN 979-403-313-8

[stat_psu-2] ttp://www.stat.psu.edu/old_resources/ClassNotes/ljs_07/sld008.htm Diarsipkan 2010-07-30 di Wayback Machine. Simon, Laura J "Descriptive statistics" Statistical Education Resource Kit Penn State Department of Statistics

[3] "AP Statistics Review - Density Curves and the Normal Distributions". Diarsipkan dari asli tanggal 8 April 2015. Diakses tanggal 16 March 2015.

[4] Pratt, William K.; Cooper, Ted J.; Kabir, Ihtisham (1985-07-11). Corbett, Francis J (ed.). "Pseudomedian Filter". Architectures and Algorithms for Digital Image Processing II. 0534: 34. Bibcode:1985SPIE..534...34P. doi:10.1117/12.946562. S2CID 173183609.

[Oja_2010_xiv+232-5] Oja, Hannu (2010). Multivariate nonparametric methods with R: An approach based on spatial signs and ranks. Lecture Notes in Statistics. Vol. 199. New York, NY: Springer. hlm. xiv+232. doi:10.1007/978-1-4419-0468-3. ISBN 978-1-4419-0467-6. MR 2598854.

[6] Wilcox, Rand R. (2001), "Theil–Sen estimator", Fundamentals of Modern Statistical Methods: Substantially Improving Power and Accuracy, Springer-Verlag, hlm. 207–210, ISBN 978-0-387-95157-7.

[Wald1940-7] Wald, A. (1940). "The Fitting of Straight Lines if Both Variables are Subject to Error" (PDF). Annals of Mathematical Statistics. 11 (3): 282–300. Bibcode:1940AnnMS..11..284W. doi:10.1214/aoms/1177731868. JSTOR 2235677.

[Nair1942-8] Nair, K. R.; Shrivastava, M. P. (1942). "On a Simple Method of Curve Fitting". Sankhyā: The Indian Journal of Statistics. 6 (2): 121–132. JSTOR 25047749.

[Brown1951-9] Brown, G. W.; Mood, A. M. (1951). "On Median Tests for Linear Hypotheses". Proc Second Berkeley Symposium on Mathematical Statistics and Probability. Berkeley, CA: University of California Press. hlm. 159–166. Zbl 0045.08606.

[Tukey1971-10] Tukey, J. W. (1977). Exploratory Data Analysis. Reading, MA: Addison-Wesley. ISBN 0201076160.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Median 📖 Wikipedia

Daftar isi

Contoh penghitungan

Untuk data ganjil

Untuk data genap

Kelebihan dan kekurangan

Kelebihan

Kekurangan

Konsep lain yang terkait

Median terinterpolasi

Median semu (pseudo-median)

Varian regresi

Filter median

Analisis klaster

Garis median–median

Rujukan

📚 Artikel Terkait di Wikipedia

Distribusi normal

Perilaku

Anatoli Timofeyewic Fomenko

Statistika nonparametrik

Rata-rata bergerak

Statistika parametrik

Analisis varians dua arah

Uji t Student