
Median atau nilai paling banyak adalah salah satu ukuran pemusatan data. Cara berhitung median adalah melihat mana angka yang paling banyak[1][2]
Untuk data populasi median dilambangkan dengan . Sedangkan untuk data contoh, median dilambangkan dengan .[1]
Contoh penghitungan
suntingUntuk data ganjil
suntingUntuk data 6, 7, 8, 3, 5: pertama menyortirkan data menjadi 3, 5, 6, 7, 8. Lalu dengan mudah diketahui median adalah 6 yang berada di tengah.
Untuk data genap
suntingUntuk data 2, 8, 3, 4, 1, 8: pertama menyortirkan menjadi 1, 2, 3, 4, 8, 8. Karena jumlah data pengamatan genap, yaitu enam biji bilangan, maka median terletak pada rata-rata dua nilai pengamatan yang di tengah yaitu data ketiga dan data keempat, maka mediannya adalah .[2]
Kelebihan dan kekurangan
sunting
Kelebihan
suntingKelebihan dari median adalah terletak pada kemudahan untuk dihitung jika jumlah data relatif kecil dan median sama sekali tidak dipengaruhi oleh nilai pencilan.[1]
Kekurangan
suntingKekurangan dari median adalah nilai median relatif tidak stabil bahkan untuk data dalam populasi yang sama.[1]
Konsep lain yang terkait
suntingMedian terinterpolasi
suntingVariabel diskrit, terkadang berguna untuk nilai-nilai yang diamati sebagai titik tengah dari interval kontinu yang mendasarinya. Contohnya adalah skala Likert, di mana pendapat atau preferensi dinyatakan pada skala dengan sejumlah kemungkinan respons yang tetap. Jika skala terdiri dari bilangan bulat positif, pengamatan 3 dapat dianggap mewakili interval dari 2,50 hingga 3,50. Dimungkinkan untuk memperkirakan median dari variabel yang mendasarinya.
Jika, misalnya, 22% pengamatan bernilai 2 atau di bawahnya dan 55,0% bernilai 3 atau di bawahnya (sehingga 33% bernilai 3), maka median adalah 3 karena median adalah nilai terkecil dari yang mana lebih besar dari setengah. Namun, median terinterpolasi berada di antara 2,50 dan 3,50. Pertama kita tambahkan setengah dari lebar interval ke median untuk mendapatkan batas atas interval median. Kemudian dikurangi proporsi lebar interval yang sama dengan proporsi dari 33% yang berada di atas tanda 50%. Dengan kata lain, kita membagi lebar interval secara pro rata dengan jumlah pengamatan. Dalam kasus ini, 33% dibagi menjadi 28% di bawah median dan 5% di atasnya, jadi dikurangi 5/33 dari lebar interval dari batas atas 3,50 untuk mendapatkan median terinterpolasi sebesar 3,35. Secara lebih formal, jika nilai-nilai diketahui, median terinterpolasi dapat dihitung dari
Atau, jika dalam sampel yang diamati terdapat skor di atas kategori median, skor di dalamnya, dan skor di bawahnya, maka median terinterpolasi diberikan oleh
Median semu (pseudo-median)
suntingUntuk distribusi univariat yang simetris terhadap satu median, estimator Hodges–Lehmann adalah estimator yang robust dan sangat efisien untuk median populasi; untuk distribusi yang tidak simetris, estimator Hodges–Lehmann adalah estimator yang robust dan sangat efisien untuk median semu (pseudo-median) populasi, yang merupakan median dari distribusi yang disimmetriskan dan dekat dengan median populasi.[4] Estimator Hodges–Lehmann telah digeneralisasi untuk distribusi multivariat.[5]
Varian regresi
suntingEstimator Theil–Sen adalah metode untuk regresi linear robust berdasarkan pencarian median dari kemiringan (slope).[6]
Filter median
suntingFilter median adalah alat penting dalam pengolahan citra, yang dapat secara efektif menghilangkan noise garam-dan-merica dari citra skala abu-abu.
Analisis klaster
suntingDalam analisis klaster, algoritme klastering k-medians menyediakan cara untuk mendefinisikan klaster, di mana kriteria memaksimalkan jarak antara rata-rata klaster yang digunakan dalam klastering k-means, digantikan dengan memaksimalkan jarak antara median-median klaster.
Garis median–median
suntingIni adalah metode regresi robust. Idenya berawal dari Wald pada tahun 1940 yang menyarankan untuk membagi sekumpulan data bivariat menjadi dua bagian tergantung pada nilai parameter independen : bagian kiri dengan nilai kurang dari median dan bagian kanan dengan nilai lebih besar dari median.[7] Dia menyarankan untuk mengambil rata-rata variabel dependen dan independen dari bagian kiri dan kanan serta memperkirakan kemiringan garis yang menghubungkan kedua titik ini. Garis tersebut kemudian dapat disesuaikan agar sesuai dengan sebagian besar titik dalam kumpulan data.
Nair dan Shrivastava pada tahun 1942 mengusulkan ide serupa tetapi lebih menyarankan untuk membagi sampel menjadi tiga bagian yang sama sebelum menghitung rata-rata dari sub-sampel.[8] Brown dan Mood pada tahun 1951 mengusulkan gagasan menggunakan median dari dua sub-sampel daripada rata-ratanya.[9] Tukey menggabungkan ide-ide ini dan merekomendasikan untuk membagi sampel menjadi tiga sub-sampel berukuran sama dan memperkirakan garis berdasarkan median dari sub-sampel tersebut.[10]
Rujukan
sunting- ^ a b c d Ronald E.Walpole. Pengantar Statistika, halaman 22-27". 1993. Jakarta: PT Gramedia Pustaka Utama. ISBN 979-403-313-8
- ^ a b http://www.stat.psu.edu/old_resources/ClassNotes/ljs_07/sld008.htm Diarsipkan 2010-07-30 di Wayback Machine. Simon, Laura J "Descriptive statistics" Statistical Education Resource Kit Penn State Department of Statistics
- ^ "AP Statistics Review - Density Curves and the Normal Distributions". Diarsipkan dari asli tanggal 8 April 2015. Diakses tanggal 16 March 2015.
- ^ Pratt, William K.; Cooper, Ted J.; Kabir, Ihtisham (1985-07-11). Corbett, Francis J (ed.). "Pseudomedian Filter". Architectures and Algorithms for Digital Image Processing II. 0534: 34. Bibcode:1985SPIE..534...34P. doi:10.1117/12.946562. S2CID 173183609.
- ^ Oja, Hannu (2010). Multivariate nonparametric methods with R: An approach based on spatial signs and ranks. Lecture Notes in Statistics. Vol. 199. New York, NY: Springer. hlm. xiv+232. doi:10.1007/978-1-4419-0468-3. ISBN 978-1-4419-0467-6. MR 2598854.
- ^ Wilcox, Rand R. (2001), "Theil–Sen estimator", Fundamentals of Modern Statistical Methods: Substantially Improving Power and Accuracy, Springer-Verlag, hlm. 207–210, ISBN 978-0-387-95157-7.
- ^ Wald, A. (1940). "The Fitting of Straight Lines if Both Variables are Subject to Error" (PDF). Annals of Mathematical Statistics. 11 (3): 282–300. Bibcode:1940AnnMS..11..284W. doi:10.1214/aoms/1177731868. JSTOR 2235677.
- ^ Nair, K. R.; Shrivastava, M. P. (1942). "On a Simple Method of Curve Fitting". Sankhyā: The Indian Journal of Statistics. 6 (2): 121–132. JSTOR 25047749.
- ^ Brown, G. W.; Mood, A. M. (1951). "On Median Tests for Linear Hypotheses". Proc Second Berkeley Symposium on Mathematical Statistics and Probability. Berkeley, CA: University of California Press. hlm. 159–166. Zbl 0045.08606.
- ^ Tukey, J. W. (1977). Exploratory Data Analysis. Reading, MA: Addison-Wesley. ISBN 0201076160.