Perbedaan antara ANOVA dan uji Kruskal–Wallis dengan peringkat

Uji Kruskal–Wallis berdasarkan peringkat, uji Kruskal–Wallis (dinamai berdasarkan dua orang penemunya yakni William Kruskal dan Wilson Allen Wallis), atau ANOVA satu arah berdasarkan peringkat adalah uji statistika nonparametrik untuk menguji apakah sampel berasal dari distribusi yang sama.[1][2][3] Uji ini digunakan untuk membandingkan dua atau lebih sampel independen dengan ukuran sampel yang sama atau berbeda. Uji ini merupakan perluasan dari uji U Mann–Whitney, yang hanya digunakan untuk membandingkan dua kelompok. Ekuivalen parametrik dari uji Kruskal–Wallis adalah analisis varians satu arah (one way ANOVA).

Uji Kruskal–Wallis yang signifikan menunjukkan bahwa setidaknya satu sampel secara stokastik mendominasi sampel lainnya. Uji ini tidak mengidentifikasi di mana dominasi stokastik ini terjadi atau untuk berapa banyak pasangan kelompok dominasi stokastik diperoleh. Untuk menganalisis pasangan sampel spesifik untuk dominasi stokastik, uji Dunn,[4] uji Mann–Whitney berpasangan dengan koreksi Bonferroni,[5] atau uji Conover–Iman yang lebih kuat tetapi kurang dikenal[5] terkadang digunakan.

Diasumsikan bahwa perlakuan secara signifikan mempengaruhi tingkat respons dan kemudian ada urutan di antara perlakuan: satu cenderung memberikan respons terendah, yang lain memberikan respons terendah berikutnya, dan seterusnya.[6] Karena merupakan metode nonparametrik, uji Kruskal–Wallis tidak mengasumsikan distribusi normal dari residual, tidak seperti analisis varians satu arah yang analog. Jika peneliti dapat membuat asumsi bahwa distribusi memiliki bentuk dan skala yang identik untuk semua kelompok, kecuali perbedaan median, maka hipotesis nolnya adalah bahwa median semua kelompok sama, dan hipotesis alternatifnya adalah bahwa setidaknya satu median populasi dari satu kelompok berbeda dari median populasi setidaknya satu kelompok lainnya. Jika tidak, tidak mungkin untuk mengatakan apakah penolakan hipotesis nol berasal dari pergeseran lokasi atau dispersi kelompok. Ini adalah masalah yang sama yang juga terjadi pada uji Mann-Whitney.[7][8][9] Jika data mengandung potensi outlier, jika distribusi populasi memiliki ekor yang tebal, atau jika distribusi populasi sangat miring, uji Kruskal–Wallis lebih ampuh dalam mendeteksi perbedaan antar perlakuan daripada uji F ANOVA. Di sisi lain, jika distribusi populasi normal atau berekor ringan dan simetris, maka uji F ANOVA umumnya akan memiliki daya yang lebih besar yaitu probabilitas menolak hipotesis nol ketika memang seharusnya ditolak.[10][11]

Metode

sunting
Ilustrasi cara menetapkan nilai yang sama dengan rata-rata peringkat
  1. Urutkan semua data dari semua kelompok bersama-sama, yaitu urutkan data dari 1 hingga N dengan mengabaikan keanggotaan kelompok. Tetapkan nilai yang sama dengan rata-rata peringkat yang akan mereka terima jika tidak sama.
  2. Statistik uji diberikan oleh
    di mana
    • adalah jumlah total pengamatan di semua kelompok
    • adalah jumlah kelompok
    • adalah jumlah pengamatan dalam kelompok
    • rij adalah peringkat (di antara semua pengamatan) dari pengamatan dari kelompok
    • adalah peringkat rata-rata dari semua pengamatan dalam kelompok
    • adalah rata-rata dari semua .
  3. Jika data tidak mengandung nilai yang sama, penyebut dari ekspresi untuk adalah tepat dan . Jadi

    Rumus terakhir hanya berisi kuadrat dari peringkat rata-rata.
  4. Koreksi untuk nilai yang sama jika menggunakan rumus singkat yang dijelaskan pada poin sebelumnya dapat dilakukan dengan membagi dengan , di mana adalah jumlah pengelompokan peringkat yang sama, dan adalah jumlah nilai yang sama dalam kelompok yang sama pada nilai tertentu. Koreksi ini biasanya tidak banyak mengubah nilai kecuali jika terdapat banyak nilai yang sama.
  5. Saat melakukan perbandingan beberapa sampel, kesalahan tipe I cenderung meningkat. Oleh karena itu, prosedur Bonferroni digunakan untuk menyesuaikan tingkat signifikansi, yaitu, , di mana adalah tingkat signifikansi yang disesuaikan, adalah tingkat signifikansi awal, dan adalah jumlah kontras.[12]
  6. Akhirnya, keputusan untuk menolak atau menerima hipotesis nol dibuat dengan membandingkan dengan nilai kritis (diperoleh dari tabel atau perangkat lunak) untuk tingkat signifikansi atau alfa tertentu. Jika lebih besar dari , hipotesis nol ditolak. Jika memungkinkan (tidak ada ikatan, sampel tidak terlalu besar) seseorang harus membandingkan dengan nilai kritis yang diperoleh dari distribusi eksak . Jika tidak, distribusi H dapat didekati dengan distribusi khi-kuadrat dengan derajat kebebasan . Jika beberapa nilai kecil (yaitu, kurang dari 5), distribusi probabilitas yang tepat dapat sangat berbeda dari distribusi khi-kuadrat ini. Jika tabel distribusi probabilitas khi-kuadrat tersedia, nilai kritis khi-kuadrat, , dapat ditemukan dengan memasukkan tabel pada derajat kebebasan dan melihat di bawah tingkat signifikansi atau alfa yang diinginkan.[13]
  7. Jika statistik tidak signifikan, tidak ada bukti dominasi stokastik di antara sampel. Namun, jika uji tersebut signifikan maka setidaknya satu sampel secara stokastik mendominasi sampel lain. Kemudian, seorang peneliti dapat menggunakan kontras sampel antara pasangan sampel individu, atau uji post hoc menggunakan uji Dunn, yang (1) menggunakan peringkat yang sama dengan uji Kruskal–Wallis, dan (2) menggunakan varians gabungan yang tersirat oleh hipotesis nol dari uji Kruskal–Wallis untuk menentukan pasangan sampel mana yang berbeda secara signifikan.[4] Ketika melakukan beberapa kontras atau pengujian sampel, tingkat kesalahan Tipe I cenderung meningkat, menimbulkan kekhawatiran tentang perbandingan berganda.

Tabel probabilitas eksak

sunting

Diperlukan banyak sumber daya komputasi untuk menghitung probabilitas eksak untuk uji Kruskal–Wallis. Perangkat lunak yang ada hanya menyediakan probabilitas eksak untuk ukuran sampel kurang dari sekitar 30 peserta. Program perangkat lunak ini bergantung pada aproksimasi asimtotik untuk ukuran sampel yang lebih besar. Nilai probabilitas eksak untuk ukuran sampel yang lebih besar tersedia. Spurrier (2003) menerbitkan tabel probabilitas eksak untuk sampel sebesar 45 peserta.[14] Meyer dan Seaman (2006) menghasilkan distribusi probabilitas eksak untuk sampel sebesar 105 peserta.[15]

Distribusi eksak H

sunting

Choi dkk.[16] melakukan tinjauan terhadap dua metode yang telah dikembangkan untuk menghitung distribusi eksak , mengusulkan metode baru, dan membandingkan distribusi eksak dengan aproksimasi khi-kuadratnya.

Contoh

sunting

Uji perbedaan tingkat ozon menurut bulan

sunting

Contoh berikut menggunakan data dari Chambers et al.[17] pada pembacaan harian ozon untuk tanggal 1 Mei hingga 30 September 1973, di Kota New York. Data tersebut terdapat dalam kumpulan data R airquality, dan analisisnya termasuk dalam dokumentasi untuk fungsi R kruskal.test. Boxplot nilai ozon menurut bulan ditunjukkan pada gambar.

Uji Kruskal–Wallis menemukan perbedaan yang signifikan (p = 6,901e-06) yang menunjukkan bahwa ozon berbeda di antara 5 bulan tersebut.

kruskal.test(Ozone ~ Month, data = airquality)

	Kruskal-Wallis rank sum test

data:  Ozone by Month
Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06

Untuk menentukan bulan mana yang berbeda, uji post-hoc dapat dilakukan menggunakan uji jumlah peringkat Wilcoxon untuk setiap pasangan bulan, dengan koreksi Bonferroni (atau lainnya) untuk pengujian hipotesis berganda.

pairwise.wilcox.test(airquality$Ozone, airquality$Month, p.adjust.method = "bonferroni")

	Pairwise comparisons using Wilcoxon rank sum test

data:  airquality$Ozone and airquality$Month

  5      6      7      8     
6 1.0000 -      -      -     
7 0.0003 0.1414 -      -     
8 0.0012 0.2591 1.0000 -     
9 1.0000 1.0000 0.0074 0.0325

P value adjustment method: bonferroni

Uji post-hoc menunjukkan bahwa setelah koreksi Bonferroni untuk pengujian berganda, perbedaan berikut signifikan (p yang disesuaikan < 0,05).

  • Bulan 5 vs Bulan 7 dan 8
  • Bulan 9 vs Bulan 7 dan 8

Implementasi

sunting

Uji Kruskal–Wallis dapat diimplementasikan dalam banyak alat dan bahasa pemrograman. Berikut ini hanya daftar paket perangkat lunak sumber terbuka gratis:

  • Dalam paket SciPy Python, fungsi scipy.stats.kruskal dapat mengembalikan hasil uji dan nilai p.[18]
  • Paket dasar R memiliki implementasi uji ini menggunakan kruskal.test.[19]
  • jamovi telah mengimplementasikan analisis ini dalam menu ANOVA.[20]
  • Java memiliki implementasi yang disediakan oleh Apache Commons.[21]
  • Di Julia, paket HypothesisTests.jl memiliki fungsi KruskalWallisTest(groups::AbstractVector{<:Real}...) untuk menghitung nilai p.[22]

Lihat juga

sunting

Referensi

sunting
  1. ^ Kruskal; Wallis (1952). "Use of ranks in one-criterion variance analysis". Journal of the American Statistical Association. 47 (260): 583–621. doi:10.1080/01621459.1952.10483441.
  2. ^ Corder, Gregory W.; Foreman, Dale I. (2009). Nonparametric Statistics for Non-Statisticians. Hoboken: John Wiley & Sons. hlm. 99–105. ISBN 9780470454619.
  3. ^ Siegel; Castellan (1988). Nonparametric Statistics for the Behavioral Sciences (Edisi Second). New York: McGraw–Hill. ISBN 0070573573.
  4. ^ a b Dunn, Olive Jean (1964). "Multiple comparisons using rank sums". Technometrics. 6 (3): 241–252. doi:10.2307/1266041.
  5. ^ a b Conover, W. Jay; Iman, Ronald L. (1979). "On multiple-comparisons procedures" (PDF) (Report). Los Alamos Scientific Laboratory. Diakses tanggal 2016-10-28.
  6. ^ Lehmann, E. L., & D'Abrera, H. J. (1975). Nonparametrics: Statistical methods based on ranks. Holden-Day.
  7. ^ Divine; Norton; Barón; Juarez-Colunga (2018). "The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians". The American Statistician. doi:10.1080/00031305.2017.1305291.
  8. ^ Hart (2001). "Mann-Whitney test is not just a test of medians: differences in spread can be important". BMJ. doi:10.1136/bmj.323.7309.391.
  9. ^ Bruin (2006). "FAQ: Why is the Mann-Whitney significant when the medians are equal?". UCLA: Statistical Consulting Group.
  10. ^ Higgins, James J.; Jeffrey Higgins, James (2004). An introduction to modern nonparametric statistics. Duxbury advanced series. Pacific Gove, CA: Brooks-Cole; Thomson Learning. ISBN 978-0-534-38775-4.
  11. ^ Berger, Paul D.; Maurer, Robert E.; Celli, Giovana B. (2018). Experimental Design (dalam bahasa Inggris). Cham: Springer International Publishing. doi:10.1007/978-3-319-64583-4. ISBN 978-3-319-64582-7.
  12. ^ Corder, G.W. & Foreman, D.I. (2010). Nonparametric Statistics for Non-statisticians: A Step-by-Step Approach. Hoboken, NJ: Wiley.
  13. ^ Montgomery, Douglas C.; Runger, George C. (2018). Applied statistics and probability for engineers. EMEA edition (Edisi Seventh). Hoboken, NJ: Wiley. ISBN 978-1-119-40036-3.
  14. ^ Spurrier, J. D. (2003). "On the null distribution of the Kruskal–Wallis statistic". Journal of Nonparametric Statistics. 15 (6): 685–691. doi:10.1080/10485250310001634719.
  15. ^ Meyer; Seaman (April 2006). "Expanded tables of critical values for the Kruskal–Wallis H statistic". Paper presented at the annual meeting of the American Educational Research Association, San Francisco. Critical value tables and exact probabilities from Meyer and Seaman are available for download at http://faculty.virginia.edu/kruskal-wallis/ Diarsipkan 2018-10-17 di Wayback Machine.. A paper describing their work may also be found there.
  16. ^ Won Choi, Jae Won Lee, Myung-Hoe Huh, and Seung-Ho Kang (2003). "An Algorithm for Computing the Exact Distribution of the Kruskal–Wallis Test". Communications in Statistics - Simulation and Computation (32, number 4): 1029–1040. doi:10.1081/SAC-120023876. Pemeliharaan CS1: Banyak nama: authors list (link)
  17. ^ John M. Chambers, William S. Cleveland, Beat Kleiner, and Paul A. Tukey (1983). Graphical Methods for Data Analysis. Belmont, Calif: Wadsworth International Group, Duxbury Press. ISBN 053498052X. Pemeliharaan CS1: Banyak nama: authors list (link)
  18. ^ "scipy.stats.kruskal — SciPy v1.11.4 Manual". docs.scipy.org. Diakses tanggal 2023-12-06.
  19. ^ "kruskal.test function - RDocumentation". www.rdocumentation.org. Diakses tanggal 2023-12-06.
  20. ^ "Jamovi documentation". jamovi.org. Diakses tanggal 2025-08-25.
  21. ^ "Math – The Commons Math User Guide - Statistics". commons.apache.org. Diakses tanggal 2023-12-06.
  22. ^ "Nonparametric tests · HypothesisTests.jl". juliastats.org (dalam bahasa Inggris). Diakses tanggal 2023-12-06.

Bacaan lanjutan

sunting

Pranala luar

sunting

Templat:Statistics