Dalam statistika, uji normalitas digunakan untuk menentukan apakah suatu kumpulan data dimodelkan dengan baik oleh distribusi normal dan untuk menghitung seberapa besar kemungkinan variabel acak yang mendasari kumpulan data tersebut terdistribusi secara normal.

Lebih tepatnya, uji ini merupakan bentuk pemilihan model, dan dapat diinterpretasikan dengan beberapa cara, tergantung pada interpretasi probabilitas seseorang:

  • Dalam istilah statistika deskriptif, seseorang mengukur kesesuaian model normal dengan data. Jika kesesuaiannya buruk maka data tersebut tidak dimodelkan dengan baik dalam hal itu oleh distribusi normal, tanpa membuat penilaian pada variabel yang mendasarinya.
  • Dalam pengujian hipotesis statistika frequentist, data diuji terhadap hipotesis nol bahwa data tersebut terdistribusi secara normal.
  • Dalam statistika Bayes, kita tidak "menguji normalitas" secara harfiah, tetapi lebih tepatnya menghitung kemungkinan bahwa data berasal dari distribusi normal dengan parameter μ,σ tertentu (untuk semua μ,σ), dan membandingkannya dengan kemungkinan bahwa data berasal dari distribusi lain yang dipertimbangkan, paling sederhana menggunakan faktor Bayes (memberikan kemungkinan relatif untuk melihat data berdasarkan model yang berbeda), atau lebih halus lagi dengan mengambil distribusi prior pada kemungkinan model dan parameter, dan menghitung distribusi posterior berdasarkan kemungkinan yang dihitung.

Uji normalitas digunakan untuk menentukan apakah data sampel telah diambil dari populasi yang terdistribusi normal (dalam batas toleransi tertentu). Sejumlah uji statistika, seperti uji t Student dan analisis varians satu arah dan dua arah (ANOVA), memerlukan populasi sampel yang terdistribusi normal.

Uji frekuensi

sunting

Uji normalitas univariat meliputi:

  • Uji K-kuadrat D'Agostino,
  • Uji Jarque–Bera,
  • Uji Anderson–Darling,
  • Kriteria Cramér–von Mises,
  • Uji Kolmogorov–Smirnov: uji ini hanya berfungsi jika rata-rata dan varians distribusi normal diasumsikan diketahui di bawah hipotesis nol,
  • Uji Lilliefors: berdasarkan uji Kolmogorov–Smirnov, disesuaikan ketika juga memperkirakan rata-rata dan varians dari data,
  • Uji Shapiro–Wilk, dan
  • Uji khi-kuadrat Pearson.

Sebuah studi tahun 2011 menyimpulkan bahwa uji Shapiro–Wilk memiliki kekuatan terbaik untuk signifikansi tertentu, diikuti oleh Anderson–Darling ketika membandingkan uji Shapiro–Wilk, Kolmogorov–Smirnov, Lilliefors, dan Anderson–Darling.[1]

Beberapa karya yang diterbitkan merekomendasikan uji Jarque–Bera,[2][3] namun uji ini memiliki kelemahan. Secara khusus, uji ini memiliki daya uji yang rendah untuk distribusi dengan ekor pendek, terutama untuk distribusi bimodal.[4] Beberapa penulis menolak untuk memasukkan hasilnya dalam studi mereka karena kinerja keseluruhannya yang buruk.[5]

Secara historis, momen terstandarisasi ketiga dan keempat (kemiringan dan kurtosis) adalah beberapa uji normalitas paling awal. Uji Lin–Mudholkar secara khusus menargetkan alternatif asimetris.[6] Uji Jarque–Bera sendiri diturunkan dari estimasi kemiringan dan kurtosis. Uji kemiringan dan kurtosis multivariat Mardia menggeneralisasi uji momen ke kasus multivariat.[7] Statistik uji awal lainnya mencakup rasio deviasi absolut rata-rata terhadap deviasi standar dan rentang terhadap deviasi standar.[8]

Uji normalitas yang lebih baru mencakup uji energi[9] (Székely dan Rizzo) dan uji berdasarkan fungsi karakteristik empiris (ECF) (misalnya Epps dan Pulley,[10] Henze–Zirkler,[11] uji BHEP[12]). Uji energi dan ECF adalah uji yang ampuh yang berlaku untuk menguji normalitas univariat atau multivariat dan secara statistik konsisten terhadap alternatif umum.

Distribusi normal memiliki entropi tertinggi dari semua distribusi untuk deviasi standar tertentu. Ada sejumlah uji normalitas berdasarkan sifat ini, yang pertama dikaitkan dengan Vasicek.[13]

Uji Bayes

sunting

Perbedaan Kullback–Leibler antara seluruh distribusi posterior kemiringan dan varians tidak menunjukkan non-normalitas. Namun, rasio ekspektasi posterior ini dan ekspektasi rasio memberikan hasil yang mirip dengan statistik Shapiro–Wilk kecuali untuk sampel yang sangat kecil, ketika prior non-informatif digunakan.[14]

Spiegelhalter menyarankan penggunaan faktor Bayes untuk membandingkan normalitas dengan kelas alternatif distribusi yang berbeda.[15] Pendekatan ini telah diperluas oleh Farrell dan Rogers-Stewart.[16]

Penggunaan

sunting

Salah satu penggunaan uji normalitas adalah pada residual dari model regresi linear.[17] Jika residual tidak terdistribusi normal, maka residual tersebut tidak boleh digunakan dalam uji Z atau uji lain yang berasal dari distribusi normal seperti uji t, uji F, dan uji khi-kuadrat. Jika residual tidak terdistribusi normal, maka variabel dependen atau setidaknya satu variabel penjelas mungkin memiliki bentuk fungsional yang salah, atau variabel penting mungkin hilang, dan sebagainya. Memperbaiki satu atau lebih kesalahan sistematis ini dapat menghasilkan residual yang terdistribusi normal; dengan kata lain, ketidaknormalan residual seringkali merupakan kekurangan model daripada masalah data.[18]

Lihat juga

sunting
  • Uji keacakan
  • Ringkasan tujuh angka

Referensi

sunting
  1. ^ Razali, Nornadiah; Wah, Yap Bee (2011). "Power comparisons of Shapiro–Wilk, Kolmogorov–Smirnov, Lilliefors and Anderson–Darling tests" (PDF). Journal of Statistical Modeling and Analytics. 2 (1): 21–33. Diarsipkan dari asli (PDF) tanggal 2015-06-30.
  2. ^ Judge, George G.; Griffiths, W. E.; Hill, R. Carter; Lütkepohl, Helmut; Lee, T. (1988). Introduction to the Theory and Practice of Econometrics (Edisi Second). Wiley. hlm. 890–892. ISBN 978-0-471-08277-4.
  3. ^ Gujarati, Damodar N. (2002). Basic Econometrics (Edisi Fourth). McGraw Hill. hlm. 147–148. ISBN 978-0-07-123017-9.
  4. ^ Thadewald, Thorsten; Büning, Herbert (1 January 2007). "Jarque–Bera Test and its Competitors for Testing Normality – A Power Comparison". Journal of Applied Statistics. 34 (1): 87–105. CiteSeerX 10.1.1.507.1186. doi:10.1080/02664760600994539. S2CID 13866566.
  5. ^ Sürücü, Barış (1 September 2008). "A power comparison and simulation study of goodness-of-fit tests". Computers & Mathematics with Applications. 56 (6): 1617–1625. doi:10.1016/j.camwa.2008.03.010. hdl:11511/46797.
  6. ^ Lin, C. C.; Mudholkar, G. S. (1980). "A simple test for normality against asymmetric alternatives". Biometrika. 67 (2): 455–461. doi:10.1093/biomet/67.2.455.
  7. ^ Mardia, K. V. (December 1970). "Measures of multivariate skewness and kurtosis with applications". Biometrika. 57 (3): 519–530. doi:10.2307/2334770.
  8. ^ Filliben, J. J. (February 1975). "The Probability Plot Correlation Coefficient Test for Normality". Technometrics. 17 (1): 111–117. doi:10.2307/1268008. JSTOR 1268008.
  9. ^ Székely, G. J. and Rizzo, M. L. (2005) A new test for multivariate normality, Journal of Multivariate Analysis 93, 58–80.
  10. ^ Epps, T. W., and Pulley, L. B. (1983). A test for normality based on the empirical characteristic function. Biometrika 70, 723–726.
  11. ^ Henze, N., and Zirkler, B. (1990). A class of invariant and consistent tests for multivariate normality. Communications in Statistics – Theory and Methods 19, 3595–3617.
  12. ^ Henze, N., and Wagner, T. (1997). A new approach to the BHEP tests for multivariate normality. Journal of Multivariate Analysis 62, 1–23.
  13. ^ Vasicek, Oldrich (1976). "A Test for Normality Based on Sample Entropy". Journal of the Royal Statistical Society. Series B (Methodological). 38 (1): 54–59. JSTOR 2984828.
  14. ^ Young K. D. S. (1993), "Bayesian diagnostics for checking assumptions of normality". Journal of Statistical Computation and Simulation, 47 (3–4),167–180
  15. ^ Spiegelhalter, D.J. (1980). An omnibus test for normality for small samples. Biometrika, 67, 493–496. DOI:10.1093/biomet/67.2.493
  16. ^ Farrell, P.J., Rogers-Stewart, K. (2006) "Comprehensive study of tests for normality and symmetry: extending the Spiegelhalter test". Journal of Statistical Computation and Simulation, 76(9), 803 – 816. DOI:10.1080/10629360500109023
  17. ^ Portney, Leslie Gross; Watkins, Mary P. (2000). Foundations of Clinical Research: Applications to Practice (Edisi 2nd). New Jersey: Prentice Hall. hlm. 516–517. ISBN 0-8385-2695-0.
  18. ^ Pek, Jolynn; Wong, Octavia; Wong, Augustine C. M. (2018-11-06). "How to Address Non-normality: A Taxonomy of Approaches, Reviewed, and Illustrated". Frontiers in Psychology. 9: 2104. doi:10.3389/fpsyg.2018.02104. ISSN 1664-1078. PMC 6232275. PMID 30459683.

Bacaan lanjutan

sunting
  • Ralph B. D'Agostino (1986). "Tests for the Normal Distribution". Dalam D'Agostino, R.B.; Stephens, M.A. (ed.). Goodness-of-Fit Techniques. New York: Marcel Dekker. ISBN 978-0-8247-7487-5.

📚 Artikel Terkait di Wikipedia

Uji hipotesis

Handbook of Statistical Practice (A good tutorial) (Inggris) References for arguments for and against hypothesis testing (Inggris) Statistical Tests Overview:

Statistika matematika

90-5699-018-7 Virtual Laboratories in Probability and Statistics (Univ. of Ala.-Huntsville) StatiBot, interactive online expert system on statistical tests.

Seleksi penstabilan

Sheets HD, Mitchell CE (2001). "Why the null matters: statistical tests, random walks and evolution". Genetica. 112–113: 105–25. doi:10.1023/A:1013308409951

Statistika nonparametrik

of similarities Anderson–Darling test: tests whether a sample is drawn from a given distribution Statistical bootstrap methods: estimates the accuracy/sampling

Eksperimen semu

heterogeneous treatment effects using random forests." Journal of the American Statistical Association 113 (523), 1228–1242. Meyer, Bruce (April 1995). "Quasi &

Median

2010-07-30 di Wayback Machine. Simon, Laura J "Descriptive statistics" Statistical Education Resource Kit Penn State Department of Statistics "AP Statistics

Uji U Mann–Whitney

Donald W. (1998-01-01). "Invalidation of Parametric and Nonparametric Statistical Tests by Concurrent Violation of Two Assumptions". The Journal of Experimental

Distribusi t Student

Randomization test Multiple comparisons Parametric tests Likelihood-ratio Wald Score Specific tests Z-test (normal) Student's t-test F-test Goodness of