Visualisasi ilmiah dari simulasi masalah ketidakstabilan Rayleighโ€“Taylor

Analisis data adalah proses inspeksi, pengelolaan dan pemodelan data dengan tujuan menemukan informasi yang berguna, menginformasikan kesimpulan dan mendukung pengambilan keputusan. Analisis data memiliki banyak sisi dan pendekatan, mencakup beragam teknik dengan berbagai nama, dan digunakan dalam berbagai bidang bisnis, ilmu pengetahuan, dan ilmu sosial. Dalam dunia bisnis saat ini, analisis data berperan dalam membuat keputusan lebih ilmiah dan membantu bisnis beroperasi lebih efektif.[1]

Penggalian data adalah teknik analisis data tertentu yang berfokus pada pemodelan statistik dan penemuan pengetahuan untuk tujuan prediksi dan bukan murni deskriptif, sedangkan intelijen bisnis mencakup analisis data yang sangat bergantung pada agregasi, dengan fokus utama pada informasi bisnis.[2]

Proses analisis data

sunting
Diagram alur proses ilmu data dari Doing Data Science, oleh Schutt & O'Neil (2013)

Analisis, mengacu pada membagi keseluruhan menjadi komponen-komponen yang terpisah untuk pemeriksaan individu.[3] Analisis data, adalah proses untuk memperoleh data mentah, dan selanjutnya mengubahnya menjadi informasi yang berguna untuk pengambilan keputusan oleh pengguna.[4] Data, dikumpulkan dan dianalisis untuk menjawab pertanyaan, menguji hipotesis, atau menyangkal teori.[5]

Ahli statistik John Tukey, mendefinisikan analisis data pada tahun 1961, sebagai:

โ€œProsedur untuk menganalisis data, teknik untuk menafsirkan hasil dari prosedur tersebut, cara merencanakan pengumpulan data untuk membuat analisisnya lebih mudah, lebih tepat atau lebih akurat, dan semua mesin dan hasil statistik (matematis) yang berlaku untuk menganalisis data."[6]

Ada beberapa fase yang dapat dibedakan, dijelaskan di bawah ini. Fase-fase tersebut berulang, di mana umpan balik dari fase selanjutnya dapat menghasilkan pekerjaan tambahan di fase sebelumnya.[7] Kerangka kerja CRISP, yang digunakan dalam penambangan data, memiliki langkah serupa.

Persyaratan data

sunting

Data diperlukan sebagai masukan untuk analisis, yang ditentukan berdasarkan kebutuhan mereka yang mengarahkan analisis atau pelanggan (yang akan menggunakan produk akhir analisis).[8][9] Jenis umum entitas di mana data akan dikumpulkan disebut sebagai unit eksperimen (misalnya, orang atau populasi orang). Variabel khusus mengenai populasi (misalnya, usia dan pendapatan) dapat ditentukan dan diperoleh. Data mungkin numerik atau kategorikal (yaitu, label teks untuk angka).[7]

Pengumpulan data

sunting

Data dikumpulkan dari berbagai sumber.[10][11] Persyaratan dapat dikomunikasikan oleh analis kepada penjaga data; seperti, personel Teknologi Informasi dalam suatu organisasi.[12] Data juga dapat dikumpulkan dari sensor di lingkungan, termasuk kamera lalu lintas, satelit, alat perekam, dll. Data juga dapat diperoleh melalui wawancara, unduhan dari sumber online, atau membaca dokumentasi.[7]

Pengolahan data

sunting

Fase siklus kecerdasan yang digunakan untuk mengubah informasi mentah menjadi kecerdasan atau pengetahuan yang dapat ditindaklanjuti secara konseptual mirip dengan fase dalam analisis data. Data, ketika awalnya diperoleh, harus diproses atau diatur untuk analisis.[13][14] Misalnya, ini mungkin melibatkan penempatan data ke dalam baris dan kolom dalam format tabel (dikenal sebagai data terstruktur) untuk analisis lebih lanjut, sering kali melalui penggunaan spreadsheet atau perangkat lunak statistik.[7]

Pembersihan data

sunting

qwsddaZAQ

Analisis data terkait

sunting

Pemodelan dan algoritma

sunting

Produk data

sunting

Komunikasi

sunting

Data Storytelling

sunting

Data hasil analisis yang dilakukan harus mampu memberikan insight dalam bentuk alur carita yang jelas dan menarik. Hal mendasar dalam data storytelling yaitu mengenal siapa pemangku kepentingan yang menjadi target informasi, setelah itu apa yang perlu pemangku kepentingan tersebut ketahui dan apa mekanisme komunikasi yang digunakan.[15]

Referensi

sunting
  1. ^ Xia, B. S., & Gong, P. (2015). Review of business intelligence through data analysis. Benchmarking, 21(2), 300-311. doi:10.1108/BIJ-08-2012-0050
  2. ^ Exploring Data Analysis
  3. ^ Field, John (2009), "Dividing listening into its components", Listening in the Language Classroom, Cambridge: Cambridge University Press, hlm.ย 96โ€“109, doi:10.1017/cbo9780511575945.008, ISBNย 978-0-511-57594-5, diakses tanggal 2021-05-29
  4. ^ "Transforming Unstructured Data into Useful Information", Big Data, Mining, and Analytics, Auerbach Publications, hlm.ย 227โ€“246, 2014-03-12, doi:10.1201/b16666-14, ISBNย 978-0-429-09529-0, diakses tanggal 2021-05-29
  5. ^ Judd, Charles and, McCleland, Gary (1989). Data Analysis. Harcourt Brace Jovanovich. ISBNย 0-15-516765-0. Pemeliharaan CS1: Banyak nama: authors list (link)
  6. ^ John Tukey-The Future of Data Analysis-July 1961
  7. ^ a b c d Schutt, Rachel; O'Neil, Cathy (2013). Doing Data Science. O'Reilly Media. ISBNย 978-1-449-35865-5.
  8. ^ "USE OF THE DATA", Handbook of Petroleum Product Analysis, Hoboken, NJ: John Wiley & Sons, Inc, hlm.ย 296โ€“303, 2015-02-06, doi:10.1002/9781118986370.ch18, ISBNย 978-1-118-98637-0, diakses tanggal 2021-05-29
  9. ^ author., Ainsworth, Penne (20 May 2019). Introduction to accountingย : an integrated approach. ISBNย 978-1-119-60014-5. OCLCย 1097366032. Pemeliharaan CS1: Banyak nama: authors list (link)
  10. ^ 1954-, Margo, Robert A. (Robert Andrew) (2000). Wages and labor markets in the United States, 1820-1860. University of Chicago Press. ISBNย 0-226-50507-3. OCLCย 41285104. Pemeliharaan CS1: Banyak nama: authors list (link)
  11. ^ Olusola, Johnson Adedeji; Shote, Adebola Adekunle; Ouigmane, Abdellah; Isaifan, Rima J. (7 May 2021). "Table 1: Data type and sources of data collected for this research". PeerJ. 9: e11387. doi:10.7717/peerj.11387/table-1. Diakses tanggal 2021-05-29. Pemeliharaan CS1: DOI bebas tanpa ditandai (link)
  12. ^ MacPherson, Derek (2019-10-16), "Information Technology Analysts' Perspectives", Data Strategy in Colleges and Universities, Routledge, hlm.ย 168โ€“183, doi:10.4324/9780429437564-12, ISBNย 978-0-429-43756-4, diakses tanggal 2021-05-29
  13. ^ 1959-, Nelson, Stephen L. (2014). Excel data analysis for dummies. Wiley. ISBNย 978-1-118-89810-9. OCLCย 877772392. Pemeliharaan CS1: Banyak nama: authors list (link)
  14. ^ "Figure 3โ€”source data 1. Raw and processed values obtained through qPCR". dx.doi.org. 30 August 2017. doi:10.7554/elife.28468.029. Diakses tanggal 2021-05-29. Pemeliharaan CS1: DOI bebas tanpa ditandai (link)
  15. ^ Nussbaumer Knaflic, Cole (2015). Storytelling with data: a data visualization guide for business professionals. Hoboken, New Jersey: Wiley. ISBNย 978-1-119-00226-0.

Bacaan lebih lanjut

sunting
  • Adรจr, H.J. & Mellenbergh, G.J. (with contributions by D.J. Hand) (2008). Advising on Research Methods: A Consultant's Companion. Huizen, the Netherlands: Johannes van Kessel Publishing.
  • Chambers, John M.; Cleveland, William S.; Kleiner, Beat; Tukey, Paul A. (1983). Graphical Methods for Data Analysis, Wadsworth/Duxbury Press. ISBN 0-534-98052-X
  • Fandango, Armando (2008). Python Data Analysis, 2nd Edition. Packt Publishers.
  • Juran, Joseph M.; Godfrey, A. Blanton (1999). Juran's Quality Handbook, 5th Edition. New York: McGraw Hill. ISBN 0-07-034003-X
  • Lewis-Beck, Michael S. (1995). Data Analysis: an Introduction, Sage Publications Inc, ISBN 0-8039-5772-6

๐Ÿ“š Artikel Terkait di Wikipedia

Perlindungan data

penyebarluasan, dan pemusnahan data, serta masalah hukum dan politik yang melingkupinya. Perlindungan data juga dikenal sebagai privasi data. Keamanan informasi

Ilmu data

Pengetahuan dan Teknologi merilis Data Science Journal. Di tahun 2003, Columbia University merilis The Journal of Data Science. Pada 2014 Asosiasi Statistika

Science

Science, juga disebut sebagai Science Magazine, adalah jurnal akademik penelaahan sejawat American Association for the Advancement of Science (AAAS) dan

Statistika

menginterpretasikan, dan akhirnya mempresentasikan data. Singkatnya, statistika adalah ilmu yang bersangkutan dengan suatu data. Istilah statistika berbeda dengan statistik

Indian Space Science Data Centre

Indian Space Science Data Center (ISSDC) adalah fasilitas baru yang didirikan oleh ISRO, sebagai pusat data primer untuk arsip data payload Misi Ruang

Springer Science+Business Media

Springer Science+Business Media atau Springer adalah perusahaan penerbitan global yang menerbitkan buku, buku elektronik, dan jurnal tinjauan sejawat

Informasi

dan dalam dua kali pelemparan adalah log2(4/1) = 2 bit. Sebuah artikel Science tahun 2011 memperkirakan bahwa 97% informasi yang tersimpan secara teknologi

OpenStreetMap

York, London: Springer Science+Business Media Dordrecht. Coast, Steve (4 December 2006). "Yahoo! aerial imagery in OSM". OpenGeoData. Diakses tanggal 15