Berbagai plot dari kumpulan data multivariat kumpulan data bunga Iris yang diperkenalkan oleh Ronald Fisher (1936).[1]

Kumpulan data adalah sebuah koleksi data. Dalam kasus data tabular, kumpulan data sesuai dengan satu atau lebih tabel basis data, di mana setiap kolom dari sebuah tabel mewakili suatu variabel, dan setiap baris sesuai dengan rekaman tertentu dari kumpulan data yang dimaksud. Kumpulan data mencantumkan nilai untuk setiap variabel, misalnya tinggi dan berat suatu objek, untuk setiap anggota dalam kumpulan data tersebut. Kumpulan data juga dapat berupa koleksi dokumen atau berkas.[2]

Dalam disiplin open data, sebuah kumpulan data merupakan satuan yang digunakan untuk mengukur jumlah informasi yang dirilis dalam repositori data terbuka publik. Portal data.europa.eu Eropa menghimpun lebih dari satu juta kumpulan data.[3]

Sifat

sunting

Beberapa karakteristik mendefinisikan struktur dan sifat suatu kumpulan data. Hal ini mencakup jumlah dan jenis atribut atau variabel, serta berbagai ukuran statistik yang berlaku untuknya, seperti simpangan baku dan kurtosis.[4]

Referensi

sunting
  1. ^ Fisher, R.A. (1963). "The Use of Multiple Measurements in Taxonomic Problems" (PDF). Annals of Eugenics. 7 (2): 179โ€“188. doi:10.1111/j.1469-1809.1936.tb02137.x. hdl:2440/15227. Diarsipkan dari asli (PDF) tanggal 2011-09-28. Diakses tanggal 2007-05-22.
  2. ^ Snijders, C.; Matzat, U.; Reips, U.-D. (2012). "'Big Data': Big gaps of knowledge in the field of Internet". International Journal of Internet Science. 7: 1โ€“5. Diarsipkan dari asli tanggal 23 November 2019. Diakses tanggal 2017-02-10.
  3. ^ "European open data portal". European open data portal. European Commission. Diakses tanggal 2025-10-05.
  4. ^ Jan M. ลปytkow, Jan Rauch (2000). Principles of data mining and knowledge discovery. Springer. ISBNย 978-3-540-66490-1.

๐Ÿ“š Artikel Terkait di Wikipedia

Kumpulan data COVID-19

Kumpulan data COVID-19 (Inggris: COVID-19 datasets) adalah kumpulan data atau database publik atau bisa diakses secara terbuka atau umum, untuk berbagi

Pangkalan data

bentuk buku besar, kuitansi dan kumpulan data yang berhubungan dengan bisnis. Konsep dasar dari pangkalan data adalah kumpulan dari catatan-catatan, atau potongan

Data tertaut

Dalam bidang komputasi, data tertaut (bahasa Inggris: linked datacode: en is deprecated ) atau data terhubung merujuk pada bentuk data terstruktur yang saling

Data

Data (serapan dari bahasa Latin: datacode: la is deprecated ) adalah catatan atas kumpulan fakta. Dalam penggunaan sehari-hari, data berarti suatu pernyataan

Kudeta

partisipasi dari pihak non-militer dan militer (tentara). Menurut kumpulan data-data kudeta dari Jonathan Powell dan Clayton Thyne, terdapat 457 upaya

Unicode

Unicode mengandung suatu kumpulan karakter, suatu metodologi pengkodean dan kumpulan standar penyandian karakter, suatu kumpulan bagan kode untuk referensi

Statistika

dengan data. Statistik adalah data itu sendiri, informasinya, atau hasil penerapan algoritme statistika pada suatu data tersebut. Dari kumpulan data, statistika

Suno AI

rekaman suara yang diberikan oleh penggunanya. Suno tidak mengungkapkan kumpulan data yang digunakan untuk melatih kecerdasan buatan mereka. Suno, Inc., didirikan