Pengenalan pola (dalam bahasa Inggris: pattern recognition) merupakan bidang dalam pembelajaran mesin dan dapat diartikan sebagai "tindakan mengambil data mentah dan bertindak berdasarkan klasifikasi data".[1][2] Dengan demikian, ia merupakan himpunan kaidah bagi pembelajaran diselia (supervised learning).
Ada beberapa definisi lain tentang pengenalan pola, di antaranya:

  • Penentuan suatu objek fisik atau kejadian ke dalam salah satu atau beberapa kategori.[3]
  • Ilmu pengetahuan yang menitikberatkan pada deskripsi dan klasifikasi (pengenalan) dari suatu pengukuran.[4]
  • Suatu pengenalan secara otomatis suatu bentuk, sifat, keadaan, kondisi, susunan tanpa keikutsertaan manusia secara aktif dalam proses pemutusan.

[5]
Berdasar beberapa definisi di atas, pengenalan pola bisa didefinisikan sebagai cabang kecerdasan yang menitik-beratkan pada metode pengklasifikasian objek ke dalam klas - klas tertentu untuk menyelesaikan masalah tertentu.
mencari/menemukan pola/kesamaan antar masalah maupun dalam masalah tersebut.

Salah satu aplikasinya adalah pengenalan suara, klasifikasi teks dokumen dalam kategori (contoh. surat-E spam/bukan-spam), pengenalan tulisan tangan, pengenalan kode pos secara otomatis pada sampul surat, atau sistem pengenalan wajah manusia. Aplikasi ini kebanyakan menggunakan analisis citra bagi pengenalan pola yang berkenaan dengan citra digital sebagai input ke dalam sistem pengenalan pola.

Teknik Pengenalan Pola

sunting

Pengenalan pola biasanya merupakan langkah perantaraan bagi proses lebih lanjut. Langkah ini biasanya merupakan dapatan data (gambar, bunyi, teks, dll.) untuk dikelaskan, pre-pemrosesan untuk menghilangkan gangguan atau menormalkan gambar dalam satu cara (pemrosesan gambar (image processing), teks dll.), pengiraan ciri-ciri, pengkelasan dan akhirnya post-pemrosesan berdasarkan kelas pengenalan dan aras keyakinan.

Pengenalan pola itu sendiri khususnya berkaitan dengan langkah pengkelasan. Dalam kasus tertentu, sebagaimana dalam jaringan saraf (neural networks), pemilihan ciri-ciri dan pengambilan juga boleh dilaksanakan secara semi otomatis atau otomatis sepenuhnya.

Sementara terdapat banyak kaidah untuk pengkelasan, ia menyelesaikan satu dari tiga masalah matematis berkaitan.

Pertama adalah mencari peta ruang ciri (feature space) (biasanya pelbagai dimensi ruang vektor (vector space)) bagi set label. Secara bersamaan ia membagi ruang ciri menjadi kawasan-kawasan, kemudian meletakkan label kepada setiap kawasan. Algoritme yang demikian ini (contohnya the nearest neighbour algorithm) biasanya belumlah menghasilkan kepercayaan atau class probabilities, sebelum diterapkannya post-processing.

Masalah kedua adalah untuk menganggap masalah sebagai anggaran, di mana matlamat adalah untuk menganggar fungsi bagi bentuk

di mana input vektor ciri adalah , dan fungsi f biasanya diparameter oleh sebagian parameter . Dalam pendekatan statistik Bayesian bagi masalah ini, berlainan dengan memilih satu vektor parameter , hasil dibentuk bagi kesemua thetas yang mungkin, dengan turutan berat bagi ketepatan berdasarkan data latihan D:

Masalah ketiga terkait dengan masalah kedua, tetapi masalahnya adalah untuk menganggar kebangkalian bersyarat (conditional probability) dan kemudian menggunakan aturan Bayes untuk menghasilkan kemungkinan kelas sebagaimana dalam masalah kedua.

Contoh algoritma klasifikasi termasuk:

Domain Aplikasi

sunting

Lihat pula

sunting

Rujukan

sunting
  1. ^ Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 0-471-05669-3.
  2. ^ J. Schuermann: Pattern Classification: A Unified View of Statistical and Neural Approaches, Wiley&Sons, 1996, ISBN 0-471-13534-8
  3. ^ IJCSNS, 2006, ISSN 1738-7906)
  4. ^ IJCSNS, 2006, ISSN 1738-7906
  5. ^ McGraw-Hill Dictionary of Scientific and Technical Terms (2003)

📚 Artikel Terkait di Wikipedia

Masalah Monty Hall

"Partition-Edit-Count: Naive Extensional Reasoning in Judgment of Conditional Probability," Journal of Experimental Psychology: General 133(4): 626-642.

Statistika

Cross-correlation (XCF) ARMA model ARIMA model (Box–Jenkins) Autoregressive conditional heteroskedasticity (ARCH) Vector autoregression (VAR) Frequency domain

Ekonometrika

pengembangan analisis runtun waktu. Engle menjadi pionir metode autoregressive conditional heteroskedasticity (ARCH) sedangkan Granger atas metode kointegrasi.

Distribusi t Student

variasi. Distribusi t Student memiliki fungsi kepekatan probabilitas (probability density function; PDF) sebagai berikut: f ( t )   =   1   ν     B (  

Efek pengacau

Cross-correlation (XCF) ARMA model ARIMA model (Box–Jenkins) Autoregressive conditional heteroskedasticity (ARCH) Vector autoregression (VAR) Frequency domain

Uji t Student

1002/asna.18760871402. Pfanzagl, J. (1996). "Studies in the history of probability and statistics XLIV. A forerunner of the t-distribution". Biometrika

Eksperimen semu

Quasi-experiment Statistika inferensia Statistical theory Population Statistic Probability distribution Sampling distribution Order statistic Empirical distribution

Model generatif

value Y for any given instance X Jebara 2004: "This distinction between conditional learning and discriminative learning is not currently a well-established