Jaringan Saraf Berulang atau Recurrent Neural Network (RNN) adalah kelas dari jaringan saraf tiruan yang dirancang khusus untuk memproses data berurutan (sequential data) atau data deret waktu (time-series). Berbeda dengan jaringan saraf feed-forward tradisional yang mengasumsikan bahwa semua masukan bersifat independen satu sama lain, RNN memiliki "memori" yang memungkinkan informasi dari langkah-langkah sebelumnya memengaruhi keluaran saat ini.[1]
Deskripsi Teknis dan Arsitektur
suntingKarakteristik utama yang membedakan RNN adalah adanya koneksi siklus atau feedback loop. Dalam setiap langkah waktu (), model menerima masukan saat ini () sekaligus informasi dari status tersembunyi sebelumnya ().
Mekanisme Kerja
suntingPada setiap unit RNN, perhitungan dilakukan untuk memperbarui status tersembunyi yang berfungsi sebagai representasi internal dari memori jangka pendek. Secara matematis, pembaruan status tersembunyi pada waktu dinyatakan sebagai:
Di mana:
- : Status tersembunyi (hidden state) pada waktu .
- : Fungsi aktivasi non-linear (biasanya atau ReLU).
- dan : Matriks bobot untuk status sebelumnya dan masukan saat ini.
- : Vektor bias.
Kelebihan dan Tantangan
sunting| Aspek | Deskripsi |
| Kelebihan | Kemampuan memodelkan ketergantungan temporal, fleksibilitas dalam menangani panjang masukan yang bervariasi, dan efisiensi dalam berbagi parameter di setiap langkah waktu. |
| Tantangan | Masalah Vanishing Gradient (gradien menghilang) dan Exploding Gradient (gradien meledak) saat melatih model pada urutan yang sangat panjang, yang menyebabkan model kehilangan kemampuan untuk mengingat informasi dari masa lalu yang jauh. |
Referensi
sunting- ^ Goodfellow, Ian (2016). Deep Learning (Chapter 10: Sequence Modeling: Recurrent and Recursive Nets). Cambridge, Massachusetts: MIT Press. Pemeliharaan CS1: Status URL (link)