📑 Table of Contents


Apache Flink
PengembangApache Software Foundation
Rilis awalMei 2011; 15 tahun lalu (2011-05)
Templat:Kotak info perangkat lunak/simple
Ditulis dalamJava and Scala
Sistem operasiCross-platform
Jenis
LisensiApache License 2.0
Situs webflink.apache.org Sunting ini di Wikidata
Repositori

Apache Flink adalah sistem pemrosesan data terdistribusi yang mendukung pemrosesan berkelompok (batch) maupun aliran data (streaming). Flink dirancang untuk menangani berbagai tantangan dalam pengolahan data terbatas dan tidak terbatas secara efisien.

Fitur

sunting

Beberapa fitur utama Flink meliputi:

  • Dukungan jendela waktu yang fleksibel, memungkinkan pengelompokan data berdasarkan periode tertentu.
  • Konsistensi status dengan jaminan pemrosesan tepat sekali (exactly-once), memastikan keakuratan data tanpa duplikasi atau kehilangan informasi.
  • Pemrosesan berbasis waktu kejadian (event-time semantics), mempertahankan urutan asli data sesuai waktu terjadinya.
  • Pemrosesan aliran data yang memiliki status (stateful stream processing), memungkinkan penyimpanan dan pengelolaan data selama pemrosesan.
  • Dukungan untuk pemrosesan kejadian kompleks (complex event processing) dan kueri berkelanjutan (continuous queries), memungkinkan analisis data secara langsung (real-time).

Sejarah

sunting

Apache Flink berasal dari proyek penelitian akademik. Pada tahun 2010, proyek Stratosphere dimulai oleh lima kelompok penelitian dari Technische Universität Berlin, Humboldt Universität zu Berlin, dan Hasso Plattner Institute Potsdam. Tujuan utama proyek ini adalah mengembangkan pendekatan baru untuk pemrosesan data terdistribusi dalam skala besar.

Sebagai bagian dari proyek ini, para peneliti mengembangkan prototipe sistem pemrosesan data untuk mengevaluasi pendekatan baru mereka. Perangkat lunak ini kemudian dirilis sebagai aplikasi terbuka (open-source) di bawah lisensi perangkat lunak Apache.

Pada tahun yang sama, proyek Apache Hadoop (dari sebuah implementasi aplikasi terbuka (open-source) dari Google MapReduce dan Google File System (GFS)) yang menjadi sangat populer di kalangan industri dan akademisi. Keunggulan utama Hadoop adalah kemampuannya untuk menskalakan tugas pemrosesan data ke banyak mesin dengan spesifikasi standar serta toleransi tinggi terhadap kegagalan perangkat keras dan perangkat lunak.

Namun, komunitas penelitian basis data menyadari bahwa MapReduce tidak cukup efisien atau mudah digunakan dalam mendefinisikan aplikasi analitik yang kompleks. Oleh karena itu, proyek Stratosphere bertujuan untuk menggabungkan keunggulan MapReduce dengan sistem basis data relasional.

Proyek ini menghasilkan sistem pemrosesan data terdistribusi yang terdiri dari:

  1. Model pemrograman PACT, yang menggeneralisasi model pemrograman MapReduce dengan menyediakan lebih banyak operator paralel.
  2. Mesin pemrosesan aliran data terdistribusi Nephele, yang menjalankan program PACT sebagai aliran data berbentuk graf asiklik terarah (DAG).
  3. Optimizer, yang menerjemahkan program PACT menjadi aliran data Nephele untuk meningkatkan efisiensi eksekusi.

Pendekatan ini membuat spesifikasi aplikasi analitik yang kompleks menjadi lebih mudah. Operator runtime yang digunakan untuk menjalankan program PACT diimplementasikan berdasarkan algoritma terkenal dalam sistem basis data, seperti:

  • External merge-sort
  • Block-nested loop join
  • Hybrid-hash join
  • Sort-merge join

Pendekatan ini memungkinkan sistem untuk menangani pemrosesan data dengan efisiensi yang lebih tinggi dibandingkan dengan MapReduce.

Referensi

sunting
  1. ^ "Release 2.2.1". 11 Mei 2026. Diakses tanggal 12 Mei 2026.
  2. ^ "All stable Flink releases". flink.apache.org. Apache Software Foundation. Diakses tanggal 2021-12-20.

📚 Artikel Terkait di Wikipedia

Diagnosis

Bayesian Pemrosesan peristiwa kompleks (Complex event processing) Diagnosis (kecerdasan buatan) Korelasi peristiwa (Event correlation) Manajemen kesalahan (Fault

Waktu

Luckham & Roy Schulte (23 August 2011). "Event Processing Glossary – Version 2.0". Complex Event Processing. Diarsipkan dari versi aslinya tanggal 15

Optimasi multitugas

"Gradient Surgery for Multi-Task Learning". Advances in Neural Information Processing Systems (dalam bahasa Inggris). 33. arXiv:2001.06782. Liu, Bo; Liu, Xingchao;

Christopher Nolan

2014). "Tarantino and Nolan share a Kodak moment as studios fund film processing". The Guardian. Diarsipkan dari versi aslinya tanggal 27 February 2017

Impatiens viridiflora

monitoring of a producing hydrocarbon deposit: Part I. Algorithms of processing and numerical simulation [Novyye algoritmyemissionnoyto

Iridium

277–372. doi:10.1021/cr60103a002. S2CID 96640406. Ohriner, E. K. (2008). "Processing of Iridium and Iridium Alloys". Platinum Metals Review. 52 (3): 186–197

Fungi

Olempska-Beer ZS, Merker RI, Ditto MD, DiNovi MJ (July 2006). "Food-processing enzymes from recombinant microorganisms--a review". Regulatory Toxicology

Manusia

Oxford University Press. hlm. 291–93. ISBN 978-0-19-508944-8. Emotional processing, but not emotions, can occur unconsciously. Cabanac M (2002). "What is