| BLAST | |
|---|---|
| Penulis asli | Stephen Altschul, Warren Gish, Webb Miller, Eugene Myers, and David Lipman |
| Pengembang | NCBI |
| Ditulis dalam | C and C++[1] |
| Sistem operasi | UNIX, Linux, Mac, MS-Windows |
| Jenis | Bioinformatika tool |
| Lisensi | Public domain |
| Situs web | blast |
Dalam bioinformatika, BLAST (Basic Local Alignment Search Tool)[2] adalah algoritma dan program untuk membandingkan informasi sekuens biologis primer, seperti sekuens asam amino, protein. atau nukleotida DNA dan/atau sekuens RNA. Pencarian BLAST memungkinkan peneliti untuk membandingkan urutan subjek protein atau nukleotida (disebut kueri) dengan perpustakaan atau database urutan, dan mengidentifikasi urutan perpustakaan yang menyerupai urutan kueri di atas ambang batas tertentu.
Berbagai jenis BLAST tersedia sesuai dengan urutan kueri dan basis data target.
Latar belakang
suntingBLAST adalah program pencarian similaritas pangkalan data yang banyak digunakan untuk pencarian sekuens.[3][4] Program ini dinilai dapat mengatasi masalah mendasar dalam penelitian bioinformatika. Algoritma heuristik yang digunakannya lebih cepat untuk pencarian skala besar dibandingkan dengan metode seperti Smith-Waterman. Penekanan pada kecepatan ini sangat penting untuk menjadikan algoritma ini praktis pada basis data genom besar yang tersedia saat ini, meskipun algoritma selanjutnya dapat lebih cepat lagi.[5]
Sejarah
suntingProgram BLAST dirancang oleh Eugene Myers, Stephen Altschul, Warren Gish, David J. Lipman, dan Webb Miller di Institut Kesehatan Nasional Amerika Serikat dan diterbitkan dalam Journal of Molecular Biology pada tahun 1990. BLAST dibentuk di atas FASTA, program yang sebelumnya dikembangkan untuk pencarian kesamaan sekuens protein dan DNA. Program ini menggabungkan model stokastik baru yang dikembangkan oleh Samuel Karlin dan Stephen Altschul.[6] Mereka mengusulkan "sebuah metode untuk memperkirakan kesamaan antara urutan DNA yang diketahui dari satu organisme dengan yang lain",[2] dan pekerjaan mereka dinilai sebagai "fondasi statistik untuk BLAST.[7] Selanjutnya, Altschul, Gish, Miller, Myers, dan Lipman merancang dan menerapkan program BLAST, yang diterbitkan dalam Journal of Molecular Biology pada tahun 1990 dan telah dikutip lebih dari 100.000 kali sejak saat itu.[8]
Algoritma
suntingMeski BLAST dinilai lebih cepat daripada implementasi Smith-Waterman mana pun untuk sebagian besar kasus, BLAST tidak dapat "menjamin penyelarasan optimal antara kueri dan sekuens basis data" seperti yang dilakukan algoritma Smith-Waterman. Algoritma Smith-Waterman merupakan pengembangan dari metode optimal sebelumnya, yaitu algoritma NeedlemanโWunsch, yang merupakan algoritma penyelarasan sekuens pertama yang dijamin akan menemukan penyelarasan terbaik. Namun, kebutuhan waktu dan ruang dari algoritma optimal ini jauh melebihi kebutuhan BLAST.[5][9]
BLAST dinilai lebih efisien waktu daripada FASTA karena hanya mencari pola yang lebih signifikan dalam sekuens sehingga lebih cepat, namun dengan sensitivitas yang relatif.[10][11] BLAST dinilai dapat menentukan protein yang terdapat pada spesies mikrobia yang terkait dalam garis keturunan dengan protein tertentu dengan sekuens asam amino yang diketahui dan menentukan gen lain yang mengkode protein sehingga menunjukkan struktur atau motif tertentu,
BLAST juga sering digunakan sebagai bagian dari algoritma lain yang memerlukan pencocokan sekuens perkiraan.
BLAST tersedia di situs web NCBI. Berbagai jenis BLAST tersedia berdasarkan urutan kueri dan basis data target. Implementasi alternatif meliputi AB-BLAST (sebelumnya dikenal sebagai WU-BLAST), FSA-BLAST (terakhir diperbarui pada tahun 2006), dan ScalaBLAST.[12][13] Ada juga beberapa jenis BLAST, mulai yang dasar seperti BLAST-N (membandingkan urutan nukleotida dengan urutan nukleotida), BLASTP (membandingkan urutan protein dengan urutan protein), BLAST-X (membandingkan urutan nukleotida dengan urutan protein), tBLAST-N (membandingkan urutan protein dengan enam translasi kerangka urutan nukleotida), dan TBLAST-X (membandingkan enam translasi kerangka urutan nukleotida dengan enam translasi kerangka urutan protein), hingga yang terspesialisasi seperti IG-BLAST yang menggunkana pangkalan data urutan imonuglobin dan reseptor sel T, pembuatan primer, pencarian domain terkonversi, penjajaran urutan banyak, atau kaitan BLAST terhadap urutan dalam pangkalan data REFSEQ (suatu koleksi iyang menyediakan serangkaian urutan yang komprehensif, terintegrasi, tidak redundan, dan beranotasi dengan baik, termasuk DNA genom, transkrip, dan protein).[4][14][15]
Masukan
suntingUrutan masukan (dalam format FASTA atau Genbank), basis data untuk pencarian, dan parameter opsional lainnya seperti matriks skor.[16]
Keluaran
suntingKeluaran BLAST dapat dikirimkan dalam berbagai format. Format ini mencakup HTML, teks biasa, dan format XML. Untuk halaman web Pusat Nasional Informasi Bioteknologi Amerika Serikat (NCB), format standar untuk keluaran adalah HTML. Saat melakukan BLAST di NCBI, hasilnya ditampilkan dalam format grafis yang menunjukkan hit yang ditemukan, tabel yang menunjukkan pengidentifikasi sekuens untuk hit tersebut dengan data terkait skor, serta penyelarasan untuk sekuens yang diinginkan dan hit yang diterima dengan skor BLAST yang sesuai. Tabel yang muncul ini mungkin merupakan cara yang dinilai paling mudah dibaca dan paling informatif.
Jika seseorang mencoba mencari sekuens proprietary atau sekuens yang tidak tersedia dalam basis data yang tersedia untuk umum melalui sumber seperti NCBI, terdapat program BLAST yang dapat diunduh ke komputer mana pun, tanpa biaya. Program ini dapat ditemukan di berkas BLAST+ yang dapat dieksekusi. Program komersial juga tersedia untuk dibeli. Basis data dapat ditemukan di situs NCBI, serta di Indeks basis data BLAST (FTP).
Tahapan[4]
suntingPenentuan kata (Seeding)
suntingPada tahap ini, BLAST membuat serangkaian urutan pendek dari kueri yang diesbut sebagai "kata". Panjang urutan DNA berbeda dengan panjang urutan protein, di mana urutan DNA menggunakan 11 residu dan urutan protein menggunakan 3 residu. Pengaturan secara manual untuk panjang urutan juga dapat dilakukan untuk menyesuaikan tingat sensitivitas dan spesialisasinya. Kemudian, daftar kata tersebut digunakan untuk mencari urutan dalam pangkalan data yang memiliki kecocokan dengannya, di mana hubungan tersebut dihitung tingkat similaritasnya dengan menggunakan matriks substitusi seperti pada metode pemrograman dinamis meskipun hanya sebagian kecil urutan saja yang dicari. Suatu kata dikatakan cocok dengan suatu urutan pangkalan data jika nilai similaritasnya berada di ambang minimal yang telah ditetapkan dan ini berlaku sebagai kriteria pertama untuk menyeleksi urutan pangkalan data yang tidak berhubunagn dengan kueri.
Pemanjangan kata (Extension)
suntingSetelah melakukan tahap penentuan kata, pasangan kata yang memenuhi kriteria akan dihitung skor similaritasnya dari kiri ke kanan kata hingga mencakup keseluruhan urutan kueri. Secara bersamaan, dilakukan juga penghitungan skor berdasarkan pasangan segmen yang memiliki skor tinggi (high-scoring segmen pair/ HSP), yang merupakan skor similaritas total setiap kali dilakukan pencocokan antar residu. Pada tahap ini, skor minimal HSP juga ditetapkan dan menjadi kriteria penyeleksi, yaitu jika nilai HSP turun di bawah ambang batas minimal, maka proses pemanjangan akan berhenti dan pasangan tersebut dikeluarkan dari daftar kandidat urutan yang cocok dengan kueri. Proses ini dilakukan terhadap seluruh pasangan kata yang ada di dalam daftar.
Penyajian hasil
suntingPada tahap ini, pasangan kata dengan skor di atas ambang minimal akan diurutkan dari yang memiliki skor HSP atau BLAST Hit yang tertinggi sampai yang terendah. Selain HSP, beberapa parameter seperti E-value, bit score, persentase identitas pasangan urutan, dan nomor akses dari setiap urutan pangkalan data juga ditampilkan.
Referensi
sunting- ^ = Web&PAGE_TYPE = BlastDocs&DOC_TYPE = DeveloperInfo "BLAST Developer Information". blast.ncbi.nlm.nih.gov.
- ^ a b Douglas Martin (February 21, 2008). "Samuel Karlin, Versatile Mathematician, Dies at 83". The New York Times.
- ^ R. M. Casey (2005). "BLAST Sequences Aid in Genomics and Proteomics". Business Intelligence Network.
- ^ a b c Aprilyanto, Victor; Sembiring, Langkah (2017). Bioinformatika. Yogyakarta: Innosain. ISBNย 9786026542328. Pemeliharaan CS1: Status URL (link)
- ^ a b Ivรกn, Gรกbor; Bรกnky, Dรกniel; Grolmusz, Vince (2016-09-01). "Fast and exact sequence alignment with the SmithโWaterman algorithm: The SwissAlign webserver". Gene Reports. 4: 26โ28. doi:10.1016/j.genrep.2016.02.004. ISSNย 2452-0144.
- ^ "BLAST topics".
- ^ Stephen Altschul; Warren Gish; Webb Miller; Eugene Myers; David J. Lipman (1990). "Basic local alignment search tool". Journal of Molecular Biology. 215 (3): 403โ410. doi:10.1016/S0022-2836(05)80360-2. PMIDย 2231712. S2CIDย 14441902.
- ^ "Sense from Sequences: Stephen F. Altschul on Bettering BLAST". ScienceWatch. JulyโAugust 2000. Diarsipkan dari asli tanggal 7 October 2007.
- ^ Altschul, Stephen F (2014). BLAST Algorithm (dalam bahasa Inggris). John Wiley & Sons, Ltd. doi:10.1002/9780470015902.a0005253.pub2. ISBNย 978-0-470-01590-2.
- ^ Mount, David W. (2007-07). "Using the Basic Local Alignment Search Tool (BLAST)". Cold Spring Harbor Protocols (dalam bahasa Inggris). 2007 (7): pdb.top17. doi:10.1101/pdb.top17. ISSNย 1940-3402.
- ^ "Computers and the Human Genome Project: BLAST Algorithm". cs.stanford.edu. Diakses tanggal 2025-10-26.
- ^ Oehmen, C.; Nieplocha, J. (2006). "ScalaBLAST: A Scalable Implementation of BLAST for High-Performance Data-Intensive Bioinformatics Analysis". IEEE Transactions on Parallel and Distributed Systems. 17 (8): 740. doi:10.1109/TPDS.2006.112. S2CIDย 11122366.
- ^ Oehmen, C. S.; Baxter, D. J. (2013). "ScalaBLAST 2.0: Rapid and robust BLAST calculations on multiprocessor systems". Bioinformatics. 29 (6): 797โ798. doi:10.1093/bioinformatics/btt013. PMCย 3597145. PMIDย 23361326.
- ^ Aryal, Sagar; PhD (2023-08-03). "What are FASTA and BLAST? An Introduction". microbenotes.com (dalam bahasa American English). Diakses tanggal 2025-10-27.
- ^ "About RefSeq". www.ncbi.nlm.nih.gov. Diakses tanggal 2025-10-27.
- ^ Penumarthi, Lasya R.; Baptista, Rodrigo P.; Beaudry, Megan S.; Glenn, Travis C.; Kissinger, Jessica C. (2024-12-18). "A new chromosome-level genome assembly and annotation of Cryptosporidium meleagridis". Scientific Data (dalam bahasa Inggris). 11 (1): 1388. Bibcode:2024NatSD..11.1388P. doi:10.1038/s41597-024-04235-7. ISSNย 2052-4463. PMCย 11655656. PMIDย 39695163.
Pranala luar
sunting| Sumber pustaka mengenai Sequence alignment |
- Situs web resmi
- BLAST+ executables โ free source downloads