Pendahuluan
DNA (asam deoksiribonukleat) adalah molekul genetik yang menyimpan informasi biologis dari makhluk hidup. Mengetahui secara tepat urutan basa DNA (A, T, G, C) sangat penting dalam genetika, biologi molekuler, evolusi, diagnosis penyakit, penelitian genomik, dan aplikasi bioteknologi lainnya. Namun, proses penentuan urutan DNA (sekuensing) tidaklah mudah: metode‐metode awal sangat lambat, labor intensif, dan mahal. Seiring waktu, teknologi berkembang dari metode generasi pertama (low throughput) ke generasi kedua (high throughput, pendek) dan generasi ketiga (single molecule, long reads). Artikel ini menelusuri perjalanan teknologi tersebut.
Awal Mula: Menjelajah DNA sebelum “sekuensing modern”
Sebelum teknologi sekuensing modern muncul, para peneliti mempelajari sifat kimia DNA, memisahkan untai, dan memetakan fragmen berdasarkan teknik kimia dan fisika. Namun penentuan urutan basa secara langsung belum mungkin.
Struktur heliks ganda DNA ditemukan oleh Watson & Crick (dengan bantuan data difraksi sinar-X Rosalind Franklin) pada tahun 1953, yang membuka wawasan bahwa DNA tersusun dari pasangan basa yang spesifik (A–T dan G–C).
Pada dekade 1960-an, Robert Holley berhasil menyusun urutan tRNA sebagai molekul RNA kecil (sekitar 77 nukleotida), langkah awal penentuan urutan nukleotida di molekul biologis. (The DNA Universe BLOG)
Namun, teknik‐teknik kimia awal tidak berlaku untuk urutan genom besar. Untuk memecahkan tantangan sekuensing DNA genom yang panjang, dibutuhkan metode baru.
Generasi Pertama: Metode klasik — Sanger & Maxam–Gilbert
Generasi pertama sekuensing DNA mencakup metode‐metode yang muncul pada akhir 1970-an, yang dikenal sebagai metode “chain termination” (Sanger) dan metode kimia degradasi (Maxam–Gilbert). Keduanya menjadi landasan sekuensing DNA selama beberapa dekade.
Metode Maxam–Gilbert (1976–1977)
Dikembangkan oleh Allan Maxam dan Walter Gilbert pada tahun 1976–1977. (Wikipedia)
Prinsipnya: DNA diberi label radioaktif di satu ujung (misalnya ujung 5’), kemudian diolah secara kimia sehingga terjadi pemutusan (cleavage) pada posisi basa tertentu (misalnya A+G, C+T, dsb). Fragmen‐fragmen tersebut dipisahkan dengan elektroforesis gel dan pola fragmen diinterpretasikan untuk menentukan urutan basa. (Wikipedia)
Kelebihan: dapat membaca langsung dari DNA terlabel, tidak memerlukan replikasi enzimatik tambahan.
Kekurangan: menggunakan bahan kimia beracun, rumit secara prosedur, sulit diskalakan untuk panjang besar, dan tidak cocok untuk genom yang sangat besar. Akhirnya, metode ini sedikit demi sedikit ditinggalkan ketika metode lain muncul. (Wikipedia)
Metode Sanger (Chain-Termination) – 1977
Diperkenalkan oleh Frederick Sanger dan rekannya pada tahun 1977. (Front Line Genomics)
Prinsip: menggunakan dideoksinukleotida (ddNTP) yang jika diinkorporasikan ke untai DNA, akan menghentikan perpanjangan untai karena tidak memiliki gugus 3’-OH. Dengan mencampurkan ddNTP (yang berlabel) bersama dNTP normal, akan terbentuk fragmen‐fragmen DNA yang berakhir secara acak di berbagai posisi. Fragmen-fragmen itu kemudian dipisahkan berdasarkan ukuran dalam elektroforesis, dan urutan basa terbaca dari fragmen terkecil ke terbesar. (PacBio)
Kemajuan: Pada tahun 1980-an, metode ini diotomatisasi menggunakan elektroforesis kapiler dan pewarna fluoresens. Applied Biosystems merilis mesin sekuensing otomatis sekitar 1987 (ABI 370 atau versi sejenis) yang memakai capillary electrophoresis. (Wikipedia)
Keunggulan:
Akurasi tinggi (tingkat kesalahan rendah).
Membaca fragmen moderate (biasanya hingga ~700–1000 nt tergantung optimisasi).
Metode yang relatif mapan, banyak dipakai sebagai standar validasi (gold standard) untuk memastikan keakuratan hasil dari teknologi baru. (Wikipedia)
Keterbatasan:
Tingkat throughput rendah — hanya bisa memproses satu fragmen DNA dalam satu reaksi (meskipun mesin otomatis bisa multiple capillary).
Biaya dan waktu relatif besar ketika ingin sekuensing genom besar.
Membutuhkan fragmen‐fragmen DNA dengan panjang moderat agar elektroforesis bisa memisahkan secara resolusi.
Aplikasi penting:
Sanger tetap digunakan untuk verifikasi (misalnya memvalidasi hasil NGS), sekuensing gen target, sekuensing klon plasmid, dan penelitian yang memerlukan akurasi tinggi dengan jumlah sampel terbatas.
Dalam proyek sekuensing genom awal (misalnya sekuensing genom bakteri atau virus), Sanger digunakan sebagai salah satu alat pembangun peta genom (mapping) dan gap closing.
Dengan munculnya metode generasi pertama ini, peneliti sudah bisa membaca urutan gen dan bakteri/virus kecil, tetapi untuk genom besar (misalnya tumbuhan, hewan, manusia), metode ini terlalu lambat. Maka muncullah era generasi kedua.
Generasi Kedua: Next-Generation Sequencing (NGS) — throughput tinggi dan parallel
Generasi kedua, sering disebut Next Generation Sequencing (NGS) atau High-Throughput Sequencing, muncul sebagai revolusi dalam kapasitas dan efisiensi sekuensing. Ide utamanya: memecah DNA menjadi fragmen kecil, menjalankan banyak reaksi sekuensing secara paralel (multiplex) dalam satu eksperimen, dan kemudian merakit fragmen-fragmen itu kembali (assembly / alignment). (PMC)
Latar belakang & motivasi
Proyek Genom Manusia (Human Genome Project) di tahun 1990-an memicu kebutuhan untuk teknologi yang lebih cepat, murah, dan berkapasitas tinggi untuk membaca genom manusia (~3 miliar basa).
Metode Sanger tradisional terlalu mahal dan lambat untuk skala tersebut.
Dengan NGS, sekuensing bisa dilakukan jutaan hingga miliaran fragmen kecil secara paralel, sehingga dalam sekali run bisa menghasilkan data besar. (PMC)
NGS secara drastis menurunkan biaya per basa dan mempercepat waktu sekuensing. (PMC)
Teknologi dan platform utama NGS
Berikut beberapa metode generasi kedua yang menonjol:
Pyrosequencing / 454 (Roche)
Salah satu platform NGS pertama yang komersial (sekitar 2005) oleh 454 Life Sciences. (PMC)
Metode: sequencing‐by‐synthesis (SBS) di mana nukleotida ditambahkan satu per satu dan pelepasan pirofosfat (PPi) diamati sebagai sinyal cahaya menggunakan enzim luciferase. (CRiver)
Panjang baca (read length) sekitar 400–500 bp, throughput lebih tinggi dibanding Sanger. (CRiver)
Keterbatasan: masalah dalam urutan basa berulang (homopolimer), biaya per-base masih relatif tinggi dibanding platform selanjutnya. (CRiver)
Illumina / Solexa (Sequencing by Synthesis dengan reversible terminator)
Metode ini menjadi sangat dominan dalam dunia NGS. (PacBio)
Prinsip: fragment DNA ditambahkan adapter, dilipat dan melekat (bridge amplification) membentuk kluster di flow cell (permukaan padat). Kemudian nukleotida fluorescent yang dapat dilepas ("reversible terminator") diinkorporasi, sinyal fluoresensi dibaca, kemudian fluor dilepas dan siklus ulang dilanjutkan. (PMC)
Kelebihan: throughput sangat besar (miliaran bacaan pendek), akurasi tinggi, biaya per-base sangat rendah dibanding metode generasi pertama. (PMC)
Keterbatasan: read pendek (biasanya 100–300 bp, tergantung platform dan generasi mesin), tantangan dalam merakit (assembly) terutama di bagian genom yang repetitif atau struktur kompleks. (Geneious)
Contoh platform populer: Illumina HiSeq, MiSeq, NextSeq, NovaSeq, dsb.
SOLiD (Sequencing by Oligonucleotide Ligation and Detection)
Dikembangkan oleh Life Technologies (Applied Biosystems). (Wikipedia)
Metode: menggunakan ligasi oligonukleotida pendek yang akan dikenali oleh sekuens target, dengan encoding dua basa (2-base encoding) sehingga sinyal gabungan dua basa digunakan untuk validasi. (Wikipedia)
Kelebihan: akurasi sangat baik, terutama untuk variasi kecil atau SNP.
Keterbatasan: proses lebih kompleks, serta interpretasi data lebih rumit dibanding metode berbasis sintesis murni.
Ion Torrent (sequencing by semiconductor / pH detection)
Platform ini mendeteksi ion hidrogen (H⁺) yang dilepaskan ketika nukleotida ditambahkan ke untai DNA (reaksi polimerase). Deteksi pH kemudian diterjemahkan menjadi basa DNA. (PMC)
Keunggulan: tidak memerlukan fluoresensi, instrumen lebih sederhana, waktu respons cepat.
Keterbatasan: masalah dalam urutan homopolimer (deret nukleotida sama), akurasi tergantung kondisi kimia.
Teknologi lain & varian
Beberapa pendekatan kombinasi dan inovasi, seperti Ion Proton, Illumina’s patterned flow cells, dan metode pengurangan ukuran sampel (single-cell sequencing) juga dikembangkan di era generasi kedua.
Beberapa teknik NGS juga menggunakan pendekatan “sequencing by ligation” (selain SOLiD) dan metode modifikasi kimia, tetapi sebagian besar platform superior adalah berbasis SBS (Illumina) dan variasinya.
Keunggulan & dampak NGS
Peningkatan throughput yang sangat besar (dari ribuan basa per run ke jutaan hingga miliaran basa per run).
Penurunan drastis biaya sekuensing per basa.
Memungkinkan sekuensing genom lengkap (whole-genome sequencing, WGS), sekuensing resekuensing (resequencing), studi biodiversitas (metagenomik), RNA‐seq, epigenetika, dan analisis varian populasi.
Membuka usaha penelitian besar skala genom (projek 1000 Genomes, TCGA, dsb).
Tantangan: manajemen data besar (big data), kualitas baca pendek, gap dalam assembly terutama area repetitif, bias kemiringan (GC bias), dan kebutuhan computational untuk assembly & analisis.
Seiring perkembangan NGS, muncullah generasi ketiga yang mencoba mengatasi batasan read pendek dan amplifikasi.
Generasi Ketiga: Single-Molecule & Long-Read Sequencing
Generasi ketiga menyajikan paradigma baru: sekuensing molekul tunggal (single molecule) tanpa amplifikasi klonal (atau minimal), dengan kemampuan menghasilkan bacaan panjang (long reads), serta deteksi modifikasi basa (epigenetik) langsung. (PMC)
Prinsip dasar & motivasi
Tujuan: mengatasi kelemahan NGS read pendek yang sulit merakit bagian genom kompleks (region berulang, structural variant). (bioMérieux Industry)
Dengan membaca molekul DNA tunggal dari ujung ke ujung (atau sepanjang mungkin) tanpa perlu kloning atau amplifikasi yang dapat memperkenalkan bias, maka assembly menjadi lebih mudah dan akurasi dapat ditingkatkan lewat konsensus. (PMC)
Beberapa metode generasi ketiga bahkan dapat mendeteksi modifikasi basa (misalnya metilasi DNA) langsung selama proses sekuensing.
Teknologi & platform generasi ketiga
Berikut beberapa teknologi dan platform terkemuka:
Pacific Biosciences (PacBio) – SMRT sequencing (Single Molecule Real-Time)
PacBio menggunakan “zero-mode waveguide” (ZMW) – sebuah sumur sangat kecil di mana DNA polymerase bekerja dan tiap penambahan nukleotida yang berlabel floresen terdeteksi secara real-time. (PMC)
Keunggulan:
Membaca fragment panjang (dari ribuan hingga puluhan ribu basa) — dikenal sebagai “long reads”. (Geneious)
Akurasi per-basa agak lebih rendah dibanding metode klonal (NGS), tetapi dengan konsensus (mengulang bacaan) dapat mencapai akurasi tinggi.
Bisa mendeteksi modifikasi basa (misalnya metilasi) secara langsung.
Kekurangan:
Biaya instrument dan reagent yang tinggi.
Tingkat kesalahan per baca (error rate) masih lebih tinggi dibanding NGS pendek, yang memerlukan koreksi lewat pengulangan atau hybrid dengan data pendek.
Penerapan:
Assembly genom bakteri & eukariotik secara lebih lengkap, mengeksplorasi struktur genom kompleks, memetakan varian structural (indel, inversi, duplikasi).
Dalam studi metagenomik dan identifikasi organisme dalam komunitas campuran.
Oxford Nanopore Technologies (ONT) – Nanopore sequencing
Teknologi: DNA untai tunggal dilewatkan melalui pori nanopori (pore) pada membran. Saat basa melewati pori, perubahan arus listrik melintasi pori digunakan untuk menerjemahkan basa DNA (A, T, G, C). (PacBio)
Keunggulan:
Dapat menghasilkan bacaan sangat panjang (bahkan >100 kb, tergantung kondisi).
Perangkat bisa portabel (misalnya MinION) dan relatif lebih murah dibanding beberapa teknologi kelas atas.
Bisa melakukan sekuensing real-time (data muncul saat proses berjalan) dan deteksi modifikasi basa (metilasi) tanpa perlakuan kimia tambahan.
Kekurangan:
Tingkat kesalahan bacaan (error per-basa) lebih tinggi dibanding NGS pendek; perlu algoritma koreksi dan polishing.
Sensitivitas terhadap kondisi kimia sampel, kualitas DNA, dan noise listrik.
Penggunaan:
Untuk assembly de novo, perekonstruksian struktur genom besar, penelitian metagenomik kompleks, serta untuk aplikasi di lapangan (misalnya ekologi, biologi lingkungan, surveilans patogen secara cepat).
Metode gabungan & varian lainnya
Beberapa metode “third-generation” menggunakan teknik baru seperti single-molecule real-time sequencing(tidak hanya PacBio), nanopore versi baru, sequencing dengan konsensus melingkar (circular consensus sequencing / CCS) untuk meningkatkan akurasi bacaan panjang. (Wikipedia)
Penggabungan data long-read dan short-read (hybrid sequencing) menjadi strategi populer — baca panjang memudahkan assembly kasar, dan baca pendek memperbaiki kesalahan.
Teknik baru pada masa depan juga mengarah ke “pembacaan langsung DNA epigenetik” atau “multi-omics langsung” dalam satu molekul.
Kelebihan & dampak generasi ketiga
Memungkinkan assembly genom yang lebih utuh, menurunkan jumlah gap, dan menyelesaikan area genom yang sebelumnya sulit (repetitif, transposon, struktur kompleks).
Deteksi varian struktural (misalnya delesi, duplikasi, inversi) lebih mudah dan akurat dibanding bacaan pendek.
Waktu nyata (real-time) dan potensi aplikasi di lapangan (misalnya perangkat portabel nanopore).
Tantangan utama: kesalahan baca tinggi, kebutuhan koreksi data, perlunya hardware dan algoritma yang kuat, dan biaya reagent.
Dengan perkembangan dan perbaikan algoritmik (polishing, konsensus), akurasi long-read semakin membaik dan mendekati rata-rata teknologi terbatas.
Perbandingan Generasi 1 vs 2 vs 3
Aspek | Generasi I (Sanger / Maxam–Gilbert) | Generasi II (NGS, high throughput) | Generasi III (Single-molecule, long-read) |
---|---|---|---|
Prinsip dasar | Chain termination (Sanger) / degradasi kimia (Maxam–Gilbert) | Sequencing by synthesis / ligation / pH detection, kloning/amplifikasi klonal banyak fragmen paralel | Sequencing molekul tunggal, tanpa/berkurang amplifikasi; long-read, nanopore, real-time |
Throughput | Rendah (satu fragmen per reaksi, meskipun otomatis multiplikasi) | Sangat tinggi (jutaan hingga miliaran fragmen per run) | Medium–tinggi, tapi bacaan panjang dan paralel (tergantung platform) |
Panjang baca | ~500–1000 basa (tergantung optimisasi) | pendek, biasanya 50–300 basa (varian tergantung platform) | Bacaan panjang (ribuan hingga puluhan ribu basa atau lebih) |
Akurasi (per basa) | Sangat tinggi (error sangat rendah) | Tinggi, terutama dengan coverage tinggi; bacaan pendek meningkatkan kesalahan sistematik | Lebih tinggi error per baca, tetapi akurasi konsensus bisa tinggi dengan pengulangan & koreksi |
Biaya per basa | Tinggi (mahal) | Rendah (sangat efisien untuk skala besar) | Menengah hingga tinggi (tergantung platform & kondisi) |
Kompleksitas assembly | Cukup sederhana untuk fragmen kecil, sulit untuk genom besar | Tantangan dalam merakit ulang fragmen (terutama area repetitif) | Memudahkan assembly, mengurangi gap, deteksi struktur kompleks |
Kemampuan deteksi modifikasi basa | Tidak langsung | Terbatas (butuh perlakuan kimia tambahan) | Bisa langsung mendeteksi modifikasi basa (seperti metilasi) |
Aplikasi utama | Validasi, gen target, plasmid, penelusuran gen standar | Sequencing genom, transcriptome (RNA-seq), epigenomik, metagenomik | Assembly de novo, genom kompleks, varian struktural, sekuensing real-time & portabel |
Dari tabel ini terlihat bahwa setiap generasi mencoba mengatasi keterbatasan generasi sebelumnya: generasi pertama sangat akurat namun lambat dan mahal; generasi kedua sangat efisien dan berkapasitas tinggi tetapi memiliki tantangan dalam assembly dan batas read panjang; generasi ketiga membawa revolusi dengan membaca molekul tunggal dan menghasilkan bacaan panjang, meskipun menghadapi tantangan akurasi per baca.
Jalannya evolusi: momen penting & contoh aplikasi
Berikut beberapa tonggak penting dalam sejarah sekuensing DNA:
1977: Penemuan metode Sanger dan Maxam–Gilbert, memulai era sekuensing DNA. (Thermo Fisher Scientific)
1980-an: Otomatisasi Sanger dengan elektroforesis kapiler dan pewarna fluoresen mempercepat proses sekuensing gen. (Front Line Genomics)
1990-an awal: ide sekuensing paralel (massively parallel sequencing) bermunculan, teknik pyrosequencing dan sequencing by synthesis mulai dikembangkan. (PMC)
2005: Platform 454 (sekuensing pyrosequencing) hadir sebagai sistem NGS komersial pertama. (PMC)
2006–2007: Illumina/Solexa meluncurkan platform sequencing by synthesis (reversible terminator), membuka era dominasi NGS pendek. (PMC)
Akhir 2000-an: Platform SOLiD dan Ion Torrent muncul sebagai alternatif NGS untuk aplikasi khusus (ligasi dan basis deteksi pH). (Wikipedia)
2010-an: Kemunculan platform long-read seperti PacBio SMRT dan nanopore Oxford Nanopore. (PacBio)
Perkembangan teknik seperti circular consensus sequencing (CCS) untuk meningkatkan akurasi long-read. (Wikipedia)
Aplikasi “lapangan” nanopore (misalnya MinION) yang memungkinkan sekuensing di tempat (in-field sequencing) dalam studi lingkungan dan epidemiologi.
Beberapa contoh penggunaan nyata:
Proyek 1000 Genomes, TCGA, dan proyek genom besar lainnya menggunakan platform NGS generasi kedua untuk memetakan variasi genetik populasi.
Penelitian bakteri/metagenomik menggunakan kombinasi NGS dan long-read untuk merakit genom mikroba kompleks.
Diagnosis klinis & penyakit genetik: menggunakan NGS dan long-read untuk mendeteksi varian struktural, mutasi baru, dan penelitian penyakit genetik jarang.
Surveilans patogen (misalnya virus, mikroba) dalam epidemi, di mana nanopore memungkinkan sekuensing cepat dari sampel klinis di lokasi.
Tantangan & masa depan
Meskipun teknologi sekuensing sudah sangat maju, masih ada tantangan dan ruang untuk inovasi.
Tantangan
Tingkat kesalahan baca (error rate)
Meski metode generasi ketiga memudahkan assembly, bacaan tunggal masih rentan kesalahan. Koreksi lewat konsensus (pengulangan bacaan) atau kombinasi dengan NGS diperlukan.
Beberapa platform memiliki bias tertentu (misalnya dalam urutan homopolimer atau GC ekstrem).
Pengelolaan dan analisis data besar
Dengan throughput tinggi, tantangan tersendiri adalah penyimpanan, pengolahan, dan analisis data (alignment, assembly, variant calling). Infrastruktur komputasi dan algoritma efisien sangat penting.
Biaya & aksesibilitas
Meskipun biaya telah turun drastis, instrumen dan reagent untuk sekuensing generasi ketiga masih relatif mahal, terutama di negara berkembang.
Akses ke laboratorium dengan fasilitas dan tenaga terampil menjadi kendala.
Kualitas DNA & persiapan sampel
Untuk bacaan panjang, kualitas DNA harus tinggi (molekul panjang, minim pecahan) agar bisa melewati proses sekuensing tanpa putus.
Persiapan library, pembersihan sampel, dan kontrol kualitas tahap awal menjadi sangat penting.
Assembly & interpretasi struktural kompleks
Meski bacaan panjang memudahkan assembly, ada tantangan di area genom dengan variasi struktural kompleks, inversi, duplikasi, pengulangan panjang, dan segmental duplications.
Pengembangan algoritma new assembler, polisher, dan penanganan varian besar terus dibutuhkan.
Arah masa depan & generasi keempat?
Beberapa peneliti menyebut munculnya “generasi keempat” (fourth‐generation sequencing) sebagai evolusi selanjutnya, menggabungkan kecepatan, akurasi, dan kemampuan sekuensing langsung molekul tunggal dengan throughput tinggi dan resolusi lebih baik. (yourgenome.org)
Inovasi seperti nanopori yang lebih presisi, elektronik deteksi langsung (non-fluorescent), integrasi multi-omics (DNA + RNA + epigenetik dalam satu baca), dan tes sekuensing real-time ultra-cepat sedang dikembangkan.
Pendekatan hibrid (kombinasi long-read + short-read) tetap populer sebagai strategi pragmatis dalam banyak proyek.
Penurunan biaya reagent, peningkatan kualitas bacaan tunggal, dan kemajuan algoritma analisis akan membuka aplikasi lebih luas (misalnya di bidang kedokteran presisi, diagnostik cepat, petanya mikrobioma individu, dan aplikasi genetik langsung di lapangan).
Kesimpulan
Sejarah DNA sekuensing adalah kisah inovasi terus-menerus: dari metode klasik yang lambat dan mahal, melalui revolusi NGS yang memungkinkan produksi data masif dan murah, hingga era sekuensing molekul tunggal dan bacaan panjang yang mengatasi banyak keterbatasan teknologi sebelumnya.
Generasi pertama (Sanger, Maxam–Gilbert) menetapkan dasar—akurat, mapan, tetapi dengan throughput rendah dan mahal.
Generasi kedua (NGS) membawa lompatan besar dalam kecepatan dan parallelisme, memungkinkan proyek-proyek genom besar dan ekspansi aplikasi biologi omik.
Generasi ketiga menawarkan kemampuan membaca molekul tunggal, bacaan panjang, dan potensi penggunaan langsung di lapangan, meskipun dengan tantangan tingkat kesalahan per baca dan kebutuhan koreksi.
No comments:
Post a Comment