KLASIFIKASI GEN ESENSIAL PADA DROSOPHILA MELANOGASTER DENGAN METODE ADABOOST DAN XGBOOST MENGGUNAKAN DATA SEQUENCE DNA DAN PROTEIN

GENDIS , ANANDA PUTRI (2026) KLASIFIKASI GEN ESENSIAL PADA DROSOPHILA MELANOGASTER DENGAN METODE ADABOOST DAN XGBOOST MENGGUNAKAN DATA SEQUENCE DNA DAN PROTEIN. Masters thesis, UNIVERSITAS LAMPUNG.

[img]
Preview
File PDF
1. ABSTRAK-ABSTRACT.pdf

Download (280Kb) | Preview
[img] File PDF
2. TESIS FULL.pdf
Restricted to Hanya staf

Download (2884Kb) | Minta salinan
[img]
Preview
File PDF
3. TESIS TANPA BAB PEMBAHASAN.pdf

Download (2252Kb) | Preview

Abstrak (Berisi Bastraknya saja, Judul dan Nama Tidak Boleh di Masukan)

Gen esensial sangat penting untuk kelangsungan hidup dan fungsi normal suatu organisme. Studi ini bertujuan membandingkan kinerja algoritma AdaBoost dan XGBoost dalam mengklasifikasikan Gen Esensial Seluler (CEG) dan Gen Esensial Organisme (OEG) pada Drosophila melanogaster. Dataset diambil dari dataset CLEARER yang telah dikurasi oleh Beder et al. (2021), terdiri dari 11.547 gen untuk label CEG setelah proses pra-pemrosesan. Fitur diekstraksi menggunakan Komposisi Asam Amino (AAC) dari urutan protein, Komposisi Tri-Nukleotida (TNC) dan Transformasi Fourier (FT) dari urutan DNA, serta PPI_degree, sehingga menghasilkan 185 fitur awal. Sebanyak 45 fitur teratas dipilih menggunakan Random Forest Gini Importance. Untuk menangani ketidakseimbangan kelas yang parah (rasio 1:8,41 untuk CEG), teknik SMOTETomek diterapkan hanya pada data pelatihan setelah dilakukan pembagian stratifikasi 90:10. Model dilatih dengan validasi silang 10-fold dan optimasi threshold probabilitas. Hasil menunjukkan bahwa XGBoost dengan SMOTETomek mencapai performa terbaik pada label CEG: akurasi 96,88%, skor F1 0,9498, MCC 0,9400, ROC-AUC 0,9888, dan PR-AUC 0,9869. Pada label OEG, XGBoost mencapai akurasi 94,98%. Sebagai perbandingan, AdaBoost memperoleh akurasi 85,00% pada CEG dan 84,15% pada OEG. Kesalahan klasifikasi umumnya terjadi akibat kemiripan pola urutan antara gen esensial dan non-esensial. Studi ini menunjukkan bahwa kombinasi XGBoost dengan SMOTETomek dan seleksi fitur berbasis Gini Importance secara efektif mengatasi ketidakseimbangan kelas dan memberikan performa yang kompetitif untuk klasifikasi gen esensial berbasis urutan pada Drosophila melanogaster. Kata Kunci: Gen esensial, AdaBoost, XGBoost, Drosophila melanogaster, SMOTETomek

Jenis Karya Akhir: Tesis (Masters)
Subyek: 500 ilmu pengetahuan alam dan matematika
Program Studi: FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) > Prodi S2 Magister Ilmu Komputer
Pengguna Deposit: 2605978713 Digilib
Date Deposited: 26 May 2026 08:09
Terakhir diubah: 26 May 2026 08:09
URI: http://digilib.unila.ac.id/id/eprint/99726

Actions (login required)

Lihat Karya Akhir Lihat Karya Akhir