GENDIS , ANANDA PUTRI (2026) KLASIFIKASI GEN ESENSIAL PADA DROSOPHILA MELANOGASTER DENGAN METODE ADABOOST DAN XGBOOST MENGGUNAKAN DATA SEQUENCE DNA DAN PROTEIN. Masters thesis, UNIVERSITAS LAMPUNG.
|
File PDF
1. ABSTRAK-ABSTRACT.pdf Download (280Kb) | Preview |
|
|
File PDF
2. TESIS FULL.pdf Restricted to Hanya staf Download (2884Kb) | Minta salinan |
||
|
File PDF
3. TESIS TANPA BAB PEMBAHASAN.pdf Download (2252Kb) | Preview |
Abstrak (Berisi Bastraknya saja, Judul dan Nama Tidak Boleh di Masukan)
Gen esensial sangat penting untuk kelangsungan hidup dan fungsi normal suatu organisme. Studi ini bertujuan membandingkan kinerja algoritma AdaBoost dan XGBoost dalam mengklasifikasikan Gen Esensial Seluler (CEG) dan Gen Esensial Organisme (OEG) pada Drosophila melanogaster. Dataset diambil dari dataset CLEARER yang telah dikurasi oleh Beder et al. (2021), terdiri dari 11.547 gen untuk label CEG setelah proses pra-pemrosesan. Fitur diekstraksi menggunakan Komposisi Asam Amino (AAC) dari urutan protein, Komposisi Tri-Nukleotida (TNC) dan Transformasi Fourier (FT) dari urutan DNA, serta PPI_degree, sehingga menghasilkan 185 fitur awal. Sebanyak 45 fitur teratas dipilih menggunakan Random Forest Gini Importance. Untuk menangani ketidakseimbangan kelas yang parah (rasio 1:8,41 untuk CEG), teknik SMOTETomek diterapkan hanya pada data pelatihan setelah dilakukan pembagian stratifikasi 90:10. Model dilatih dengan validasi silang 10-fold dan optimasi threshold probabilitas. Hasil menunjukkan bahwa XGBoost dengan SMOTETomek mencapai performa terbaik pada label CEG: akurasi 96,88%, skor F1 0,9498, MCC 0,9400, ROC-AUC 0,9888, dan PR-AUC 0,9869. Pada label OEG, XGBoost mencapai akurasi 94,98%. Sebagai perbandingan, AdaBoost memperoleh akurasi 85,00% pada CEG dan 84,15% pada OEG. Kesalahan klasifikasi umumnya terjadi akibat kemiripan pola urutan antara gen esensial dan non-esensial. Studi ini menunjukkan bahwa kombinasi XGBoost dengan SMOTETomek dan seleksi fitur berbasis Gini Importance secara efektif mengatasi ketidakseimbangan kelas dan memberikan performa yang kompetitif untuk klasifikasi gen esensial berbasis urutan pada Drosophila melanogaster. Kata Kunci: Gen esensial, AdaBoost, XGBoost, Drosophila melanogaster, SMOTETomek
| Jenis Karya Akhir: | Tesis (Masters) |
|---|---|
| Subyek: | 500 ilmu pengetahuan alam dan matematika |
| Program Studi: | FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) > Prodi S2 Magister Ilmu Komputer |
| Pengguna Deposit: | 2605978713 Digilib |
| Date Deposited: | 26 May 2026 08:09 |
| Terakhir diubah: | 26 May 2026 08:09 |
| URI: | http://digilib.unila.ac.id/id/eprint/99726 |
Actions (login required)
![]() |
Lihat Karya Akhir |
