RIDHO ALRAFI, 1817051009 (2022) KLASIFIKASI DNA-BINDING PROTEIN MENGGUNAKAN ALGORITME RANDOM FOREST. FAKULTAS MIPA, UNIVERSITAS LAMPUNG.
|
File PDF
ABSTRAK.pdf Download (550Kb) | Preview |
|
File PDF
SKRIPSI FULL.pdf Restricted to Hanya staf Download (2981Kb) |
||
|
File PDF
SKRIPSI FULL TANPA BAB PEMBAHASAN.pdf Download (2984Kb) | Preview |
Abstrak (Berisi Bastraknya saja, Judul dan Nama Tidak Boleh di Masukan)
Mengklasifikasikan fungsi protein dan struktur dari urutan adalah salah satu tantangan penting untuk kombinasi biologi. Urutan protein masih susah untuk diklasifikasikan karena semakin beragamnya protein yang ditemukan, dan juga banyaknya metode yang bisa digunakan untuk menentukan urutan protein. Pada penelitian ini berfokus terhadap protein pengikat DNA. Protein pengikat DNA memainkan peran penting dalam beberapa bagian besar proses seluler. Oleh karena itu, perlu dilakukannya pengklasifikasian untuk mengidentifikasi protein pengikat DNA berdasarkan urutan protein menggunakan ekstrasi fitur dan random forest. Tujuan dari penelitian ini untuk menganalisa sensitivitas, spesifisitas, akurasi, dan matthew correlation coefficient dari protein pengikat DNA. Dataset protein pengikat DNA diperoleh dari PDB (Protein Data Bank) dengan mencari kata kunci “DNA-binding protein”, memiliki jumlah protein 1075 dengan 525 data positif dan 550 data negatif serta memiliki panjang protein terpendek, yaitu 51 amino acids. Dataset dibagi menjadi 2, yaitu 80% data latih 20% data uji dan 90% data latih 10% data uji. Ekstraksi fitur yang digunakan protein descriptor menggunakan R package BioSeqClass versi 1.44.0, yaitu AAIndex, CTD, dan PseAAC, dengan jumlah total 440 fitur. Hasil yang didapatkan diolah kembali menggunakan klasifikasi algoritme random forest dengan mtry 10, 21, dan 42 lalu ntree dipilih secara acak 100, 250, 500, dan 1000. Hasil yang didapatkan paling tinggi didapatkan pada pembagian dataset 90% data latih 10% data uji dengan mtry 42 ntree 1000 sebesar 89.97% sensitivitas, 92.79% spesifisitas, 80.76% MCC, dan 90.42% akurasi. Hasil yang didapatkan menggunakan ekstraksi fitur dan algoritme random forest bisa mengklasifikasikan protein pengikat DNA.
Jenis Karya Akhir: | Skripsi |
---|---|
Subyek: | 000 Ilmu komputer, informasi dan pekerjaan umum > 005 Pemrograman komputer, program dan data 500 ilmu pengetahuan alam dan matematika |
Program Studi: | FAKULTAS MIPA > Prodi Ilmu Komputer |
Pengguna Deposit: | 2208635556 . Digilib |
Date Deposited: | 25 Aug 2022 07:41 |
Terakhir diubah: | 25 Aug 2022 07:41 |
URI: | http://digilib.unila.ac.id/id/eprint/65702 |
Actions (login required)
Lihat Karya Akhir |