@misc{eprints67038, month = {Nopember}, title = {KLASIFIKASI SITUS HIDROKSILASI PROTEIN PADA PROLIN DAN LISIN MENGGUNAKAN EXTREME GRADIENT BOOSTING (XGBOOST)}, author = {1817051025 INTANIA RAHMADHILLA}, address = {UNIVERSITAS LAMPUNG}, publisher = {FAKULTAS MIPA}, year = {2022}, url = {http://digilib.unila.ac.id/67038/}, abstract = {Modifikasi pasca-translasi (PTM) memiliki peran penting dalam berbagai sel dan proses biologis. Sebagian besar protein menjalankan fungsi biologisnya setelah melalui modifikasi pasca-translasi. Hidroksilasi protein merupakan salah satu jenis PTM yang terjadi pada prolin (P) dan lisin (K). Diketahui bahwa sekuens protein mengandung banyak residu P dan K yang tidak dikarakterisasi, pertanyaannya mana yang bisa dihidroksilasi dan mana yang tidak bisa. Untuk mengatasi hal tersebut, metode komputasi sangat disarankan untuk mengidentifikasi situs hidroksilasi karena tidak memakan waktu dan biaya yang mahal. Distribusi kelas yang tidak seimbang menjadi tantangan berat bagi algoritma pembelajaran tradisional untuk meningkatkan hasil akurasi keseluruhan, sehingga penelitian ini menggunakan pendekatan machine learning dengan metode Extreme Gradient Boosting (XGBoost) dan implementasi algoritma SMOTE untuk mengatasi kelas data tidak seimbang. Fitur ekstraksi pada penelitian ini terdiri atas tiga macam fitur, yaitu Pseudo Amino Acid Composition (PseAAC), CTD, dan AAindex. Berdasarkan dataset uji, hasil akurasi mencapai 97.9\% dan 99.1\% untuk prediksi situs hidroksilasi prolin dan hidroksilasi lisin. Sementara itu, diperoleh sensitivitas sebesar 93.6\% dan 95.4\%, f-1 score sebesar 92.9\% dan 97.6\%, serta MCC 95.3\% dan 97.1\% untuk residu P dan K.} }