PENGARUH AUGMENTASI DATA TERHADAP KINERJA PRE-TRAINED TRANSFORMER MODELS DALAM KLASIFIKASI JUDUL BERITA COVID-19

YULINA , PUTRI (2025) PENGARUH AUGMENTASI DATA TERHADAP KINERJA PRE-TRAINED TRANSFORMER MODELS DALAM KLASIFIKASI JUDUL BERITA COVID-19. FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM, UNIVERSITAS LAMPUNG.

[img]
Preview
File PDF
ABSTRAK.pdf

Download (81Kb) | Preview
[img] File PDF
SKRIPSI FULL.pdf
Restricted to Hanya staf

Download (5Mb) | Minta salinan
[img]
Preview
File PDF
SKRIPSI TANPA BAB PEMBAHASAN.pdf

Download (3090Kb) | Preview

Abstrak (Berisi Bastraknya saja, Judul dan Nama Tidak Boleh di Masukan)

Volume informasi digital, khususnya berita online selama masa pandemi COVID-19 mengalami lonjakan yang menyebabkan pembaca kesulitan memperoleh informasi yang relevan. Klasifikasi otomatis berbasis pre-trained transformer models merupakan pendekatan yang dapat digunakan untuk menyaring informasi secara efisien. Namun, kinerja model klasifikasi sangat dipengaruhi oleh kualitas dan distribusi data latih. Ketidakseimbangan distribusi kelas dalam data dapat menurunkan kinerja prediksi model, terutama terhadap kelas minoritas. Oleh karena itu, penelitian ini bertujuan menganalisis pengaruh augmentasi data terhadap peningkatan kinerja model klasifikasi pada data judul berita COVID-19 yang tidak seimbang. Dua metode augmentasi yang digunakan yaitu synonym replacement (SR) dan kombinasi synonym replacement dengan back translation (SR + BT). Evaluasi dilakukan menggunakan beberapa model pre-trained transformer, diantaranya ALBERT, BERT, DistilBERT, IndoBERT, Indo RoBERTa, dan RoBERTa. Hasil menunjukkan bahwa augmentasi berhasil meningkatkan rata-rata akurasi dan recall hingga 1,45%, presisi dan F1-score hingga 1,94%, dan ROC-AUC hingga 5,58%. Pada kelas minoritas, augmentasi meningkatkan recall hingga 14,67% dan F1-score hingga 5,37%. Temuan ini menunjukkan bahwa augmentasi data efektif dalam mengatasi ketidakseimbangan kelas dan meningkatkan kemampuan model dalam mengidentifikasi kelas minoritas yang sebelumnya sulit terdeteksi. Kata-kata kunci: Klasifikasi, Transformer, Augmentasi Data, Berita Online, Synonym Replacement, Back Translation.

Jenis Karya Akhir: Skripsi
Subyek: 500 ilmu pengetahuan alam dan matematika
500 ilmu pengetahuan alam dan matematika > 510 Matematika
Program Studi: FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) > Prodi S1 Matematika
Pengguna Deposit: 2506589018 Digilib
Date Deposited: 19 Jun 2025 14:46
Terakhir diubah: 19 Jun 2025 14:46
URI: http://digilib.unila.ac.id/id/eprint/89089

Actions (login required)

Lihat Karya Akhir Lihat Karya Akhir