@misc{eprints89319, month = {Juni}, title = {IMPLEMENTASI MODEL ROBUSTLY OPTIMIZED BERT PRETRAINING APPROACH (ROBERTA) UNTUK KLASIFIKASI TWEET CYBERBULLYING DENGAN AUGMENTASI DATA BACK TRANSLATION}, author = {ALHINDAMI FATHAN }, address = {UNIVERSITAS LAMPUNG}, publisher = {FAKULTAS MATEMATIKA ILMU PENGETAHUAN ALAM}, year = {2025}, url = {http://digilib.unila.ac.id/89319/}, abstract = {Perkembangan teknologi internet yang pesat telah memberikan peningkatan yang signifikan dalam jumlah pengguna media sosial di seluruh dunia. Terlepas dari manfaatnya, media sosial juga bisa menjadi ruang munculnya perilaku negatif seperti cyberbullying. Kondisi ini memerlukan adanya sistem klasifikasi otomatis yang dapat mendeteksi dan mengidentifikasi jenis cyberbullying dalam teks secara akurat. Penelitian ini bertujuan untuk membangun model klasifikasi teks berbasis RoBERTa dan mengevaluasi pengaruh teknik augmentasi data terhadap peningkatan kinerja model. Data yang digunakan merupakan kumpulan tweet berbahasa Inggris yang telah diberi label sesuai jenis cyberbullying. Teknik augmentasi data back translation diterapkan untuk mengatasi data yang tidak seimbang dan menambah variasi data pelatihan. Model RoBERTa yang telah melalui proses fine-tuning diimplementasikan untuk melakukan klasifikasi dan kinerjanya dievaluasi menggunakan metrik accuracy, precision, recall, F1-score, dan ROC-AUC. Hasil penelitian menunjukkan bahwa metode tanpa augmentasi data menghasilkan accuracy sebesar 88\%, sedangkan metode dengan augmentasi data mencapai accuracy tertinggi sebesar 93\%, dengan precision, recall, dan F1-score masing-masing sebesar 92\%, serta rata-rata nilai AUC sebesar 95,19\%. Hasil ini menunjukan bahwa teknik augmentasi data secara signifikan mampu meningkatkan kinerja model dalam mengklasifikasikan tweet cyberbullying. Kata kunci: Cyberbullying, RoBERTa, Augmentasi Data, Klasifikasi Teks.} }