IDENTIFIKASI KEMIRIPAN DOKUMEN AKADEMIK PADA TUGAS KULIAH MAHASISWA DI JURUSAN ILMU KOMPUTER UNIVERSITAS LAMPUNG

Theresia Tri Oktavia, Irmawanti (2026) IDENTIFIKASI KEMIRIPAN DOKUMEN AKADEMIK PADA TUGAS KULIAH MAHASISWA DI JURUSAN ILMU KOMPUTER UNIVERSITAS LAMPUNG. FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM, UNIVERSITAS LAMPUNG.

[img]
Preview
File PDF
ABSTRAK.pdf

Download (183Kb) | Preview
[img] File PDF
SKRIPSI FULL.pdf
Restricted to Hanya staf

Download (8Mb) | Minta salinan
[img]
Preview
File PDF
SKRIPSI TANPA PEMBAHASAN.pdf

Download (4Mb) | Preview

Abstrak (Berisi Bastraknya saja, Judul dan Nama Tidak Boleh di Masukan)

Integritas akademik dalam lingkungan perguruan tinggi, terutama pada program studi ilmu komputer, sangat bergantung pada kemampuan mendeteksi kemiripan antar dokumen yang dikumpulkan mahasiswa, baik berupa laporan tertulis maupun kode program. Penelitian ini merancang dan membangun sebuah sistem deteksi kemiripan dokumen akademik yang mampu memproses dokumen teks berbahasa Indonesia dan kode sumber Python secara terintegrasi dalam satu platform. Pada tahap pemrosesan dokumen teks, digunakan kombinasi representasi berbasis statistik TF-IDF dan representasi berbasis semantik Word2Vec (FastText), dengan bobot 0,6 untuk TF-IDF dan 0,4 untuk FastText, yang selanjutnya dihitung kemiripannya menggunakan metode Cosine Similarity. Pendekatan ini dirancang agar sistem tidak hanya mampu menangkap kesamaan kata secara langsung, tetapi juga mengenali kemiripan makna meskipun kalimat telah mengalami parafrase. Sementara itu, pada pemrosesan kesamaan kode program, sistem menggunakan strategi penggabungan dua skor kemiripan, yaitu TF-IDF Cosine Similarity dan Line-based Cosine Similarity, untuk menghasilkan penilaian yang lebih akurat dan menyeluruh. Guna mengatasi tantangan efisiensi pada dataset berskala besar, algoritma K-Means Clustering diimplementasikan untuk mengelompokkan dokumen sehingga proses perbandingan hanya dilakukan di dalam klaster yang relevan. Hasil pengujian terhadap 90 dokumen teks dan 117 file kode Python memperlihatkan bahwa sistem mampu mendeteksi masing-masing 6 pasang dokumen dan kode yang memiliki kemiripan tinggi. Selain itu, penggunaan klasterisasi terbukti menekan jumlah komputasi perbandingan secara signifikan, yakni sebesar 85,8% untuk dokumen teks dan 83,7% untuk kode sumber, dengan peningkatan kecepatan proses mencapai 1,90x dan 6,86x. Sistem ini diimplementasikan dalam bentuk aplikasi web menggunakan framework Flask, yang menyediakan modul pemrosesan dokumen teks (SimDoc) dan kode sumber (SimCode), visualisasi bagian yang mirip serta fitur ekspor hasil analisis ke dalam format laporan PDF.

Jenis Karya Akhir: Skripsi
Subyek: 000 Ilmu komputer, informasi dan pekerjaan umum
000 Ilmu komputer, informasi dan pekerjaan umum > 003 Sistem-sistem
000 Ilmu komputer, informasi dan pekerjaan umum > 004 Pemrosesan data dan ilmu komputer
000 Ilmu komputer, informasi dan pekerjaan umum > 080 Kumpulan karya umum
Program Studi: FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) > Prodi S1 Ilmu Komputer
Pengguna Deposit: 2605225172 Digilib
Date Deposited: 24 Jun 2026 02:16
Terakhir diubah: 24 Jun 2026 02:16
URI: http://digilib.unila.ac.id/id/eprint/101307

Actions (login required)

Lihat Karya Akhir Lihat Karya Akhir