DEEP SUPPORT VECTOR DATA DESCRIPTION(DEEPSVDD) BERBASIS BIOWORDVEC UNTUK DETEKSI ANOMALI PASANGAN TEKS LEUKEMIA PADA GENIABIOMEDICAL EVENT CORPUS

KHUSNI SINTA , RODIYAH (2026) DEEP SUPPORT VECTOR DATA DESCRIPTION(DEEPSVDD) BERBASIS BIOWORDVEC UNTUK DETEKSI ANOMALI PASANGAN TEKS LEUKEMIA PADA GENIABIOMEDICAL EVENT CORPUS. FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM, UNIVERSITAS LAMPUNG.

[img]
Preview
File PDF
ABSTRAK.pdf

Download (67Kb) | Preview
[img] File PDF
SKRIPSI FULL.pdf
Restricted to Hanya staf

Download (3358Kb) | Minta salinan
[img]
Preview
File PDF
SKRIPSI TANPA BAB PEMBAHASAN.pdf

Download (2768Kb) | Preview

Abstrak (Berisi Bastraknya saja, Judul dan Nama Tidak Boleh di Masukan)

Deteksi anomali pada pasangan teks biomedis merupakan tantangan penting dalamnatural language processing, khususnya pada data dengan hubungan semantik yang kompleks seperti dataset GENIABiomedical Event. Penelitian ini bertujuan mengembangkan model deteksi anomali berbasisDeep Support Vector Data Description(DeepSVDD) pada pasangan teks biomedis, yaitu Sentence–TriggerWord,Sentence–EventType, danTriggerWord–EventType. Pada tahap awal, dilakukanpseudo labelingmenggunakan pendekatan aproksimasiWord Mover’s Distance(WMD) yang dimodifikasi dengan pembobotanPart-of-Speech (POS) untuk membentuk kelas normal dan anomali berdasarkan tingkat kemiripan semantik. Representasi fitur dibangun menggunakanembeddingBioWordVec yang kemudian diproses menggunakanencoderLSTM dan BiLSTM untuk menghasilkan representasi laten. Hasil penelitian menunjukkan bahwa modelDeepSVDD denganencoderLSTM memberikan performa terbaik dengan nilai ROC AUC sebesar 0,99 pada datasetSentence–TriggerWordserta 0,98 pada dua dataset lainnya, sedangkan BiLSTM menunjukkan performa yang lebih rendah. Selain itu, analisis sensitivitasthresholdmenunjukkan adanyatrade-offantara sensitivitas dan spesifisitas. Peningkatanthresholdmeningkatkan spesifisitas namun menurunkan sensitivitas. Oleh karena itu,thresholdP95 dipilih karena menghasilkan sensitivitas tertinggi sehingga lebih efektif dalam meminimalkanfalse negative. Kata-kata kunci:Deteksi anomali,DeepSVDD, GENIABiomedical Event, BioWordVec, LSTM, BiLSTM, ROC AUC,Treshold Sensitivity. Anomaly detection in biomedical text pairs is a critical challenge in natural language processing, particularly in data with complex semantic relationships such as the GENIA Biomedical Event dataset. This study aims to develop an anomaly detection model based on Deep Support Vector Data Description (Deep SVDD) for biomedical text pairs: Sentence–TriggerWord, Sentence–EventType, and TriggerWord–EventType. In the initial stage, pseudo-labeling was performed using a modified Word Mover’s Distance (WMD) approximation approach with Part-of-Speech (POS) weighting to classify normal and anomalous texts based on semantic similarity. Feature representations were constructed using BioWordVec embeddings, which were then processed using LSTM and BiLSTM encoders to generate latent representations. The results showed that the Deep SVDD model with an LSTM encoder provided the best performance, with an ROC AUC of 0.99 on the Sentence–TriggerWord dataset and 0.98 on the other two datasets, while BiLSTM performed lower. Furthermore, a threshold sensitivity analysis revealed a trade-off between sensitivity and specificity. Increasing the threshold increased specificity but decreased sensitivity. Therefore, the P95 threshold was chosen because it yielded the highest sensitivity and was therefore more effective in minimizing false negatives. Keywords:Anomaly detection, Deep SVDD, GENIA Biomedical Event, BioWordVec, LSTM, BiLSTM, ROC AUC, Threshold Sensitivity.

Jenis Karya Akhir: Skripsi
Subyek: 500 ilmu pengetahuan alam dan matematika > 510 Matematika
Program Studi: FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) > Prodi S1 Matematika
Pengguna Deposit: 2605727857 Digilib
Date Deposited: 19 Jun 2026 03:42
Terakhir diubah: 19 Jun 2026 03:42
URI: http://digilib.unila.ac.id/id/eprint/100919

Actions (login required)

Lihat Karya Akhir Lihat Karya Akhir