VINDO, RIZKIYANTO (2023) NAMED ENTITY RECOGNITION (NER) BAHASA INDONESIA BERBASIS MULTI CLASS CLASSIFICATION. FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM, UNIVERSITAS LAMPUNG.
|
File PDF
ABSTRAK (ABSTRACT).pdf Download (43Kb) | Preview |
|
File PDF
SKRIPSI FULL.pdf Restricted to Hanya staf Download (1334Kb) |
||
|
File PDF
SKRIPSI TANPA BAB PEMBAHASAN.pdf Download (1285Kb) | Preview |
Abstrak (Berisi Bastraknya saja, Judul dan Nama Tidak Boleh di Masukan)
Penelitian ini bertujuan untuk menghasilkan sistem yang dapat mengekstraksi informasi berupa data teks Bahasa Indonesia dan mendeskripsikan hasil implementasi Named Entity Recognition berbasis Multi Class Classification. Metode yang digunakan adalah extreme programming. Penelitian ini juga melakukan beberapa tahapan seperti studi literatur, pembuatan model, perancangan sistem, dan pengujian sistem. Jumlah kata yang diperoleh dari hasil pengumpulan data adalah 8017 kata. Dalam tahapan pengumpulan data dilakukan dengan bantuan library beautifulSoup untuk proses scraping website dengan melakukan import request untuk mendapatkan link berita yang akan di scraping dan html5lib untuk mendapatkan konten dari website dengan parsing html. Total entitas label yang diperoleh dari hasil pelabelan data adalah 1197 entitas label. Dalam penelitian ini pelabelan data dibagi menjadi 9 kelompok. Pelatihan data dilakukan dengan menerapkan 6 skenario. Hasil skenario yang didapatkan pada pelatihan data menghasilkan precision, recall, dan f1- score. Dalam tahapan proses pembagian data, penelitian ini menggunakan 2 skenario pembagian data, pertama yaitu 70% training data dan 30% testing data, kemudian pada training data dibagi menjadi 70% training data dan 30% validation data. Pada skenario kedua data dibagi menjadi 60% training data dan 40% testing data, kemudian pada training data akan dibagi menjadi 60% training data dan 40% validation data. Berdasarkan hasil dari skenario yang telah dilakukan pada proses evaluasi kinerja model dapat diketahui bahwa skenario 6 dengan pembagian 60% data training, dan 40% data testing menggunakan hyperparameter epoch 100, batch size 1000, dan learn rate 0.001, skenario ini merupakan konfigurasi hyperparameter bawaan library spaCy dan terbukti memiliki hasil nilai precision, recall, dan f1-score terbaik dibandingkan dengan skenario lainnya. Sistem yang telah dibuat diuji menggunakan metode black box testing, dengan hasil yang didapatkan sesuai yang diharapkan berdasarkan skenario uji yang di lakukan.
Jenis Karya Akhir: | Skripsi |
---|---|
Subyek: | 000 Ilmu komputer, informasi dan pekerjaan umum 000 Ilmu komputer, informasi dan pekerjaan umum > 004 Pemrosesan data dan ilmu komputer |
Program Studi: | FAKULTAS MIPA > Prodi Ilmu Komputer |
Pengguna Deposit: | 2301063380 . Digilib |
Date Deposited: | 06 Apr 2023 07:53 |
Terakhir diubah: | 06 Apr 2023 07:53 |
URI: | http://digilib.unila.ac.id/id/eprint/70458 |
Actions (login required)
Lihat Karya Akhir |