<> "The repository administrator has not yet configured an RDF license."^^ . <> . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN)"^^ . "Peningkatan angka kematian akibat leukemia telah mendorong pesatnya\r\npertumbuhan publikasi mengenai penyakit ini. Lonjakan publikasi tersebut\r\nberdampak signifikan pada peningkatan literatur biomedis, yang membuat ekstraksi\r\ninformasi relevan tentang leukemia secara manual semakin menantang. Hal ini\r\ndikarenakan penelitian yang ada sebelumnya umumnya hanya memperhitungkan\r\nkomponen leksikal dan sintaksis teks tanpa mempertimbangkan makna\r\nsemantiknya.\r\nTujuan dilakukannya penelitian ini antara lain adalah untuk menemukan\r\nmodel Deep Learning (DL) terbaik dalam melakukan ekstraksi informasi yang\r\nrelevan secara semantik pada sejumlah besar data biomedis yang disebut\r\nbiomedical big data report. Semantic Text Similarity (STS) adalah salah satu bidang\r\npenelitian penting dalam aplikasi saat ini yang terkait dengan analisis semantik teks.\r\nMetode tersebut memungkinkan ekstraksi informasi dari suatu teks menjadi lebih\r\nbermakna karena melibatkan penerapan representasi distribusi kata-kata atau\r\nsumber eksternal pengetahuan semantik terstruktur seperti word embedding.\r\nNamun perlu diperhatikan bahwa word embedding yang digunakan harus sesuai\r\ndengan domain penelitian.\r\nPenelitian ini mengusulkan penerapan arsitektur Siamese Manhattan pada\r\n\r\nmodel DL, yaitu model CNN, LSTM, hybrid CNN-LSTM, dan hybrid LSTM-\r\nCNN, untuk melakukan analisis semantik teks biomedis. Teks biomedis yang\r\n\r\nmemiliki makna semantik atau berada pada konteks yang sama direpresentasikan\r\nke dalam bentuk vektor berdasarkan word embedding khusus domain biomedis,\r\nyaitu BioWordVec. Lebih lanjut, model tersebut dibangun dan dibandingkan\r\nberdasarkan jumlah lapisan tersembunyi dan metode pelabelan yang digunakan.\r\nJumlah lapisan tersembunyi yang digunakan adalah dua dan tiga, sedangkan metode\r\npelabelan yang digunakan adalah metode Cosine Similarity (CS) dan metode Word\r\nMover’s Distance (WMD). Hasil analisis semantik menunjukkan bahwa setiap\r\nkalimat memiliki makna semantik yang identik dengan tingkat similarity 1.\r\nHasil tersebut selanjutnya menjadi landasan untuk dilakukan klasifikasi teks\r\nsebagai bentuk aplikasi langsung dari STS. Model klasifikasi teks dibangun dan\r\ndibandingkan berdasarkan dua skema pembagian data, yaitu train-test split dan k-\r\nfold Cross Validation. Masalah ketidakseimbangan kelas yang muncul selama\r\n\r\nproses klasifikasi kemudian diatasi melalui prosedur resampling menggunakan\r\nkombinasi metode Random Undersampling dan Random Oversampling. Sama\r\nseperti tahap sebelumnya yaitu STS, tahap klasifikasi teks juga menerapkan\r\nBioWordVec sebagai metode representasi kata.\r\nSecara keseluruhan, model hybrid LSTM – CNN yang diusulkan untuk\r\nekstraksi informasi memiliki performa yang lebih baik dibandingkan model CNN,\r\nLSTM, dan hybrid CNN – LSTM dengan nilai akurasi mencapai 100% pada tugas\r\nSTS dan mencapai 99% untuk tugas klasifikasi teks. Dengan demikian, dapat\r\ndisimpulkan bahwa model DL terbaik untuk melakukan ekstraksi informasi pada\r\npenelitian ini adalah model hybrid LSTM – CNN dengan implementasi word\r\nembedding khusus domain biomedis, yaitu BioWordVec.\r\nKata Kunci: Klasifikasi Teks, Semantic Text Similarity, BioWordVec, Hybrid\r\n\r\nLSTM – CNN.\r\nThe rise in death rates associated with leukemia has fueled the rapid expansion of\r\npublications focused on this disease. The rise in the number of publications has\r\nsubstantially affected the growth of biomedical literature, making it more\r\nchallenging to manually extract pertinent information concerning leukemia. That is\r\nbecause prior studies typically focused solely on the lexical and syntactic aspects\r\nof the text, neglecting its semantic significance.\r\nThis study aims to identify the most effective Deep Learning (DL) model\r\nfor extracting semantically significant information from a substantial volume of\r\nbiomedical data called the Biomedical Big Data Report. Semantic Text Similarity\r\n(STS) is a crucial field of research in contemporary applications that deal with the\r\nsemantic analysis of texts. This approach enhances extracting information from a\r\ntext by utilizing a distributed model of words or an external source of organized\r\nsemantic knowledge, such as word embedding. Nevertheless, it is essential to\r\nacknowledge that word embedding must suit the specific research field.\r\nThis study suggests implementing the Siamese Manhattan architecture in\r\nDeep Learning (DL) models, namely Convolutional Neural Networks (CNN), Long\r\nShort-Term Memory (LSTM) networks, hybrid CNN-LSTM models, and hybrid\r\nLSTM-CNN models, to do semantic analysis on biomedical text. Biomedical\r\nlanguage with semantic significance or in the same context is transformed into\r\nvector representation using word embedding techniques specifically designed for\r\nthe biomedical field, known as BioWordVec. In addition, the models are\r\nconstructed and evaluated based on the number of hidden layers and labelling\r\ntechniques employed. Two to three hidden layers are utilised, along with the Cosine\r\nSimilarity (CS) and Word Mover's Distance (WMD) tagging methods. The findings\r\nof the semantic analysis indicate that every sentence has the same semantic\r\nmeaning, with a similarity level of 1.\r\nThese results are the foundation for text classification, which directly\r\nimplements STS. Text classification models are constructed and evaluated using\r\ntwo data partitioning methods: train-test split and k-fold Cross Validation. The class\r\nimbalance issue during the classification process is addressed using a resampling\r\ntechnique that combines Random Undersampling and Random Oversampling\r\n\r\napproaches. Like the previous step, STS, the text categorization stage utilizes\r\nBioWordVec to represent words.\r\nThe hybrid LSTM – CNN model outperforms the CNN, LSTM, and hybrid\r\nCNN – LSTM models in information extraction, achieving accuracy rates of 100%\r\non the STS task and 99% on the text classification task. Thus, it can be concluded\r\nthat the best DL model for extracting information in this research is a hybrid LSTM\r\n– CNN model with the implementation of word embedding specifically for the\r\nbiomedical domain, namely BioWordVec.\r\nKeywords: Text Classification, Semantic Text Similarity, BioWordVec, Hybrid\r\n\r\nLSTM – CNN."^^ . "2024-03-22" . . . . . "FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM "^^ . . . . . . . "Kurniasari\t"^^ . "\tDian "^^ . "Kurniasari\t \tDian "^^ . . . . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (File PDF)"^^ . . . "1. ABSTRAK - Dian Kurniasari.pdf"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (File PDF)"^^ . . . "3. DISERTASI FULL TANPA BAB PEMBAHASDian Kurniasari.pdf"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (File PDF)"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "indexcodes.txt"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "indexcodes.txt"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "lightbox.jpg"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "preview.jpg"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "medium.jpg"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "small.jpg"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "lightbox.jpg"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "preview.jpg"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "medium.jpg"^^ . . . "PENDEKATAN BARU EKSTRAKSI INFORMASI\r\nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC\r\nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM\r\nMEMORY – CONVOLUTIONAL NEURAL NETWORK\r\n\r\n(LSTM – CNN) (Other)"^^ . . . . . . "small.jpg"^^ . . "HTML Summary of #83781 \n\nPENDEKATAN BARU EKSTRAKSI INFORMASI \nBIOMEDICAL BIG DATA REPORT DENGAN BIOWORDVEC \nMENGGUNAKAN MODEL HYBRID LONG SHORT-TERM \nMEMORY – CONVOLUTIONAL NEURAL NETWORK \n \n(LSTM – CNN)\n\n" . "text/html" . . . "500 ilmu pengetahuan alam dan matematika" . .