KLASIFIKASI DIALEK BAHASA DAERAH BERDASARKAN SUARA MENGGUNAKAN CONVOLUTIONAL NEURAL NETWORK DAN MULTILAYER PERCEPTRON

  • FAHMI B MARABESSY
  • 14220011

ABSTRAK

Bahasa daerah tidak hanya berfungsi sebagai alat komunikasi, tetapi juga merepresentasikan identitas budaya dan nilai warisan lokal yang sangat berharga. Namun, karena pengaruh globalisasi dan modernisasi yang semakin kuat, bahasa daerah dapat terancam punah oleh dominasi bahasa nasional atau internasional. Penelitian mengenai pengenalan dialek bahasa daerah masih jarang dilakukan oleh peneliti untuk mengembangkan model pengenalan dialek bahasa dengan kinerja yang lebih baik. Penelitian ini menggabungkan penerapan teknik augmentasi data, seperti penambahan noise, time stretch, dan pitch shift, untuk meningkatkan ukuran data dari dataset dialek yang dikumpulkan sendiri oleh penulis. Fitur diekstraksi menggunakan Mel Frequency Cepstral Coefficients (MFCC) untuk kemudian membangun model Convolutional Neural Network (CNN) dan menggunakan Multilayer Perceptron (MLP) untuk mengklasifikasikan dialek bahasa berdasarkan suara. Dalam penelitian ini, dilakukan 8 eksperimen model dengan berbagai kombinasi teknik augmentasi data. Dari hasil evaluasi yang telah dilakukan, algoritma CNN menghasilkan kinerja tertinggi dengan akurasi sebesar 97,92%, recall 97,90%, precision 97,97%, F1-score 97,92%, dan kappa sebesar 97,49% dengan menerapkan Teknik Add Noise, Time Stretch, dan Pitch Shift.

KATA KUNCI

Dialek bahasa daerah,Convolutional Neural Network,Multilayer Perceptron,Augmentasi Data


DAFTAR PUSTAKA

[1] M. A. Bangun, M. F. A. Nasution, N. R. Sinaga, S. F. D. Sastra, and W. Khairani, “Analisis Pengaruh Media Sosial Terhadap Perkembangan Bahasa Indonesia di Era Globalisasi,” J. Bhs. Drh. Indones., vol. 1, no. 3, p. 9, 2024, doi: 10.47134/jbdi.v1i3.2646.

[2] M. Ernawati and D. Riana, “Classification of Human Emotions Based on Javanese Speech Using Convolutional Neural Network and Multilayer Perceptron,” Indones. J. Electr. Eng. Informatics, vol. 12, no. 1, pp. 101–112, 2024, doi: 10.52549/ijeei.v12i1.5343.

[3] M. H. F. Amrilla, “Speech Recognition Pada Dialek Bahasa Sunda Menggunakan Metode Convolutional Neural Network dengan Ekstraksi Ciri Mel-Spectrogram,” Repository.Uinjkt.Ac.Id, 2023, [Online]. Available: https://repository.uinjkt.ac.id/dspace/handle/123456789/73643%0Ahttps://repositor y.uinjkt.ac.id/dspace/bitstream/123456789/73643/1/M.FITROH AMRILLA FST.pdf

[4] B. Budiman, D. S. Ningsih, and M. K. Harahap, “Dasar-Dasar Dialektologi: Pemahaman Variasi Bahasa dalam Suatu Sosial Masyarakat,” J. Pendidik. Tambusai, vol. 8, no. 1, pp. 1353–1359, 2024.

[5] M. Novela and T. Basaruddin, “Dataset Suara dan Teks Berbahasa Indonesia Pada Rekaman Podcast dan Talk show,” J. Fasilkom, vol. 11, no. 2, pp. 61–66, 2021, doi: 10.37859/jf.v11i2.2628.

[6] B. R. Setiawan, A. Aranta, and B. Irmawati, “Speech To Text Bahasa Sasak Menggunakan Extraksi Fitur Mel-Frequency Cepstral Coefficients Dan Klasifikasi Convolutional Neural Networks,” J. Teknol. Informasi, Komputer, dan Apl. (JTIKA ), vol. 5, no. 1, pp. 21–32, 2023, doi: 10.29303/jtika.v5i1.235. A. Putri et al., “Komparasi Algoritma K-NN, Naive Bayes dan SVM untuk Prediksi Kelulusan Mahasiswa Tingkat Akhir,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 1, pp. 20–26, 2023, doi: 10.57152/malcom.v3i1.610.

[7] A. I. Putri, Y. Syarif, P. Jayadi, F. Arrazak, and F. N. Salisah, “Implementasi Algoritma Decision Tree dan Support Vector Machine (SVM) untuk Prediksi Risiko Stunting pada Keluarga,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 2, pp. 349–357, 2024, doi: 10.57152/malcom.v3i2.1228.

[8] D. Darwis, E. S. Pratiwi, and A. F. O. Pasaribu, “Penerapan Algoritma Svm Untuk Analisis Sentimen Pada Data Twitter Komisi Pemberantasan Korupsi Republik Indonesia,” Edutic - Sci. J. Informatics Educ., vol. 7, no. 1, pp. 1–11, 2020, doi: 10.57152/malcom.v3i2.1228.

[9] D . Darwis, E. S. Pratiwi, and A. F. O. Pasaribu, “Penerapan Algoritma Svm Untuk Analisis Sentimen Pada Data Twitter Komisi Pemberantasan Korupsi Republik Indonesia,” Edutic - Sci. J. Informatics Educ., vol. 7, no. 1, pp. 1–11, 2020, doi: 10.21107/edutic.v7i1.8779.

[10] A. Ganang Pradana, D. Rosal, I. M. Setiadi, and A. R. Muslikh, “Fine tuning model Convolutional Neural Network EfficientNet-B4 dengan augmentasi data untuk klasifikasi penyakit kakao Fine tuning Convolutional Neural Network model EfficientNet-B4 with data augmentation for cocoa disease classification,” J. Inf. Syst. Appl. Dev., vol. 2, no. 1, pp. 1–11, 2024, doi: 10.26905/jisad.v2i1.11899.

[11] T. Nasution, “Metoda Mel Frequency Cepstrum Coefficients (MFCC) untuk Mengenali Ucapan pada Bahasa Indonesia,” SATIN - Sains dan Teknol. Inf., vol. 1, pp. 22–31, 2012.

[12] H. R. Paleva and B. H. Prasetio, “Penerapan Short Time Fourier Transform pada MFCC untuk Sistem Pengenalan Ucapan Tingkat Stres,” vol. 1, no. 1, pp. 1–10, 2024.

[13] M. A. Ridwansyah, “Design of Smart Door Key System Based on Voice Recognition Using Mel Frequency Cepstral Coefficient ( Mfcc ) and K-Nearest Neighbor ( K-Nn ),” vol. 5, no. 3, pp. 4211–4218, 2018.

[14] E. Shandy, A. H. Anshor, and D. Ardiatma, “Journal of Computer Networks , Architecture and High Performance Computing Implementation of Data Mining for Speech Recognition Classification of Sundanese Dialect Using KNN Method with MFCC Feature Extraction Journal of Computer Networks , Architecture a,” vol. 6, no. 3, pp. 1145–1158, 2024.

[15] F. Zamachsari and N. Puspitasari, “Penerapan Deep Learning dalam Deteksi Penipuan Transaksi Keuangan Secara Elektronik,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 2, pp. 203–212, 2021, doi: 10.29207/resti.v5i2.2952.

[16] Radikto, D. I. Mulyana, M. A. Rofik, and Mo. Z. Z. Zakaria, “Klasifikasi Kendaraan pada Jalan Raya menggunakan Algoritma Convolutional Neural Network ( CNN ),” J. Pendidik. Tambusai, vol. 6, no. 1, pp. 1668–1679, 2022.

[17] K. Azmi, S. Defit, and S. Sumijan, “Implementasi Convolutional Neural Network (CNN) Untuk Klasifikasi Batik Tanah Liat Sumatera Barat,” J. Unitek, vol. 16, no. 1, pp. 28–40, 2023, doi: 10.52072/unitek.v16i1.504.

[18] V. F. Hakim and D. Riana, “ANALYSIS OF USER COMPLAINTS FOR TELECOMMUNICATION BRANDS ON X ( TWITTER ) USING INDOBERT AND DEEP LEARNING Jurnal Nasional Pendidikan Teknik Informatika?: JANAPATI | 271,” vol. 13, no. 2, pp. 270–279, 2024.

[19] H. F. Pardede, A. R. Yuliani, and R. Sustika, “Convolutional neural network and feature transformation for distant speech recognition,” Int. J. Electr. Comput. Eng., vol. 8, no. 6, pp. 5381–5388, 2018, doi: 10.11591/ijece.v8i6.pp5381-5388.

[20] N. Nurmila, A. Sugiharto, and E. A. Sarwoko, “Algoritma Back Propagation Neural Network Untuk Pengenalan Pola Karakter Huruf Jawa,” J. Masy. Inform., vol. 1, no. 1, pp. 1–10, 2010, doi: 10.14710/jmasif.1.1.

[21] G. C. Utami, C. R. Widiawati, and P. Subarkah, “Detection of Indonesian Food to Estimate Nutritional Information Using YOLOv5,” Teknika, vol. 12, no. 2, pp. 158 165, 2023, doi: 10.34148/teknika.v12i2.636.

[22] M. Riyyan and H. Firdaus, “PERBANDINGAN ALGORITME NAÃ VE BAYES DAN KNN TERHADAP DATA PENERIMAAN BEASISWA (Studi Kasus Lembaga Beasiswa Baznas Jabar),” J. Inform. dan Rekayasa Elektron., vol. 5, no. 1, pp. 1–10, 2022, doi: 10.36595/jire.v5i1.547.

[23] M. Iqbal, Hendri Mahmud Nawawi, M. R. Ramadhan Saelan, M. Sony Maulana, Yudhistira, and A. Mustopa, “Optimasi Hyperparameter Multilayer Perceptron Untuk Prediksi Daya Beli Mobil,” J. Manaj. Inform. dan Sist. Inf., vol. 6, no. 1, pp. 73–81, 2023, doi: 10.36595/misi.v6i1.739.

[24] S. A. Assaidi and F. Amin, “Analisis Sentimen Evaluasi Pembelajaran Tatap Muka 100 Persen pada Pengguna Twitter menggunakan Metode Logistic Regression,” vol. 6, pp. 13217–13227, 2022. [25] R. Bakeman, “KappaAcc: A program for assessing the adequacy of kappa,” Behav. Res. Methods, vol. 55, no. 2, pp. 633–638, 2023, doi: 10.3758/s13428-022-01836-1.

[26] F. P. Anindya, D. E. Herwindiati, and N. J. Perdana, “Pengenalan Suara Manusia Menggunakan Support Vector Classifier(SVC) Untuk Proses Otentikasi,” Comput. J. Comput. Sci. Inf. Syst., vol. 7, no. 1, pp. 28–36, 2023, doi: 10.24912/computatio.v7i1.16230.

[27] M. A. H. Sulaiman, N. Abd Aziz, A. Zabidi, Z. Jantan, I. Mohd Yassin, and M. S. A. Megat Ali, “A Systematic Approach for Malay Language Dialect Identification by Using CNN,” J. Electr. Electron. Syst. Res., vol. 19, no. OCT2021, pp. 25–37, 2021, doi: 10.24191/jeesr.v19i1.004.

[28] O. V. Putra, A. Musthafa, and M. Kholil, “Klasifikasi Intonasi Bahasa Jawa Khas Ponorogo Menggunakan Algoritma Multilayer Perceptron Neural Network,” Pros. Semin. Nas. Penelit. Dan Pengabdi. 2021, pp. 459–464, 2021.

[29] Widya Bayu Pratiwi, Arik Aranta, and Gibran Satya Nugraha, “Analisis Kebutuhan Dataset Algoritma Speech To Text Bahasa Sasak Menggunakan Perbandingan Data Suara Bahasa Inggris Pada Metode CNN,” J. Comput. Sci. Informatics Eng., vol. 7, no. 2, pp. 165–173, 2024, doi: 10.29303/jcosine.v7i2.568.

[30] Edwin Ariesto Umbu Malahina, “Teachable Machine: Deteksi Dialek Sumba Timur (Kambera) Menggunakan Layanan Open Source,” J. Nas. Tek. Elektro dan Teknol. Inf., vol. 12, no. 4, pp. 280–286, 2023, doi: 10.22146/jnteti.v12i4.8174.

[31] E. B. Union, “( Advanced Audio Coding ),” pp. 5–6, 2003.

[32] B. A. Alsaify, H. S. A. Arja, B. Y. Maayah, and M. M. Al-Taweel, “A dataset for voice-based human identity recognition,” Data Br., vol. 42, p. 108070, 2022, doi: 10.1016/j.dib.2022.108070.

[33] M. A. A. A. Solichin, “Analisis Sentimen MotoGP Mandalika Pada Twitter Menggunakan Metode Naïve Bayes,” J. Ticom Technol. Inf. Commun., vol. 11, no. Vol 11 No 1 (2022): Jurnal Ticom: Technology of Information and Communication, pp. 20–25, 2022, [Online]. Available: https://jurnal-ticom.jakarta.aptikom.or.id/index.php/Ticom/article/view/66/55

Detail Informasi

Tesis ini ditulis oleh :

  • Nama : FAHMI B MARABESSY
  • NIM : 14220011
  • Prodi : Ilmu Komputer
  • Kampus : Margonda
  • Tahun : 2024
  • Periode : I
  • Pembimbing : Prof. Ir. Dr. Dwiza Riana, S,Si, MM, M.Kom
  • Asisten :
  • Kode : 0002.S2.IK.TESIS.I.2024
  • Diinput oleh : SGM
  • Terakhir update : 16 Februari 2025
  • Dilihat : 83 kali

TENTANG PERPUSTAKAAN


PERPUSTAKAAN UNIVERSITAS NUSA MANDIRI


E-Library Perpustakaan Universitas Nusa Mandiri merupakan platform digital yang menyedikan akses informasi di lingkungan kampus Universitas Nusa Mandiri seperti akses koleksi buku, jurnal, e-book dan sebagainya.


INFORMASI


Alamat : Jln. Jatiwaringin Raya No.02 RT08 RW 013 Kelurahan Cipinang Melayu Kecamatan Makassar Jakarta Timur

Email : perpustakaan@nusamandiri.ac.id

Jam Operasional
Senin - Jumat : 08.00 s/d 20.00 WIB
Isitirahat Siang : 12.00 s/d 13.00 WIB
Istirahat Sore : 18.00 s/d 19.00 WIB

Perpustakaan Universitas Nusa Mandiri @ 2020