SOFTWARE DEFECT PREDICTION DENGAN RANDOM OVER SAMPLING DAN RANDOM FOREST LEARNING

  • TOMMI ALFIAN ARMAWAN SANDI
  • 14002290

ABSTRAK

ABSTRAK

 

 

Nama                              : Tommi Alfian Armawan Sandi

NIM                               : 14002290

Program Studi                : Ilmu Komputer (S2)

Jenjang                           : Strata Dua (S2)

Konsentrasi                    : Software Engineering

Judul Tesis                     : “SOFTWARE DEFECT PREDICTION DENGAN RANDOM OVER SAMPLING DAN RANDOM FOREST LEARNING”

 

Perangkat lunak atau sering disebut dengan aplikasi sangat melekat pada kehidupan khalayak ramai pada akhir-akhir ini. Dalam pengembangannya perangkat lunak didukung oleh berbagai macam metode, bagi sebagian besar pelaku software development mengetahui bagaimana cara membangun perangkat lunak dari perancangan  lalu pengujian (testing) dan pemeliharaan (maintenance) sampai aplikasi tersebut dapat digunakan oleh banyak orang. Namun, ada beberapa kasus yang terkuak dan tidak terdeteksi pada proses testing melainkan ketika aplikasi tersebut sudah ditangan penguna. Pengujian demi pengujian telah di lakukan namun tidak dapat memprediksi kecacatan dikemudian hari. Penelitian ini dilakukan untuk menjawab kebutuhan development dimana pengaruh praproses data berpengaruh pada akurasi algoritma, algoritma yang digunakan diantaranya Naïve bayes, C.45, Linear Regression, MLP, RF, KNN dan SVM, fakta yang ditemukan dengan menggunakan SVM pada metode Discretize medapat akurasi 77.3410%, dengan menggunakan Random Forest pada teknik ROS mendapat akurasi 87.7682% dan dengan menggunakan Algoritma C.45 pada seleksi fitur Gain Ratio mendapat akurasi 77.5554%

 

Kata Kunci : Praprocess Data, Resampling Data, Seleksi Fitur, Algorima Klasifikasi

KATA KUNCI

Software engineering


DAFTAR PUSTAKA

DAFTAR REFERENSI

 

 

[1]      A. Montella, S. Chiaradonna, G. Criscuolo, and S. De Martino, “Development and evaluation of a web-based software for crash data collection, processing and analysis,” Accid. Anal. Prev., 2019, doi: 10.1016/j.aap.2017.01.013.

[2]      S. V. Zykov, Historical Survey: Crises, Crises, Everywhere; Any End to This Nightmare? 2020.

[3]      V. Garousi and M. Felderer, “Worlds Apart: Industrial and Academic Focus Areas in Software Testing,” IEEE Softw., 2017, doi: 10.1109/MS.2017.3641116.

[4]      G. Fan, X. Diao, H. Yu, K. Yang, and L. Chen, “Software Defect Prediction via Attention-Based Recurrent Neural Network,” Hindawi, vol. 2019, 2019.

[5]      A. Iqbal et al., “Performance Analysis of Machine Learning Techniques on Software Defect Prediction using NASA Datasets,” vol. 10, no. 5, pp. 300–308, 2019.

[6]      S. Mulyati, Yulianti, and A. Saifudin, “KETIDAKSEIMBANGAN KELAS BERBASIS NA?VE BAYES PADA PREDIKSI,” vol. 2, no. 4, pp. 190–199, 2017.

[7]      H. Rianto and R. S. Wahono, “Resampling Logistic Regression untuk Penanganan Ketidakseimbangan Class pada Prediksi Cacat Software,” IlmuKomputer.com J. Softw. Eng., vol. 1, no. 1, pp. 46–53, 2015.

[8]      C. M. L. Florence, “Deep neural network based hybrid approach for software defect prediction using software metrics,” Cluster Comput., 2018, doi: 10.1007/s10586-018-1696-z.

[9]      A. Iqbal, S. Aftab, and F. Matloob, “Performance Analysis of Resampling Techniques on Class Imbalance Issue in Software Defect Prediction,” I.J. Inf. Technol. Comput. Sci., no. November, pp. 44–53, 2019, doi: 10.5815/ijitcs.2019.11.05.

[10]    R. J. L. Florence, “Software defect prediction techniques using metrics based on neural network classifier,” Cluster Comput., 2018, doi: 10.1007/s10586-018-1730-1.

[11]    D. Nofriansyah and G. W. Nurcahyo, Algoritma Data Mining Dan Pengujian. Jakarta, 2015.

[12]    S. A. Alasadi and W. S. Bhaya, “Review of Data Preprocessing Techniques,” Journal of Engineering and Applie Sciences, vol. 12, no. 16. pp. 4102–4107, 2017.

[13]    Suyanto, Machine Learning Tingkat dasar dan Lanjut. Penerbit Informatika, 2018.

[14]    D. Firdaus, “Penggunaan Data Mining dalam Kegiatan Sistem Pembelajaran Berbantuan Komputer,” J. Format, vol. 6, no. 2, pp. 91–97, 2017.

[15]    H. N. Firqiani, “Seleksi Fitur Menggunakan Fast Correlation Based Filter Pada Algoritma Voting Feature Intervals 5,” Institut Pertanian Bogor (IPB), 2007.

[16]    J. Lever, M. Krzywinski, and N. Altman, “Points of Significance: Principal component analysis,” Nat. Methods, vol. 14, no. 7, pp. 641–642, 2017, doi: 10.1038/nmeth.4346.

[17]    S. J. Wetzel, “Unsupervised learning of phase transitions: From principal component analysis to variational autoencoders,” Phys. Rev. E, vol. 96, no. 2, pp. 1–11, 2017, doi: 10.1103/PhysRevE.96.022140.

[18]    Y. M. S., “Random Forest,” 2018. https://machinelearning.mipa.ugm.ac.id/2018/07/28/random-forest/ (accessed Jan. 19, 2021).

[19]    A. Syukron and A. Subekti, “Penerapan Metode Random Over-Under Sampling dan Random Forest Untuk Klasifikasi Penilaian Kredit,” J. Inform., vol. 5, no. 2, pp. 175–185, 2018, doi: 10.31311/ji.v5i2.4158.

[20]    F. Tempola, M. Muhammad, and A. Khairan, “Perbandingan Klasifikasi Antara KNN dan Naive Bayes pada Penentuan Status Gunung Berapi dengan K-Fold Cross Validation,” J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 5, p. 577, 2018, doi: 10.25126/jtiik.201855983.

[21]    I. A. M. SUPARTINI, I. K. G. SUKARSA, and I. G. A. M. SRINADI, “Analisis Diskriminan Pada Klasifikasi Desa Di Kabupaten Tabanan Menggunakan Metode K-Fold Cross Validation,” E-Jurnal Mat., vol. 6, no. 2, p. 106, 2017, doi: 10.24843/mtk.2017.v06.i02.p154.

[22]    R. A. Haristu, “PENERAPAN METODE RANDOM FOREST UNTUK PREDIKSI WIN RATIOPEMAIN PLAYER UNKNOWN BATTLEGROUND,” UNIVERSITAS SANATA DHARMA, 2019.

[23]    M. K. Dr. Maria Susan Anggreany, S.Kom., “Confusion Matrix,” Binus University School of Information System, 2020. https://socs.binus.ac.id/2020/11/01/confusion-matrix/ (accessed Jan. 19, 2021).

[24]    S. Narkhede, “Understanding Confusion Matrix,” Towards Data Science, 2018. https://towardsdatascience.com/understanding-confusion-matrix-a9ad42dcfd62 (accessed Jan. 19, 2021).

[25]    U. Ali, S. Aftab, A. Iqbal, Z. Nawaz, M. S. Bashir, and M. A. Saeed, “Software defect prediction using variant based ensemble learning and feature selection techniques,” Int. J. Mod. Educ. Comput. Sci., vol. 12, no. 5, pp. 29–40, 2020, doi: 10.5815/ijmecs.2020.05.03.

Detail Informasi

Tesis ini ditulis oleh :

  • Nama : TOMMI ALFIAN ARMAWAN SANDI
  • NIM : 14002290
  • Prodi : Ilmu Komputer
  • Kampus : Kramat Raya
  • Tahun : 2020
  • Periode : II
  • Pembimbing : Dr. Agus Subekti, M.T.
  • Asisten :
  • Kode : 0056.S2.IK.TESIS.II.2020
  • Diinput oleh : RKY
  • Terakhir update : 27 Juli 2022
  • Dilihat : 157 kali

TENTANG PERPUSTAKAAN


PERPUSTAKAAN UNIVERSITAS NUSA MANDIRI


E-Library Perpustakaan Universitas Nusa Mandiri merupakan platform digital yang menyedikan akses informasi di lingkungan kampus Universitas Nusa Mandiri seperti akses koleksi buku, jurnal, e-book dan sebagainya.


INFORMASI


Alamat : Jln. Jatiwaringin Raya No.02 RT08 RW 013 Kelurahan Cipinang Melayu Kecamatan Makassar Jakarta Timur

Email : perpustakaan@nusamandiri.ac.id

Jam Operasional
Senin - Jumat : 08.00 s/d 20.00 WIB
Isitirahat Siang : 12.00 s/d 13.00 WIB
Istirahat Sore : 18.00 s/d 19.00 WIB

Perpustakaan Universitas Nusa Mandiri @ 2020