ANALISIS PERFORMA DAN KECEPATAN KOMPUTASI ALGORITMA K-MEANS DAN K-MEDOIDS PADA TEXT CLUSTERING

  • KARNO NUR CAHYO
  • 14002459

ABSTRAK

 

ABSTRAK
Karno Nur Cahyo (14002459), Analisis Performa dan Kecepatan Komputasi
Algoritma K-Means dan K-Medoids pada Text Clustering Banyaknya jumlah skripsi tentunya akan menyulitkan dalam mencari kategori pada topik skripsi yang sudah ditulis oleh mahasiswa di suatu universitas. Salah satu pemanfaatan metode Text Mining adalah mampu mengelompokkan obyek skripsi ke dalam jumlah kluster yang dibentuk dengan algoritma clustering. Penelitian ini bertujuan untuk melakukan perbandingan 2 algoritma clustering yaitu algoritma KMeans dan K-Medoids untuk mendapatkan evaluasi yang tepat dari sisi performa dan waktu komputasi pada kasus pengelompokan skripsi, sehingga topik yang relevan dapat dikelompokkan dan memiliki keakuratan jumlah kluster yang lebih baik. Parameter evaluasi yang digunakan adalah Davies Bouldin Index (DBI) yang merupakan salah satu teknik pengujian pada hasil clustering, dengan pembagian data training dan data testing menggunakan cross validation dengan parameter pengulangan 10 folds iteration. Dari hasil penelitian dengan kondisi Term Weighting yang digunakan adalah Term Occurrences dan menggunakan nilai NGrams adalah 2 dapat disimpulkan bahwa algoritma K-Means memiliki nilai DBI yang lebih baik yaitu -0,426. Sementara rentang nilai DBI yang dimiliki oleh KMedoids dengan kondisi yang sama memiliki nilai DBI yaitu -1,631. Namun dari hasil visualisasi menggunakan t-SNE dengan parameter pendukung yang sama, terdapat opsi yang bisa digunakan yaitu dengan jumlah kluster adalah 6, dengan nilai DBI adalah -1,110. Untuk pengujian waktu komputasi dalam proses clustering 50 dokumen skripsi, algoritma K-Means memiliki waktu rata-rata sebesar 2,5 detik sementara pada algoritma K-Medoids memiliki waktu rata-rata sebesar 261,5 detik. Spesifikasi komputer yang digunakan adalah Asus ZenBook UX425EA.312 dengan prosesor yang digunakan adalah 11 th Gen Intel® Core™ i5-1135G7 @ 2.40GHz @ 2.40GHz, kartu grafis adalah Intel® Iris® Xe Graphics, RAM yang digunakan adalah 8GB, dengan penyimpanan sebesar 512GB SSD.
Kata kunci: clustering, text mining, pengelompokan skripsi, k-means, kmedoids, Davies Bouldin Index, visualisasi t-SNE, performa penentuan
cluster, waktu komputasi penentuan cluster
 

KATA KUNCI

Analisis,Performa dan Kecepatan Komputasi,Algoritma K-Means,Algoritma K-Medoids


DAFTAR PUSTAKA

 

REFERENSI [1] S. Lialiyah and R. Andrea, “Penerapan Algoritma K-Medoids Clustering Dalam Pembentukan Zona Cluster Vaksin Boster,” vol. 4, no. 1, pp. 124– 129, 2022, doi: 10.47065/bits.v4i1.1617. [2] S. Ramadhani, D. Azzahra, U. I. Negeri, and S. S. Kasim, “Comparison of K-Means and K-Medoids Algorithms in Text Mining based on Davies Bouldin Index Testing for Classification of Student ’s Thesis,” vol. x, no. x, pp. 24–33, 2022. [3] F. Nur, M. Zarlis, and B. B. Nasution, “Penerapan Algoritma K-Means Pada Siswa Baru Sekolahmenengah Kejuruan Untuk Clustering Jurusan,”
InfoTekJar (Jurnal Nas. Inform. dan Teknol. Jaringan), vol. 1, no. 2, pp. 100–105, 2017, doi: 10.30743/infotekjar.v1i2.70. [4] M. Arifandi, A. Hermawan, and D. Avianto, “Implementasi Algoritma K- Medoids Untuk Clustering Wilayah Terinfeksi Kasus Covid19 Di Dki Jakarta,” JTT (Jurnal Teknol. Ter. , vol. 7, no. September, pp. 120–128, 2021. [5] B. Wira, A. E. Budianto, and A. S. Wiguna, “Implementasi Metode K- Medoids Clustering Untuk Mengetahui Pola Pemilihan Program Studi Mahasiwa Baru Tahun 2018 Di Universitas Kanjuruhan Malang,”
RAINSTEK J. Terap. Sains Teknol. , vol. 1, no. 3, pp. 53–68, 2019, doi: 10.21067/jtst.v1i3.3046. [6] Y. Elda, S. Defit, Y. Yunus, and R. Syaljumairi, “Klasterisasi Penempatan Siswa yang Optimal untuk Meningkatkan Nilai Rata-Rata Kelas Menggunakan K-Means,” J. Inf. dan Teknol., vol. 3, pp. 103–108, 2021, doi: 10.37034/jidt.v3i3.130. [7] C. Purnama, W. Witanti, and P. Nurul Sabrina, “Klasterisasi Penjualan Pakaian untuk Meningkatkan Strategi Penjualan Barang Menggunakan KMeans,” J. Inf. Technol., vol. 4, no. 1, pp. 35–38, 2022, doi: 10.47292/joint.v4i1.79. [8] N. Nurahman, A. Purwanto, and S. Mulyanto, “Klasterisasi Sekolah Menggunakan Algoritma K-Means berdasarkan Fasilitas, Pendidik, dan Tenaga Pendidik,” MATRIK J. Manajemen, Tek. Inform. dan Rekayasa
Komput., vol. 21, no. 2, pp. 337–350, 2022, doi: 10.30812/matrik.v21i2.1411. [9] S. U. Tarigan, M. Yetri, and Saniman, “Klasterisasi Data Penanganan Dan Pelayanan Kesehatan Masyarakat,” Jurnam Sist. Inf. TGD, vol. 1, p. 14, 2022. [10] Noviyanto and P. Ekasari, “Algoritma K-Means Untuk Klasterisasi Jabatan
64 Fungsional Dosen Pada Perguruan Tinggi Swasta Di Lingkungan LLDikti Wilayah III,” Paradigma, vol. 24, no. 1, pp. 103–107, 2022. [11] A. Wahyu and Rushendra, “Klasterisasi Dampak Bencana Gempa Bumi Menggunakan Algoritma K-Means di Pulau Jawa,” J. Edukasi dan Penelit.
Inform., vol. 8, no. 1, pp. 175–179, 2022. [12] H. N. Putra, A. Wisandra, and Fransiska, “Penerapan Algoritma K-Means untuk Klasterisasi Data Obat Pasien Rawat Jalan Berdasarkan 3 Penyakit Terbanyak Di Rumah Sakit M. Natsir Solok,” Ensikolediaku J., vol. 4, no. 3, pp. 304–312, 2022. [13] M. R. Nugroho, I. E. Hendrawan, and Purwantoro, “Penerapan Algoritma K-Means Untuk Klasterisasi Data Obat Pada Rumah Sakit ASRI,” J.
Nuansa Inform., vol. 16, pp. 125–133, 2022. [14] S. A. Rahmah and J. Antares, “Klasterisasi Seleksi Mahasiswa Calon Penerima Beasiswa Yayasan Menggunakan K-Means Clustering,” I N F O
R M a T I K a, vol. 13, no. 2, p. 25, 2022, doi: 10.36723/juri.v13i2.282. [15] M. A. Hairudin, Y. Wabula, and Hazriani, “Rekomendasi Strategi Sosialisasi Program Studi Melalui Jalur Undangan Menggunakan Algoritma ID3 dan K-Means,” J. Inf. Technol. Comput. Eng., vol. 01, pp. 14–18, 2022. [16] R. Chairunnisa and P. P. Adikara, “Analisis Sentimen terhadap Karyawan Dirumahkan pada Media Sosial Twitter menggunakan Fitur N-Gram dan Pembobotan Augmented TF – IDF Probability dengan K-Nearest Neighbour,” vol. 6, no. 4, pp. 1960–1965, 2022. [17] A. T. Ni’mah and A. Z. Arifin, “Perbandingan Metode Term Weighting terhadap Hasil Klasifikasi Teks pada Dataset Terjemahan Kitab Hadis,”
Rekayasa, vol. 13, no. 2, pp. 172–180, 2020, doi: 10.21107/rekayasa.v13i2.6412.
 

Detail Informasi

Tesis ini ditulis oleh :

  • Nama : KARNO NUR CAHYO
  • NIM : 14002459
  • Prodi : Ilmu Komputer
  • Kampus : Margonda
  • Tahun : 2022
  • Periode : I
  • Pembimbing : Dr. Agus Subekti, M.T
  • Asisten : Dr. Muhammad Haris, M. Eng
  • Kode : 0009.S2.IK.TESIS.I.2022
  • Diinput oleh : RKY
  • Terakhir update : 17 Mei 2023
  • Dilihat : 227 kali

TENTANG PERPUSTAKAAN


PERPUSTAKAAN UNIVERSITAS NUSA MANDIRI


E-Library Perpustakaan Universitas Nusa Mandiri merupakan platform digital yang menyedikan akses informasi di lingkungan kampus Universitas Nusa Mandiri seperti akses koleksi buku, jurnal, e-book dan sebagainya.


INFORMASI


Alamat : Jln. Jatiwaringin Raya No.02 RT08 RW 013 Kelurahan Cipinang Melayu Kecamatan Makassar Jakarta Timur

Email : perpustakaan@nusamandiri.ac.id

Jam Operasional
Senin - Jumat : 08.00 s/d 20.00 WIB
Isitirahat Siang : 12.00 s/d 13.00 WIB
Istirahat Sore : 18.00 s/d 19.00 WIB

Perpustakaan Universitas Nusa Mandiri @ 2020