PENERAPAN ALGORITMA KLUSTERISASI DAN KLASIFIKASI PADA DATABASE SQL SERVER
- RAKA IBNU SHOLEH SADAMI
- 14002053
ABSTRAK
ABSTRAK
Nama : Raka Ibnu Sholeh Sadami
NIM : 14002053
Program Studi : Ilmu Komputer
Jenjang : Program Magister (S2)
Konsentrasi : Data Mining
Judul : “Penerapan Algoritma Klusterisasi dan Klasifikasi Pada
Database SQL Server”
Perkembangan Database Management System (DBMS) demikian pesat, banyak vendor menawarkan produk-produk DBMS mereka namun bagi perusahaan diindonesia masih banyak yang memilih SQL Server sebagai DBMS untuk menunjang bisnisnya. Keberhasilan merupakan sasaran utama bagi perusahaan-perusahaan yang bergerak dibidang jasa konsultan teknologi informasi (TI), maka dari itu kehandalan pada sistem informasi suatu organisasi atau perusahaan sangatlah penting untuk ditingkatkan dan dimaksimalkan agar investasi dan sumberdaya yang terdapat didalamnya dapat terolah dengan baik dan berkembang dan juga dapat mengemat biaya dan waktu. Terlebih laju percepatan globalisasi ekonomi dan persaingan usaha telah menyebabkan organisasi dan perusahaan menghadapi malasah memilih kebijakan pengambilan keputusan strategi yang tepat dalam menentukan langkah agar terhindar dari kerugian yang diakibatkan problem teknologi dan keluar dari permaslahan tersebut. Penellitian ini mengangkat dari permasalahan pada suatu Proyek informasi teknologi yang di tangani oleh sumber daya manusia perusahaan konsultan TI yaitu Database Administrator (DBA) yang mana DBA dituntut oleh pelanggan untuk memenuhi permintaan perubahan spesifikasi infrastruktur yang dilakukan dalam waktu dekat yaitu Refreshment Computer Server for Database dan server database yang digunakan pelanggan adalah SQL Server, jumlah perangkat server yang disediakan yaitu 4 (empat) Komputer Server baru dengan spesifikasi perangkat komputer server identik dengan komputer server yang saat ini digunakan yaitu 2 (dua) komputer server database dengan sistem SQL Server failover cluster dan metode Network Load-Balancing Clusters, mengingat dan melihat database yang ada dalam komputer server cluster SQL Server saat ini sudah mencapai 1.260 database dan ada kemungkinan untuk bertambahnya database dalam waktu yang akan datang, maka pelanggan bertujuan memfungsikan 4 komputer server yang baru untuk di isi dari sebagian database yang ada pada komputer server saat ini, untuk menentukan langkah pengambilan keputusan dalam menempatkan database baru kedalam salah satu SQL Server Cluster dan untuk mencapai keberhasilan dari permasalah diatas, maka metode datamining menjadi solusi untuk membagi database kedalam beberapa cluster dengan Metode ELBOW dan Algoritma klusterisasi K-Means dan pengujian dengan beberapa algoritma klasifikasi untuk menentukan penempatan database bila ada penambahan database baru. Peneliti menggunakan ukuran database terkini dan data performance monitor transaction / sec pada setiap database untuk transaksi pertama hingga transaksi ke sepuluh (10) sebagai dataset dan dengan tools pembelajaran mesin KNIME untuk menciptakan model datamining yang terbaik, dari model yang diciptakan dalam penelitan ini pertama-tama dataset diproses dengan model klusterisasi yaitu menentukan terlebih dahulu jumlah k yang optimal dengan metode Elbow kemudian dilakukan pengelompokan dengan algoritma K-Means dari hasil model klusterisasi dihasilkan jumlah k = 3 dari perhitungan Sum of Square Error (SSE) pada metode ELbow dan pelabelan keanggotaan cluster pada setiap baris dataset dari algoritma K-Means dengan hasil keanggotaan Cluster_0 memiliki anggota = 153, Cluster_1 memiliki anggota = 93, Cluster_2 memiliki anggota = 1013, setelah dataset menghasilkan label baru yaitu keanggotaan cluster kemudian dataset tersebut diproses dengan model klasifikasi dari beberapa algoritma diantanya adalah altoritma K-Nearest Neighbor, Naive Bayes, Support Vectore Machine, Random Forest, Decision Tree, dan Jaringan Syaraf Tiruan dengan beberapa teknik validasi seperti teknik validasi split, cross validation, dan cross validation plus optimization parameter, dari hasil proses model klasifikasi di tetapkan satu algoritma dan teknik validasi yang mendapatkan nilai akurasi paling optimal untuk memprediksi penempatan database baru pada cluster_0, cluster_1 atau cluster_2 yaitu algoritma Jaringan Syaraf Tiruan dengan teknik validasi cross validation plus optimization parameter dengan nilai akurasi akurasi 99,44% sedangkan K-Nearest Neighbor hanya mendapatkan nilai akurasi 96,51%, Naïve Bayes hanya mendapatkan nilai akurasi 97,06%, Support Vector Machine hanya mendapatkan nilai akurasi 89,05%, Decesion Tree hanya mendapatkan nilai akurasi 94,05%, dan Random Forest hanya mendapatkan nilai akurasi 96,67%.
Kata kunci:
Database, SQL Server Cluster, Klusterisasi, Klasifikasi, Clustering, Classification, Elbow , K-Means, K- Nearest Neighbor, Naïve Bayes, Support Vector Machine, Random Forest, Decision Tree, Jaringan Syaraf Tiruan
KATA KUNCI
Algoritma Klusterisasi
DAFTAR PUSTAKA
DAFTAR REFERENSI
[1] H. Setya, “PENERAPAN METODE LOAD-BALANCING CLUSTERS PADA DATABASE SERVER GUNA PENINGKATAN KINERJA PENGAKSESAN DATA,” Techno Nusa Mandiri, vol. IX, no. 1, pp. 97–108, 2013.
[2] J. Jupriyanto and S. Nurlela, “Kerangka Pengambilan Keputusan Untuk Pemasaran Presisi Menggunakan Metode Rfm, Algoritma K-Means Dan Decision Tree,” J. Pilar Nusa Mandiri, vol. 15, no. 2, pp. 227–234, 2019, doi: 10.33480/pilar.v15i2.618.
[3] R. L. Hasanah, M. Hasan, W. E. Pangesti, F. F. Wati, and W. Gata, “Klasifikasi Penerima Dana Bantuan Desa Menggunakan Metode Knn (K-Nearest Neighbor),” J. Techno Nusa Mandiri, vol. 16, no. 1, pp. 1–6, 2019, doi: 10.33480/techno.v16i1.25.
[4] J. Suntoro, Data Mining Algoritma dan Implementasi dengan Pemrograman PHP.pdf. Elex Media Komputindo, 2019.
[5] T.S Madhulatha, “An overview of clustering methods,” IOSR J. Eng., vol. 2, no. 4, pp. 1–7, 2012, doi: 10.3233/ida-2007-11602.
[6] Irwanto, Y. Purwananto, and R. Soelaiman, “Optimasi Kinerja Algoritma Klasterisasi K-Means untuk Kuantisasi Warna Citra,” J. Tek. ITS, vol. 1, no. 1, pp. A197–A202, 2012, [Online]. Available: http://ejurnal.its.ac.id/index.php/teknik/article/view/631.
[7] T. M. Kodinariya and P. R. Makwana, “Review on determining number of Cluster in K-Means Clustering,” Int. J. Adv. Res. Comput. Sci. Manag. Stud., vol. 1, no. 6, pp. 2321–7782, 2013.
[8] H. He and Y. Tan, “A two-stage genetic algorithm for automatic clustering,” Neurocomputing, vol. 81, pp. 49–59, 2012, doi: 10.1016/j.neucom.2011.11.001.
[9] W. Xiang, N. Zhu, S. Ma, X. Meng, and M. An, “A dynamic shuffled differential evolution algorithm for data clustering,” Neurocomputing, vol. 158, pp. 144–154, Jun. 2015, doi: 10.1016/J.NEUCOM.2015.01.058.
[10] C. Zhang, D. Ouyang, and J. Ning, “An artificial bee colony approach for clustering,” Expert Syst. Appl., vol. 37, no. 7, pp. 4761–4767, 2010, doi: 10.1016/j.eswa.2009.11.003.
[11] J. A. Sáez, M. Galar, J. Luengo, and F. Herrera, “Tackling the problem of classification with noisy data using Multiple Classifier Systems: Analysis of the performance and robustness,” Inf. Sci. (Ny)., vol. 247, pp. 1–20, 2013, doi: 10.1016/j.ins.2013.06.002.
[12] G. Haixiang, L. Yijing, L. Yanan, L. Xiao, and L. Jinling, “BPSO-Adaboost-KNN ensemble learning algorithm for multi-class imbalanced data classification,” Eng. Appl. Artif. Intell., vol. 49, pp. 176–193, 2016, doi: 10.1016/j.engappai.2015.09.011.
[13] B. Santosa and A. Umam, Data Mining dan Big Data Analytics Teori dan Implementasi Mengg.pdf. Penebar Media Pustaka, 2018.
[14] J. Suntoro and C. N. Indah, “Average Weight Information Gain Untuk Menangani Data Berdimensi Tinggi Menggunakan Algoritma C4.5,” J. Buana Inform., vol. 8, no. 3, pp. 131–140, 2017, doi: 10.24002/jbi.v8i3.1315.
[15] M. K. and J. P. Jiawei Han, “Data Mining: Concepts and Techniques, Third Edition - Books24x7,” Morgan Kaufmann Publ., vol. 1, p. 745, 2012, [Online]. Available: http://library.books24x7.com/toc.aspx?bkid=44712.
[16] M. Kantardzic, “Data Mining Concepts 4 Regression,” vol. 1, pp. 1–25, 2014.
[17] M. P. Shakina Rizkia, Erwin Budi Setiawan S.Si., M.T, Diyas Puspandari S.S., “Analisis Sentimen Kepuasan Pelanggan Terhadap Internet Provider Indihome di Twitter Menggunakan Metode Decision Tree dan Pembobotan TF-IDF,” e-Proceeding Eng., vol. 6, no. 2, pp. 9683–9693, 2019.
[18] S. N. Edusaintek, B. Bawono, R. Wasono, and U. M. Semarang, “PERBANDINGAN METODE RANDOM FOREST DAN NAÏVE BAYES Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari salah satu Bank . Data yang memiliki 10 atribut yang terdiri dari Tanggal Akad , Tanggal Jatuh Tempo , Plafond , Saldo Sept,” pp. 343–348, 2019.
[19] W. Gata et al., “Algorithm Implementations Naïve Bayes, Random Forest. C4.5 on Online Gaming for Learning Achievement Predictions,” vol. 258, no. Icream 2018, 2019, doi: 10.2991/icream-18.2019.1.
[20] M. Badrul, “PERBANDINGAN ALGORITMA C4.5 DAN NEURAL NETWORK UNTUK MEMPREDIKSI HASIL PEMILU LEGISLATIF DKI JAKARTA,” J. Pilar Nusa Mandiri, vol. X, no. 2, pp. 1–12, 2014, doi: https://doi.org/10.33480/pilar.v10i2.470.
[21] A. Bode, “K-Nearest Neighbor Dengan Feature Selection Menggunakan Backward Elimination Untuk Prediksi Harga Komoditi Kopi Arabika,” Ilk. J. Ilm., vol. 9, no. 2, pp. 188–195, 2017, doi: 10.33096/ilkom.v9i2.139.188-195.
[22] KNIME, “Parameter optimization,” Optim. Param., vol. 21, pp. 297–336, 2020, doi: 10.1007/3-540-32849-1_8.
[23] M. R. Berthold et al., “KNIME: The konstanz information miner,” 4th Int. Ind. Simul. Conf. 2006, ISC 2006, pp. 58–61, 2006, doi: 10.1007/978-3-540-78246-9_38.
[24] S. Adinugroho and Y. A. Sari, Implementasi Data Mining Menggunakan Weka.pdf. Universita Brawijaya Press, 2018.
[25] P. Chapman et al., Crisp-Dm 1.0. 2000.
Detail Informasi
Tesis ini ditulis oleh :
- Nama : RAKA IBNU SHOLEH SADAMI
- NIM : 14002053
- Prodi : Ilmu Komputer
- Kampus : Kramat Raya
- Tahun : 2020
- Periode : I
- Pembimbing : Dr. Windu Gata, M.Kom
- Asisten :
- Kode : 0005.S2.IK.TESIS.I.2020
- Diinput oleh : RKY
- Terakhir update : 11 Juli 2022
- Dilihat : 312 kali
TENTANG PERPUSTAKAAN

E-Library Perpustakaan Universitas Nusa Mandiri merupakan
platform digital yang menyedikan akses informasi di lingkungan kampus Universitas Nusa Mandiri seperti akses koleksi buku, jurnal, e-book dan sebagainya.
INFORMASI
Alamat : Jln. Jatiwaringin Raya No.02 RT08 RW 013 Kelurahan Cipinang Melayu Kecamatan Makassar Jakarta Timur
Email : perpustakaan@nusamandiri.ac.id
Jam Operasional
Senin - Jumat : 08.00 s/d 20.00 WIB
Isitirahat Siang : 12.00 s/d 13.00 WIB
Istirahat Sore : 18.00 s/d 19.00 WIB
Perpustakaan Universitas Nusa Mandiri @ 2020