ANALISA FITUR SELEKSI DATASET CICIDS-2017 DENGAN ALGORITMA XGBOOST, RANDOM FOREST, LOGISTIC REGRESSION DAN VOTING TERHADAP UJI PERFORMA DETEKSI ANOMALI
- YULIUS PAULUS DHARSONO
- 14002320
ABSTRAK
Analisis dataset CICIDS2017 dengan jumlah atribut dan observasi yang besar merupakan tantangan tersendiri dalam penelitian deteksi anomali. Hal ini dikarenakan kebutuhan data penelitian anomali. Hal ini dikarenakan kebutuhan data penelitian anomali yang searah dengan zero-day, maka pengujian model dengan metode yang akurat dalam prediksi label dan atribut yang mempengaruhinya merupakan suatu state of the art. Fokus studi penelitian adalah melakkan analisa fitur dataset CICIDS-2017 berdasarkan fitur penting. Metode penelitian dilakukan dengan praproses data, penerapan SMOTE terkait isu keseimbangan label dataset, pembangkitan fitur penting, serta voting terhadap algoritma penelitian. Dari penelitian yang bersiftat eksperimen, didapatkan sejumlah fitur penting dengan 10 peringkat tertinggi, EVC sebagai algoritma voting mampu meningkatkan prediksi akurasi sebesar 97,92%, validasi akurasi 89,28% dengan nilai F1 adalaha 98,28%. Algoritma XGBoost adalah model terbaik dalam penelitian yang dilakukan dengan performa validasi akurasi 93,65% dan F1 81,37%
Kata kunci: CICIDS-2017, Feature Importance, Akurasi, Multiklasifikasi
KATA KUNCI
Data Mining
DAFTAR PUSTAKA
A. H. Lashkari "Characterization of tor traffic using time based features" 2017
V. Labayen " Online classification of user activities using machine learning on network traffic" 2020
L. Ding "A Classification algorithmn for network for network traffic based on improved suppport vector machine"
N.A. Joseph Muniz "Building Operating and maintaning your SOC" 2016
A. Yulianto " Improving AdaBoost-based intrusion Detection System Performance on CIC IDS 2017 Dataset"
B. Reis "Selection and Performance Analysis of CICIDS2017 Features Importance"
Kurniabudi "CICIDS-2017 Dataset feature Analysis with Information Gain for Anomaly Detection" 2020
I.H. Witten "Data Mining: Practical Machine Learning Tools and Techniques" 2016
D.T. Larose "Discovering Knowledge in Data" 2014
J.Wang "Encylopedia of Data Warehousing and MIning" 2009
D. Liparas "News Articles Classification using Random Forest and Weighted Multimodal Features"
Detail Informasi
Tesis ini ditulis oleh :
- Nama : YULIUS PAULUS DHARSONO
- NIM : 14002320
- Prodi : Ilmu Komputer
- Kampus : Kramat Raya
- Tahun : 2021
- Periode : II
- Pembimbing : Dr. Hilman Ferdinandus Pardede, ST, M.EICT
- Asisten : Dr. Agus Subekti, M.T
- Kode : 0031.S2.IK.TESIS.II.2021
- Diinput oleh : RHU
- Terakhir update : 08 Desember 2022
- Dilihat : 202 kali
TENTANG PERPUSTAKAAN

E-Library Perpustakaan Universitas Nusa Mandiri merupakan
platform digital yang menyedikan akses informasi di lingkungan kampus Universitas Nusa Mandiri seperti akses koleksi buku, jurnal, e-book dan sebagainya.
INFORMASI
Alamat : Jln. Jatiwaringin Raya No.02 RT08 RW 013 Kelurahan Cipinang Melayu Kecamatan Makassar Jakarta Timur
Email : perpustakaan@nusamandiri.ac.id
Jam Operasional
Senin - Jumat : 08.00 s/d 20.00 WIB
Isitirahat Siang : 12.00 s/d 13.00 WIB
Istirahat Sore : 18.00 s/d 19.00 WIB
Perpustakaan Universitas Nusa Mandiri @ 2020