Analisis Penerapan Hyperparameter Tuning Pada Machine Learning Untuk Meningkatkan Akurasi Prediksi Tingkat Penjualan

  • SUGIYANTI
  • 14210253

ABSTRAK

ABSTRAK

Nama              : Sugiyanti

NIM                 : 14210253

Program Studi : Ilmu Komputer

Fakultas          : Teknologi Informasi

Jenjang           : Strata Dua (S2)

Konsentrasi     : Data Mining

Judul             : “Analisis Penerapan Hyperparameter Tuning Pada Machine Learning Untuk Meningkatkan Akurasi Prediksi Tingkat Penjualan”

Pertumbuhan pelaku bisnis penjualan semakin meningkat, untuk itu perlu adanya suatu prediksi terhadap tingkat penjualan untuk penjualan masa depan agar tidak mengalami kerugian finansial. Tujuan dari penelitian ini adalah untuk mendapatkan model prediksi tingkat penjualan dengan akurat. Pihak penjual akan memahami fitur-fitur penting yang mempengaruhi terhadap tingkat atau nilai penjualan. Metode yang digunakan dalam peneltiian ini adalah algoritma regression Machine Learning (ML) serta menggunakan hyperparameter tuning. Tahap preprocessing dalam penelitian ini sangat penting untuk dapat menghasilkan nilai prediksi yang lebih baik. Hasil dari penelitian ini menghasilkan algoritma terbaik yaitu XGBoost dengan hasil Root Mean Squared Error (RMSE) adalah 968 dan nilai Mean Absolute Error (MAE) adalah 713, hasil tersebut lebih baik dari hasil penelitian sebelumnya dengan menggunalan algoritma yang sama yaitu XGBoost tetapi tidak menggunakan hyperparameter tuning optuna menghasilkan nilai RMSE sebesar 1052, dan MAE sebesar 739.03. Sehingga dengan menggunakan hyperparameter tuning optuna dapat menurunkan nilai error hasil prediksi.

KATA KUNCI

Prediksi,Penjualan,Hyperparameter,Optuna,XGBoost


DAFTAR PUSTAKA

DAFTAR PUSTAKA

[1] X. Dairu and Z. Shilong, “Machine Learning Model for Sales Forecasting by Using XGBoost,” 2021 IEEE Int. Conf. Consum. Electron. Comput. Eng. ICCECE 2021, no. Iccece, pp. 480–483, 2021, doi: 10.1109/ICCECE51280.2021.9342304.

[2] D. Preethi and V. S, “An Analysis of Machine Learning Algorithms to Predict Sales,” Int. J. Sci. Res., vol. 11, no. 6, pp. 462–466, 2022, doi: 10.21275/SR22601144946.

[3] J. Wang, “A hybrid machine learning model for sales prediction,” Proc. - 2020 Int. Conf. Intell. Comput. Human-Computer Interact. ICHCI 2020, pp. 363–366, 2020, doi: 10.1109/ICHCI51889.2020.00083.

[4] A. Krishna, V. Akhilesh, A. Aich, and C. Hegde, “Sales-forecasting of Retail Stores using Machine Learning Techniques,” Proc. 2018 3rd Int. Conf. Comput. Syst. Inf. Technol. Sustain. Solut. CSITSS 2018, pp. 160–166, 2018, doi: 10.1109/CSITSS.2018.8768765.

[5] R. Saravanan and P. Sujatha, “A State of Art Techniques on Machine Learning Algorithms: A Perspective of Supervised Learning Approaches in Data Classification,” Proc. 2nd Int. Conf. Intell. Comput. Control Syst. ICICCS 2018, no. Iciccs, pp. 945–949, 2019, doi: 10.1109/ICCONS.2018.8663155.

[6] L. Owen, Hyperparameter Tuning with Python. Birmingham: Packt Publishing Ltd, 2022.

[7] A. Van Wyk, Machine Learning with LightGBM and Python. Birmingham: Packt Publishing Ltd, 2023.

[8] G. Behera and N. Nain, “A comparative study of big mart sales prediction,” Commun. Comput. Inf. Sci., vol. 1147 CCIS, no. March, pp. 421–432, 2020, doi: 10.1007/978-981-15-4015-8_37. 53 Program Studi Ilmu Komputer (S2) Universitas Nusa Mandiri

[9] D. Kurniawan, Pengenalan Machine Learning dengan Python. Jakarta: PT Elex Media Komputindo, 2020.

[10] K. Pengetahuan, “Pengertian Prediksi,” 2020. https://www.kanal.web.id/pengertian-prediksi

[11] B. Purnama, Pengantar Machine Learning Konsep dan Praktikum Dengan Contoh Latihan Berbasis R dan Python. Bandung: Informatika Bandung, 2019.

[12] R. Primartha, Algoritma Machine Learning. Bandung: Informatika Bandung, 2021.

[13] I. Daqiqil Id, Machine Learning Teori, Studi Kasus dan Implementasi Menggunakan Python. Pekanbaru: UR PRESS, 2021.

[14] R. R. Pratama, “Analisis Model Machine Learning Terhadap Pengenalan Aktifitas Manusia,” MATRIK J. Manajemen, Tek. Inform. dan Rekayasa Komput., vol. 19, no. 2, pp. 302–311, 2020, doi: 10.30812/matrik.v19i2.688.

[15] I. Ahmad, S. Samsugi, and Y. Irawan, “Implementasi Data Mining Sebagai Pengolahan Data,” J. Teknoinfo, vol. 16, no. 1, p. 46, 2022, [Online]. Available: http://portaldata.org/index.php/portaldata/article/view/107

[16] J. Wira and G. Putra, “Pengenalan Konsep Pembelajaran Mesin dan Deep Learning Edisi 1.4,” vol. 4, no. August, pp. 45–46, 2014, [Online]. Available: https://www.researchgate.net/publication/323700644_Pengenalan_Pembela jaran_Mesin_dan_Deep_Learning

[17] L. Afifah, “Apa itu Regresi, Klasifikasi, dan Clustering (Klasterisasi)?,” 2023. https://ilmudatapy.com/apa-itu-regresi-klasifikasi-dan-clusteringklasterisasi/

[18] M. Chen, Q. Liu, S. Chen, Y. Liu, C. H. Zhang, and R. Liu, “XGBoost-Based Algorithm Interpretation and Application on Post-Fault Transient Stability Status Prediction of Power System,” IEEE Access, vol. 7, pp. 13149–13158, 54 Program Studi Ilmu Komputer (S2) Universitas Nusa Mandiri 2019, doi: 10.1109/ACCESS.2019.2893448.

[19] I. R. Hendrawan and E. Utami, Natural Language Processing. Yogyakarta: ANDI, 2023.

[20] K. Kowsari, K. J. Meimandi, M. Heidarysafa, S. Mendu, L. Barnes, and D. Brown, “Text classification algorithms: A survey,” Inf., vol. 10, no. 4, pp. 1– 68, 2019, doi: 10.3390/info10040150.

[21] B. M. Pavlyshenko, “Machine-learning models for sales time series forecasting,” Data, vol. 4, no. 1, pp. 1–11, 2019, doi: 10.3390/data4010015.

[22] M. A. Pratama, “Perbandingan Performa Algoritma Linear Regresi dan Random Forest untuk Prediksi Harga Bawang Merah di Kota Samarinda,” vol. 1, no. 2, pp. 172–182, 2024, [Online]. Available: https://jurnalistiqomah.org/index.php/tektonik/article/view/468

[23] D. Jollyta, Prihandoko, A. Hajjah, E. Haerani, and M. Siddik, Algortitma Klasifikasi Untuk Pemula Solusi Python dan RapidMiner. Yogyakarta: CV Budi Utama, 2023.

[24] M. K. Pangkasidhi, H. N. Palit, and A. Gunawan, “Analisis Sentimen Mahasiswa di Surabaya Terhadap Pelayanan Vaksinasi COVID-19 Menggunakan Beberapa Classifier,” J. Infra, vol. 10, no. 2, pp. 21–27, 2022.

[25] F. Alzamzami, M. Hoda, and A. El Saddik, “Light Gradient Boosting Machine for General Sentiment Classification on Short Texts: A Comparative Evaluation,” IEEE Access, vol. 8, pp. 101840–101858, 2020, doi: 10.1109/ACCESS.2020.2997330.

[26] S. Shafiee, L. M. Lied, I. Burud, J. A. Dieseth, M. Alsheikh, and M. Lillemo, “Sequential forward selection and support vector regression in comparison to LASSO regression for spring wheat yield prediction based on UAV imagery,” Comput. Electron. Agric., vol. 183, no. 1432, p. 106036, 2021, doi: 10.1016/j.compag.2021.106036.

[27] A. Saifudin, Level Data Dan Algoritma Untuk Penanganan Ketidakseimbangan Kelas. Tangerang Selatan: Pascal Books, 2021. 55 Program Studi Ilmu Komputer (S2) Universitas Nusa Mandiri

[28] P. Lalwani, M. K. Mishra, J. S. Chadha, and P. Sethi, “Customer churn prediction system: a machine learning approach,” Computing, vol. 104, no. 2, pp. 271–294, 2022, doi: 10.1007/s00607-021-00908-y.

[29] I. Werdiningsih, B. Nuqura, and Muhammadun, Data Mining Menggunakan Android, Weka, Dan SPSS. Surabaya: Airlangga University Press, 2020.

[30] M. Sarosa, N. Muna, M. Kusumawardani, A. Suyono, and Y. M. Azis, Pemograman Python Dalam Contoh Dan Penerapan. Malang: Media Nusa Creative, 2022.

[31] R. P. Adi, “Mengenal CatBoost: Algoritma Boosting yang Membuat Machine Learning Lebih Efektif,” 2023. https://medium.com/@rezapurnama1997/mengenal-catboost-algoritmaboosting-yang-membuat-machine-learning-lebih-efektif-5d679bab4966

[32] M. R. Supriadi and R. Andarsyah, Deteksi Halaman Website Phising. Bandung Barat: Buku Pedia, 2023.

[33] G. Gupta, K. L. Gupta, and G. Kansal, “MegaMart Sales Prediction Using Machine Learning Techniques,” Lect. Notes Networks Syst., vol. 421, pp. 437–446, 2023, doi: 10.1007/978-981-19-1142-2_35.

[34] S. Misra, H. Li, and J. He, Machine Learning for Subsurface Characterization. United Kingdom, 2020. [Online]. Available: Elsevier

[35] H. Zahro, “Algoritma K-Nearest Neighbor (K-NN) Regression,” 2019. https://medium.com/@hanifahzhr.hz/algoritma-k-nearest-neighbor-k-nnregression-61684fcc3eb8

[36] C. C. Kurniawan, S. Rostianingsih, and L. W. Santoso, “Penerapan Metode KNN-Regresi dan Multiplicative Decomposition untuk Prediksi Data Penjualan pada Supermarket X,” J. Infra, vol. 10, no. 2, pp. 345–351, 2022.

[37] U. Hidayah and A. Sifaunajah, Cara Mudah Memahami Algoritma K-Nearst Neighbor Studi Kasus: Visual Basic 6.0. Jawa Timur: Lembaga Penelitian 56 Program Studi Ilmu Komputer (S2) Universitas Nusa Mandiri dan Pengabdian Masyarakat, 2019.

[38] N. D. Maulana, B. D. Setiawan, and C. Dewi, “Implementasi Metode Support Vector Regression (SVR) Dalam Peramalan Penjualan Roti (Studi Kasus?: Harum Bakery),” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 3, no. 3, pp. 2986–2995, 2019.

[39] D. A. Rhamadhani, E. Eklezia, and D. Saputri, “Analisa Model Machine Learning dalam Memprediksi Laju Produksi Sumur Migas 15/9-F-14H,” J. Sustain. Energy Dev., vol. 1, no. 1, pp. 48–55, 2023.

[40] S. Khomsah, S. K. Dirjen, P. Riset, D. Pengembangan, R. Dikti, and A. S. Aribowo, “Model Text-Preprocessing Komentar Youtube Dalam Bahasa Indonesia,” Masa Berlaku Mulai, vol. 1, no. 3, pp. 648–654, 2020, [Online]. Available: https://jurnal.iaii.or.id/index.php/RESTI/article/view/2035/274

[41] R. Mulyawan, “Multilayer Perceptron,” 2023. https://rifqimulyawan.com/kamus/multilayer-perceptron/

[42] Z. Munawar et al., Visi Komputer Konsep, Metode, dan Aplikasi. Bandung: Kaizen Media Publishing, 2023. [43] C. Li, “Preprocessing Methods and Pipelines of Data Mining: An Overview,” no. June, pp. 1–7, 2019, [Online]. Available: http://arxiv.org/abs/1906.08510

[44] E. D. Wahyuni, A. A. Arifiyanti, and M. Kustyani, “Exploratory Data Analysis dalam Konteks Klasifikasi Data Mining,” Pros. Nas. Rekayasa Teknol. Ind. dan Inf. XIV Tahun 2019, vol. 2019, no. November, pp. 263– 269, 2019, [Online]. Available: http://journal.itny.ac.id/index.php/ReTII

[45] S. Gracia, J. Luengo, and F. Herrera, Data Preprocessing in Data Mining. Granada: Springer, 2014.

[46] O. Alghushairy, R. Alsini, T. Soule, and X. Ma, “A review of local outlier factor algorithms for outlier detection in big data streams,” Big Data Cogn. Comput., vol. 5, no. 1, pp. 1–24, 2021, doi: 10.3390/bdcc5010001.

[47] S. Setiawan, “Mendeteksi Univariate Outliers dengan Metode IQR 57 Program Studi Ilmu Komputer (S2) Universitas Nusa Mandiri (Python),” 2020. https://stevkarta.medium.com/mendeteksi-univariateoutliers-dengan-metode-iqr-python-3adfad87de82

[48] Y. Wang, “A XGBOOST RISK MODEL VIA FEATURE SELECTION AND BAYESIAN HYPER-PARAMETER OPTIMIZATION,” vol. 11, no. 1, pp. 1–17, 2019.

[49] S. Chakrabarti, “Optimize your optimizations using Optuna,” 2023. https://www.analyticsvidhya.com/blog/2021/09/optimize-youroptimizations-using-optuna/

[50] J. Al Amien, Yoze Rizki, and Mukhlis Ali Rahman Nasution, “Implementasi Adasyn Untuk Imbalance Data Pada Dataset UNSW-NB15 Adasyn Implementation For Data Imbalance on UNSW-NB15 Dataset,” J. CoSciTech (Computer Sci. Inf. Technol., vol. 3, no. 3, pp. 242–248, 2022, doi: 10.37859/coscitech.v3i3.4339.

[51] I. Muslim, K. Karo, F. Informatika, and U. Telkom, “Implementasi Metode XGBoost dan Feature Importance untuk Klasifikasi pada Kebakaran Hutan dan Lahan,” vol. 1, no. 1, pp. 11–18, 2020.

[52] F. Haselbeck, J. Killinger, K. Menrad, T. Hannus, and D. G. Grimm, “Machine Learning Outperforms Classical Forecasting on Horticultural Sales Predictions,” Mach. Learn. with Appl., vol. 7, no. October 2021, p. 100239, 2022, doi: 10.1016/j.mlwa.2021.100239.

[53] V. Siahaan and R. H. Sianipar, Brain Tumor Analysis, Classification, And Detection Using Machine Learning And Deep Learning With Python GUI. Sumatera: Balige, 2023.

[54] A. Narkhede, M. Awari, S. Gawali, and AmrapalMhaisgawali, “BigMart Sales Prediction Using Machine Learning Techniques,” vol. 3, no. 4.

[55] V. Chitre, “Big Mart Sales Analysis,” Int. J. Innov. Technol. Explor. Eng., vol. 11, no. 5, pp. 8–11, 2022, doi: 10.35940/ijitee.c9833.0411522.

[56] N. R, C. G, M. T, N. K. S, and S. M, “Predictive Analysis for Big Mart Sales using Machine Learning Algorithms,” Int. J. Eng. Res. Technol., vol. 10, no. 58 Program Studi Ilmu Komputer (S2) Universitas Nusa Mandiri 12, 2022.

[57] P. Bajaj, R. Ray, S. Shedge, S. Vidhate, and N. Shardoor, “SALES PREDICTION USING MACHINE LEARNING ALGORITHMS,” AIP Conf. Proc., vol. 2444, no. June, pp. 3619–3625, 2022, doi: 10.1063/5.0078390.

[58] R. F. Ali, A. Muneer, A. Almaghthawi, A. Alghamdi, S. M. Fati, and E. A. A. Ghaleb, “BMSP-ML: big mart sales prediction using different machine learning techniques,” IAES Int. J. Artif. Intell., vol. 12, no. 2, pp. 874–883, 2023, doi: 10.11591/ijai.v12.i2.pp874-883.

[59] S. Suganya, S. Santhoshkumar, G. Saravanakumar, J. S. Paul, and J. V. Bharathi, “PREDICTION SYSTEM FOR BIGMART SALES USING MACHINE LEARNING,” Ind. Eng. J., no. 5, pp. 427–432, 2023.

[60] G. Behera and N. Nain, “Grid search optimization (GSO) based future sales prediction for big mart,” Proc. - 15th Int. Conf. Signal Image Technol. Internet Based Syst. SISITS 2019, pp. 172–178, 2019, doi: 10.1109/SITIS.2019.00038.

[61] M. saad bin Ilyas, A. Ikram, M. A. Butt, and I. Tariq, “Comparative Analysis of Regression Algorithms used to Predict the Sales of Big Marts,” J. Innov. Comput. Emerg. Technol., vol. 3, no. 1, 2023, doi: 10.56536/jicet.v3i1.53.

[62] S. R Vinayaga and R. Naveenraj, “Prediction of Big Mart Sales Using Machine Learning,” Int. Res. J. Mod. Eng. Technol. Sci. www.irjmets.com @International Res. J. Mod. Eng., no. 09, pp. 2582–5208, 2021, [Online]. Available: www.irjmets.com

[63] M. Manwal, “Implementation of Machine Learning Techniques for Big Mart Sales Forecast Analysis,” Turkish J. Comput. Math. Educ., vol. 10, no. 1, pp. 631–637, 2019, doi: 10.17762/turcomat.v10i1.13559.

[64] D. M. U. Ashraf, “A Predictive Analysis of Retail Sales Forecasting using Machine Learning Techniques,” Lahore Garrison Univ. Res. J. Comput. Sci. Inf. Technol., vol. 6, no. 04, pp. 23–33, 2022, doi: 59 Program Studi Ilmu Komputer (S2) Universitas Nusa Mandiri 10.54692/lgurjcsit.2022.0604399.

[65] D. Swami, A. D. Shah, and S. K. B. Ray, “Predicting Future Sales of Retail Products using Machine Learning,” pp. 1–6, 2020, [Online]. Available: http://arxiv.org/abs/2008.07779

Detail Informasi

Tesis ini ditulis oleh :

  • Nama : SUGIYANTI
  • NIM : 14210253
  • Prodi : Ilmu Komputer
  • Kampus : Margonda
  • Tahun : 2023
  • Periode : II
  • Pembimbing : Dr. Muhammad Haris, S.Kom., M.Eng
  • Asisten :
  • Kode : 0048.S2.IK.TESIS.II.2023
  • Diinput oleh : NZH
  • Terakhir update : 09 Juli 2024
  • Dilihat : 120 kali

TENTANG PERPUSTAKAAN


PERPUSTAKAAN UNIVERSITAS NUSA MANDIRI


E-Library Perpustakaan Universitas Nusa Mandiri merupakan platform digital yang menyedikan akses informasi di lingkungan kampus Universitas Nusa Mandiri seperti akses koleksi buku, jurnal, e-book dan sebagainya.


INFORMASI


Alamat : Jln. Jatiwaringin Raya No.02 RT08 RW 013 Kelurahan Cipinang Melayu Kecamatan Makassar Jakarta Timur

Email : perpustakaan@nusamandiri.ac.id

Jam Operasional
Senin - Jumat : 08.00 s/d 20.00 WIB
Isitirahat Siang : 12.00 s/d 13.00 WIB
Istirahat Sore : 18.00 s/d 19.00 WIB

Perpustakaan Universitas Nusa Mandiri @ 2020