Peningkatan Performa Decision Tree dengan AdaBoost untuk Klasifikasi Kekurangtransparanan Informasi Anti-Korupsi

Authors

  • Zico Karya Saputra Domas Politeknik Keuangan Negara STAN
  • Roby Rakhmadi Jurusan Hubungan Internasional Universitas Lampung

DOI:

https://doi.org/10.15408/aism.v5i2.24887

Keywords:

Anti-korupsi, Transparansi, Data mining, Klasifikasi, Decision tree, Adaboost

Abstract

Di era big data saat ini, peran teknik data mining sangatlah dibutuhkan terkait kebutuhan pengambilan keputusan yang akurat. Algoritma decision tree telah lazim diterapkan untuk menemukan pola klasifikasi karena mudah diinterpretasikan namun harus senantiasa dievaluasi tingkat performanya. Adaboost merupakan salah satu metode untuk meningkatkan performa algoritma decision tree. Eksperimen dilakukan pada 141 sampel perusahaan yang melantai di Bursa Efek Indonesia sektor konstruksi-infrastruktur, pertambangan-perminyakan, dan sektor perbankan pada periode 2019, dengan menerapkan teknik adaboost pada decision tree dengan parameter maximum depth dan confidence yang diuji dalam enam skenario berbeda berdasarkan informasi anti-korupsi pada pengungkapan laporan tahunan perusahaan. Hasil ekperimen decision tree untuk akurasi sebesar 69,5%, AUC-optimistis 0,826, dan AUC 0,756, sedangkan rerata hasil dari enam skenario decision tree versi  adaBoost untuk akurasi sebesar 71,16%, AUC-optimistis 0,8905, dan AUC 0,744, sehingga dapat disimpulkan bahwa pengklasifikasian atas prediksi klasifikasi dengan metode adaBoost layak diterapkan sebagai upaya alternatif untuk meningkatkan tingkat performa yang lebih baik.

 

Downloads

Download data is not yet available.

References

A. Bisri and R. S. Wahono, “Penerapan AdaBoost untuk Penyelesaian Ketidakseimbangan Kelas pada Penentuan Kelulusan Mahasiswa dengan Metode Decision Tree,” J. Intell. Syst., vol. 1, no. 1, pp. 27-32, Feb. 2015. [Online]. Available: http://www.journal.ilmukomputer.org/index.php?journal=jis&page=article&op=view&path%5B%5D=29

D. A. Cieslak, T. R. Hoens, N. V. Chawla, and W. P. Kegelmeyer, “Hellinger distance decision trees are robust and skew-insensitive,” Data Min Knowl Disc, vol. 24, pp. 136–158, 2011, doi: 10.1007/s10618-011-0222-1.

Y. Sun, M. S. Kamel, A. K. C. Wong, and Y. Wang, “Cost-sensitive boosting for classification of imbalanced data,” ScienceDirect, vol. 40, no. 12, pp. 3358-3378, Dec. 2007.

F. D. Astuti and F. N. Lenti, “Implementasi SMOTE untuk mengatasi Imbalance Class pada Klasifikasi Car Evolution menggunakan K-NN,” JUPITER (Jurnal Penelit. Ilmu dan Teknol. Komputer), vol. 13, pp. 89–98, 2021.

A. N. Kasanah, Muladi, and U. Pujianto, “Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN,” RESTI, vol. 3, no. 2, pp. 196–201, 2019.

R. Siringoringo, “Klasifikasi Data Tidak Seimbang Menggunakan Algoritma SMOTE dan k-Nearest Neighbor,” J. ISD, vol. 3, no. 1, pp. 44-49, Jan-Jun 2018.

Y. Pristyanto, “Penerapan Metode Ensemble Untuk Meningkatkan Kinerja Algoritme Klasifikasi Pada Imbalanced Dataset,” J. Teknoinfo, vol. 13, no. 1, pp. 11-16, 2019, doi: 10.33365/jti.v13i1.184.

J. Van Hulse and T. Khoshgoftaar, “Knowledge discovery from imbalanced and noisy data,” Data Knowl. Eng., vol. 68, no. 12, pp. 1513–1542, Dec. 2009, doi: 10.1016/J.DATAK.2009.08.005.

C. Drummond and R. C. Holte, “C4.5, Class Imbalance, and Cost Sensitivity: Why Under-Sampling beats Over-Sampling.,” Phys. Rev. Lett., vol. 91, no. 3, 2003.

A. Saifudin and R. S. Wahono, “Pendekatan Level Data untuk Menangani Ketidakseimbangan Kelas pada Prediksi Cacat Software,” J. Softw. Eng., vol. 1, no. 2, 2015.

S. Kotsiantis, D. Kanellopoulos, and P. Pintelas, “Handling imbalanced datasets: A review,” GESTS Int. Trans. Comput. Sci. Eng., vol. 30, 2006.

S. Kotsiantis and P. E. Pintelas, “Selective costing ensemble for handling imbalanced data sets,” Int. J. Hybrid Intell. Syst., vol. 6, no. 3, pp. 123–133, 2009, doi: 10.3233/HIS-2009-0084.

A. Rohman, V. Suhartono, and C. Supriyanto, “Penerapan Agoritma C4.5 Berbasis AdaBoost Untuk Prediksi Penyakit Jantung,” J. Teknol. Inf., vol. 13, no. 1, pp. 13-19, Jan. 2017.

A. Nurzahputra and M. A. Muslim, “Peningkatan Akurasi Pada Algoritma C4.5 Menggunakan AdaBoost Untuk Meminimalkan Resiko Kredit,” in Proc. SNATIF ke-4, 2017. [Online]. https://media.neliti.com/media/publications/173704-ID-none.pdf

Transparency International Indonesia, “Transparency in Corporate Reporting.” Ti.or.id. https://ti.or.id/transparency-in-corporate reporting/ (accessed Apr. 17, 2022).

E. Pradana, “Analisis Penerapan Adaptive Boosting (AdaBoost) Dalam Meningkatkan Performasi Algoritma C4.5,” Skripsi, Prodi Teknik Informatika, STT Pelita Bangsa, Bekasi, 2018.

C. Wirawan, “Teknik Data Mining Menggunakan Algoritma Decision Tree C4.5 untuk Memprediksi Tingkat Kelulusan Tepat Waktu,” Appl. Inf. Syst. Manag., vol. 3, no. 1, pp. 47–52, 2020, doi: 10.15408/aism.v3i1.13033.

S. Sumanto, L. S. Marita, L. Mazia, and T. W. Ratnasari, “Analisis Kelayakan Kredit Rumah Menggunakan Metode Naïve Bayes untuk Mengurangi Kredit Macet,” Appl. Inf. Syst. Manag., vol. 4, no. 1, pp. 17–22, 2021, doi: 10.15408/aism.v4i1.20274.

K. B. Soni; M. Chopade; and R. Vaghela, “Credit Card Fraud Detection Using Machine Learning Approach,” Appl. Inf. Syst. Manage., vol. 4, no. 2, pp. 71–76, 2021.

D. Thammasiri, D. Delen, P. Meesad, and N. Kasap, “A critical assessment of imbalanced class distribution problem: The case of predicting freshmen student attrition,” Expert Syst. Appl., vol. 41, no. 2, pp. 321–330, 2014.

Y. H. Agustin, Kusrini, and E. T. Luthfi, “Klasifikasi Penerimaan Mahasiswa Baru Menggunakan Algortima C4.5 dan AdabBoost (Studi Kasus : STMIK XYZ),” CSRID (Computer Sci. Res. Its Dev.) Journal, vol. 9, no. 1, pp. 1-11, Feb. 2017, doi: 10.22303/csrid.9.1.2017.1-11.

L. Eka and M. Much Aziz, “Penerapan Adaboost untuk Klasifikasi Support Vector Machine Guna Meningkatkan Akurasi pada Diagnosa Chronic Kidney Disease,” presented at the Seminar Nasional Teknologi dan Informatika, Indonesia, Juli 2017.

S. Mulyati, Yulianti, and A. Saifudin, “Ketidakseimbangan kelas berbasis naϊve bayes pada prediksi,” J. Inform. Univ. PAMULANG, vol. 2, no. 4, 2017.

P. A. Jusia, “Analisis Komparasi Pemodelan Algoritma Decision Tree Menggunakan Metode Particle Swarm Optimization Dan Metode Adaboost Untuk Prediksi Awal Penyakit Jantung,” in Seminar Nasional Sistem Informasi (SENASIF), pp. 1048–1056, 2018.

M. S. Mauludin, and L. Hermawanti, “Merger C4.5 Algorithm and Adaboost for Determining the Department Ipa Students Graduation in Sma Islam Sultan Fatah Wedung Demak,” in Proc. the 2nd International Seminar and Conference on Global Issues (ISCoGI), European and Asian in the Age of Globalization: Cooperation and Challenge, Nov. 25-26, 2016. [Online]. Available: https://publikasiilmiah.unwahas.ac.id/index.php/ISC/article/view/1664/1739

F. Gorunescu, Data Mining: Concepts, Models, and Techniques, 12th ed. Springer, 2011.

J. Perols, “Financial Statement Fraud Detection: An Analysis of Statistical and Machine Learning Algorithms,” Audit. A J. Pract. Theory, vol. 30, no. 2, pp. 19-50, 2011. [Online]. Available: https://ssrn.com/abstract=2206572.

Downloads

Published

2022-09-17

How to Cite

Peningkatan Performa Decision Tree dengan AdaBoost untuk Klasifikasi Kekurangtransparanan Informasi Anti-Korupsi. (2022). Applied Information System and Management (AISM), 5(2), 75-82. https://doi.org/10.15408/aism.v5i2.24887