Peningkatan Performa Decision Tree dengan AdaBoost untuk Klasifikasi Kekurangtransparanan Informasi Anti-Korupsi
Abstract
Di era big data saat ini, peran teknik data mining sangatlah dibutuhkan terkait kebutuhan pengambilan keputusan yang akurat. Algoritma decision tree telah lazim diterapkan untuk menemukan pola klasifikasi karena mudah diinterpretasikan namun harus senantiasa dievaluasi tingkat performanya. Adaboost merupakan salah satu metode untuk meningkatkan performa algoritma decision tree. Eksperimen dilakukan pada 141 sampel perusahaan yang melantai di Bursa Efek Indonesia sektor konstruksi-infrastruktur, pertambangan-perminyakan, dan sektor perbankan pada periode 2019, dengan menerapkan teknik adaboost pada decision tree dengan parameter maximum depth dan confidence yang diuji dalam enam skenario berbeda berdasarkan informasi anti-korupsi pada pengungkapan laporan tahunan perusahaan. Hasil ekperimen decision tree untuk akurasi sebesar 69,5%, AUC-optimistis 0,826, dan AUC 0,756, sedangkan rerata hasil dari enam skenario decision tree versi adaBoost untuk akurasi sebesar 71,16%, AUC-optimistis 0,8905, dan AUC 0,744, sehingga dapat disimpulkan bahwa pengklasifikasian atas prediksi klasifikasi dengan metode adaBoost layak diterapkan sebagai upaya alternatif untuk meningkatkan tingkat performa yang lebih baik.
Keywords
Full Text:
PDFReferences
A. Bisri and R. S. Wahono, “Penerapan AdaBoost untuk Penyelesaian Ketidakseimbangan Kelas pada Penentuan Kelulusan Mahasiswa dengan Metode Decision Tree,” J. Intell. Syst., vol. 1, no. 1, pp. 27-32, Feb. 2015. [Online]. Available: http://www.journal.ilmukomputer.org/index.php?journal=jis&page=article&op=view&path%5B%5D=29
D. A. Cieslak, T. R. Hoens, N. V. Chawla, and W. P. Kegelmeyer, “Hellinger distance decision trees are robust and skew-insensitive,” Data Min Knowl Disc, vol. 24, pp. 136–158, 2011, doi: 10.1007/s10618-011-0222-1.
Y. Sun, M. S. Kamel, A. K. C. Wong, and Y. Wang, “Cost-sensitive boosting for classification of imbalanced data,” ScienceDirect, vol. 40, no. 12, pp. 3358-3378, Dec. 2007.
F. D. Astuti and F. N. Lenti, “Implementasi SMOTE untuk mengatasi Imbalance Class pada Klasifikasi Car Evolution menggunakan K-NN,” JUPITER (Jurnal Penelit. Ilmu dan Teknol. Komputer), vol. 13, pp. 89–98, 2021.
A. N. Kasanah, Muladi, and U. Pujianto, “Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN,” RESTI, vol. 3, no. 2, pp. 196–201, 2019.
R. Siringoringo, “Klasifikasi Data Tidak Seimbang Menggunakan Algoritma SMOTE dan k-Nearest Neighbor,” J. ISD, vol. 3, no. 1, pp. 44-49, Jan-Jun 2018.
Y. Pristyanto, “Penerapan Metode Ensemble Untuk Meningkatkan Kinerja Algoritme Klasifikasi Pada Imbalanced Dataset,” J. Teknoinfo, vol. 13, no. 1, pp. 11-16, 2019, doi: 10.33365/jti.v13i1.184.
J. Van Hulse and T. Khoshgoftaar, “Knowledge discovery from imbalanced and noisy data,” Data Knowl. Eng., vol. 68, no. 12, pp. 1513–1542, Dec. 2009, doi: 10.1016/J.DATAK.2009.08.005.
C. Drummond and R. C. Holte, “C4.5, Class Imbalance, and Cost Sensitivity: Why Under-Sampling beats Over-Sampling.,” Phys. Rev. Lett., vol. 91, no. 3, 2003.
A. Saifudin and R. S. Wahono, “Pendekatan Level Data untuk Menangani Ketidakseimbangan Kelas pada Prediksi Cacat Software,” J. Softw. Eng., vol. 1, no. 2, 2015.
S. Kotsiantis, D. Kanellopoulos, and P. Pintelas, “Handling imbalanced datasets: A review,” GESTS Int. Trans. Comput. Sci. Eng., vol. 30, 2006.
S. Kotsiantis and P. E. Pintelas, “Selective costing ensemble for handling imbalanced data sets,” Int. J. Hybrid Intell. Syst., vol. 6, no. 3, pp. 123–133, 2009, doi: 10.3233/HIS-2009-0084.
A. Rohman, V. Suhartono, and C. Supriyanto, “Penerapan Agoritma C4.5 Berbasis AdaBoost Untuk Prediksi Penyakit Jantung,” J. Teknol. Inf., vol. 13, no. 1, pp. 13-19, Jan. 2017.
A. Nurzahputra and M. A. Muslim, “Peningkatan Akurasi Pada Algoritma C4.5 Menggunakan AdaBoost Untuk Meminimalkan Resiko Kredit,” in Proc. SNATIF ke-4, 2017. [Online]. https://media.neliti.com/media/publications/173704-ID-none.pdf
Transparency International Indonesia, “Transparency in Corporate Reporting.” Ti.or.id. https://ti.or.id/transparency-in-corporate reporting/ (accessed Apr. 17, 2022).
E. Pradana, “Analisis Penerapan Adaptive Boosting (AdaBoost) Dalam Meningkatkan Performasi Algoritma C4.5,” Skripsi, Prodi Teknik Informatika, STT Pelita Bangsa, Bekasi, 2018.
C. Wirawan, “Teknik Data Mining Menggunakan Algoritma Decision Tree C4.5 untuk Memprediksi Tingkat Kelulusan Tepat Waktu,” Appl. Inf. Syst. Manag., vol. 3, no. 1, pp. 47–52, 2020, doi: 10.15408/aism.v3i1.13033.
S. Sumanto, L. S. Marita, L. Mazia, and T. W. Ratnasari, “Analisis Kelayakan Kredit Rumah Menggunakan Metode Naïve Bayes untuk Mengurangi Kredit Macet,” Appl. Inf. Syst. Manag., vol. 4, no. 1, pp. 17–22, 2021, doi: 10.15408/aism.v4i1.20274.
K. B. Soni; M. Chopade; and R. Vaghela, “Credit Card Fraud Detection Using Machine Learning Approach,” Appl. Inf. Syst. Manage., vol. 4, no. 2, pp. 71–76, 2021.
D. Thammasiri, D. Delen, P. Meesad, and N. Kasap, “A critical assessment of imbalanced class distribution problem: The case of predicting freshmen student attrition,” Expert Syst. Appl., vol. 41, no. 2, pp. 321–330, 2014.
Y. H. Agustin, Kusrini, and E. T. Luthfi, “Klasifikasi Penerimaan Mahasiswa Baru Menggunakan Algortima C4.5 dan AdabBoost (Studi Kasus : STMIK XYZ),” CSRID (Computer Sci. Res. Its Dev.) Journal, vol. 9, no. 1, pp. 1-11, Feb. 2017, doi: 10.22303/csrid.9.1.2017.1-11.
L. Eka and M. Much Aziz, “Penerapan Adaboost untuk Klasifikasi Support Vector Machine Guna Meningkatkan Akurasi pada Diagnosa Chronic Kidney Disease,” presented at the Seminar Nasional Teknologi dan Informatika, Indonesia, Juli 2017.
S. Mulyati, Yulianti, and A. Saifudin, “Ketidakseimbangan kelas berbasis naϊve bayes pada prediksi,” J. Inform. Univ. PAMULANG, vol. 2, no. 4, 2017.
P. A. Jusia, “Analisis Komparasi Pemodelan Algoritma Decision Tree Menggunakan Metode Particle Swarm Optimization Dan Metode Adaboost Untuk Prediksi Awal Penyakit Jantung,” in Seminar Nasional Sistem Informasi (SENASIF), pp. 1048–1056, 2018.
M. S. Mauludin, and L. Hermawanti, “Merger C4.5 Algorithm and Adaboost for Determining the Department Ipa Students Graduation in Sma Islam Sultan Fatah Wedung Demak,” in Proc. the 2nd International Seminar and Conference on Global Issues (ISCoGI), European and Asian in the Age of Globalization: Cooperation and Challenge, Nov. 25-26, 2016. [Online]. Available: https://publikasiilmiah.unwahas.ac.id/index.php/ISC/article/view/1664/1739
F. Gorunescu, Data Mining: Concepts, Models, and Techniques, 12th ed. Springer, 2011.
J. Perols, “Financial Statement Fraud Detection: An Analysis of Statistical and Machine Learning Algorithms,” Audit. A J. Pract. Theory, vol. 30, no. 2, pp. 19-50, 2011. [Online]. Available: https://ssrn.com/abstract=2206572.
DOI: https://doi.org/10.15408/aism.v5i2.24887 Abstract - 0 PDF - 0
Refbacks
- There are currently no refbacks.
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
EDITORIAL ADDRESS:
Department of Information Systems, Faculty of Science and Technology,
Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta
Faculty of Science and Technology Building, 3rd Floor, 1st Campus, Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta
Jl. Ir. H. Juanda No. 95, Ciputat Timur, Kota Tangerang Selatan, Banten 15412, Indonesia.
Tlp/Fax: +622174019 25/+62217493315.
E-mail: aism.journal@apps.uinjkt.ac.id, Website: https://journal.uinjkt.ac.id/index.php/aism
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Applied Information System and Management (AISM) | E-ISSN: 2621-254 | P-ISSN: 2621-2536
https://journal.uinjkt.ac.id/index.php/aism