PENERAPAN METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) DAN COSINE SIMILARITY PADA SISTEM TEMU KEMBALI INFORMASI UNTUK MENGETAHUI SYARAH HADITS BERBASIS WEB (STUDI KASUS: HADITS SHAHIH BUKHARI-MUSLIM)

Victor Amrizal

Abstract


ABSTRAK

Hadits merupakan sumber ajaran Islam disamping Al-Qur’an. Tanpa hadits, syari’at Islam tidak dapat dimengerti secara utuh dan tidak dapat dilaksanakan. Namun dewasa ini, tidak sedikit orang yang keliru dalam memahaminya, hal tersebut disebabkan oleh banyaknya orang yang memahami hadits sebatas mengandalkan teks lahiriyah saja. Salah satu hal yang dapat kita tempuh untuk mengetahui makna yang terkandung dalam hadits adalah dengan mempelajari syarah hadits guna meminimalisir kesalahan penafsiran terhadap suatu hadits. Sejauh ini aplikasi syarah hadits yang ada masih terbatas, yaitu dalam bahasa full arab yang tidak semua orang dapat memahaminya. Sedangkan untuk bahasa indonesia hanya ada lidwa dan arbain, namun masih sangat luas jangkauannya. Oleh karena itu, diperlukan suatu sistem untuk solusi permasalahan tersebut, yaitu  Sistem Temu Kembali Informasi yang dapat dimanfaatkan karena memberikan alternatif berupa metode similarity yang dapat digunakan untuk melakukan pencarian dokumen relevan dengan yang kita inginkan. Metode similiarity yang digunakan adalah cosine similarity dengan pembobotan kata menggunakan metode TFIDF dan menerapkan teks preprocessing terlebih dahulu untuk memperkecil term sehingga bisa mempercepat proses perhitungan term. Teks preprocessing tersebut meliputi tokenizing, stopword removal atau filtering, dan stemming. Hasil uji coba dengan pengujian confusion matrix didapatkan: recall 88.7%, precision 100%, accuracy 88,73 %, dan error rate 11,27 %.

 

ABSTRACT

Hadith is a source of Islamic teachings besides the Qur'an. Without using the hadith, the syari'at of Islam can not be fully understood and can not be implemented. But today, many people are mistaken in understanding it, it is caused by the many people who understand the hadith to rely on text lahiriyah only. One of the things that we can take to know the meaning contained in the hadith is to study syarah hadith in order to minimize misinterpretation of a hadith. So far the application of syarh hadith is still limited. Because so far the existing applications are still full Arab language that not everyone can understand it.. As for the Indonesian language there are only lidwa and arbain, but still very wide reach. Therefore, we need a system for the solution of the problem, that is Information Retrieval System which can be utilized because it provides an alternative in the form of similarity method that can be used to search documents relevant to what we want. The similiarity method used is cosine similarity with word weighting using TFIDF method and applying preprocessing text first to minimize term so that it can speed up the term calculation process. The preprocessing text includes tokenizing, stopword removal or filtering, and stemming. The results of testing with confusion matrix test obtained: 88.7% recall, precision 100%, accuracy 88.73%, and error rate 11.27%.

 


Keywords


syarah, hadith, cosine similarity, tf-idf

Full Text:

PDF

References


Zuhri, Muhammad. 2011. Hadis Nabi Telaah Historis dan Metodologis. Yogyakarta: Tiara Wacana Yogya.

Rosyid, Khoirul. 2016. Kepemimpinan Menurut Hadits Nabi Saw. Skripsi. Jurusan Tafsir Hadits. Fakultas Ushuluddin. Institut Agama Islam Negeri (IAIN) Raden Intan Lampung.

Mukaromah, Kholila. 2015. Kajian Syarah Hadits Subul Al-Salam. Tesis. Jurusan Studi Agama dan Filsafat. Fakultas Humaniora. Universitas Islam Negeri Sunan Kalijaga. Yogyakarta.

Katsir, Ibnu. 2013. Tafsirul ‘Allam Syarh ‘Umdatul Ahkam. Jakarta: Ummul-Qura.

Rizki, Dhidik, dan Eko Supraptono. 2017. Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen. Skripsi. Jurusan Teknik Elektro. Fakultas Teknik. Universitas Negeri Semarang Kampus Sekaran, Gunungpati, Semarang.

Ma’arif, Abdul Aziz. 2015. Penerapan Algoritma Tf-Idf Untuk Pencarian Karya Ilmiah. Jurnal. Jurusan Teknik Informatika. Fakultas Ilmu Komputer. Universitas Dian Nuswantoro Semarang.

Rozas, I. R. dan Sarno, R. 2011. Sistem Pemilihan Kontrol Keamanan Informasi Berbasis ISO 27001. Seminar Nasional Pascasarjana XI. IT. Surabaya.

Mukaromah, Kholila. 2015. Kajian Syarah Hadits Subul Al-Salam. Tesis. Jurusan Studi Agama dan Filsafat. Fakultas Humaniora. Universitas Islam Negeri Sunan Kalijaga. Yogyakarta.

Katsir, Ibnu. 2013. Tafsirul ‘Allam Syarh ‘Umdatul Ahkam. Jakarta: Ummul-Qura.

Feldman, Ronen, dan Sanger, James. 2007. The Text Mining Handbook Advanced Approaches in Analyzing Unstructured Data. New York: Cambridge University Press.

Safitri, Rima Noer. 2013. Temu Kembali Informasi Pada Pencarian Jurnal Skripsi Menggunakan Metode Single Pass Clustering. Skripsi. Universitas Muhammadiyah Gresik.

Feldman, Ronen, dan Sanger, James. 2007. The Text Mining Handbook Advanced Approaches in Analyzing Unstructured Data. New York: Cambridge University Press.

Rizki, Dhidik, dan Eko Supraptono. 2017. Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen. Skripsi. Jurusan Teknik Elektro. Fakultas Teknik. Universitas Negeri Semarang Kampus Sekaran, Gunungpati, Semarang.

Arwanda, Ivan. 2013. Penerapan Metode Text Mining pada Aplikasi Chatbot. Skripsi. Jurusan Teknik Informatika Universitas Ilmu Komputer. Bandung.

Simorangkir, Manase Sahat. 2017. Studi Perbandingan Algoritma-Algoritma Stemming Untuk Dokumen Teks Bahasa Indonesia. Jurnal. Teknik Informatika. Universitas Presiden Jababeka Education.

Ma’arif, Abdul Aziz. 2015. Penerapan Algoritma Tf-Idf Untuk Pencarian Karya Ilmiah. Jurnal. Jurusan Teknik Informatika. Fakultas Ilmu Komputer. Universitas Dian Nuswantoro Semarang.

Putra, Agung Auliaguntary Arif. 2016. Implementasi Text Summarization Menggunakan Metode Vector Space Model pada Artikel Berita Bahasa Indonesia. Skripsi. Jurusan Teknik Informatika. Fakultas Teknik dan Ilmu Komputer. Universitas Komputer Indonesia.

Dewa, Arie, dan Agustinus. 2016. Pengukuran Kemiripan Dokumen Teks Bahasa Indonesia Menggunakan Metode Cosine Similarity. Jurnal. Teknik Informatika Universitas Sam Ratulangi Manado.

Rozas, I. R. dan Sarno, R. 2011. Sistem Pemilihan Kontrol Keamanan Informasi Berbasis ISO 27001. Seminar Nasional Pascasarjana XI. IT. Surabaya.

Ferdinandus, Subari. 2015. Sistem Information Retrieval Layanan Kesehatan Untuk Berobat dengan Metode Vector Space Model berbasis WebGis. Jurnal. Teknik Informatika. STIKI Malang.




DOI: https://doi.org/10.15408/jti.v11i2.8623

Refbacks

  • There are currently no refbacks.


Copyright (c) 2018 Prodi Teknik Informatika Universitas Islam Negeri Syarif Hidayatullah Jakarta

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Lantai 3, Prodi Teknik Informatika, UIN Syarif Hidayatullah Jakarta
Jl. Ir. H. Juanda No.95, Cempaka Putih, Ciputat Timur. 
Kota Tangerang Selatan, Banten 15412
Tlp/Fax: +62 21 74019 25/ +62 749 3315
Handphone: +6281371798903
E-mail: jurnal-ti@uinjkt.ac.id