MEREVIEW PENELITIAN MENGGUNAKAN METODE DATA MINING DENGAN ALGORITMA J48


 Hello peeps!!

Pada kesempatan kali ini aku bakalan me-review hasil dari penelitian seseorang dan kemudian akan aku review. Ini merupakan salah satu tugas kuliah aku yatu mata kuliah Konsep Data Mining. Langsung aja yuk baca review-nya! 


Judul Penelitian : DATA MINING UNTUK MEMPREDIKSI PRESTASI SISWA  TINGKAT X SMK NEGERI 4 SURAKARTA BERDASARKAN SOSIAL EKONOMI, MOTIVASI, KEDISIPLINAN DAN PRESTASI MASA LALU

 

HASIL PENELITIAN DAN PEMBAHASAN

Hasil penelitian berdasarkan tahapan-tahapan proses dalam KDD (Knowledge Data Discovery) sebagai berikut:

(1) Data Selection, tahapan ini dilakukan untuk memilih data yang sesuai dengan variabel yang dibutuhkan dalam penelitian. Caranya adalah dengan memilih atau menentukan atribut-atribut data mana yang akan digunakan dalam penelitian dari sekelompok data operasional yang ada. Salah satunya adalah menentukan atribut-atribut untuk variabel Sosial Ekonomi Orang Tua yang diambil dari data operasional yaitu Data Pribadi Siswa yang ada di BP/BK sekolah;

(2) Preprocessing/Cleaning, proses cleaning tersebut dilakukan terhadap keseluruhan data yang diteliti yang berjumlah 416 siswa. Setelah dilakukan proses cleaning data sejumlah 416, dihasilkan data bersih sebanyak 346 record data yang digunakan untuk proses analisis berikutnya;

(3) Transformation, tahap ini menghasilkan satu recordset data yang siap untuk analisis data; (4) Analisis data.

            Analisis data yang pertama adalah dengan menggunakan teknik decision tree algoritma J48. Software yang digunakan adalah WEKA 3.6.9. Hasil yang diperoleh adalah tingkat akurasi prediksi sebesar 95,7%.

            Analisis yang kedua menggunakan CHAID (Chi Squared Automatic Interaction Detection). Analisis ini menggunakan software SPSS 16.0. Hasil yang diperoleh adalah tingkat akurasi prediksi sebesar 82,1%.

            Analisis yang ketiga menggunakan regresi ganda. Analisis ini menggunakan software SPSS 16.0. Hasil yang diperoleh adalah tingkat signifikansi seluruh variabel independen terhadap variabel dependen sebesar 90,6%.

Soal :

1.  Menjelaskan data yang digunakan: type data, atribut, type atribut masing-masing, dimensi.

2.   Menjelaskan preprocessing yang digunakan

3.   Menjelaskan task mining  yang dilakukan

4.   Menjelaskan hasil yang diperoleh

5.   Menjelaskan tools yang digunakan

6.   Menjelaskan peran yang digunakan dalam penelitian ini


Perbandingan Hasil Akurasi Prediksi antara Metode J48, CHAID dan Regresi Ganda             Perbandingan akurasi klasifikasi antara metode J48, CHAID dan regresi ganda untuk class nilai UTS sebagai target adalah sebagai berikut:

            Tingkat akurasi atau signifikansi variabel prediktor terhadap prestasi belajar siswa dengan menggunakan metode J48 sebesar 95,7%. Tingkat akurasi atau signifikansi variabel prediktor terhadap prestasi belajar siswa dengan menggunakan metode CHAID sebesar 82,1%. Tingkat akurasi atau signifikansi variabel prediktor terhadap prestasi belajar siswa dengan menggunakan regresi ganda sebesar 90,1%. Berdasarkan hasil tersebut terlihat bahwa penggunaan metode J48 lebih baik dari metode CHAID dan regresi ganda.

Jawaban :

1.      Data yang digunakan: type data, atribut, type atribut masing-masing, dan dimensi.

Atribut : Menentukan atribut-atribut untuk variabel Sosial Ekonomi Orang Tua yang diambil dari data operasional yaitu Data Pribadi Siswa yang ada di BP/BK sekolah.

2.        Preprocessing/Cleaning

     Proses cleaning tersebut dilakukan terhadap keseluruhan data yang diteliti yang berjumlah 416 siswa. Setelah dilakukan proses cleaning data sejumlah 416, dihasilkan data bersih sebanyak 346 record data yang digunakan untuk proses analisis berikutnya.

3.        Menjelaskan task mining  yang dilakukan :

     Salah satu task mining adalah : Pattern Evaluation, merupakan tahapan evaluasi untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan sumber data yang ada.

4.        Menjelaskan hasil yang diperoleh :

     Berdasarkan ketiga hasil analisis di atas dapat diketahui bahwa akurasi prediksi prestasi belajar menggunakan metode J48 adalah sebesar 95,7%, sedangkan metode CHAID mempunyai akurasi prediksi sebesar 82,1% dan analisis regresi ganda mempunyai tingkat signifikansi 90,6%. Berdasarkan data tersebut dapat disimpulkan bahwa penggunaan metode data mining dengan algoritma decision tree (J48) memiliki tingkat akurasi yang lebih baik dari 2 (dua) metode lain yaitu CHAID dan regresi ganda.

5.        Menjelaskan tools yang digunakan :

Ø  Methode yang diguanakan : Metode data mining dengan algoritma J48

Ø  Software yang digunakan :

·         Pada analisis pertama adalah WEKA 3.6.9.

·         Pada Analisis kedua menggunakan software SPSS 16.0.

·         Pada analisis ketiga menggunakan software SPSS 16.0.

Ø  Analisis yang digunakan : CHAID (Chi Squared Automatic Interaction Detection) dan regresi ganda.

Ø  Pendekatan penelitian yang digunakan : Pendekatan kuantitatif.

Ø  Teknik pengumpulan data yang digunakan : Dokumentasi dan angket.

6.      Salah satu peran yang digunakan dalam penelitian ini adalah : Prediction. yaitu Memprediksi Prestasi Siswa  Tingkat X Smk Negeri 4 Surakarta Berdasarkan Sosial Ekonomi, Motivasi, Kedisiplinan dan Prestasi Masa Lalu.

Sumber : https://journal.uny.ac.id/index.php/jpv/article/download/2547/2104


Nah itu dia Peeps, hasil dari review-an aku, semoga bermanfaat ya buat kalian. Have a nice day Peeps😊

Komentar