Fst.umsida.ac.id – Universitas Muhammadiyah Sidoarjo (Umsida) terus berupaya mengembangkan inovasi dalam meningkatkan mutu pendidikan dan kelulusan prestasi mahasiswa. Salah satu langkah yang ditempuh adalah penerapan teknik data mining dengan algoritma Naive Bayes guna memprediksi masa studi mahasiswa.
Penelitian yang dilakukan menggunakan data alumni program studi Informatika angkatan 2017-2018 ini bertujuan memberikan gambaran prediktif yang bisa membantu mahasiswa dan dosen pembimbing agar lulusan dapat tercapai tepat waktu. Penelitian ini dilakukan oleh tim dosen Fakultas Sains dan Teknologi Informatika (Fst) Umsida, salah satunya adalah Hamzah Setiawan SKom MKom.
Sistem Pendidikan Membutuhkan Cara-cara Inovatif untuk Meningkatkan Kualitas Pendidikan dan Kelulusan

Dalam dunia pendidikan tinggi, upaya meningkatkan kualitas akademik dan kinerja mahasiswa merupakan hal utama yang terus diupayakan oleh perguruan tinggi. Namun, berbagai tantangan masih muncul, terutama masalah ketepatan masa studi yang mempengaruhi kualitas lulusan dan citra institusi. Banyak mahasiswa mengalami keterlambatan kelulusan yang berdampak pada produktivitas serta biaya pendidikan yang lebih tinggi.
Oleh karena itu, sistem pendidikan modern dituntut untuk menerapkan cara-cara inovatif guna memperbaiki dan meminimalisir tingkat kegagalan mahasiswa dalam menyelesaikan studi tepat waktu. Salah satu metode inovasi yang saat ini menjadi fokus adalah data mining. Teknik ini mampu menggali dan mengolah data akademik maupun non-akademik mahasiswa secara komprehensif sehingga dapat memprediksi masa studi secara akurat.
Dalam penelitian ini, terdapat sembilan variabel yang dijadikan indikator prediktor, yaitu Indeks Prestasi Semester (IPS) 1 hingga 4, Indeks Prestasi Kumulatif (IPK), asal sekolah (negeri atau swasta), kondisi keuangan, status beasiswa, serta aktivitas kemahasiswaan. Dengan menggabungkan data akademik dan non-akademik tersebut, model prediksi yang dihasilkan diharapkan mampu memberikan informasi yang lebih menyeluruh tentang faktor-faktor yang mempengaruhi masa studi mahasiswa.
Data Diperoleh dari Direktorat Sistem dan Teknologi Informasi Umsida Sebanyak 200 Data
Data yang digunakan dalam penelitian ini berasal dari Direktorat Sistem dan Teknologi Informasi (DSTI) Umsida yang menyediakan dataset sebanyak 200 data alumni program studi Informatika angkatan 2017-2018. Proses penelitian diawali dengan tahap pengumpulan data dan dilanjutkan ke tahapan preprocessing guna memastikan data yang digunakan bersih dan siap untuk dianalisis.
Baca Juga: Diagnosa Cerdas Penyakit TBC Berbasis Web, Dosen Informatika Umsida Ciptakan Inovasi Sistem Pakar
Pada tahap preprocessing, data diperiksa untuk menghilangkan data ganda dan mengisi atau menghapus data yang kosong. Selain itu, data non-numerik seperti status asal sekolah, kondisi keuangan, beasiswa, dan keaktifan kemahasiswaan diubah menjadi bentuk numerik agar dapat diproses oleh algoritma Naive Bayes.
Pemodelan prediksi dilakukan dengan menggunakan software Anaconda Navigator, yang menjalankan tools Jupyter Notebook serta bahasa pemrograman Python. Data tersebut kemudian dibagi menjadi dua kelompok, yaitu 70% sebagai data training untuk membangun model dan 30% sebagai data testing untuk menguji keakuratan model. Setelah model selesai dibangun, dilakukan pengujian klasifikasi terhadap data testing, dan evaluasi menggunakan confusion matrix untuk mengukur performa model.
Dari 60 Data Testing, Model Mendapatkan Hasil Accuracy 68 Persen
Setelah proses pemodelan dan pengujian dilakukan, hasil evaluasi model dengan algoritma Naive Bayes menunjukkan akurasi sebesar 68%. Angka ini menandakan bahwa model mampu memprediksi masa studi mahasiswa tepat waktu atau tidak dengan tingkat keakuratan yang cukup baik.
Lebih rinci, hasil precision pada kelas mahasiswa yang lulus tepat waktu sebesar 0,67, recall 0,77, dan F1-score 0,72. Sedangkan untuk kelas mahasiswa yang tidak lulus tepat waktu, precision tercatat 0,71, recall 0,59, dan F1-score 0,64. Ini memperlihatkan bahwa model lebih efektif dalam mengidentifikasi mahasiswa yang akan lulus tepat waktu dibandingkan yang tidak tepat waktu, namun secara keseluruhan performa model masih dapat diterima.
Confusion matrix yang digunakan untuk evaluasi memberikan gambaran rinci distribusi hasil klasifikasi. Dari 60 data testing, terdapat 24 data yang benar diklasifikasikan sebagai lulusan tepat waktu (True Positive), dan 7 data sebagai lulusan tidak tepat waktu yang diklasifikasikan dengan benar (True Negative). Namun, terdapat 12 data yang salah diklasifikasikan sebagai lulusan tepat waktu padahal tidak (False Positive), serta 17 data yang sebaliknya (False Negative). Angka-angka ini menjadi indikator area yang masih dapat ditingkatkan pada model.
Evaluasi Model Memberikan Gambaran Awal yang Baik untuk Intervensi Dini

Penelitian ini memberikan kontribusi penting bagi pengembangan sistem akademik di Umsida. Dengan hasil akurasi yang diperoleh, algoritma Naive Bayes terbukti memiliki potensi sebagai alat bantu untuk melakukan prediksi masa studi mahasiswa. Hal ini memungkinkan dosen pembimbing dan pihak akademik untuk melakukan intervensi lebih awal kepada mahasiswa yang berisiko mengalami keterlambatan kelulusan.
Integrasi variabel non-akademik seperti status keuangan dan aktivitas kemahasiswaan menunjukkan bahwa keberhasilan studi tidak hanya dipengaruhi oleh nilai akademik, tetapi juga faktor-faktor sosial dan ekonomi. Pendekatan yang holistik seperti ini menjadi penting untuk memaksimalkan upaya pendampingan mahasiswa.
Ke depan, Umsida diharapkan dapat mengembangkan teknologi prediktif ini secara lebih lanjut, dengan menambah jumlah data dan variabel, serta menggunakan algoritma machine learning lainnya untuk meningkatkan akurasi dan ketepatan prediksi. Dengan demikian, universitas dapat lebih efektif dalam mendukung mahasiswa agar lulus tepat waktu dan meningkatkan mutu pendidikan secara menyeluruh.
Sumber: Jurnal “Penggunaan Datamining Untuk Memprediksi Masa Studi Mahasiswa di Universitas Muhammadiyah Sidoarjo Dengan Algoritma Naive Bayes“
Penulis: Annifa Umma’yah Bassiroh